阿拉拉特小麦α-醇溶蛋白基因克隆及序列分析_第1页
阿拉拉特小麦α-醇溶蛋白基因克隆及序列分析_第2页
阿拉拉特小麦α-醇溶蛋白基因克隆及序列分析_第3页
阿拉拉特小麦α-醇溶蛋白基因克隆及序列分析_第4页
阿拉拉特小麦α-醇溶蛋白基因克隆及序列分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、阿拉拉特小麦-醇溶蛋白基因克隆及序列分析生物科学 2003级 余颂华指导老师 魏育明 研究员摘要:根据已报道的-醇溶蛋白基因序列设计引物,利用PCR扩增的方法从阿拉拉特小麦DNA扩增得到约900bp的DNA片段,分离纯化后连接到pMD18-T载体上,转化后筛选阳性克隆进行测序。获得5个不同的基因序列并分别命名为GliTar-1、GliTar-2、GliTar-3、GliTar-4和GliTar-5。结果表明:GliTar-1、GliTar-2和GliTar-5。分别为893bp、893bp和863bp,可分别编码288、288和278个氨基酸残基的成熟蛋白;而GliTar-3和GliTar-4

2、编码区长度分别为896bp和890bp,但由于GliTar-3存在1个提前终止密码子GliTar-4存在3个提前终止密码子,不能编码有功能的成熟蛋白,为假基因。序列分析表明:它们与其他材料的-醇溶蛋白基因有很高的一致性;而与-和-醇溶蛋白基因差异明显。关键词:阿拉拉特小麦,-醇溶蛋白基因,基因克隆,序列分析Gene clone And Sequence Analysis of -Gliadin Gene from Triticum araraticum JakubzYu Song-hua Biological Science, Grade 2003Directed by Wei Yu-ming

3、 (Prof. Ph. D)Abstract: The full coding regions of -gliadin genes were amplified from Triticum araraticum Jakubz by using the primer pairs, which were designed according to the known -gliadin gene sequences. The amplified DNA fragments were separated and recovered from agarose gel, subsequently liga

4、ted into pMD18-T vector, and then transformed into E. coli strain DH5. Five positive clones were screened out and sequenced. Five gliadin gene sequences were obtained, designated as GliTar-1、GliTar-2、GliTar-3、GliTar-4 and GliTar-5, respectively. Among which, the coding regions of GliTar-1, GliTar-2

5、and GliTar-5 were 861bp, 870bp and 900bp, respectively, and could encode three mature proteins with 288, 288 and 278 amino acid residues, respectively. GliTar-3 and GliTar-4 were pseudogenes that due to stop codon in its coding region. Multiple sequence alignment analysis suggested that the cloned g

6、liadin gene sequences have the higher similarity in their structure with the known -gliadin genes, whereas they have much difference with the - and -gliadin genes.Keywords: Triticum araraticum Jakubz, -gliadin gene, gene clone, sequence analysis小麦属的四倍体种主要分为2群:一群为硬粒小麦群( Triticum turgidum L.),其染色体组型为A

7、ABB ;另一群为提莫菲维小麦群(T.timopheevii Zhuk.),染色体组型为AtAtGG。阿拉拉特小麦是提莫菲维四倍体小麦的野生种(2n=4x=28),与普通小麦起源不同。它具有高抗白粉和锈病的特点,且稳定性好,对遗传育种者创造新抗原有重要价值1。张旭等2应用N-分带和C-分带技术对阿拉拉特小麦的根尖细胞进行染色体构成分析,发现阿拉拉特小麦A、G组染色体带型与普通小麦A、B组染色体带型差异明显。因此其中可能蕴藏着可用于改良普通小麦的遗传资源。小麦胚乳贮藏蛋白主要由麦谷蛋白(Glutenins)和麦醇溶蛋白(Gliadins)组成,它们对小麦烘烤品质具有重要作用,其中麦谷蛋白决定面团

8、弹性的主要因素,而麦醇溶蛋白决定面团的延展性。麦醇溶蛋白约占小麦胚乳贮藏蛋白总量的50%-60%,是小麦胚乳的主要贮藏蛋白。越来越多的研究证实,麦醇溶蛋白等位变异与小麦烘烤品质性状显著相关。近年来随着小麦胚乳贮藏蛋白研究的不断深入,麦醇溶蛋白受到越来越广泛的重视,逐渐成为贮藏蛋白研究领域中的一个重要方向3。其中已有研究指出-醇溶蛋白的一级结构包括一个19/20个氨基酸残基的信号肽(signal peptide,不出现在成熟蛋白中),接着分别是重复区(repetitive domain),多聚谷氨酰胺区I(polyglutamine I),特征区I(unique I),多聚谷氨酰胺区II(pol

9、yglutamine II), 特征区II(unique II)4-7。一些学者从重复区又分出一个包含5-14个氨基酸残基的N末端(N-terminal)。-醇溶蛋白序列的差异主要是在于两个多聚谷氨酰胺区谷氨酰胺残基数目不同。重复区由若干重复单元组成,已有报道称重复单元是PQPQPFP和PQQPY8。绝大多数-醇溶蛋白有六个保守的半胱氨酸残基,分布在两个特征区,它们之间形成分子内二硫键。极少数-醇溶蛋白包括奇数个半胱氨酸残基4。但是阿拉拉特小麦中编码醇溶蛋白的基因信息尚不丰富。本研究旨在克隆来自阿拉拉特小麦的-醇溶蛋白基因,并进行序列分析,获得了该蛋白的分子标记,为分析及利用这些基因可以设计特

10、异的分子标记,以促进育种工作。1 材料与方法1.1 实验材料1份阿拉拉特小麦(PI352265),由美国种质资源库提供。1.2 实验方法设计引物根据已报道的-醇溶蛋白基因序列,设计了一对可扩增-醇溶蛋白基因完整编码区的引物Gli-1上游引物:5-GSTCAATACAAATCCAYCATG-3下游引物:5-TTCTCTTCTCAGT TRGTACCR -3分别位于-醇溶蛋白基因编码区的起始端和终末端。方法对供应的材料DNA进行扩增PCR反应体系组成:DNA 100-150ngdNTPs 100M引物P1(50M) 0.3L引物P2(50M) 0.3L Taq聚合酶 1U10×PCR缓冲

11、液 2.5LddH2O 加至终体积25LPCR反应程序:(1)94 预变性4分钟 (2)94 变性45秒 (3)60 退火1分钟 (4)72 延伸45秒 重复(2)(4)40次(5)72 延伸4分钟PCR反应在PTC-220型PCR仪()中进行。扩增产物在1%琼脂糖凝胶上分离,100V恒定电压电泳45分钟。产物回收、纯化(1) 在紫外灯下小心割下含DNA的琼脂糖块,放入1.5mL的离心管中。(2) 按每0.1g回收胶:100L溶胶液的比例加入溶胶缓冲液,65水浴直至使胶全部溶化,期间轻轻上下颠倒几次。(3) 将溶化后的琼脂糖液移入吸附柱,10000转/分离心1分钟,倒掉收集管中的液体,再将吸附

12、柱放入同一收集管中。(4) 在吸附柱中加入700L洗涤液,静置1分钟后10000转/分离心1分钟,倒掉收集管中的液体,将吸附柱放入同一收集管中。(5) 重复第4步的操作。(6) 10000转/分离心1分钟。(7) 将吸附柱放入一个干净的1.5mL的离心管中,在吸附膜中央加入15-30L 洗脱液,静置5分钟后,10000转/分离心1分钟。(8) 将回收产物经琼脂糖凝胶电泳检测后贮存在-20的冰箱中备用。连接扩增产物回收并纯化后连接到pMD18-T载体反应体系如下:pMD18-T载体 0.5L连接混合物(含有连接酶和缓冲液) 4.5L回收PCR产物 5L16连接过夜转化大肠杆菌(1) 将连接产物加

13、入200L感受态细胞中,充分混匀,置于冰上30分钟。(2) 42热击2.5分钟,冰浴1分钟后加入预热至37的LB液体培养基400L。(3) 37低速(120转/分)恢复培养40分钟。(4) 取两个含有氨苄青霉素(50g/mL)的LB固体培养基平板,分别加200L菌液,均匀涂于平板上。(5) 37培养箱中过夜培养。阳性克隆的筛选挑取培养过夜的培养平板上生长良好的单菌落,在含有氨苄青霉素(50g/mL)的LB固体培养基平板上划线,扩大培养(37培养过夜)。挑取适量菌体进行PCR扩增,扩增所用引物为M13通用引物。PCR反应体系组成:dNTPs 100M引物P1(50M) 0.5L引物P2(50M)

14、 0.5L Taq聚合酶 1U10×PCR缓冲液 2.5L少许菌体ddH2O 加至终体积25LPCR反应程序同。序列测定与比较分析随机选取阳性克隆进行测序,序列测定由大连宝生物公司完成,测序结果比较分析采用NCBI网址中的BLAST()程序和DNAman软件进行。2 结果与分析2.1 PCR扩增、目的片段回收与克隆用引物对材料基因组总DNA进行PCR扩增,在1%琼脂糖凝胶上分离,检测为一条900bp左右的带。将目的片段回收纯化后,连接到pMD18-T载体上,并转化到大肠杆菌中。对白斑进行PCR扩增,确认为阳性克隆后进行测序,得到5个不同的基因,分别命名为:GliTar-1、GliTa

15、r-2、GliTar-3、GliTar-4、GliTar-5。2.2 -醇溶蛋白基因推导氨基酸序列结构分析GliTar-1、GliTar-2、GliTar-3、GliTar-4、GliTar-5的编码区长度分别为893bp、893bp、896bp、890bp和863bp,其中GliTar-1、GliTar-2、GliTar-5可分别编码288、288和278个氨基酸残基;而GliTar-3和GliTar-4由于在编码区中存在提前终止密码子,(其中GliTar-3在615bp处出现提前终止密码子,GliTar-4在84bp、267bp和354bp处出现3次提前终止密码子)推测其为假基因。这5个基

16、因的推导氨基酸一级结构与已知的-醇溶蛋白基因十分相似(图)。首先是由20个氨基酸组成的信号肽,之后分别是N端重复区、多聚谷氨酰胺区、特征区、多聚谷氨酰胺区和特征区。不同基因的差异主要集中在重复区和多聚谷氨酰胺区。大多数-醇溶蛋白在特征区有6个保守的半胱氨酸残基(C),它们形成分子内二硫键。在GliTar-1和GliTar-2的特征区具有与在腹泻疾病中有活性的序列,这在已知的-醇溶蛋白中已有报道9。图1 GliTar-1、GliTar-2、GliTar-3、GliTar-4、GliTar-5的推导氨基酸序列比对。“连续”和“不连续”分别表示缺失和终止密码子。GliTar-1中的下划线部分为在腹泻

17、疾病中有活性的肽序列(位于N端)。Fig 1 Alignment of the deduced amino acid sequences of GliTar-1、GliTar-2、GliTar-3、GliTar-4 and GliTar-5. “Continuously” and “Not continuously” represented the deletions and stop condons. GliTar-1 were underlined. which, in the N-terminal domain had the activity for celiac disease.2.

18、3 序列一致性比较将克隆的5个-醇溶蛋白基因在NCBI上进行序列相似性比对,结果(表1)发现,它们与来自普通小麦和硬粒小麦的-醇溶蛋白基因之间的序列一致性很高,最高达96.88%,而与-和-醇溶蛋白基因差异显著。表1 醇溶蛋白基因序列一致性比较Table 1 Comparison of nucleotide sequences of gliadin genes类型GenBank 登录号序列一致性(%)Identity (%)TypeGenBankaccession No.GliTar-1GliTar-2GliTar-3GliTar-4GliTar-5-typeDQ40169696.5396.1

19、887.0384.5189.93DQ14035196.8896.5387.3784.8590.28U5098494.1293.4384.0782.2187.54-typeM1606037.0936.0935.8835.3736.96-typeAF28060535.2334.1134.5831.9634.922.3 多聚谷氨酰胺区及微卫星结构两个多聚谷氨酰胺区是所有-醇溶蛋白一级结构的主要特征,几乎全为谷氨酰胺残基组成。比较GliTar-1、GliTar-2、GliTar-3、GliTar-4和GliTar-5与其它-醇溶蛋白的多聚谷氨酰胺区发现,在区中,GliTar-1和GliTar-2由20

20、个氨基酸残基组成,第18位由谷氨酰胺(Q)突变为谷氨酸(E);与GliTar-1一致性最高的DQ140351有18个氨基酸残基,在第16位同样由谷氨酰胺突变为谷氨酸。在区中,GliTar-1、GliTar-2和DQ140351有8个氨基酸残基,第4位由谷氨酰胺突变为赖氨酸(K)。这些非谷氨酰胺残基的出现,主要是单个碱基替代的结果,如:CAA到GAA、CAA到CAC或CAA到AAA的突变(表1)。分析其核苷酸组成发现,编码谷氨酰胺的两个密码子CAG和CAA以串联重复形式出现,形成微卫星。从表2可以看出,在区中,CAG和CAA分别先后出现,且几乎各占一半;而区中则全为CAA。表2 -醇溶蛋白的多聚

21、谷氨酰胺区比较Table 2 Comparison of polyglutamine regions of -gliadins 基因Gene多聚谷氨酰胺区Polyglutamine region 多聚谷氨酰胺区Polyglutamine regionGliTar-1QQQQQQQQQQQQQQQQQEQQQQQKQQQQGliTar-2QQQRQQQQQQQQQQQQQEQQQQQKQQQQGliTar-3QQQAQQQQQQQQQQQQ*QRQQQGliTar-4QQQ*QQQQI LQQILQQQQQQQQEQQQQQQQQQQQGliTar-5QQQ*QQQQQKQKQQQQQQDQ14

22、0351QQQQQQQQQQQQQQEQQQQQKQQQQM11075QQQQQQQQQQQQQQQQQQQQQQQQQQQQQQDQ166378QQQQQQQQQQQQQQQQQQQQQQ表3 在-醇溶蛋白基因DNA序列中编码多聚谷氨酰胺的微卫星Table 3 Microsatellites encoding the polyglutamine within the -gliadin gene sequences基因Gene微卫星Microsatellites-微卫星Microsatellites-GliTar-1(CAG)5(CAA)12GAA(CAA)2(CAA)3AAA(CAA)3Gl

23、iTar-2(CAG)3CGGCAG(CAA)12GAA(CAA)2(CAA)3AAA(CAA)3GliTar-3CAG(CAA)2 GCA(CAA)11CAATAACAGCGA(CAA) 2GliTar-4CAG(CAA)2TAA(CAA)4(CAA) 5GAA(CAA) 10GliTar-5CAG(CAA)2TAA(CAA)4(CAAAAA) 2 (CAA) 5DQ140351(CAG)5(CAA)10GAA(CAA)2(CAA)3AAA(CAA)3M11075(CAG)8(CAA)6 CAG(CAA)15DQ166378(CAG)7(CAA)8(CAA)73 讨论醇溶蛋白中-醇溶蛋白约占

24、小麦醇溶蛋白总量的25%左右,主要由小麦第六同源短臂上的Gli-2基因编码。在小麦单个基因组中,具有从2025到100150个拷贝数的变异类型,但Anderson等10认为-醇溶蛋白基因大约有50%是假基因,主要原因是-醇溶蛋白基因中C到T的碱基转换频率很高。-醇溶蛋白基因序列中含有丰富的谷氨酰胺密码子CAA和CAG,C到T的转换很容易导致提前终止密码子的出现。本研究中的假基因GliTar-3和GliTar-4中出现的提前终止密码子也可能是由C到T的碱基转换造成的。以及GliTar-1和GliTar-2在多聚谷氨酰胺区出现非谷氨酰胺残基也是由单碱基替换造成的。在小麦低分子量谷蛋白基因中,半胱氨

25、酸的数目和相对位置非常保守,这对于形成稳定的分子间和分子内二硫键非常重要11,而稳定的分子间和分子内二硫键的形成,有助于将多个蛋白质亚基联在一起,形成网络结构,从而影响小麦面粉的粘弹性和延展性12。Payne等13对麦醇溶蛋白中的二硫键进行了详细的分析、定位后证明,麦醇溶蛋白为单聚体蛋白,分子量小,仅有分子内二硫键和较紧密的三维结构,呈球形,溶于70%乙醇,多由非极性氨基酸组成,流动性较大,赋予面筋以粘性。-醇溶蛋白基因通常含有6个保守的半胱氨酸,形成分子内二硫键。醇溶蛋白氨基酸序列中多余的半胱氨酸残基能形成分子间二硫键,从而参与面筋的聚合。Anderson等14报道的-醇溶蛋白基因中也出现了

26、额外半胱氨酸的现象,认为这样的醇溶蛋白基因可能为聚合体的形成提供更多因素。在本研究报道的-醇溶蛋白基因中出现了保守半胱氨酸残基被替换的现象,这些特殊的变异可能会影响二硫键的形成,从而对面团特性造成影响。小麦种子蛋白一般占籽粒重量的5%-20%,其中麦醇溶蛋白作为重要的贮藏蛋白,其组成和含量对小麦面粉加工品质具有重要影响。克隆小麦及近缘物种的麦醇溶蛋白基因序列分析可以进一步了解醇溶蛋白分子结构及其与品质的关系,同时为小麦品质改良提供新的基因资源。而且阿拉拉特小麦是重要的四倍体小麦类型,其A染色体组与四倍体、六倍体小麦A染色体组相比,已经发生了巨大的变化。导入来自A染色体组的优异基因,可以丰富小麦

27、染色体组的遗传多样性15。为研究醇溶蛋白的转基因功能验证打下了基础。参考文献:1 刘畅,杨足君,肖燕,等.一个提莫菲维小麦-醇溶蛋白基因的克隆与序列分析J.安徽农业科学2006,34(18):4530-4531.2 张旭,臧宇辉,钟少斌等.阿拉拉特小麦染色体的C-带和N-带分析J.南京大学学报(自然科学),2000,36(2):247-252.3 郝春燕,李建国,李雅轩等.小麦醇溶蛋白基因克隆研究进展J.首都师范大学学报(自然科学版),2006,27(2):67-70.4 Jackson E.A., Morel M.H., Sontag-Strohm T. et al.Proposal for

28、 combination the classification system of alleles of Gli-1 and Gli-3 loci in bread wheat (Triticum aestivum L.)J. Genet Breed, 1996, 50:321-336. .et al. Nucleic acid (cDNA) and amino acid sequences of -type gliadins from wheat (Triticum aestivum)J. Proc. Natl. Acad. Sci., 1984, 81:4712-4716.6 Sumner

29、-Smith M., Rafalski J.A., Sugiyama T. et al. Conservation and variability of wheat /-gliadin genesJ. Nucleic Acids Research, 1985, 13:3905-3916.7 Müller S.W., Wieser H. The location of disulphide bonds in -type gliadinsJ. Journal of Cereal Science, 1995, 22:21-27.8 Shewry P.R., Tatham A.S. The

30、prolamin storage proteins of cereal seeds: structure and evolutionJ. Biochem. J., 1990, 267:1-12.9 Kasarda D D , DOvidio R. Deduced amino acid sequence of an alpha-gliadin gene form spelt wheat (spelta) includes sequences active in Celiac diseaseJ. Cereal Chemistry,1999, 76 (4):548551.10 Anderson O

31、D, Litts J C, Greene F C. The -gliadin gene family. . Characterization of ten new wheat -gliadin genomic clones, evidence for limited sequence conservation of flanking DNA, and Southern analysis of the gene familyJ. Theoretical and Applied Genetics, 1997, 95:50-58.11 Vensel W H, Tarr G E, Kasarda D D. C-Terminal and Internal sequence of a low molecular weight (LMW-s) type of glutenin subunitJ. Ce

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论