毛果杨PP2C基因家族生物信息学分析_第1页
毛果杨PP2C基因家族生物信息学分析_第2页
毛果杨PP2C基因家族生物信息学分析_第3页
毛果杨PP2C基因家族生物信息学分析_第4页
毛果杨PP2C基因家族生物信息学分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毛果杨PP2C基因家族生物信息学分析摘要:蛋白磷酸酯酶2C(PP2C)是蛋白磷酸酯酶中的一大类,广泛参与逆境信号的传递过程。本实验采用比较基因组学的方法,利用已知的拟南芥PP2C蛋白序列为检索序列,在全基因组水平上搜索毛果杨的PP2C基因的同源序列。最终确定了毛果杨45个PP2C候选基因。对同源序列作进一步的多序列联配、ESTs、MEME和系统发生表达分析。关键词:毛果杨比较基因组学基因家族Abstract:Proteinphosphatase2C(PP2C)isaproteinphosphataseinalargeclass,thebroadparticipationofadversitysignaltransmissionprocess.Inthisstudy,wesearchedthehomologoussequencefromPopulustrichocarpaproteindatabasebasedonthecompletegenomebyusingcomparativegenomicsmethodsandtakingtheArabidopsisthalianaPP2Cproteinwhichhasbeenisolatedastheretrievalsequence.Theresultsshowedthat45PP2C-likeproteinwereidentifiedfromPopulustrichocarpa.Further,wealsoanalyzedthesequencealignment,MEME,ESTandphylogenetic.Keywords:Populustrichocarpacomparativegenomicsgennefamily真核生物基因组中,编码蛋白磷脂酶的基因远远少于蛋白激酶,一般只有蛋白激酶基因数的四分之一至三分之一。在过去的研究中,蛋白质可逆磷酸化研究的重点主要针对蛋白激酶,不过,现在越来越多的研究显示,在信号转导中,蛋白磷酸酶和蛋白激酶同样重要[1]。根据底物蛋白分子上去磷酸化的氨基酸残基的种类,PP主要分为三个家族:酪氨酸蛋白磷酸酶(proteintyrosinephosphatases,PTPs)、丝氨酸蛋白磷酸酶(proteinserinephosphatases,PPPs)和双特异性蛋白磷酸酶(dualspecificityphosphatases,PSPs)。根据酶对底物选择的特异性和对抑制剂的敏感程度,PPPs分为PP1和PP2。根据亚基的结构、二价离子的依赖性和底物特异性,PP2又可进一步分为PP2A、PP2B和PP2C[2]。大量研究表明,PP2A在进化过程中,高度保守且广泛表达。PP2B是由催化亚基A和调节亚基B构成的二聚体,也是唯一受Ca2+/CaM调节的丝氨酸蛋白磷酸酶,在介导Ca2+信号到细胞应答中发挥了重要作用。在所有PSPs的亚类中,只有PP2C没有调控亚基,是一种单体蛋白磷酸酶,活性依赖于Mg2+或Mn2+[4]。PP2C与其他类型的PPP类蛋白磷酸酶相比,没有较明显的氨基酸序列同源性,但是蛋白质三维结构的相似性却揭示这些蛋白磷酸酶可能拥有相似的催化机制或相同的催化底物。PP2C类蛋白磷酸酶的一个重要的结构特征是在其催化区域内含有11个保守的结构亚区[3]。与哺乳动物PP2Cs相比,植物PP2Cs具有独特的结构模式,即植物中多数PP2C类磷酸酶C端具有保守的催化区域,而N端却是保守性不强、长度不一的延伸区域,在这些延伸区域内,含有与胞内信号相关的序列包括跨膜区域和激酶互作区域等,从而赋予了PP2C不同的功能[1]。蛋白磷酸酶结构的复杂性是功能广泛性的基础。随着植物中越来越多的蛋白磷酸酶基因及其相关蛋白的分离、纯化与鉴定,以及基因特性与生理生化的深入研究,其众多的功能也陆续的被确定。迄今为止,蛋白磷酸酶已经被证实与植物的生长发育、信号转导、细胞周期、渗透胁迫以及活性氧胁迫等各种抗逆性反应相关联。如今,毛果杨的全基因组测序已经完成,数据库Populustrichocarpav1.1(/Poptrl_1/Poptrl_1.home.html)公布了全部序列。此后,在第一测序的基础上,进行了第二次补充测序。毛果杨全基因组最新数据已经包含在数据库Phytozomev7.0(/poplar)。本实验运用生物信息学方法对毛果杨的PP2C基因家族进行了初步分析鉴定[5]。1材料与方法1.1数据库的搜索根据拟南芥只已分离出的PP2C基因及其编码的蛋白质序列,在NCBI(美国国立生物技术信息中心,NationalCenterforBiotechnologyInformation,/)中通过blastp检索毛果杨无荣誉蛋白质数据库,E≤10-26的序列被认为是候选蛋白。利用Blastn程序将获得的候选蛋白与拟南芥的PP2C基因作进一步的匹配,采用默认参数,取E≤10-10的击中项为最终的候选蛋白,由相应的程序和索引文件提取所有符合条件的蛋白序列,构建列表。最后,从相应的数据库中下载最终确认的候选蛋白所对应的CDS序列[5]。1.2序列联配分析与系统发生树的构建利用ClustalW软件对搜索到的蛋白质序列进行多序列联配分析。以序列联配结果为基础,用MEGA3.1软件生成毛果杨PP2C蛋白的系统发生树。进化树的生成采用邻接法(Neighbor-joiningmethod)。具体参数设置TestofPhylogeny:Bootstrapmethod;Replications:1000;Method:Poissonmodel;Gaps:Pairwisedeletion;RatesamongSites:Uniformrates。其它为默认参数[7]。1.3PP2C的motif分析毛果杨PP2C类型基因的预测motif分析通过MEME(/meme/cgi-bin/meme.cgi)在线分析[14]。1.4PP2C的EST分析毛果杨PP2C基因家族的EST分析是通过NCBI,在Expressedsequencetags(EST)数据库中进行核苷酸比对,统计比对结果的组织类型的信息,进而与预测每个基因在不同组织类型中的表达情况。2结果与分析2.1毛果杨PP2C的挖掘根据拟南芥PP2C基因编码的蛋白质检索出毛果杨PP2C基因家族蛋白,之后去冗余共得到45条毛果杨候选PP2C氨基酸序列,都具有PP2C保守区域。从表可知,毛果杨的PP2C基因分布于第1至18号染色体上,除四号染色体上无表达基因外,其余都有所表达。从基因结构看,毛果杨内含子数目在2-10之间变化,并不包含没有内含子的基因,说明植物的PP2C基因,进化过程中没有发生内含子的插入和缺失事件。详细信息如表1所示。表1毛果杨的PP2C候选蛋白及匹配EST的数量Table1ThePP2CcandidateproteinsandthehitsnumberofESTinPopulustrichocarpa基因Gene位点Locus蛋白质长度(aa)Proteinlength(aa)染色体Chromosome匹配EST数量ThehitsnumberofEST内含子IntronPPTP2C-1EEF02439397LGX1193PTPP2C-2EEE88105385LGIX1184PTPP2C-3EEE84651392LGI03PTPP2C-4ERP66114411LGI03PTPP2C-5EEF05571334LGXV1223PTPP2C-6EEE96607370LGXII1202PTPP2C-7EEE79084546LGIII1473PTPP2C-8ERP66113302LGI03PTPP2C-9EEE93007548LGVI1202PTPP2C-10EEF03306551LGXVIII1093PTPP2C-11EEE82783388LGI03PTPP2C-12ERP49654578LGXVIII1093PTPP2C-13ERP59565229LGVI1202PTPP2C-14EEF05989289LGXV1223PTPP2C-15ERP52444305LGXV1223PTPP2C-16EEE97078286LGXII1202PTPP2C-17EEF05572351LGXV1228PTPP2C-18EEE96604355LGXII1208PTPP2C-19EEE94467276LGV1447PTPP2C-20ERP61405273LGV1447PTPP2C-21EEF02923292LGXVIII1098PTPP2C-22EEE92243292LGVI1208PTPP2C-23ERP49572262LGXVIII1098PTPP2C-24EEE83289392LGI03PTPP2C-25ERP54886255LGXII1202PTPP2C-26EEE87942416LGIX1183PTPP2C-27EEF02373389LGX1193PTPP2C-28EEF01832397LGX1195PTPP2C-29ERP65062359LGI010PTPP2C-30EEE99269397LGXIV1313PTPP2C-31EEE97500282LGXI1594PTPP2C-32EEE88603380LGVIII1263PTPP2C-33ERP51920284LGXV1228PTPP2C-34ERP50526313LGXVII1894PTPP2C-35EEE79713359LGIII14710PTPP2C-36EEE92161382LGVI1203PTPP2C-37EEF04978661LGXVI13911PTPP2C-38EEF02837380LGXVIII1093PTPP2C-39EEF03484358LGXVIII10910PTPP2C-40EEE93202358LGVI10910PTPP2C-41EEE94216381LGV1443PTPP2C-42ERP53974446LGXIII1304PTPP2C-43EEE80809389LGII1123PTPP2C-44EEF03734338LGXVIII1094PTPP2C-45ERP58376384LGVII1174注:毛果杨染色体构成LG_2.2毛果杨PP2C蛋白的系统发生分析为了对毛果杨PP2C蛋白的功能和特性作进一步的了解,本实验对预测的毛果杨45个PP2C基因与已经鉴定出的拟南芥的所有蛋白序列的进化关系进行了评估。由进化树可以看出(图1):毛果杨PP2C家族中可被分为7个亚族(A、B、C、D、E、F、G),其中A、D、E和G的Bootstrap在85%以上,基因PP2C-36为独立的分枝。7个亚族中共有45个基因形成15个同源基因对(Bootstrap大于85%),其中15对的Bootstrap为100%。基因结构分析显示,毛果杨PP2C基因的长度在0.2kb-0.7kb之间,内含子数量在2-10间,不同亚族间有较大变化(表1)。由此可见,内含子和非翻译区长度的变化也是引起基因结构变化的原因之一[15-16]。图1毛果杨PP2C基因家族蛋白的进化树Picture1ThephylogenetictreeoftheproteinofPP2CgenefamilyinPopulustrichocarpa2.3PP2C蛋白的基序分布为了进一步了解毛果杨PP2C基因家族的系谱发生和功能,就毛果杨的45个PP2C蛋白序列进行了系统进化树的构建,并利用MEME在线软件对其motif进行了分析,结果表明:在构建的系统进化树中,毛果杨PP2C基因家族被分为7个亚族。在该motif分析中,在该家族中共找到45个motif。MEME分析表明(表3):毛果杨的PP2C基因家族蛋白的结构域具有很强的保守性,由表3可知:毛果杨除PP2C-7、PP2C-12、PP2C-13、PP2C-14、PP2C-15、PP2C-24、PP2C-32、PP2C-44外,其余候选蛋白都存在1、2、3号基序(表2),且PP2C-7、PP2C-13、PP2C-14、PP2C-15、PP2C-24、PP2C-32缺失3号基序,PP2C-12缺失2号基序,PP2C-44缺失2号和3号基序。这就说明在进化过程中可能发生了基序的部分功能丧失突变。表2MEME分析提取的保守序列Table2ConservedmotifsretrievedbyMEMEanalysis基序编号Motif.No一致序列Consensussequence1GSTAVTALICGDHLIVANCGDCRAVLCRGGKAIPLSVDHKP2HFFGVYDGHGGAHVAEYCKENLHKNILEH3KQWVIAEPEIMFMKLTPEDEFLILACDGLWDVMSNQ表3毛果杨PP2C蛋白序列的基序及排列顺序Table3MotifsanddistributionofPP2CcandidateproteinsinPopulustrichocarpa名称Name最低联合概率combinedp-value基序与排列顺序motifandarrangementPPTP2C-11.1e-812-1-3PTPP2C-21.5e-862-1-3PTPP2C-31.7e-852-1-3PTPP2C-41.9e-852-1-3PTPP2C-54.7e-722-1-3PTPP2C-61.6e-822-1-3PTPP2C-72.5e-562-1PTPP2C-82.9e-872-1-3PTPP2C-91.4e-862-1-3PTPP2C-106e-712-1-3PTPP2C-111.6e-862-1-3PTPP2C-123.2e-541-3PTPP2C-133.5e-572-1PTPP2C-144e-572-1PTPP2C-152.1e-572-1PTPP2C-168.3e-802-1-3PTPP2C-171.5e-802-1-3PTPP2C-189.4e-532-1-3PTPP2C-197.9e-342-1-3PTPP2C-202.8e-782-1-3PTPP2C-212.3e-782-1-3PTPP2C-222e-782-1-3PTPP2C-238.6e-782-1-3PTPP2C-243e-542-1PTPP2C-251.9e-722-1-3PTPP2C-264.7e-752-1-3PTPP2C-273.5e-662-1-3PTPP2C-289.1e-822-1-3PTPP2C-291.8e-732-1-3PTPP2C-303.2e-522-1-3PTPP2C-311.1e-752-1-3PTPP2C-324.7e-542-1PTPP2C-332.1e-562-1-3PTPP2C-342.2e-772-1-3PTPP2C-355.6e-752-1-3PTPP2C-361.3e-602-1-3PTPP2C-371.7e-742-1-3PTPP2C-381.9e-792-1-3PTPP2C-393.1e-762-1-3PTPP2C-404.5e-712-1-3PTPP2C-413e-592-1-3PTPP2C-422.6e-692-1-3PTPP2C-432.1e-722-1-3PTPP2C-444.1e-351PTPP2C-452.7e-702-1-32.4PP2C的EST表达部位分析EST(expressedsequencetags)是指来源于不同的组织的cDNA序列,不同的EST在发掘过程中面对整个cDNA文库的机会均等,所以通过BLAST在数据库中搜索EST,其数量的多少可以反映相应的基因在不同的组织中的表达情况,从而分析基因的组织特异性。本实验通过BLAST搜索对数据库中毛果杨中所有的候选PP2C蛋白序列进行EST分析,结果显示(表4),仅有三个组织被检测到,分别为芽、叶和茎。除此之外,仅有39个候选蛋白序列找到相应的表达部位,且候选蛋白序列在这些组织中呈现不均匀分布,具有特异性[8-14]。表4毛果杨PP2C基因家族基因的EST表达情况Table4ThedistributionfortheexpressedESTsofpartPP2CgenneinPopulustrichocarpa基因(gene)器官(Apparatus)芽(Bud)叶(Leaf)茎(Stem)PPTP2C-1√√√PTPP2C-2√√√PTPP2C-3PTPP2C-4PTPP2C-5√√PTPP2C-6√√√PTPP2C-7√√√PTPP2C-8PTPP2C-9√√√PTPP2C-10√√√PTPP2C-11PTPP2C-12√√√PTPP2C-13√√√PTPP2C-14√√√PTPP2C-15√PTPP2C-16√√√PTPP2C-17√PTPP2C-18√√√PTPP2C-19√√PTPP2C-20√√√PTPP2C-21√PTPP2C-22√√√PTPP2C-23√√√PTPP2C-24PTPP2C-25√√√PTPP2C-26√√√PTPP2C-27√√√PTPP2C-28√√√PTPP2C-29PTPP2C-30√√√PTPP2C-31√√√PTPP2C-32√√√PTPP2C-33√PTPP2C-34√√√PTPP2C-35√√√PTPP2C-36√√PTPP2C-37√√√PTPP2C-38√PTPP2C-39√√√PTPP2C-40√√√PTPP2C-41√√√PTPP2C-42√√PTPP2C-43√√√PTPP2C-44√√√PTPP2C-45√3讨论毛果杨全基因组序列图谱的成功构建使我们得以有机会对该物种进行初步的比较基因组学的分析。杨属物种在历经全基因组复制,染色体重建,以及串联重复等一系列复杂事件后烟花形成我们现在所观察到的基因组。运用已知的杨属基因组序列,进一步开展杨属与其他不同植物间基因组的比较分析,将有效地促进这些物种基因组结构及基因家族进化的研究。蛋白磷酸酶2C(PP2C)是植物中最大的蛋白磷酸酶家族,现在已经在拟南芥和水稻基因组中分别鉴定出80和78个成员,进化树分析分别将它们归为13个和11个亚族,基因组进化过程中发生的基因组和染色体片段的重复是导致该家族成员众多的主要因素。作为植物体内重要的信号分子,PP2C为数众多,且有保守的结构特征和理化性质。大量的PP2C基因已经被克隆到[17],目前研究主要集中在不同信号途径的角色,寻找PP2C的作用受体成为蛋白磷酸酶的研究热点。本实验的进行,为以后研究毛果杨PP2C基因家族的后续分析提供了理论依据。实验结果中,毛果杨EST表达只出现在根、茎、芽中,对于为什么没出现在其他组织中,且根、茎、芽中有些未表达,有待作进一步的研究。参考文献[1]薛彤彤.棉花金属硫蛋白基因GhMT3α的功能分析及拟南芥与水稻蛋白质磷酸酶PP2C基因家族分析.山东农业大学[D].2009.[2]胡晓丽,李德全.植物蛋白磷酸酶2C(PP2C)及其在信号转导中的作用.植物生理学通讯[J].2007,43(3):407-412.[3]阮海华.植物PP2C蛋白磷酸酶负调控ABA信号转导途径研究进展.安徽农业科学[J],2007,35(3):652-653.[4]周旺,亓晓艳,张应玖.蛋白磷酸酶2C(PP2C)的表达、纯化与催化活性.吉林大学学报(理学版)[J].2009

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论