五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析_第1页
五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析_第2页
五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析_第3页
五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析_第4页
五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    五加科植物鲨烯合酶核苷酸及其编码氨基酸序列的生物信息学分析    魏磊 常霞 全彦涛摘要:鲨烯合酶(squalene synthase,ec2.5.1.21,简称sqs)是三萜类化合物生物合成通路的关键酶之一。采用生物信息学方法对13种五加科植物的sqs核苷酸及其编码氨基酸序列的结构、理化性质、磷酸化位点、亲/疏水性、信号肽、导肽、跨膜结构域、亚细胞定位、二级结构、功能域、三级结构及进化关系进行初步预测和分析,并构建sqs蛋白家族的系统进化树。结果表明,13种五加科植物的sqs氨基酸序列结构与理化性质基本一致,均表现出亲水性,没有信号肽,具有跨膜

2、结构域;亚细胞定位分析显示,除panax sokpayensis定位于内质网膜上,其余均定位于质膜上。螺旋和无规则卷曲为sqs二级结构中最主要的结构元件,保守区包括底物结合区、镁离子结合位点、活性位点残基盖、催化残基和2个天冬氨酸富集区,具有典型的多聚异戊二烯基合成酶活性结构域和鲨烯/八氢番茄红素合成酶活性结构域。分析结果可为sqs的酶学特性及三萜类化合物生物合成的分子机制研究提供理论基础。关键词:五加科;生物信息学;鲨烯合酶;三萜生物合成:s188   文献标志码: a  :1002-1302(2019)12-0057-06三萜类化合物由6个异戊二烯结构单元组成

3、,以共同前体鲨烯(squalene)为底物,在不同三萜合酶的催化下形成的c30类萜类化合物,广泛分布于植物、动物和微生物中。在植物界,三萜类化合物在五加科、豆科、大戟科、卫矛科等科属中广泛存在,且具有抗癌、解热、抗炎、镇痛、溶血、抗菌、抗病毒等重要的药理活性1。在植物三萜合成通路(图1)中,鲨烯合酶(squalene synthase,简称sqs)处于法尼基焦磷酸(fpp)到其他产物(二萜、四萜等)的分支点上,催化2分子fpp缩合生成1分子鲨烯,而鲨烯是三萜、甾醇等萜烯类物质生物合成的共同前体,因此,sqs是三萜类化合物生物合成通路中的关键酶2。至今,多种植物的sqs已经或正在被深入研究,包括

4、银杏(ginkgo biloba,genebank:apb03419.1)、紫杉(taxus cuspidata,genbank:abi14439.1)等裸子植物及以烟草(nicotiana tabacum,genebank:aab08578.1)、拟南芥(arabidopsis thaliana,genebank:aad00296.1)为代表的被子植物。floressánchez等用果胶处理猫掌树悬浮细胞,使得sqs活性提高了3倍以上,进而增加了萜烯类物质产量3;han等通过诱导睡茄鲨烯合酶的表达,能够提高植物甾醇的含量4;而张毅等反义抑制烟草sqs,降低了植物甾醇的生物合成5;p

5、atel等抑制人参鲨烯合酶的表达,可使三萜皂苷的生成量降低6。以上研究均表明,对植物sqs进行调控可改变后续产物的产量。五加科(araliaceae)植物多为古老而又名贵的药用植物,通常其体内三萜类化合物含量丰富,活性显著,广泛应用于医药和食品行业,如具有大补元气、固脱、生津、安神和益智功效的人参(panax ginseng)7,活血止血、消肿定痛、金刀跌伤的三七(p. notoginseng)8,补气安神、强精滋肾、祛风除湿、活血止痛的楤木(aralia elata)9等。目前,已从五加科人参、三七、楤木、刺五加(eleutherococcus senticosus)、西洋参(p. quin

6、quefolius)等中药材中克隆到了sqs的基因。鲨烯合酶作为植物三萜类化合物生物合成过程中的一个关键酶,受到越来越多的关注,本研究利用生物信息学方法,筛选出五加科植物中已被克隆的13个sqs蛋白,对其核苷酸及编码的氨基酸序列的组成、理化性质、磷酸化位点、亲/疏水性、信号肽、导肽、跨膜结构域、亚细胞定位、二级结构、结构域、三级结构和进化关系进行预测和分析,以期为更多物种sqs蛋白结构和功能的深入研究提供理论依据。1 材料与方法1.1 材料从美国国立生物技术信息中心(national center of biotechnology information,简称ncbi)下载并筛选出了五加科植物

7、人参、三七、西洋参、刺五加、竹节参(panax japonicus)、楤木和p. sokpayensis的13种完整的sqs核苷酸和氨基酸序列(表1)。1.2 方法2 结果与分析2.1 五加科植物sqs核苷酸及其编码氨基酸序列的结构和理化性质利用orf finder和protparam在线网站对13种五加科植物sqs核苷酸及其编码氨基酸序列进行理化性质分析。由表2可知,sqs核苷酸序列的起始密码子均为atg,终止密码子均为tga;氨基酸残基数(amino acids,aa)在414446个之间;各蛋白相对分子质量在46 923.2651 063.97 ku 之间,中位值为47 067.53 k

8、u;理论等电点范围为5.966.67,平均为6.28,说明sqs为酸性蛋白。从氨基酸组成可以看出,13种sqs蛋白所含酸性氨基酸残基比例均高于碱性氨基酸,进一步说明sqs为酸性蛋白。各种植物sqs蛋白中,含量最丰富的氨基酸残基主要集中在亮氨酸(leu)、丙氨酸(ala)、丝氨酸(ser)、赖氨酸(lys)和异亮氨酸(ile)上。除p. sokpayensis外,其余12种五加科植物总原子数和消光系数基本一致。人参2、人参3、西洋参1、西洋参3、刺五加1、刺五加2不稳定系数低于40,为稳定蛋白,其余均为不稳定蛋白。2.2 五加科植物sqs蛋白的磷酸化位点利用netphos 3.1 server對

9、13种五加科植物sqs蛋白磷酸化位点进行预测,磷酸化位点在1720个之间。以楤木sqs蛋白为例,超过阈值(threshold)0.5判定为磷酸化位点,共有36个磷酸化位点(图2),其中丝氨酸磷酸化位点20个,分别为s3、s48、s50、s126、s134、s187、s196、s198、s232、s234、s249、s215、s329、s344、s358、s370、s374、s378、s385、s408;苏氨酸磷酸化位点9个,分别为t78、t83、t112、t161、t296、t318、t327、t366、t372;酪氨酸磷酸化位点7个,分别为y15、y136、y168、y236、y245、y2

10、73、y332。除个别位点以外,其余植物sqs蛋白磷酸化位点与楤木基本一致。2.3 五加科植物sqs的亲/疏水性、信号肽、导肽、跨膜结构域和亚细胞定位特征2.3.1 蛋白亲/疏水性的预测 蛋白质亲/疏水性氨基酸组成是蛋白质折叠的主要驱动力10,利用protscale在线预测亲疏水性,以楤木sqs为例,其多肽链中第351位氨基酸有最低的亲水性分值-2.433,位于395和398位的氨基酸有最高的疏水性分值3.567。其中,亲、疏水性氨基酸分别占55.4%和 44.6%,推测折叠的蛋白为亲水性蛋白。此外,肽链两端为亲水性氨基酸,中间有2段疏水性氨基酸,这与跨膜结构的预测结果相吻合。其余12种sqs

11、的亲/疏水性分析结果都与楤木相似。2.3.2 信号肽的预测和分析 信号肽是新合成的多肽链中用于指导蛋白质跨膜转移(定位)的n-末端的氨基酸序列,一般由1626个氨基酸组成,在信号肽的引导下,新合成的蛋白质进入内质网腔,而信号肽自身的序列在信号肽酶的作用下被切除11。利用在线工具signal p 4.1 server的神经网络算法对13种五加科植物的sqs蛋白进行信号肽的预测,结果表明均不存在信号肽。2.3.3 导肽的预测和分析 导肽又称转运肽,大约1820个氨基酸长度,位于新合成蛋白质的n端,其含有丰富的碱性氨基酸,这些氨基酸对于蛋白质的定位具有重要的作用12,能将肽链准确地定位于细胞的某一个

12、细胞器或组织上13。因此,对导肽的预测分析有助于蛋白质的功能和作用机制研究。通过在线预测工具targetp 1.1 server,对五加科植物sqs序列进行预测。以楤木sqs蛋白为例,预测可靠性为级,其叶绿体转运肽、线粒体靶位肽、分泌途径信号肽及其他的分值分别为0.065、0.237、0.061、0.743,并且不存在导肽分裂位点。因此,无法确定楤木sqs是否具有导肽。其他11种五加科植物的sqs预测分析结果与楤木完全一致。但p. sokpayensis的sqs蛋白预测可靠性为级,可能含有较低相似度的分泌途径信号肽,但不存在导肽分裂位点。2.3.4 跨膜结构域特征 跨膜结构域一般由20个左右的

13、疏水性氨基酸残基组成,主要形成螺旋,常由跨膜蛋白的效应区域展现14。利用在线工具tmhmm server v.2.0对13种五加科植物sqs蛋白跨膜结构进行预测可知,sqs蛋白均具有跨膜结构域,p. sokpayensis有1个,其余五加科植物均有2个。跨膜区域位于c端的疏水序列,用于锚定在生物膜上。2.3.5 亚细胞定位特征 蛋白质在细胞中合成后被转运到特定的细胞器发挥作用,蛋白质亚细胞定位分析及预测能极大地加速蛋白质结构和功能的研究15。采用psort prediction在线工具对13种五加科植物的sqs进行亚细胞定位。由表3可知,p. sokpayensis sqs位于内质网膜上的可能

14、性为0.850,其余植物sqs位于质膜上的可能性均大于0.640。因此判断sqs p. sokpayensis定位于内质网膜上,其余植物sqs定位于质膜上。2.4 五加科植物sqs二级结构预测蛋白质二级结构是指借助于氢键沿一维方向排列成具有周期性结构的构象,是多肽链局部的空间结构(构象),它们是构成蛋白质高级结构的基本要素。利用sopma对13种五加科植物sqs二级结构进行预测。结果显示,五加科sqs中均有螺旋、无规则卷曲、延伸链和折叠。以楤木sqs为例,由表4可知,其主要结构元件是螺旋(68.36%)、折叠(5.31%)、无规则卷曲(20.05%)和延伸链(6.28%)。其余蛋白二级结构的主

15、要结构元件与比例与楤木sqs基本一致。2.5 蛋白质功能结构域的预测和分析结构域是蛋白质分子中介于二级与三级结构之间的一种结构层次,是指蛋白质亚基结构中明显分开的紧密球状结构区域,是蛋白质三级结构内的独立折叠单元,具有特定的生物学功能,结构域通常也是蛋白质的功能域16。采用ncbi在线软件conserved domains对楤木sqs蛋白的氨基酸序列进行保守区和功能域的预测分析,结果表明,楤木sqs蛋白保守区域包括底物结合区、镁离子结合位点、活性位点残基盖、催化殘基和2个天冬氨酸富集区,具有典型的多聚异戊二烯基合成酶活性结构域和鲨烯/八氢番茄红素合成酶活性结构域,属于isoprenoid-bi

16、osyn-c1超家族(图3)。其余sqs蛋白均存在上述结构域,为类异戊二烯生物合成酶。x2.6 五加科植物sqs蛋白三级结构的预测和分析蛋白质的三级结构是在二级结构的基础上进一步盘绕、折叠形成的天然构象,主要依靠氨基酸侧链之间的疏水相互作用、氢键、二硫键、范德华力和静电作用维持。蛋白质的功能与其三级结构密切相关,对蛋白质三级结构的预测和分析,有助于理解蛋白质结构与功能之间的相关性17。利用同源建模工具 swiss-model对楤木sqs蛋白进行三级结构预测和分析,找到模板蛋白(accession:3wef.2.a;sequence identity:47.73%;gmqe:0.63),再用sw

17、iss pdb-viewer工具显示楤木sqs结构域的3d结构。结果显示,楤木sqs为单体蛋白结构,活性中心主要由几个螺旋围绕形成1个穴状活性中心结构,其20个磷酸化位点位于蛋白质表面。主要结构单元为螺旋结构,伴有折叠、无规则卷曲和延伸链结构(图4),与二级结构预测结果一致。2.7 sqs蛋白的系统进化树分析来源于同一祖先的不同植物在进化过程中的关系可以通过进化树来描述,通过构建植物进化树,可以了解一种植物在进化过程中的地位18。用mega 7.0软件对包括五加科在内的28种有代表性的sqs蛋白构建系统进化树。结果显示,来源于裸子植物、被子植物、动物、细菌、真菌的sqs按照不同类群分为5群,在

18、进化遗传学上亲缘越近的物种,在sqs的分子系统进化树上距离越近(图5)。基于氨基酸序列重建的系统进化树,虽不能完全客观地反映出植物系统分类学关系和漫长历史长河中的自然演化进程,但其结果对判断不同植物之间的亲缘关系仍具有一定的借鉴意义19。3 结论与讨论植物萜类化合物的生物合成途径包括2种:一种是甲戊二羟酸(mva)途径,也称细胞质途径,主要合成倍半萜、三萜和甾醇等化合物;一种是脱氧木酮糖磷酸酯(dxp)途经,又称质体途径,主要合成单萜、二萜、类胡萝卜素等化合物20-21。虽然2种途径在细胞的不同区域独立进行,但许多证据表明2种途径有着密切的联系,细胞质和质体之间存在某些中间产物交换现象。由于s

19、qs竞争利用fpp来合成三萜及甾醇,会影响单萜、二萜类物质的合成22,因此sqs含量和活性决定了相关物质的产量。蛋白一级结构预测分析结果表明,sqs蛋白为酸性的亲水性蛋白,部分不稳定,部分稳定,具有明显的疏水区和亲水区,不具有信号肽,可推测sqs不是分泌性蛋白,这与其属于细胞质中的mva途径关键酶相一致;都具有2个跨膜结构域,无法确定是否具有导肽,也未发现导肽的分裂位点;亚细胞定位预测分析表明其可能定位在质膜、内质网膜或高尔基体上。sqs蛋白的二级结构均以螺旋、折叠、无规则卷曲和延伸链分布于整个肽链结构中。所有五加科sqs蛋白氨基酸序列中都含有多聚异戊二烯基合成酶的活性结构域和底物结合位点结构

20、域,属于isoprenoid-biosyn-c1超家族,为类异戊二烯生物合成酶。利用生物信息学的方法对五加科植物sqs氨基酸序列的生理生化特性进行预测和分析,可以为sqs蛋白及其编码基因的克隆提供可靠的依据;对其序列结构的预测和分析,可为其蛋白表达与修饰提供指导;并为更多物种sqs蛋白及其编码基因的克隆提供可靠的依据。对其二级及高级结构的预测和分析有利于深入探讨该酶结构和功能之间的关系、作用机制和代谢过程。参考文献:1刘江亭,蒋海强. 三萜类化合物药理作用研究进展j. 中国中医药咨讯,2011,3(10):321.2goldstein j l,brown m s. regulation of

21、the mevalonate pathwayj. nature,1990,343(6257):425.3floressánchez i j,ortegalópez j,ramosvaldivia a c. biosynthesis ofsterols and triterpenes in cell suspension cultures of uncaria tomentosaj. plant & cell physiology,2002,43(12):1502.4han j y,in j g,kwon y s,et al. regulation of ginsen

22、oside and phytosterol biosynthesis by rna interferences of squalene epoxidase gene in panax ginsengj. phytochemistry,2010,71(1):36-46.5張 毅,刘 彦,王 红,等. 转青蒿反义鲨烯合酶基因对烟草鲨烯合酶基因表达的影响j. 农业生物技术学报,2005,13(4):416-422.6patel n,patel p,kendurkar s v,et al. overexpression of squalene synthase in withania somnifer

23、a,leads to enhanced withanolide biosynthesisj. plant cell tissue & organ culture,2015,122(2):409-420.7王 月,翟华强,鲁利娜,等. 人参的本草考证及现代研究综述j. 世界中医药,2017,12(2):470-473.8孙千惠,刘海娇,杨小玉,等. 三七本草考证j. 中医药信息,2017,34(5):113-117.9赵俊男,谭玉婷,姜天童,等. 龙牙楤木药理作用研究进展j. 吉林中医药,2016(2):207-210.10张 弢. 不同植物查尔酮合成酶chs基因的生物信息学分析j. 江

24、西农业学报,2012,24(6):5-8.11翟中和,王喜忠,丁明孝. 细胞生物学m. 北京:高等教育出版社,2000:191.12强 毅. 植物蔗糖磷酸合成酶的生物信息学分析j. 现代生物医学进展,2007,7(4):557-560,570.13金元昌,向育君,李景鹏. 重组人促性腺激素释放激素及导肽的分离纯化与活性分析j. 生物技术通报,2008(3):87-90,94.14董 娇,周 军,辛培尧,等. 不同植物ldox/ans基因的生物信息学分析j. 基因组学与应用生物学,2010,29(5):815-822.15herr d. secretion of cellulase and -glucosidase by trichoderma viride itcc-1433 in submerged culture on differ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论