![纤维素合成酶基因家族的生物信息学分析_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/e664f012-0474-4fec-988d-ef504efc4886/e664f012-0474-4fec-988d-ef504efc48861.gif)
![纤维素合成酶基因家族的生物信息学分析_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/e664f012-0474-4fec-988d-ef504efc4886/e664f012-0474-4fec-988d-ef504efc48862.gif)
![纤维素合成酶基因家族的生物信息学分析_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/e664f012-0474-4fec-988d-ef504efc4886/e664f012-0474-4fec-988d-ef504efc48863.gif)
![纤维素合成酶基因家族的生物信息学分析_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/e664f012-0474-4fec-988d-ef504efc4886/e664f012-0474-4fec-988d-ef504efc48864.gif)
![纤维素合成酶基因家族的生物信息学分析_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-1/27/e664f012-0474-4fec-988d-ef504efc4886/e664f012-0474-4fec-988d-ef504efc48865.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目 录摘要·················································&
2、#183;································1 关键词················
3、183;·················································
4、183;·············1 前言···································
5、3;··············································2 1 材料与方法··&
6、#183;·················································&
7、#183;·····················41.1 获取氨基酸序列··························&
8、#183;·········································41.2 序列比对及进化树构建·····
9、3;················································4 2 结果与分析&
10、#183;·················································&
11、#183;·······················42.1 水稻纤维素合成酶基因家族组成·······················
12、·······························42.2 纤维素合成酶各成员蛋白质序列的多重比对···············
13、·····························62.3 纤维素合成酶成员的进化分析··················
14、·····································17 3 讨论············
15、;··················································
16、;·················20 4 参考文献·······························
17、183;···········································20 5 致谢·····&
18、#183;·················································&
19、#183;·······················20水稻纤维素合成酶基因家族的生物信息学分析作者: 吴赵 指导老师:彭喜旭 专业:生物科学(湖南科技大学 生命科学学院,湖南湘潭 411201 摘 要: 本文利用DNAStar 和MEGA 软件对水稻纤维素合成酶基因家族进行生物信息学分析。结果表明,水稻纤维素合成酶基因家族分为CesA (纤维素合成酶家族)和Cs
20、l (纤维素合成酶相似家族)两个家族,其中CesA 有11个成员; Csl 有34个成员,蛋白质序列对比和进化树分析表明,CesA 家族可分3组,其中CesA7可以看出是第一组与第二组的过渡支。Csl 家族可以分为6组。这些结果为纤维素合成酶基因家族成员的结构、功能分析和进化起源的探索提供了资料。关键词:纤维素合成酶; 基因家族; 进化树;生物信息学; 水稻 Bioinformatics analysis of cellulose synthase Gene family of riceMajor :Life SciencesAuthor: Wu Zhao Director: Peng Xix
21、u,(School of Life Sciences of Hunan University of Science and Technology Xiangtan 411201,HunanAbstract : This article analyze the cellulose synthase gene family of rice by using the DNAStar and MEGA software, The results show that cellulose synthase gene family is formed by the cellulose synthase fa
22、mily which is make up of eleven members and the cellulose synthase-like family which including thirty-four members, By Protein sequence alignment and phylogenetic analysis,we know that the family of CesA can divided into three groups .the member CesA7 can be seen as the transition of the group one a
23、nd group two ,The family of Csl can be divided into six groups, This results laiding a foundation on origin, evolution and function research of ccellulose synthase gene family.Key words: cellulose synthase; gene family; evolution tree;Bioinformatics;rice前言纤维素是生物圈最丰富的有机质,占植物界碳素的50%以上,是植物的结构多糖,是它们的细胞壁
24、主要成分。纤维素是线形葡萄糖,残疾通过(14)糖苷键连接的纤维二糖可看成是它的二糖单位。它是在细胞质膜上的纤维素合成酶催化下合成的,此酶同时催化多条糖链的合成。自然界中每年可产生约1 800 亿t 纤维素。纤维素广泛分布于植物和大多数藻类中, 一些细菌、真菌甚至某些动物也能合成纤维素1 。纤维素在造纸、纺织、食品、林业、生物能源等工农业生产领域中有着广泛的经济和商业价值, 这使得它一直成为人们研究的热点。纤维素的基本单位是吡喃式D2葡萄糖, 通过(1, 4 )糖苷键相连2 。虽然纤维素合酶基因首先在木醋杆菌(Acetobacter xylinum 中被发现3 5 , 但近年来随着人类对石油、煤
25、炭的大量需求及石油价格的飞速增长, 对植物纤维素合酶基因及其蛋白的研究显得更有价值。 要掌握纤维素合成酶基因的调控, 可以通过植物基因工程方式增加植物中的纤维素含量, 而同时相对减少木质素的含量6, 这样可以充分减少由造纸工业带来的环境污染, 也可以更加充分地利用纤维素来造福于人类。同时增加纤维素含量以改善其品质, 将会培育更适于造纸的新型树种。纤维素是在细胞质膜上的纤维素合成酶催化下合成的,对纤维素合成酶(cellulose synthase,CESA 的了解可以更使纤维素的人工合成更具效率。所有的CESA 与CSl (cellulose-synthase-like protein ,纤维素
26、合成酶相似蛋白 蛋白都具有跨膜蛋白的特征, 在N 端与C 端具2个或多个跨膜区域中, 其中间为亲水胞内区, 相似性比较结果表明了CESA 与CSl 蛋白之间最大的同源性出现在中间胞内区。有关研究结果表明, 高尔基体存在着大量的糖苷转移活性, 因此, 有许多研究者认为, 部分CSl 蛋白可能位于高尔基体的膜上。植物CESA 蛋白含有一个植物特异保守区和一个超变区(HVR ,N 端含有2个锌指区, 紧跟着HVR 区, 这是植物CESA 蛋白所特有的结构特征7 。1999 年, Delmer 提出了一个纤维素合酶的三维结构模型, 即8 个跨膜结构域在细胞膜上形成一个 “洞” , 正在合成的(14)
27、葡萄糖苷链经此 “洞” 到达细胞外形成细胞壁。 N 2端形成的蛋白间互作结构域位于胞内, 可以结合各种催化活性所需的因子。纤维素合成酶基因的大小为 315515 kb , 有 913 个内含子, 转录的mRNA 范围为310315 kb , 编码的蛋白长约9851088个氨基酸, 序列同源性53 %98 %。其内含子和外显子的边界区域是高度保守的, 基因结构的差异主要在于内含子的多少。CESA 基因家族目前有40多个基因。公共数据库里收集了来自40多个不同植物的1400 多个相关序列, 新的序列还在不断增加。植物纤维素合酶是一个由36个单体组成的玫瑰状复合体,其单体主要由植物纤维素合酶(cel
28、lulose synthase, CesA )基因家族成员编码。近年来的研究证明CesA1,CesA3,CesA6在初生细胞壁的合成中起着不可替代的作用,CesA4,CesA7,CesA8与次生细胞壁的形成有直接的关系。而CesA2,CesA5,CesA9,CesA10的功能还不是很清楚。类纤维素合酶(cellulose-synthase-like protein, Csl 蛋白 家族共分CslA 、 CslF 、CslC 、CslD 、CslE 和CslH 等6个家族。Csl 基因家族功能还处于探索阶段,目前只有少数的报道。有研究表明Csl 基因与半纤维素的合成有关;有文献指出在旱金莲花(T
29、ropaeolum )中发现Csl 与I 型初生细胞壁的半纤维素主要成分xyloglucan (XyG )的-1,4-glucan 骨架合成有关,该基因与拟南芥CslC4高度同源。而Burton 等报道水稻CslF 基因家族与细胞物细胞壁形成和生长发育中的重要作用,但绝大多数的Csl 基因功能有待进一步研究。近年来,科学家采用了ESTs (Expressed Sequence tags),cDNA 微阵列,反向遗传学等技术手段,在拟南芥纤维素合酶基因的的定位、表达和功能的研究上取得了一定的进展, 而在探索纤维素的合成对外界环境胁迫的反应方面研究较少。因为纤维素合酶(CesA 多基因现象的存在,
30、 所以它与存在的大量纤维素合酶相似蛋白(Csl 构成了一个庞大的超基因家族。目前CesA 基因R 基因家族已有40 多个基因, 并且在不断地增加着。CesA 基因的长度大约在3.55.5 Kb 之间, 含有913个内含子, 其内含子和外显子的边界区域是高度保守的, 基因结构的差异主要决定于内含子的多少。CesA 基因转录产物介于3.03.5Kb 之间, 编码的肽链长度约为9851088个氨基酸。CESA 蛋白家族各成员的氨基酸数目大约在9851088之间, 它们之间的一致性为53% 98%; CesA 包含了2 个高变区, 即N 端约有150 个氨基酸残基,A 区与B 区(植物纤维素合成酶基因
31、特有的保守区, A 区有DX , , XDXD , B 区与酶的催化活性有关, 除含有一个保守的天冬氨酸残基外, 还有一个序列QXXRW 之间约有50个氨基酸8。2000 年, Richmond 和 Somerville 以拟南芥基因(AtCes1 及棉花纤维素合酶多肽氨基酸序列为初始序列, 对拟南芥基因组DNA 序列进行反复检测后发现, 至少有41 个高度相关的基因或DNA 序列, 其中有10个纤维素合酶的编码基因被验证, 而其余的基因或DNA 序列编码产物在结构上与AtCes 具有相似性, 但由于它们的功能目前还不清楚, 所以被命名为纤维素合酶相似蛋白。依据序列结构特征的不同, Csl 蛋
32、白可分为6 个族: CslA、 CslF 、CslC 、CslD 、CslE 和CslH 。现在对生物信息的分析都能从生物信息学提供的各种蛋白质以及基因数据库中获得大量资料,比较著名的如GenBank 与PIR 。生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics 和蛋白组学(Proteomics 两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。核心是基因组信息学, 包括基因组信息的获取, 处理, 存储, 分配和解释。
33、基因组信息学的关键是“读懂”基因组的核苷酸顺序, 即全部基因在染色体上的确切位置以及各DNA 片段的功能;发现了新基因信息之后进行蛋白质空间结构模拟和预测。目前研究的主要方向有:序列比对,基因识别,基因重组,蛋白质结构的预测,基因表达,蛋白质反应的预测,以及建立进化论的模型。分子进化是利用不同物种中同一基因序列的异同来研究生物的进化, 构建进化树。既可以用DNA 序列也可以用其编码的氨基酸序列来做, 甚至于可通过相关蛋白质的结构比对来研究分子进化, 其前提假定是相似种族在基因上具有相似性。通过比较可以在基因组层面上发现哪些是不同种族中共同的, 哪些是不同的。早期研究方法常采用外在的因素, 如大
34、小, 肤色, 肢体的数量等等作为进化的依据。近年来较多模式生物基因组测序任务的完成, 人们可从整个基因组的角度来研究分子进化。在匹配不同种族的基因时, 一般须处理三种情况:Orthologous : 不同种族, 相同功能的基因Paralogous : 相同种族, 不同功能的基因Xenologs : 有机体间采用其他方式传递的基因, 如被病毒注入的基因。这一领域常采用的方法是构造进化树, 通过基于特征(即DNA 序列或蛋白质中的氨基酸的碱基的特定位置 和基于距离(对齐的分数 的方法和一些传统的聚类方法(如UPGMA 来实现。目前,水稻基因组已测定,为水稻纤维素合成酶基因家族的蛋白质以及基因研究提
35、供了一个数据平台。本文通过对水稻纤维素合成酶基因家族分析,得到较为完整的纤维素合成酶基因家族数据,为纤维素合成酶基因家族的起源、进化和功能研究奠定基础。1. 材料与方法1.1获取氨基酸序列1.2 序列比对及进化树构建cellulose synthase gene family的氨基酸序列比对用DNAStar(Lasergene软件执行。多重序列比对(MegAlign输入序列File(Enter Sequences:Add all完成( Done查看(View :Aligenment report,装饰定义options(New Decoration:shade black在ClustalW 运
36、算的基础上,再用MEGA4软件 形成进化树。打开序列(Alignment ):Alignment Exploer/CLUSTAL创建新的序列 (Creat a new Alignment :OK多序列比对 (Align by ClustalW):OK输出序列 (Data (Export Alignment):MEGA Format打开数据 (Open the data in MEGA :YES输出解鞋带值(phylogeny )Bootstarp Test of phylogeny2. 结果与分析2.1 水稻纤维素合成酶基因家族组成表1 CESA家族成员信息OsCESAchrAccPos(cm
37、extronPIDLOC1 5 AC135426 4.5654.571 13 AAU44296 LOC_Os05g08370 2 3 AC135958 33.77233.779 14 AAP21426 LOC_Os03g59340 3 7 AP005248 13.74013.746 13 BAD30574 LOC_Os07g24190 41AP003237 31.42131.427 12 BAD97094 LOC_Os01g54620 5 3 AC104487 35.17035.176 13 AAD41140 LOC_Os03g62090 6 7 AP005824 8.4958.500 12
38、BAC84511 LOC_Os07g14850 7 10 AC022457 17.19017.195 8 AAK27814 LOC_Os10g32980 8 7 AP003837 5.8515.857 14 BAC57282 LOC_Os07g10770 9 9 AP005579 17.19017.195 10 BAD33645LOC_Os09g25490 10 12 AC731763 17.36117.362 2LOC_Os12g29300 11 6AP00361223.77623.7797BAD32845LOC_Os06g39970表2 CSL家族成员信息OsCSLextronchrACC
39、PIDLOCPOS(cMC1 5 1 AP003377 BAC10759 LOC_Os01g56130 32.317-32.321 A1 9 2 AP005785 BAD34025 LOC_Os02g09930 5.151-5.158 E2 8 2 AP005113 AAL25130 LOC_Os02g49332 30.142-30.148 A6 9 2 AP005297 BAD16122 LOC_Os02g51060 31.222-31.226 A4 8 3 AC073556 AAL84294 LOC_Os03g07350 3.728-3.732 A5 10 3 AC084766 AAL82
40、530 LOC_Os03g26044 14.923-14.929 C9 6 3 AC133450 AAT85054 LOC_Os03g56060 31.923-31.927 H2 7 4 AL606632 CAD41009 LOC_Os04g35020 21.109-21.113 H3 8 4 AL606632 CAD41008 LOC_Os04g35030 21.116-21.121 C7 5 5 AC108873 AAT44138 LOC_Os05g43530 25.238-25.242 D2 4 6 AP001552 BAA93027 LOC_Os06g02180 0.659-0.664
41、 A3 12 6 AP003509 BAD37274 LOC_Os06g12460 6.757-6.761 D5 1 6 AP005449 BAD61907 LOC_Os06g22980 13.413-13.417 A9 9 6 AP008212 BAD37742 LOC_Os06g42020 25.230-25.234 C10 5 7 AP005309 BAC56816 LOC_Os07g03260 1.604-1.307 F9 3 7 AP005126 BAC80027 LOC_Os07g36610 21.900-21.907 F8 3 7 AP005126 BAC65371 LOC_Os
42、07g36630 21.909-21.914 F2 2 7 AP004261 BAC65378LOC_Os07g36690 21.969-21.972 F1 2 7 AP004261 LOC_Os07g36700 21.988-21.990 F4 3 7 AP004261 BAC83321 LOC_Os07g36740 22.005-22.011 F3 3 7 AP004261 BAC83322 LOC_Os07g36750 22.014-22.018 A7 10 7 AP004260 BAC79726 LOC_Os07g43710 26.157-22.162 F6 3 8 AP004635
43、BAC66734LOC_Os08g06380 3.543-3.549 C3 5 8 AP004013 LOC_Os08g15420 9.382-9.386 D328AP004459BAD01697LOC_Os08g2571015.639-15.643续表2 OsCSL extron chr ACCPIDLOCPOS(cMA11118AP004666 BAD09847 LOC_Os08g33740 21.075-21.083 C2 5 9 AP005568 BAD33623 LOC_Os09g25900 15.545-15.548 E179AP005759 BAD46389 LOC_Os09g3
44、0120 18.306-18.313 E6 7 9 AP005759 BAD46391 LOC_Os09g30130 18.314-18.320 H1910AC119148 ABB47240 LOC_Os10g20090 10.018-10.023 F7 2 10 AC090441 AAK91320 LOC_Os10g20260 10.109-10.116 A2 9 10 AC021893 AAK98678 LOC_Os10g26630 13.824-13.829 D1 2 10 AC027037 AAL58185 LOC_Os10g42750 22.990-22.994 D4212AL845
45、342ABA99552LOC_Os12g3689022.569-22.573Abbreviation :ACC 为该成员的基因登陆号,PID 为蛋白质登陆号,extron 为外显子数目,chr 为染色体,LOC 为染色体的位置,Pos 为在染色体上的长度。从表1我们可以发现纤维素合成酶成员中有3个分布在7号染色体上,CESA10只有两个外显子,从表2可以看出CSL 家族中有8个成员分布在7号染色体上,可以说7号染色体是纤维素合成酶超家族分布最密集的地方,整个D 族外显子数目普遍较少,为1至4个,其中CSLD5没有内含子。从整个家族上看11号染色体上没有纤维素合成酶基因家族的分布。2.2纤维素合
46、成酶各成员蛋白质序列的多重比对将CESA 家族中的11个成员与CSL 家族中的34个成员的氨基酸序列用MEGA 4软件进行多重序列比对,可以得到图1与图2。从图2.1我们可以看出家族中分散分布了多个保守域,保守域同源性较高,保守域外同源性较低,其中CESA4与CESA11比较特殊,它们的氨基酸序列与其它成员有较大不同,CESA10的氨基酸序列最短只有244个氨基酸残基。表明它们在进化路上与其它成员出现了分歧。 图1 CESA家族成员蛋白质序列的多重比对从图2我们可以看出,整个CSL 大家族中存在多个保守域,这些保守域的蛋白质序列决定了该酶的特定功能,我们可以看到各个大组(A ,C ,D ,E
47、,F ,H )它们的保守序列具有高度相似性,这表明它们在进化上的亲缘关系极其相近,此外我们可以发现整个H 组的序列较短。 图2 CSL家族成员蛋白质序列的多重比对2.3纤维素合成酶成员的进化分析为了了解纤维素合成酶基因家族系统发育的关系,我们根据预测得到的11个CESA 的氨基酸序列和34个CSL 氨基酸序列,用MEGA 软件以邻接法构建系统发育树,可以发现CESA 家族可以分为三组,其中CESA5,CESA3,CESA6,CESA9,CESA7可分为第一大组,CESA1,CESA2,CESA8可分为第二大组,其中CESA4,CESA11,CESA10比较特殊将其分为第三组,其中CESA7可以
48、看出第一组与第二组的过渡。详细信息见图3。而CSL 家族可以分为六大组;其中CSLF1,CSLF2,CSLF3,CSLF4,CSLF6,CSLF7,CSLF8,CSLF9为第一大组;CSLD1,CSLD2,CSLD3,CSLD4,CSLD5为第二大组;CSLH1,CSLH2,CSLH3为第三大组,CSLE1,CSLE2,CSLE6为第四大组,CSLC1,CSLC2,CSLC3,CSLC7,CSLC9,CSLC10为第五大组,CSLA1,CSLA2,CSLA3,CSLA4,CSLA5,CSLA6,CSLA7,CSLA9,CSLA11为第六组。其中CSLF6在进化上处在第一组与第二组的过渡支。具体
49、信息见图4。OsCESA5 OsCESA3 OsCESA6 OsCESA9 OsCESA7 OsCESA1OsCESA2 OsCESA8 OsCESA4 OsCESA11 OsCESA10100971005432891835 图3 水稻CESA 家族的系统发生树OsCSLF2 OsCSLF1 OsCSLF4 OsCSLF9 OsCSLF8 OsCSLF3 OsCSLF7 OsCSLF6 OsCSLD4OsCSLD3 OsCSLD5 OsCSLD2 OsCSLD1 OsCSLH2OsCSLH3 OsCSLH1 OsCSLE2OsCSLE1 OsCSLE6 OsCSLC1 OsCSLC7 OsCSLC9 OsCSLC10 OsCSLC3OsCSLC2 OsCSLA5 OsCSLA7OsCSLA1 OsCSLA9 OsCSLA11OsCSLA6 OsCSLA3 OsCSLA4 OsCSLA26310010075969413627553997949629999659261657636971009254351485296图4 水稻CSL 家族的系统发生树3 讨论 利用生物信息学方法对基因进行分析,发现新线索和新规律,指导实验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国植物蛋白饮料行业市场运行动态及投资发展潜力分析报告
- 高中物理题型解题技巧之电磁学篇11 等效阻抗秒解变压器动态问题(原卷版)
- 2.2 长度与时间的测量(课件)2022-2023学年八年级物理上学期同步
- 二零二五年度装配式建筑造价工程师聘用协议4篇
- Module4 Unit2 The apples are falling down the stairs.教学课件-六年级英语下册课堂外研版三起
- 《甜津津的河水》课件
- 《高位胆管癌的护理》课件
- 《运动品牌标志》课件
- 02.冠词【知识精研】小学英语语法专项系列 (人教PEP版)
- 2025至2031年中国圆底计量罐行业投资前景及策略咨询研究报告
- DB41-T 2704-2024 森林抚育技术规程
- 2020-2021学年浙江省金华市东阳市七年级(下)期末数学试卷(附答案详解)
- 苏教版小学语文上册教学研究论文
- 片状锌粉行业分析!中国片状锌粉行业市场发展前景研究报告(2024版)
- 2024至2030年中国中水回用行业发展监测及投资战略规划报告
- NB/T 11430-2023煤矿TBM掘进施工工艺要求
- 部编版六年级下册道德与法治全册教案
- 全国职业院校技能大赛培训课件
- 供货送货服务承诺书
- 福建省医院大全
- EPC项目质量保证措施
评论
0/150
提交评论