对一条新的基因序列进行生物信息学的分析_第1页
对一条新的基因序列进行生物信息学的分析_第2页
对一条新的基因序列进行生物信息学的分析_第3页
对一条新的基因序列进行生物信息学的分析_第4页
对一条新的基因序列进行生物信息学的分析_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对一条新的基因序列进行生物信息学的分析海南中学

作者:许汝言

指导老师:黄小葵论文摘要本研究的主要内容是运用生物信息学的手段结合生物学实验方法对从一株产B甘露聚糖酶的新菌种获得的新基因序列(命名为)进行生物信息学的分析。针对然后结合利用所获得的信息设计生物学方法证实其生物学功能。关键词:B关键词:B甘露聚糖酶;s生物信息学论文目的和意义英国《自然》杂志网络版200年65月18日报道,科学家已对含有2.2亿3个碱基对,占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序,宣告持续16年的人类基因组计划全部完成。作为人类自然科学史上重要的里程碑,“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计划、草鱼基因组计划等,和快速增长的微生物基因测序,“海量”的基因信息的积累,催生了“功能基因组”时代的来临。针对充分利用“海量”基因组信息的生物信息学不仅应运而生,而且为以注释、阐明基因功和利用基因生物学功能的“后基因组时代”的研究发挥了重大作用。生物信息学是把基因组序列信息分析作为源头在获得了蛋白质编码区的信息后,进行蛋白质空间结构的预测和模拟,然后依据特定蛋白质的功能进行必要的药物设计。就是说,生物信息学的主要任务是组织和分析生物学数据,而生物学数据的分析离不开计算机算法的运用。因此,可以说生物信息学是一门集生命科学、计算机科学、数学、物理学为一身的多学科交叉的前沿学科。生物信息学的主要研究对象是序列,即一维的分子排列顺序所分析包括分子碱基序列和编码蛋白质的氨基酸序列。序列分析的主要任务是基因识别和发现某些功能区(如启动子、增强子等序列研究的最终目的是说明遗传语言的语法和语法规则从而最终读懂序列。蛋白质的结构预测研究始终是生物信息学的核心内容之一,目前研究工作是利用一级结构中的氨基酸排列顺序所隐藏的信息来预测蛋白质的高级结构,而蛋白质结构研究的最终目标是阐明肽链的折叠规律,即所谓破译“第二套生物学密码”。“基因组计划”积累了大量生物信息。而生物信息学的任务就是挖掘和利用这些信息,从众多生命信息中发现统一的,本质的,有用的规律。而这些规律必将促进生命科学,如结构生物学,生物技术,药物设计,分子进化等研究工作的进展。所以,生物信息学将在“后基因组”的时代,发挥极其重要的作用,这将有助于全部读懂人类基因组的全部信息,有助于揭示基因组物质结构的复杂性,有助于生命起源和生物进化问题的最终解决,有助于识别与鉴定人类特定疾病的相关基因,有助于药物设计理论和方法的改进和提高。[1-10]研究现状随着信息学大环境的改善,如信息高速公路、国际互联网的发展,生物信息学发展迅速。美国、日本及欧洲各国的生物信息学已相继在上建立了各自的网络节点进行管理大型数据库为研究人员提供研究数据的分析、处理、采集、交换的服务。国际互联网所到之处,都有各种研究机构的联网、数据库的建立,开展生物信息学研究。各种数据库各具特色: 、 、 是三大核苷酸及蛋白质数据库; 数据库主要收集遗传学制图的资料; 的数据库收集 o 、 储存遗传学标记系列;研究所的数据库可了解全部 个 及联系作图的信息;另外还有突变序列的数据库在建立之中。在各类数据库建立的同时,数据库设计中出现了集成化趋势,集成化包括:各类数据的集成、数据库与数据分析软件的整合。各种数据库分析、测序应用软件包也被开发出来。[11]除了数据库、数据分析软件的发展,生物信息学中比较基因组学的发展也较为突出。其中河豚、鼠、猪、牛和马的基因组与人基因组的比较研究,秀丽隐杆线虫与人基因组的比较研究、酵母与人基因组的比较研究,支原体与嗜血流感杆菌基因组的比较研究,都取得了成果,从比较中分离到一些人类遗传病的候选基因,鉴定了一些新克隆的基因,为人类基因组的分析提供了有益的数据。随着计算机技术的发展和渗透,生物信息学在人类基因组中大规模测序的自动化控制、测序结果分析处理、序列数据的计算机管理、各类遗传图谱、物理图谱的绘制、研究数据网络获取、分析和交换,以数据分析的结果辅助基因组研究等都发挥着不可替代的功能,显示出越来越重要的作用。全长cDNA序列man的生物信息学分析前言随着因特网在上世纪90年代的出现和信息技术的迅猛发展。生命科学也相伴走向信息化,其主要标志就是人类基因组计划的实施,这一计划及其相继展开的众多的基因组计划使得生物学数据急剧增加,而传统的实验手段却远远不能满足对这些数据的解释,使之上升到科学知识的高度[9-10]。随着人类基因组计划的实施,分子生物学家提供了大量的有关生物分子的数据,如何将这些从实验室中取得的生物信息进行整理,,并能对以后的研究提供资料和依据,这就需要运用到现代计算机技术对这些原始数据进行收集,整理和分析,从而是人们在研究过程中及时得到有效的生物信息.因此,生物信息学不仅是一门学科,也是研究过程中的一项技术和开发工具.核酸序列分析是生物信息学应用中的一个重要方面.DNA序列分析可分两大类:1.面向测序的DNA序列分析;2.指定DNA序列的分析.通过一个简单序列相似性的比较可以对未知序列进行初步的功能预测,对后续实验确定初步研究方向[12]。本论文通过对从真菌A.tabescens中克隆出一个基因的全长cDNA进行生物信息的分析,预测这个未知cDNA的功能.目前因特网上有许多生物学信息库,采用不同的算法,对生物学数据进行从序列水平到结构层次,进而到功能的多种分析。本章的分析主要利用这些数据库和相关软件完成。材料和仪器(1)生物技术实验室从一株产B甘露聚糖酶的新菌种克隆出一个全长cDNA(命名为 )(2)可以连接国际互联网的计算机核酸序列的基本分析运用DNAMAN软件分析核酸序列的分子质量、碱基组成和碱基分布。同时运用BioEdit(版本)软件对 做酶切谱分析。碱基同源性分析运用NCBI信息库的BLAST程序对 进行碱基同源性分析(Translatedquerytien网站如下:/BLAST/参数选择:TRANSLATEDquery-PROTEINda;tanbra;sset开放性阅读框()分析利用NCBI的ORFFinder程序对 做开放性阅读框分析,网址如下:/projects/gorf/orfig.cgi参数选择:GeneticCodes:1Standard对蛋白质序列的结构功能域分析运用简单模块构架搜索工具(SimpleModularArchitectureResearchTool,SMART)对ORF出的蛋白质序列进行蛋白质结构功能域分析。该数据库由EMBL建立,其中集成了大部分目前已知的蛋白质结构功能域的数据。[12]网址如下:http://smart.embl-heidelberg.de/运用NCBI的BLAST程序再对此蛋白质序列进行rpsBlast分析rpsblast分析其保守功能域参数选择:SearchDatabase:CDDv2.07—11937PSSMsExpect:0.01Filter:LowcomplexitySearchmode:multiplehits1-pass同源物种分析用DNAMAN软件将蛋白质序列与GHF5的B甘露聚糖酶序列和的B甘露聚糖酶序列序列比对,根据结果绘出系统进化树,并进行分析。蛋白质一级序列的基本分析运用BioEdit(版本)软件对ORF翻译的蛋白的一些基本性质,对分子量、等电点、氨基酸组成等作出分析。二级结构和功能分析信号肽预测利用丹麦科技大学(DTU)的CBS服务器蛋白质序列的信号肽( )预测,进入PredictionServes页面。网址如下:http://www.cbs.dtu.dk/services/SignalP/参数选择:••••;; ; ;疏水性分析利用瑞士生物信息学研究所(50155InstituteofBioinformatics,SIB)的ExPASy服务器上的ProtScale程序口引对ORF翻译后的氨基酸序列做疏水性分析网址如下:参数选择:Hphob./Kyte&Doolittle蛋白质溶解能力和PROSITEmotifsearch的分析利用美国哥伦比亚大学(ColumbiaUniversity)的PredictProtein服务器(PHD)[14]对ORF翻译后的氨基酸序列通过发邮件的方式获得蛋白质溶解能力和PROSITEmotifsearch分析的结果。网址如下:磷酸化位点分析磷酸化和去磷酸化是细胞内信号传导的重要方式,利用丹麦科技大学(DTU)的CBS服务器上的NetPhos2.0Server程序[均做磷酸化位点分析。NetPhos2.0Server程序是基于神经网络算法,对蛋白序列中的Ser、Thr和Tys三种氨基酸残基可能成为的磷酸化位点作出预测,网址如下:http://www.cbs.dtu.dk/services/NetPhos/跨膜区分析蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。[⑵利用丹麦科技大学(DTU)的CBS服务器上的TMHMMServerv.2.0程序进行蛋白序列跨膜区分析。网址如下:参数选择:亚细胞定位通过 工具基于其氨基酸序列预测蛋白质亚细胞定位点网址如下:参数选择:Fun;gFiromTextArea二硫键分析运用 对蛋白质的二硫键做出分析。网址如下:参数选择:Dlp(DriosulfideBonds)二级结构预测运用 信息库对蛋白质序列进行二级结构预测( t主要用 神经网络()预测。网址如下:讨论与结果从一株产B甘露聚糖酶的新菌种序列如下:获得的全长核酸序列的基本分析核酸序列的基本分析结果如下:

对其所做对其所做的酶切谱分析结果如下:①对DQ286392的酶切图(见附录1)②单酶切统计,见下表:Restrictiontable:EnzymeRecognition frequencyPositionsAccIGT'mk_AC2258,640AloIGAACnnnnnnTCCnnnnnnn_nnnnn'1632AloIGGAnnnnnnGTTCnnnnnnn_nnnnn'1600AlwIGGATCnnnn'n_5833,885,1056,1095,1290ApoIr'AATT_y3333,992,1368BanIG'GyrC_C4327,348,429,1179BbeIG_GCGC'C2352,1183BbsIGAAGACnn'nnnn_1531BbvIGCAGCnnnnnnnn'nnnn_753,156,551,554,557,560,1103BceAIACGGCnnnnnnnnnnnn'nn_3199,211,540BcgICGAnnnnnnTGCnnnnnnnnnn_nn'31003,998,1294BcgIGCAnnnnnnTCGnnnnnnnnnn_nn'3969,1032,1260BclIT'GATC_A11094BfrBIATG'CAT117BglIGCCn_nnn'nGGC191BmrIACTGGGnnnn_n'1371BpuEICTTGAGnnnnnnnnnnnnnn_nn'1605BsaHIGr'CG_yC2349,1180BsaJIC'CnnG_G2859,1309BsaWIw'CCGG_w3501,1254,1265BsaXIACnnnnnCTCCnnnnnnn_nnn'1215BsaXIGGAGnnnnnGTnnnnnnnnn_nnn'1185BseMIICTCAGnnnnnnnn_nn'330,67,1080BseRIGAGGAGnnnnnnnn_nn'11155BseYIC'CCAG_C11045BsgIGTGCAGnnnnnnnnnnnnnn_nn'1559BsiEICG_ry'CG3199,889,1440BsiHKAIG_wGCw'C257,1223BslICCnn_nnn'nnGG481,449,963,1272BsmAIGTCTCn'nnnn_340,743,1205BsmBICGTCTCn'nnnn_1743BsmFIGGGACnnnnnnnnnn'nnnn_1827Bsp1286IG_dGCh'C257,1223BspCNICTCAGnnnnnnn_nn'331,68,1079

BspEIT'CCGG_A3501,1254,1265BsrIACTG_Gn'4290,366,618,1220BsrBICCG'CTC2201,1399BsrDIGCAATG_nn'11089BstF5IGGATG_nn'4108,641,1077,1251BstZ17IGTA'TAC1641Bsu36ICC'TnA_GG11066BtgIC'CryG_G1859BtsIGCAGTG_nn'1832Cac8IGCn'nGC425,781,1234,1345ClaIAT'CG_AT3889,979,1440EaeIy'GGCC_r3184,196,997EagIC'GGCC_G1196EarICTCTTCn'nnn_11208EciIGGCGGAnnnnnnnnn_nn'1306FauICCCGCnnnn'nn_21112,1336FokIGGATGnnnnnnnnn'nnnn_4115,648,1084,1238FspITGC'GCA2143,673HaeIIr_GCGC'y2352,1183Hin4IGAynnnnnvTCnnnnnnnn_nnnnn'3690,1079,1111Hin4IGAbnnnnnrTCnnnnnnnn_nnnnn'3722,1079,1111HincIIGTy'rAC2259,647HpaIGTT'AAC1647HphIGGTGAnnnnnnn_n'11145Hpy8IGTn'nAC5259,510,641,647,752Hpy188IIITC'nn_GA1075,502,728,823,908,11911255,1266,1290,1435HpyF10VIGCn_nnnnn'nGC1167,92,418,430,452,562,571574,871,997,1099KasIG'GCGC_C2348,1179MboIIGAAGAnnnnnnn_n'5223,271,335,531,1195MlyIGAGTCnnnnn'2479,1159MmeITCCrACnnnnnnnnnnnnnnnnnn_nn'1643MnlICCTCnnnnnn_n'9311,330,455,580,692,830,10751133,1328MscITGG'CCA1999MslICAynn'nnrTG150MspA1ICmG'CkG3861,1045,1116MwoIGCnn_nnn'nnGC1166,91,417,429,451,561,570573,870,996,1098NarIGG'CG_CC2349,1180NlaIVGGn'nCC584,329,350,431,1181NsiIA_TGCA'T119PleIGAGTCnnnn'n_2478,1158

PshAIGACnn'nnGTC1735PvuICG_AT'CG2889,1440PvuIICAG'CTG21045,1116SacIICC_GC'GG1862SalIG'TCGA_C1257SfaNIGCATCnnnnn'nnnn_54,26,542,786,977SfcIC'TryA_G4380,388,424,1389SfoIGGC'GCC2350,1181SmlIC'TyrA_G1584TatIw'GTAC_w242,507TspDTIATGAAnnnnnnnnn_nn'5411,732,802,934,949TspGWIACGGAnnnnnnnnn_nn'11288TspRI_nnCAsTGnn'3839,1064,1432EnzymesthatcutfiveorfewertimesEnzymeRecognitionfrequencyPositionsAccIGT'mk_AC2258,640AloIGAACnnnnnnTCCnnnnnnn_nnnnn'1632AloIGGAnnnnnnGTTCnnnnnnn_nnnnn'1600AlwIGGATCnnnn'n_5833,885,1056,1095,1290ApoIr'AATT_y3333,992,1368BanIG'GyrC_C4327,348,429,1179BbeIG_GCGC'C2352,1183BbsIGAAGACnn'nnnn_1531BceAIACGGCnnnnnnnnnnnn'nn_3199,211,540BcgICGAnnnnnnTGCnnnnnnnnnn_nn'31003,998,1294BcgIGCAnnnnnnTCGnnnnnnnnnn_nn'3969,1032,1260BclIT'GATC_A11094BfrBIATG'CAT117BglIGCCn_nnn'nGGC191BmrIACTGGGnnnn_n'1371BpuEICTTGAGnnnnnnnnnnnnnn_nn'1605BsaHIGr'CG_yC2349,1180BsaJIC'CnnG_G2859,1309BsaWIw'CCGG_w3501,1254,1265BsaXIACnnnnnCTCCnnnnnnn_nnn'1215BsaXIGGAGnnnnnGTnnnnnnnnn_nnn'1185BseMIICTCAGnnnnnnnn_nn'330,67,1080BseRIGAGGAGnnnnnnnn_nn'11155BseYIC'CCAG_C11045BsgIGTGCAGnnnnnnnnnnnnnn_nn'1559

BsiEICG_ry'CG3199,889,1440BsiHKAIG_wGCw'C257,1223BslICCnn_nnn'nnGG481,449,963,1272BsmAIGTCTCn'nnnn_340,743,1205BsmBICGTCTCn'nnnn_1743BsmFIGGGACnnnnnnnnnn'nnnn_1827Bsp1286IG_dGCh'C257,1223BspCNICTCAGnnnnnnn_nn'331,68,1079BspEIT'CCGG_A3501,1254,1265BsrIACTG_Gn'4290,366,618,1220BsrBICCG'CTC2201,1399BsrDIGCAATG_nn'11089BstF5IGGATG_nn'4108,641,1077,1251BstZ17IGTA'TAC1641Bsu36ICC'TnA_GG11066BtgIC'CryG_G1859BtsIGCAGTG_nn'1832Cac8IGCn'nGC425,781,1234,1345ClaIAT'CG_AT3889,979,1440EaeIy'GGCC_r3184,196,997EagIC'GGCC_G1196EarICTCTTCn'nnn_11208EciIGGCGGAnnnnnnnnn_nn'1306FauICCCGCnnnn'nn_21112,1336FokIGGATGnnnnnnnnn'nnnn_4115,648,1084,1238FspITGC'GCA2143,673HaeIIr_GCGC'y2352,1183Hin4IGAynnnnnvTCnnnnnnnn_nnnnn'3690,1079,1111Hin4IGAbnnnnnrTCnnnnnnnn_nnnnn'3722,1079,1111HincIIGTy'rAC2259,647HpaIGTT'AAC1647HphIGGTGAnnnnnnn_n'11145Hpy8IGTn'nAC5259,510,641,647,752KasIG'GCGC_C2348,1179MboIIGAAGAnnnnnnn_n'5223,271,335,531,1195MlyIGAGTCnnnnn'2479,1159MmeITCCrACnnnnnnnnnnnnnnnnnn_nn'1643MscITGG'CCA1999MslICAynn'nnrTG150MspA1ICmG'CkG3861,1045,1116NarIGG'CG_CC2349,1180NlaIVGGn'nCC584,329,350,431,1181NsiIA_TGCA'T119PleIGAGTCnnnn'n_2478,1158PshAIGACnn'nnGTC1735PvuICG_AT'CG2889,1440PvuIICAG'CTG21045,1116SacIICC_GC'GG1862SalIG'TCGA_C1257SfaNIGCATCnnnnn'nnnn_54,26,542,786,977SfcIC'TryA_G4380,388,424,1389SfoIGGC'GCC2350,1181SmlIC'TyrA_G1584TatIw'GTAC_w242,507TspDTIATGAAnnnnnnnnn_nn'5411,732,802,934,949TspGWIACGGAnnnnnnnnn_nn'11288TspRI_nnCAsTGnn'3839,1064,1432Enzymesthatdonotcut:AarI,AatII,Acc65I,AclI,AfeI,AflII,AflIII,AgeI,AhdI,AleI,AlwNI,ApaIApaLI,AscI,AseI,AsiSI,AvaI,AvrII,BaeI,BaeI,BamHI,BanII,BbvCI,BciVIBglII,BlpI,Bme1580I,BmgBI,BmtI,BplI,BpmI,Bpu10I,BsaI,BsaAI,BsaBI,BsiWIBsmI,BspHI,BspMI,BsrFI,BsrGI,BssHII,BssSI,BstAPI,BstBI,BstEII,BstXIBstYI,DraI,DraIII,DrdI,Eco57I,EcoICRI,Eco57MI,EcoNI,EcoO109I,EcoRI,EcoRVFalI,FseI,FspAI,HgaI,HindIII,KpnI,MfeI,MluI,NaeI,NcoI,NdeI,NgoMIV,NheINotI,NruI,NspI,PacI,PciI,PflMI,PmeI,PmlI,PpiI,PpiI,PpuMI,PsiI,PspOMIPsrI,PsrI,PstI,RsrII,SacI,SanDI,SapI,SbfI,ScaI,SexAI,SfiI,SgrAI,SmaISnaBI,SpeI,SphI,SrfI,SspI,StuI,StyI,SwaI,TaqII,TaqII,Tth111I,XbaI,XcmIXhoI,XmaI,XmnI,ZraI碱基同源性分析DQ286392序列的BLASTX分析结果(见图1):

Distributionof104BlastHit$ontheQuerySequenceMouse-overto$howdeflineandscores,clicktoshowalignmentsColorkeyforalignmentscores<40 40-6050-SO 80-200 >=200图 序列的L分析结果EeEEEeEEe-

e-(以下省略)由分析结果可知,DQ286392和其他物种的B甘露聚糖酶相似性最高,尤其是与 物种的和的B甘露聚糖酶的相同性达到64和%63,%相似性均达到76。%以下是 分别与和序列对比:Sbjct418VYPDGPVYPLMKSHASAMKNRA439gi|l679597|emb|CAA90423.l|CEL4bmannanase[Agaricusbisporus]Length=439Score=528bits(1360),Expect=3e-148Identities=280/442(63%),Positives=336/442(76%),Gaps=7/442(1%)Frame=+2TOC\o"1-5"\h\zQuery 23 LAFLSLSTFLCSAFAAVPEWGQCGGIGWTGQTTCVSGTVCAALNDYYSQCVPGtatttaa 202+F+L++AAVPWGQCGGWTG+TCSG+CN++YSQC+PG+TTSbjct 5 IRFIILAISISLATADVPVWGQCGGRDWTGETACASGSSCVVQNEWYSQCLPGSTTPTNP 64Query 203 pttatsttisstsrttatsttasapsstGFVTTSGTEFRLNGAKFTIFGANSYWVGLMGY 382PT++++T++TGFVSGTFLNGK+T+GNSYWVGLGSbjct65PPATTTSQTTAPPTTSHPVST GFVKASGTRFTLNGQKYTVVGGNSYWVGLTGL117Query383STTDMNKAFADIAATGATVVRTWGFNEVTSPNGIYYQSWSGSTPTINTGSTGLQNFDavv562ST+MN+AF+DIAGTVRTWGFNEVTSPNGYYQSWSG+PTINTG++GLNFDV+TOC\o"1-5"\h\zSbjct 118 STSAMNQAFSDIANAGGTTVRTWGFNEVTSPNGNYYQSWSGARPTINTGASGLLNFDNVI 177Query 563 aaaaaHGLRLIVAITNNWSDYGGMDVYVNQIVGSGSAHDLFYTDCEVISTYMNYVKTFVS 742AAAA+G+RLIVA+TNNW+DYGGMDVYVNQ+VG+GHDLFYT++ ++Y+FVSSbjct 178 AAAKANGIRLIVALTNNWADYGGMDVYVNQMVGNGQPHDLFYTNTAIKDAFKSYGRAFVS 237Query 743 RYVNEPTILGWELANEPRCKgstgttsgsctattitkwaaaisaYIKSIDPNHLVGIGDE 922RYNEPT++WELANEPRCKGSTGTTSG+CTTT+TWA+SA+IK+IDNHLVIGDESbjct238RYANEPTVMAWELANEPRCKGSTGTTSGTCTTTTVTNWAKEMSAFIKTIDSNHLVAIGDE297Query923GFYNEPSAPTYPYQGSEGIDFDANLAISSIDFGTFHSYPISWGQTTDPQGWGTQWIADHA1102GFYN+PAPTYPYQGSEG+DF+ANLAISS+DFTFHSYPWGQD+WGTQWIDHASbjct298GFYNQPGAPTYPYQGSEGVDFEANLAISSVDFATFHSYPEPWGQGADAKAWGTQWITDHA357Query1103TSMTAAGKPVILEEFGVTTNQATVYGAWYQEVVSSGLTGALIWQAGSYLSSGATPDDGYA1282SMKPVILEEFGVTTNQYW+E+SSGLTGLIWQAGS+LS+GTP+DGYASbjct358ASMKRVNKPVILEEFGVTTNQPDTYAEWFNEIESSGLTGDLIWQAGSHLSTGDTPNDGYA417Query1283IYPDDPVYSLETSYAVTLKARA1348+YPDPVYLS+A+KRASbjct418VYPDGPVYPLVKSHASAMKNRA439

开放性阅读框(RF分析用N的R对 序列」作开放阅读框分析,结果如图2:WNCBIORFFinder(OpenReadingFrameFinder)WNCBIPubMed Ent阳工 EiLA曰T ONflMTaMnnmy 日tructweAnonymous-2.+3+1+1-3口745..786..n796..丽9914921□1372..14821..110-2.+3+1+1-3口745..786..n796..丽9914921□1372..14821..110Length133B2312252161951681621531441135129126:111i110序列,3~3位存在一个长33的开放阅读框,编码为个氨基酸,起始密码子为Ag终止密码子为A,编码区两侧为3的5非翻译区和 的3’非翻译区(〜3 〜31而且在3’末端的尾上游和3 处各有一个加尾信号,为AAAAA进一步表明所获得片段包括全长的mRNA3'非翻译区。将该蛋白质序列命名为“A”。序列“A”的开放阅读框及其编码的氨基酸序列如下:

104149194239284329374419464509MHLLAFLSLSTFLCS59gcgttcgctgctgttcctgagtggggccaatgtggcggcattggaAFAAVPEWGQCGGIGtggacaggacagaccacttgcgttagtggtacagtatgcgcagctWTGQTTCVSGTVCAActcaatgactattattctcaatgtgtgcctggaacggccacaacaLNDYYSQCVPGTATTacggccgctcccacgactgctacatcaacaaccatttcttccactTAAPTTATStctcgcacaactgctacgtcgaccacagcttccgcaccatcttctTOC\o"1-5"\h\zS R T T A T S T T A S A P S SactggctttgtaactacctctggcacagagttccgcctcaacggtT G F V T T S G T E F R L N GgccaaatttactatcttcggcgccaactcatactgggtcgggttgA K F T I F G A N S Y W V G LatgggctatagcactacagatatgaataaagccttcgcagacatcM G Y S T T D M N K A F A D IgcggctacaggtgccaccgtcgtccgcacatggggcttcaatgagA A T G A T V V R T W G F N EgtaacgagtcctaacgggatttattaccagagttggtccggaagtV T S P N G I Y Y Q S W S G Sacaccaactatcaacacaggttctacgggtcttcaaaactttgat

TOC\o"1-5"\h\zT P T I N T G S T G L Q N F D554gccgtcgtcgctgctgctgctgcacatggcttgaggcttattgttA V V A A A A A H G L R L I V599gccataacgaacaactggtccgactatggtggaatggatgtatacA I T N N W S D Y G G M D V Y644gttaaccaaattgtcgggtctggctctgcgcacgatttattctatV N Q I V G S G S A H D L F Y689accgactgtgaggttatatctacttacatgaactacgtcaagaccT D C E V I S T Y M N Y V K T734ttcgtctcgcgctatgtgaacgaacctactattttaggttgggagF V S R Y V N E P T I L G W E779cttgcaaatgaacctagatgcaaggggagtaccgggacgacctctL A N E P R C K G S T G T T S824ggatcatgcactgcaacgactatcacaaaatgggccgcggcaattG S C T A T T I T K W A A A I869tcagcgtacatcaagtcgatcgatcccaaccatcttgtcgggataS A Y I K S I D P N H L V G I914ggagatgaagggttctacaatgaacctagcgcaccaacatatccaG D E G F Y N E P S A P T Y P959tatcaaggtagcgaaggtatcgattttgatgcaaatttggccattY Q G S E G I D F D A N L A I1004agtagcattgatttcggtacattccattcctatcctatcagctgg对蛋白质序列的结构功能域分析结果如图3和图4

SchultzHtal.(1yyy)Feg.岫乩白匚日口Sci.USASchultzHtal.(1yyy)Feg.岫乩白匚日口Sci.USA95,5857-5864Letunicetal.(2DD6)Me柜赳Acids他s34,D257-D26DIHOMESETUPFAQABOUTGLOSSARYWHAT'SNEWFEEDBACKSimpleModularArchitectureResearchToolDomainswithinthequerysequenceof445residues1 100 200Mouseoverdomaiik1iindefinedregionfoimoreinfo;clickoikittogotodetailedaiknotation:riglit-clicktosavewholeproteinasPNGimageTransmembraneseqmentsaspredictedbythe丁MR期M2program(I),criiledcriilreqirmsdHterminedbytheCoils2program(E!),seqmentsofIuwcumpusitionaIcum口lenity,dHtermiriHdbytheSEGprnqramIntrunpositionsareindicated\.vithVHrtii::allinesshLiV'/inqtheintrunphaseandexactpositioninYoucansavetheresultsofyoursearchfureasyaccessinthefuturebybookrnarkinqthispage,itwillbeavailableforonemonth.DomainarchitectureanalysisThisdomainarchitecturewasprobablyinventedwiththeemergenceofFungi.Displayallproteinswithsimilardurnainorganisation.Displayallproteinswithsimilardomaincumpositiun.TheSMARTdiagramabuverepresentsasummaryoftheresultsshuV'/nbeiri'i.'i.'.Domains'uvithsl:oreslesssignificantthanestablished口」忙iffsarenutshuV'/ninthediagram.Featuresarealsonotshownwhentwoormoreoccupythesamepieceofsequence;thepriorityfordisplayisgivenbySMART>PFAM>PROSPEROrepeats>Signalpeptide>Transineinhrane>Coiledcoil>Unstructuredregions>Lowcoinplexily.Ineithercase,featuresnotshownintheabovediagramaremarkedas'overlap'inthesecondtablebelow.Confidentlypredicteddomaiiks.repeats,motifsandfeatures:NameBeginEndE-vnluefCBD 21 54 9.11e-17TOC\o"1-5"\h\zlowcomplexity 57 91 -lowcomplexity 181 188 -lowcomplexity1 264 287 -Thesefeaturesanddomainsarenotshowninthe<liagrain.eitherbecausetlieirscoresarelesssignificantthantherequiredthreshold.01l)ecausetheyoverlapwitlisomesourceofannotation:NameBeginEndE-valueReasonAFOR_Ni1611.616+05thresholdWR112.559.95e+UlthresholdX812702.26e+U4thresholdEGF13383.25e+03thresholdPSI13548.47e+02thresholdAAI141013.02e+03thresholdTSP117595.33e+02thresholdNH22762.02e+03thresholdEGF_CA26681.685+03thresholdacidPPc291442.656+03thresholdFU32591.956+03thresholdVIT3915U4,016+03thresholdNPCBM752117.0.9e+04thresholdPRP852761.87e+03thresholdAlpha_L_fucos9540U5.33e+04thresholdZnMc1062542.95e+03thresholdGlyco」81114112.22e+03thresholdCASH2834252.12e+03thresholdPQQ3794093.24e+03thresholdRuiiBLASTwithp—ofmubinittedsequence:

StartpEnd.|445 BU\STwithsub-sequence图用对 出的蛋白质序列结构功能域分析OConciseResult@FullResult0ShowSearchInformationOConciseResultSearchInformationOptions:DataSource:System:Database:cdd,v2.10LowcompleMityfilter:yesE-valuethreshold:0.010Options:DataSource:System:LiveblastsearchRID=1171257147-12254-22722001265.BLASTQ3Searchcreator:newblastSoftware:blastp2.2.15Oct-15-2006Service:rpsblast1 751 I I_i I 1 I I 150 225 300i i 1 i i i i 1 i i i i 1 i i375iili445_l l l_1DescriptionsTitlePssmldMulti-DomE-value[+1COG3934,COG3934,Endo-beta-mannanase[Carbohydratetransportandmetabolism].371日Mu 2e-25[+]傩m口口150,Cellular,Cellulase(glycosylhydrolasefamilyBlNa 1^-14H[+]smar[口口236,fC日Fungal-typecellulose-bindingdomain;Smallfour-cysteinecellulose-...47565No 4e-9图4rpsblast结果由分析结果可知,MAN有B甘露聚糖酶的结构域外,还含有 (纤维素结合域)和 的结合域。同源物种分析MAN与GHF5的B甘露聚糖酶序歹U比对:A.sulphureusA.tabescensH.jecorinaA.sulphureusA.tabescensH.jecorinaA.aculeatusA.bisporusT.reeseiA.fumigatusA.sulphureusA.tabescensH.jecorinaA.aculeatusA.bisporusT.reeseiA.fumigatusA.sulphureusA.tabescensH.jecorinaA.aculeatusA.bisporusT.reeseiA.fumigatusA.sulphureusA.tabescensH.jecorinaA.aculeatusA.bisporusT.reeseiA.fumigatusA.sulphureusA.tabescensH.jecorinaYGGMSAYVSAYGGS--DETDFYTSDTMQSAYQTYIKTVVERYSNSSAVFAWELANEPRCPYGGMDVYVNQIVGSGSAHDLFYTDCEVISTYMNYVKTFVSRYVNEPTILGWELANEPRCKYGGINAYVNAFGGNATTWYTNTAAQTQYRKYVQAVVSRYANSTAIFAWELGNEPRCN***.** ** .*...*** ..*******G CDTSVLYNWISDTSKYIKSLDSKHLVTIGDEGFGLDVDSDGSYPYTYGEGLGSTGTTSGTCTTTTVTNWAKEMSAFIKTIDSNHLVAIGDEGFYNQPG-APTYPYQGSEGVG CSTDVIVQWATSVSQYVKSLDSNHLVTLGDEGLGLSTG-DGAYPYTYGEGTG CSTDVIYNWTAKTSAYIKSLDPNHMVATGDEGMGVTVDSDGSYPYSTYEGSS CDTTVLYDWIEKTSKFIKGLDADHMVCIGDEGFGLNTDSDGSYPYQFAEGLGSTGTTSGSCTATTITKWAAAISAYIKSIDPNHLVGIGDEGFYNEPS-APTYPYQGSEGIG CSTDVIVQWATSVSQYVKSLDSNHLVTLGDEGLGLSTG-DGAYPYTYGEGT*..* *..*.**.***** .*** **NFTKNLGISTIDFGTLHLYPDSWGTSYDWGNGWITAHAAACKAVGKPCLLEEYGVTSDFEANLAISSVDFATFHSYPEPWGQGADAKAWGTQWITDHAASMKRVNKPVILEEFGVTTDFAKNVQIKSLDFGTFHLYPDSWGTNYTWGNGWIQTHAAACLAAGKPCVFEEYGAQQDFAKNLAAPDIDFGVFHLYTEDWGIKD--NSWGNGWVTSHAKVCKAAGKPCLFEEYGLKDNFTMNLGIDTIDFATLHLYPDSWGTSDDWGNGWISAHGAACKAAGKPCLLEEYGVTSDFDANLAISSIDFGTFHSYPISWGQTTDPQGWGTQWIADHATSMTAAGKPVILEEFGVTTDFAKNVQIKSLDFGTFHLYPDSWGTNYTWGNGWIQTHAAACLAAGKPCVFEEYGAQQ**. .** ** ** **.*.* .**.**.*NHCAVESPWQQTAGNATGISGDLYWQYGTTFSWGQSPN-DGNTFYYNTSDFTCLVTDHVANQPDTYAEWFNEVESS-GLTGDLIWQAGSHLSTGDTHN-DGYAVYPDGPVYP-LMKSHASNPCTNEAPWQTTSLTTRGMGGDMFWQWGDTFANGAQSNSDPYTVWYNSSNWQCLVKNHVDDHCSASLTWQKTSVSS-GMAADLFWQYGQTLSTGPSPN-DHFTIYYGTSDWQCGVADHLSNHCSVESPWQQTALNTTGVSADLFWQYGDDLSTGESPD-DGNTIYYGTSDYECLVTDHVANQATVYGAWYQEVVSS-GLTGALIWQAGSYLSSGATPD-DGYAIYPDDPVYS-LETSYAVNPCTNEAPWQTTSLTTRGMGGDMFWQWGDTFANGAQSNSDPYTVWYNSSNWQCLVKNHVD* .*. .*** .* *.AINAQSK AMKNRA AIN TL AIDSA TLKARA A.aculeatusA.bisporusT.reeseiAINGGTTTPPPVSSTTTTSSRTSSTPPPPGGSCSPLYGQCGGSGYTGPTCCAQGTCIYSNA.aculeatusA.bisporusT.reesei图种真菌B甘露聚糖酶的氨基酸序列比对通过与其他种真菌 的8甘露聚糖酶的氨基酸序列比对。可的8甘露聚糖酶序列和 的8甘露聚糖酶的氨基酸序列保守性较强。与 序列比对A.tabescensYVNQIVGSG SAHDLFYTDCEVISTYMNYVKTFVSR YVNEPTILTOC\o"1-5"\h\z.* * . * .* **orpinomyces S WQLANEARCNNGPHGLPVKNCNTDTITKWMDEIATFIHQEDPNHLVSSGpiromyces RPLHENNGDWFWWGNNPKACA KLWKILYERMVNYHGLNNLIA.tabescens G WELANEPRCK-GSTGTTSGSCTATTITKWAAAISAYIKSIDPNHLVGIG* * * * . *.*.orpinomyces IEGIGTPPAGVDKNTYVYTYTEGTDYEAISALDSIDYNTVHMYP piromyces WLWNGNN DANTPVDYIDIIGVDIYANDHGPQTTAYNTHFDFA.tabescens DEGFYNEPSAPTYPYQGSEGIDFDANLAISSIDFGTFHSYP .* .** *orpinomyces VGWG-LKDYAKDGVTWIKAHADVDKKFNKPTVVEEpiromyces YGGKKMVVLSENGRIPDIQQCVDQDVWWG A.tabescens ISWGQTTDPQGWGTQWIADHATSMTAAGKPVILEE.**orpinomyces WGLSTSADNVPIEQRDPIYTQWMNEVLANDNIGMNMFWYVCGEDYYGT DGYLLE-piromyces YFQTWNSEFILQD SYHTDAQLK A.tabescens FGVTT NQATVYGAWYQEVVSSG-LTGALIWQAG--SYLSSGATPDDGYAIYP.**. *orpinomyces EDEITAVIDPFTKKLYANQTCENLDTISIVHTDLVDVYYEVEGCQPKYGTCTGGKCCAHGpiromyces EYFNHKTVMNMDELPSFN VDSYNGDSGSSHNG A.tabescens DDPVYSLETSYAVTLKARA orpinomyces TRCEGSEYYGQCRPITEPPYRGATSPVEGYVLPGAKSTSKKNNTTKKTTTKTTTSAKSEPpiromyces NSESNSA.tabescens orpinomyces TSSSSDECFSIALGFPCCSDNTVVYSDNDGDWGVENGEWCGIGGTIVDNDSCFAKSLGYSpiromycesNTGNSDECWSINLGYPCCIGDYVVTTDENGDWGVENNEWCG IVHKSCWSEPLGYPA.tabescens orpinomyces CCSSCDVVYTDNDGNWGVENGEWCGIKDSC piromyces CCVGNTVISADESGDWGVENNEWCGIVHKSCWAEFLGYPCCVGNTVISTDEFGDWGVENDA.tabescens orpinomyces

图 种真菌B甘露聚糖酶的氨基酸序列比对通过与其他种真菌 的B甘露聚糖酶的氨基酸序列比对。可知,的B甘露聚糖酶序列和 的B甘露聚糖酶氨基酸序列差异较大。系统进化树分析图 种真菌B甘露聚糖酶的氨基酸序列比对生成的系统进化树由B甘露聚糖酶进化树,可知, 和 最为相似,可归为一类。此外, 和 与其他的8甘露聚糖酶的氨基酸序列的5种真菌可聚为一大类。A.bisporus:Agaricusbisporus(CAB76904)A.fumigatus:AspergillusfumigatusAf293(EAL85463)A.sulphureus:Aspergillussulphureus(ABC59553)A.aculeatus:Aspergillusaculeatus(AAA67426)H.jecorina:Hypocreajecorina (AAA34208)A.tabescens:Armillariellatabescens(DQ286392)T.Reesei:TrichodermaReesei(1QNS_A)Orpinomyces:Orpinomycessp.PC-2(AAL01213)Piromyces:Piromycessp.(CAA62968)蛋白质一级序列的基本分析结果如下Protein:~outLength=445aminoacidsMolecularWeight=46959.25DaltonsAminoAcidNumberMol%AlaA5011.24CysC81.80AspD194.27GluE143.15PheF173.82GlyG4510.11HisH61.35IleI245.39LysK81.80LeuL224.94MetM61.35AsnN184.04ProP184.04GlnQ132.92ArgR71.57SerS4510.11ThrT6113.71ValV276.07TrpW 13 2.92TyrY 24 5.39图8氨基酸组成分析结果,蛋白质分子质量为MAN的445个氨基酸中强碱性氨基酸(K,R)有15个,强酸性氨基酸(D,E)有33个,疏水氨基酸(A,I,L,F,W,V)有153个,不带电荷的极性氨基酸有(N,C,Q,S,T,Y)个。附[16]:一、组成蛋白质的20种氨基酸的分类1、非极性氨基酸包括:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸2、极性氨基酸极性中性氨基酸:色氨酸、酪氨酸、丝氨酸、半胱氨酸、蛋氨酸、

天冬酰胺、谷氨酰胺、苏氨酸酸性氨基酸:天冬氨酸、谷氨酸碱性氨基酸:赖氨酸、精氨酸、组氨酸其中:属于芳香族氨基酸的是:色氨酸、酪氨酸、苯丙氨酸属于亚氨基酸的是:脯氨酸含硫氨基酸包括:半胱氨酸、蛋氨酸二级结构和功能分析信号肽预测结果如图9Signalf-NNreault:Siurmlf'-Nnprtrfiotion<tuknttworki>2Stdutn4*HHLLfiFLSLSTFLCSAFftAVPEWG(]CGGIGMTGQTTCV8GTVCAALNBYYSQCVFGTATTTA^FTTATS30 40Position>Sequencelengcii■70#MeasurePositionValueCutoffsignalpeptide?max.c190.9010.32YESznaXi¥19口.846□•33YESmax.5130.9930.87YESmeanS1-1B0.961口■48YESD1-180.9030.43YES#Hostlikelycleavagesitetoet.veeuposBISand19』AFI-AV图9信号肽分析由图9分析,可知信号肽序歹U为:MHLLAFLSLSTFLCSAFA在生物体内,蛋白质的合成场所与功能场所常常被一层或多层细胞膜所隔开,这样就产生了蛋白质转运的问题。核糖体是真核生物细胞内合成蛋白质的场所,几乎在任何时候,都有数以百计或千计的蛋白质离开核糖体并被输送到细胞各个部分,以补充细胞的物质成分和更新细胞功能。由于细胞各部分都有特定的蛋白质组分,因此,合成的蛋白质必须准确无误地定向运送才能保证生命活动的进行。一般认为,蛋白质定位的信息存在于该蛋白质自身结构中,并且通过与膜上特殊受体的互相作用得以表达。在起始密码子后,有一段编码疏水性氨基酸序列RNA片段,这个氨基酸序列就称为信号序列。含有信号肽的蛋白质一般能够被分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值[12]。MAN的第18〜19位之间有信号肽的剪切位点。疏水性分析结果如图10:1 2 3 4 5 6 7 8 91.001.00 1.00 1.001.001.00 1.001.00 1.00edge center edgeMIN:-1.822MAX:2.300图10疏水性分析UsingthescaleHphob./Kyte&Doolittle,theindividualvaluesforthe20aminoacidsare:Weightsforwindowpositions1,..,9,usinglinearweightvariationmodel:由图中得知,MAN的疏水性较强,最大值达到2.300,且位于N端的信号肽剪切处,最小值为-1.822。蛋白质溶解能力和PROSITEmotifsearch的分析结果如下:•Predictedsolventaccessibilitycomposition(core.smfaceratio)foryomprotemClassesused:oe:residuesexposedwithmorethan16%ofthen-surfaceob:allotherresidues.accessibtypelbe1%inprotein57,9842.02-蛋白质溶解能力分析结果,可知:MAN有45.7%的残基暴露于蛋白质表面,54.83%的残基位于蛋白质内部,说明其亲水性比疏水性较弱。PROSITEmotifsearch由分析结果得知,MAN含有1个N型糖基化位点,含有2个蛋白激酶C磷酸化位点,6个酪蛋白激酶H磷酸化位点,13个肉豆蔻酰基化位点,1个C—末端锚定微体信号,1个真菌纤维素结合结构域,1个GHF5的结合域。蛋白质的糖基化,酰基化和磷酸化都是化学修饰,具有重要的生物学意义,提供蛋白质功能信息。磷酸化位点分析由以上的PROSITEmotifsearch可知MAN含有磷酸化位点,

磷酸化位点分析结果如图HetPh□sE.U:predictedph口sph口ry1atiqnsitesinSequenceImlq-U山q-CIQucllq.wlSer-ineThr-eonineTyr-osineImlq-U山q-CIQucllq.wl图11磷酸化位点分析由磷酸化位点分析,有个,个,个可能成为蛋白激酶磷酸化位点。跨膜区分析分析结果如下:TMHMMposteriorprobabilitiesforSequence1.2-三qEqEd1.2-三qEqEd0.250 100 150 200 250 300 350 40050 100 150 200 250 300 350 400transmembraneinsideoutsidetransmembraneinsideoutside图12跨膜区分析无明显跨膜区,不可能是膜上的受体或定位于膜上。亚细胞定位48.0%:extracellular,includingcellwall16.0%:nuclear12.0%:cytoplasmic12.0%:endoplasmicreticulum8.0%:vesiclesofsecretorysystem4.0%:mitochondrialpredictionforqueryProteinisexc亚细胞定位分析可知有的可能性分泌到细胞外,的可能性存在于细胞核内,有12的%可能性存在于细胞质中,有12的%可能性存在于分泌泡中,4%的可能性存在于线粒体中。二硫键分析结果如下:由分析可知,含有个,共形成个二硫键,分别连接着第位和第位,第位和第位,第位和第位的y绝大多数情况下二硫键是在多肽链的B—转角附近形成的。二硫键的形成并不规定多肽链的折叠,然而一旦蛋白质采取了它的三维结构则二硫键的形成将对此构象起稳定作用。假如蛋白质中所有的二硫键相继被还原将引起蛋白质的天然构象改变和生物活性丢失。在许多情况下二硫键可选择性的被还原。同时,该蛋白含有二硫键也使得该蛋白对热、对蛋白酶降解较为稳定。二级结构预测结果如下:iiiiiiiiiiiiiiiiiiiiiiii|iiiiiiiiiiiiiiiilli||||iiiii|||iiiiiiiiiiminmiiiniiiiiiiiiiiiiiiiiiiiiiiiiiiiiii|||iiiiiiiiiiiiiiiiiiniii|ii|||iiiiiiiiiiiiiiiiI I I I I I I I50 100 150 200 250 300 350 400图13二级结构预测MAN的二级结构,主要以a-螺旋,不规则盘绕和延伸链为蛋白最大量的结构元件,B-折叠散布于整个蛋白质中。总结与展望本章通过对对从一株产B甘露聚糖酶的新菌种获得的新基因序列(命名为)及进行生物信息学的分析,总结结果如下:于14〜1351位存在一个长1338bp的开放阅读框,编码为445个氨基酸,起始密码子为ATG,终止密码子为TAG。将其ORF出的氨基酸序列(命名为MAN,已登录号: 6继续进行生物信息学的分析, 与目前数据库中存有的数据中具有明显的同源性,尤其与的B甘露聚糖酶的氨基酸序列保守性较强。对其进行的一级结构分析和二级结构分析中,表明了MAN是一个酸性蛋白,亲水性较弱,疏水性较强,信号肽序列为第1位~第18位,亚细胞定位最大可能性为定位于细胞外。含有N型糖基化位点,蛋白激酶C磷酸化位点,酪蛋白激酶H磷酸化位点,肉豆蔻酰基化位点,C一末端锚定微体信号,真菌纤维素结合结构域,GHF5的结合域。主要以a-螺旋,不规则盘绕和延伸链为新蛋白最大量的结构元件,B-折叠散布于整个蛋白质中。通过这些分析数据,可以从功能、结构上获得有价值的信息,为下一步的研究及开发利用做出探索、提出可参考的研究方案。在人类基因组计划的推动下,以生物信息的采集、处理、存储、传布、分析和解释等多个方面为研究内容的生物信息学得到了很好的发展。本章通过运用生物信息学研究内容的一部分对一个未知基因序列的结构和功能进行了预测,为下一步研究方案的制定提供了依据,以期研究的顺利进行。现生物信息学技术贯穿了生物学,信息学和数学等多门学科,不仅为科学的研究起到了重大作用,而且能为高新技术产品的开发带来巨大的经济效益和发展潜力。附录1:ioEditversion(10/28/05)RestrictionMappingUtility(c)1998,TomHall~outRestrictionMap2003-2-1113:09:591483basepairsTranslations:noneRestrictionEnzymeMap:1 ACGCGGGGGAAAGATGCATCTGCTCGCTTTTCTGTCTCTGAGTACATTCCTGTGCTCTGCGTTCGCTGCTGTTCCTGAGT8080TGCGCCCCCTTTCTACGTAGACGAGCGAAAAGACAGAGACTCATGTAAGGACACGAGACGCAAGCGACGACAAGGACTCA

80SfaNIBfrBICac8I BsmAI MslIBsiHKAIMwoI Hpy188IIINsiISfaNI TatI BbvI HpyF10VIBseMII Bsp1286IBseMIIBspCNI BspCNI8116081160161240161240241320241320321400321400GGGGCCAATGTGGCGGCATTGGATGGACAGGACAGACCACTTGCGTTAGTGGTACAGTATGCGCAGCTCTCAATGACTATCCCCGGTTACACCGCCGTAACCTACCTGTCCTGTCTGGTGAACGCAATCACCATGTCATACGCGTCGAGAGTTACTGATABslIBglI BstF5I FspI BbvINlaIVMwoI FokIHpyF10VITATTCTCAATGTGTGCCTG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论