真核生物基因结构的预测分析_第1页
真核生物基因结构的预测分析_第2页
真核生物基因结构的预测分析_第3页
真核生物基因结构的预测分析_第4页
真核生物基因结构的预测分析_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

真核生物基因结构的预测分析1第1页,共34页,2023年,2月20日,星期一基因组序列cDNA序列编码区预测CodonbiasGCContent限制性酶切位点基因结构分析选择性剪切转录调控因子序列比对功能注释KEGGGO系统发育树蛋白质序列翻译蛋白质理化性质二级结构预测结构域分析重要信号位点分析三级结构预测基因组功能分析2第2页,共34页,2023年,2月20日,星期一真核生物基因的主要结构3第3页,共34页,2023年,2月20日,星期一基因结构分析开放读码框GENSCANCpG岛CpGPlot转录终止信号POLYAH启动子/转录起始位点PromoterScan密码子偏好分析CodonWmRNA剪切位点NETGENE2Spidey选择性剪切ASTD基因结构分析常用软件4第4页,共34页,2023年,2月20日,星期一开放读码框的识别开放读码框(openreadingframe,ORF)

是一段起始密码子和终止密码子之间的碱基序列ORF是潜在的蛋白质编码区5第5页,共34页,2023年,2月20日,星期一基因开放阅读框/基因结构分析识别工具ORFFinder/gorf/gorf.htmlNCBI通用BestORF/berry.phtml?topic=bestorf&group=programs&subgroup=gfindSoftberry真核GENSCAN/GENSCAN.htmlMIT脊椎、拟南芥、玉米GeneFinder/tools/genefinder/Zhanglab人、小鼠、拟南芥、酵母FGENESH/berry.phtml?topic=fgenesh&group=programs&subgroup=gfindSoftberry真核(基因结构)GeneMark/GeneMark/eukhmm.cgiGIT原核GLIMMER/genomes/MICROBES/glimmer_3.cgi/software/glimmer

Maryland原核Fgenes/berry.phtml?topic=fgenes&group=programs&subgroup=gfindSoftberry人(基因结构)FgeneSV/berry.phtml?topic=virus&group=programs&subgroup=gfindvSoftberry病毒Generation/generation/ORNL原核FGENESB/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindbSoftberry细菌(基因结构)GenomeScan

/genomescan.html

MIT脊椎、拟南芥、玉米GeneWise2http://www.ebi.ac.uk/Wise2/EBI人GRAIL/grailexp/ORNL人、小鼠、拟南芥、果蝇6第6页,共34页,2023年,2月20日,星期一ORF识别:GENSCAN/GENSCAN.html结果返回到邮箱(可选)提交序列提交序列文件运行GENSCAN显示氨基酸或CDS序列序列名称(可选)是否显示非最优外显子选择物种类型7第7页,共34页,2023年,2月20日,星期一8第8页,共34页,2023年,2月20日,星期一9GENSCAN输出结果:文本中间外显子起始外显子终止外显子加尾信号启动子中间外显子权重9第9页,共34页,2023年,2月20日,星期一10第10页,共34页,2023年,2月20日,星期一转录调控序列分析

CpG岛、启动子区域和转录终止信号的预测11第11页,共34页,2023年,2月20日,星期一CpG岛的预测CpG岛常位于真核生物基因转录起始位点,GC含>50%,长度>200bp的一段DNA序列。12第12页,共34页,2023年,2月20日,星期一CpGIsland分析常用软件CpGIsland/cpgislands2/cpg.aspxWebCpGPlothttp://www.ebi.ac.uk/emboss/cpgplot/index.htmlWebCpGfinder/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoterWebCpGi130/CpG130.dowebCpGproDhttp://pbil.univ-lyon1.fr/software/cpgprod_query.htmlweb13第13页,共34页,2023年,2月20日,星期一提交序列文件提交序列参数选项CpG岛的预测:CpGPlothttp://www.ebi.ac.uk/Tools/emboss/cpgplot/预测单元窗口步移观测值与期望值打分最小GC含量CpG岛的长度反向链和互补链是否预测第14页,共34页,2023年,2月20日,星期一15第15页,共34页,2023年,2月20日,星期一GENESCAN预测结果

起始为532bp

终止于51783bp观测值与期望值的比值GC含量的比值预测得到的CpG预测得到的CpG16第16页,共34页,2023年,2月20日,星期一转录终止信号上游作用元件:AAUAAA下游作用元件:GCrich二重对称区、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA5’3’AAUAAACAAAAAAAAAAAAA成熟mRNA5’3’AAUAAACAGUmRNA前体5’3’17第17页,共34页,2023年,2月20日,星期一转录终止信号预测:POLYAH/berry.phtml?topic=polyah&group=programs&subgroup=promoter

提交序列文件提交序列18第18页,共34页,2023年,2月20日,星期一polyA位置GENESCAN预测结果

PolyA位点52490bpPOLYAH输出结果对预测起佐证的作用权重吻合19第19页,共34页,2023年,2月20日,星期一启动子区结构启动子(Promoter)位于结构基因5’端上游,能活化RNA聚合酶,使之与模板DNA结合并具有转录起始的特异性。转录起始位点(Transcriptionstartsite,TSS)PYCAPY(嘧啶)核心启动子元件(Corepromoterelement)TATAbox,Pribnowbox

(TATAA)上游启动子元件(Upstreampromoterelement,UPE)CAATbox,GCbox,SP1,Otc增强子(Enhancer)20第20页,共34页,2023年,2月20日,星期一原核和真核生物基因转录起始位点上游区结构原核生物真核生物TTGACATATAATAmRNA+1-10-35PyAPyTATAATGC区CAAT区mRNA+1-40-25-110增强子上游启动子元件,UPE核心启动子元件转录起始位点21第21页,共34页,2023年,2月20日,星期一PromoterScan:80/molbio/proscan/WebPromoser/zlab/PromoSer/WebNeuralNetworkPromoterPrediction/seq_tools/promoter.htmlWebSoftberry:BPROM,TSSP,TSSG,TSSW/berry.phtml?topic=index&group=programs&subgroup=promoterWebMatInspectorhttp://www.gene-regulation.de/WebRSAThttp://rsat.ulb.ac.be/rsat/WebCister/~mfrith/cister.shtmlWeb启动子结合位点分析常用软件22第22页,共34页,2023年,2月20日,星期一启动子预测:PromoterScan/molbio/proscan/提交序列去掉该选项23第23页,共34页,2023年,2月20日,星期一PromoterScan输出结果找到的TATAbox和转录起始位点预测可能的转录因子转录因子在提交序列中的位置24第24页,共34页,2023年,2月20日,星期一基因密码子偏好性1.研究蛋白质结构功能中的作用2.在表达外源基因方面的作用3.在生物信息学研究中的作用25第25页,共34页,2023年,2月20日,星期一基因密码子偏好性:CodonW粘帖目的序列密码子表的选择http://mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw#forms::codonw是否计算所有参数,一般选择物种选择,与表达物种有关,可以自行输入。26第26页,共34页,2023年,2月20日,星期一CAI(CodonAdaptationIndex)密码子适应指数

目标基因与高表达基因的密码子偏好性的相似程度。

(1完全相同,0完全不相同,本例为0.173)CBI(CondonBiasIndex)密码子偏好指标

目标基因与随机序列的最优密码子的差异程度

(1完全偏好,0随机情况,可能为负值,本例为-0.049)Fop(Frequencyofoptimalcodon)最优密码子频率

目标基因的最优密码子数与全部同义密码子数的比值

(1完全偏好,0完全无偏好,本例为0.380)多个密码子编码同一个氨基酸,同义密码子。有些物种偏好某些(1~2种)同义密码子,这1~2种同义密码子即为高表达密码子。该现象叫密码子偏好性。27第27页,共34页,2023年,2月20日,星期一各项指数输出结果密码子使用频率CodonW结果界面有效密码子数GC含量同义密码子总数有效密码子总数外源表达蛋白的物理性质(亲疏水性)外源表达蛋白芳香性28第28页,共34页,2023年,2月20日,星期一内含子/外显子剪切位点识别如何分析核酸序列中的外显子组成?通过对特征序列(GT-AG)的分析进行直接的预测基因预测软件(NetGene2)与相应的基因组序列比对,分析比对片段的分布位置(Spidey)29第29页,共34页,2023年,2月20日,星期一30第30页,共34页,2023年,2月20日,星期一剪切位点识别:NetGene2http://www.cbs.dtu.dk/services/NetGene2/提交序列选择物种点击31第31页,共34页,2023年,2月20日,星期一NetGene2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论