真核生物基因结构的预测分析方法(软件)_第1页
真核生物基因结构的预测分析方法(软件)_第2页
真核生物基因结构的预测分析方法(软件)_第3页
真核生物基因结构的预测分析方法(软件)_第4页
真核生物基因结构的预测分析方法(软件)_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 实习二实习二 真核生物基因结构的预真核生物基因结构的预 测分析测分析 浙江加州国际纳米技术研究院浙江加州国际纳米技术研究院 2010年11月 苏锟楷苏锟楷 楼小燕楼小燕 韩韩 序序 蒋蒋 琰琰 2 实习一实习一基因组数据注释和功能分析基因组数据注释和功能分析 实习二实习二真核生物基因结构的预测分析真核生物基因结构的预测分析 实习三实习三芯片的基本数据处理和分析芯片的基本数据处理和分析 实习四实习四蛋白质结构与功能分析蛋白质结构与功能分析 实习五实习五蛋白质组学数据分析蛋白质组学数据分析 实习六实习六系统生物学软件实习系统生物学软件实习 课程内容课程内容 基因组学基因组学 转录物组学转录物组

2、学 蛋白质组学蛋白质组学 系统生物学系统生物学 3 编码区预测编码区预测 Codon bias GC Content 限制性酶切位点限制性酶切位点 基因结构分析基因结构分析 选择性剪切选择性剪切 转录调控因子转录调控因子 序列比对序列比对 功能注释功能注释 KEGG GO 系统发育树系统发育树 蛋白质序列蛋白质序列 翻翻 译译 蛋白质理化性质蛋白质理化性质 二级结构预测二级结构预测 结构域分析结构域分析 重要信号位点分析重要信号位点分析 三级结构预测三级结构预测 基因组功能分析基因组功能分析 4 真核生物基因的主要结构真核生物基因的主要结构 5 基因结构分析基因结构分析 开放读码框开放读码框

3、GENSCAN GENOMESCAN CpG岛岛CpGPlot 转录终止信号转录终止信号POLYAH 启动子启动子/转录起始位点转录起始位点PromoterScan 密码子偏好分析密码子偏好分析CodonW mRNA剪切位点剪切位点 NETGENE2 Spidey 选择性剪切选择性剪切ASTD 基因结构分析常用软件基因结构分析常用软件 6 开放读码框的识别开放读码框的识别 开放读码框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列 ORF 是潜在的蛋白质编码区 7 基因开放阅读框基因开放阅读框/ /基因结构分析识别工具基因结构分析识别工具 ORF

4、Finder /gorf/gorf.html NCBI通用 BestORFhttp:/ group=programs&subgroup=gfind Softberry真核 GENSCAN/GENSCAN.htmlMIT脊椎、拟南芥、玉米脊椎、拟南芥、玉米 Gene Finder/tools/genefinder/Zhang lab人、小鼠、拟南芥、酵母 FGENESHhttp:/ &group=programs&subgroup=gfind Softberry真核(

5、基因结构) GeneMark/GeneMark/eukhmm.cgiGIT原核 GLIMMER/genomes/MICROBES/gli mmer_3.cgi /software/glimmer Maryland原核 Fgeneshttp:/ group=programs&subgroup=gfind Softberry人(基因结构) FgeneSVhttp:/ oup=programs&subgroup=gfindv Softberry病毒

6、 Generation /generation/ORNL原核 FGENESBhttp:/ &group=programs&subgroup=gfindb Softberry细菌(基因结构) GenomeScan /genomescan.html MIT脊椎、拟南芥、玉米脊椎、拟南芥、玉米 GeneWise2http:/www.ebi.ac.uk/Wise2/EBI人 GRAIL/grailexp/ORNL人、小鼠、拟南芥、果蝇 8 ORF识别识别:GENSCAN h

7、ttp://GENSCAN.html 结果返回到邮箱(可选)结果返回到邮箱(可选) 提交序列提交序列 提交序列文件提交序列文件 运行运行GENSCAN 显示氨基酸或显示氨基酸或CDS序列序列 序列名称(可选)序列名称(可选) 是否显示非最优外显子是否显示非最优外显子 选择物种类型选择物种类型 9 9 GENSCAN输出结果:文本输出结果:文本 1010 GENSCAN输出结果:图形输出结果:图形 11 ORF识别识别: GenomeScan 提交待分析序列提交待分析序列 提交同源蛋白质序列提交同源蛋白质序列 运行运行GenomeScan http:/genes.mit

8、.edu/genomescan.html 12 GenomeScan输出结果输出结果:文本:文本 预测外显子位置、可预测外显子位置、可 信度等信息信度等信息 同源比同源比 对信息对信息 预测结果的氨基酸序列预测结果的氨基酸序列 13 GenomeScan输出结果输出结果:图形:图形 14 课堂练习 1使用GENESCAN预测序列中可能的ORF。 2使用GENOMESCAN预测序列中可能的 ORF。 练习用的序列文件在c:zcnishixi2文件下, 名字为clone.fasta,使用写字板打开查看。 15 转录调控序列分析转录调控序列分析 CpG岛、转录终止信号和启动子区域的预测 16 CpG

9、岛的预测 CpG岛 常位于真核生物基因转录起始位点,GC含50% , 长度200bp的一段DNA序列。 17 CpG Island 分析常用软件分析常用软件 CpG Island http:/ x Web CpGPlot http:/www.ebi.ac.uk/emboss/cpgplot/index. html Web CpG finder http:/ pgfinder&group=programs&subgroup=pro moter Web CpGi130http:/ CpGproD http:/pbil.univ- lyon1.fr/software/cpgprod_query.ht

10、ml web 提交序列文件提交序列文件 提交序列提交序列 参数选项参数选项 CpG岛的预测:CpGPlot http:/www.ebi.ac.uk/emboss/cpgplot/index.html 19 GENESCAN 预测结果 起始为532bp 终止于51783bp 20 转录终止信号转录终止信号 上游作用元件:AAUAAA 下游作用元件:GC rich二重对称区、UUUUUU C-G C-G G-C G-C U-A G-C G-C C-G G-C UUUUUUUUU RNA 53 AAUAAACAAAAAAAAAAAAA 成熟mRNA 53 AAUAAACAGUmRNA前体5 3 21

11、 转录终止信号预测:POLYAH http:/ &subgroup=promoter 提交序列文件提交序列文件 提交序列提交序列 22 polyA位置 GENESCAN预测结果 PolyA位点52490bp POLYAH输出结果 23 启动子区结构启动子区结构 启动子(Promoter) 位于结构基因5端上游,能活化RNA聚合酶,使之与模板 DNA结合并具有转录起始的特异性。 转录起始位点(Transcription start site, TSS) PYCAPY(嘧啶) 核心启动子元件(Core promoter element) TATA box,Pribnow box (TATAA) 上

12、游启动子元件(Upstream promoter element,UPE) CAAT box,GC box,SP1,Otc 增强子(Enhancer) 24 原核和真核生物基因转录起始位点上游区原核和真核生物基因转录起始位点上游区 结构结构 原核生物原核生物 真核生物真核生物 TTGACATATAATA mRNA 11035 PyAPyTATAATGC区 CAAT区 mRNA 14025110 增强子增强子 上游启动子元件,上游启动子元件,UPE核心启动子元件核心启动子元件 转录起始转录起始 位点位点 25 PromoterScan:80/mol

13、bio/proscan/Web Promoser/zlab/PromoSer/Web Neural Network Promoter Prediction /seq_tools/promoter.htmlWeb Softberry: BPROM, TSSP, TSSG, TSSW http:/ ex&group=programs&subgroup=promoter Web MatInspectorhttp:/www.gene-regulation.de/Web RSAThttp:/rsat.ulb.ac.be/

14、rsat/Web Cister/mfrith/cister.shtmlWeb 启动子结合位点分析常用软件启动子结合位点分析常用软件 26 启动子预测:PromoterScan /molbio/proscan/ 提交序列提交序列 27 PromoterScan输出结果 找到的TATA box和转录起始位点 预测可能的转录因子预测可能的转录因子转录因子在提交序列中的位置转录因子在提交序列中的位置 28 课堂练习 1 使用CpG Plot预测基因的CpG island 位置。 2 使用PolyAH预测基因可能的转

15、录终止 的位置。 3 使用PromotorScan寻找基因上游序列 里可能的转录因子调控区域。 基因密码子偏好性基因密码子偏好性 29 1.研究研究蛋白质结蛋白质结 构功能构功能中的作用中的作用 2.在在表达外源基表达外源基 因因方面的作用方面的作用 3.在在生物信息学生物信息学 研究中的作用研究中的作用 基因密码子偏好性基因密码子偏好性: CodonW 30 粘帖目的序列粘帖目的序列 密码子表的选择密码子表的选择 如需计算如需计算FOP/CBIFOP/CBI 选择相应物种选择相应物种 如需计算如需计算CAICAI选择选择 相应物种相应物种 输出格式输出格式( (默认不选默认不选) ) 汇总所

16、有基因的信息汇总所有基因的信息 31 参 数 选 择 计算所有指数计算所有指数 选择导入对应物种选择导入对应物种 CAICAI FOPFOP CBICBI数据数据 计算有效密码子数计算有效密码子数 计算计算GCGC含量含量 计算计算GC3sGC3s含量含量 计算同义密码子数量计算同义密码子数量 计算同义密码子计算同义密码子 第三位碱基组成第三位碱基组成 密码子总数密码子总数 32 各项指数输出结果各项指数输出结果 密码子使用频率密码子使用频率 CodonW结果界面 课堂练习 使用CodonW分析基因的密码子使用偏好, 了解密码子偏好分析中各指数的含义。 33 34 内含子内含子/外显子剪切位点

17、识别外显子剪切位点识别 如何分析核酸序列中的外显子组成? 通过对特征序列(GT-AG)的分析进行直 接的预测基因预测软件(NetGene2) 与相应的基因组序列比对,分析比对片 段的分布位置(Spidey) 35 36 剪切位点识别:剪切位点识别:NetGene2 http:/www.cbs.dtu.dk/services/NetGene2/ 提交序列提交序列 选择物种选择物种 37 NetGene2输出结果输出结果 供体位点供体位点 受体位点受体位点 可信度可信度 相位相位 38 mRNA剪切位点识别:剪切位点识别:Spidey NCBI开发的在线预测程序 用于mRNA序列同基因组序列比对分

18、析 /spidey 39 Spidey同源序列的获得同源序列的获得:序列比对序列比对 通过BLAST进行序列比对,找到可能同源 的相似性好的一系列mRNA序列。 BLAST比对到的三条mRNA序列 40 输入基因组序列或序列数据库号输入基因组序列或序列数据库号 输入相似性序列输入相似性序列 判断用于分析的序列间的判断用于分析的序列间的 差异,并调整比对参数差异,并调整比对参数 不受默认内含子长度限不受默认内含子长度限 制,制, 默认长度:内部内含子默认长度:内部内含子 为为35kb, 35kb, 末端内含子为末端内含子为 100kb100kb 比对阈

19、值比对阈值 选择物种选择物种 输出格式选择输出格式选择 41 Spidey输出结果 第一条蓝色序列第一条蓝色序列 为基因组序列,为基因组序列, 橘黄色为外显子橘黄色为外显子 外显子对应于外显子对应于 基因组上的基因组上的 起始起始/ /结束位置结束位置 外显子对应于外显子对应于 mRNA/cDNAmRNA/cDNA上的上的 起始起始/ /结束位置结束位置 供体、受体位点供体、受体位点 外显子外显子 长度长度 一致性一致性 百分比百分比 错配和错配和gapgap 外显子外显子 序号序号 序列联配结果序列联配结果 42 课堂练习 1 练习两种预测剪切位点的软件的使用, NetGene2和Spidey。 2 Spidey的同源序列文件保存在 c:zcnishixi2文件下,名字为Spidey.txt, 使用写字板打开查看。 43 选择性剪切选择性剪切(Alternative splicing)分析分析 选择性剪接是调控基因表达的重要机制 了解不同物种、细胞、发育阶段、环境压力下基因 的调控表达机制 44 选择性剪接的类型选择性剪接的类型 选择性剪切的五种基本类型: 内含子保留. 5端选择性剪切位点. 3端选择性剪切位点. 外显子遗漏. 互斥外显子. 45 查询选择性剪切相关的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论