五基因结构预测与基因表达分析_第1页
五基因结构预测与基因表达分析_第2页
五基因结构预测与基因表达分析_第3页
五基因结构预测与基因表达分析_第4页
五基因结构预测与基因表达分析_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Chapter 5 基因结构预测基因结构预测与基因表达分析与基因表达分析蛋白质序列蛋白质序列翻翻译译调控元件分析调控元件分析编码区预测编码区预测基因结构分析基因结构分析选择性剪切选择性剪切SNP序列比对序列比对功能注释功能注释KEGGGO系统发育树系统发育树蛋白质理化性质蛋白质理化性质二级结构预测二级结构预测结构域分析结构域分析重要信号位点分析重要信号位点分析三级结构预测三级结构预测基因预测和基因结构分析基因预测和基因结构分析u生物信息学中的重要内容之一生物信息学中的重要内容之一u预测编码蛋白质的基因预测编码蛋白质的基因u排除重复序列排除重复序列u确定开放阅读框(确定开放阅读框(open re

2、ading frame, ORF)内含子内含子/外显子外显子剪切位点识别;选择性剪切分析剪切位点识别;选择性剪切分析 (一)(一) 基因预测的基本分析内容基因预测的基本分析内容u确定基因的调控区确定基因的调控区核心启动子核心启动子/转录因子结合位点转录因子结合位点/转录启始位转录启始位点的识别;转录终止信号的预测;点的识别;转录终止信号的预测; CpG 岛的识别等岛的识别等 ATG TGA5-UTR3-UTRExon 1Exon 2Promoter (二)(二) 基因预测的基本方法基因预测的基本方法 1. 序列相似性搜索序列相似性搜索基因组基因组DNA序列序列 在在6个阅读框中进行翻译并与蛋白

3、质数据库中的序个阅读框中进行翻译并与蛋白质数据库中的序列进行比较分析(如列进行比较分析(如Blastx) 对对EST数据库中同一生物的数据库中同一生物的cDNA序列进行比较序列进行比较分析(如分析(如Blastn)确定基因数目和对应的确定基因数目和对应的ORFu 分析举例:水稻分析举例:水稻Xa21基因区段基因区段DNA序列(序列(U37133)v CDS:1-2677 bp处和处和3521-3921 bp处处v Blastx分析结果分析结果(检索蛋白质数据库):与(检索蛋白质数据库):与水稻蛋白质序列比较水稻蛋白质序列比较v Blastn分析结果分析结果(检索(检索est other数据库)

4、:数据库):与水稻与水稻cDNA序列比较序列比较 取决于数据库中取决于数据库中EST数据的数量和长度数据的数量和长度 通过通过“Tree view”查看与查看与U37133序列序列同源的其它同源的其它EST序列序列 有些蛋白质序列是推测获得的有些蛋白质序列是推测获得的Blastx结果结果与与cDNA的比对结果的比对结果 2. 根据模式序列预测基因根据模式序列预测基因u 各种基因预测软件各种基因预测软件u 取决于人们取决于人们对已知基因结构特征的认识对已知基因结构特征的认识u 采用统计学方法采用统计学方法v 基于一个或多个已知序列模式对未知序基于一个或多个已知序列模式对未知序列进行分类列进行分类

5、v 密码子偏爱性密码子偏爱性v 对发现的模式进行统计检验对发现的模式进行统计检验 启动子结构启动子结构 外显子、内含子外显子、内含子u 原核微生物(大肠杆菌原核微生物(大肠杆菌lexA基因的基因的DNA模式)模式)v LexA repressor的结合位点(启动子区段)的结合位点(启动子区段) CTGNNNNNNNNNNCAGv 与与RNA聚合酶相互作用位点(聚合酶相互作用位点(-10至至-35的启动的启动子区)子区) TTGACA和和TATAATv 核糖体结合位点(转录起始位点后)核糖体结合位点(转录起始位点后) GGAGGu 真核生物真核生物v 基因结构复杂基因结构复杂v 已知外显子、内含

6、子外显子边界、启动子序已知外显子、内含子外显子边界、启动子序列特征列特征基因预测方法基因预测方法 不同方法预测不同方法预测 核酸序列出现频率统计法 同源比较法 隐马尔可夫模型法 决策树方法 语言学方法 神经网络分析法 训练数据集有针对性训练数据集有针对性 原核生物vs.真核生物 动物vs.植物基因预测软件基因预测软件基因结构分析工具基因结构分析工具GENSCAN/GENSCAN.htmlWeb/LinuxGeneMarkhttp:/www.ebi.ac.uk/genemark/ /GeneMark/

7、WebGene Finder/tools/genefinder/(Dr. Michael Zhang )WebFGENESHhttp:/ LinuxFgeneSB/ FgeneSVhttp:/ /generation/WebGeneBuilder http:/r.it/webgene/genebuilder.html WebFGENESH+ /+http:/ Web/LinuxGenomeScan /genomescan.html WebGeneWise http:/www

8、.sanger.ac.uk/Software/Wise2/ WebGRAIL/grailexp/Web/Linux/WindowsBCM Gene Finder/seq-search/gene-search.htmlWebu 目前还没有一个基因预测工具可以完全正确地预测一个目前还没有一个基因预测工具可以完全正确地预测一个基因组中的所有基因基因组中的所有基因(Mathe C, Sagot MF, Schiex T, Rouze P. Current methods of gene pr

9、ediction, their strengths and weaknesses. Nucleic Acids Res. 30 (19):4103-4117, 2002)u 目前最好的基因预测工具预测一个基因组中的所有外显目前最好的基因预测工具预测一个基因组中的所有外显子的准确率最多达到子的准确率最多达到75%,预测基因结构的准确率,预测基因结构的准确率100相似度相似度95%S.Gupta et al., Genome wide identification and classification of alternative splicing based on EST data, 2004,

10、 20(16): 2579-2585基因周围调控序列分析基因周围调控序列分析 CpG岛 位于真核生物基因转录起始位点上游,GC含50% ,长度200bp 转录起始位点(Transcription start site, TSS) PY2CAPY5 核心启动子(Core promoter element) TATA box,Pribnow box 上游启动子元件(Upstream promoter element) CAAT box,GC box,SP1,Otc 转录终止信号 AAUAAA,UUUUUU 操纵子、终止子、增强子、沉默子启动子数据库启动子数据库TransFac http:/www.

11、gene- EPD http:/www.epd.isb-sib.ch/ TRRD http:/wwwmgs.bionet.nsc.ru/mgs/gnw/trrd Jasparhttp:/jaspar.cgb.ki.se/cgi-bin/jaspar_db.plZhang Lab/software/index1.htm DBTSShttp:/dbtss.hgc.jp/index.htmlMIRAGE/ Bacillus subtilis http:/dbtbs.hgc.jp/ Drosophila melanogaste

12、r /labs/Kadonaga/DCPD.html E. coli /ecoli_matrices/ Human /mfrith/HPD.html PlantProm http:/ Planthttp:/www.dna.affrc.go.jp/PLACE http:/oberon.fvms.ugent.be:8080/PlantCARE/index.html Saccharomyces cerevisiae /j

13、ian/ CpG Island 分析分析CpG Island http:/ finderhttp:/ Network Promoter Prediction/seq_tools/promoter.htmlWebSoftberry: BPROM, TSSP, TSSG, TSSWhttp:/ ftp:/ariane.gsf.de/pub/win95_NT/ConsInspector.exeWindows/LinuxCister/mfrith/cister.shtmlWeb Promoter预测Cis-regulator

14、y elements analysisPlantCARE转录终止信号预测转录终止信号预测Hcpolyahttp:/r.it/webgene/wwwHC_polya.htm1Web POLYAHhttp:/ /tools/polyadq/polyadq_form.htmlWeb编码区综合分析举例编码区综合分析举例CpG岛分析No调控序列所在位置Cister结果:881- 896 CCAAT908- 923 CCAAT转录终止信号GetOrfGenScan735 - 773 964 - 1020 1054 - 1146 1112 - 1156 1341 -

15、1625 1054-1490(1054-1145, 1268-1490 )CCTAGTCCAGACGCCATGGGT比对分析(Blastx,Blastn,Blastp)Blastx结果: gamma globin:1054-11461266-1493 /mfrith/HPD.htmlHuman gene 5HSA004013: -10001000基因表达分析基因表达分析利用已发表基因芯片数据分析目标基因的表达情况 GEO serves as a public repository for a wide range of high-throughput expe

16、rimental data. These data include single and dual channel microarray-based experiments measuring mRNA, miRNA, genomic DNA (arrayCGH, ChIP-chip, and SNP), and protein abundance, as well as non-array techniques such as serial analysis of gene expression (SAGE), mass spectrometry peptide profiling, and

17、 various types of quantitative sequence data.GEO数据库查询数据库查询根据关键词查询或或根据GEO accession查询可下载这两种格式作进一步分析探针探针不同处理条件下的基因表达量不同处理条件下的基因表达量TXT格式如何判断目标基因所对应的芯片探针?根据soft格式文件中探针的注释信息利用PlantGDB数据库中的PLEXdb Probe Match工具查询选择数据库选择数据库粘贴目标基因粘贴目标基因CDS序列序列其它资源其它资源GenevestigatorGenevestigator is a reference expression dat

18、abase and meta-analysis system. It allows biologists to study the expression and regulation of genes in a broad variety of contexts by summarizing information from hundreds of microarray experiments into easily interpretable results. A user-friendly interface allows you to visualize gene expression

19、in many different tissues, at multiple developmental stages, or in response to large sets of stimuli, diseases, drug treatments, or genetic modifications. This type of meta-analysis is core to understanding the spatio-temporal-response regulation of genes, to identify or validate biomarkers, and to find out which subnetworks are commonly affected in different diseases and conditions.注册后可以免费试用以软件以软件Genevestigator tool的形式在的形式在PC机上打开进行操作。目机上打开进行操作。目前整合了拟南芥、水稻、人、老鼠等物种的基因芯片表达数据前整合了拟南芥、水稻、人、老鼠等物种的基因芯片表达数据Plant Expression DatebaseArrayexpresshttp:/www.ebi.ac.uk/microarray-as/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论