生物信息学基因组分析_第1页
生物信息学基因组分析_第2页
生物信息学基因组分析_第3页
生物信息学基因组分析_第4页
生物信息学基因组分析_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类基因组计划目前一页\总数五十六页\编于十九点基因组、转录组和蛋白质组基因组转录组蛋白质组化学生物学目前二页\总数五十六页\编于十九点本章内容提要1.基因组的结构与内容2.基因组注释3.比较基因组学4.基因/蛋白质的功能预测目前三页\总数五十六页\编于十九点1.基因组的结构与内容(1)基因的结构(2)mRNA:可变剪切(3)蛋白质:翻译后修饰(4)相互作用网络:基因、蛋白质、小分子之间的相互作用(5)非编码区a.功能元件:转录因子结合位点;启动子…b.Non-codingRNA:MicroRNAc.转座子d.重复片段e.伪基因(Pseudogene)目前四页\总数五十六页\编于十九点(1)基因的结构目前五页\总数五十六页\编于十九点基因组大小&基因数目前六页\总数五十六页\编于十九点基因数量->生物复杂性?1.基因数量的变化,无法解释生物学功能、调控机理以及物种多样性和复杂性的巨大变化2.当前解释:蛋白质组的多样性和复杂性->物种的多样性和复杂性;~10,000,000种蛋白质分子3.两种观点:a.

转录后层面,mRNA剪切,产生拼接异构体b.

蛋白质层面,蛋白质序列上一个或多个位点上发生的翻译后修饰目前七页\总数五十六页\编于十九点GenotypetoPhenotype目前八页\总数五十六页\编于十九点isoform1isoform2isoform3mRNASplicing转录后层面:mRNASplicing目前九页\总数五十六页\编于十九点PhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白质层面:翻译后修饰目前十页\总数五十六页\编于十九点(4)相互作用网络蛋白质-蛋白质相互作用网络目前十一页\总数五十六页\编于十九点细胞信号通路G1/S检验点:有调控方向目前十二页\总数五十六页\编于十九点(5)非编码区a.功能元件:转录因子结合位点;启动子…b.Non-codingRNA:MicroRNAc.转座子d.重复片段e.伪基因(Pseudogene)目前十三页\总数五十六页\编于十九点Functionalelements:Promotor目前十四页\总数五十六页\编于十九点TranscriptionFactorBindingSiteCRM:cis-regulatorymodules目前十五页\总数五十六页\编于十九点Gal4pandKruppelGal4pKruppel目前十六页\总数五十六页\编于十九点其他功能元件Exonsplicingenhancer(ESE)andsilencer(ESS)Intronsplicingenhancer(ISE)andsilencer(ISS)目前十七页\总数五十六页\编于十九点Non-codingRNA1.不翻译成蛋白质,具有重要的调控功能2.分类:a.transferRNA(tRNA)b.ribosomalRNA(rRNA)c.snoRNAs,d.microRNAs,e.siRNAsf.piRNAs:与piwi相互作用的RNAg.longncRNAs:Xist…目前十八页\总数五十六页\编于十九点tRNA&rRNA目前十九页\总数五十六页\编于十九点snoRNAssnoRNAs:SmallnucleolarRNAs;介导其他RNA分子的化学修饰,例如甲基化目前二十页\总数五十六页\编于十九点microRNA/miRNA1.长度21-23bp2.调控基因的表达3.pre-miRNA:~70bp目前二十一页\总数五十六页\编于十九点Transposon转座子:在基因组中能够移动位置的DNA序列目前二十二页\总数五十六页\编于十九点2.基因组注释(1)基因组序列的拼装(2)基因预测(3)可变剪切的预测(4)非编码的功能元件的预测目前二十三页\总数五十六页\编于十九点(1)基因组测序:鸟枪法目前二十四页\总数五十六页\编于十九点基因组的拼装目前二十五页\总数五十六页\编于十九点重复序列带来干扰目前二十六页\总数五十六页\编于十九点(2)基因预测直接的,序列高度匹配同一或近缘物种中,与EST,cDNA,蛋白质等序列完美或近似完美的匹配间接的,基于统计学的序列比对(Homology)从头预测(abinitio)以上两种方法的结合目前二十七页\总数五十六页\编于十九点真核生物的基因结构5’3’3’5’

~1-100Mbp5’3’3’5’…………

~1-1000kbpexons(cds

&

utr)/introns(~102-103bp)(~102-105bp)Polyadenylationsitepromoter(~103bp)enhancers(~101-102bp)otherregulatorysequences(~101-102bp)目前二十八页\总数五十六页\编于十九点基因的其他特征1.ORF(OpenReadingFrame):从AUG开始,至stopcodon终止2.CodonUsage:CAI…目前二十九页\总数五十六页\编于十九点HMMmodelforGenePrediction(Genie)Kulp,D.,PhDThesis,UCSC2003目前三十页\总数五十六页\编于十九点(3)可变剪切的预测将EST,cDNA序列比对到基因组上目前三十一页\总数五十六页\编于十九点部分有向图算法目前三十二页\总数五十六页\编于十九点3.比较基因组学(1)有功能的通常保守(2)例:SUMO底物的预测:a.SUMO化位点存在ψ-K-X-E模体b.核定位信号(NLS)c.人和小鼠中,SUMO化位点应当保守d.功能分析:GeneOntology(3)分析结果:a.2,683个人-小鼠保守的SUMO化底物b.SUMO化的功能:参与转录调控、信号转导等目前三十三页\总数五十六页\编于十九点GeneOntology:基因本体论1.描述基因/蛋白质的功能2.三类术语(Term):a.Cellularcomponent:在哪里?b.Biologicalprocess:干什么?c.Molecularfunction:我是谁?目前三十四页\总数五十六页\编于十九点GeneOntology:基因本体论目前三十五页\总数五十六页\编于十九点目前三十六页\总数五十六页\编于十九点功能显著性分析:超几何分布目前三十七页\总数五十六页\编于十九点目前三十八页\总数五十六页\编于十九点转录因子Inhumanproteome:

DNAbinding(GO:0003677):2,255Transcriptionfactoractivity(GO:0003700):1,102regulationoftranscription,DNA-dependent(GO:0006355):2,174InSUMOSubstrates:DNAbinding(GO:0003677):530Transcriptionfactoractivity(GO:0003700):304regulationoftranscription,DNA-dependent(GO:0006355):510因此,可以估计1/4~1/3的转录因子受到SUMO化的调控目前三十九页\总数五十六页\编于十九点4.基因/蛋白质的功能预测(1)一级序列的比较:相似的序列具有相似的功能(2)保守的功能结构域:保守的功能(3)三级结构的比较:相似的结构具有相似的功能(4)蛋白质相互作用的预测目前四十页\总数五十六页\编于十九点(1)一级序列的比较1.同源物的鉴定:不同物种中的直系、旁系同源物的预测2.主要工具:BLAST目前四十一页\总数五十六页\编于十九点(2)保守的功能结构域1.保守的功能结构域:保守的功能2.常用工具:工具网址Interprohttp://www.ebi.ac.uk/interpro/Pfamhttp://pfam.sanger.ac.uk/SMARThttp://smart.embl.de/PROSITE/prosite/ProDomhttp://prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgi目前四十二页\总数五十六页\编于十九点例:Nek2目前四十三页\总数五十六页\编于十九点(3)三级结构的比较1.Ubiquitin:泛素,主要负责蛋白质的降解2.SUMO:小的类泛素蛋白质,基因转录&信号通路3.催化反应通路的分子机制相似4.序列相似性:不显著!目前四十四页\总数五十六页\编于十九点Ubiquitinvs.SUMO目前四十五页\总数五十六页\编于十九点序列相似性:~20%目前四十六页\总数五十六页\编于十九点结构相似性SUMOUbiquitin目前四十七页\总数五十六页\编于十九点(4)蛋白质相互作用的预测1.基因组信息(Genomicinformation)A.GenefusionandfissionB.Conservationofgeneorder/bidirectionalpairsC.Phylogeneticprofile2.关联的序列特征(Correlatedsequencesignatures)3.mRNAco-expression4.Literaturemining目前四十八页\总数五十六页\编于十九点Genefusion/fission:RosettaStoneABABQueryproteinLinkedproteinRosettaproteinMarcotteEMetal.,Science1999,285:751-753;EnrightAJetal.,Nature,1999,402:86-90GenomeAGenomeB目前四十九页\总数五十六页\编于十九点Conservationofgeneorder/bidirectionalpairsGeneorderpairsBidirectionaltranscribedgenepairsDandekarTetal.,TIBS,1998,23:324-328;OverbeekRetal.,PNAS,1999,96:2896-2901;KorbelJOetal.,NBT,2004,22:911-917目前五十页\总数五十六页\编于十九点PhylogeneticprofilesPellegriniMetal.,PNAS,1999,96:4285-4288;HuynenMAetal.,PNAS,1998,95:5849-5856目前五十一页\总数五十六页\编于十九点CorrelatedsequencesignaturesA.B.ThismodeliscomputationallyfasterandmoreconvenientPIDmodelPIDCmodel目前五十二页\总数五十六页\编于十九点P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论