计算系统生物学导论4蛋白质组学_第1页
计算系统生物学导论4蛋白质组学_第2页
计算系统生物学导论4蛋白质组学_第3页
计算系统生物学导论4蛋白质组学_第4页
计算系统生物学导论4蛋白质组学_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

TheIntroductionof

ComputationalSystemsBiology

计算系统生物学导论

WangDongAssociateProfessor

蛋白质组学proteinRNADNA蛋白质相互网络蛋白质相互作用网络

蛋白质网络可以被表示成为一个无向图,其中每个节点表示一个蛋白质,每条边表示一对蛋白质节点之间的相互作用。模块性(Modularity)蛋白质网络拓扑特征蛋白质相互作用网络特点:网络直径与特征路径长度度的分布特性及度与度的相关性聚集系数(clustercoefficient)间隔,等等拓扑特征小世界特性聚集系数和特征路径长度无尺度网络特性幂规律分布;增长和偏好连接向心特性模块化结构特征蛋白质网络无尺度的意义Hub节点主导着网络大量低连接度节点的意义呢?hub节点在网络中的作用和网络的鲁棒性从因特网路由器中随机选择的失效节点比例高达80%,剩余的路由器还是能组成一个完整的模块并保证任意两个节点间存在通路。要扰乱细抱内的蛋白质相互作用网络也同样困难,即使在细胞内随机制造较高比例的突变,那些没有改变的蛋白质还是会组成一个连通的网络。

无尺度网络对意外故障具有惊人的鲁棒性,但对于hub节点的过分依赖导致了攻击脆弱性

蛋白质网络怎么组织的?这是我们最关心的问题目前已知的知识:小世界:表明蛋白质网络有一些很潇洒很随意的链接,导致网络路径得到很大压缩。无尺度:表明蛋白质网络有数目超过我们期望的很牛的节点,主导着整个网络。‘网络是怎么组织的’到‘模块是怎么组织的?’模块之间的协作怎么完成?神经生物学的类比Red:transcriptionregulation;Blue:cell-cycle/cell-fatecontrol;Green:RNAprocessing;Yellow:proteintransport.ProteincomplexesandfunctionalmodulesinmolecularnetworksSpirin,Mirny,PNAS100,12123(2003)modulesthataredenselyconnectedwithinthemselvesbutsparselyconnectedwiththerestofthenetwork从‘模块是怎么组织的?’到‘模块在网络中是怎么组织的?’蛋白质组相互作用数据库数据库名说明网址BIND生物分子相互作用数据库http://bind.ca/DIP蛋白质相互作用数据库/IntAct蛋白质相互作用数据库http://www.ebi.ac.uk/intact/index.htmlInterDom结构域相互作用数据库.sg/MINT生物分子相互作用数据库http://mint.bio.uniroma2.it/mint/STRING蛋白质相互作用网络数据库http://string.embl.de/HPRD人类蛋白质参考数据库/MPPI脯乳动物相互作用数据库http://mips.gsf.de/proj/ppi/biogrid蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人/PDZbase包含PDZ结构域的蛋白质相互作用数据库/services/pdz/startReactome生物学通路的辅助知识库/PPIdatabasesInteractionsMIPSDIPBINDGRIDMINTHPRDOPHID数据库比较之数据量SureshMathivananAnevaluationofhumanprotein-proteininteractiondatainthepublicdomain.BMCBioinformatics2006,7HPRD(HumanProteinReferenceDatabase)来自于文献而且有实验证据相关信息post-translationalmodifications,subcellularlocalizationproteindomainarchitecture,tissueexpressionAssociationwithhumandiseases除了蛋白质之间的相互作用蛋白质与核酸的相互作用蛋白质与小分子的相互作用数据格式PSI-MIProteomicsStandardsInitiativeMolecularInteractions/数据检索(HPRD)DIP人工从文献中获取的两两相互作用和复杂相互作用/ExperimentalmethodsTaggedFusionProteinsCoimmunoprecipitationYeastTwo-hybridBiacoreAtomicForceMicroscopy(AFM)FluorescenceResonaceEnergyTrasfer(FRET)X-rayDiffractionLarge-scaletandemaffinitypurificationcoupledtomassspectrometry(TAP–MS)fragmentcomplementationassay酵母双杂交系统利用酵母作为真核蛋白相互作用的模型通过报告基因的转录鉴定蛋白的相互作用酵母双杂交原理双杂交系统的建立得力于对真核生物调控转录起始过程的认识。转录激活因子在结构上是组件式的(modular),即这些因子往往由两个或两个以上相互独立的结构域构成,其中有DNA结合结构域(DNAbindingdomain,简称为DB)和转录激活结构域(activationdomain,简称为AD),它们是转录激活因子发挥功能所必需的。前者可识别DNA上的特异序列,并使转录激活结构域定位于所调节的基因的上游,转录激活结构域可同转录复合体的其他成分作用,启动它所调节的基因的转录。二个结构域不但可在其连接区适当部位打开,仍具有各自的功能,而且不同两结构域可重建发挥转录激活作用。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白-蛋白的相互作用。单独的DB虽然能和启动子结合,但是不能激活转录。His,β-galDNA-BindingDomainBaitProteinPreyProteinTranscriptionActivatingRegionReporterGeneDNA-BindingSite酵母双杂交模型模型系统生物学的基础

——信息生物的信息以这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体→群体

每个层次信息都对理解生命系统的运行提供有用的视角。系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。寻找实验条件相关的蛋白质互作子网络蛋白质间的互作有着其内在的动态性,互作的发生依赖于特定的实验条件。但是,由于目前互作鉴别技术内在的局限性,互作信息还不能提供互作发生对应的时空信息。换句话说,现有的互作信息是静态的信息,一组基因间的互作是多个实验条件下互作关系的一种累积。那么,依据互作信息构建的互作网络也是一个静态的网络,它反映的是基因组内所有基因互作关系的叠加。因此,我们的目的是借助于基因表达谱提供的基因表达信息反映基因的活性然后对原始的互作网络进行筛选,从而得到实验条件下的应答子网实验条件下应答子网的鉴别将有助于研究生物体对环境改变的适应机制,更有效地构建分子通路,预测基因功能以及药物靶点的设计。现有的寻找实验条件下特定网络的研究大多是基于节点打分方式和搜索方式,网络中的边则是节点涉及到的所有互作。

实验数据互作数据提取MIPS中的Physicalinteraction数据,经过如下操作:(1)去除自己和自己的互作;(2)不同实验证实的同一互作只保留一个.以基因为节点,以互作关系为边构建互作网络,节点数目为4096,边数为6928。表达谱数据使用的是酵母diauxicshift实验数据。diauxicshift过程指的是:起初培养基内有着较丰富的葡萄糖,随着酵母的不断消耗(不进行补充),葡萄糖浓度由高变低,酵母的代谢过程由葡萄糖的无氧发酵转换为酒精的有氧呼吸的过程。表达谱数据经ArrayTool处理(删掉有缺失值的基因,因为只有7个时间点,即使有一个时间点的数据缺失,缺失率就会达到10%以上;标化采用的是减中值的方法),处理后一共有5349个基因。将表达谱数据与互作网络数据进行交叉结合(即将互作网络中没有检测的基因去除)得到网络G0,节点数为3282,边数为5151。网络G0是寻找应答子网待搜索的网络。对子网的应答性打分一方面要衡量网络中基因的变异程度一方面要衡量直接连通基因间的表达协同性。网络中基因的变异程度越高,基因间表达协同性越大,则子网的应答性越强,我们的打分系统应该相应地给出较高的得分边的得分取决于两端的基因,基因的变异越大,基因间表达的一致性越强,则边的得分越高。我们使用了一个非常简单而且直接的测度——协方差来定量这种关系。在子网内相连接两个基因X,Y间的协方差为:基因X,Y的相关系数,反映了基因间表达的协同性;基因X,Y的标准差,反映了基因的变异程度。它是一种基于边的打分方式,分值的大小与三方面有关:网络内基因的变异程度;连通基因间表达的协同性;网络的大小。另外打分过程较充分地考虑了网络的拓扑结构:1、用连通基因间的表达协同性反映网络的协同性;2、能够体现Hub节点的重要性:Hub节点指的是网络中度较高的节点,无论是在网络的拓扑结构上还是在生物过程上Hub节点都扮演着重要的角色。在我们的打分方案中,度越高的节点涉及的边越多,对网络的应答性得分影响越大子网的搜索策略从互作网络中寻找RNs,由于子网可能的形式有无穷多个,这是一个NP问题,不能通过穷举所有可能来寻找得分最高的子网。同M2方法一样采用模拟退火的搜索策略,该算法的优势是在搜索的过程中能够跳出局部最小点,并且数学上证明了只要迭代的次数足够多,模拟退火算法能够搜索得到最优解。与M2方法不同之处是:我们进行搜索的对象是边,而不是节点,通过搜索得到的边集构建应答子网。搜索过程每次迭代试探的对象是边,试探将边加到应答子网或者将边从应答子网拿出是否能够提高分值,如果能提高则接受这次试探,如果分值降低则以一定的概率接受,随着退火温度的降低,接受的概率越来越小,最终通过边集构建得到应答网络。应答子网中一些重要hub节点的功能相关性

Hub节点指的网络中度(与该节点连接的边数)较高的节点,无论是对于细胞生物学过程还是网络的拓扑结构,hub节点都扮演着重要的作用。Hanetal.在以前的研究中提出了两种hub节点,一种是‘partyhub’,这种hub在特定的实验下同时与周围的partner发生互作;另一类是‘datehub’,这类hub在一定的实验条件只与一部分相应的partner发生互作。以上结果支持了酵母体内蛋白质的模块化结构,即partyhub位于模块的内部,而datehub是位于模块之间,因此partyhub的功能一致性要高于datehub的功能一致性。在下面的分析中,我们会关注网络中的hub节点——top3的hub,研究网络中hub节点区域的实验相关性。结果表明,不但发现了它们的生物学合理性,而且发现它们对应着Han提出的那两类hub。度最高的hub节点是SRP1,它的度是33。它的邻居中有显著多的邻居(27个)都能够注释到BP节点:“metabolism”(GO:0008152),相对于该节点在原始网络中118个节点73个节点有这个功能对应的概率是。这表明这个节点与它的邻居参与代谢有关的生物学过程,这与在diauxicshift实验条件下,生物体内部主要发生的生物学改变是体内代谢过程的转变是吻合的(从无氧发酵到有氧呼吸)。另外,这个节点的邻居涉及到多种多样的代谢过程而且这些代谢过程在以前的研究中证明是与实验过程相关的,例如:“carbohydratemetabolism”(GO:0005975),有6个邻居注释到这个节点,以前的研究已经证明在diauxicshift过程中,代谢物将重导向(re-channeling)到碳水化合物的存储。概括起来,SRP1基因有着较高度的变化(由118到33),在diauxicshift实验条件下只与一部分的邻居节点互作,这些邻居节点涉及多种多样的代谢过程。因此它可能与Hanetal.提出的‘datehub’相对应。度第二大的节点ATP14同样有着较大的度的变化(105到30),只与一部分的邻居节点存在互作,类似于SRP1那样,位于多个有关的代谢的生物学过程之间。度大小排在第三位的节点是NOP7,它与前两个节点存在着显著的不同,它的度变化很小,由23到21,并且这21个节点全部注释到比较深层的节点“ribosomebiogenesisandassembly”(GO:0042254),这个节点的实验相关性以前的工作已经证明过。这个节点与几乎全部的邻居节点发生互作以及节点周围邻居节点高度的功能一致性表明这个节点可能对应着Han提出的‘partyhub’。图1应答子网的图示。A、原始的互作网络,3282个节点,5151条边。B、通过我们的方法搜索得到的分值最高的前5个实验应答子网G1,整体来看,一共有393个节点,410条边;C、将G1子网内的节点投射到原始互作网络中。节点数不变仍为393,此时应答基因间的边是应答子网内的节点在互作网络中涉及到的所有的互作,为543条。D、通过Ideker的方法搜索得到的分值最高的前5个实验应答子网G2,一共有361个节点,398条边。Han,J.D.etal.Nature430,88–93(2004)Evidencefordynamicallyorganizedmodularityintheyeastprotein–proteininteractionnetworkDateandpartyhubTissuespecificityandthehumanproteininteractionnetworkinteractome

Nearlyallprocessesinbiologyaredependentontheprecisephysicalinteractionsamongmanyindividualproteins.Defininganear-completemapofthephysicalinteractionsthatcanoccurbetweenhumanproteins—thehumanprotein‘interactome’—isanimportantambitionofcurrentresearch.Similartothesequenceofthehumangenome,thehumaninteractomeservesasaresourceforresearchersandcanbeusedtounderstandhowproteinsareorganizedtoperformfunctionswithinacellproblemAglobalinteractomenetworkprovidesanoverviewofallofthephysicalinteractionsthatcanoccurbetweenhumanproteins.However,verylittleisknownaboutwhenandwhereeachoftheseinteractionscanoccur.Withinanyparticularcellortissueofthehumanbodynotallproteininteractionscanoccur.Mostsimply,iftwogenesarenotexpressedinacell,thenaninteractionbetweentheirproteinproductscannotoccur.approachInunicellularorganisms,oneapproachthathasbeenusedtoinvestigatethedynamicsofinteractionnetworksbetweencellularstateshasbeentointegrateinteractomedatawithexpressiondata.Thisapproachhasbeenusedtoidentifyco-regulatedinteractionmodulesortoinvestigatetherelationshipsbetweeninteractionnetworktopologyandgeneco-expression.purposeInthepresentstudy,weapplyasimilarapproachtothehumanproteininteractionnetwork,usingglobalgeneexpres-siondatatoidentifythehumancellsandtissuesinwhicheachinteractioncanorcannotoccur.resultByperformingthisanalysis,1)weareabletoinvestigatetherelationshipbetweenthetissuespecificityofaproteinanditsnumberofinteractionpartners.2)Moreover,andstrikingly,wefindextensivecommunicationbetweenuniversallyexpressedproteinsandthosewithtissue-specificexpression.Eventhemosttissue-specificproteinsnormallyinteractdirectlywithcomponentsofthecorecellularmachinery.3)Conversely,nearlyalluniversallyexpressed‘housekeeping’proteinshaveproteininteractionsthatcanonlyoccurinarestrictedsubsetofcells.4)Ourresultssuggestamodelfortheevolutionoftissue-specificfunctionsthroughthemodificationandre-useofcorecellularprocesses,andthatmost‘housekeeping’proteinsshouldprobablybeconsideredasimportantfortissue-specificprocesses.DeterminingthetissuespecificityofhumanproteininteractionsWethenusedgeneexpressiondata(Suetal,2004)todeterminethecellsandtissuesofthehumanbodyinwhicheachoftheseinteractionscanoccur(Figure1A).

Iftwogenesareco-expressedinacell,thenundersomeconditiontheirproductscanphysicallyinteractinthatcell.However,iftwoproteinsarenotexpressedinatissue,thentheinteractioncannotoccurinthistissue.

TissuespecificandrecentlyevolvedproteinsmakefewproteininteractionsWefindthatmoretissue-specificproteinsmakefewerinteractionsthanwidelyexpressedproteins(Figure1B).Wefindthatmore-recentlyevolvedproteinshavefewerinteractionsthanancientproteins,butthattherelation-shipbetweentissuespecificityandinteractiondegreeisseenforbothsetsofproteins(Figure1C).Thatis,theolderaproteinis,andthemoretissuesinwhichitisexpressed,themoreproteininteractionsitislikelytohave.Themosttissue-specificproteinsnormallyinteractwithcorecellularcomponents

Wenextanalyzedtheextenttowhichtissue-specificproteinsinteractwiththemostwidelyexpressedproteins.Wefindthatevenwhenonlyconsideringthemosttissue-restrictedproteins(proteinsexpressedinp10/79tissues),mostofthemareknowntointeractdirectlywithuniversallyexpressedhumanproteins(Figure2A).Thus,mosttissue-specificproteinscanfunctionbydirectlycontactingcomponentsofthecorecellularmachineryMostuniversallyexpressedproteinshavetissue-specificproteininteractions

Constitutivelyexpressedproteinsareoftenconsideredasimportantfor‘housekeeping’biologicalprocessesthatarerequiredinallcells.However,nearlyallofthemostwidelyexpressedproteinshaveinteractionswithotherproteinsthatarenotthemselvesuniversallyexpressed(Figure2B).Thatis,mostuniversallyexpressedproteinshavephysicalinteractionsthatcanonlyoccurinarestrictedsubsetofcellsandtissues.Thusmost,andpossiblyall,universallyexpressedproteinshavetissue-specificmolecularinteractions.Proteinsthatthemselveshaverestrictedexpressionpatternsalsohavemanyinteractionsthat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论