分子生物网络分析-第4章-基因调控网络及其模型_第1页
分子生物网络分析-第4章-基因调控网络及其模型_第2页
分子生物网络分析-第4章-基因调控网络及其模型_第3页
分子生物网络分析-第4章-基因调控网络及其模型_第4页
分子生物网络分析-第4章-基因调控网络及其模型_第5页
已阅读5页,还剩227页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章基因调控网络及其模型教师:崔颖办公室:外语学馆412室基因调控网络及其模型4.1概述4.2基因调控网络模型4.2.1布尔网络模型4.2.3有向图模型4.2.4线性组合模型4.2.5加权矩阵模型4.2.6互信息关联模型4.2.7常微分方程模型4.3基因调控机制4.4基序和模块4.5基因调控网络数据库4.1概述基因调控网络是21世纪生物学研究的一个重要课题。统计1950-2008年有关基因调控网络的论文数量,近年来明显的增长趋势。4.1概述4.1概述基因调控网络研究:每个网络节点的功能基因网络结构复杂性层次上的动力学机制和行为在细胞和组织层次从基因到信号路径等各种问题4.1概述传统遗传学假说:基因处于稳定及无相互作用的分离状态。基因对应于某一种蛋白质完成某一种特定遗传功能近年来,科学家发现上述假说是错误的,重视研究遗传网络。4.1概述大型遗传网络的全局模型:知道一个生物体的所有细节准确建立目前不可能完全做到这一点。研究遗传网络的一般性质从分子水平认识细胞组织的功能4.1概述遗传网络的底层局部模型高层次综合模型网络的全局功能简化的模型1.基因调控网络基因调控网络GRN,generegulatorynetwork遗传调控网络、遗传网络geneticregulatory\geneticnetworkGRN组成:一个细胞中相互联系的若干DNA片段组成,间接地与RNA和蛋白质表达产生相互作用还有与其物质相互作用调控基因转录或mRNA速率一般来说,每个mRNA分子可生成一个或一类特异的蛋白质。1.基因调控网络GRN是研究者在长期科研实践中,综合分析某一生物学系统的各种文献后,推断出来并构建的一种生物网络。相关生化反应知识的集中、抽象和升华。1.基因调控网络某些情况下,蛋白质可以:积聚在细胞外壁或细胞内组成特定的结构具有功能其他情况下,蛋白质可以:生成酶并催化各种生物化学反应某些蛋白质具有激活其他基因的功能1.基因调控网络作为转录因子成为GRN的主要组成部分结合到被激活的基因的启动子区域目的基因便开始转录形成蛋白质产物其他一些转录因子则被抑制1.基因调控网络单细胞生物体的GRN可以应对外部环境变化,使其在特定时间内适应所处环境得以生存。例如:酵母细胞发现自己处在糖溶液时,激活一些基因来产生酶,以便将糖分解为乙醇。此过程与酿酒相似,可使酵母细胞得以存活并获得繁殖后代所需要的能量,提高其生存能力。1.基因调控网络意大利RobertoSerra教授将GRN网络简称为遗传网络。他认为GRN包括:不只包括基因蛋白质、化学反应产物等给出简单示意图1.基因调控网络2.基因表达及其多层次调控基因表达的研究大致分为两类:对GRN结构和动力学机制分析识别对生物体基因整体表达水平的实验数据进行归纳整理。前者涉及网络动力学理论的应用后者采用各种统计和聚类方法2.基因表达及其多层次调控对GRN的基因表达研究涉及在蛋白质合成过程中实施调控的复杂过程,主要包括如下内容:DNA→RNA→mRNA→protein→modifiedprotein2.基因表达及其多层次调控2.基因表达及其多层次调控基因的表达是可控制及多层次的,主要有4个调控层次。通常是用上一层次的基因产物来调控下一层次基因的表达。3.基因调控网络的控制节点从生物网络的观点来看,GRN包括下列6种控制节点:3.基因调控网络的控制节点4.基因调控网络的基因结构和功能在生物体的每一个细胞中,GRN是DNA、RNA,mRNA和蛋白质之间的相互作用网络,各细胞的GRN基本上都是相同的。4.基因调控网络的基因结构和功能图5.5是一个最小的GRN的基因结构框图,它是整个生物体的遗传网络的一个基因组成单元。4.基因调控网络的基因结构和功能简单地说,GRN可以被看作是一个细胞输入输出设备。一个GRN至少包括下列组成部分:1.输入信号的接收系统(矩形表示)及细胞内部和外部信号的传导系统,不止一个信号输入,而且影响到某一个靶基因。4.基因调控网络的基因结构和功能2.一个GRN的核心部分(用圆形表示),包括功能类似的一些基因组成部分,由调控蛋白质与同类物顺式作用的DNA序列合成的复杂物质结构。3.GRN中的一些靶基因产生的初始输出,包括变化了的RNA和蛋白质。4.基因调控网络的基因结构和功能4.GRN的最终输出,主要是网络对细胞结构和行为的改变,这种改变是不断变化的。最终输出还可产生直接(实线)和间接(虚线)的信号响应和反馈,可对GRN起到很重要的作用。4.基因调控网络的基因结构和功能GRN的节点是:基因、蛋白质、其相应的mRNA、蛋白质与蛋白质的复合物。GRN的节点随时间的变化过程可以用一个函数来描述,并可利用对输入的各种运算的组合来建立这种函数。例如,布尔网络中的布尔函数就是采用了“或or”、“异或nor”、“异与nand”等逻辑运算。4.基因调控网络的基因结构和功能这些函数可以描述细胞内的信息处理过程,决定细胞的行为。各种GRN在结构上可能有所不同,但其有一般的结构示意图。4.基因调控网络的基因结构和功能在此图中,两个不同的信号A和B,分别输入同一靶基因的两个受体蛋白质,该基因的顺式调控元件产生一个综合输出来响应这两个输入。信号A使原来被抑制的转录因子A激活,并使其依附于靶基因的顺式调控序列。4.基因调控网络的基因结构和功能信号B的进程更为复杂:信号B使原来被抑制的转录因子B激活,并使其与抑制因子分离。转录因子B获得自由并与被激活的抑制因子形成了一个激活的异二聚体,并进一步与激活的转录因子A形成一个激活的新异二聚体,然后进入到顺式调控序列中。4.基因调控网络的基因结构和功能下图是上述在GRN中将异聚体插入靶基因的顺式调控序列的示意图。4.基因调控网络的基因结构和功能网络输出的是在由激活转录因子A和B所决定的层次上的靶基因表达。由此,顺式调控的DNA序列及在其上结合的蛋白质在共同集成了多个输入信号之后,产生新的输出----调控信息读出。4.基因调控网络的基因结构和功能5.基因调控网络模型的种类通过基因调控数据可以构建基因转录调控网络。基因转录调控网络是以转录因子和受调控基因作为节点,以调控关系作为边的有向网络。有的时候,根据转录因子是促进还是抑制受控基因的表达,调控网络中的边可以分为正调控和负调控。5.基因调控网络模型的种类目前常见的GRN模型包括:随机模型有向图、常微分方程布尔网络、连接模型人工神经网络、贝叶斯网络基于规则的模型基于信息理论的模型4.2布尔网络模型系统生物学(systemsbiology):是研究一个生物系统中所有组成成分(基因、mRNA和蛋白质等)的构成,以及在特定条件下这些组成成分间的相互关系的学科,而生物网络由于生物系统很好描述,正逐渐成为系统生物学研究中的主要研究对象。4.2布尔网络模型网络是图论中图的通俗说法,由节点和连接节点之间的边构成。在生物分子网络中,生物分子作为节点,而生物分子之间的物理遗传及调控等多种相互作用为边,因此它可以从系统层面上描述复杂的生命现象,以及系统中的相互作用、调控和动态行为等特性。4.2布尔网络模型目前,生物网络的研究主要分为两类:正向工程和逆向工程。在正向工程中,主要是利用已有的生物知识设计生物网络(也就是合成生物学),或者是构建量化模型来解释生物系统工作的机制。目前,正向工程已经取得了非常瞩目的成果。4.2布尔网络模型与正向工程不同,生物网络的逆向工程研究主要是利用高通量的生物数据来构建生物网络。生物网络的构建是生物分子网络研究的基础和重点内容,过去几年主要是利用高通量数据重建生物分子网络。4.2布尔网络模型这些数据描述了成百上千的相互作用,但是这些数据一般都具有高噪声和假阳性的特点。因此,如何利用这些高通量的生物数据来构建精确的生物分子网络正成为系统生物学中的研究热点。4.2布尔网络模型DNA微阵列的广泛应用提供了海量的基因表达谱数据,即细胞内mRNA的相对或绝对数量,反映了基因转录的调控机制,而基因转录在基因表达环节中起着非常重要的作用。4.2布尔网络模型基因在转录过程中,转录因子(蛋白质)与DNA的结合以激活基因的转录,而基因的表达产物有可能是转录因子,它又能激活或抑制其它基因的转录,如此继续下去,就形成一个基因调控路径(generegulatorypathway)。4.2布尔网络模型一条路径中的基因在表达水平上存在某种相关性,例如受同一个转录因子调控的基因往往是共表达的,这些生物学原理可以用于指导基因调控路径的构建。4.2布尔网络模型从表达谱数据出发,可以建立基因相互作用的网络模型,这种方法也称反向工程(reverseengineering),如下图所示。最常用的基因调控网络模型是Boolean网络、连续模型、线性组合模型、加权矩阵模型、互信息关联模型等。

4.2布尔网络模型4.2布尔网络模型布尔网络模型:是刻画基因调控网络一种最简单的模型。在布尔网络中,每个基因所处的状态或者是“开”,或者是“关”。状态“开”表示一个基因转录表达,形成基因产物;状态“关”则代表一个基因未转录。4.2布尔网络模型基因之间的相互作用关系由布尔表达式来表示,即基因之间的作用关系由逻辑算子and、or和not刻画。例如:4.2布尔网络模型读作“如果A基因表达,并且B基因不表达,则C基因表达”。以有向图G=(V,F)表示布尔网络。其中V是图的节点集合,每个节点代表一个基因,或者代表一个环境刺激。4.2布尔网络模型环境刺激可以是任何相关的生物、物理或化学因素,但不是基因或基因的产物,它影响调控网络。而F是有向边的集合,每条边代表基因之间的相互作用关系。4.2布尔网络模型上例所对应的网络见图。布尔网络模型当一个节点代表基因时,该节点与一个稳定的表达水平相联系,表示对应基因产物的数量。4.2布尔网络模型4.2布尔网络模型如果一个节点代表环境因素,则节点的值对应于环境刺激量。各节点的值或者是"1",或者是"0",分别表示“高水平”和“低水平”。网络中各个基因状态的集合成为整个系统的状态,当系统从一个状态转换到另一个状态时,每个基因根据其连接输入(相当于调控基因的状态)及其布尔规则确定其下一时刻的状态是否是“开”或“关”。4.2布尔网络模型4.2布尔网络模型布尔规则以“真值表”的形式表示。

下列列出当节点A、B处于不同状态时,C的状态应当如何。4.2布尔网络模型节点C的真值表4.2布尔网络模型转录调控网络最简单的模型就是布尔网络模型,布尔网络模型最早由Kauffman由1969年引入的。网络中各个基因状态的集合成为整个系统的状态,当系统从一个状态转换到另一个状态时,每个基因根据其输入(调控基因的状态)及其布尔规则确定其一下时刻的状态是“开”还是“关。”4.2布尔网络模型布尔网络从初始状态开始,经过一系列状态转换,最后到达系统的稳定状态。从不同的初始状态出发,布尔网络会到达不同的终止稳定状态,而这些不同的终止状态对应于细胞相对稳定的生化状态。4.2布尔网络模型4.2布尔网络模型如果在布尔网络的一个稳定状态下,所有基因的状态不变,则称该稳态是“点吸引子”;如果网络的一个稳态是多个状态的周期切换,则称该稳态为“动态吸引子”,此时网络系统处于相对稳定状态。具体来说,稳定状态分两种情况,一是单稳态,即系统状态不再改变。另一种稳定状态是所谓多稳态,即系统状态没有绝对稳定,只是相对稳定,系统在若干个状态之间循环往复。4.2布尔网络模型4.2布尔网络模型布尔网络模型状态转换图:单稳态和多稳态如图(a)所示,系统从状态(1,0,0)出发,经过一系列中间状态,到达单稳定状态以后,系统一直驻留在状态(0,0,0)。如图(b)所示,系统达到相对稳定,在状态(0,0,1)和状态(1,1,0)之间切换。4.2布尔网络模型比如三个基因x1,x2和x3有如下的逻辑关系:读作“如果x1基因表达,并且x2基因不表达,则x3基因表达。”这种由逻辑算子连接的布尔变量可以布尔函数f表示为一般形式,例如一个三变元的布尔函数为:4.2布尔网络模型4.2布尔网络模型如果抽象为数学问题,则可以用有向图来表示,图的顶点表示蛋白质或核酸,边表示相互作用。对于每个顶点,有状态的切换或者是物质浓度的变化,这种变化反映了网络的动力学特性。4.2布尔网络模型对于稳定系统,每个项点的状态最终可以达到相对平衡。作为网络的整体特性可能是单稳态,或者是具有多个吸引子的多稳态。这样一个布尔网络就可用一个有向图G=(X,E)来描述,其中节点xi∈X是布尔变量,每个节点代表一个基因,E是有向边的集合,每条边代表基因之间的相互作用关系。因此G中的每一个变量xi对应于一个布尔函数fi,在一个给定的时间,所有节点的值表示网络中基因的状态。4.2布尔网络模型4.2布尔网络模型对于基因调控网络,节点变量相应于基因表达的水平,如果得到表达则值为“1”,否则为“0”。当一个节点代表基因时,该节点与一个稳定的表达水平相联系,表示对就基因产物的数量,每一个节点的值依赖前一个时间网络中的某些节点的值,并且所有节点的状态同时得到更新。即有:网络中种各个基因状态的集合成为整个系统的状态,当系统从一个状态转换到另一个状态时,每个基因根据其连接输入(相当于调控基因的状态)及其布尔规则确定其下一时刻的状态是否是开或关,布尔规则以真值表的形式表示。下图给出了一个三变元布尔网络,其中包括有向图、布尔规则和真值表。4.2布尔网络模型X1X1X1X2X1X3(a)x1x2x3x1x2x3000001010011100101110111000010100111010011110111(c)一个三变元布尔网络:(a)有向图;(b)网络更新的逻辑规则;(c)一个状态转移表(真值表)说明了在t时刻基因的表达如何影响t+1时刻基因的表达状态。(b)000(a)100010001(b)101011110111(c)a、c为两个稳定的点吸引子,b为一个两点环布尔网络从初始状态开始,经过一系列状态转换,最后到达系统的稳定状态。从不同的初始状态出发,布尔网络会到达不同的终止稳定状态,而这些不同的终止状态对应于基因表达的相对稳定状态.4.2布尔网络模型4.2布尔网络模型如果在布尔网络的一个稳定状态下,所有基因的状态不变,则称该稳态是点吸引子;如果网络的一个稳态是多个状态的周期切换,则称该稳态为动态吸引子,此时网络系统处于相对稳定状态。4.2布尔网络模型具体来说,稳定状态分两种情况:一是单稳态,即系统状态不再改变,如图所示,系统从状态(000)和(111)出发,系统的状态不发生变化而始终驻在该状态本身。如果从(101)或(110)出发,经过一系列中间状态,到达单稳定状态以后,系统一直驻留在状态(111)。4.2布尔网络模型另一种稳定状态是所谓多稳态或周期点环,即系统状态没有绝对稳定,只是相对稳定,系统在若干个状态之间循环往复,如图所示,系统达到相对稳定,在状态(010)和(100)之间切换而形成一个稳定的两点环。借助于计算机工具或者其他智能训练的方法可以构建一个具体的布尔网络。即根据基因表达的实验数据建立待研究的基因之间的相互作用关系,确定每个基因的连接输入(或调控输入)。4.2布尔网络模型4.2布尔网络模型并且为每个基因生成布尔表达式,或者形成网络系统的状态转换表,对于复杂的网络,在网络构造过程中,其搜索空间非常大,需要利用先验知识或合理的假设,以减小搜索空间,有效地构造布尔网络。4.2布尔网络模型关于布尔网络中状态更新的一个基本假设就是所有状态同时被更新,近来研究者希望放松这一假设而研究在不同时间更新不同的系统状态,这方面的工作有:Harvey和Bossamaier,diPaolo,Rohlfshagen和diPaolo。4.2布尔网络模型布尔网络的优点是简单,便于计算;但是由于它是一种离散的数学模型,不能很好地反映细胞中基因表达的实际情况;如布尔网络不能反映各个基因表达的数值差异,不考虑各种基因作用大小的区别等。4.2布尔网络模型而在实际中,各个基因的表达数值是连续的,并且以具体的数值表示一个基因对其他基因的影响。布尔网络在基因调控网络中的主要应用体现在如下几个方面:1.对特殊的基因调控系统建立模型,比如果蝇胚胎形成和内皮组织周期;2.研究调控网络的进化动力学;4.2布尔网络模型布尔网络在基因调控网络中的主要应用体现在如下几个方面:3.根据基因表达数据推断基因调控网络;4.组织和器官等形态建成的网络模型。4.2布尔网络模型练习1.根据下列布尔网络的有向图,写出布尔逻辑表达式及状态转移表(真值表)。X1X1X1X2X1X3(a)4.2布尔网络模型加拿大卡尔加里大学生物复杂性和信息学研究所的StuartAlanA.Kauffman教授是第一个使用布尔网络模型模拟GRN的生物学家。1969年,他提出了一种描述GRN及其元素相互作用的布尔网络模型。4.2布尔网络模型该模型用布尔变量来描述基因的活性(on,1)或抑制(off,0)状态及其产物的存在或缺失,还可以用布尔函数计算一个基因在其他基因激活后的新状态及描述GRN各元素之间的相互作用。1993年,Kauffman出版了全面介绍布尔网络模型应用的著名论著《秩序之源:进化中的自组织与选择》。4.2布尔网络模型4.2布尔网络模型布尔网络模型具有以下4个特点:1.每一个基因、输入及输出均是一个有向网络边线图,采用从一个节点到另一个节点的一个箭头表示两个节点之间具有因果关系。2.每个节点可以在“开”或“关”的两种状态之一。4.2布尔网络模型3.对于一个基因,“开”对应于基因表达;对于输入和输出,“开”对应于化学反应物质的产生。4.时间被看作是一系列离散的时间步。在每一个时间步,一个节点的新状态是其前一状态的布尔函数,用箭头从节点前一状态指向新状态来表示。4.3有向图模型利用有向图可建立直观的GRN模型。图5.9显示了3个基因abc组成的调控网络,还有上述基因编码组成的4个抑制子(repressor)分别为ABC和D。B和C处于基因a的不同调控位置,A和D相互作用后构成一个异聚体并处于基因b的一个调控位置。这可阻止RNA聚合酶在基因转录中向下游移动。箭头指的方向为基因转录方向。抑制子蛋白质在实施调控中可抑制基因的转录。4.3有向图模型有向图可以定义为二元组<V,E>,其中V是节点的集合,E是边的集合。有向图的边可以表示多个基因之间的相互作用。为此GRN的有向边可定义为三元组<i,j,s>,其中s表示节点i是否被节点j激活(s为+)或抑制(s为-)。4.3有向图模型图中(a)显示了用有向图表示的GRN。(b)为节点集合V及有向边的三元组<i,j,s>4.3有向图模型还可以用有向超图(Hypergraph)来描述基因表达的蛋白质合作调控过程。在此种图中的边可定义为三元组<i,J,S>,其中J为节点i的一组调控基因的列表,S为该组基因调控i效果的列表。4.3有向图模型下图C显示了用有向超图表示的GRN。在此图中,节点2分别受到节点1和3的抑制作用。(d)为节点集合V及有向边的三元组<i,J,S>.4.4线性组合模型线性组合模型是一种连续网络模型,在这种模型中,一个基因的表达值是若干个其它基因表达值的加权和。基本表示形式为:4.4线性组合模型其中,Xi(t+Δt)是基因i

在t+Δ

t时刻的表达水平,Xj(t)是基因j

在t时刻的表达水平,而wij

代表基因j的表达水平对基因i

的影响,+正值表示激活,-负值表示抑制,0表示无影响。4.4线性组合模型在这种基因相互关系表示形式中,还可以增加其它数据项,以逼近基因调控的实际情况。例如,可以增加一个常数项,反映一个基因在没有其它调控输入下的活化水平。将上述表达式转换为线性差分方程,可描述一个基因表达水平的连续变化趋势。当调控网络参数给定时,公式描写的是基因网络的动力学:当基因表达时间序列Xi(t)给定,要估计调控网络参数,已有用“奇异值分解”方法求解过此逆向工程问题。4.4线性组合模型然而,目前的测量均限于基因数远大于时间点数,故他们的解集不是惟一的,因而难有生物学意义。一种解决办法是利用插值将方程组转化成满秩的,但这不可避免地会引入人为误差;另一种办法是先将众多基因进行全局聚类,寻求类与类之间的调控网络,而类内的基因相互作用用其它知识或信息来辨认。4.4线性组合模型目前,常把具有相似表达谱的共表达基因归属一类,同类中的平均基因表达谱定义为代表此类的原型基因(prototype)的表达谱.原型基因的调控网络形式上仍为式(1),但参与网络的不是基因数,而是原型基因数(即聚类总数).4.4线性组合模型4.4线性组合模型反向工程问题就是要寻求网络参数,使得用线性网络模型拟合原型基因表达时间序列的残差平方和达到最小,即当上述时间采样点是满值或无缺值,则式(2)有解析解。当时间采样点中有缺值,则测量点不等间距,例如相隔两个△t,需要将式(2)相关项改写.此时涉及的非线性组合方程没有解析解,但可用最优化方法,例如模拟退火、遗传算法,求得数值解。4.4线性组合模型4.4线性组合模型实验结果表明,该模型能比较好地拟合基因表达实验数据.Zhang等进一步发展了这种模型,用线性模型构建原型基因间的调控网络,再用多元回归模型构建基因间调控网络,得到了更有意义的结果.4.5加权矩阵模型

加权矩阵模型与线性组合模型相似,加权矩阵模型可以看作是线性组合模型的推广,在该模型中,一个基因的表达水平是其它基因表达水平的函数。Weaver等用一个加权矩阵表示基因彼此之间的相互调控影响。4.5加权矩阵模型含有n个基因的转录调控网络的基因表达状态,用n维空间中的向量u(t)表示,u(t)的每一个元素代表一个基因在状态t或时刻

t的表达水平。以一个加权矩阵W

表示基因之间的相互调控作用.

4.5加权矩阵模型W的每一行代表一个基因的所有调控输入,wij

代表基因j的表达水平对基因i的影响。在时刻t,基因j对基因i的调控效应为j的表达水平,即uj(t)

乘以j对i的调控影响程度Wij

。基因i的总调控输入ri(t)

为:

这一形式与线性组合模型相似,若Wij为正值,则基因j激发基因i的表达,而负值表示基因j抑制基因i的表达,0表示基因j对基因i没有作用。与线性组合模型不同的是,基因i最终表达响应还需要经过一次非线性映射:4.5加权矩阵模型4.5加权矩阵模型这种函数是神经网络中常用的Sigmoid函数,其中α和β是两个基因特异性常数,定义了映射函数的位置和度.对于这种模型,可以利用成熟的线性代数和神经网络方法进行分析。4.5加权矩阵模型实验表明,该模型具有稳定的周期和稳定的基因表达水平,与真实的生物系统相一致。在这种模型中还可以加入新的变量,模拟环境条件变化对基因表达水平的影响.4.6互信息关联模型

(MutualInformation)互信息关联模型:用熵和互信息描述基因和基因的关联;一个基因表达模式A的熵是所含信息量的度量,其计算公式为:其中P(xi)为基因表达值出现在区间xi的频率,n为表达水平的区间数目。熵越大,则基因表达水平越趋近于随机分布。两个基因表达模式的互信息公式为互信息是一种两变量之间关系的量度。若MI(A,B)=0,则表示两个基因表达不相关,反之MI(A,B)越大,则两个基因越是非随机相关,它们之间的生物关系越密切。4.6互信息关联模型

(MutualInformation)4.6互信息关联模型

(MutualInformation)互信息关联网络模型中的连接关系来自基因表达实验数据计算出的互信息与预先设定的阈值(threshold)的比较。高于阈值的基因对之间被认为在生物学意义上存在关联。Butte等是较早用信息理论研究基因调控网络的。4.6互信息关联模型

(MutualInformation)计算互信息使用的是基因表达值在某一表达变化区间的概率(频率),而不是实际的表达值.因此,可以避免因个别异常表达值造成的假关联,从而可以作为两个基因相互独立性的一个衡量指标.4.7常微分方程模型常微分方程(ordinarydifferentialequaton,ODE)模型广泛应用于分析GRN的动力学机制。ODE可以模拟RNA、蛋白质等组成部分在调控过程中与时间有关的各种相互作用参数的变化。4.7常微分方程模型例如,用反应速率方程(reacton-rateequation)计算基因产物(蛋白质或mRNA)的生成速率:其中的向量:表示GRN中各节点的蛋白质、mRNA或者代谢产物数量,fi

通常是一个非线性函数。设节点i的合成速率取决于蛋白质的数量xi

。4.7常微分方程模型通过求解上述方程的特定GRN节点i,可得出一个或多个蛋白质及mRNA的浓度,它们在理论上是持续存在的(但不一定是稳定的)。上述方程的稳定状态对应各种细胞类型,其振荡解也可能对应处于自然循环的细胞状态类型。4.7常微分方程模型这些数学稳定性通常可以反映接近衍生物临界点的程度,还可以反映对应的生化反应产物浓度分布的稳定性。在方程中,临界点和分叉对应于细胞的临界状态,在此状态下微小的状态或参数摄动将使系统在几种稳定状态之间突变。变化轨迹对应于生物路径的展开及短期生物事件的瞬变。4.7常微分方程模型20世纪,研究者们利用反应速率方程开发了许多模拟生物化学反应系统的数学工具,特别是代谢过程的模型。使用这些工具可以建立遗传调控过程的动力学模型。4.7常微分方程模型其中,A和C代表蛋白质,F和K为代谢产物。x1,x2和x3分别代表mRNA、蛋白质A和代谢产物K的浓度;k1,k2和k3是反应产物常数,r1,r2和r3是降解常数,r是一个递减的非线性函数,其取值范围是[0,1].图5.11(a)是一个GRN的示例,包括最后产物的降解;(b)是该示例的常微分方程模型。4.7常微分方程模型图5.11参见利用常微分方程模型分析GRN的动力学机制研究的一个先行者:英国open大学教授BrainCareyGoodwin早期的论文。1963年,他建立了第一个遗传调控的动力学和基因操作子的数学模型。模型的评估连续网络模型的评估已有文献予以综述,其评估主要依据下述标准:1.推断强度2.预测强度3.鲁棒性4.一致性5.稳定性6.计算成本1.推断强度:推断强度是用以度量真实的基因调控网络权值矩阵与被推断的矩阵的相似度的标准,表示为其中,ρ()表示pearson产物瞬时相关。2.预测强度3.鲁棒性数据测量中噪声总是存在和需要处理的。由实验获得的基因表达数据尤其存在噪声。鲁棒性是对噪声存在的情况下提取调控网络权值矩阵准确度的度量。鲁棒性测试起来比较困难,可以通过监控噪声的性能给予有效的评价。4.一致性一致性是衡量基因调控网络模型的一个重要指标。造成基因调控网络不一致的原因主要有两个方面:一是维度问题,即网络的基因数远远大于测量的时间点数;二是模型的预测强度超过了数据本身的复杂度。一致性可以考虑通过模型从合理的模拟数据复原复杂功能网络的能力来衡量。5.稳定性由于细胞内的能量储存总是有限的,因此可认为所有的基因调控网络都是稳定的。具体地说,对任意有限地初始状态,预测表达水平对所有时间有界,则由具体调控网络权值矩阵参数化的模型稳定。6.计算成本基因调控网络的复杂性:网络规模大;细胞多组分参与调控网络;调控的动态性;基因调控网络的复杂性远远高于基因表达之间的相关性;聚类分析不能揭示基因之间的因果关系为什么需要数学建模与仿真?数学模型是刻画和研究这些生物过程的重要工具之一,在调控网络建模方面,已发展了很多种数学模型。

基因调控网络模型----小结基因调控网络模型----小结目标--我们想知道:Whichgenesareexpressed?

Whenandwhereintheorganisms?

Towhichextent?Arethereanyuniversallaws?Canwepredicttheevolutionofthenetwork?Howtopredicttheevolutionofthenetwork?基因调控网络模型----小结网络模型的构建:途径--实验、建模、仿真基因调控网络模型----小结基因调控网络模型----小结通过计算工具模拟仿真对理解基因调控过程是必须的;对不同水平的基因调控系统开发适合的方法。方法的选择依赖于分析的目的以及可用的数据信息。4.8

基因调控机制基因调控网络的形成基因在转录过程中,转录因子与DNA结合能激活基因的转录过程,而基因的表达产物有可能是转录因子,它又能激活或抑制其他基因的转录,如此继续下去,就形成了一个基因调控路径。基因调控网络的形成基因调控网络的形成基因表达调控的研究是后基因组时代的核心内容,也是系统生物学的主要研究内容,基因调控网络是研究细胞和分子生物学中各种关系的模型之一。4.8

基因调控机制基因表达的多级调控4.8.1基因的转录调控4.8.2基因的转录后调控4.8.3基因的翻译后修饰4.8.1基因的转录调控1、顺式调控-顺式作用元件:存在于基因旁侧序列中能影响基因表达的序列,它们的作用是参与基因表达的调控,本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。启动子(Promoter)增强子(Enhancer)沉默子(Silencer)4.8.1基因的转录调控启动子(Promoter)启动子:真核基因启动子是RNA聚合酶结合位点周围的一组转录控制组件,至少包括一个转录起始点以及一个以上的功能组件。4.8.1基因的转录调控增强子(Enhancer)增强子:指远离转录起始点、决定基因的时间、空间特异性、增强启动子转录活性的DNA序列。

4.8.1基因的转录调控沉默子:指帮助降低或关闭邻近基因表达活性的一段DNA顺式元件序列。参与基因表达的负调控。沉默子(Silencer)4.8.1基因的转录调控2、反式调控-反式作用元件:参与基因表达调控的因子,它们与特异的靶基因的顺式元件结合起作用。编码反式作用因子的基因与被反式作用因子调控的靶序列(基因)不在同一染色体上4.8.1基因的转录调控2、反式调控-反式作用元件:RNA聚合酶(RNApolymerase)普遍性转录因子(Generaltranscriptionfactor)特异性转录因子(Specifictranscriptionfactor)种类多样的协调因子(Coregulatoryfactor)4.8.1基因的转录调控RNA聚合酶(RNApolymerase)RNA聚合酶:是一种负责从DNA或RNA模板制造RNA的酶。4.8.1基因的转录调控普遍性转录因子(Generaltranscriptionfactor)普遍性转录因子:它们结合在靶基因的启动子上,形成前起始复合物,启动基因的转录。4.8.1基因的转录调控特异性转录因子(Specifictranscriptionfactor)特异性转录因子:一类与靶基因启动子和增强子(或沉默子)特异结合的转录因子,具有细胞及基因特异性,可以增强或抑制靶基因的转录。4.8.1基因的转录调控特异性转录因子(Specifictranscriptionfactor)4.8.1基因的转录调控种类多样的协调因子(Coregulatoryfactor)种类多样的协调因子:改变局部染色质的构像(如组蛋白酰基转移酶和甲基转移酶),对基因转录的起始具有推动作用。4.8.2基因的转录后调控MicroRNAs是一种小的内源性非编码RNA分子,大约由21-25个核苷酸组成。这些小的miRNA通常靶向一个或者多个mRNA,通过翻译水平的抑制或断裂靶标mRNAs而调节基因的表达。4.8.2基因的转录后调控随着基因转录调控网络研究的深入,由miRNA参与的调控网络开始受到研究者的重视,并取得了很大的进展。对miRNA的调控关系主要包括miRNA对转录因子、转录因子对miRNA、miRNA与靶基因之间的调控关系以及它们的组合调控网络。4.8.2基因的转录后调控在转录后调控网络研究中,一般结合转录调控过程构建网络模型来分析转录后调控过程和调控重要通路的miRNA数量的增加,量化分析miRNA在基因表达中的调控作用是一个崭新的重要任务。不论原核生物还是真核生物,翻译完成后,一些肽链能直接折叠成最终的活性形式,不需要加工修饰;4.8.3

基因的翻译后调控4.8.3

基因的翻译后调控然而经常的情况是新生肽链需要加工修饰(称为翻译后加工或修饰)包括:(1)切除部分肽段(蛋白酶)(2)在特定氨基酸残基的侧链上添加一些基团(共价修饰)(3)蛋白质折叠:肽链→二级→三级→更高级4.8.3

基因的翻译后调控(1)切除部分肽段(蛋白酶)4.8.3

基因的翻译后调控(2)在特定氨基酸残基的侧链上添加一些基团(共价修饰)4.8.3

基因的翻译后调控(3)蛋白质折叠:肽链→二级→三级→更高级4.8.3

基因的翻译后调控翻译后加工有两方面目的:(1)功能需要(2)定向转运的需要(这在真核生物中尤为复杂,合成的蛋白要定向运输到细胞质、质膜、各种细胞器如叶绿体、线粒体、溶酶体、过氧化物酶体等)。4.9

基因调控网络的基序和模块最近的研究发现,基因调控网络具有重要的局部性质。其中包括Milo等人首次提出的网络模体概念,网络模体的发现引起了生物信息学领域的广泛关注,已为目前生物信息学研究的热点之一。Shen-Orr等人的研究表明,基因调控网络中的网络模体是细胞系统中最基本的功能模块,这些网络模体互相配合来实现各种生物过程。4.9

基因调控网络的基序和模块一些文献中给出了定义网络模体的条件:在所对应的随机网络中出现次数远远小于在真实网络中出现的次数等,这些条件为网络模体的识别提供了重要依据。4.9

基因调控网络的基序和模块目前研究较多的网络模体主要有单输入模体(singleinputmotifs),多输入模体(multi-inputmotifs),双扇形模体(bi-fanmotif),双并行模体(bi-parallelmotif),前馈环(feedforwardloop)和反馈环(feedbackloop),其网络结构如图所示。4.9

基因调控网络的基序和模块4.9

基因调控网络的基序和模块基因转录调控网络模体反映了生物体行为功能的最小单位网络模体最初是在细菌和酵母中发现的,更多地反映了基因调控网络的局部性质,能够从系统的水平研究转录调控关系。4.9

基因调控网络的基序和模块不同生物体的基因转录调控网络包含相同类型的网络模体,说明这些模体是基因正常表达的机制,也说明这些不同的生物体存在进化关系。4.9

基因调控网络的基序和模块1.模体又称为基序—网络的关系单元一个复杂的基因调控网络是由成千上万基因及其调控因子构成,它们彼此之间相互作用和调控关系构成网络的各种结构;实际上,基因调控网络的复杂性本质上就是这些调控关系的复杂性;

4.9基因调控网络的基序和模块1.基序—网络的关系单元研究发现各种关系种类的出现频率是非随机性的,某些特定的关系种类在网络中反复出现,形成网络的典型连接方式。不同类型的网络具有不同的典型连接方式,研究者把这些特定的关系种类称为“网络基序(networkmotif)”,认为它们是一个网络的基本构造单元。4.9.1基序-网络的关系单元例:大肠杆菌转录调控网络此网络是被生物学实验分析得最为透彻的网络模型之一,对该网络的研究分析发现它涉及424个基因操纵子和577种相互作用,同时发现这个网络中最常出现的基序有三种,每一种基序都在控制基因表达中扮演着特定的角色。例:大肠杆菌转录调控网络第一种基序被称为前馈环(feedforwardloop),即转录因子X作用于第2个转录因子Y,X和Y两个因子共同调控操纵子Z的表达,由此可以看出前馈环具有8种可能的类型,Alon在其专著里列出了前馈环的8种可能的类型。例:大肠杆菌转录调控网络这8种类型可分成两个集合:相干和不相干。间接路径的符号是指所有间接路径上符号的乘积,比如两个负调控作用意味着最终是正调控;对于相干前馈环,间接路径与直接路径具有相同的符号;对于不相干前馈环,间接路径与直接路径具有相反的符号。XYZ(a)XYZ(b)XYZ(c)XYZ(d)XYZ(e)(f)XYZXYZ(g)XYZ(h)前馈环的8种连接关系:箭头表示激活,钝线表示抑制a—d为相干类e—h为不相干类第二种是单输入模式(singleinputmodule),即一个转录因子控制一系列相关的操纵子。这种基序可以用一个信号控制所有相关的操纵子,使之产生同样的正调控反应或同样的负调控反应。例:大肠杆菌转录调控网络例:大肠杆菌转录调控网络第三种基序为高重叠调控型(denseoverlappingregulon)大肠杆菌内近一半的操纵子都是建立在这种调控关系下,即一组转录因子对多个操纵子采用相互重叠的、密集的控制方式。4.9.1.基序-网络的关系单元4.9

基因调控网络的基序和模块反馈环可以分成一致反馈环和非一致反馈环两种。(a)一致反馈环(b)非一致反馈环图4.9反馈环结构圆圈表示转录因子,长方形表示miRNA,箭头表示激活,钉子头表示抑制。4.9

基因调控网络的基序和模块在一致反馈环中,两种调控对靶目标具有同样的影响,或者都是激活或者都是抑制。在非一致反馈环中,两种调控对靶目标的影响相反,其中一个为激活,另一个为抑制。4.9

基因调控网络的基序和模块最近的研究表明:一致反馈环在功能上可以使靶目标的表达很快达到双稳态,也可以使瞬态信号修饰后成为一个不可逆的锁定状态。非一致反馈环的功能是对基因表达进行微调,从而使环的两个组成部分振荡表达。4.9

基因调控网络的基序和模块同样,前馈环也可以分为两种:一致前馈环和非一致前馈环。(a)一致前馈环(b)非一致前馈环图4.10前馈环结构YZXYXZXYZXYZ调控因子X可以直接或者通过调控因子Y间接地调控靶目标Z的表达。4.9

基因调控网络的基序和模块一致前馈环可以起到加强转录的作用,同时也起切换开关的作用,把起始信号转换成一个持久的细胞反应。而非一致前馈能加快信号检测的反应速度。Kaplan等通过对大肠杆菌的研究发现非一致前馈环能够使基因表达对输入信号产生非单调依赖性。4.9

基因调控网络的基序和模块最近的研究表明,包含转录因子和miRNA的调控环不只是以个例的形式存在,而在基因组水平上是大量存在的。基因表达的相关和负相关性一直是研究的热点,Tsang等通过包含转录因子和miRNA的各种前馈环和反馈环的存在解释了基因表达的相关性和负相关性。4.9

基因调控网络的基序和模块Shalgi等对人类基因组调控靶基因的miRNA-TF进行了研究,在实际人类基因组中miRNA-TF调控关系比随机选取的miRNA-TF调控关系的频率要高,表明在人类基因组中的确存在前馈环和反馈环。4.9

基因调控网络的基序和模块Wang等对果蝇的miRNA的顺式调控元件进行了研究,通过整合miRNA靶目标的相互作用,对假定的调控反馈环进行了识别。Martinez等对线虫的基因组进行了研究,整合了通过实验得到的TF-miRNA的调控网络和预测得到的miRNA-TF网络,得到了miRNA和TF相互作用反馈环,并发现这种反馈环的发生要比随机网络高得多,这表明反馈环为基因表达的一般调控机制。4.9.2.模块—网络的结构单元大生物分子如蛋白质之间常常发生非常紧密的相互作用,并形成具有明确空间形态的复合物,这种由许多分子相互结合形成的、有着稳定结构和功能的复合体称为模块(module)。4.9.2.模块—网络的结构单元基序:是从功能的角度来分析网络的构成,着眼于网络内各种成分之间连接的模式或关系;模块:则注重从结构的角度来理解网络,寻找网络内由直接相互作用的成分构成的单元。4.9.2.模块—网络的结构单元模块有两个显著的特征:一是模块内的分子与分子间有些直接的相互作用;二是模块与模块或模块与非模块之间有着清晰的边界。4.9.2.模块—网络的结构单元常用生物网络分析和可视化软件CentiScaPe软件CentiScaPe是一款用来分析生物网络中心性参数的工具,同时可利用实验数据和网络拓扑识别功能相关的分子(网络节点)。另外,该工具还有一个特征,就是有一款基于布尔逻辑的工具,可以利用不止一种的中心性参数来描述网络节点之间的相关性。并且,该工具已经开发成Cytoscape的一个插件,可以很方便地对网络进行操作和可视化。SNOW软件SNOW是一款专门用来分析蛋白质相互作用网络的软件。根据用户提供的蛋白质列表,该软件可以自动利用蛋白质相互作用来分析蛋白质之间的关系。同时,可以计算一些相关的网络参数以及这些参数的统计显著性。SNOW为网络节点计算的参数包括:连接性,介数和聚类系数。另外,SNOW还提供了网络可视化。VisANT软件VisANT提供了一个生物网络分析的集成框架。该软件的特色之处在于能够挖掘和显示生物网络所提供的功能分级层次信息。另外,该工具可以可视化基因功能注释GenoOntology(GO)的分级结构。同时,VisANT可以识别显著的GO注释富集和表达富集的基因模块,该软件可免费使用。ChiBE软件BioPAX是用来表示生物通路的一种数据交换格式。ChiBE是一个开源的软件,用来多角度可视化和操作BioPAX生物通路模型。在ChiBE中,生物通路可以用多种现有的可视化工具来显示,包括化合物、细胞器和分子复合物。用用户可以很容易地通过共同通路查询和可视化生物通路,以及生物通路的分子表达谱。Cytoscape软件Cytoscape是一个开源软件,可以在一个统一框架下将高通量的表达数据、分子状态和生物分子网络进行集成分析。还可以对各种分子组件和相互作用进行分析。特别是对大的蛋白质相互作用、蛋白质DNA相互作用和遗传相互作用等。另外,Cytoscape具有简单的网络发布和查询功能、结合表达谱数据、表型数据和分子状态等进行网络分析,结合功能注释等网络分析。Cytoscape的另一个特色之处在于可以利用不同的插件软件来对生物网络进行分析。此外,用户可以根据自己的需要开发自己的插件,结合Cytoscape使用,应该说是目前最为流行的生物网络绘图软件。Pajek软件Pajek是一款专门用来可视化大规模网络的软件,在社会网络分析中应用较为广泛。Pajek可以操作几千甚至上百万的节点。Pajek被用来分析随机网络、网络分解等。PajeK的优点在于网络可视化效果好,可视化选项较多,缺点在于该款软件是只针对windows操作系统开发的。FANMOD软件网络模体(motif)是小的连通子网络,该子网络的出现频率远高于随机网络。目前,很多生物网络都表现出模块化的现象,模体被认为是网络的基本功能单元。FANMOD就是一款有效识别生物网络中模体的工具,并特别适合于大网络中大的模体。另外,该软件具有很好的用户界面,并可以将结果输出为多种机器可读格式。POINeT软件POINeT是一款用来进行蛋白质相互作用查找、分析和可视化的软件。该工具可以蛋白质相互作用和多个数据来源的组织特异表达数据。同时该工具还可以结合文本信息来对蛋白质相互作用过滤。该软件还提供了一个特色功能,就是对子网络工具其优先级进行排序。Osprey软件Osprey软件可以提供无向、有向和加权网络的二维可视化,该软件不适合大规模网络分析,但是提供了很多网络分布选项以及多种网络节点分布方式。Osprey还可以利用基因功能注释对基因进行聚类。BioLayoutExpress3D软件BioLayoutExpress3D是一款可以二维或者三维显示和聚类大规模网络的工具。BioLayoutExpress3D可以利用基因表达数据对基因调控网络进行可视化和聚类。由于采用了多种颜色模式,该软件为网络聚类的可视化提供了更多选项,特别是该软件采用了马尔可夫聚类算法使得网络聚类具有较高的精度。参考文献参考文献基因调控网络常用数据库基因调控网络常用数据库基因调控网络常用数据库基因调控网络常用数据库一个扩展的调节胚胎干细胞多能性的转录调控网络Cell132,1049–1061,March21,2008胚胎干细胞具有多能性(Pluripotency),特点是可以通过细胞分化(Cellulardifferentiation)成多种组织(所有组织,包括生殖系细胞)的能力,但无法独自发育成一个个体(利用四倍体融合技术可以得到完全由所用ES细胞发育而来的个体)。它可以发育成为外胚层、中胚层及内胚层三种胚层的细胞组织。大纲AbstractIntroductionResultsGlobalMappingofTargetGenesbyBiotin-MediatedChromatinImmunoprecipitationPromoterOccupancyofNineTranscriptionFactorsinmESCellsHistoneModificationSignaturesRegulationofTargetGeneExpressionbyTranscriptionFactorOccupancyExpansionofCoreTranscriptionalRegulatoryNetworkinESCellsRegulatoryNetworkwithinFourSomaticCellReprogrammingFactorsDiscussionAbstract最近,几个转录因子引起了人们的注意,这些转录因子维持了人或鼠的胚胎干细胞处于多能性分化的状态。为了更完整的了解维持多能性状态的调控网络,我们用到九个转录因子在小鼠干细胞基因组范围的目标启动子,这些转录因子包括:4个用于诱导成体细胞重编程的转录因子(Oct4,Sox2,Klf4,和c-Myc),以及其他5个转录因子(Nanog,Dax1,Rex1,Zpf281,andNac1)。Abstract我们发现这些被转录因子靶向的基因分成两类:被少数因子靶向的启动子倾向于失活或被抑制;而被至少四个转录因子靶向的启动子大部分在多能性状态下是激活的,但在分化的过程中逐渐被抑制了。更进一步,我们对重编程的转录因子构建了层次调控网络,发现c-Myc靶向的基因与其他因子靶向的基因有很大差别。我们提供了一个有用的数据资源用于探索复杂的维持干细胞多能性的网络。IntroductioniPS:诱导多能性干细胞在胚胎干细胞中多能性是如何建立和维持的,是我们非常关心的研究内容。随着我们对于调控网络中的转录因子和表观遗传学修饰研究的深入,我们可以更容易的直接诱导胚胎干细胞分化成某一特殊的细胞系或者是诱导体细胞分化成与胚胎干细胞相似的细胞。核心转录因子Oct4,Sox2,andNanog,对胚胎干细胞的特性的建立和维持非常重要,其他的转录因子的重要性也被逐渐的认识到。诱导多能干细胞(inducedpluripotentstemcells,iPScells)最初是日本人山中申弥(ShinyaYamanaka)于2006年利用病毒载体将四个转录因子(Oct4,Sox2,Klf4和c-Myc)的组合转入分化的体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论