基因调控网络_第1页
基因调控网络_第2页
基因调控网络_第3页
基因调控网络_第4页
基因调控网络_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因调控网络1第1页,共30页,2023年,2月20日,星期四背景基因表达(geneexpression)是指细胞在生命过程中,把储存在DNA顺序中遗传信息经过转录和翻译,转变成具有生物活性的蛋白质分子。生物体内的各种功能蛋白质和酶都是同相应的结构基因编码的。一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因表达调控网络。更一般些,几乎所有的细胞活动都被基因网络所控制。对系统科学的研究促使生物学家以系统的观点认识高度复杂的生命现象。生命是存储并加工信息的复杂系统,从而,孤立地研究单个基因及其表达往往不能确切地反映生命现象本身的内在规律。因此,科学家们开始从复杂系统的角度研究基因网络。2第2页,共30页,2023年,2月20日,星期四基因调控网络本质上是一个连续而复杂的动态系统,即复杂的动力系统网络。建模时为了简化求解的需要,往往对其进行简化。基因调控网络有许多特性,如复杂性(即基因网络包含着不同层次的错综复杂的物质、关系和功能结构,基因的复杂性还体现在基因的组合性质方面)、稳定性(基因网络系统能够通过自动调节达到稳定)、可进化性和有限连通性等。3第3页,共30页,2023年,2月20日,星期四研究现状当前对于基因调控网络研究的方法一般包括以下两个步骤:

1.模型选择线性模型、布尔模型、贝叶斯网络模型、微分方程模型、随机方程模型等

2.模型构建或优化的算法梯度下降法、支持向量机、贪心算法、遗传算法、遗传编程等近年来,微分方程模型逐渐成为系统生物学领域中的热点。微分方程模型是以其它基因表达水平和外部环境的因素组成的函数来描述基因表达的变化,可以充分模拟基因调控网络的动态行为。相比较其他模型,微分方程模型非常强大灵活,利于研究基因网络中的复杂关系。4第4页,共30页,2023年,2月20日,星期四例如,,其中xi表示第i个基因的表达水平,n表示基因调控网络中的基因数。所以主要的工作就是对于右端任意的微分方程系统的演化。关于这方面的研究主要集中在两个方面:

(1).微分方程结构的优化;

(2).微分方程系数和常数的优化。研究表明:微分方程演化的越准确,得到的生物网络模型越精确,越接近目标网络模型。5第5页,共30页,2023年,2月20日,星期四研究过程基于多表达式程序设计(MEP)的一些优点,如线性的染色体结构、实现简单、一个染色体包含多个基因等,我们采用MEP优化微分方程的结构,粒子群优化算法(PSO)优化方程中的系数和常数。例如,我们选取F={+,-,*},T={X1,...,Xn,1}(1表示常数)。对于含三个未知数的微分方程组6第6页,共30页,2023年,2月20日,星期四可表示一组染色体形式(E1,E6,E6):统计每个方程对应系数的个数和其对应的位置,把方程组的系数组合成一个粒子,通过粒子群优化算法(PSO),得到好的系数。1:x12:x24:*1,33:+1,15:+1,26:-2,51:x12:x24:-1,33:+1,25:x36:+3,51:x12:x24:-1,23:+1,25:x36:+3,5dx1/dtdx2/dtdx3/dt1:x16:-2,52:x34:*1,33:+1,15:1P2P1P3P5P47第7页,共30页,2023年,2月20日,星期四流程图是否否是初始化种群评价个体适应值保留好的个体结束是否达到要求代数是否达到要求交叉,变异选择一定数量的个体参数优化8第8页,共30页,2023年,2月20日,星期四分裂采用分裂思想,可以大量的减少方程组得搜索空间。假设一个微分方程组的方程最大表达式长度为c,则假如有一个变量,则搜索空间为1c,若有两个变量,则搜索空间为2c×2c=22c。对于n个变量的微分方程组,则搜索空间为nnc。若采用分裂法,即每个微分方程分别优化,则搜索空间变为nc+1,明显变小。单独优化每一个微分方程,在结构和系数编码、优化上都与前面一样。只是在求每个染色体适应值时,解微分方程需要做一下改动。9第9页,共30页,2023年,2月20日,星期四解微分方程一般采用四阶定步长Runge-Kutta算法计算解常微分方程。该算法结构简单。求解方法如下:首先定义四个附加变量:

k1=f(x(t),t)

k2=f(x(t)+hk1/2,t+h/2)

k3=f(x(t)+hk2/2,t+h/2)

k4=f(x(t)+hk3,t+h/2)

其中:h为计算步长,在实际应用中该步长是一个常数,这样由四阶Runge-Kutta算法可以由当前状态变量x(t)的值求解出下个状态变量x(t+1)的值

x(t+1)=x(t)+h(k1/6+k2/3+k3/3+k4/6)10第10页,共30页,2023年,2月20日,星期四对于包含n个方程的方程组,k1k2k3k4x(t)

为n维向量,函数组f={f1,f2,…,fn}。由于采用分裂思想,每个方程单独优化。假设优化第一个微分方程(下图为优化方程的训练数据),11第11页,共30页,2023年,2月20日,星期四生成的种群只代表第一个微分方程,即函数组中只有f1已知,只能计算出k1k2k3k4中的第一个元素的值,其他元素的值未知。利用训练数据,在根据当前状态变量x(t)的值求解出下个状态变量x(t+1)的值时,k1k4中的其他元素可以分别取x(t),x(t+1)相应的值,但k2k3的确定出现了问题。对于这种情况,我们采用一种近似的处理方法。即在根据当前状态变量x(t)的值求解出下个状态变量x(t+1)的值时,k2k3向量中的其他元素一律采用xi=[x(t+1)+x(t)]/2。由于采用这中近似四阶定步长Runge-Kutta算法,不可避免有些误差,通过实验,用这种方法,在大幅度提高减少搜索空间的同时,又对效果影响不大。但在研究过程中,发现如果采用线性插值的方法确定

k2k3向量中的其他元素,误差会小一些。即在确定k2中的12第12页,共30页,2023年,2月20日,星期四元素时使用xi=x(t)+[x(t+1)-x(t)]/3;确定k3中的元素时使用xi=x(t)+2*[x(t+1)-x(t)]/3。使用这种分裂思想,每个方程的优化过程是平行进行的,所以采用并行计算的方式,n个方程的进化时间可以缩小为一个方程的优化时间,方程越大,效果越明显,特别对于大规模基因调控网络的识别。13第13页,共30页,2023年,2月20日,星期四模拟实例我们使用以下实例来测试程序的有效性。这些实例使用的都是模拟数据,即从已知的方程模型中采集数据,然后利用这些数据来优化出方程模型,和已知的模型比较,来判断方法的有效性。(1)Lotka_Volterramodel14第14页,共30页,2023年,2月20日,星期四(2)anoscillatormodelX1'(t)=k1*X2(t)X2'(t)=-k2*X1(t)+k3*X2(t)–k4*X2(t)*X3(t)X3'(t)=k5*X1(t)2-k6*X3(t)

Thefollowingparametervaluesareused:k=[0.9,0.9,1.0,0.6,0.6,0.8].15第15页,共30页,2023年,2月20日,星期四结果(3).BimolecularReaction

对应于S=X1,E=X2,C=X3,P=X4,四类对应的微分方程如下(k1=2,k2=1.2):X1'(t)=0.900001X2(t)X2'(t)=-0.8999X1(t)+0.9992X2(t)–0.5998X2(t)X3(t)X3'(t)=0.6000X1(t)2–0.799943X3(t)16第16页,共30页,2023年,2月20日,星期四优化结果:17第17页,共30页,2023年,2月20日,星期四基因调控网络模拟实例基因调控网络是一个非常复杂的非线性系统,因此,对数学模型的选择也提出了较高的要求。目前研究比较广泛的一种动态连续建模方法是S系统。S系统以一组特殊的幂律常微分方程作为建模模型形式。这种结构在捕捉系统许多相关动态性能方面具有丰富的表达描述力,特别是分子生物机制中的各个组件间的非线性作用。S-system系统的具体形式如下其中:Xi为状态变量,数gij和hij通常称为动力学序数,表示基因i对基因j的影响作用。参数αi和βi分别被称速率常数。18第18页,共30页,2023年,2月20日,星期四(1)小规模基因调控网络上图为一基因调控网络的例子。这个网络可以通过S-system系统模拟,通过实验得到的时间序列求解基因调控网络,已广泛应用于生物信息学在领域中。19第19页,共30页,2023年,2月20日,星期四基因网络所需的参数在下列表中我们调整函数集和终点集如下:F={+,×}T={X1,X1-1,X2,X2-1,X3,X3-1,X4,X4-1,X5,X5-1}初始条件为20第20页,共30页,2023年,2月20日,星期四试验所得到的方程如下从结果可以看出,无论是结构还是参数,都和期望模型都近乎一样。21第21页,共30页,2023年,2月20日,星期四(2)中规模基因调控网络所需的参数如下:22第22页,共30页,2023年,2月20日,星期四我们选取函数集和终点集为:F={+,×,ax}T={X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12,X13,X14,X15}

得到的结果,除第11个基因外,都和原模型一样。我们得到的第11方程为

X11'(t)=X7-0.199999X110.018851-X11

由于原方程为X11'(t)=X7-0.2X40.4-X11

所以,X4X11没检测出来。23第23页,共30页,2023年,2月20日,星期四AdditiveTreeModels关于最近的工作,主要集中在换一种新的树型结构的模型来优化微分方程的结构。additivetreemodel是陈老师在2005年提出的一种树结构编码的模型结构。使用这种模型表示微分方程如下图所示:24第24页,共30页,2023年,2月20日,星期四生成这种模型需要两个操作集和:参数的优化,仍然采用PSO,参数的个数很容易得到,即n个(如果选择+n)。25第25页,共30页,2023年,2月20日,星期四对于这种模型,使用前面的例子做了测试,相比MEP,可以较快的得到好的结果,并且所需要的种群数量也很少。下面的例子是相比较MEP效果很差的,但这种模型表现的较好的。

Three-speciesLotka-Volterramodel26第26页,共30页,2023年,2月20日,星期四对于这种有点复杂的方程,MEP表现的不是很好,总是少几项。27第27页,共30页,2023年,2月20日,星期四出现的问题1,由于采用分裂思想,近似的解微分方程,会导致一定的误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论