DNA计算机在分子生物学中的研究进展_第1页
DNA计算机在分子生物学中的研究进展_第2页
DNA计算机在分子生物学中的研究进展_第3页
DNA计算机在分子生物学中的研究进展_第4页
DNA计算机在分子生物学中的研究进展_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目 录第一章第一章 生物计算机的现状和发展生物计算机的现状和发展.11.1 生物计算机出现的背景.11.1.1电子计算机的缺陷.11.1.2生物计算机的优势.11.2 生物计算机技术.21.2.1生物计算机的物质基础.21.2.2生物计算机的数学基础.31.2.3生物计算机的数据结构.31.3 生物计算机的研究现状.4第二章第二章 DNA 计算机基本原理计算机基本原理 .62.1 DNA 计算机的诞生.62.2 DNA 计算机理.62.3 DNA 计算模型.72.4 DNA 计算的应用.8第三章第三章 DNA 计算机在分子生物学的应用计算机在分子生物学的应用 .93.1 基因组数据和数据基因组

2、.93.2 DNA 计算机的算法研究与基因表达调控研究不谋而合.93.3 出色的句子和笨拙的文章.93.4 基因治疗.10第四章第四章 未来展望未来展望.11第五章第五章 参考文献参考文献.121DNADNA 在分子生物学中的研究进展在分子生物学中的研究进展第一章 生物计算机的现状和发展1.1 生物计算机出现的背景1.1.1 电子计算机的缺陷集成电路是电子计算机的核心部分。要想提高计算机的工作速度和存储量,关键是实现更高的集成度。传统计算机的芯片是用半导体材料制成的,这在当时是最佳的选择,但随着计算机技术迅猛发展,硅芯片的集成度越来越高,它的弱点也日益显现出来1。作为计算机心脏的CPU 运算速

3、度越来越快,体积越来越小,但在单位面积上容纳的元件数是有限的,终有一天CPU 上集成电路的尺寸会因为间隙过于狭小而产生干扰,达到运算速度的最高极限。这是由于电路器件的过度密集和电路相互干扰、散热困难等问题之间存在着固有矛盾。由摩尔定律可知,芯片制造商们能够通过在结晶硅片上蚀刻极其细微的凹槽,使晶体管数目每隔18 个月翻一番。现在,人们在市场中已经可以买到0.13 微米的CPU,下一代0.09微米的CPU 也正在研制中,但是这一尺寸的CPU 即将走向硅芯片的终点。因为再往下发展,晶体管将变得如此之小,以致于其硅部件的尺寸将达到分子级,在这种超近距离内,将产生量子效应,引起短路。因此,0.05 微

4、米精度的电路工艺可能将是硅芯片的发展终点。目前,在全世界范围内的科学家正在进行下一代计算机研究,希望能解决电子计算机的这一缺陷,科学界看好的未来计算机有这三类:光计算机、量子计算机、生物计算机,即DNA(Deoxyribo Nucleic Acid 脱氧核糖核酸)计算机,本章针对生物计算机进行介绍。121.1.2 生物计算机的优势生物分子计算机有独特的优势,用分子计算处理某些问题,比传统的计算方2法更为有效。将生命活动的指令进行编码的遗传分子DNA 和RNA(核糖核酸),比硅芯片上的电子元件要小很多,甚至可小到几十亿分之一米。而且,生物芯片本身具有天然独特的立体化结构,其密度要比平面型硅集成电

5、路高5 个数量级。纳米技术家认为,DNA 具有在极小空间里存储海量信息的自然特性,遗传密码符号的间距仅有0.34 纳米,1 立方米的DNA 溶液可存储1万亿亿比特数据;1 立方厘米DNA 溶液将超过1万亿片CD 光盘的存储容量。2试管状的生物计算机中含有大量遗传物质工具,因此,生物计算机能够同时进行数千次甚至上百万次计算。在传统的计算机中,对于处理的问题,它是以电流的速度一个一个地检验所有可能的解决方案。而生物计算机真正的优势在于它可以同时对整个分子库里的所有分子(或答案)进行处理,而不必按照次序一个一个地分析所有可能的答案。可以这样比喻一下,一道数学题是一把锁,计算机是一串钥匙。电子计算机在

6、开这把锁的时候是一次试一把钥匙,而DNA 计算机在开这把锁的时候是一次试几百万把钥匙,所以由DNA 链组成的计算机速度将比现有的超级计算机快100 万倍。具有生命特征的这种电脑,运算次数甚至可以达到每秒1020 或更高。十几个小时的DNA 计算,就相当于人类社会所有电脑问世以来的运算总量。其效率自然不可同日而语,可谓是超级并行计算机。2生物计算机体积小、重量轻、能耗小(运算次数每秒1020 以上,消耗的能量却只有普通电脑的十亿分之一)、散热少、能耐高温高寒。另外,由于生物计算机所需的生物分子材料可利用基因技术通过细菌繁殖大量生产,因此它的造价将比半导体元件计算机要低。生物计算机,从某种程度上说

7、,是现在的电子计算机的对等物,但它是以化学和生物为基础的。随着微电子技术和蛋白质工程的相互渗透,生物计算机将跃上历史的大舞台。231.2 生物计算机技术1.2.1 生物计算机的物质基础70 年代就有人发现,DNA 处在不同状态下,可产生有信息和无信息。后来有科学家发现,一些半醌类有机化合物的分子具备“开”和“关”两种电态功能,3可以把它当成一个开关。科学家们还进一步发现,蛋白质分子中的氢也具备“开”和“关”两种电态功能,因而也可以把一个蛋白质分子当成一个开关。联想到晶体管的导通或截止电压的高或低、脉冲信号的有或无等等,激起了科学家们研制生物电子元件的灵感,相继有一些简单的生物元件问世,如生物开

8、关元件、生物记忆元件等。3生物计算机的主要原材料是生物工程技术产生的蛋白质分子,它作为生物芯片,以波的形式沿着蛋白质分子链传播信息,引起蛋白质分子链中单键、双键结构顺序的改变,从而传递了信息,而且它的集成度高,运算速度快,可以用生物分子作为软件,代替集成电路,设计制造生物计算机。34生物计算机是一种化学反应计算机。它的基本构想是:以DNA 碱基序列作为信息编码的载体,利用现代分子生物学技术,在试管内控制酶的作用下控制DNA 序列反应,实现运算过程;它以反应前DNA 序列作为输入的数据,反应后的DNA 序列作为运算的结果。即DNA 计算机的数据输入、输出和软件运行都是以DNA 分子为基础,通过活

9、的组织来完成编码信息的存储和运算。41.2.2 生物计算机的数学基础1994 年11 月,计算机科学家L.阿德勒曼(L.Adleman)在科学杂志上公布了生物计算机的理论,并成功地运用生物计算机解决了一个有向哈密尔顿路径问题,这说明DNA计算蕴含的理念可使计算的方式产生“进化”。4生物计算机的提出,让人们有这样一个发现,即生物与数学的相似性:一是生物体异常复杂的结构是对由DNA 链表示的初始信息执行简单操作(复制、剪接)的结果;二是可计算函数f(x)的结果可以通过在x 上执行一系列的基本简单函数而获得。这两个过程有很大的相似性,而且可以利用生物过程来模拟数学过程。更确切地说是,DNA 链可用于

10、表示信息,酶可用于模拟简单的计算。41.2.3 生物计算机的数据结构DNA是由核苷酸的一些单元组成,这些核苷酸随着附在其上的化学组或碱基的不同而不同。DNA共有四种碱基:腺瞟呤、鸟瞟呤、胞嘧啶和胸腺嘧啶,分别4用A、G、C、T表示。一些单个的核苷酸顺序地连在一起形成DNA链。4像一串带有0 和1 编码的二进制数据链,DNA 的数据密度是非常惊人的。这些碱基沿着DNA 分子链方向的空间距离是0.35 纳米。因此,DNA 的惊人数据密度约是每厘米7Mb。如果我们假设1 平方纳米1 个碱基,DNA 的二维数据密度约是每平方厘米155000Gb。目前所使用的普通硬盘数据密度是每平方厘米1Gb,因此DN

11、A 的二维数据密度大约是普通硬盘数据密度15 万倍。4DNA 链的另一个重要的性质是双螺旋结构,A 碱基与T 碱基、C 碱基与G 碱基结合在一起形成碱基对。然而每个DNA 序列都有一个互补序列,例如,如果序列S 是ATTACGTCG,它的互补序列S是AATGCAGC,S 与S结合在一起形成双螺旋DNA 结构。这种互补性使得DNA 在计算方面具有独特的结构,而且在很多方面可以利用。例如改正错误就是一个例子,在DNA 中产生错误的原因是多方面的。45偶尔DNA 酶也产生简单的错误,例如切掉那些不希望切掉的部分。另外DNA 还可能被热能和太阳光中的紫外线能量破坏。如果错误发生在DNA双螺旋结构中的某

12、一个螺旋序列中,修改酶可以参考互补序列恰当地恢复之。DNA的双螺旋结构类似于计算机硬盘的RAID1 阵列,即第二块硬盘是第一块硬盘的镜像,如果第一块硬盘的数据被破坏,可以根据第二块硬盘的数据恢复第一块硬盘的数据。在生物系统中,由于有修改错误的特性,使得错误率非常低。例如,在DNA 复制方面,每10 亿个复制的碱基中只有1 个错误,即错误率是10-9。51.3 生物计算机的研究现状美国南加州大学阿德拉曼博士1994 年首次使用试管中的DNA 解决了一道实际的数学题,该生物计算机由装满有机液体的微型试管组成,承担计算任务的DNA 分子就溶在液体之中,它通过控制DNA 分子间的生化反应来完成运算。5

13、以色列维茨曼科学研究所的研究人员开发出一种由DNA 和生物分子制成的可运行程序的分子计算机。现在,该研究所的研究人员又研制出一 “台”速度达每秒330 万亿次运算的生物计算机,这种计算机的运算速度比现在普通计算机快10 万倍,这台计算机也是世界上迄今为止最小的生物计算装置。这种计算机中的DNA 既可以为整个计算机提供输入信息,又可以为计算机提供运行所必须的能5量。5美国威斯康星大学的研究人员最近也制造出一台生物计算机。它由大约100 万亿个人工合成的DNA 链状结构组成,能进行一些相对复杂的运算。这部计算机寿命很短,很原始,但它使人们看到希望:生物计算机不是梦。56虽然生物计算机的研究已经取得

14、了很大的成果,但生物计算机的使用目前正处在理论探讨阶段。不论体外或体内,DNA 计算的所有潜在用途还只是纯理论的探讨。与此同时,科学家还在研究DNA 的其他特性:这些特性不仅能够用于储存信息,还能用于构成计算机集成电路的其他部件。其中一种特性就是自装配,即互补的DNA 分子能够互相识别并在溶液中结合在一起。此外,DNA 链也许还能像微小的线路一样导电。66第二章 DNA 计算机基本原理2.1 DNA 计算机的诞生自计算机问世50多年来,运算速度已提高了约10亿倍。在最新一代芯片中,晶体管之间的连接导线的厚度已被蚀刻到只有0.18m。科学家认为,电路线宽在0.1m 以下将不可避免地达到仅有单个分

15、子大小的物理学极限,到2020年,传统计算机在信息存储和处理方面不大可能有大的发展,传统计算机的发展可能将走入穷途末路。由于无数高新技术的研究对计算机的性能不断提出更高要求,各种新型计算机的研究开发势在必行。量子计算机和生物计算机包括DNA计算机有可能为计算机进一步发展另辟蹊径。1994年,L.Adleman首创了DNA计算的概念,在Science上发表了研究结果,介绍了用DNA进行特定目的计算解决图论中Hamiltonian有向路径NP问题,该研究引起了许多生物学家和计算机科学家及其他许多领域科学家的兴趣。欧阳颀等在Science发表文章,利用DNA分子出色地解决了Clique计算问题。20

16、01年11月,Nature杂志上报道了一种由DNA分子和相应的酶分子构成的DNA生物计算机,体积只有一只试管的1/16,每秒可执行10亿次作业,准确率高达99.8%,这种DNA计算机也是世界上第一部输入输出、软件和硬件均由生物分子组成的有图灵机功能的可程序自律计算机器,是DNA计算机研究的标志性重大进展。2001年,美国科学家利用简单的分子生物学操作进行DNA计算,为一个有24个变量、100万种可能结果的数学难题(3-SAT问题)找到了答案,这是迄今利用非电子化计算手段解决的最复杂数学问题。6早些时候国内也有一些研究者从不同角度对DNA计算(机)进行了总结,但是国内尚未见DNA计算机的实验研究

17、的报道。我们实验室在DNA计算机的试管实验方面已经做了不少努力,完成了第一个简单的试管型DNA计算机,并首次从实验上把自动机功能与表面DNA计算结合在一起。72.2 DNA 计算机理DNA计算是利用DNA双螺旋结构和碱基互补配对规律进行信息编码,将要运算7的对象映射成DNA分子链,通过生物酶的作用,生成各种数据池,再按照一定的规则将原始问题的数据运算高度并行地映射成DNA分子链的可控的生化反应过程。最后,利用分子生物技术(如聚合链反应PCR、超声波降解、亲和层析、克隆、诱变、分子纯化、电泳、磁珠分离等),检测所需要的运算结果。7从数学上讲,单链DNA可看作由符号A、C、G、T组成的串,同电子计

18、算机中编码0和1一样,可表示成4字母的集合来译码信息。特定的酶可充当“软件”来完成所需的各种信息处理工作。不同的酶用于不同的算子,如限制内核酸酶可作为分离算子,DNA结合酶可作为绑结算子,DNA聚合酶可作为复制算子,外核酸酶可作为删除算子等。这样,通过对DNA双螺旋进行丰富的、精确可控的化学反应以完成各种不同的运算过程,就可研制成一种以DNA为芯片的新型计算机。已被证明DNA计算至少在理论上是通用的,可以解决图灵机所能解决的所有问题。72.3 DNA 计算模型经过10多年的发展已有多种DNA计算模型被提出。如剪接模型、粘贴模型、等同检测模型、插入/删除系统、最小计算模型等,这些模型都被证明和图

19、灵机是等价的,也就是具有计算完备性。8插入/删除系统:插入/删除系统是建立在上下文插入和删除基础上的DNA计算模型。Kari等人利用建立在该系统基础上的递归可数语言特征研究了形式语言和DNA计算的交叉性,证明了单个字母的插入/删除系统同样是计算完备的。在该系统中,如何选择实际操作参数的数目,个体操作的速度,个体操作和序列操作的可靠性,信息载体的稳定性及一个实验中连续操作的数目都是要进一步研究的。8剪接系统:Head在1987年利用形式语言对DNA序列进行分析的基础上,提出了剪接系统的概念。1997年将其引入DNA计算领域,随后,Paun等人对该系统的通用性、计算能力和剪接运算等方面进行了详细的

20、讨论。剪接系统是目前研究较多、较为成熟的通用计算模型之一。8粘贴系统:1996年,Roweis提出一种基于分子操作和随机访问内存的DNA计算粘贴模型。它有着与剪接系统一样的计算能力,而且与有限自动机理论有着密切的联系,在运算过程中不需要DNA链的延伸,也不需要酶的作用,并且DNA链可8重复使用。1998年,Kari等人受到粘贴模型的启发,提出粘贴系统的概念随后,Paun等人将粘贴系统的概念推广到一个更为普遍的形式上。已有许多实例用粘贴模型来计算。但容错性还需进一步地研究。8等量检测模型:1998年Yokomori提出了一种新的DNA计算模型DNAEC。此模型是基于简单的等量检测计算理论。同检测

21、原理非常简单,可在任何一种机器上实现,特别适合于分子计算,因为等量检测只需对两记忆单元进行等量性检测,而记忆单元可描绘成双链DNA序列形成的符号串。8从严格的数学意义上讲,等量检测模型提供了一个极具吸引力的计算理论基础,所需元素操作数目不多,模型简单。但此模型的在实验室中的可行性还有待研究。随着DNA表面模型、DNA二级结构、DNA空间构造、DNA自装配微结构、鞭绳PCR的研究,新的模型必将出现,且这种模型是计算完备的、可编程、易实现的。82.4 DNA 计算的应用(1)解决某些NP完全问题和一些难解的数学问题。如HPP问题、满足性问题、最大集团问题;(2)数据加密和解密。这是超级计算机应用的

22、一个重要领域;(3)智能控制;(4)生物化学、组合化学和医学等;(5)Boolean电路和数据流逻辑运算的仿真和实现。99第三章 DNA 计算机在分子生物学的应用3.1 基因组数据和数据基因组当一个细胞被看成一台计算机时,细胞中的基因组在这个计算机中的角色就是个重要的问题。它是编程软件还是数据,还是兼而有之,这方面还没有太多的争论,主要原因是DNA计算机的复杂性和概念上巨大的新颖性。我们认为基因组的主要功能还是编程,但是在一定程度上也有数据库的功能。由于DNA分子有巨大的储存功能,把大量的数据储存在DNA长链上并整合到某种细胞的基因组中,这种数据就是基因组数据;大量的数据也可以体外存放在某种形

23、式的DNA分子中,这些DNA分子可以做成数据基因组。93.2 DNA 计算机的算法研究与基因表达调控研究不谋而合人类基因组可能是迄今为止最大的计算程序。基因组研究中已经出现许多目前计算机难以解决的计算问题(计算量或算法),如:基因调控网络预测;基于特殊算法的大规模的序列比较;多个基因组的同时比较和高级算法实现;染色体的折叠过程模拟;基因组和蛋白组的综合代谢网络模拟和药物效应模拟等等。9103.3 出色的句子和笨拙的文章染色体是实现基因表达调控和发育的时空机制等DNA算法的行为工具。相对于单个的基因来讲,染色体是一个巨大的机器;如果说单独一个基因表达的过程是一个小程序,那么染色体在生命个体的全部

24、过程中的活动就是一个巨大的程序软件包。或者说,单独一个基因表达的过程是一个句子,而染色体行为是撰写一篇生命过程的文章。句子的优美固然重要,但是文章表达的内涵是更重要的。笨拙的文章(如癌症)中间我们经常看到精美的文句。DNA计算机的研究将帮助把10人类基因组中的字,词,句,篇章结构等进行详尽的分析。103.4 基因治疗在基因组中发生任何形式的突变或病毒感染都可以认为是“计算机病毒”,因为基因组实际是一个大软件,任何改变该软件正常运行的基因组变化可以当作“计算机病毒感染”;作为病毒,有其特殊的源代码,将来可以设计能识别许多源代码的DNA剪切装置并自动进行“查毒”和“杀毒”;如果该装置与可以进出细胞

25、的超微型机器人结合在一起,其应用前景不可估量。1011第四章 未来展望DNA 计算机具有划时代的意义。计算机的计算方式是依据一定的法则对有关符号串进行变换的过程。目前计算机中的加减乘除是一种物理性质的符号变换,但是 DNA 计算机中对应的有一套生物化学性质的变换,即 DNA 分子的切割,连接,插入和删除等。随着 DNA 计算机的发展,RNA 或其他生物大分子也要越来越多地介入到 DNA 计算机中以实现更高级更复杂的算法。这种计算方法的变革是前所未有的,是更高级形式的计算方法,具有划时代的意义。它将彻底改变计算机硬件的性质和基本运作。极为重要的是,DNA 计算机中的算法研究已经超越了纯粹计算机研究本身,它实际上也是在研究生命的本质过程,即基因组是通过怎样的编程(算法)来实现生物个体的生命过程(发育,衰老,疾病,死亡等,即生,老,病,死) 。所以,DNA 计算机的研究可能是把其他高技术导入生命科学并实现技术操纵的一个关键窗口。有关的研究必须引起我们的高度重视。目前计算机的算法是人类运算历史自然发展的必然性结果,是一种物理性质的符号变换,不论是目前的高速超级计算机或今后发展的纳米计算机都(可能)处于这种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论