生物信息学简介、应用与展望_第1页
生物信息学简介、应用与展望_第2页
生物信息学简介、应用与展望_第3页
生物信息学简介、应用与展望_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学简介、应用与展望生物信息学简介、应用与展望摘要 生物信息学作为一门新兴的交叉学科,有其独特的优势及发展空间,在今后的一段时间会更好的利用及发展。关键词 生物信息学 应用 发展 展望生物信息学简介生物信息学简介生物信息学生物信息学生物信息学(Bioinformatics)是在生命科学、计算机科学和数学的基础上逐步发展而形成的一门新兴交叉学科,是为理解各种数据的生物学意义,运用数学与计算机科学手段进行生物信息的收集、加工、存储、传播、分析与解析的科学。生物信息学是当今最具发展前途的学科之一,它缘于近10年来生物学相关信息量的“革命性爆炸”,又得益于近10 年来信息技术的“革命性发展”。生物信息学的出现极大地推动了分子生物学的发展。生物信息学已经成为生物医学、农学、遗传学、细胞生物学等学科发展的强大推动力量,也是药物设计、环境监测的重要组成部分。生物信息学在基因的功能发现、疾病基因诊断、蛋白质结构预测、基于结构的药物设计、药物合成和制药工业中起着极其重要的作用,生物信息学的应用大大加快了药物的研究开发进程。生物信息学的产生生物信息学的产生生物信息学的产生最早可以上溯到1956年在美国田纳西州的Gatlinburg召开的首次“生物学中的信息理论讨论会”5。美籍学者Hwa A. Lim首先创造并使用了“bioinformatics”这个名词。生物信息学是20世纪80年代末随着人类基因组计划的启动而兴起的。美国政府于1990年10月正式启动的人类基因组计划(Human Genome Project,HGP)6,是一项耗资30亿美元的15年计划,预期到2005年弄清人类基因组大约30亿个碱基的全序列,被称为生命科学“登月计划”。随着人类基因组计划的实施,通过基因测序、蛋白质序列测定和结构分析实验,获得了大量不连续的数据,需要利用现代计算机网络技术对这些原始数据进行收集、存储、处理,以便于检索使用;而且为了解释和理解这些数据,还需要对数据进行对比、分析,建立计算模型,进行仿真、预测与验证。美国在最初提出人类基因组计划时就成立了一个由42位专家组成的生物信息研究小组。人类基因组计划的实施,生物学的快速发展以及数学、物理、计算机科学、信息科学的渗入,使生物信息学逐渐发展成为一门独立的学科并将其推上了生物科学发展的最前沿。生物信息学的发展阶段及各阶段的主要研究内容生物信息学的发展阶段及各阶段的主要研究内容生物信息学是一个建立在对DNA和蛋白质序列比较基础上的学科,目的是发现进化关联,并由此进行功能比较。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段5。前基因组时代的标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等;基因组时代的标志性工作包括基因识别与发现、网络数据库系统的建立和交互界面工具的开发等;后基因组时代的研究重点主要体现在基因组学(Genomics)、比较基因组学(Comparative genomics)和蛋白质组学(Proteomics)等方面,标志则是大规模基因组分析、蛋白质组分析以及各种数据的比较与整合,具体说就是在基因组和蛋白质组水平上,从核酸和蛋白质序列、表达谱数据出发,分析序列中表达的结构与功能、基因调控网络、生化代谢途径的生物信息。这三个阶段虽无明显的界限,但反映出整个研究重心的转移变化情况。目前,生物信息学的主要研究内容已经从对DNA和蛋白质序列比较、编码区分析、分子进化转移到大规模的数据整合、可视化;转移到比较基因组学、代谢网络分析、基因表达谱网络分析、蛋白质组技术数据分析处理,蛋白质结构与功能分析以及药物靶点筛选等。在后基因组时代,生物信息学分别与功能基因组、蛋白质组、结构基因组等领域相互配合、紧密相关,成为目前极其热门的系统生物学研究的重要基石。生物信息学的应用生物信息学的应用核酸序列分析核酸序列分析核酸序列分析是生物信息学应用中的一个重要方面。基于已有知识所形成的核酸序列数据库以及在此基础上所形成的二级数据库对未知核酸序列的分析及功能预测具有重要的参考价值。在从事分子生物学研究的几乎所有实验室中,对所获得核酸序列进行生物信息学分析已经成为进行下一步实验之前的一个标准操作。在很多时候,往往通过一个简单序列相似性的比较就可以对未知序列进行初步的功能预测,为后续实验确定初步的研究方向。具体包括以下内容:核酸序列的基本分析、基因结构与DNA序列分析、表达序列标签分析、电子克隆cDNA全长序列。蛋白质序列分析蛋白质序列分析蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成、分子质量、等电点(pI)、亲水性和疏水性、信号肽、跨膜区及结构功能域的分析等。蛋白质的很多功能牲可直接由分析其序列而获得。蛋白质功能预测,一般说来,对于蛋白质功能预测分析而言,最为重要的莫过于分析目的蛋白质是否和功能已知的蛋白质相似。其中主要有两个策略进行:同源序列分析和功能区相关的保守序列特点分析。蛋白质分子进化分析,蛋白质同源家族的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义。同源蛋白质进一步划分为直系同源和并系同源。前者指在不同物种中具有相同功能和共同起源的基因,后者则指同一物种内具有不同功能但有共同起源的基因。序列对比序列对比序列比较是生物信息学中最基本、最重要的操作,通过序列比较可以发现生物序列中的功能、结构和进化的信息。序列比较的根本任务是:通过比较生物分子序列,发现它们的相似性,找出序列之间共同的区域,同时辨别序列之间的差异。在分子生物学中,DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构的相似,也可能是功能的相似。研究序列相似性的目的之一是通过相似的序列得到相似的结构或相似的功能。通过比较未知序列与已知序列(尤其是结构和功能已知的序列)之间的相似性,可以很容易地预测未知序列的功能。这种方法在大多数情况下是成功的,当然,也存在着这样的情况,即两条序列几乎没有相似之处,但分子却折叠成相同的空间开关,并具有相同的功能。这里先不考虑空间结构或功能的相似性,仅研究序列的相似性。研究序列相似性的另一个目的是通过序列的相似性,判别序列之间的同源性,推测序列之间的进化关系。分子系统发生分析分子系统发生分析系统发生(或种系发生、系统生育,phylogeny)是指生物形成或进化的历史。系统发生学(phylogeneties)研究特种之间的进化关系,其基本思想是比较物种的特征,并认为特征相似的特种在遗传学上接近。系统发生研究的结果往往以系统发生树(phylogenetic tree)表示,用它描述特种之间的进化关系。通过对生物学数据的建模提取特征,进而比较这些特征,研究生物形成或进化的历史。在分子水平上进行系统发生分析具有许多优势,所得到的结果更加科学、可靠。分子系统发生分析主要分成3个步骤:分子序列或特征数据的分析,系统发生树的构造以及结果的检验。基因组信息学分析基因组信息学分析基因组(genome)是指一个生物体、细胞器或病毒的整套基因。对于基因组序列,人们最关心的就是从序列中找到基因及其表达调控的信息。基因组学(genomics)则以基因组分析为手段,识别基因,发现与基因表达调控相关的信息,并提供有关生物物种及其细胞功能的进化信息。生物信息学中的各种信息资源和分析工具正逐渐形成一个整合系统来反映生物体的高度复杂性,基因组分析也不例外。通常,人们也将有基因组信息的储存、获取、处理、分配、分析和注释等方面的研究合称为“基因组信息学(genome informatics)”。生物芯片生物芯片生物芯片会对21世纪的生命科学和医学的发展产生巨大的影响,可以大大促进后基因组计划的各项研究。通过比较不同个体或物种之间以及同一个体在不同生长发育阶段,正常状态和疾病状态下基因转录及其表达的差异,寻找和发现新基因,研究它们在生物体发育、遗传、进化等过程中的功能。生物芯片还将在研究人类重大疾病如癌症、心血管病等恩及 其相互作用机理方面发挥重要作用。在预防医学方面,生物芯片可以使人们尽早认识自身潜在的疾病,并实施有效的防治。生物信息学展望生物信息学展望21世纪是生命科学的时代,也是信息时代。随着人类基因组计划的各项任务接近完成,有关核酸、蛋白质的序列和结构数据呈指数增长。面对巨大而复杂的数据,运用计算机技术更加有效管理数据、控制误差、加速分析过程势在必行。从而使生物信息学成为当今生命科学和自然科学的重大前沿领域之一,也是21世纪自然科学的核心领域之一。随着后基因组时代的到来,生物信息学研究的重点将逐步转移到功能基因组信息研究,其研究的内容不仅包括基因的查询和同源性分析,而且进一步发展到基因和基因组的功能分析,即所谓的功能基因组学研究。具体表现在将已知基因的序列与功能联系在一起进行研究;从以常规克隆为基础的基因分离转向以序列分析和功能分析为基础的基因分离;从单个基因致病机理的研究转向多个基因致病机理的研究;从组织与组织之间的比较来研究功能基因组和蛋白质组,这类比较主要有:正常与疾病组织之间的比较,正常与激活组织之间的比较,疾病与处理(或治疗)组织之间的比较,不同发育过程的比较等。今后网络数据库和软件算法的发展取向,一是发展集成的生物数据仓库和联邦数据库技术。目的是对分散的、异构的甚至是冗余和混乱的生物学数据库在公认的注释标准下进行整理,建立整合的、非冗余的数据库体系,建立不同生物学数据之间的关联,以利于数据挖掘。二是发展整合功能基因组数据分析软件体系。单一功能的生物信息分析软件已不再是生物信息学应用研究的主流,要发展一大类算法、数据库和分析软件有机地整合集成在一起,以完成系统的功能分析,保证大规模的功能基因组数据分析的需求。三是发展有效的生物学文献的信息管理、搜索和挖掘工具。文献发掘工具已成为新兴的生物信息学的研究方向,如何从海量文献信息中发现关联信息,高通量、高准确度地进行知识发现,为基因表达谱数据分析、基因调控网络分析和蛋白质蛋白质相互作用分析等功能组基因分析提供帮助,已成为生物信息学必须要解决的问题之一,也是生物信息学发展面临的又一挑战。生物信息学将会揭示人类及重要动植物种类的基因的信息,为生物大分子结构模拟和药物设计提供巨大的帮助。生物信息学不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质有重要意义,而且将为人类疾患的诊治开辟全新的途径,还可为动植物的物种改良提供坚实的理论基础。生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。一只小鼠的肥胖基因都值上亿美元,更何况关系人类自身生老病死的基因了。生物信息学的许多研究成果可以较快地产业化,成为价值很高的产品。生物信息学的这一特点在现有的许多学科中几乎是独一无二的,应用的领域十分广阔,具有重要的现实意义和深远的战略意义。生物信息学的发展已经超越了它最初的目标。现在可以说生物信息学的重要目标在于理解生物学数据和揭示生命本质,但是它的前景仍然是不可估量的。 可以肯定,在不远的将来,生物信息学的研究成果不仅被应用于生物、医学等相关领域,同时它将对其它学科,包括信息科学、数学、计算机科学、物理学等的研究产生巨大的影响。参考文献参考文献1 Bonguki M S. Bioinformaticsa new eraM. TIBC,1998(Trends Suppl):1-3.2蔡禄.生物信息学教程.北京:化学工业出版社,2006.12.3刘玉庆等.生物信息学及其在农业上的应用前景.山东农业科学,2001 年第 5 期:5154.4 Collins F S. New goals for the U.S. Human Genome Project: 1998-2003.5赵爱民. 生物信息技术发展态势分析J. 中国生物工程杂志,2003,23(5):101-103.6 吴旻. 基因组学,生物信息学及其对科学和社会的影响J. 世界科技研究与发展,1999,21(5).7 王正华,王勇献. 后基因组时代生物信息学的新进展J. 国防科技大学学报,2003,25(1):1-6.8 王玉梅,王艳. 国外生物信息学发展动态分析J. 科技情报开发与经济,2002,12(6):83-85.9E.Marshall.Bioinformatics:Hot Pr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论