生物信息学及其发展历史ppt课件_第1页
生物信息学及其发展历史ppt课件_第2页
生物信息学及其发展历史ppt课件_第3页
生物信息学及其发展历史ppt课件_第4页
生物信息学及其发展历史ppt课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二节第二节 生物信息学及其开展历史生物信息学及其开展历史 1、生物信息学的概念生物信息学生物信息学BioinformaticsBioinformatics这一名词的来由这一名词的来由 八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的重要意义,开场留意要为这一领域构思一个适宜的称号。起初,思索到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研讨所的关系,他运用的是“CompBio;之后,又将其更改为兼具法国风情的“bioinformatique,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics或bio/informatics。

2、但由于当时的电子邮件系统与今日不同,该称号中的-或/符号经常会引起许多系统问题,于是林博士将其去除,今天我们所看到的“bioinformatics就正式诞生了,林博士也因此博得了“生物信息学之父的佳誉。 生物信息学生物信息学HGP生物数据的激增生物数据的激增每每15个月翻一番个月翻一番生物学家生物学家数学家数学家计算机计算机科学家科学家生物信息学生物信息学bioinfomatics)的诞生的诞生 生物信息学bioinformatics)是80年代未随着人类基因组方案Human genomeproject)的启动而兴起的一门新的交叉学科。它涉及生物学、数学、计算机科学和工程学,依赖于计算机科学、

3、工程学和运用数学的根底,依赖于生物实验和衍生数据的大量储存。 概念广义概念广义生物体系和过程中信息生物体系和过程中信息的存贮、传送和表达的存贮、传送和表达细胞、组织、器官的生理、病理细胞、组织、器官的生理、病理、药理过程的中各种生物信息、药理过程的中各种生物信息信息科学信息科学生生命命科科学学中中的的信信息息科科 学学 广义的说,生物信息不仅包括基因组信息,如基因的DNA序列、染色体定位,也包括基因产蛋白质或RNA的构造和功能及各生物种间的进化关系等其他信息资源。生物信息学既涉基因组信息的获取、处置、储存、传送、分析和解释,又涉及蛋白质组信息学如蛋白质的序列、构造、功能及定位分类、蛋白质连锁图

4、、蛋白质数据库的建立、相关分析软件的开发和运用等方面,还涉及基因与蛋白质的关系如蛋白质编码基因的识别及算法研讨、蛋白质构造、功能预测等,另外,新药研制、生物进化也是生物信息学研讨的热点。 概念狭义概念狭义生物生物分子数据分子数据深层次生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics发掘获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用 由于当前生物信息学开展的主要推进力来自分子生物学,生物信息学的研讨主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学运用于生物大分子信

5、息的获取、加工、存储、分类、检索与分析,以到达了解这些生物大分子信息的生物学意义的交叉学科。 2019年,在美国人类基因组方案HGP第一个五年总结报告中给出了一个较为完好的生物信息学的定义:生信息学是包含生物信息的获取、处置、储存、分发、分析和解释的一切方面的一门学科,它综合运用数学、计算机科学和生物学的各种工具进展研讨,目的在于了解大量的生物学意义。 Bioinformatics生物分子数 据 计算机计 算 + 2、生物分子信息细胞细胞分子分子存贮、复制、传送和表达存贮、复制、传送和表达遗传信息的系统遗传信息的系统生物信息的载体生物信息的载体n生物信息学主要研讨两种信息载体nDNA分子n蛋白

6、质分子Protein Machines From the Cell to Protein Machines 生物分子至少携带着三种信息生物分子至少携带着三种信息遗传信息遗传信息与功能相关的构造信息与功能相关的构造信息进化信息进化信息(1)遗传信息的载体遗传信息的载体DNA 遗传信息的载体主要是DNA 控制生物体性状的基因是一系列DNA片段 生物体生长发育的本质就是遗传信息的传送和表达 DNA经过自我复制,在生物体的繁衍过经过自我复制,在生物体的繁衍过程中传送遗传信息程中传送遗传信息 基因经过转录和翻译,使遗传信息在生物基因经过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代个体

7、中得以表达,并使后代表现出与亲代类似的生物性状。类似的生物性状。 基因控制着蛋白质的合成基因控制着蛋白质的合成 DNARNA蛋白蛋白质质转录转录翻译翻译基因的DNA序列DNA前体RNAmRNA多肽链多肽链蛋白质序列对对应应关关系系遗遗传传密密码码(2)蛋白质的构造决议其功能蛋白质的构造决议其功能蛋白质功能取决于蛋白质的空间构造 蛋白质构造决议于蛋白质的序列这是目前根本共认的假设,蛋白质构造的信息隐含在蛋白质序列之中。(3) DNA分子和蛋白质分子分子和蛋白质分子都含有进化信息都含有进化信息n 经过比较类似的蛋白质序列,如肌红经过比较类似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复蛋白

8、和血红蛋白,可以发现由于基因复制而产生的分子进化证据。制而产生的分子进化证据。n经过比较来自于不同种属的同源蛋白质,经过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们至种属之间的系统发生关系,推测它们共同的祖先蛋白质。共同的祖先蛋白质。生生物物分分子子信信息息DNA序列数据序列数据 蛋白质序列数据蛋白质序列数据 生物分子构造数据生物分子构造数据 生物分子功能数据生物分子功能数据 最根本最根本直直观观复杂复杂生物分子数据类型生物分子数据类型 DNA核酸序列核酸序列蛋白质蛋白质氨基酸序列氨基酸序列蛋白质蛋白质构

9、造构造蛋白质蛋白质功能功能最根本的最根本的生物信息生物信息维持生命活维持生命活动的机器动的机器第一部第一部遗传密码遗传密码第二部第二部遗传密码?遗传密码?生命体系千姿生命体系千姿百态的变化百态的变化生物分子数据及其关系生物分子数据及其关系n第一部遗传密码已被破译,但对密码的转录过程还不第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数清楚,对大多数DNA非编码区域的功能还知之甚少非编码区域的功能还知之甚少n 对于第二部密码,目前那么只能用统计学的方法进展对于第二部密码,目前那么只能用统计学的方法进展分析分析n无论是第一部遗传密码,还是第二部遗传密码,都隐无论是第一部遗传密码,还是第二

10、部遗传密码,都隐藏在大量的生物分子数据之中。藏在大量的生物分子数据之中。生物分子数据是宝藏,生物分子数据是宝藏,生物信息数据库是金矿,生物信息数据库是金矿,等待我们去发掘和利用。等待我们去发掘和利用。生物分子信息的特征生物分子信息的特征n生物分子信息数据量大生物分子信息数据量大 n生物分子信息复杂生物分子信息复杂 n生物分子信息之间存在着亲密的联络生物分子信息之间存在着亲密的联络3、生物信息学的开展历史、生物信息学的开展历史生物信息学生物信息学根本思想的产生根本思想的产生 生物信息学生物信息学 的迅速开展的迅速开展二十世纪二十世纪50年代年代二十世纪二十世纪80-90年代年代n2020世纪世纪

11、5050年代,生物信息学开场孕育年代,生物信息学开场孕育n2020世纪世纪6060年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算n 生物学和计算机科学联络起来生物学和计算机科学联络起来n2020世纪世纪7070年代,生物信息学的真正开端年代,生物信息学的真正开端n2020世纪世纪7070年代到年代到8080年代初期年代初期 ,出现了一系列著,出现了一系列著n 名的序列比较方法和生物信息分析方法名的序列比较方法和生物信息分析方法 n2020世纪世纪8080年代以后,出现一批生物信息效力机年代以后,出现一批生物信息效力机n 构和生物信息数据库构和生物信息数据库n2020世纪世纪9

12、090年代后年代后 ,HGPHGP促进生物信息学的迅速促进生物信息学的迅速n 开展开展关于生物信息学开展历程中的重要大事,关于生物信息学开展历程中的重要大事,请参见下面两个网站的引见:请参见下面两个网站的引见:/Education/BLASTinfo/milestones.html、/bioinformatics/。生物信息学主要研讨内容生物信息学主要研讨内容1、 生物分子数据的搜集与管理生物分子数据的搜集与管理2、 数据库搜索及序列比较数据库搜索及序列比较 3 3、 基因组序列分析基因组序列分析 4、基因表达数据的分析与处置、基因表达数据

13、的分析与处置 5、蛋白质构造预测、蛋白质构造预测 基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质构造构造数据库数据库 DDBJEMBLGenBankSWISS-PROTPDBPIR2、 数据库搜索及序列比较数据库搜索及序列比较 n搜索同源序列在一定程度上就是经过序列比较搜索同源序列在一定程度上就是经过序列比较寻觅类似序列寻觅类似序列 n序列比较的一个根本操作就是比对序列比较的一个根本操作就是比对Alignment,即将两个序列的各个字符,即将两个序列的各个字符代表核苷酸或者氨基酸残基按照对应等同代表核苷酸或者氨基酸残基按照对应等同或者置换关系进展对比陈列,其结果是两个

14、序或者置换关系进展对比陈列,其结果是两个序列共有的陈列顺序,这是序列类似程度的一种列共有的陈列顺序,这是序列类似程度的一种定性描画定性描画n多重序列比对研讨的是多个序列的共性。序列多重序列比对研讨的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,的多重比对可用来搜索基因组序列的功能区域,也可用于研讨一组蛋白质之间的进化关系。也可用于研讨一组蛋白质之间的进化关系。 发现同源分子3、 基因组序列分析基因组序列分析 n遗传言语分析遗传言语分析天书天书 n基因组构造分析基因组构造分析n基因识别基因识别n基因功能注释基因功能注释n基因调控信息分析基因调控信息分析n基因组比较基因组比较4、

15、基因表达数据的分析与处置、基因表达数据的分析与处置n基因表达数据分析是目前生物信息学研讨的热基因表达数据分析是目前生物信息学研讨的热n 点和重点点和重点 n目前对基因表达数据的处置主要是进展聚类分目前对基因表达数据的处置主要是进展聚类分n 析,将表达方式类似的基因聚为一类,在此析,将表达方式类似的基因聚为一类,在此基基n 础上寻觅相关基因,分析基因的功能础上寻觅相关基因,分析基因的功能 n所用方法主要有:所用方法主要有:n相关分析方法相关分析方法n方式识别技术中的层次式聚类方法方式识别技术中的层次式聚类方法n人工智能中的自组织映射神经网络人工智能中的自组织映射神经网络n主元分析方法主元分析方法

16、 基因芯片基因芯片层次式聚类层次式聚类5、蛋白质构造预测、蛋白质构造预测 n蛋白质的生物功能由蛋白质的构造所决议蛋白质的生物功能由蛋白质的构造所决议 ,蛋,蛋白质构造预测成为了解蛋白质功能的重要途径白质构造预测成为了解蛋白质功能的重要途径n蛋白质构造预测分为蛋白质构造预测分为:n二级构造预测二级构造预测n空间构造预测空间构造预测 蛋白质折叠蛋白质折叠二级构造预测二级构造预测n在一定程度上二级构造的预测可以归结为方式识别问题在一定程度上二级构造的预测可以归结为方式识别问题 n在二级构造预测方面主要方法有:在二级构造预测方面主要方法有:n立体化学方法立体化学方法n图论方法图论方法n统计方法统计方法

17、n最临近决策方法最临近决策方法n基于规那么的专家系统方法基于规那么的专家系统方法n分子动力学方法分子动力学方法n人工神经网络方法人工神经网络方法 n预测准确率超越预测准确率超越70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统空间构造预测空间构造预测n在空间构造预测方面,比较胜利的实际在空间构造预测方面,比较胜利的实际方法是同源模型法方法是同源模型法 n该方法的根据是:类似序列的蛋白质倾该方法的根据是:类似序列的蛋白质倾向于折叠成类似的三维空间构造向于折叠成类似的三维空间构造 n运用同源模型方法可以完成一切蛋白质运用同源模型方法可以完成一切蛋白质10-30%的空间构造

18、预测任务的空间构造预测任务 第四节第四节 生物信息学当前的主要义务生物信息学当前的主要义务 纵观当今生物信息学界的现纵观当今生物信息学界的现状,可以发现,大部分人都状,可以发现,大部分人都把留意力集中在基因组、蛋把留意力集中在基因组、蛋白质组、蛋白质构造以及与白质组、蛋白质构造以及与之相结合的药物设计上之相结合的药物设计上 1. 基因组基因组 1.1 新基因的发现新基因的发现 经过计算分析从ESTExpressed Sequence Tags序列库中拼接出完好的新基因编码区,也就是通俗所说的“电子克隆;经过计算分析从基因组DNA序列中确定新基因编码区,经过多年的积累,曾经构成许多分析方法,如根

19、据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差别、根据高维分布的统计方法、根据神经网络方法、根据分形方法和根据密码学方法等。 1.2 非蛋白编码区生物学意义的分析非蛋白编码区生物学意义的分析 非蛋白编码区约占人类基因组的95%,其生物学意义目前尚不是很清楚,但从演化观念来看,其中必然蕴含着重要的生物学功能,由于它们并不编码蛋白,普通以为,它们的生物学功能能够表达在对基因表达的时空调控上。 对非蛋白编码区进展生物学意义分析的战略有两种,一种是基于已有的曾经为实验证明的一切功能知的DNA元件的序列特征,预测非蛋白编码区中能够含有的功能知的DNA元件,从而预测其能够的生物学功能,并

20、经过实验进展验证;另一种那么是经过数理实际直接探求非蛋白编码区的新的未知的序列特征,并从实际上预测其能够的信息含义,最后同样经过实验验证。 1.3 基因组整体功能及其调理网络的系统把握基因组整体功能及其调理网络的系统把握 把握生命的本质,仅仅掌握基因组中部分基因的表达调控是远远不够的,由于生命景象是基因组中一切功能单元相互作用共同制造出来的。基因芯片技术由于可以监测基因组在各种时延续面上的整体转录表达情况,因此成为该领域中一项非常重要和关键的实验技术,对该技术所产生的大量实验数据进展高效分析,从中获得基因组运转以及调控的整体系统的机制或者是网络机制,便成了生物信息学在该领域中首先要处理的问题。

21、 1.4 基因组演化与物种演化基因组演化与物种演化 虽然曾经在分子演化方面获得了许多重要的成就,但仅仅依托某些基因或者分子的演化景象,就想阐明物种整体的演化历史似乎不太可靠。例如,智人与黑猩猩之间有98%-99%的构造基因和蛋白质是一样的,然而表型上却具有如此宏大的差别,这就不能不使我们联想到形形色色千差万别的建筑楼群,它们的外观如此不同,但根底的部件组成却是几乎一样的,差别就在于这些根底部件的组织方式不同,这就提示我们基因组整体组织方式而不仅仅是个别基因在研讨物种演化历史中的重要作用。由于基因组是物种一切遗传信息的贮藏库,从根本上决议着物种个体的发育和生理,因此,从基因组整体构造组织和整体功

22、能调理网络方面,结合相应的生理表征景象,进展基因组整体的演化研讨,将是提示物种真实演化历史的最正确途径。 2、蛋白质组、蛋白质组 基因组对生命体的整体控制必需经过它所表达的全部蛋白质来执行,由于基因芯片技术只能反映从基因组到RNA的转录程度上的表达情况,由于从RNA到蛋白质还有许多中间环节的影响,因此仅凭基因芯片技术我们还不能最终掌握生物功能详细执行者蛋白质的整体表达情况; 因此,近几年在开展基因芯片的同时,人们也开展了一套研讨基因组一切蛋白质产物表达情况蛋白质组研讨技术,从技术上来讲包括二维凝胶电泳技术和质谱测序技术。经过二维凝胶电泳技术可以获得某一时间截面上蛋白质组的表达情况,经过质谱测序

23、技术就可以得到一切这些蛋白质的序列组成。这些都是技术实现问题,最重要的就是如何运用生物信息学实际方法去分析所得到的巨量数据,从中复原出生命运转和调控的整体系统的分子机制。 基因组和蛋白质组研讨的迅猛开展,使许多新蛋白序列涌现出来,然而要想了解它们的功能,只需氨基酸序列是远远不够的,由于蛋白质的功能是经过其三维高级构造来执行的,而且蛋白质三维构造也不一定是静态的,在行使功能的过程中其构造也会相应的有所改动。因此,得到这些新蛋白的完好、准确和动态的三维构培育成为摆在我们面前的紧迫义务。目前除了经过诸如X射线晶体构造分析、多维核磁共振NMR波谱分析和电子显微镜二维晶体三维重构电子晶体学,EC等物理方

24、法得到蛋白质三维构造之外3、蛋白质构造、蛋白质构造 另外一种广泛运用的方法就是经过计算机辅助预测的方法,目前,普通以为蛋白质的折叠类型只需数百到数千种,远远小于蛋白质所具有的自在度数目,而且蛋白质的折叠类型与其氨基酸序列具有相关性,这样就有能够直接从蛋白质的氨基酸序列经过计算机辅助方法预测出蛋白质的三维构造 4、新药设计、新药设计 近年来随着构造生物学的开展,相当数量的蛋白质以及一些核酸、多糖的三维构造获得准确测定,基于生物大分子构造知识的药物设计成为当前的热点。生物信息学的研讨不仅可提供生物大分子空间构造的信息,还能提供电子构造的信息,如能级、外表电荷分布、分子轨道相互作用等以及动力学行为的

25、信息,如生物化学反响中的能量变化、电荷转移、构象变化等。实际模拟还可研讨包括生物分子及其周围环境的复杂体系和生物分子的量子效应。 但生物信息学的义务远不止于此。在以上任务的根底上,最重要的是如何运用数理实际成果对生物体进展完好系统的数理模型描画,使得人类可以从一个更加明确的角度和一个更加易于操作的途径来认识和控制本身以及一切其他的生命体生物信息学不仅仅是一门科学学科,生物信息学不仅仅是一门科学学科, 它更是一种重要的研讨开发工具。它更是一种重要的研讨开发工具。 从科学的角度来讲,它是一门研讨生物和生从科学的角度来讲,它是一门研讨生物和生物相关系统中信息内容物和信息流向的综合系统物相关系统中信息

26、内容物和信息流向的综合系统科学,只需经过生物信息学的计算处置,我们才科学,只需经过生物信息学的计算处置,我们才干从众多分散的生物学观测数据中获得对生命运干从众多分散的生物学观测数据中获得对生命运转机制的详细和系统的了解。转机制的详细和系统的了解。 从工具的角度来讲,它是今后几乎进展一切从工具的角度来讲,它是今后几乎进展一切生物医药研讨开发所必需的舵手和动力机,生物医药研讨开发所必需的舵手和动力机,只需基于生物信息学经过对大量已有数据资料的只需基于生物信息学经过对大量已有数据资料的分析处置所提供的实际指点和分析,我们才干选分析处置所提供的实际指点和分析,我们才干选择正确的研发方向,同样,只需选择

27、正确的生物择正确的研发方向,同样,只需选择正确的生物信息学分析方法和手段,我们才干正确处置和评信息学分析方法和手段,我们才干正确处置和评价新的观测数据并得到准确的结论。价新的观测数据并得到准确的结论。生物信息学研讨意义生物信息学研讨意义生物信息学将是生物信息学将是21世纪生物学的中心世纪生物学的中心 n认识生物本质认识生物本质n了解生物分子信息的组织和构造,破译了解生物分子信息的组织和构造,破译基因组信息,阐明生物信息之间的关系基因组信息,阐明生物信息之间的关系n改动生物学的研讨方式改动生物学的研讨方式 n改动传统研讨方式,引进现代信息学方改动传统研讨方式,引进现代信息学方法法n在医学上的重要

28、意义在医学上的重要意义n为疾病的诊断和治疗提供根据为疾病的诊断和治疗提供根据n为设计新药提供根据为设计新药提供根据第五节第五节 生物信息学所用的方法和技术生物信息学所用的方法和技术 1、数学统计方法 2、动态规划方法 3、机器学习与方式识别技术 4、数据库技术及数据发掘 5、人工神经网络技术6、专家系统 7、分子模型化技术8、量子力学和分子力学计算 9、生物分子的计算机模拟10、因特网Internet技术 1、数学统计方法n生物活动经常以大量、反复的方式出现,既遭生物活动经常以大量、反复的方式出现,既遭到内在要素的制约,又遭到外界环境的随机干到内在要素的制约,又遭到外界环境的随机干扰。因此概率

29、论和数学统计是现代生物学研讨扰。因此概率论和数学统计是现代生物学研讨中一种常用的分析方法中一种常用的分析方法 n数据统计、要素分析、多元回归分析是生物学数据统计、要素分析、多元回归分析是生物学研讨必备的工具研讨必备的工具n隐马尔科夫模型隐马尔科夫模型Hidden Markov Models在序列分析方面有着重要的运用。与隐马尔科在序列分析方面有着重要的运用。与隐马尔科夫模型相关的技术是马尔科夫链夫模型相关的技术是马尔科夫链Markov Chain 2、动态规划方法n动态规划动态规划Dynamic Programming是一种处理多阶段决策过程的最优化方是一种处理多阶段决策过程的最优化方法或复杂

30、空间的优化搜索方法法或复杂空间的优化搜索方法 n动态规划处理问题的根本过程是:将一动态规划处理问题的根本过程是:将一个问题的全局解分解为部分解,逆序递个问题的全局解分解为部分解,逆序递推求出部分最优解,随着执行过程的推推求出部分最优解,随着执行过程的推进,进,“部分逐渐接近部分逐渐接近“全局,最终获全局,最终获得全局最优解得全局最优解 3、机器学习与方式识别技术n机器学习机器学习n机器学习是模拟人类的学习过程,以计算机为工机器学习是模拟人类的学习过程,以计算机为工具获取知识、积累阅历具获取知识、积累阅历 n1 1、遗传算法采用随机搜索方法,具有自顺应才、遗传算法采用随机搜索方法,具有自顺应才干

31、和便于并行计算干和便于并行计算 n2 2、神经网络的实际是基于人脑的构造,其目的、神经网络的实际是基于人脑的构造,其目的是提示一个系统是如何向环境学习的,这一种方是提示一个系统是如何向环境学习的,这一种方法被称为联接主义。法被称为联接主义。 n方式识别方式识别n方式识别是机器学习的一个主要义务。方式是对方式识别是机器学习的一个主要义务。方式是对感兴趣客体定量的或者构造的描画,而方式识别感兴趣客体定量的或者构造的描画,而方式识别就是利用计算机对客体进展鉴别,将一样或者类就是利用计算机对客体进展鉴别,将一样或者类似的客体归入同种类别中似的客体归入同种类别中n方式识别主要有两种方法方式识别主要有两种

32、方法: :n根据对象的统计特征进展识别,根据对象的统计特征进展识别,n根据对象的构造特征进展识别根据对象的构造特征进展识别 环境学习知识库执行机器学习系统的根本构造机器学习系统的根本构造 反反 馈馈4、数据库技术及数据发掘、数据库技术及数据发掘n数据库技术数据库技术 n数据仓库数据仓库 n虚拟数据库技术虚拟数据库技术Virtual DatabaseVirtual Database,简称,简称 VDBVDB n数据发掘数据发掘data miningdata mining n又称作数据库中的知识发现又称作数据库中的知识发现 (Knowledge (Knowledge Discovery in Da

33、tabase)Discovery in Database),它是从数据库或数,它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进展归纳新技术,它能自动分析数据,对它们进展归纳性推理和联想,寻觅数据间内在的某些关联,性推理和联想,寻觅数据间内在的某些关联,从中开掘出潜在的、对信息预测和决策行为起从中开掘出潜在的、对信息预测和决策行为起着非常重要作用的方式着非常重要作用的方式 n数据发掘过程普通分为数据发掘过程普通分为4 4个根本步骤:数据选择、个根本步骤:数据选择、数据转换、数据发掘和结果分析数据转换、数据发掘和结果

34、分析 5、人工神经网络技术、人工神经网络技术n人工神经网络人工神经网络Artificial Neural Network, 简称简称ANN是经过模拟神经元的特性以及脑的是经过模拟神经元的特性以及脑的大规模并行构造、信息的分布式和并行处置等大规模并行构造、信息的分布式和并行处置等机制建立的一种数学模型机制建立的一种数学模型 n在生物信息学中,运用得最多的是反向传播神在生物信息学中,运用得最多的是反向传播神经网络经网络Back Propagation Neural Network,简称,简称BP网。网。BP网被以为是稳定网被以为是稳定性和鲁棒性较强的人工神经网络之一,而且属性和鲁棒性较强的人工神经

35、网络之一,而且属于有监视学习的网络模型。规范的于有监视学习的网络模型。规范的BP网由三网由三层神经元组成:输入层、隐藏层和输出层层神经元组成:输入层、隐藏层和输出层 输入层隐藏层输出层使用界面解释机构推理机知识获取知识库数据库7、分子模型化技术、分子模型化技术n分子模型化分子模型化Molecular modeling是利用是利用计算机模拟分子构造、研讨分子之间相互作用计算机模拟分子构造、研讨分子之间相互作用的一种技术的一种技术n分子模型化是进展分子设计的根底。分子图形分子模型化是进展分子设计的根底。分子图形学学Molecular Graphics是进展分子模型是进展分子模型化的一项重要技术,正

36、是由于分子图形学和其化的一项重要技术,正是由于分子图形学和其它计算化学方法如分子力学、分子动力学它计算化学方法如分子力学、分子动力学的相互结合,才使得分子模型化方法获得胜利的相互结合,才使得分子模型化方法获得胜利8、量子力学和分子力学计算、量子力学和分子力学计算 n量子力学主要研讨原子、分子、凝聚态物质、量子力学主要研讨原子、分子、凝聚态物质、以及原子核和根本粒子的构造、性质的根底实以及原子核和根本粒子的构造、性质的根底实际,在化学等有关学科中得到了广泛的运用际,在化学等有关学科中得到了广泛的运用 n分子力学分子力学Molecular Mechanics方法是一方法是一种非量子力学的计算分子构

37、造、能量与性质的种非量子力学的计算分子构造、能量与性质的方法,该方法运用阅历势能函数,即阅历力场方法,该方法运用阅历势能函数,即阅历力场方法模拟分子的构造,计算分子的性质方法模拟分子的构造,计算分子的性质 n在进展分子构造分析、构象优化、分子间相互在进展分子构造分析、构象优化、分子间相互作用研讨及分子模拟时需求运用量子力学或分作用研讨及分子模拟时需求运用量子力学或分子力学子力学 9、生物分子的计算机模拟、生物分子的计算机模拟 n所谓生物分子的计算机模拟就是从分子或所谓生物分子的计算机模拟就是从分子或者原子程度上的相互作用出发,建立分子者原子程度上的相互作用出发,建立分子体系的数学模型,利用计算

38、机进展模拟实体系的数学模型,利用计算机进展模拟实验,预测生物分子的构造和功能,预测动验,预测生物分子的构造和功能,预测动力学及热力学等方面的性质力学及热力学等方面的性质n分子动力学和蒙特卡罗方法分子动力学和蒙特卡罗方法Monte Carlo method是两种最常用的技术,是两种最常用的技术,另一种模拟方法是模拟退火方法另一种模拟方法是模拟退火方法 反响,改良模型实验实验景象数学模型计算机模拟模拟结果分析新的想象10、因特网、因特网Internet技术技术nInternet曾经成为生物学研讨的平台,同曾经成为生物学研讨的平台,同时也成为分子生物学研讨人员进展信息交时也成为分子生物学研讨人员进展

39、信息交流特别是生物分子数据的交流的场所流特别是生物分子数据的交流的场所n经过网络查询或搜索所需求的生物信息,经过网络查询或搜索所需求的生物信息,运用分析工具运用分析工具 n将所要处置的数据直接送到相应的网络效将所要处置的数据直接送到相应的网络效力器上,效力器接受他的处置恳求,并将力器上,效力器接受他的处置恳求,并将处置结果前往处置结果前往 SkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w

40、)z1C4F7JaMdPhSkWnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%

41、u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjUmVmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOg

42、SjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D

43、5H8KbNfQiUlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaMdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&am

44、p;w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQh

45、TkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5G8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F

46、6I9LdOgSjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbNeQhTlWoZr%u(y+B2E6H9KcOfRjUmXp!s&v)z0C4F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmYp!s&w)z0C4F7JaMdPhSkVnZq$u*

47、x-A2D5G8KbKbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3F6I9LdOgRjVmYq!t&w-z1C4G7JbMePhTkWnZr$u(x+A2E5H8KcNfRiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbMeQhTkWoZr$u(x+B2E5H9KcNfRiUmXp#s&v)y0C3F7IaLdPgSjVnYq$t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp

48、!s&v)z0C3F7IaMdPgSkVnYq$t*x-A1D5G8JbNeQiTlWo#r%u(y+B3E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlXo#r%v(y+B3E6I9LcOgRjUmYp!t&w)z1C1C4F7JaMePhSkWnZq$u*x+A2D5H8KbNfQiUlXo#s%v(y0B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2E5H8KcNfQiUlXp#s%v)y0B3F6IaLdOgSjVmYq!t*w-z1D4G7JbM

49、eQhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdPgSjVnYq!t*w-A1D4G8JbMeQhTlWoZr%u(x+B2E6H9KcOfRiUmXp!s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9LcOfRjUmXp!s&w)z0C4F7IaMdPhSkVnZq$t*x-A2D5G8KbNeQiTlWo#r%v(y+B3E6H6I9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#s%v(y0

50、B3E6I9LdOgRjVmYp!t&w-z1C4G7JaMePhTkWnZr$u*x+A2D5H8KcNfQiUlXo#s%v)y0B3F6I9LdOgSjVmYq!t&w-z1D4G7JbMePhTkWoZr$u(x+A2E5H9KcNfRiUlXp#s&v)y0C3F6IaLdOgSjVnYq!t*w-z1D4G8JbMeQhTkWoZr%u(x+B2E5H9KcOfRiUmXp#s&v)z0C3F7IaLdPgSkVnYq$t*w-A1D5G8JbNeQhTlWo#r%u(y+B2E6H9KcOfRjUjUmXp!s&v)z0C4F7IaMdPgSkVnZq$t*x-A1D5G8KbNeQiTlWo#r%v(y+B3E6H9LcOgRjUmYp!s&w)z1C4F7JaMdPhSkWnZq$u*x-A2D5H8KbNfQiTlXo#r%v(y0B3E6I9LcOgRjVmYp!t&w)z1C4G7JaMePhSkWnZr$u*x+A2D5H8KcNf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论