-生物信息学绪论_第1页
-生物信息学绪论_第2页
-生物信息学绪论_第3页
-生物信息学绪论_第4页
-生物信息学绪论_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

—生物信息学绪论第1页/共106页内容一、生物信息学定义二、生物信息学的发展历史三、生物信息学的主要研究内容四、生物信息学的研究意义五、生物信息学所用的方法和技术六、生物信息学学习方法七、研究生物信息学的一般步骤八、生物信息学的展望第2页/共106页3一、生物信息学定义第3页/共106页4生物信息学(Bioinformatics)名词的由来

八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics(bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的-或/符号经常会引起许多系统问题,于是林博士将其去除,今天我们所看到的“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。第4页/共106页5生物信息学之父——林华安

Dr.HwaA.Lim(林华安)1987年提出“Bio-informatique”→“Bioinformatics”1955年出生于马来西亚。联合国Bioinformatics专家,UniversityofTexasatDallas分子与细胞生物学AdjunctProfessor、中国科学院基因遗传研究所客座教授。1981年英国伦敦大学帝国学院(ImperialCollege,LondonUniversity)毕业,1986年获得美国RochesterUniversity生化物理学博士学位,30岁取得佛罗里达州立大学终生教授。1992年受聘担任美国国家癌症中心及美国国家科学基金会审核委员。1995年后,历任多家生物科技公司生化信息执行长、副总裁等高层管理职位。1997年,创立结合软件与数据分析的专业顾问公司D’Trends,服务生物技术、制药及卫生保健等机构。第5页/共106页什么是生物信息学

?第6页/共106页7背景人类基因组计划(HumanGenomeProject,HGP):1990年正式启动,旨在完成人类基因组约30亿个碱基的全序列测定。海量生物数据的迅速膨胀:DNA、RNA和蛋白质序列,蛋白质二级结构和三维结构数据,蛋白质相互作用数据等。对大量生物数据的管理、分析和信息化需求促进了生物信息学的迅速发展。第7页/共106页8生命信息的组织、传递、表达物理化学分子生物学遗传学信息技术各学科参与、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学……生物信息学诞生第8页/共106页9生物信息学定义的历史演变定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(Bioinformaticsisanewsubjectofgeneticdatacollection,analysisanddisseminationtotheresearchcommunity)。(Dr.HwaA.Lim,1987)定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(Bioinformaticsreferstodatabase-likeactivities,involvingpersistentsetsofdatathataremaintainedinaconsistentstateoveressentiallyindefiniteperiodsoftime)。(Dr.HwaA.Lim,1994)定义三:生物信息学是在大分子方面的概念型的生物学,并且使用了信息学的技术,这包括了从应用数学、计算机科学以及统计学等学科衍生而来各种方法,并以此在大尺度上来理解和组织与生物大分子相关的信息。

(Luscombe,2001)第9页/共106页生物信息学说文解字:生物

+信息

+学

(bioinformatics)biology+information+theory广义:

应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:

应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。

第10页/共106页11“生物信息学和计算生物学”计划

NIH于2003年形成了一个通向生命科学未来的“中长期发展规划”--国立卫生研究院路线图(NIH

Roadmap)。NIH路线图中启动了一个“生物信息学和计算生物学”计划,希望通过这个项目的实施而铺设一条通向生命科学未来的“信息高速公路”。该项目计划从2004年开始,建立数个“国立生物医学计算中心”,以便开发相关软件和数据管理工具。第11页/共106页12计算生物学计算生物学(ComputationalBiology)是生物学的一个分支。根据美国国家卫生研究所(NIH)的定义,它是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等,用于生物学、行为学和社会群体系统的研究的一门学科。第12页/共106页13生物信息学与计算生物学区别与联系

有些人将计算生物学作为生物信息学的同义词处理;但是另外一些人认为计算生物学和生物信息学应当被作为不同的条目处理。生物信息学主要侧重于对生物学中所得信息的采集、存贮、分析处理与可视化方面,而计算生物学主要侧重于使用计算技术对生物学问题进行研究方面。第13页/共106页14生物信息学基本思想的产生生物信息学的迅速发展二十世纪50年代二十世纪80-90年代生物科学和技术的发展人类基因组计划的推动二、生物信息学的发展历史第14页/共106页15(一)前基因组时代的生物信息学属于生物物理学范畴的传统生物信息学可以追溯到很久以前,如研究生物发光、生物电、生物磁和激素等信息物质的传递现象及其相应测定技术。以研究序列比对为标志的现代生物信息学则起源于20世纪70~80年代。这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生物学数据库的建立以及检索工具的开发。例如Dayhoff的替换矩阵、Neelleman和Wunsch的序列比对(sequencealignment)及GenBank(由美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,形成了生物信息学的雏形。第15页/共106页1620世纪50年代,生物信息学开始孕育20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来20世纪70年代,生物信息学的真正开端(序列比对算法)20世纪80年代初期,生物信息分析方法的发展20世纪80年代以后,生物信息服务机构和数据库20世纪90年代后,HGP促进生物信息学的迅速发展生物信息学的孕育和初步形成第16页/共106页171956:美国田纳西州首次召开了“生物学中的理论研讨会”;1962:Zucherkandl和Pauling研究了序列变化与进化的关系,开创了一个新的领域——分子进化;1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白质信息源PIR;1970:Needleman和Wunsch提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;1970:Gibbs和McIntyre发表著名的矩阵打点做图法;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;1981:Smith和Waterman提出了著名的公共子序列识别算法,同年Doolittle提出了关于序列模式的概念;第17页/共106页181982:GenBank第3版本正式发行;1983:Wilbur和Lipman发表了数据库相似序列搜索算法;1986:日本核酸序列数据库DDBJ诞生;1986:蛋白质数据库SWISS-PROT诞生;1988:美国国家生物技术信息中心NCBI诞生;1988:成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生;1988:Person和Lipman发表了著名的序列比较算法FASTA;1990:快速相似性序列搜索算法BLAST问世,1987年BLAST的改进版本PSI-BLAST投入使用第18页/共106页19(二)基因组时代的生物信息学以基因组计划的实施为标志的基因组时代(1990年至2001年)是生物信息学成为一个较完整的新兴学科并得到高速发展的时期。这一时期生物信息学确立了自身的研究领域和学科特征,成为生命科学的热点学科和重要前沿领域之一。

这一阶段的主要成就包括大分子序列以及表达序列标签(expressedsequencetag,EST)数据库的高速发展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具软件的研制和相应新算法的提出、基因的寻找与识别、电子克隆(insilicocloning)技术等,大大提高了管理和利用海量数据的能力。第19页/共106页人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘

由美国NIH和能源部提出和带头,美、英、德、法、日、中共同参与的国际合作项目。重大国际研究项目:测定人类基因组全部DNA序列,构建人类基因组遗传图谱和物理图谱。

1990年:正式启动,30亿美元。

2001年:人类基因组草图公开发表。

2003年:美国宣布该项目完成。第20页/共106页HGP的历史回顾1984.12犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列的意义1985Dulbecco在《Science》撰文“肿瘤研究的转折点:人类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元1989美国成立“国家人类基因组研究中心”,Watson担任第一任主任1990.10经美国国会批准,人类基因组计划正式启动第21页/共106页

第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成1996完成人类基因组计划的遗传作图启动模式生物基因组计划H.inf全基因组Saccharomycescerevisiae酿酒酵母Caenorhabditiselegans秀丽线虫第22页/共106页1997大肠杆菌(E.coli)全基因组测序完成1998完成人类基因组计划的物理作图开始人类基因组的大规模测序

Celera公司加入,与公共领域竞争启动水稻基因组计划1999.7第5届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组水稻基因组计划第23页/共106页1999.7第5届国际公共领域人类基因组测序会议,加快测序速度2000Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作Drosophilamelanogaster果蝇Arabidopsisthaliana拟南芥第24页/共106页2001年2月15日《Nature》封面2001年2月16日《Science》封面2000.6.26公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15《Nature》刊文发表国际公共领域结果2001.2.16《Science》刊文发表Celera公司及其合作者结果第25页/共106页26第26页/共106页我国对人类基因组计划的贡献第27页/共106页28

人类基因组计划准备用15年时间投入30亿美元,完成人全部24(22+X+Y)条染色体中3.2×109个碱基对的序列测定,主要任务包括做图(遗传图谱\物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。第28页/共106页29人类基因组人类基因组的组成线粒体基因组(16.6kb)细胞核基因组(3200Mb)基因外序列基因和基因有关序列约10%约90%专一或中等重复序列Non-codingDNA假基因内含子基因片段<10%>90%专一的或低拷贝数序列中度至高度重复序列20~30%70~80%分散重复序列串联重复序列/成簇重复序列约60%约40%蛋白编码基因rRNA基因tRNA基因CodingDNA估计10万→最初公布3.5万→目前研究确定2.45万第29页/共106页30笼统的说,人类基因组计划为我们研究生物信息的组织、结构、遗传、表达带来了极大的方便,使人类对自身有一个根本的了解。人类是最高级、最复杂、最重要的生物,如果搞清楚人类基因组,那么再研究其它的生物就容易得多。研究多种模式生物基因组将有助于研究地球生物的进化史。人类基因组计划的实施意义

引言第30页/共106页HGP带来的科学挑战随着实验数据和可利用信息急剧增加,信息的管理和分析成为HGP的一项重要的工作发现生物学规律解读生物遗传密码认识生命的本质研究基因组数据之间的关系分析现有的基因组数据利用数学模型和计算技术第31页/共106页32基因组计划带来的科学挑战随着实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作。1、信息的整合2、信息的储存3、信息的比较4、信息的分析5、信息的分解基因组学功能基因组学第32页/共106页33第33页/共106页34生物信息学的研究结构基因组学时期第34页/共106页35基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROT

PDBPIR1生物分子数据的收集与管理第35页/共106页362数据库搜索及序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。

第36页/共106页373运用计算机软件进行序列拼接第37页/共106页384基因识别与定位第38页/共106页395基因相关的SNP研究SingleNucleotidePolymorphisms(SNP),是指在基因组上单个核苷酸的变异,一般而言,SNP

是指变异频率大于1%的单核苷酸变异第39页/共106页4040基因变异与疾病第40页/共106页41与以前的该RILs的重组图谱比较分析,在150个RILs中鉴定出2334个重组框,平均每个框的大小约164kb利用slidingwindow方法分析SNP位点与表型间的关系与重组位点利用全基因组重测序分析表型差异Slidingwindow方法第41页/共106页426非编码区信息结构分析在微生物中,非编码区只占整个基因组序列的10%~20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%第42页/共106页43

非蛋白编码区约占人类基因组的95%,其生物学意义目前尚不是很清楚,但从演化观点来看,其中必然蕴含着重要的生物学功能,由于它们并不编码蛋白,一般认为,它们的生物学功能可能体现在对基因表达的时空调控上。

对非蛋白编码区进行生物学意义分析的策略有两种,一种是基于已有的已经为实验证实的所有功能已知的DNA元件的序列特征,预测非蛋白编码区中可能含有的功能已知的DNA元件,从而预测其可能的生物学功能,并通过实验进行验证;另一种则是通过数理理论直接探索非蛋白编码区的新的未知的序列特征,并从理论上预测其可能的信息含义,最后同样通过实验验证。第43页/共106页446比较基因组学比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。第44页/共106页45比较基因组分析各类功能基因中氨基酸在物种间差异比例差异同源蛋白GO分类进化关系分析第45页/共106页467基因组演化与物种演化

(生命之树)第46页/共106页47生物进化谱系树大鼠、小鼠、狗、大熊猫、牛……家鸡、火鸡……斑马鱼……拟南芥、水稻、杨树、酿酒葡萄、短柄草、黄瓜、高粱、玉米……1535个细菌基因组、49个真菌基因组和78个古细菌……

利什曼原虫、椎体虫……四类蓝藻……隐藻……蜜蜂……第47页/共106页48

尽管已经在分子演化方面取得了许多重要的成就,但仅仅依靠某些基因或者分子的演化现象,就想阐明物种整体的演化历史似乎不太可靠。例如,智人与黑猩猩之间有98%-99%的结构基因和蛋白质是相同的,然而表型上却具有如此巨大的差异,这就不能不使我们联想到形形色色千差万别的建筑楼群,它们的外观如此不同,但基础的部件组成却是几乎一样的,差别就在于这些基础部件的组织方式不同,这就提示我们基因组整体组织方式而不仅仅是个别基因在研究物种演化历史中的重要作用。由于基因组是物种所有遗传信息的储藏库,从根本上决定着物种个体的发育和生理,因此,从基因组整体结构组织和整体功能调节网络方面,结合相应的生理表征现象,进行基因组整体的演化研究,将是揭示物种真实演化历史的最佳途径。第48页/共106页498基因表达数据的分析与处理基因表达数据分析是目前生物信息学研究的热点和重点目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能所用方法主要有:相关分析方法、模式识别技术中的层次式聚类方法、人工智能中的自组织映射神经网络、主元分析方法等表达数据缺点:仅反映mRNA丰度,噪声,…第49页/共106页50蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法9蛋白质结构及功能预测第50页/共106页51

基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来,然而要想了解它们的功能,只有氨基酸序列是远远不够的,因为蛋白质的功能是通过其三维高级结构来执行的,而且蛋白质三维结构也不一定是静态的,在行使功能的过程中其结构也会相应的有所改变。因此,得到这些新蛋白的完整、精确和动态的三维结构就成为摆在我们面前的紧迫任务。目前除了通过诸如X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法得到蛋白质三维结构蛋白质结构第51页/共106页52

另外一种广泛使用的方法就是通过计算机辅助预测的方法,目前,一般认为蛋白质的折叠类型只有数百到数千种,远远小于蛋白质所具有的自由度数目,而且蛋白质的折叠类型与其氨基酸序列具有相关性,这样就有可能直接从蛋白质的氨基酸序列通过计算机辅助方法预测出蛋白质的三维结构第52页/共106页53

基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行,由于基因芯片技术只能反映从基因组到RNA的转录水平上的表达情况,由于从RNA到蛋白质还有许多中间环节的影响,因此仅凭基因芯片技术我们还不能最终掌握生物功能具体执行者——蛋白质的整体表达状况;近几年在发展基因芯片的同时,人们也发展了一套研究基因组所有蛋白质产物表达情况——蛋白质组研究技术,从技术上来讲包括二维凝胶电泳技术和质谱测序技术。通过二维凝胶电泳技术可以获得某一时间截面上蛋白质组的表达情况,通过质谱测序技术就可以得到所有这些蛋白质的序列组成。这些都是技术实现问题,最重要的就是如何运用生物信息学理论方法去分析所得到的巨量数据,从中还原出生命运转和调控的整体系统的分子机制。10蛋白质组研究

第53页/共106页54蛋白质组研究第54页/共106页551)、诊断类药物:生物芯片设计遗传病:基因诊断感染性疾病:抗体、基因芯片、PCR技术11药物设计:第55页/共106页56病人/健康人基因芯片诊断及早治疗,对症下药第56页/共106页572)、预防类药物:计算机辅助疫苗设计计算机预测抗原表位第57页/共106页58

所谓基因组药物(Genomicdrug)是指利用基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物.实际上利用了反向生物学的原理.沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。3)、开发基因组药物第58页/共106页59美国的人类基因组科学公司(HGS公司)。根据其1999年2月公布的消息,在功能基因组研究领域,HGS公司己发现95%的人类cDNA;克隆了9000个人类分泌蛋白质的全长cDNA;发现了3000个基因的可能医学应用;发现了35个新的白细胞介素类分子和40个新的生长因子类分子;已有3个基因组药物进入临床。第59页/共106页604)、寻找药物作用新靶点基因组比较:抗微生物同源性搜索表达差异分析第60页/共106页61

理想的抗生素靶标应为微生物细胞存活所必须,在病原体中高度保守,且在人体中不存在或与人类基因有根本差异。基因组研究促进了新靶标的发现:第61页/共106页62

生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程.通过数据分析首先确立靶标分子预测蛋白质分子结构设计药物分子与靶标分子相互作用第62页/共106页63计算机辅助分子建模,分子三维结构可视化。

1982年,Dock程序已成功的有HIV蛋白酶抑制剂、二氢叶酸还原酶抑制剂等5)、计算机辅助药物设计第63页/共106页64开发阶段:药物基因组学

减少药物副作用避免开发风险第64页/共106页65第65页/共106页66第66页/共106页67(三)后基因组时代的生物信息学随着人类基因组计划的顺利进行,人类全基因组测序工作已经完成。测序工作的完成并不代表基因组计划的结束,相反标志着“后基因组信息学”的开始。基因组学研究也由结构基因组转向了功能基因组的研究,通过对基因组的分析来了解生物体的功能成为后基因组时代的主要目标。后基因组时代,生物综合论将成为生物学的主流研究方法。人们在网络观点下、在分子相互作用网络水平理解生物学的基本原理。后基因组生物信息学有时也称为功能基因组系统学。功能基因组系统学的出现,是生物信息学领域的一个重大变化,它由主要以整理、储存、分析生物学数据或知识转变为综合多种生物分子及其相互作用的知识来了解生物系统的功能。第67页/共106页68后基因组研究对象的多层次性后基因组研究对象是多层次的,人们从包括基因组(Genome)、转录组(Transcriptome)、蛋白质组(Proteome)、相互作用组(Interactome)、定位组(Localizome)、折叠子组(foldome)、代谢组(Metabolome)、表型组(Phenome)等方面,从组的角度研究各类生物学过程。如果说基因组问题涉及遗传图谱(Geneticmap)、限制性图谱(Restrictionmap)和物理图谱(Physicalmap),那么其它的组学涉及功能图谱(Functionalmaps)。第68页/共106页69但现在更加合理的看法是基因组只是细胞中分子之间相互作用的整个网络的一部分。基因组只是细胞指令的大仓库,相互作用网络本身才是那个所谓的指令系统,这个系统遵循固有程序引导发育过程,并产生生殖细胞。后基因组生物信息学是以对一系列生物学知识的综合为特征的,是在网络观点下、在分子网络层次上研究和理解生命的基本规律。第69页/共106页70功能基因组学发展趋势功能基因组学发展的一个最新和重要领域是系统生物学(SystemsBiology),系统生物学研究问题有如下三个特点:1、更好整合生物过程不同阶段的分散数据如整合基因组、转录组、蛋白质组和代谢组的数据,得到对生物学过程的总体认识。另外一个方面是为了满足整合数据库的复杂查询。2、对复杂生物过程的更好模拟包括蛋白质折叠和复杂系统建模(如信号/代谢通路和发病机理)3、生物过程动态研究从一个通路的成分到一个通路的动力学第70页/共106页71功能基因组系统学正如前面所述,在相互作用网络背景下阐释“功能”是功能基因组系统学的一个主要特点。另外一个特点是复杂系统的思想,把生物体看作一个复杂系统进行研究。主要有三个特征:1多层次数据整合整合包括基因组、蛋白质组、转录、表达和调控路径等方面数据2系统的复杂性特点具有复杂系统的自组织、自调控和突变等特点3信息学分析采用信息学方法对多种数据进行分析是功能基因组系统学的又一特点第71页/共106页72

传统生物学关注的是一个一个的通路,而后基因组生物信息学则希望研究各个通路之间的相互作用,构成一个复杂的相互作用网络,从而从更高的层面上理解生命过程。通俗地说:传统生物学看到的是树木,后基因组生物信息学则看到的是森林。第72页/共106页73

图中显示了基于信息学方法、整合多层次数据在网络层面研究细胞内复杂生物过程的基本思想。基于知识的网络预测第73页/共106页74一切从基因组开始…

—“基因组到生命”(Genomes

to

Life,GTL)计划

第74页/共106页75第75页/共106页76高通量测序在组学中的应用从头测序基因组重测序转录组测序SmallRNA测序Listeretal.CurrentOpinioninPlantBiology(2009)12:107第76页/共106页77第77页/共106页78第78页/共106页79第79页/共106页80分子生物网络的分类分子生物网络的分类标准基于分子生物学的分类标准。分子生物网络分类基因调控网络信号转导网络表观遗传调控网络疾病基因网络代谢网络蛋白质互作网络第80页/共106页811.信号传导网络cAMP与蛋白激酶对细胞活性的影响第81页/共106页822.基因调控网络第82页/共106页833.蛋白质互作网络人类蛋白质互作网络第83页/共106页844.代谢网络第84页/共106页85第85页/共106页865.疾病基因网络第86页/共106页876.表观遗传调控网络第87页/共106页88第88页/共106页89第89页/共106页90第90页/共106页91三、生物信息学的主要研究内容生物信息的存储与查询;序列比对;基因预测及基因组分析;比较基因组与系统发育分析;RNA结构预测;蛋白质结构预测;分子设计与药物设计;生物网络;生物芯片。第91页/共106页生物信息学系统化概图第92页/共106页四、生物信息学的研究意义生物信息学将是21世纪生物学的核心

认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系改变生物学的研究方式改变传统研究方式,引进现代信息学方法在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据第93页/共106页五、生物信息学所用的方法和技术

1、数学统计方法(高维、样本量的问题)2、动态规划方法3、机器学习与模式识别技术(从数据中学习)4、数据库技术及数据挖掘5、人工神经网络技术6、专家系统7、分子模型化技术8、量子力学和分子力学计算9、生物分子的计算机模拟10、因特网(Internet)技术(Grid计算)

。。。第94页/共106页95生物信息学的相关杂志第95页/共106页96六、生物信息学学习方法(一)采用多学科交叉的方法来学习

例如,一个生物信息学问题的解决,可能需要在实验生物学充分的实验证据基础之上进行计算生物学的算法与理论推导,加上高效的编程和简明的界面设计才能最终完成。生物学,计算机科学和数学等多个相关学科。第96页/共106页97(二)以网络作为平台和工具进行学习

例如,大量的序列数据保存在网络的生物信息学服务器中,生物信息数据的提交、发布、提取、查询相关、比对和其他计算等都需要通过网络实现,也可以通过网络共享数据乃至进行生物信息学方面的并行计算,大量生物信息学工具软件、教学课件、参考资料、论坛和新闻组等资源都是存在于网络之中,因此,必须熟练掌握以网络作为平台和工具的方法学习生物信息学。第97页/共106页98(三)在理论和实践的高度互动中学习

例如蛋白质和核酸序列等生物信息学的研究对象来自于试验研究,而算法则属于理论研究,所以生物信息学属于一门理论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论