版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学概述演示文稿当前第1页\共有57页\编于星期四\19点(优选)生物信息学概述当前第2页\共有57页\编于星期四\19点生物分子信息生物分子至少携带着三种信息遗传信息与功能相关的结构信息进化信息生物分子信息的特征生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系当前第3页\共有57页\编于星期四\19点遗传信息的载体——DNA
遗传信息的载体主要是DNA
控制生物体性状的基因是一系列DNA片段生物体生长发育的本质就是遗传信息的传递和表达DNA通过自我复制,在生物体的繁衍过程中传递遗传信息基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状2023/6/44蛋白质RNA转录DNA翻译当前第4页\共有57页\编于星期四\19点DNA前体RNAmRNA多肽链2023/6/4当前第5页\共有57页\编于星期四\19点生命机器的执行者--蛋白质蛋白质功能取决于蛋白质的空间结构
蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。2023/6/4当前第6页\共有57页\编于星期四\19点DNA分子和蛋白质分子都含有进化信息通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。2023/6/47当前第7页\共有57页\编于星期四\19点生物分子信息DNA序列数据
蛋白质序列数据
生物分子结构数据
生物分子功能数据
最基本直观复杂生物信息数据类型2023/6/4当前第8页\共有57页\编于星期四\19点
DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功能最基本的生物信息维持生命活动的机器第一部遗传密码第二部遗传密码?生命体系千姿百态的变化生物分子数据及其关系2023/6/49当前第9页\共有57页\编于星期四\19点第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少对于第二部密码,目前则只能用统计学的方法进行分析。破译“第二遗传密码”:即折叠密码(foldingcode),从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用2023/6/4当前第10页\共有57页\编于星期四\19点Bioinformatics,生物
+信息
+学--新兴的交叉学科ComputersciencesMathematicalsciencesLifesciences二、生物信息学的概念当前第11页\共有57页\编于星期四\19点定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(1987)定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(1994)定义三:采用信息科学技术,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。收集、加工、储存:计算机科学家分析、解释:生物学家当前第12页\共有57页\编于星期四\19点三、生物信息学发展简史(一)前基因组时代的生物信息学
起源于20世纪70-80年代。这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生物学数据库的建立以及检索工具的开发。例如Dayhoff的替换矩阵、Neelleman和Wunsch的序列比对及GenBank(由美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,形成了生物信息学的雏形。当前第13页\共有57页\编于星期四\19点1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白质信息源PIR;1970:Needleman和Wunsch提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;1981:Doolittle提出了关于序列模式的概念;1986:日本核酸序列数据库DDBJ诞生;1986:蛋白质数据库SWISS-PROT诞生;1988:美国国家生物技术信息中心NCBI诞生;1988:成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生当前第14页\共有57页\编于星期四\19点(二)基因组时代的生物信息学以基因组计划的实施为标志的基因组时代(1990年至2001年)是生物信息学成为一个较完整的新兴学科并得到高速发展的时期。这一时期生物信息学确立了自身的研究领域和学科特征,成为生命科学的热点学科和重要前沿领域之一。这一阶段的主要成就包括大分子序列以及表达序列标签(expressedsequencetag,EST)数据库的高速发展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具软件的研制和相应新算法的提出、基因的寻找与识别、电子克隆(insilicocloning)技术等,大大提高了管理和利用海量数据的能力。当前第15页\共有57页\编于星期四\19点人类基因组计划开始(HumanGenomeProject,HGP)人类基因组计划带来了
生物信息学20世纪90年代当前第16页\共有57页\编于星期四\19点人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘由美国NIH和能源部提出和带头,美、英、德、法、日、中共同参与的国际合作项目。完成人全部24(22+X+Y)条染色体中3.2×109个碱基对的序列测定,主要任务包括做图(遗传图谱、物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。当前第17页\共有57页\编于星期四\19点18基因组(Genome):包含细胞或生物体全套的遗传信息的全部遗传物质
包括:细胞核基因组DNA细胞质(线粒体、叶绿体)基因组DNA
人类基因组:3.2×109bp当前第18页\共有57页\编于星期四\19点当前第19页\共有57页\编于星期四\19点曼哈顿原子弹计划阿波罗登月计划人类基因组计划人类自然科学史上的3大计划当前第20页\共有57页\编于星期四\19点21AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.当前第21页\共有57页\编于星期四\19点222001年2月15日《Nature》封面2001年2月16日《Science》封面当前第22页\共有57页\编于星期四\19点我国对人类基因组计划的贡献当前第23页\共有57页\编于星期四\19点24当前第24页\共有57页\编于星期四\19点当前第25页\共有57页\编于星期四\19点humanArabidopsis拟南芥ThermotogamaritimaEscherichiacoli大肠杆菌Buchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis当前第26页\共有57页\编于星期四\19点当前第27页\共有57页\编于星期四\19点数据库中的蛋白质序列Swiss-prot:≈550,000条蛋白质序列当前第28页\共有57页\编于星期四\19点29结构与功能信号网络代谢途径细胞重建系统重建基因组基因(三)后基因组时代的生物信息学当前第29页\共有57页\编于星期四\19点四、生物信息学的研究领域基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计当前第30页\共有57页\编于星期四\19点大规模核酸测序及拼接基因识别与定位基因相关的SNP研究非编码区信息结构分析比较基因组学
(一)核酸及基因组信息当前第31页\共有57页\编于星期四\19点大规模基因组测序当前第32页\共有57页\编于星期四\19点33当前第33页\共有57页\编于星期四\19点运用计算机软件进行序列拼接当前第34页\共有57页\编于星期四\19点基因识别与定位
当前第35页\共有57页\编于星期四\19点基因相关的SNP研究:
单核苷酸多态性(SingleNucleotidePolymorphisms,SNP):主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。当前第36页\共有57页\编于星期四\19点37SNP的研究意义寻找疾病相关的突变位点法医学研究器官移植中供体/受体配对分析
当前第37页\共有57页\编于星期四\19点
全基因组关联分析(Genome-wideassociationstudy,GWAS):是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs
当前第38页\共有57页\编于星期四\19点非编码区信息结构分析:基因表达调控分析在微生物中,非编码区只占整个基因组序列的10%-20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%。非编码区有调控作用的核苷酸序列,包括位于编码区上游的RNA聚合酶结合位点。当前第39页\共有57页\编于星期四\19点比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科当前第40页\共有57页\编于星期四\19点(二)蛋白质及蛋白质组信息蛋白质结构预测蛋白质功能预测基因表达及蛋白质组信息学当前第41页\共有57页\编于星期四\19点蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白质结构及功能预测当前第42页\共有57页\编于星期四\19点当前第43页\共有57页\编于星期四\19点蛋白质组研究
蛋白质组(proteome):即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。
当前第44页\共有57页\编于星期四\19点基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子数据的收集与管理2023/6/4当前第45页\共有57页\编于星期四\19点(四)数据库搜索及序列比较
搜索同源序列在一定程度上就是通过序列比较寻找相似序列序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。
2023/6/446当前第46页\共有57页\编于星期四\19点发现同源分子2023/6/447当前第47页\共有57页\编于星期四\19点48生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程通过数据分析首先确立靶标分子预测蛋白质分子结构设计药物分子与靶标分子相互作用(五)
在药学领域应用当前第48页\共有57页\编于星期四\19点
所谓基因组药物(Genomicdrug)是指利用基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物.
基于机理的药物发现:基因组药物实际上利用了反向生物学的原理.沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。基因组药物当前第49页\共有57页\编于星期四\19点人类基因组约有10万左右的基因.编码10万以上的蛋白质,其中至少5%即5000以上的基因编码蛋白质可能具有药物开发前景。大量基因特别是疾病相关基因申请专利,如肥胖。当前第50页\共有57页\编于星期四\19点
理想的抗生素靶标应为微生物细胞存活所必须,在病原体中高度保守
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届高考英语二轮创新复习专题强化练二十-二十三-短文改错练习含解析
- 2024年新教材高中地理第一章人口分布迁移与合理容量第二节人口迁移的特点及影响因素学案中图版必修2
- 2023届新高考新教材化学人教版一轮学案-第十章第2讲 物质的分离与提纯
- 2024年试验机械相关检测仪器合作协议书
- 盐城师范学院《中国政治制度史专题》2022-2023学年第一学期期末试卷
- 2024年恩替卡韦项目建议书
- 2024学校食堂从业人员的学校食堂从业人员聘用合同
- 2024年航空用玻璃系列项目建议书
- 盐城师范学院《小学课堂教学技能》2022-2023学年第一学期期末试卷
- 2024年地(水)面效应飞机项目发展计划
- 女性生殖系统生理 卵巢的周期性变化
- 保洁人员排班表
- 2023年安徽省交通控股集团招聘笔试题库及答案解析
- 领导在班组长会上的讲话(5篇)
- LY/T 1956-2011县级林地保护利用规划编制技术规程
- GB/T 30842-2014高压试验室电磁屏蔽效能要求与测量方法
- GB/T 20399-2006自然保护区总体规划技术规程
- 简单折纸笔筒制作
- 九年级化学上册复习课件(1-7单元)(2)第五单元复习课件
- GB/T 12976.2-2008额定电压35 kV(Um=40.5 kV)及以下纸绝缘电力电缆及其附件第2部分:额定电压35 kV电缆一般规定和结构要求
- 你来比划我来猜大全非常大配图版
评论
0/150
提交评论