版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学概论
1编辑ppt生物信息学概论
1编辑ppt第一节概念
第二节生物信息学的发展历史
第三节生物信息学主要研究内容
第四节生物信息学的研究意义2编辑ppt第一节概念2编辑ppt第一节概念
生命信息的组织、传递、表达天文技术空间技术物理化学分子生物学遗传学信息技术3编辑ppt第一节概念
生命信息的组织、天文技术物理分子遗传生物不是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂而有序的过程。信息科学?4编辑ppt生物不是物质的简单堆积,生物体的生长发育是生命信息控制之下的1、生物信息学概念HGP生物数据的激增(每12个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)的诞生5编辑ppt1、生物信息学概念HGP生物学家数学家计算机生物信息学概念(广义)生物体系和生物过程中信息的存贮、传递和表达细胞、组织、器官的生理、病理和药理过程的中各种生物信息信息科学生命科学中的信息科学
6编辑ppt概念(广义)生物体系和生物过程中信息细胞、组织、器官的生理、概念(狭义)生物分子数据深层次生物学知识分子生物信息学MolecularBioinformatics挖掘获取管理、分析和利用生物分子数据提高研究的科学性及效率7编辑ppt概念(狭义)生物深层次挖掘获取管理、分析和利用生物分子数据7生物体是一个复杂的系统物理、化学和生物学方法生物体也是一个信息系统信息科学方法2、生物分子信息8编辑ppt生物体是一个复杂的系统物理、化学和生物学方法2、生物分细胞存贮、复制、传递和表达遗传信息的系统分子生物信息的载体9编辑ppt细胞存贮、复制、传递和表达分子生物信息的载体9编辑ppt生物信息学主要研究两种信息载体DNA分子蛋白质分子10编辑ppt10编辑pptFromtheCelltoProteinMachines
11编辑pptFromtheCelltoProteinMachi生物分子至少携带着三种信息遗传信息与功能相关的结构信息进化信息12编辑ppt生物分子至少携带着三种信息12编辑ppt(1)遗传信息的载体——DNA遗传信息的载体主要是DNA存储氨基酸序列编码信息、基因表达调控信息及遗传信息生物体生长发育的本质就是遗传信息的传递和表达13编辑ppt(1)遗传信息的载体——DNA遗传信息的载体主要是DNA1DNA通过自我复制,在生物体的繁衍过程中传递遗传信息基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。
基因控制着蛋白质的合成
DNARNA蛋白质转录翻译14编辑pptDNA通过自我复制,在生物体的繁衍过基因通过转录和翻译,使遗基因的DNA序列DNA前体RNAmRNA多肽链蛋白质序列对应关系遗传密码15编辑ppt基因的DNA序列DNA前体RNAmRNA多肽链蛋白质序列对遗(2)蛋白质的结构决定其功能蛋白质功能取决于蛋白质的空间结构
蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列中。16编辑ppt(2)蛋白质的结构决定其功能16编辑ppt(3)DNA和蛋白质都含有进化信息通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。(或基因组)17编辑ppt(3)DNA和蛋白质都含有进化信息通过比较相似的蛋白质序列生物分子信息DNA序列数据
蛋白质序列数据
生物分子结构数据
生物分子功能数据
最基本直观复杂生物分子数据类型18编辑ppt生DNA序列数据蛋白质序列数据生物分子结构数据生物分子
DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功能最基本的生物信息维持生命活动的机器第一部遗传密码第二部遗传密码?生命体系千姿百态的变化生物分子数据及其关系19编辑ppt
DNA蛋白质蛋白质蛋白质最基本的维持生命活动的机器第一部第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少对于第二部密码,目前则只能用统计学的方法进行分析无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用。20编辑ppt第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数生物分子信息的特征生物分子信息数据量大生物分子信息复杂生物分子信息之间存在密切联系21编辑ppt生物分子信息的特征生物分子信息数据量大21编辑ppt研究目标:揭示生物分子数据的内涵
生物分子数据具有深刻的内涵,数据之间存在着复杂的联系,丰富的生物学知识和规律。3、生物信息学的目标和任务
22编辑ppt研究目标:揭示生物分子数据的内涵3、生物信息学的目标和任务研究任务
收集和管理生物分子数据,使研究人员能方便地使用这些数据,并为信息分析和数据挖掘打下基础。
数据来自于生物学实验,应用信息学技术收集和管理数据,建立数据库,并提供数据查询、搜索等工具。23编辑ppt研究任务收集和管理生物分子数据,使研究人员能方便地使用这些数据分析和挖掘
发现数据间的关系,认识数据的本质,上升为生物学知识解释与生物分子信息复制、传递和表达有关的生物过程解释生物过程中出现的信息变化与疾病的关系,帮助设计新的药物分子24编辑ppt24编辑ppt
实验
数据
信息知识收集表示分析建模刻画特征比较推理
应用基因工程蛋白质设计疾病诊断疾病治疗开发新药生物分子信息处理流程25编辑ppt
应用生物分子信息处理流程25编辑ppt目前生物信息学主要研究对象是DNA和蛋白质。
DNA分析方面:分析DNA序列中的基因信息及基因表达调控信息、基因表达数据、基因间的相互作用关系蛋白质分析方面:分析蛋白质序列与蛋白质结构、功能间的关系,预测蛋白质的结构和功能,研究蛋白质的进化关系26编辑ppt目前生物信息学主要研究对象是DNA和蛋白质。26编辑ppt开发分析工具和实用软件生物分子序列比较工具基因识别工具生物分子结构预测工具基因表达数据分析工具
27编辑ppt27编辑ppt数据源数据量生物信息学任务DNA序列11.5百万条序列125.0亿个碱基分离编码与非编码区域识别内含子与外显子基因产物预测基因功能注释基因调控信息分析蛋白质序列100万条序列(每条序列平均有300氨基酸)序列比较多重序列比对识别保守的序列模式进化分析大分子结构2万个结构(每个结构平均1000个原子坐标)二级结构、空间结构预测三维结构比对蛋白质几何学度量表面和形态计算分子间相互作用分析分子模拟基因组300个基因组标注重复序列基因结构分析系统发生分析基因与疾病的连锁分析基因组比较遗传语言分析基因表达酵母6000个基因在约20时间点表达值基因表达模式相关分析表达调控信息分析28编辑ppt数据源数据量生物信息学任务DNA序列11.5百万条序列分离编分子生物学的三大核心数据库
GenBank核酸序列数据库SWISS-PROT蛋白质序列数据库PDB生物大分子结构数据库29编辑ppt分子生物学的三大核心数据库GenBank核酸序列数据库2第二节生物信息学的发展历史30编辑ppt第二节生物信息学的发展历史30编辑ppt20世纪50年代,生物信息学开始孕育
1956年在美国首次召开了“生物学中的信息理论研讨会”31编辑ppt20世纪50年代,生物信息学开始孕育31编辑ppt20世纪60年代,生物信息学形成雏形一些计算生物学家开始进行相关研究,生物分子信息在概念上将计算生物学和计算机科学联系起来。
1962年,Zucherkandl和Pauling研究了序列变化与进化间的关系——分子进化1967年,Dayhoff研制出蛋白质序列图集(氨基酸序列的收集)32编辑ppt32编辑ppt20世纪70~80年代初期
,许多生物分子序列数据产生,一部分计算机科学家应用计算机技术解决生物学问题,尤其与生物分子序列相关的问题。序列比较方法1970年,Needleman和Wunsch提出序列比对算法Gibbs和McIntyre发表矩阵打点作图法Dayhoff提出PAM矩阵1981年,Smith和Waterman提出公共子序列识别法1983年,Wilbur和Lipman发表了数据库相似序列搜索法
1985年,蛋白质序列搜索法FASTP/FASTN出现1988年,Pearson和Lipman发表著名的序列比较法FASTA1990年,快速相似序列搜索法BLAST问世33编辑ppt20世纪70~80年代初期,许多生物分子序列数据产生,一部生物信息分析方法
1972年,Gatlin证实自然的生物分子序列是高度非随机1975年,Pipas和McMahon提出计算机预测RNA二级结构1977年,DNA序列翻译成蛋白质序列法出现1978年,Gingeras研制出核酸序列中限制性酶切位点的识别软件34编辑ppt生物信息分析方法34编辑ppt20世纪80年代后1982年,核酸序列数据库GenBank公开发行1986年,日本核酸序列数据库DDBJ诞生蛋白质序列数据库SWISS-PROT出现1988年,NCBI生物信息中心成立欧洲分子生物学网络(EMBnet)成立35编辑ppt20世纪80年代后35编辑ppt20世纪90年代后
1990年,HGP计划启动1995年,第一个细菌基因组被完全测序1996年,酿酒酵母基因组被完全测序Affymetrix生产出第一块芯片1998年,线虫的基因组被完全测序1999年,果蝇的基因组被完全测序获得人类第22对染色体的遗传序列2000年6月24日,完成人类基因组的工作框架图36编辑ppt36编辑ppt关于生物信息学发展历程中的重要大事,请参见下面两个网站的介绍:/Education/bioinformatics/37编辑ppt关于生物信息学发展历程中的重要大事,37编辑ppt
PubMed中与生物信息学相关论文统计
38编辑ppt
PubMed中与生物信息学相关论文统计38编辑ppt生物信息学国内发展概况20世纪80年代初,个别单位开展计算分子生物学的工作1993年,参与HGP,列入生物信息学的相关研究内容1995-1996年开始发展1997年,香山会议召开,专题讨论生物信息学的发展1999年,北京召开生命科学中的信息科学问题
近几年,成立了一些生物信息学服务机构,如北京大学、中科院上海生命科学研究院分别成立了生物信息中心。39编辑ppt生物信息学国内发展概况20世纪80年代初,个别单位开展计算分第三节生物信息学主要研究内容40编辑ppt第三节生物信息学主要研究内容40编辑ppt1、生物分子数据的收集与管理2、数据库搜索及序列比较3、基因组序列分析4、蛋白质结构预测41编辑ppt1、生物分子数据的收集与管理41编辑ppt100万多个蛋白质序列2万多个蛋白质空间结构核酸序列呈指数级增长1、生物分子数据的收集与管理42编辑ppt100万多个蛋白质序列2万多个蛋白质空间结构核酸序列呈指数级收集和管理数据的具体工作构建数据库系统建立网络服务器开发数据查询和搜索工具设计数据分析软件和数据可视化软件43编辑ppt收集和管理数据的具体工作构建数据库系统43编辑ppt交叉索引:数据库中的每一条数据应尽可能地与其它数据库中的相关数据链接起来。DAN序列蛋白质序列蛋白质结构44编辑ppt交叉索引:数据库中的每一条数据应尽可能地与其它数据库中的相关核酸序列数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR45编辑ppt核酸蛋白质蛋白质DDBJEMBLGenBankSWISS-P2、数据库搜索及序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列一个普遍规律:序列决定结构,结构决定功能新序列——已知序列——功能预测46编辑ppt2、数据库搜索及序列比较搜索同源序列在一定程度上就是通过对于DNA序列,同源搜索有助于确定功能、编码区及基因对于蛋白质序列,有助于预测蛋白质的结构、功能及进化信息
序列的比较可以同类,也可以不同类,但比较前需转换成相同类型的序列。47编辑ppt对于DNA序列,同源搜索有助于确定功能、编码区及基因两序列比较数据库中某个序列或每个序列48编辑ppt两序列比较48编辑pptBLAST和FASTA
数据库搜索的序列比较法49编辑pptBLAST和FASTA49编辑ppt多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。50编辑ppt多重序列比对研究的是多个序列的共性。序列的多重比对可用发现同源分子51编辑ppt发现同源分子51编辑ppt
在蛋白质研究方面,通过结构数据库的搜索,能发现蛋白质间更深层的关系。52编辑ppt52编辑ppt3、基因组序列分析
在DNA序列分析方面,识别蛋白质编码区或识别基因是最关键的。如发现一个新基因,通过实验了解与其相关的生理功能或疾病的本质实验测定的编码区域不一定完整,需结合计算找到并证实所有的外显子大量DNA序列数据的存在促使发展识别编码区和基因算法53编辑ppt3、基因组序列分析在DNA序列分析方面蛋白质序列测定麻烦蛋白质序列预测并非容易:
非编码区域存在
编码区——基因结构和蛋白质序列54编辑ppt编码区——基因结构和蛋白质序列54编辑ppt蛋白质编码区的统计特征、基因结构中一些特殊信号位点、基因转录调控区的蛋白质结合位点等都有助于识别基因。
预测蛋白质的编码区利用相关的数据以提高基因识别的准确性
理论识别与分子生物学实验结合基因识别55编辑ppt蛋白质编码区的统计特征、基因结构中一些特基因识别55编
分析与基因表达调控相关的信息、各种功能位点及基因转录调控元件。DNA序列上特殊的片段,是蛋白质因子作用的位点,是与基因转录、翻译有关的信号序列通过模式识别及生物信息软件分析
非编码区的分析56编辑ppt分析与基因表达调控相关的信息、各种功能位点及基因转录调分析基因组的结构和信息,发现与功能密切相关的保守序列研究物种间的进化关系基因组比较57编辑ppt分析基因组的结构和信息,发现与功能密切相关的保守序列基因组比4、蛋白质结构预测
蛋白质是生物体的基本物质,一切生命活动都与蛋白质有关。蛋白质的结构由蛋白质的序列决定???蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。58编辑ppt4、蛋白质结构预测蛋白质是生物体的基本物质,一切生命活动都蛋白质结构预测的基础:蛋白质的变性及重折叠实验蛋白质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手术室管理与护理技术
- 2026年新疆职业大学单招综合素质笔试备考试题附答案详解
- 2026年河北传媒学院单招综合素质考试备考试题带答案解析
- 机器人辅助微创手术技术
- 医疗护理理论与实践创新
- 医院保卫人员职业素养
- 医院精神科护理职业行为准则
- 医疗行业医护人员职业发展规划与培训
- 财政评审课件
- 2026年哈尔滨城市职业学院高职单招职业适应性测试参考题库有答案解析
- 3.提高多标高深基坑支护施工验收一次合格率-飞扬QC小组
- 数据中心智能化系统设备部署方案
- 专项突破:平面直角坐标系中面积、规律、新定义、几何综合问题(解析版)
- 2025年铍矿行业分析报告及未来发展趋势预测
- 化学剥脱美容技术
- 医疗机构传染病隔离区域设置与管理要求
- 2025年数学广东一模试卷及答案
- 安全总监先进个人材料范文
- 2025年高速公路收费员考试题(附答案+解析)
- 智算中心大模型训练部署方案
- 2025年中国BBU备用电源行业市场全景分析及前景机遇研判报告
评论
0/150
提交评论