




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、结构生物信息学基础知识和基本处理方法Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法生物学两种主要信息载体核酸分子 与 蛋白质分子生物基础核酸分子核酸的基本单元式核苷酸。核苷酸有一个磷酸基团、一个糖基团和一个含有氮原子的碱基基团构成。根据糖基不同,核苷酸可分为:脱氧核糖核苷酸核糖核苷酸生物基础碱基糖基磷酸DNA(脱氧核糖核酸)RNA(核糖核酸)核苷 + 磷酸碱基+糖基核苷酸核酸聚合核酸分子 DNA和RNADNA的磷酸基团和糖基团都相同,碱基分为4种类型:腺嘌呤 - A鸟嘌呤 - G胞嘧啶 - C胸腺嘧啶 - T生物基础A只能与T配对C只能与G配对ACGT核酸分子 D
2、NA和RNA多个脱氧核苷酸通过5和3形成磷酸二酯键连接而成的长DNA单链。通过碱基互补配对形成互补链,两条相互平行的DNA单链形成双螺旋结构。生物基础A - UC - GG - URNA通常是单链形式。RNA只有尿嘧啶(U)而没有胸腺嘧啶(T)DNA主要存在于细胞核内,RAN在细胞核外也存在。配对原则:蛋白质分子 生命活动的执行者蛋白质是由氨基酸通过肽键相链接形成的聚合物。氨基酸-蛋白质的基本组成单位,存在自然界中的氨基酸有300余种,但组成人体蛋白质的氨基酸仅有20种。生物基础氨基酸有一个位于中心的碳原子(C)以及用共价键相连的四个基团组成。氨基酸的通式RC氨基羧基侧链甘氨酸HCH3丙氨酸氨
3、基酸之间的差异主要体现在侧链部分蛋白质分子 生命活动的执行者20种标准氨基酸生物基础氨基酸名称英文缩写简 写氨基酸名称英文缩写简 写甘氨酸GlyG丝氨酸SerS丙氨酸AlaA苏氨酸ThrT缬氨酸ValV天冬酰胺AsnN异亮氨酸IleI谷酰胺GlnQ亮氨酸LeuL酪氨酸TyrY苯丙氨酸PheF组氨酸HisH脯氨酸ProP天冬氨酸AspD甲硫氨酸MetM谷氨酸GluE色氨酸TrpW赖氨酸LysK半胱氨酸CysC精氨酸ArgR蛋白质分子 生命活动的执行者生物基础氨基酸之间的差异主要体现在侧链部分氨基酸的侧链决定了不同氨基酸的物理化学性质RC氨基羧基侧链蛋白质分子 生命活动的执行者氨基酸的分类生物基础
4、碱性氨基酸酸性氨基酸极性中性氨基酸非极性疏水氨基酸蛋白质分子的结构生物基础蛋白质分子的结构蛋白质的一级结构生物基础定义:蛋白质的一级结构指多肽链中氨基酸的排列顺序。主要化学键:肽键一级结构是蛋白质空间构象和特异生物功能的基础。胰岛素的一级结构蛋白质分子的结构蛋白质的二级结构生物基础定义:蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链的构象。主要化学键:氢键HHHH肽单元(peptide unit)蛋白质分子的结构肽平面及二面角生物基础蛋白质分子的结构二级结构主要有以下几种形式:生物基础螺旋 ( -helix) 折叠 ( -sheet)转角 (
5、 -turn)无规卷曲 (coil)多肽链中有60%的区段为螺旋和折叠蛋白质分子的结构-螺旋生物基础多肽链主链围绕中心轴形成右手螺旋状结构,侧链伸向螺旋外侧每个氨基酸残基(第n个)的羰基与多肽链 C 端方向的第4个残基(第4+n个)的酰胺氮形成氢键蛋白质分子的结构 -折叠生物基础多肽链充分伸展,相邻肽单元之间折叠成锯齿状结构,侧链位于锯齿结构的上下方两段以上的 -折叠结构平行排列 ,两链间可顺向平行,也可反向平行两链间的肽键之间形成氢键,以稳固 -折叠结构。氢键与螺旋长轴垂直。蛋白质分子的结构 -转角生物基础含4个氨基酸残基,第一个残基的 CO 基团和第四个残基的 NH基团之间形成氢键,使多肽
6、链的方向发生“U”形改变。蛋白质分子的结构超二级结构生物基础在蛋白质分子中,特别是球状蛋白质中,由若干相邻的二级结构单元(即-螺旋、-折叠和-转角等)彼此相互作用组合在一起,形成有规则、在空间上能辨认的二级结构组合体,充当三级结构的构件单元,称超二级结构。蛋白质分子的结构蛋白质三级结构生物基础在二级结构基础上的肽链再折叠形成的构象。整条肽链中全部氨基酸残基的相对空间位置,即肽链中所有原子在三维空间的排布位置。蛋白质分子的结构结构域(domain)生物基础多肽链在超二级结构基础上进一步绕曲折叠而成的相对独立的三维实体称结构域蛋白质结构中具有特异结构和独立功能的区域。蛋白质分子的结构结构域(dom
7、ain)生物基础蛋白质分子的结构肌红蛋白的三级结构生物基础分子中多肽主链由长短不等的8段直的螺旋组成最大的螺旋含23个残基最短的7个残基,分子中几乎80%的氨基酸残基都处于螺旋区中。拐弯是由18个残基组成的无规则卷曲。蛋白质分子的结构蛋白质四级结构生物基础每条完整三级结构的多肽链,称为亚基 (subunit)蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级结构。Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法生物信息学数据库Background生物分子数据高速增长 分子生物学及相关领域研究人员迅速获得最新实验数据 建立生物分子数据库 生物
8、信息学数据库Background应满足5个方面的主要需求:(1)时间性(2)注释 (3)支撑数据 (4)数据质量 (5)集成性生物信息学数据库Background生物信息数据库具备的几个明显特征:数据库的更新速度不断加快数据库使用频率增长更快数据库的复杂程度不断增加 数据库网络化 面向应用先进的软硬件配置蛋白质结构数据库BackgroundPDB ( Protein Data Bank)是目前最主要的蛋白质分子结构数据库。1970由美国Brookhaven国家实验室建立,1988年,由美国RCSB(research collaboratory for structural biology)管理
9、;含有通过实验(X射线晶体衍射,核磁共振NMR,冷冻电子显微镜)测定的生物大分子(蛋白质、核酸、糖类、复合物)的三维结构。以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等; 蛋白质结构数据库BackgroundPDB ( Protein Data Bank)蛋白质结构数据库BackgroundPDB ( Protein Data Bank)Jan 08, 2013蛋白质结构数据库BackgroundPDB的文件格式物种来源、测定方法、提交者信息、蛋白质序列 一级结构蛋白质二级结构构成蛋白质的氨基酸的每个原子的三维坐标蛋白质结构分类数据库Background
10、SCOP (Structural Classification of Proteins)提供已知结构的蛋白质之间结构和进化关系的详细描述。按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次是家族、超家族和折叠:家族:具有明显的进化关系超家族:具有远源进化关系,具有共同的进化源折叠类:主要结构相似ROOT(根) CLASS(类) FOLD(折叠) SUPERFAMILY (超家族) FAMILY(家族)PROTEIN(蛋白)SPECIES(种)蛋白质结构分类数据库BackgroundSCOP (Structural Classification of Proteins)蛋
11、白质结构分类数据库BackgroundCATH (Class, Architecture, Topology, Homology)CATH数据库的分类基础是蛋白质结构域。与SCOP不同的是,CATH把蛋白质分为4类,即a主类、b主类,a-b类(a/b型和a+b型)和低二级结构类。 类型(Clase):二级结构构架(Architecture):超二级结构排列方式拓扑结构(Topology):二级结构的形状和二级结构间的联系同源性(Homology):序列同源性Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法生物数据的基本处理方法Method生物信息学所用的方法和技术:
12、数学统计方法 动态规划方法 机器学习与模式识别技术 数据库技术及数据挖掘 人工神经网络技术分子模型化技术量子力学和分子力学计算 生物分子的计算机模拟因特网(Internet)技术 生物数据的基本处理方法数学统计方法:生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法 数据统计、因素分析、多元回归分析是生物学研究必备的工具隐马尔科夫模型(Hidden Markov Models)在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链(Markov Chain)数学统计方法Method生物数据的
13、基本处理方法2. 动态规划方法 :动态规划(Dynamic Programming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法 动态规划解决问题的基本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解 Method生物数据的基本处理方法3. 机器学习与模式识别技术 :机器学习:模拟人类的学习过程,以计算机为工具获取知识、积累经验 遗传算法采用随机搜索方法,具有自适应能力和便于并行计算神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义 模式识别:机器学习的
14、一个主要任务。模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中。模式识别主要有两种方法:根据对象的统计特征进行识别根据对象的结构特征进行识别Method生物数据的基本处理方法3. 机器学习与模式识别技术 :环境知识库执行反 馈学习Method生物数据的基本处理方法4.数据库技术及数据挖掘 :数据库技术 数据仓库 虚拟数据库技术(Virtual Database,简称 VDB) 数据挖掘(data mining) 又称作数据库中的知识发现 (Knowledge Discovery in Database),它是从数据库或数据仓库中
15、发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进行归纳性推理和联想,寻找数据间内在的某些关联,从中发掘出潜在的、对信息预测和决策行为起着十分重要作用的模式 数据挖掘过程一般分为4个基本步骤:数据选择、数据转换、数据挖掘和结果分析 Method生物数据的基本处理方法5.人工神经网络技术:人工神经网络(Artificial Neural Network, 简称ANN)是通过模拟神经元的特性以及脑的大规模并行结构、信息的分布式和并行处理等机制建立的一种数学模型 在生物信息学中,使用得最多的是反向传播神经网络(Back Propagation Neural Network,简称BP网
16、)。BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监督学习的网络模型。标准的BP网由三层神经元组成:输入层、隐藏层和输出层 Method生物数据的基本处理方法5.人工神经网络技术:输入层隐藏层输出层反向传播神经网络结构示意Method生物数据的基本处理方法6.分子模型化技术:分子模型化(Molecular modeling)是利用计算机模拟分子结构、研究分子之间相互作用的一种技术分子模型化是进行分子设计的基础。分子图形学(Molecular Graphics)是进行分子模型化的一项重要技术,正是由于分子图形学和其它计算化学方法(如分子力学、分子动力学)的相互结合,才使得分子模型
17、化方法取得成功Method生物数据的基本处理方法7.量子力学和分子力学计算:量子力学主要研究原子、分子、凝聚态物质、以及原子核和基本粒子的结构、性质的基础理论,在化学等有关学科中得到了广泛的应用 分子力学(Molecular Mechanics)方法是一种非量子力学的计算分子结构、能量与性质的方法,该方法应用经验势能函数,即经验力场方法模拟分子的结构,计算分子的性质 在进行分子结构分析、构象优化、分子间相互作用研究及分子模拟时需要应用量子力学或分子力学 Method生物数据的基本处理方法8.生物分子的计算机模拟:所谓生物分子的计算机模拟就是从分子或者原子水平上的相互作用出发,建立分子体系的数学模型,利用计算机进行模拟实验,预测生物分子的结构和功能,预测动力学及热力学等方面的性质分子动力学和蒙特卡罗(Monte Carlo)方法是两种最常用的技术,另一种模拟方法是模拟退火方法 实 验实验现象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《智能手机维修教程》课件
- 铁路桥隧无损检测任务二无损检测基本理论课件
- 铁道机车专业教学郑州铁路课件
- 铁路安全监测与预警系统讲师刘新强课件
- 铁路工程安全技术石家庄铁路21课件
- 铁路集装箱运输组织单元集装箱运输作业流程课件
- 2025年吉林医学高等专科学校单招考试题库
- 合同纠纷处理办法
- 个人终止租房合同协议书范本
- 版体育场地使用权租赁合同
- 私募基金财务管理制度版本
- 人教部编版语文四年级下册第七单元大单元教学设计
- 2025-2030全球及中国炼油厂服务行业市场现状供需分析及投资评估规划分析研究报告
- 商务英语中的语用失误分析论文
- 2025中国海洋大学辅导员考试题库
- 广西桂林市2025年中考语文一模试题(附答案)
- 土地房屋测绘项目投标方案技术标
- 2025年河北省初中学业水平模拟考试英语试卷(含答案含听力原文无音频)
- 2025年辽宁省本溪市公安局明山分局招聘辅警10人历年高频重点模拟试卷提升(共500题附带答案详解)
- 2025年春季形势与政策-从教育大国迈向教育强国
- 4.2《炉中煤》《红烛》教案-【中职专用】高二语文同步教学(高教版2024·拓展模块下册)
评论
0/150
提交评论