结构生物信息学基础知识_第1页
结构生物信息学基础知识_第2页
结构生物信息学基础知识_第3页
结构生物信息学基础知识_第4页
结构生物信息学基础知识_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

结构生物信息学基础知识第1页,课件共47页,创作于2023年2月Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法第2页,课件共47页,创作于2023年2月生物学两种主要信息载体生物基础核酸分子与蛋白质分子第3页,课件共47页,创作于2023年2月核酸分子生物基础核酸的基本单元式核苷酸。核苷酸有一个磷酸基团、一个糖基团和一个含有氮原子的碱基基团构成。根据糖基不同,核苷酸可分为:脱氧核糖核苷酸核糖核苷酸碱基糖基磷酸DNA(脱氧核糖核酸)RNA(核糖核酸)核苷+磷酸碱基+糖基核苷酸核酸聚合第4页,课件共47页,创作于2023年2月核酸分子–DNA和RNA生物基础DNA的磷酸基团和糖基团都相同,碱基分为4种类型:腺嘌呤--A鸟嘌呤--G胞嘧啶--C胸腺嘧啶--TA只能与T配对C只能与G配对ACGT第5页,课件共47页,创作于2023年2月核酸分子–DNA和RNA生物基础多个脱氧核苷酸通过5’和3’形成磷酸二酯键连接而成的长DNA单链。通过碱基互补配对形成互补链,两条相互平行的DNA单链形成双螺旋结构。A--UC--GG--URNA通常是单链形式。RNA只有尿嘧啶(U)而没有胸腺嘧啶(T)DNA主要存在于细胞核内,RAN在细胞核外也存在。配对原则:第6页,课件共47页,创作于2023年2月蛋白质分子–生命活动的执行者生物基础蛋白质是由氨基酸通过肽键相链接形成的聚合物。氨基酸-蛋白质的基本组成单位,存在自然界中的氨基酸有300余种,但组成人体蛋白质的氨基酸仅有20种。氨基酸有一个位于中心的碳原子(Cα)以及用共价键相连的四个基团组成。氨基酸的通式RCα氨基羧基侧链甘氨酸HCH3丙氨酸氨基酸之间的差异主要体现在侧链部分第7页,课件共47页,创作于2023年2月蛋白质分子–生命活动的执行者生物基础20种标准氨基酸氨基酸名称英文缩写简写氨基酸名称英文缩写简写甘氨酸GlyG丝氨酸SerS丙氨酸AlaA苏氨酸ThrT缬氨酸ValV天冬酰胺AsnN异亮氨酸IleI谷酰胺GlnQ亮氨酸LeuL酪氨酸TyrY苯丙氨酸PheF组氨酸HisH脯氨酸ProP天冬氨酸AspD甲硫氨酸MetM谷氨酸GluE色氨酸TrpW赖氨酸LysK半胱氨酸CysC精氨酸ArgR第8页,课件共47页,创作于2023年2月蛋白质分子–生命活动的执行者生物基础氨基酸之间的差异主要体现在侧链部分氨基酸的侧链决定了不同氨基酸的物理化学性质RCα氨基羧基侧链第9页,课件共47页,创作于2023年2月蛋白质分子–生命活动的执行者生物基础氨基酸的分类碱性氨基酸酸性氨基酸极性中性氨基酸非极性疏水氨基酸第10页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础第11页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础蛋白质的一级结构定义:蛋白质的一级结构指多肽链中氨基酸的排列顺序。主要化学键:肽键一级结构是蛋白质空间构象和特异生物功能的基础。胰岛素的一级结构第12页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础蛋白质的二级结构定义:蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链的构象。主要化学键:氢键HHHH肽单元(peptideunit)第13页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础肽平面及二面角第14页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础二级结构主要有以下几种形式:螺旋(-helix)折叠(-sheet)转角(-turn)无规卷曲(coil)

多肽链中有60%的区段为螺旋和折叠第15页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础-螺旋多肽链主链围绕中心轴形成右手螺旋状结构,侧链伸向螺旋外侧每个氨基酸残基(第n个)的羰基与多肽链C端方向的第4个残基(第4+n个)的酰胺氮形成氢键第16页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础-折叠多肽链充分伸展,相邻肽单元之间折叠成锯齿状结构,侧链位于锯齿结构的上下方两段以上的β-折叠结构平行排列,两链间可顺向平行,也可反向平行两链间的肽键之间形成氢键,以稳固β-折叠结构。氢键与螺旋长轴垂直。第17页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础-转角含4个氨基酸残基,第一个残基的CO基团和第四个残基的NH基团之间形成氢键,使多肽链的方向发生“U”形改变。第18页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础超二级结构在蛋白质分子中,特别是球状蛋白质中,由若干相邻的二级结构单元(即α-螺旋、β-折叠和β-转角等)彼此相互作用组合在一起,,形成有规则、在空间上能辨认的二级结构组合体,充当三级结构的构件单元,称超二级结构。第19页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础蛋白质三级结构在二级结构基础上的肽链再折叠形成的构象。整条肽链中全部氨基酸残基的相对空间位置,即肽链中所有原子在三维空间的排布位置。第20页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础结构域(domain)多肽链在超二级结构基础上进一步绕曲折叠而成的相对独立的三维实体称结构域蛋白质结构中具有特异结构和独立功能的区域。第21页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础结构域(domain)第22页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础肌红蛋白的三级结构分子中多肽主链由长短不等的8段直的α螺旋组成最大的螺旋含23个残基最短的7个残基,分子中几乎80%的氨基酸残基都处于α螺旋区中。拐弯是由1—8个残基组成的无规则卷曲。第23页,课件共47页,创作于2023年2月蛋白质分子的结构生物基础蛋白质四级结构每条完整三级结构的多肽链,称为亚基(subunit)蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级结构。第24页,课件共47页,创作于2023年2月Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法第25页,课件共47页,创作于2023年2月生物信息学数据库Background生物分子数据高速增长

分子生物学及相关领域研究人员迅速获得最新实验数据

建立生物分子数据库

第26页,课件共47页,创作于2023年2月生物信息学数据库Background应满足5个方面的主要需求:(1)时间性(2)注释(3)支撑数据(4)数据质量(5)集成性第27页,课件共47页,创作于2023年2月生物信息学数据库Background生物信息数据库具备的几个明显特征:数据库的更新速度不断加快数据库使用频率增长更快数据库的复杂程度不断增加数据库网络化面向应用先进的软硬件配置第28页,课件共47页,创作于2023年2月蛋白质结构数据库BackgroundPDB(ProteinDataBank)是目前最主要的蛋白质分子结构数据库。1970由美国Brookhaven国家实验室建立,1988年,由美国RCSB(researchcollaboratoryforstructuralbiology)管理;含有通过实验(X射线晶体衍射,核磁共振

NMR,冷冻电子显微镜)测定的生物大分子(蛋白质、核酸

、糖类

、复合物)的三维结构。以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等;/pdb

第29页,课件共47页,创作于2023年2月蛋白质结构数据库BackgroundPDB(ProteinDataBank)第30页,课件共47页,创作于2023年2月蛋白质结构数据库BackgroundPDB(ProteinDataBank)Jan08,2013第31页,课件共47页,创作于2023年2月蛋白质结构数据库BackgroundPDB的文件格式物种来源、测定方法、提交者信息、蛋白质序列一级结构蛋白质二级结构构成蛋白质的氨基酸的每个原子的三维坐标第32页,课件共47页,创作于2023年2月蛋白质结构分类数据库BackgroundSCOP(StructuralClassificationofProteins)提供已知结构的蛋白质之间结构和进化关系的详细描述。按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次是家族、超家族和折叠:/家族:具有明显的进化关系超家族:具有远源进化关系,具有共同的进化源折叠类:主要结构相似ROOT(根)CLASS(类)FOLD(折叠)SUPERFAMILY(超家族)FAMILY(家族)PROTEIN(蛋白)SPECIES(种)第33页,课件共47页,创作于2023年2月蛋白质结构分类数据库BackgroundSCOP(StructuralClassificationofProteins)第34页,课件共47页,创作于2023年2月蛋白质结构分类数据库BackgroundCATH(Class,Architecture,Topology,Homology)CATH数据库的分类基础是蛋白质结构域。与SCOP不同的是,CATH把蛋白质分为4类,即a主类、b主类,a-b类(a/b型和a+b型)和低二级结构类。

类型(Clase):二级结构构架(Architecture):超二级结构排列方式拓扑结构(Topology):二级结构的形状和二级结构间的联系同源性(Homology):序列同源性第35页,课件共47页,创作于2023年2月Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法第36页,课件共47页,创作于2023年2月生物数据的基本处理方法Method生物信息学所用的方法和技术:数学统计方法动态规划方法机器学习与模式识别技术数据库技术及数据挖掘人工神经网络技术分子模型化技术量子力学和分子力学计算生物分子的计算机模拟因特网(Internet)技术第37页,课件共47页,创作于2023年2月生物数据的基本处理方法数学统计方法:生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法数据统计、因素分析、多元回归分析是生物学研究必备的工具隐马尔科夫模型(HiddenMarkovModels)在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链(MarkovChain)数学统计方法Method第38页,课件共47页,创作于2023年2月生物数据的基本处理方法2.动态规划方法:动态规划(DynamicProgramming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法动态规划解决问题的基本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解Method第39页,课件共47页,创作于2023年2月生物数据的基本处理方法3.机器学习与模式识别技术:机器学习:模拟人类的学习过程,以计算机为工具获取知识、积累经验遗传算法采用随机搜索方法,具有自适应能力和便于并行计算神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义模式识别:机器学习的一个主要任务。模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中。模式识别主要有两种方法:根据对象的统计特征进行识别根据对象的结构特征进行识别Method第40页,课件共47页,创作于2023年2月生物数据的基本处理方法3.机器学习与模式识别技术:环境知识库执行反馈学习Method第41页,课件共47页,创作于2023年2月生物数据的基本处理方法4.数据库技术及数据挖掘:数据库技术数据仓库虚拟数据库技术(VirtualDatabase,简称VDB)数据挖掘(datamining)又称作数据库中的知识发现(KnowledgeDiscoveryinDatabase),它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进行归纳性推理和联想,寻找数据间内在的某些关联,从中发掘出潜在的、对信息预测和决策行为起着十分重要作用的模式数据挖掘过程一般分为4个基本步骤:数据选择、数据转换、数据挖掘和结果分析Method第42页,课件共47页,创作于2023年2月生物数据的基本处理方法5.人工神经网络技术:人工神经网络(ArtificialNeuralNetwork,简称ANN)是通过模拟神经元的特性以及脑的大规模并行结构、信息的分布式和并行处理等机制建立的一种数学模型在生物信息学中,使用得最多的是反向传播神经网络(BackPropagationNeuralNetwork,简称BP网)。BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监督学习的网络模型。标准的BP网由三层神经元组成:输入层、隐藏层和输出层Method第43页,课件共47页,创作于2023年2月生物数据的基本处理方法5.人工神经网络技术:输入层隐藏层输出层反向传播神经网络结构示意Method第44页,课件共47页,创作于2023年2月生物数据的基本处理方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论