蛋白质结构预测的原理与方法_第1页
蛋白质结构预测的原理与方法_第2页
蛋白质结构预测的原理与方法_第3页
蛋白质结构预测的原理与方法_第4页
蛋白质结构预测的原理与方法_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

蛋白质结构预测的

原理与方法第一节引言中心法则蛋白质翻译一.蛋白质的组成

氨基酸是蛋白质的单体。天然存在于蛋白质中的氨基酸共有20种。氨基酸由肽键相连形成多肽链二.蛋白质结构的层次一级结构-氨基酸序列二级结构-主要由氢键稳固的局部构象,如

-helix,

-sheet,

-turn等

-helix

-sheet三级结构

-三维构象N端

C端肌酸激酶肌红蛋白四级结构

-多个多肽链的组合三.蛋白质折叠折叠时间极短四.影响蛋白质折叠的因素

对于水溶性蛋白来说,多肽链的折叠主要受氨基酸侧链的疏水性所驱动。五.蛋白质结构域的折叠模式

结构域可以按二级结构的种类及排列方式进行分类,其基本基本类型:

/、/、/、/六.蛋白质结构预测序列——结构——功能….-Gly-Ala-Glu-Phe-….功能?解决方法….-Gly-Ala-Glu-Phe-….FUNCTION!

蛋白质结构预测:寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射七.蛋白质结构预测的流程序列对比二级结构预测三级结构预测蛋白质结构模建蛋白质结构的检验八.蛋白质结构数据库蛋白质结构数据库PDB/pdb/九.蛋白质结构分类数据库SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)十.蛋白质的进化

同源性的蛋白往往具有相关的功能并采取相似的三维结构,序列的相同性有时可以低到20%。但三维结构总体上是保守的。类似的蛋白质可以采取相似的三维结构,但序列的同源性要低于20%。如何识别蛋白质的同源性和类似性是蛋白质结构预测中的一个重要问题。蛋白质结构预测主要有两大类方法:(1)理论分析方法通过理论计算(如分子力学、分子动力学计算)进行结构预测。十一.蛋白质结构预测方法(2)统计的方法对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。包括:经验性方法结构规律提取方法同源模型化方法第二节 蛋白质二级结构预测

蛋白质序列:↓二级结构:二级结构预测

蛋白质序列:二级结构:QLMGERIRARRKKLK→STHHHHHHHHHHHHT

1、二级结构预测概述蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二级结构的倾向。二级结构预测问题是模式分类问题二级结构预测的目标:判断每一段中心的残基是否处于

螺旋、

折叠、转角(或其它状态)之一的二级结构态,即三态。基本策略(1)

相似序列→相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK结构?基本策略(2)

分类分析α螺旋提取样本聚类分析学习分类规则预测….-Gly-Ala-Glu-Phe-….二级结构预测的方法大体分为三代:

第一代是基于单个氨基酸残基统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析统计的对象是氨基酸片段片段的长度通常为11-21片段体现了中心残基所处的环境在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据这些算法可以归为几类:(1)基于统计信息(2)基于物理化学性质(3)基于序列模式(4)基于多层神经网络(5)基于多元统计(6)基于机器学习的专家规则(7)最邻近算法第一代和第二代预测方法对三态预测的准确率都小于70%,而对

折叠预测的准确率仅为28

48%,其主要原因是只利用局部信息第三代方法(考虑多条序列)运用长程信息和蛋白质序列的进化信息准确度有了比较大的提高2、蛋白质二级结构预测方法(1)经验参数法(Chou-Fasman法)

经验参数法由Chou和Fasman在70年代提出来,是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。内容:蛋白质二级结构的组成规律性比较强三种基本二级结构(

螺旋、

折叠、转角)平均占氨基酸残基的85%各种二级结构均匀地分布在蛋白质中

有些蛋白质中含有大量的

螺旋(血红蛋白和肌红蛋白)而一些蛋白质中则不含或者仅含很少的

螺旋(铁氧蛋白)有些蛋白质的二级结构以

折叠为主(免疫球蛋白)例:肽链Ala(A)-Glu(E)-Leu(L)-Met(M)倾向于形成

螺旋肽链Pro(P)-Gly(G)-Tyr(Y)-Ser(S)则不会形成

螺旋每种氨基酸出现在各种二级结构中倾向或者频率不同例如:Glu主要出现在

螺旋中

Asp和Gly主要分布在转角中

Pro也常出现在转角中,但是绝不会出现在

螺旋中

可以根据每种氨基酸残基形成二级结构的倾向性或者统计规律进行二级结构预测

(2)GOR方法是一种基于信息论算法和贝

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论