第10讲 蛋白质二级结构预测_第1页
第10讲 蛋白质二级结构预测_第2页
第10讲 蛋白质二级结构预测_第3页
第10讲 蛋白质二级结构预测_第4页
第10讲 蛋白质二级结构预测_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十讲蛋白质二级结构预测中心法则(thecentraldogma)蛋白质结构

蛋白质功能转录翻译?翻译细胞质核糖体氨基酸折叠密码(foldingcode)又称“第二遗传密码”,蛋白质的氨基酸序列与其三维空间结构间的关系。破译折叠密码:从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。在生物学研究中,分子的结构是最重要的数据它提供很多信息,包括生物分子的功能、作用机制、进化历史等如何获得蛋白质结构….-Gly-Ala-Glu-Phe-….?解决方法一

:实验测定….-Gly-Ala-Glu-Phe-….X-射线晶体衍射核磁共振电镜技术?20世纪60年代解析一个蛋白质结构可以获得诺贝尔奖;20世纪70年代解析一个蛋白质结构则可成为轰动世界的新闻;20世纪80年代解析一个蛋白质结构则可申请到教授的职位;20世纪90年代解析一个蛋白质结构通常可以获得博士学位;蛋白质结构解析的发展YearLaureatePrizeRationale1914MaxvonLauePhysics"ForhisdiscoveryofthediffractionofX-raysbycrystals",[118]animportantstepinthedevelopmentofX-rayspectroscopy.1915WilliamHenryBraggWilliamLawrenceBraggPhysics"FortheirservicesintheanalysisofcrystalstructurebymeansofX-rays",[119]1962MaxF.PerutzJohnC.KendrewChemistry"fortheirstudiesofthestructuresofglobularproteins"[120]1962JamesDeweyWatsonFrancisHarryComptonCrickMauriceHughFrederickWilkinsMedicine"Fortheirdiscoveriesconcerningthemolecularstructureofnucleicacidsanditssignificanceforinformationtransferinlivingmaterial"[121]1964DorothyHodgkinChemistry"ForherdeterminationsbyX-raytechniquesofthestructuresofimportantbiochemicalsubstances"[122]1972StanfordMooreWilliamH.SteinChemistry"Fortheircontributiontotheunderstandingoftheconnectionbetweenchemicalstructureandcatalyticactivityoftheactivecentreoftheribonucleasemolecule"[123]1976WilliamN.LipscombChemistry"Forhisstudiesonthestructureofboranesilluminatingproblemsofchemicalbonding"[124]1985JeromeKarleHerbertA.HauptmanChemistry"Fortheiroutstandingachievementsindevelopingdirectmethodsforthedeterminationofcrystalstructures"[125]1988JohannDeisenhoferHartmutMichelRobertHuberChemistry"Fortheirdeterminationofthethree-dimensionalstructureofaphotosyntheticreactioncentre"[126]1997JohnE.WalkerChemistry"Fortheirelucidationoftheenzymaticmechanismunderlyingthesynthesisofadenosinetriphosphate(ATP)"[127]2003RoderickMacKinnonPeterAgreChemistry"Fordiscoveriesconcerningchannelsincellmembranes[...]forstructuralandmechanisticstudiesofionchannels"[128]2006RogerD.KornbergChemistry"Forhisstudiesofthemolecularbasisofeukaryotictranscription"[129]2009AdaE.YonathThomasA.SteitzVenkatramanRamakrishnanChemistry"Forstudiesofthestructureandfunctionoftheribosome"[130]2012BrianKobilkaRobertLefkowitz

Chemistry"ForstudiesofG-protein-coupledreceptors"[131]X射线晶体学全解析的第一个蛋白质

结构--肌红蛋白2005年,线粒体膜蛋白复合物2精细结构X射线衍射测定蛋白和核酸精细结构,为新药设计提供了全新方向中国科学家研制抗癌新药首获瑞典爱明诺夫奖2016.03Lastupdate:TuesdayMar01,2016at4PMPST

数量大技术难度高瓶颈实验测定蛋白质结构三维结构数据与一维序列数据在量上增长速度严重不协调解决方法二:结构预测….-Gly-Ala-Glu-Phe-….蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维空间结构。Levinthal悖论(Levinthal'sParadox)一个100个氨基酸组成的肽链的折叠:假设:三种可能构象/氨基酸残基3100种不同构象;即使:10-13秒(0.1皮秒)/可能构想,(一皮秒:十亿分之一秒的千分之一)5x1034秒,or1027年(宇宙年龄1010年)CyrusLevinthal(1996):美国分子生物学家

蛋白质结构预测的理论基础:Anfinsen理论(Anfinsen'sdogma)ChristianBoehmerAnfinsen,Jr.(1916–1995)美国生物化学家,1972诺贝尔化学奖获得者蛋白质序列含有蛋白质折叠的全部信息!凡人改变世界?Folding@home:(始于2000年10月)分布式蛋白质折叠计算,它是众多分布式计算项目之一,也是最出名、普及最广泛的之一。它所凝聚的志愿者计算能力,比肩世界最快的超级计算机“天河二号”。Intel、Google、NVIDIA、AMD(前ATI)、索尼、苹果、戴尔等厂商形成了一个支持Folding@home项目发展的同盟。

蛋白质结构的层次与结构预测初级结构(primarystructure)-螺旋(-helix)

-折叠(-pleatedsheet)二级结构(secondarystructure)四级结构(quaternarystructure)三级结构(tertiarystructure)SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)蛋白质的二级结构预测判断每一段中心的残基是否处于-螺旋、-折叠(或其它状态)的二级结构态。1.经验参数法(Chou-Fasman方法)由Chou和Fasman在70年代提出来。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子(P(ɑ-helix)、P(β-sheet)),进而利用这些倾向性因子预测蛋白质的二级结构。理论依据:每种氨基酸出现在各种二级结构中倾向或者频率是不同的。例如:谷氨酸(Glu,E):-螺旋(√)缬氨酸(Val,V):-折叠(√)脯氨酸(Pro,P):-螺旋(X)氨基酸残基的构象倾向性因子定义:

Pi=Ai/Ti (i=,β,c,t) i表示构象态:如螺旋、β折叠、转角、无规卷曲等;Ti是所有被统计残基处于构象态i的比例;Ai是第A种残基处于构象态i的比例;Pi大于1.0表示该残基倾向于形成二级结构构象i,小于1.0则表示倾向于形成其它构象。四个转角参数,f(i)、f(i+1)、f(i+2)和f(i+3)。这四个参数分别对应于每种残基出现在转角第一、第二、第三和第四位的频率(例如,脯氨酸约有30%出现在转角的第二位,然而出现在第三位的几率不足4%)。Chou-Fasman参数基本思想是在序列中寻找规则二级结构的成核位点和终止位点。扫描输入的氨基酸序列,发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于某个阈值(1.0)为止。成核区延伸延伸ɑ-螺旋Chou-Fasman参数法预测二级结构的经验规则氨基酸残基(i)α螺旋规则(ii)β折叠规则(iii)转角规则

(iv)重叠规则经验规则(i)α螺旋规则沿蛋白质序列寻找α螺旋核相邻的6个残基中如果有至少4个残基倾向于形成α螺旋,则认为是螺旋核。从螺旋核向两端延伸直至四肽片段的α螺旋倾向性因子的平均值{P}<1.0为止。将螺旋两端各去掉3个残基剩余部分若长于6个残基,而且{P}>1.03,则预测为螺旋。(ii)β折叠规则相邻6个残基中若有4个倾向于形成β折叠,则认为是折叠核。折叠核向两端延伸直至4个残基的平均折叠倾向性因子{P}<1.0。若延伸后的片段的{P}>1.05,则预测为β折叠。在实际运用中有50-60%的准确率,虽然有文章宣称能达到更高的准确率(数据集受限)(iii)β-转角规则转角的模型为四肽组合模型,要考虑每个位置上残基的组合概率,即特定残基在四肽模型中各个位置的概率。在计算过程中,对于从第i个残基开始的连续4个残基的片段,将上述概率相乘,根据计算结果判断是否是转角。如果f(i)×f(i+1)×f(i+2)×f(i+3)大于7.5×10-5,四肽片段Pt的平均值大于100,并且Pt的均值同时大于P

的均值以及P

的均值,则可以预测这样连续的4个残基形成转角。

2.基于氨基酸疏水性的预测方法α螺旋的两亲特特征:螺旋的一侧通常处于蛋白质的疏水核心,另一侧则常处于亲水表面,因此,α-螺旋中亲疏水氨基酸残基的出现位置也就有一定的规律性,亲水残基多出现在亲水侧面,而疏水残基则多出现在疏水侧面,反映在序列上就是一些特征的亲疏水残基间隔模式。脂肪族疏水性氨基酸极性或带负电氨基酸带正电氨基酸432151432α-螺旋的两亲特特征与结构预测基于氨基酸疏水性的预测α螺旋的形成规律:在一段序列中发现第i、i+3、i+4位(如1、4、5)是疏水残基时,这一片段就被预测为α螺旋;当发现第i、i+1、i+4位(如7,8,11)为疏水残基时,这一片段也被预测为α螺旋。基于氨基酸疏水性的预测β折叠的形成规律:对于β折叠,也存在着一些特征的亲疏水残基间隔模式,埋藏的β折叠通常由连续的疏水残基组成,一侧暴露的β折叠则通常具有亲水-疏水的两残基重复模式。原则上,通过在序列中搜寻特殊的亲疏水残基间隔模式,就可以预测α螺旋和β折叠。将待预测的片段与数据库中已知二级结构的片段进行相似性比较,根据相似性得分以及数据库中的构象态,构建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性大于30%的序列,则预测准确率可大大上升。3.基于多重序列比对的方法(同源法)

序列比对:

T=TNGIY

U=TSGVF

将T的构象态赋予U相似序列→相似结构4.综合方法多个程序同时预测

综合评判,一致结果双重预测:首先预测蛋白质的结构类型,然后再预测二级结构经验参数法基于氨基酸疏水性的预测方法同源分析法蛋白质二级结构预测的意义由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或蛋白质突变体的设计。当序列同源性较低时,二级结构的指认有助于确定蛋白质间结构与功能的关系。在基于二级结构片段堆积的三级结构预测中正确的二级结构预测是第一步。二级结构的预测有助于多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。蛋白质二级结构在线预测PHDsecneuralnetworkforsecondarystructureprediction,accesibility,andtrans-membranehelix.Usesmultiplealignments.Reliability~70%.Jpred

uses2neuralnetworksandincludesevolutiveinformation(PSI-BLAST).Theversion2evaluatestheresultsof4networks(JNet,NSSP,Predator,PHD)toimprovereliability.pbio.dundee.ac.uk/jpred/PROFBasedonmultiplealignmentsandotherresiduepropertiesobtainedfromdatabases.Relaibility~70%.PSIpred

Basedonfilteredpsi-blastprofilesandneuralnetworks(combinesreultsfromdifferentmethods).relaibilityis>76%.

PredictProtein

(PHDsec)

PsiPred

JPred

蛋白质折叠病同源建模法(Homologymodelling)线索化法/折叠识别法/串线法(Threading/Foldrecognition)从头预测法(Abinitio/Denovomethods)蛋白质三级结构预测蛋白质三级结构预测

1.同源蛋白质结构预测依据:任何一对蛋白质,如果两者的序列等同部分超过30%(序列比对长度大于80),则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。主要思想:对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。搜索结构模型的模板序列比对建立骨架构建目标蛋白质的侧链、环区、加入氢原子优化模型同源建模的过程将模板结构的坐标拷贝到目标U,仅拷贝匹配残基的坐标

分子力学分子动力学模拟退火

PDB数据库SWISS-MODEL:

//SWISS-MODEL.html同源建模方法特点绕过了二级结构预测目前蛋白质结构预测方法中最成功、最准确、使用最多局限是:仅仅是一种技术手段,而非理论应用范围收已有同源结构的限制Loop区域准确率差又称蛋白质折叠类型识别依据:蛋白质折叠模式的有限性:一些序列(小于25%,远程同源)/功能不同的蛋白质采用类似的结构,蛋白质折叠模式的种类是有限的。序列中的残基的结构信息比残基本身更加保守。蛋白质三级结构预测

2.线索化方法蛋白质结构分类数据库SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)CATH的结构层次主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。具体做法是即将结构转换为含有这三个结构的字符串,然后对这些字符串进行比较。线索技术的首要任务是建立核心折叠数据库在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论