版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
蛋白质结构预测的原理与方法演示文稿1当前1页,总共76页。2优选蛋白质结构预测的原理与方法当前2页,总共76页。ExPASy
主要分析软件资源当前3页,总共76页。当前4页,总共76页。§6.1概述当前5页,总共76页。一、基本概念蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维空间结构。蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有生物活性的三维空间结构。第二套遗传密码:蛋白质的氨基酸序列与其三维空间结构间的关系。当前6页,总共76页。序列模体(motif):通常指蛋白质序列中相邻或相近的一组具有保守性的残基(或称基序),它与蛋白质分子及其家族的功能有关。当前7页,总共76页。二、蛋白质结构数据的获得圆二色性(circulardichroism,CD),描绘了不对称分子的用左右圆偏振光吸收差异谱表示的光学活性。在160-240nm的CD光谱可以快速了解蛋白质的二级结构,因为α螺旋,β折叠和卷曲产生不同的CD谱。X射线晶体衍射核磁共振光谱(nuclearmagneticresonancespectroscopy,NMR)当前8页,总共76页。三、蛋白质结构预测要解决的问题蛋白质结构预测问题 “序列-结构-功能”三者之间的关系….-Gly-Ala-Glu-Phe-….FUNCTION当前9页,总共76页。
又称蛋白质侵染因子。朊病毒是一类能侵染动物并在宿主细胞内复制的小分子无免疫性疏水蛋白质。目前发现的由朊病毒引起的疾病并不多,主要有:人类中的库鲁病(Kuru病)、克—雅氏综合症(CJD)、格斯特曼综合症(GSS)及致死性家族性失眠症(FFI),动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主要是引起神经系统和肌肉组织的损坏。案例:朊病毒当前10页,总共76页。β折叠,正常3%致病43%当前11页,总共76页。致病机理1982年普鲁辛纳提出了朊病毒致病的“蛋白质构象致病假说”,以后魏斯曼等人对其逐步完善。其要点如下:①朊病毒蛋白有两种构象:细胞型(正常型PrPc)和瘙痒型(致病型PrPsc)。两者的主要区别在于其空间构象上的差异。PrPc仅存在a螺旋,而PrPsc有多个β折叠存在,后者溶解度低,且抗蛋白酶解;②Prpsc可胁迫PrPc转化为PrPsc,实现自我复制,并产生病理效应;③基因突变可导致细胞型PrPsc中的α螺旋结构不稳定,至一定量时产生自发性转化,β片层增加,最终变为PrPsc型,并通过多米诺效应倍增致病。当前12页,总共76页。….-Gly-Ala-Glu-Phe-….结构预测问题FUNCTION?关键限制因素当前13页,总共76页。解决方法….-Gly-Ala-Glu-Phe-….FUNCTION!解决方案当前14页,总共76页。四、蛋白质预测的一般流程当前15页,总共76页。五、影响蛋白质折叠的因素影响蛋白质结构稳定性的非共价键有:①范德华力。②偶极相互作用。③部分电荷或完整电荷间静电相互作用。④氢键。氢键是形成蛋白质中规则二级结构的主要作用力。⑤熵效应。除了原子间的共价连接以外,蛋白质结构的形成及稳定性在很大程度上依赖于非键相互作用。当前16页,总共76页。熵效应:是热力学的一个概念。它是指在一个封闭的并存在能量差异的系统中,虽然系统内总能量保持守衡,但能量却总是不可逆转地由高能区向低能区流动,最终达到能量的分散与平衡的一种状态和趋势。当前17页,总共76页。§6.2蛋白质结构分析当前18页,总共76页。一、蛋白质结构分类蛋白质结构依据不同的层次可以分为四类:1)一级结构(氨基酸序列)2)二级结构(规则结构,如a螺旋、折叠)3)三级结构(简单蛋白质的三维空间结构,或复杂蛋白质亚基的三维空间结构)4)四级结构(亚基的组装)当前19页,总共76页。….-Gly-Ala-Glu-Phe-….一级结构二级结构三级结构四级结构当前20页,总共76页。四级结构(quaternarystructure):由多个亚基组成的蛋白质分子的空间结构。五级结构(quinternarystructure):蛋白质与蛋白质、蛋白质与核酸相互作用时的空间位置关系。当前21页,总共76页。二、周期性的二级结构1)α螺旋是蛋白质结构中最常见的二级结构,由于在α螺旋内部每隔3-4个氨基酸残基形成氢键,因而本身的稳定性较好。α螺旋由于与溶剂的作用或中间有脯氨酸等也会发生弯曲。不同的残基对于α螺旋中间部位及N端或C端出现的倾向性不同。2)β折叠片是由带状的β折叠股间形成氢键而构成的,在氨基酸序列上往往是不连续的。几乎所有的β折叠片在沿着β折叠股的方向均发生右手的扭曲,在β折叠股间形成左手的扭曲。某些残基倾向于出现在β折叠中。当前22页,总共76页。三、非周期性的二级结构连接规则二级结构间的区域统称为环区(loop或Coil,简写为C),这些环区本身的结构也是遵循一定规律的。①β转角是由四个残基构成的,使得蛋白质主链的走向形成180度的回折。β转角可以分为几种特定的类型,并具有一定的氨基酸残基倾向性。②由三个残基构成的主链的回折称之为转角。③反平行的β折叠形成的β发夹具有特定的结构。α螺旋间的短连接具有特定的结构与堆积。④当较大的环区的N端与C端靠近时就形成环。⑤非规则性环区也可以按照其平面性、手性及N端与C端的相对位置进行分类。当前23页,总共76页。α折叠β折叠α/β折叠α+β折叠当前24页,总共76页。四、超二级结构
二级结构间特定的组合构成超二级结构。1)α螺旋一般以特定的角度相堆积,使得一个螺旋的突出部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。2)β折叠片/β折叠片、α螺旋/β折叠片间的堆积有常出现的特定模式。β折叠片中的β折叠股以多种拓扑结构相连接,如希腊钥匙型结构等。平行的β折叠股间的连接(特别是βαβ单元)总是右手型的。随着已知蛋白质结构的增加,不断有新的超二级结构类型出现。当前25页,总共76页。五、蛋白质结构域的折叠模式与蛋白质结构分类数据库蛋白质结构域(domain):是蛋白质分子中介于二级结构和三级结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构域。结构域可以按照二级结构的种类及排列方式进行分类:①主要含有α螺旋的α/α结构;②主要含有β折叠片的β/β结构;③以α螺旋和β折叠交替出现的α/β结构;④混和型的α+β结构;⑤小于100残基的不含有明显规则二级结构的小蛋白。1蛋白质结构域的折叠模式当前26页,总共76页。2蛋白质折叠模式的有限性研究表明,一些序列/功能很不同的蛋白质采用类似的结构,这就提示人们蛋白质折叠模式的种类可能是有限的。当务之急发展快速的能够对蛋白质的折叠类型进行识别的方法。当前27页,总共76页。3蛋白质分类数据库蛋白质结构分类数据库对于蛋白质预测具有重要的意义。两个重要的蛋白质结构分类数据库:1)SCOP数据库2)CATH数据库当前28页,总共76页。六、蛋白质的进化1)同源性的蛋白质(homologousprotein)是从一个共同的祖先进化而来的,往往具有相关的功能(例如丝氨酸蛋白酶)并采取相似的三维结构。2)序列的相似性有时可低到20%以下,但三维结构在总体上是保守的。3)蛋白质结构的核心在序列上及三维结构上均比表面环区更保守。同源的蛋白质往往具有相似的三维结构;但具有相似的三维结构的蛋白质序列不一定是同源的。当前29页,总共76页。§6.3二级结构预测当前30页,总共76页。
蛋白质序列:
二级结构:蛋白质二级结构预测是蛋白质结构预测的主要组成部分之一。当前31页,总共76页。一、蛋白质二级结构预测概述蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二级结构的倾向。二级结构预测问题是模式分类问题二级结构预测的目标:判断每一段中心的残基是否处于螺旋、折叠、转角(或其它状态)之一的二级结构态,即三态。
当前32页,总共76页。基本策略(1)
相似序列→相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK当前33页,总共76页。二、蛋白质二级结构预测的意义蛋白质二级结构预测不仅仅可以给出二级结构信息,在实际工作中有广泛的用途。①由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或蛋白质突变体的设计。②当序列同源性较低时,二级结构的指认有助于确定蛋白质间结构与功能的关系。③在同源蛋白质模建中,二级结构预测有助于建立正确的序列比对关系。④在基于二级结构片段堆积的三级结构预测中正确的二级结构预测是第一步。⑤二级结构的预测有助于多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。当前34页,总共76页。三、蛋白质二级结构预测的主要方法二级结构预测的方法大体分为三代:第一代是基于单个氨基酸残基统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析统计的对象是氨基酸片段片段的长度通常为11-21片段体现了中心残基所处的环境在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据当前35页,总共76页。第一代和第二代预测方法对三态预测的准确率都小于70%,而对折叠预测的准确率仅为2848%。其主要原因是只利用局部信息第三代方法:考虑多条序列的同源进化信息运用长程信息和蛋白质序列的进化信息准确度有了比较大的提高当前36页,总共76页。1Chou-Fasman方法
Chou-Fasman方法曾经是、现在仍然是最为普遍应用的方法。其基本出发点在于对于蛋白质20种不同的氨基酸残基在不同的二级结构中出现的几率进行统计分析得出在不同二级结构中出现的倾向性。2GOR方法
GOR(Garnier-Osguthorpe-Robson)方法基于信息论算法,是所有统计算法中理论基础最好的。3最近邻居方法在最近邻居方法(nearestneighbormethod)中新测定的序列被归类于与已知的最相近的序列具有相同的二级结构。当前37页,总共76页。4神经网络方法相对而言神经网络方法便于应用,有较高的预测准确度。最大的缺点是没有明确的物理化学意义。
其中PHD方法是广泛应用的预测方法。5基于多重序列比对的二级结构预测基于单个序列的二级结构预测方法的预测准确度相对较低,大约在58%左右。而基于多重序列比对的二级结构预测方法PSI-PRED的预测准确度可达到77%。当前38页,总共76页。四、二级结构预测的准确度二级结构预测方法针对不同蛋白质所给出的准确度可能会有很大差别。1)单序列的预测准确度在60%左右。2)应用多重序列对比信息的二级结构预测准确度在65%~85%之间。当前39页,总共76页。五、二级结构在线预测许多蛋白质二级结构预测程序可以从因特网上免费下载至本地计算机进行蛋白二级结构预测。另外,还可以进行在线计算:可以通过送Email的方式,也可以在因特网上实时计算。可以进行二级结构在线预测两个网站为:1.PHD算法
PredictProtein网站的地址为:
2.SSPro4.0(神经网络)
当前40页,总共76页。PredictProtein可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。需要学术邮箱注册当前41页,总共76页。PredictProtein提交界面当前42页,总共76页。1D序列预测PROFsec(默认)是PHDsec的改进版本:基于轮廓(profile)的神经网络算法预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDhtm(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性来预测蛋白质结构域CHOP预测蛋白质结构域结构表面识别ConSeq预测蛋白质表面结构功能关键区域分析方法程序详解当前43页,总共76页。跨膜区非跨膜区当前44页,总共76页。LoopHelixSheet当前45页,总共76页。当前46页,总共76页。结果发送至邮箱当前47页,总共76页。结果直接发送至邮箱,如下:当前48页,总共76页。(a)-TypeImembraneprotein(b)-TypeIImembraneprotein(c)-Multipasstransmembraneproteins(多通道跨膜蛋白)(d)-Lipidchain-anchoredmembraneproteins(链吸附酯膜蛋白)(e)-GPI-anchoredmembraneproteins(GPI吸附膜蛋白)(糖基磷脂酰肌醇)
六、蛋白质跨膜区分析当前49页,总共76页。α螺旋跨膜区主要是由20-30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成。亲水残基往往出现在疏水残基之间,对功能有重要的作用。基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量。蛋白质跨膜区特性当前50页,总共76页。跨膜蛋白序列“边界”原则
-LandoltMarticorenaetal.,1993
胞外末端-Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外-内分界区域-Trp(色氨酸)跨膜区-Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞内-外分界区域-Tyr(酪氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端-Lys(赖氨酸)和Arg(精氨酸)当前51页,总共76页。常用蛋白质跨膜区域分析工具工具网站备注DAShttp://www.sbc.su.se/~miklos/DAS/用DenseAlignmentSurface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPhttp://www.enzim.hu/hmmtop/由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUIhttp://bp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPhttp://bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMhttp://www.cbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具TMpred/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredhttp://bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序当前52页,总共76页。TMpredTMpred工具:依靠跨膜蛋白数据库Tmbase预测跨膜区和跨膜方向在Expasy网站上有链接:/tools/当前53页,总共76页。当前54页,总共76页。主要参数/选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式最短和最长的跨膜螺旋疏水区长度输入序列名(可选)选择序列的格式贴入protein.txt蛋白质序列当前55页,总共76页。输出结果包含四个部分可能的跨膜螺旋区相关性列表可能的跨膜螺旋区相关性列表位置分值片段中点位置当前56页,总共76页。57
跨膜拓扑模型及图示建议的跨膜拓扑模型每一位置计算分值最优拓扑结构当前57页,总共76页。TMHMM当前58页,总共76页。输出结果当前59页,总共76页。§6.4三级结构预测当前60页,总共76页。三维结构数据与一维序列数据在量上增长速度严重不协调。原因:1直接测定法:速度慢2预测法:在方法上,还没有一个方法或程序可以真正做到所谓的“从头”预测蛋白的三维结构。当前61页,总共76页。一、同源蛋白质结构预测又称同源模型化方法主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。依据:任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。
当前62页,总共76页。同源蛋白质结构预测的方法
1)片段组装法:SWISS-MODEL2)距离几何法:MODELLERSWISS-MODEL:当前63页,总共76页。当前64页,总共76页。当前65页,总共76页。最后的预测结果当前66页,总共76页。模板序列与查询序列的装载结构的精细比对分子骨架的形成侧链形成和优化加入氢原子、优化回环能量最小化、结构封装SWISS-MODEL的工作过程:当前67页,总共76页。二、蛋白质折叠类型识别又称线索化方法有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%,即远程同源。对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。当前68页,总共76页。对于一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《通信电子线路》2022-2023学年期末试卷
- 淮阴师范学院《健身气功》2023-2024学年第一学期期末试卷
- 黄山学院《导游业务》2021-2022学年第一学期期末试卷
- 淮阴师范学院《新世纪文学批评》2023-2024学年第一学期期末试卷
- 小菜籽课件教学课件
- 淮阴师范学院《国际贸易理论与实务》2023-2024学年第一学期期末试卷
- 淮阴工学院《汽车运用工程1》2022-2023学年第一学期期末试卷
- 淮阴师范学院《编译原理》2021-2022学年第一学期期末试卷
- 淮阴工学院《园艺植物栽培学3》2022-2023学年第一学期期末试卷
- DB2102T+0114-2024海鲜预制菜产业园区建设指南
- 2024年中考历史九年级上册重点知识点复习提纲(部编版)
- 眼科门诊经营方案
- 《声声慢(寻寻觅觅)》
- 智慧小区建设售后服务方案
- 软件使用授权书
- Unit1KnowingMeKnowingYou如何写读后感课件高一下学期英语
- 脑卒中后吞咽障碍患者进食护理(2023年中华护理学会团体标准)
- DB21T 2885-2023居住建筑节能设计标准
- 压覆矿产资源调查评估规范
- 2023秋二年级上册《小学生数学报》数学学习能力调研卷
- 项目三婴幼儿皮肤疾病预防与照护
评论
0/150
提交评论