第六章蛋白质结构预测的原理与方法_第1页
第六章蛋白质结构预测的原理与方法_第2页
第六章蛋白质结构预测的原理与方法_第3页
第六章蛋白质结构预测的原理与方法_第4页
第六章蛋白质结构预测的原理与方法_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第六章第六章蛋白质结构预测蛋白质结构预测的原理与方法的原理与方法 2主要内容主要内容6.1 概述概述6.2 蛋白质结构分析蛋白质结构分析 6.3 二级结构预测二级结构预测 6.4 三三级结构预测级结构预测 3/proteomicsExPASy 主要分析软件资源456.1 概述概述6一、基本概念一、基本概念蛋白质结构预测蛋白质结构预测:指从蛋白质的氨基酸序列预测出:指从蛋白质的氨基酸序列预测出其三维空间结构。其三维空间结构。蛋白质折叠蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有:指蛋白质的氨基酸序列可折叠成具有生物活性的三维空间结构。生物活性的三维空间结

2、构。第二套遗传密码第二套遗传密码:蛋白质的氨基酸序列与其三维空蛋白质的氨基酸序列与其三维空间结构间的关系。间结构间的关系。 7序列模体(序列模体(motif):通常指蛋白质序列中相邻或相通常指蛋白质序列中相邻或相近的一组具有保守性的残基(或称基序),它与蛋近的一组具有保守性的残基(或称基序),它与蛋白质分子及其家族的功能有关。白质分子及其家族的功能有关。8二、蛋白质结构数据的获得二、蛋白质结构数据的获得圆二色性(圆二色性(circular dichroism, CD),),描绘了不对称描绘了不对称分子的用左右圆偏振光吸收差异谱表示的光学活性。在分子的用左右圆偏振光吸收差异谱表示的光学活性。在1

3、60-240nm的的CD光谱可以快速了解蛋白质的二级结构,光谱可以快速了解蛋白质的二级结构,因为因为螺旋,螺旋,折叠和卷曲产生不同的折叠和卷曲产生不同的CD谱。谱。X射线晶体衍射射线晶体衍射核磁共振光谱(核磁共振光谱(nuclear magnetic resonance spectroscopy, NMR)9三、蛋白质结构预测要解决的问题三、蛋白质结构预测要解决的问题 蛋白质结构预测问题蛋白质结构预测问题 “序列序列-结构结构-功能功能 ” 三者之间的关系三者之间的关系.-Gly-Ala-Glu-Phe-.FUNCTION10 又称蛋白质侵染因子。朊病毒是一类能侵染动物又称蛋白质侵染因子。朊病

4、毒是一类能侵染动物并在宿主细胞内复制的并在宿主细胞内复制的小分子无免疫性疏水蛋白小分子无免疫性疏水蛋白质质。 目前发现的由朊病毒引起的疾病并不多,目前发现的由朊病毒引起的疾病并不多, 主要主要有:人类中的有:人类中的库鲁病库鲁病(Kuru病)、克病)、克雅氏综合症雅氏综合症(CJD)、)、格斯特曼综合症(格斯特曼综合症(GSS)及致死性家族及致死性家族性失眠症(性失眠症(FFI),),动物中的水貂脑软化病,羊搔动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主要是引起神经系统和状脑病,疯牛病。这些疾病主要

5、是引起神经系统和肌肉组织的损坏。肌肉组织的损坏。案例:案例:朊病毒朊病毒11折叠,正折叠,正常常3致病致病4312致病机理致病机理19821982年年普鲁辛纳普鲁辛纳提出了朊病毒致病的提出了朊病毒致病的“蛋白质构象致蛋白质构象致病假说病假说”,以后魏斯曼等人对其逐步完善。其要点如,以后魏斯曼等人对其逐步完善。其要点如下:朊病毒蛋白有两种构象:下:朊病毒蛋白有两种构象:细胞型(正常型细胞型(正常型PrPcPrPc)和瘙痒型(致病型和瘙痒型(致病型PrPscPrPsc)。两者的主要区别在于其两者的主要区别在于其空间构象上的差异。空间构象上的差异。PrPcPrPc仅存在仅存在a a螺旋,而螺旋,而P

6、rPscPrPsc有多有多个个折叠存在,后者溶解度低,且抗蛋白酶解;折叠存在,后者溶解度低,且抗蛋白酶解;PrpscPrpsc可胁迫可胁迫PrPcPrPc转化为转化为PrPscPrPsc,实现自我复制,并实现自我复制,并产生病理效应;基因突变可导致细胞型产生病理效应;基因突变可导致细胞型PrPscPrPsc中的中的螺旋结构不稳定,至一定量时产生自发性转化,螺旋结构不稳定,至一定量时产生自发性转化,片片层增加,最终变为层增加,最终变为PrPscPrPsc型,并通过多米诺效应倍增致型,并通过多米诺效应倍增致病。病。13.-Gly-Ala-Glu-Phe-.结构预测问题FUNCTION?关键限制因素

7、关键限制因素14解决方法.-Gly-Ala-Glu-Phe-.FUNCTION!解决方案解决方案15四、蛋白质预测的一般流程四、蛋白质预测的一般流程16五、影响蛋白质折叠的因素五、影响蛋白质折叠的因素 影响蛋白质结构稳定性的非共价键有:影响蛋白质结构稳定性的非共价键有: 范德华力。范德华力。 偶极相互作用。偶极相互作用。 部分电荷或完整电荷间静电相互作用。部分电荷或完整电荷间静电相互作用。 氢键。氢键是形成蛋白质中规则二级结构的主要作用力。氢键。氢键是形成蛋白质中规则二级结构的主要作用力。 熵效应熵效应。除了原子间的共价连接以外,蛋白质结构的形成及除了原子间的共价连接以外,蛋白质结构的形成及稳

8、定性在很大程度上依赖于稳定性在很大程度上依赖于非键相互作用非键相互作用。 17熵效应:熵效应:是热力学的一个概念。它是指在一是热力学的一个概念。它是指在一个封闭的并存在能量差异的系统中,虽然系个封闭的并存在能量差异的系统中,虽然系统内总能量保持守衡,但能量却总是不可逆统内总能量保持守衡,但能量却总是不可逆转地由高能区向低能区流动,最终达到能量转地由高能区向低能区流动,最终达到能量的分散与平衡的一种状态和趋势。的分散与平衡的一种状态和趋势。186.2 蛋白质结构分析蛋白质结构分析19一、蛋白质结构分类一、蛋白质结构分类蛋白质结构依据不同的层次可以分为四类:蛋白质结构依据不同的层次可以分为四类:1

9、 1)一级结构(氨基酸序列)一级结构(氨基酸序列)2 2)二级结构(规则结构,如)二级结构(规则结构,如a a螺旋、螺旋、 折叠)折叠)3 3)三级结构(简单蛋白质的三维空间结构,或复)三级结构(简单蛋白质的三维空间结构,或复杂蛋白质亚基的三维空间结构)杂蛋白质亚基的三维空间结构)4 4)四级结构(亚基的组装)四级结构(亚基的组装)20.-Gly-Ala-Glu-Phe-.一级结构一级结构二级结构二级结构三级结构三级结构四级结构四级结构21四级结构四级结构(quaternary structure):由多个亚由多个亚基组成的蛋白质分子的空间结构。基组成的蛋白质分子的空间结构。五级结构(五级结构

10、(quinternary structure):蛋白质蛋白质与蛋白质、蛋白质与核酸相互作用时的空与蛋白质、蛋白质与核酸相互作用时的空间位置关系。间位置关系。22二、周期性的二级结构二、周期性的二级结构1 1)螺旋螺旋是蛋白质结构中最常见的二级结构,由于在是蛋白质结构中最常见的二级结构,由于在螺旋内部每隔螺旋内部每隔3 34 4个氨基酸残基形成氢键,因而本身的个氨基酸残基形成氢键,因而本身的稳定性较好。稳定性较好。螺旋由于与溶剂的作用或中间有脯氨酸螺旋由于与溶剂的作用或中间有脯氨酸等也会发生弯曲。不同的残基对于等也会发生弯曲。不同的残基对于螺旋中间部位及螺旋中间部位及N N端端或或C C端出现的

11、倾向性不同。端出现的倾向性不同。2 2) 折叠片折叠片是由带状的是由带状的折叠股间形成氢键而构成的,折叠股间形成氢键而构成的,在氨基酸序列上往往是不连续的。几乎所有的在氨基酸序列上往往是不连续的。几乎所有的折叠片折叠片在沿着在沿着折叠股的方向均发生右手的扭曲,在折叠股的方向均发生右手的扭曲,在折叠股折叠股间形成左手的扭曲。间形成左手的扭曲。某些残基倾向于出现在某些残基倾向于出现在折叠中折叠中。23三、非周期性的二级结构三、非周期性的二级结构 连接规则二级结构间的区域统称为连接规则二级结构间的区域统称为环区环区(looploop或或CoilCoil,简写为简写为C C),),这些环区本身的结构也

12、是遵循一定规律的。这些环区本身的结构也是遵循一定规律的。 转角转角是由四个残基构成的,使得蛋白质主链的是由四个残基构成的,使得蛋白质主链的走向形成走向形成180180度的回折。度的回折。转角可以分为几种特定的类型,转角可以分为几种特定的类型,并具有一定的氨基酸残基倾向性。并具有一定的氨基酸残基倾向性。 由三个残基构成的主链的回折称之为由三个残基构成的主链的回折称之为 转角转角。 反平行的反平行的折叠形成的折叠形成的发夹发夹具有特定的结构。具有特定的结构。 螺旋间的短连接具有特定的结构与螺旋间的短连接具有特定的结构与堆积堆积。 当较大的环区的当较大的环区的N N端与端与C C端靠近时就形成端靠近

13、时就形成 环环。 非规则性环区非规则性环区也可以按照其平面性、手性及也可以按照其平面性、手性及N N端与端与C C端的相对位置进行分类。端的相对位置进行分类。 24折叠折叠/折叠+折叠25四、超二级结构四、超二级结构 二级结构间特定的组合构成超二级结构。二级结构间特定的组合构成超二级结构。1)1)螺旋一般以特定的角度相堆积,使得一个螺旋的突出螺旋一般以特定的角度相堆积,使得一个螺旋的突出部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。嵌合。2)2)折叠片折叠片/ /折叠片、折叠片、螺旋螺旋/ /折叠片间的堆积有常出折叠片间的堆积有常出现

14、的特定模式。现的特定模式。 折叠片中的折叠片中的折叠股以多种拓扑结构折叠股以多种拓扑结构相连接,如希腊钥匙型结构等。平行的相连接,如希腊钥匙型结构等。平行的折叠股间的连接折叠股间的连接(特别是(特别是单元)总是右手型的。单元)总是右手型的。 随着已知蛋白质结构的增加,不断有新的超二级结构随着已知蛋白质结构的增加,不断有新的超二级结构类型出现。类型出现。 26五、蛋白质结构域的折叠模式与蛋白质结构分类数据库五、蛋白质结构域的折叠模式与蛋白质结构分类数据库蛋白质结构域(蛋白质结构域(domaindomain): :是蛋白质分子中介于二级结构是蛋白质分子中介于二级结构和三级结构之间的结构层次。在分子

15、量较大的球形蛋白质分和三级结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条多肽链可能折叠成两个或多个空间上互相独立的子中,一条多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构域。区域,称为结构域。 结构域可以按照二级结构的种类及排列方式进行分类:结构域可以按照二级结构的种类及排列方式进行分类: 主要含有主要含有螺旋的螺旋的/结构;结构; 主要含有主要含有折叠片的折叠片的/结构;结构; 以以螺旋和螺旋和折叠交替出现的折叠交替出现的/结构;结构; 混和型的混和型的结构;结构; 小于小于100100残基的不含有明显规则二级结构的小蛋白。残基的不含有明显规则二级结构的小蛋白。 1 蛋白

16、质结构域的折叠模式蛋白质结构域的折叠模式272蛋白质折叠模式的有限性蛋白质折叠模式的有限性 研究表明,一些序列功能很不同的蛋白质采用研究表明,一些序列功能很不同的蛋白质采用类似的结构,这就提示人们蛋白质折叠模式的种类类似的结构,这就提示人们蛋白质折叠模式的种类可能是有限的。可能是有限的。 当务之急当务之急发展快速的能够对蛋白质的折叠类型进行识别的方法。发展快速的能够对蛋白质的折叠类型进行识别的方法。283蛋白质分类数据库蛋白质分类数据库蛋白质结构分类数据库蛋白质结构分类数据库 对于蛋白质预测对于蛋白质预测具有重要的意义。具有重要的意义。两个重要的蛋白质结构分类数据库:两个重要的蛋白质结构分类数

17、据库:1 1)SCOPSCOP数据库数据库2 2)CATHCATH数据库数据库29六、蛋白质的进化六、蛋白质的进化1 1)同源性的蛋白质()同源性的蛋白质(homologous proteinhomologous protein)是从是从一个共同的祖先进化而来的,往往具有相关的功能一个共同的祖先进化而来的,往往具有相关的功能(例如丝氨酸蛋白酶)并采取相似的三维结构。(例如丝氨酸蛋白酶)并采取相似的三维结构。2 2)序列的相似性有时可低到)序列的相似性有时可低到2020以下,但三维结以下,但三维结构在总体上是保守的。构在总体上是保守的。3 3)蛋白质结构的)蛋白质结构的核心核心在序列上及三维结构

18、上均比在序列上及三维结构上均比表面表面环区环区更保守。更保守。同源的蛋白质往往具有相似的三维结构;但具有同源的蛋白质往往具有相似的三维结构;但具有相似的三维结构的蛋白质序列不一定是同源的。相似的三维结构的蛋白质序列不一定是同源的。306.3 二级结构预测二级结构预测 31 蛋白质蛋白质 序列:序列: 二级结构:二级结构:蛋白质二级结构预测是蛋白质结构预测的蛋白质二级结构预测是蛋白质结构预测的主要组成部分之一主要组成部分之一 。32一、蛋白质一、蛋白质二级结构预测概述二级结构预测概述 蛋白质的二级结构预测的基本依据是:蛋白质的二级结构预测的基本依据是:每一段相邻的氨基酸残基具有形成一定二级每一段

19、相邻的氨基酸残基具有形成一定二级结构的倾向。结构的倾向。 二级结构预测问题是模式分类问题二级结构预测问题是模式分类问题 二级结构预测的目标二级结构预测的目标: 判断每一段中心的残基是否处于判断每一段中心的残基是否处于 螺旋、螺旋、 折叠、折叠、转角(或其它状态)之一的二级结构态,即三态。转角(或其它状态)之一的二级结构态,即三态。 33基本策略(1)相似序列相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK34二、蛋白质二级结构预测的意义二、蛋白质二级结构预测的意义蛋白质二级结构预测不仅仅可以给出二级结构信息,在蛋白质二级结构预测不仅仅可以给出二级结构信息,在实际工作中有广

20、泛的用途。实际工作中有广泛的用途。 由蛋白质二级结构统计分析得到的规则可用于由蛋白质二级结构统计分析得到的规则可用于全新蛋白全新蛋白质设计或蛋白质突变体的设计质设计或蛋白质突变体的设计。 当序列同源性较低时,二级结构的指认有助于当序列同源性较低时,二级结构的指认有助于确定蛋白确定蛋白质间结构与功能的关系质间结构与功能的关系。 在同源蛋白质模建中,二级结构预测有助于在同源蛋白质模建中,二级结构预测有助于建立正确的建立正确的序列比对关系序列比对关系。 在基于二级结构片段堆积的在基于二级结构片段堆积的三级结构预测三级结构预测中正确的二级中正确的二级结构预测是第一步。结构预测是第一步。 二级结构的预测

21、有助于二级结构的预测有助于多维核磁共振中二级结构的指认多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。,同时也有助于晶体结构的解析。 35三、蛋白质二级结构预测的主要方法三、蛋白质二级结构预测的主要方法 二级结构预测的方法大体分为三代:二级结构预测的方法大体分为三代:第一代第一代是基于是基于单个氨基酸残基单个氨基酸残基统计分析统计分析 从有限的数据集中提取各种残基形成特定二级结构的从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。倾向,以此作为二级结构预测的依据。第二代第二代预测方法是基于预测方法是基于氨基酸片段氨基酸片段的统计分析的统计分析 统计的对象

22、是氨基酸片段统计的对象是氨基酸片段 片段的长度通常为片段的长度通常为11-2111-21 片段体现了中心残基所处的片段体现了中心残基所处的环境环境 在预测中心残基的二级结构时,以残基在特定环境形在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据成特定二级结构的倾向作为预测依据 36第一代和第二代预测方法对三态预测的准第一代和第二代预测方法对三态预测的准确率都小于确率都小于70%70%,而对,而对 折叠预测的准确率仅折叠预测的准确率仅为为2828 48%48%。 其主要原因是只利用局部信息其主要原因是只利用局部信息第三代第三代方法方法: :考虑多条序列的同源进化信息考

23、虑多条序列的同源进化信息 运用长程信息和蛋白质序列的进化信息运用长程信息和蛋白质序列的进化信息 准确度有了比较大的提高准确度有了比较大的提高371 1ChouChouFasmanFasman方法方法 ChouChouFasmanFasman方法曾经是、现在仍然是最为普遍应方法曾经是、现在仍然是最为普遍应用的方法。其基本出发点在于对于蛋白质用的方法。其基本出发点在于对于蛋白质2020种不同的氨种不同的氨基酸残基在不同的二级结构中出现的几率进行统计分析基酸残基在不同的二级结构中出现的几率进行统计分析得出在不同二级结构中出现的倾向性。得出在不同二级结构中出现的倾向性。 2 2GORGOR方法方法 G

24、ORGOR(GarnierGarnierOsguthorpeOsguthorpeRobsonRobson)方法基于方法基于信息论算法,是所有信息论算法,是所有统计算法统计算法中理论基础最好的。中理论基础最好的。3 3最近邻居方法最近邻居方法 在最近邻居方法(在最近邻居方法(nearest neighbor methodnearest neighbor method)中中新测定的序列被归类于与已知的最相近的序列具有相同新测定的序列被归类于与已知的最相近的序列具有相同的二级结构。的二级结构。 384 4神经网络方法神经网络方法相对而言神经网络方法便于应用,有较高的预测相对而言神经网络方法便于应用,

25、有较高的预测准确度。最大的缺点是没有明确的物理化学意义。准确度。最大的缺点是没有明确的物理化学意义。 其其中中PHDPHD方法方法 是广泛应用的预测方法。是广泛应用的预测方法。 5 5基于多重序列比对的二级结构预测基于多重序列比对的二级结构预测 基于单个序列的二级结构预测方法的预测准确基于单个序列的二级结构预测方法的预测准确度相对较低,大约在度相对较低,大约在5858左右。而基于多重序列比左右。而基于多重序列比对的二级结构预测方法对的二级结构预测方法PSI-PREDPSI-PRED的预测准确度可达的预测准确度可达到到7777。39四、二级结构预测的准确度四、二级结构预测的准确度二级结构预测方法

26、针对不同蛋白质所给出的二级结构预测方法针对不同蛋白质所给出的准确度可能会有很大差别。准确度可能会有很大差别。1 1)单序列的预测准确度在)单序列的预测准确度在6060左右。左右。2 2)应用多重序列对比信息的二级结构预测准)应用多重序列对比信息的二级结构预测准确度在确度在 65 658585之间。之间。 40五、二级结构在线预测五、二级结构在线预测许多蛋白质二级结构预测程序可以从因特网上免费下载许多蛋白质二级结构预测程序可以从因特网上免费下载至本地计算机进行蛋白二级结构预测。另外,还可以进行在至本地计算机进行蛋白二级结构预测。另外,还可以进行在线计算:可以通过送线计算:可以通过送EmailEm

27、ail的方式,也可以在因特网上实时的方式,也可以在因特网上实时计算。计算。可以进行二级结构可以进行二级结构在线预测在线预测两个网站为:两个网站为:1 1PHDPHD算法算法 PredictProteinPredictProtein网站的地址为:网站的地址为: / 2 2SSPro 4.0(SSPro 4.0(神经网络)神经网络) / 41 PredictProtein / 可以获得功能预测、二级结构、基序、二硫键

28、结构、结构域可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息等许多蛋白质序列的结构信息 该方法的平均准确率超过该方法的平均准确率超过72%,最佳残基预测准确率达,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。以上。因此,被视为蛋白质二级结构预测的标准。 需要学术邮箱注册需要学术邮箱注册42PredictProtein提交界面提交界面431D序列预测PROFsec(默认)是PHDsec的改进版本:基于轮廓(profile)的神经网络算法预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDht

29、m(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性来预测蛋白质结构域CHOP预测蛋白质结构域结构表面识别ConSeq预测蛋白质表面结构功

30、能关键区域分析方法程序详解分析方法程序详解44跨膜区跨膜区非跨膜区非跨膜区45LoopHelixSheet4647结果发送至邮箱结果发送至邮箱48结果直接发送至邮箱,如下:结果直接发送至邮箱,如下:49(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(多通道跨膜蛋白)(d)-Lipid chain-anchored membrane proteins(链吸附酯膜蛋白)(e)-GPI-anchored membrane proteins(GPI吸附膜蛋白)(糖基磷

31、脂酰肌醇)糖基磷脂酰肌醇) 六、蛋白质跨膜区分析六、蛋白质跨膜区分析50 螺旋跨膜区主要是由螺旋跨膜区主要是由20-30个疏水性氨基酸个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成。等)组成。 亲水残基往往出现在疏水残基之间,对功能有亲水残基往往出现在疏水残基之间,对功能有重要的作用。重要的作用。 基于亲基于亲/疏水量和蛋白质膜区每个氨基酸的统疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量。计学分布偏好性量。蛋白质跨膜区特性蛋白质跨膜区特性51跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 -Landolt Marticorena et al., 1993 胞外末端As

32、p(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) 胞外-内分界区域Trp(色氨酸) 跨膜区Leu(亮氨酸(亮氨酸)、Ile(异亮氨酸异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸(甘氨酸) 胞内-外分界区域Tyr(酪氨酸)、Trp(色氨酸)和Phe(苯丙氨酸) 胞内末端Lys(赖氨酸)和Arg(精氨酸)52常用蛋白质跨膜区域分析工具常用蛋白质跨膜区域分析工具工具工具网站网站备注备注DAShttp:/www.sbc.su.se/miklos/DAS/用Dense Alignment

33、Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPhttp:/www.enzim.hu/hmmtop/由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具TMpredhttp:/www.ch.embnet

34、.org/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序53TMpred TMpred工具工具: /software/TMPRED_form.html 依靠跨膜蛋白数据库Tmbase 预测跨膜区和跨膜方向在在Expasy网站上有链接:网站上有链接:/tools/5455主要参数主要参数/ /选

35、项选项 序列在线提交形式: 直接贴入蛋白序列 填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列56输出结果输出结果 包含四个部分 可能的跨膜螺旋区 相关性列表可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表位置位置分值分值 片段中点位置片段中点位置5757 跨膜拓扑模型及图示跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型每一位置计算分值每一位置计算分值最优拓最优拓扑结构扑结构5

36、8TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM/59输出结果输出结果606.4 三三级结构预测级结构预测61三维结构数据与一维序列数据在量上增长三维结构数据与一维序列数据在量上增长速度严重不协调。速度严重不协调。原因:原因:1直接测定法:速度慢直接测定法:速度慢2预测法:在方法上,还没有一个方法或程序可预测法:在方法上,还没有一个方法或程序可以真正做到所谓的以真正做到所谓的“从头从头”预测蛋白的三维结构。预测蛋白的三维结构。62一、同源蛋白质结构预测一、同源蛋白质结构预测 又称又称同源模型化方法同源模型化方法 主要思想:主要思想:对于一个未知结构的蛋白质,找

37、到一个已知结构的同源对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。质建立结构模型。 依据:依据: 任何一对蛋白质,如果两者的序列任何一对蛋白质,如果两者的序列等同等同部分超过部分超过30%30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。不同。 63同源蛋白质结构预测的方法同源蛋白质结构预测的方法1)片段组装法:)片段组装法:S

38、WISS-MODEL2)距离几何法:)距离几何法:MODELLERSWISS-MODEL:/SWISS-MODEL.html646566最后的预测结果最后的预测结果67模板序列与查模板序列与查询序列的装载询序列的装载结构的精细比对结构的精细比对分子骨架的形成分子骨架的形成侧链形成和优化侧链形成和优化加入氢原子、加入氢原子、优化回环优化回环能量最小化、能量最小化、结构封装结构封装SWISS-MODEL的工作过程:的工作过程:68二、蛋白质折叠类型识别二、蛋白质折叠类型识别又称又称线索化方法线索化方法 有很多蛋白质具有相似的空间结构,但它们有很

39、多蛋白质具有相似的空间结构,但它们的序列等同部分小于的序列等同部分小于25%,即远程同源。,即远程同源。 对于这类蛋白质,很难通过序列比对找出它对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。们之间的关系,必须设计新的分析方法。69 对于一个未知结构的蛋白质(对于一个未知结构的蛋白质(U),), 如果找到一个已知结构的远程同源蛋白质如果找到一个已知结构的远程同源蛋白质(T),), 那么可以根据那么可以根据T的结构模板通过的结构模板通过远程同源模型远程同源模型化方法化方法建立建立U的三维结构模型。的三维结构模型。U T(远程同源)70 线索化的主要思想:线索化的主要思想

40、: 利用氨基酸的结构倾向(如形成二级结构利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定列所对应的结构是否能够适配到一个给定的结构环境中。的结构环境中。71 线索化方法一般有线索化方法一般有5个基本组成部分:个基本组成部分: (1)已知三维折叠结构的数据库;)已知三维折叠结构的数据库; (2)一种适合于进行序列)一种适合于进行序列-结构比对的三维折结构比对的三维折叠信息的表示方法;叠信息的表示方法; (3)一个序列)一个序列-结构匹配函数,该函数对匹配结构匹配函数,该函数对匹配程度进行打分;程度进行

41、打分; (4)建立最优线索的策略,或者是进行序列)建立最优线索的策略,或者是进行序列-结构比对的策略;结构比对的策略; (5)一种评价序列)一种评价序列-结构比对显著性的方法。结构比对显著性的方法。72假设存在有限数目的核心折叠(假设存在有限数目的核心折叠(core folds) 核心折叠实际上是构成蛋白质空间形状的基核心折叠实际上是构成蛋白质空间形状的基本模式。本模式。 建立核心折叠数据库建立核心折叠数据库 预测预测- 建立线索建立线索U序列与数据库核与数据库核心折叠比对心折叠比对取最佳核取最佳核心折叠心折叠U结构模型73http:/www.sbg.bio.ic.ac.uk/phyre/in

42、dex.cgiphyre与已知折与已知折叠子比对叠子比对74三、蛋白质结构从头预测三、蛋白质结构从头预测在既没有已知结构的同源蛋白质、也在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,不能用,这时只能采用从头预测方法,即直接或仅仅根据序列本身来预测其结即直接或仅仅根据序列本身来预测其结构。构。75 从头预测方法一般由下列从头预测方法一般由下列3个部分组成:个部分组成: (1)一种蛋白质几何的表示方法)一种蛋白质几何的表示方法由于表示和处理所有

43、原子和由于表示和处理所有原子和溶剂环境溶剂环境的计算开销非的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似常大,因此需要对蛋白质和溶剂的表示形式作近似处理。处理。 (2)一种)一种势函数势函数及其参数及其参数通过对已知结构的蛋白质进行统计分析确定势函数通过对已知结构的蛋白质进行统计分析确定势函数中的各个参数。中的各个参数。 (3)一种构象空间搜索技术)一种构象空间搜索技术 构象空间搜索和势函数的建立是从头预测方法的关构象空间搜索和势函数的建立是从头预测方法的关键。键。76能量函数和优化能量函数和优化 需要考虑的相互作用需要考虑的相互作用疏水作用疏水作用氢键氢键二硫桥二硫桥静电作用静电作用范德华力范德华力溶剂作用溶剂作用77 基于势函数或者力场的结构预测方法在实际应用基于势函数或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论