第10章蛋白质结构分析.ppt_第1页
第10章蛋白质结构分析.ppt_第2页
第10章蛋白质结构分析.ppt_第3页
第10章蛋白质结构分析.ppt_第4页
第10章蛋白质结构分析.ppt_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 蛋白质结构分析,Analysis of Protein Structure,哈尔滨医科大学 陈丽娜,本章重点、难点,重点:使用蛋白质结构数据库分析蛋白质结构及可视化、蛋白质结构预测方法、基于蛋白质结构的功能预测方法 难点:蛋白质的三维结构预测及基于结构的蛋白质功能预测软件的使用、蛋白质高级结构特征的识别和指认,第一节 引言,Introduction,一、诺贝尔奖与蛋白质结构分析,1914年诺贝尔物理学奖,劳厄(M.von Laue) 发现晶体中的X射线衍射现象 1915年诺贝尔物理学奖,布拉格父子用X射线对晶体结构的研究 1936年诺贝尔化学奖,德拜(P.J.W.Debye)用射线衍射

2、技术探明分子中原子的排列与结合形式 1944年诺贝尔物理学奖,拉比(I.I.Rabi) 发明核磁共振法,1958年诺贝尔化学奖,桑格(F.Sanger) 分离和测定一种蛋白质-胰岛素的氨基酸结构 1962年诺贝尔化学奖,佩鲁茨(M.F.Perutz)和肯德鲁 (J.C.Kendrew) 用 射线衍射技术测定肌红蛋白和血红蛋白 的原子排列 1964年诺贝尔化学奖,霍奇金(D.C.Hodgkin)测定维生素B12等复杂晶体的结构 1972年诺贝尔化学奖,安芬森 (C.B.Anfinsen) 、莫尔 (S.Moore)和斯坦 (W.H.Stein) 对核糖核酸酶的三维结构及其 124个氨基酸顺序的研

3、究,1982年诺贝尔化学奖,克卢格(A.Klug)将射线衍射技术与电子显微技术结合发明显微影象重组技术,以及在结构分子生物学方面的研究 1985年诺贝尔化学奖,豪普特曼 (H.A.Haupt-man) 和卡尔(J.Karlc) 开发了用于X射线衍射确定物质晶体结构的直接计算法 1991年诺贝尔化学奖,恩斯特 (R.Ernst) 发明了傅立叶变换核磁共振分光法和二维核磁共振技术 2002年诺贝尔化学奖,库尔特维特里希“发明了利用核磁共振技术测定溶液中生物大分子三维结构的方法”,二、蛋白质高级结构信息,1. 二级结构 (secondary structure) 2. 超二级结构 (super se

4、condary structure) 3. 三级结构 (tertiary structure) 4. 四级结构 (quaternary structure),三、蛋白质结构分析的主要目标,1. 建立研究蛋白质结构信息发掘与预测的方法; 2. 研究参与生命活动过程的蛋白质的物理性质、空间架构、功能片段和相互作用; 3. 探索基于蛋白质结构表征蛋白质的生物学意义; 4. 得到新的预测性的知识。,第二节蛋白质的高级结构,Advanced Structures of Protein,一、蛋白质的高级结构特征,(一)二级结构的主要类型和特征 蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键

5、维系。主要分为螺旋、折叠、转角及无规卷曲等类型。,1. 螺旋(helix)的结构特征为:,(1)主链骨架围绕中心轴盘绕形成右手螺旋; (2)螺旋每上升一圈是3.6个氨基酸残基,螺距为0.54nm; (3)相邻螺旋圈之间形成许多氢键; (4)侧链基团位于螺旋的外侧。,2. 折叠(sheets) 的结构特征为:,(1)若干条肽链或肽段平行或反平行排列成片; (2)所有肽键的C=O和NH形成链间氢键; (3)侧链基团分别交替位于片层的上、下方。,人细胞珠蛋白(2DC3.pdb)的第121到140位残基 对应的a-螺旋侧面和顶部(N端)视图,折叠示意图,a. 反平行和平行的多个折叠链形成一个完整折叠结

6、构的氢键示意图;b.来自人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分折叠结构(2DGQ.pdb)侧面视图,可见转角(turn); c. 来自人pi型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分折叠结构顶部视图,可见转角(turn);d. 来自人信号传递蛋白SMAD4(1DD1.pdb)的一个亚基中部分折叠结构顶部视图,可见到大的环区(loop)。,多肽链180回折部分,通常由四个氨基酸残基构成,借1. 4残基之间形成的氢键维系。,3. 转角的结构特征为:,a. 人谷胱甘肽-S-转硫酶pi第56到59位残基的转角连接了来自相同主链的两段折叠链,片层末端残基显示为粗枝状,转角中Gly和A

7、sp显示为细线,转角区域内第一个Asp的羰基氧与其后第三位氨基成氢键(3DGQ.pdb); b. 来自人细胞珠蛋白(2DC3.pdb)的两段螺旋由转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。,转角及其连接的折叠链和螺旋,4. 无规卷曲的结构特征为:,无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法识别无规卷曲(缺失其座标),即使有座标则其温度因子也较高。无规卷曲同环的区分主要是其长度和其形状的波动性。,(二)超二级结构的主要类型和特征 超二级结构(supersecondary structure)指位于同一主链的

8、多个二级结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。,(1)转角或环等连接连续四个螺旋形成的四螺旋捆; (2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的螺旋组成的亮氨酸拉链(Leucine zipper); (3)一条主链中相邻七个两亲螺旋通过过度结构形成的七次穿膜螺旋组; (4)连续主链中两段螺旋连接三段折叠链形成的Rossmann折叠; (5)转角连接a螺旋构成的a-螺旋-转角-螺旋; (6)环连接螺旋构成的螺旋-环-螺旋等。 (7)-折叠都为超二级结构。

9、,超二级结构的主要类型:,三级结构(protein tertiary structure),即蛋白质分子处于它的天然折叠状态的三维构象,它是在二级结构的基础上进一步盘绕,折叠形成的。蛋白质三级结构的稳定主要靠氨基酸侧链之间的疏水相互作用,氢键、二硫键、范德华力和静电作用维持。不同类型的蛋白质尽管局部结构分解后具有很高的相似性,但是由于其含辅助因子的全部共价相连原子空间的相对位置,即其二级结构的组装(assembly)模式存在着差异,在三级结构层面不同的蛋白质将体现各自整体的结构特征。,(三)三级结构的主要类型和特征,1. 水溶性蛋白质三级结构的基本特征,a. 飘带显示全螺旋人血清白蛋白单体三级

10、结构,结构略微松散(2T2Z.pdb);b. 飘带显示全螺旋人血清白蛋白单体三级结构,树枝状显示氨基酸侧链,结构明显紧密;,c. 飘带显示全折叠人晶状体蛋白三级结构,结构略微松散(2JDF.pdb),全蓝色的树枝状结构为配体;d. 飘带显示全折叠人晶状体蛋白的三级结构,树枝状显示氨基酸侧链,结构非常紧密,全蓝色的树枝状结构为配体。,2. 膜蛋白三级结构的基本特征,ac. 细菌视紫红质蛋白,结晶时结合了大量脂类(2BRD.pdb);,d. 人淋巴细胞激活抗原 CD98(2DH2.pdb);e. 鸡1-肾上腺素受体,七螺旋跨膜蛋白(2VT4.Pdb)并结合有其配体;f. 大肠杆菌NANC离子通道蛋

11、白(2WJR.pdb)。,3. 蛋白质三级结构中二级结构的折叠和组装,按二级结构组装模式对蛋白质进行分类对解析蛋白质高级结构形成规律和预测蛋白质功能有重要帮助。蛋白质二级结构组装模式主要是全螺旋、全折叠、螺旋/折叠,还有少量螺旋+折叠类。,全a-螺旋蛋白质,人血清白蛋白(上图a,b)和细菌视紫红质(下图 a-c),全-折叠蛋白质,人晶状体蛋白(上图c, d)和大肠杆菌NANC离子通道蛋白(下图f),a-螺旋/-折叠蛋白质,细胞表面标志蛋白CD98(图d)及糖酵解的绝大多数酶蛋白 (图a),a-螺旋+-折叠类蛋白质,人TBP与双螺旋DNA复合物(1CDW.pdb),有独立三级结构的单元通过非共价

12、键聚集成的非共价复合物称为四级结构,其所含独立三级结构单位为亚基(subunit)。形成四级结构全部依靠非共价键相互作用,且来自不同亚基的二级结构间可发生强的相互作用以稳定四级结构,如生成跨亚基的更大折叠结构或螺旋聚集体;其中,氢键、疏水相互作用和静电作用是主要维持力。为了形成稳定的四级结构,必然要求相互作用的任两个蛋白质间在空间外形互补以增加接触面且理化性质互补。这些特征也是预测蛋白质间相互作用时有用的辅助判据。,(四)四级结构的主要类型和特征,PBO-1蛋白质呈现的对称结构,偶数亚基形成的四级结构具有较高的对称性,二、蛋白质高级结构中二级结构的测定与指认,蛋白质二级结构词典(diction

13、ary of secondary structures of proteins, DSSP)来自模式识别技术,其仅依据主链肽键基团的坐标判断主链肽键基团间是否形成氢键,计算氢键能量低于0.5 kcal/mol则有氢键形成,用于搜索螺旋和片层结构是否存在。 STRIDE程序用特殊方法判定主链肽键之间的氢键是否存在并用二面角参数辅助识别指认二级结构。,三、蛋白质结构域与家族分类,(一)蛋白质结构域,结构域是构成蛋白质亚基的紧密球状区域,为介于二级与三级结构之间的一种结构层次;是蛋白质中可以具有独立三级结构的部分,通常由一个基因外显子编码,并可具有特定的功能。 最常见的结构域约含有100200个氨基

14、酸残基,一般至少40个、多的可至400个以上;对于一个较大球状蛋白质分子来说,往往由两个或两个以上相对独立的三维实体缔合而成三维结构体。,(二)蛋白质家族分类,目前建立在结构域基础上的蛋白质家族数据库有PROSITE、PRINTS、Pfam、SMART、SWISS、PROT、ProDom 和BLOCKS等,每个蛋白质结构数据库运用不同的原理来识别结构相似的蛋白质超家族;将它们结合起来可以更准确地归类蛋白质家族和描绘结构域。InterPro数据库,是联合PROSITE、PRINTS、Pfam和ProDom 四个独立完整的蛋白质结构域数据库组成站点,它是将蛋白质的结构域和功能位点加以统一建立的数据

15、库资源。,四、蛋白质高级结构的实验解析方法,蛋白质结构实验分析主要有 三大技术平台,(一)X-衍射蛋白质晶体结构分析 (二)核磁共振波谱分析 (三)冷冻电镜技术,(一)蛋白质晶体结构X-衍射分析,摸索蛋白质结晶条件、快速处理晶体结构数据和减少差错是目前蛋白质晶体结构分析的两大难题或瓶颈。,是目前分辨率最高的结构测定方法,高通量晶体结构分析中的几大重要环节是:数据处理与分析、重原子的定位、密度修饰、分子替换、图形整合、模型加工和确认。,晶体结构分析的常用软件有SOLVE,RESOLVE等。,(二)核磁共振波谱分析,利用核磁共振原理,检测分子质量小于60k的蛋白质,通过对其核磁共振谱线特征参数的测

16、定来分析蛋白质的结构与性质,就是将原始资料利用傅里叶变换转换为不同的峰值,然后采集各种不同的峰组成图谱,并利用生物信息学方法筛选出具有特定结构特征的图谱。 常用NMRPipe和SPARKY软件处理这些过程,使用XEASY,DYANA和GARANT等软件分析侧链或骨架结构。,与X-衍射晶体分析技术相比较,NMR技术在蛋白质结构测定的速度上、和研究的对象上都存在一定的限制,成本太高,步骤繁多。但其无需制备晶体标本,可在溶液中直接测定,也可进行固相测定,因此利用NMR法使得某些无法获得晶体结构的蛋白质或非液相蛋白质(如膜蛋白)的结构测定成为可能。相对而言,NMR技术更适合小分子质量以及水溶性较好培养

17、晶体困难的蛋白质结构的分析,对于蛋白质折叠、局部动力学或构象分析、蛋白-蛋白相互作用,NMR更体现其优越性。,X-衍射晶体分析技术和NMR技术的比较,(三)冷冻电子显微镜技术,采用高压快速液氮冷冻方法使样品包埋在玻璃态的水环境中,使我们能够观察到生物大分子在天然状态下的结构;同时冷冻的速度极快,把细胞在其生理活动的某些特定时刻固定下来,显示此时的结构特点,进而可通过不同功能状态的瞬时构象变化来研究生物分子的功能。冷冻电镜获得的是处于天然状态下未经染色的分子的二维投影像。将样品进行不同角度的倾斜所获得的数据进行综合分析,并依据样品的不同特性使用不同的重构技术获得分子的结构,在此基础上观察多种成分

18、的图像变化,追踪生物大分子的装配及其动力学过程。,由冷冻电镜技术所获得的蛋白质三维结构与X射线晶体技术非常相似,而且其信噪比非常低,并适合于内在膜蛋白的分析。其独特优势为:可以用不同的方法对均一的(如膜蛋白的二维晶体,二十面体对称的病毒等对称结构)和不均一的(如核糖体等)样品进行三维结构重构,同时,冷冻电子显微镜是唯一的能研究小到蛋白质、蛋白质复合物,大到细胞器甚至整个细胞的方法 。,冷冻电子显微镜技术与X衍射晶体结构分析方法比较,五、蛋白质结构的可视化,可视化分析蛋白质的高级结构,有利于从原子间相互作用的层次理解生命活动过程的信息控制机制,更加有效地揭示分子在完成其功能过程中的演化情况,了解

19、蛋白质分子结构和各种微观性质与宏观性质之间的定量关系。只要安装蛋白质分子图形学软件,并获得所需蛋白质结构数据,配以商业软件或免费的小分子图形设计系统,就可开展结构生物信息学的探索性工作。,蛋白质可视化免费软件Pymol,Pymol是强大的分子图形显示和基本特征测定系统 Pymol可在/寻找链接下载,Pymol启动后显示双界面,对分子操作的常用命令界面,多种分析功能界面。,1. 图形界面左上侧列出主要的可操作对象并分成几个层次,包括所选对象、蛋白质、整体等; 2. 每个层次的对象有五种主要操作:动作(A: action)、显示(S: Show)、隐藏(H:

20、hide)、标记(L: Label)、上色(C: Color)。 3. Dispaly下拉菜单中可显示蛋白质中每条肽链的序列和非蛋白质成分 ,鼠标左键单击序列选中特殊待操作的残基可同时显示对象所在位置 ;还可设置背景(论文中这类图一般用白色背景,而报告中常用黑色背景以增加视觉效果); 4. Wizard中有对分子常用性质测定模块,包括距离、电荷等以及尝试进行蛋白质分子改造的功能。,蛋白质图形操作和性质测定,第三节蛋白质结构数据库,Protein Structure Databases,一、蛋白质三维结构数据库PBD,PDB数据库收录条目一览表,以人类泪液载脂蛋白为例,具体介绍下其在PDB数据库

21、中结构检索和可视化过程,第一步: 输入关键字“HUMAN TEAR LIPOCALIN”,第二步: 选择人类泪液载脂蛋白1XKI,第三步: 点击Biology Assembly面板展示其结构图,第四步: 1XKI结构展示图,二、蛋白质结构分类数据库SCOP,SCOP(structural classification of protein)数据库是一个包含已有结构的蛋白质分类数据库,依据不同蛋白质的氨基酸组成的相似性及三级结构,详细描述已知结构蛋白质之间的功能及进化关系,SCOP数据库的构建除了使用计算机程序外,主要依赖于人工验证。,SCOP数据库中1.75 版本中详细信息,三、蛋白质分类数据

22、库CATH,数据库的名称CATH分别是数据库中四种分类类别的第一个字母,即C代表蛋白质的种类(class);A代表蛋白质中二级结构的构架(architecture);T代表蛋白质的拓扑结构(topology);最后H代表数据库中最高层的分类类别-蛋白质同源超家族(homologous superfamily)。CATH蛋白质分类数据库与另外一个蛋白质分类数据库SCOP相比,后者更注重从蛋白质进化的角度来对蛋白质进行分类,而CATH数据库偏重于从结构角度对蛋白质分类。,CATH把蛋白质分为4类,即全、全、-(/型和+型)和低二级结构类。,以蛋白质1ucr为例的搜索结果,1ucr包括两个结构域,分

23、别为1ucrA00和1ucrB00。这两个结构域属于同一同源家族 0。,结果显示1ucr为二聚物,它的每条链都有自己特异的链标识(如1ucrA和1ucrB)。,获得该查询1ucr的PDB code、图像和功能信息。,点击上述查询结构页面domain ID为1ucrA00的超链接,CATH数据库将列出该结构域相关的序列家族、结构、序列和数据更新历史记录等结果;并可进一步获得三维结构。,第四节 蛋白质结构的预测 Prediction of Protein Structure,蛋白质结构的密码隐藏在序列中,通过序列来解开蛋白质的结构,一种氨基酸序列只可能有一种蛋白质结构,这就是计算

24、机预测蛋白质结构的意义所在。根据安芬森的热动力学原理,蛋白质在细胞中应该处在它与环境的自由能最低态。这意味着可以根据物理、化学、生物学等知识来设计蛋白质的能量函数,因此寻找这种最低自由能所代表的结构。,一、蛋白质二级结构预测方法及软件,(一)蛋白质二级结构的预测方法,1DPM(双重预测方法) 2DSC 3PHDsec 4SOMPA 5MLRC 6Jpred,(二)蛋白质结构域识别方法,通过分析氨基酸C-C键的距离,将每一套蛋白质三维结构里的结构域进行测量。再通过结构域的稳定性,与折叠方面来确认蛋白质结构域的子结构。,2运用图论法,将蛋白质看做是互相作用的残基的三维图形,这里不涉及任何共价结构,

25、确定结构域的问题这里就变成将这个图分割成几批残基,使这几批残基之间的相互作用最小。,1通过蛋白质空间结构信息获取结构域信息,(三)蛋白质二级结构预测相关软件,以人基质金属蛋白酶MMP14(Matrix metalloproteinase )序列为例,介绍Jpred和SOMPA的二级结构预测方法。,人基质金属蛋白酶MMP14(Matrix metalloproteinase, MMP14)氨基酸序列的fasta形式可从NCBI的蛋白质数据库获得(gi|4826834|ref|NP_004986.1|matrix metalloproteinase 14 preproprotein Homo sa

26、piens)。,Jpred二级结构预测方法,(1) 进入Jpred首页 (pbio.dundee.ac.uk/_www-jpred/),,(2) 在“Sequence”下的空白处直接输入序列;也可以选择“Advanced”高级模式,选择Email提交方式或留空为网页结果显示,输入蛋白质序列或者从电脑文件夹中获取,最后点击“Make Prediction”;,(3) 在电子邮箱中找到结果地址,在弹出的结果显示界面选择进行简单结果浏览、图形化输出等操作;,(4) 分析结果 H:代表-螺旋;E:代表-折叠;-:代表无规则卷曲。由图看出:Jpred方法预测的MMP14二级结构有8个螺旋区(H)和23个

27、折叠区(E),其他区域均为无规则卷曲区(-)。,Jpred二级结构预测,SOMPA二级结构预测方法,(1) 进入SOMPA主页(http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);,(2) 在“Paste a protein sequence below”下的空白处提交蛋白序列(原始序列),可以在参数中进行符合我们要求的设置,然后点击“SUBMIT”按钮进行分析;,人民卫生出版社8年制及7年制临床医学等专业用生物信息学,(3) 查看结果,主要含有alpha helix (Hh)-螺旋,Exten

28、ded strand (Ee)延伸链,Beta turn (Tt)-折叠,Random coil(Cc)无规卷曲。其中Hh有150个氨基酸,占25.77%;Ee有110个氨基酸,占18.90%;Tt有52个氨基酸,占8.93%;Cc有270个氨基酸,占46.39%。Hh、Cc和Ee贯穿于整个氨基酸链,Tt主要分布在氨基酸链的第300个氨基酸之后。,SOMPA预测结果,二、蛋白质三维结构预测方法及软件,比较建模(comparative modeling),穿线(threading),自由建模(free modeling),蛋白质的结构预测,(一)穿线法预测蛋白质高级结构,穿线法是用于检测进化相关

29、的序列和相似的折叠,接受与靶蛋白非常相似的结构。该方法已相对成熟,进一步的研发主要在结构的优化,使提炼的结构模板更加接近其天然结构。穿线法是蛋白质结构预测最活跃的领域之一,大量的算法包括序列profileprofile alignments (PPA)、structural profile alignments、隐马尔可夫模型,以及其他机器学习算法等。,(二)比较建模法预测蛋白质高级结构,比较建模法又称为同源建模法(Homology modeling),它是基于进化相关的序列具有相似的三维结构,且进化过程中三维结构比序列保守而利用进化相关的结构模板信息建模。,1. 比较建模的原理,2. 比较建

30、模的基本步骤,将靶序列作为查询序列来搜索PDB 将靶序列和模板序列进行序列比对 以模板结构骨架作为模型,建立靶蛋白质骨架模型 对侧链建模,包括构建环区(loops)和侧链,优化侧链位置,并从模板结构到靶精炼整个模型 优化和评估产生的模型。,3. 比较建模法的局限性,传统的比较建模是通过PSI-BLAST找到已知结构的相关蛋白。最近如进行profileprofile比较和有效利用结构信息的更加复杂的方法已显著增加了不仅比对的质量而且远程同源(remote homologue)检测的能力。因此,比较建模和折叠识别在基于模板的建模方法中的区别现已十分模糊。开发新的比较建模和折叠识别的算法导致网上各种

31、预测方法的出现,这包括结构预测meta-服务器。,蛋白质三维结构预测服务通过因特网对公众免费开放(同源建模): 瑞士生物信息研究所 SWISS-MODEL 丹麦技术大学生物序列分析中心 CPHmodels 比利时拿摩大学 ESyPred3D 英国癌症研究中心 3DJigsaw,4. 常用建模服务器和软件简介,Accelrys Discovery Studio 软件 InsightII FAMS,第一步:进入SWISS-MODEL三级结构预测服务器主页,仍以人MMP14序列为实例 应用SWISS-MODEL服务器自动模式,第二步:选择“Automated Mode” 粘入MMP14蛋白质序列;在

32、这里可以填写E-mail地址,将结果发送至电子邮箱,也可以在新的网页上直接展示;,第三步:点击“Submit Modeling Request”即可;,第四步:直接在页面上查看MMP14蛋白质的三级结构信息。,第五步:结果分析:通过查询Expdb数据库,共得到218个击中项。我们选用其中相似性最高的两个模型。分别是模板1:1bqqM,模板2:1su3B,,第二步:把3个三维结构导入到“Discovery Studio”的主界面中,调节角度使得3个三维结构展示在一个界面里。在主菜单中选择“Structure”|“Superimpose”|“Molecular overlap”,在弹出的对话框中点

33、击“Yes”。按下组合键“Ctrl+D”,弹出“Display Style”对话框,在“Atom”一栏中选“None”,在“Protein”一栏中选“Solid ribbon”。折叠结果如下图,可以看到这三个蛋白分子叠合的效果还是比较好的。,在PDB数据库Blast搜索MMP14的结果,三个蛋白质分子的叠合图,蛋白质MMP14序列相似性蛋白质(1BQQ/1SU3/1RM8)的三维结构模型,第一步:MMP14序列Blast搜索蛋白质结构数据库(PDB),选取以上获得结构中分值最高的三个三维结构进行同源建模。分别是1BQQ的M链(Model-1),1SU3的A链(Model-2),1RM8的A链。

34、它们的三维结构展示如图。,Accelrys Discovery Studio 软件,第三步:基于结构的序列比对 在“Protocol Explorer”中,选择“Protein Modeling”下的“Align Structure”(MODELER)。在打开的“Parameter Explorer”中,选择“Input Sequence Alignment”为model-1,点开“+”号,确保在“Input Protein Molecules”中包含以上三个蛋白分子,将“Gap Extension Penalty”一栏中的参数改为3.0,其余参数均不变。最后得到的比对结果所示的序列相似性分别

35、如下:identify:24.4%,simility:28.2%。由此可以看出该模型的整合效果还是可以的。最后参数表如图。,第四步:靶序列与模板序列的比对 在“Protocol Explorer”中,选择“Protein Modeling”下的“Align Sequence with Structure protocol”,鼠标双击。在“Parameter Explorer”中,将“Gap Open Penalty”一栏中的参数改为-450,“Gap Extension Penalty”设为-25,其余参数均不变 。运行之后序列的相似性分别为:Identify:18.1%;similarity

36、:20.9%。,比对参数设置(基于结构),比对参数设置(目标序列和模板序列),第五步:同源模型的建立 在“Protocol Explorer”中,选择“Protein Modeling”下的“Build Homology Models Protocol”,鼠标双击。该模块通过使用Modeler,从序列比对结果出发构建蛋白的三维结构模型。在“Parameter Explorer”中, “Input Sequence Alignment”栏选择model-1, 点开“+”号,“Input Model Sequence”栏选择 MMP14,“Input Template Structure”栏选择

37、model-1,model-2,和1rm8,将“Cut Overhangs” 栏改为False,其余参数均保留默认值。参数设置如下图。,第六步:经过基于结构的序列比对、目标序列与模板序列的比对等步骤,最后获得一个MMP14比较好的三维模型。窗口中的蛋白模型以飘带的形式显示,不同部位采用不同的颜色和宽度。颜色和宽度依Verify score而定,score越高则蛋白结构越理想,从蓝色到红色score值依次降低,蓝色表示score值很高,白色表示score中等,而红色则表示score值较低。飘带的宽度与score值成反比,蛋白的结构越不理想,则该处的飘带越宽。如下图所示。,参数设置(同源模型建立)

38、,预测的MMP14三维飘带模型,第七步:模型验证 由于从图中我们不能很直观的看出模型建立的好坏,所以我们借助软件将每一个氨基酸的Score与其序号作图。在MMP14.msv所在的3D-Window中,按组合键“Ctrl+T”调出“Data Table”,选择“AminoAcid”。找到“PDF Total”一栏,鼠标 单击将此列选中,然后选择主面板上“Chart”|“Line Plot”,对此列作图,图中可见:在PDF值较低的部位,蛋白的结构是比较合理的,而在PDF值较高的部位蛋白结构能量较高,可能还需要进一步的优化。例如:第125位,第250位残基附近的高峰区。,第八步:为了进一步直观地展示

39、模型的好 坏,我们采用图形的形式展示;选择主面 板上的“Chart”|“RamachandraPlot” ,对整个蛋白作图。如下图所示,位于蓝 色区域以内的残基结构合理,处于蓝色区 域以外紫色区域以内的残基结构比较合理 ,位于这两个区域以外的残基结构则合理 性较差。,模型验证,采用图形进行模型验证,(三)蛋白质三维结构的从头预测方法,从头预测可以分为两个主要方向: (1)根据已经预测的二级结构,把可信度较高的二级结构进一步组装,得到最后的蛋白质结构。 (2)不依赖二级结构预测的结果,直接预测三维结构。,(四)蛋白质高级结构的其他预测方法,相似的序列常常意味着相似的结构,这种认识虽然对大多数蛋白

40、确实如此,但自1990年以来,随着结构数据的增加,人们明显地发现:惊人相似的蛋白折叠不一定来自任何明显相似的序列,许多结构相同的蛋白质,它们的序列并没有相似性。1960年Perutz等显示,肌红蛋白(myoglobin)和血红蛋白(hemoglobin)这两种最早通过X-射线解析的蛋白尽管其序列不同,但具有相似的结构;Alexander等人发现:两条序列有88%的序列一致但明显不同的折叠。最新的研究显示,少至3个氨基酸的突变足以引入根本不同的折叠方法。,序列相似度高的蛋白2FSl和1PGB的不同折叠模式,折叠识别法包括两步: 将目的蛋白的序列和已知的折叠结构进行匹配,在已知的结构中找到一个或几

41、个匹配最好的结构模型,作为目的蛋白的预测结构 基于已有的知识找到最好的模型,三、对结构预测结果的评价,面对多种的模型和预测方法,我们常常会问:我应该用哪种分析方法和哪种服务器?哪种方法结果更值得信赖?输出结果怎么解释等等?为此,研究者们创建了多种公共范围的实验评估方法。主要有三类:主要有LB、CASP和CAFASP、EVA等方法。,第五节 基于结构预测蛋白质功能,Prediction of Protein Function Based on Structures,如蛋白质间序列相似性高于40%,该蛋白质同其相似序列蛋白可能有保守序列发挥的相同生物化学作用;但当序列保守性低于40%时,可从高级结

42、构预测功能。蛋白质有多个功能域和结构域,从高级结构预测功能实际上是预测蛋白质的每项基本生物化学作用。,一、基于结构分类的蛋白质功能预测,1.基于结构进行蛋白质功能注释的方法是搜索与目标蛋白质结构相似的蛋白质,并将其功能转移给输入目标蛋白质。 2.此过程中需要进行蛋白质的结构比对和判断结构相似程度。 3.可将这种相似性估值转化为序列比对问题,利用序列比对经典算法来解决结构比对问题,如DaliLite,SSM,STRUCTAL,MultiProt和3DCoffee等。,二、基于结构预测蛋白质间相互作用,应用蛋白质的高级结构信息辅助进行相互作用蛋白质预测的策略,1)决策树残基法 2)关联性突变法 3

43、)联用方法 4)人工神经网络学习法,1.基于结构的物理对接,2.识别相互作用界面序列特性模式进行预测,三、其他蛋白质功能预测方法,不同的蛋白质,由于结构不同而执行不同的生物学功能,其特定的空间结构是行使生物功能的基础。,基于结构预测功能联系的方法,1.基于基序的方法 2.基于表面的方法 3.基于学习的方法,四、蛋白质结构与功能关系数据库,(一)Pfams数据库,(二)PIR蛋白质功能预测数据库,PIR全称The Protein Information Resource,是集成了蛋白质功能预测数据的公用数据库。PIR在超家族、域和模体水平上对蛋白的分类,同时提供蛋白质的结构和功能信息,并给出了与其他40个数据库之间的相互参考。,(三)InterPro数据库,整合蛋白质结构域和功能位点资源数据库(Integrated Resources of Proteins Domains and Functional Sites,InterPro)是集成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论