版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章蛋白质结构预测和分子设计蛋白质结构的预测概述由于用X光晶体衍射和NMR核磁共振技术测定蛋白质的三维结构,以及用生化方法研究蛋白质的功能效率不高,无法适应蛋白质序列数量飞速增长的需要。蛋白质序列——结构——功能….-Gly-Ala-Glu-Phe-….功能蛋白质结构预测问题就是通过理论计算和统计模拟等方法寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。!蛋白质结构预测主要有两大类方法:(1)理论分析方法通过理论计算(如分子力学、分子动力学计算)进行结构预测。这种方法由于折叠前后的能量差太小、蛋白质可能的构象空间庞大和质折叠的计算量太大等原因不大可行。(2)统计的方法对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。主要方法包括:经验性方法根据一定序列形成一定结构的倾向进行结构预测。结构规律提取方法从蛋白质结构数据库中提取关于蛋白质结构形成的一般性规则,指导建立未知结构的蛋白质的模型。
同源模型化方法通过同源序列分析或者模式匹配预测蛋白质的空间结构或者结构单元(如锌指结构、螺旋-转角-螺旋结构、DNA结合区域等)。这是目前预测结果最可靠的方法。预测蛋白质的物理性质由蛋白质序列可以预测出蛋白质的许多基本性质:氨基酸组成、等电点(pI)、分子质量、酶切特性、亲水性和疏水性、电荷分布等。相关工具有:ComputepI/MW(http://www.expasy.ch/tools/)
是ExPASy工具包中的程序,计算蛋白质的等电点和分子量。对于碱性蛋白质,计算出的等电点可能不准确。PeptideMass(http://www.expasy.ch/tools/)
是ExPASy工具包中的程序,分析蛋白质在各种蛋白酶和化学试剂处理后的内切产物(肽片段的相对分子质量、理论等电点等)。
TGREASE(ftp:///pub/fasta/)是FASTA工具包中的程序,分析蛋白质序列的疏水性。这个程序延序列计算每个残基位点的移动平均疏水性,并给出疏水性-序列曲线,用这个程序可以发现膜蛋白的跨膜区和高疏水性区的明显相关性。
SAPS(http://www.isrec.isb-sib.ch/software/SAPS_form.html)蛋白质序列统计分析,对提交的序列给出大量全面的分析数据,包括氨基酸组成统计、电荷分布分析、电荷聚集区域、高度疏水区域、跨膜区段等。AACompIdent
(http://www.expasy.ch/tools/
)或PROSEARCH(http://www.embl-heidelberg.de/prs.html)利用未知蛋白的氨基酸组成检索具有相同组成的已知蛋白。将查询蛋白与库中已知蛋白进行比较,给出相似蛋白及其所打分数,分数越高,可能性越大。蛋白质二级结构预测二级结构是指α螺旋和β折叠等规则的蛋白质局部结构元件。二级结构预测的基本依据:每一段相邻的氨基酸残基具有形成一定二级结构的倾向。二级结构预测的目标:判断每一段中心的残基是否处于螺旋(H)、折叠(E)、转角(-)(或其它状态)之一的二级结构态,即三态。总的来说,二级结构预测仍是未能完全解决的问题,一般对于α螺旋预测精度较好,对β折叠差些,而对除α螺旋和β折叠等之外的无规则二级结构则效果很差。二级结构预测的基本策略:(1)相似序列→相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK结构?(2)分类分析α螺旋提取样本聚类分析学习分类规则预测….-Gly-Ala-Glu-Phe-….二级结构预测的方法:经验参数法又称Chou-Fasman方法,是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。基本过程:扫描输入的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于1.0为止。经验规则:(i)α螺旋规则(ii)β折叠规则(iii)转角规则(iv)重叠规则延伸成核区延伸(2)GOR方法基本过程:首先对已知二级结构的蛋白样本集进行分析,计算出中心残基的二级结构分别为螺旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率,从而产生一个得分矩阵。然后利用矩阵中的值来计算待预测的序列中每个残基形成螺旋、折叠或者转角的概率。序列窗口中心残基窗口中各个残基对中心残基二级结构的支持程度(3)基于氨基酸疏水性的预测方法这种方法是一种用物理化学方法进行二级结构预测的方法,或称为立体化学方法。在蛋白质中,氨基酸的理化性质对蛋白质的二级结构影响较大,因此在进行结构预测时需要考虑氨基酸残基的物理化学性质,如疏水性、极性、侧链基团的大小等,根据氨基酸残基各方面的性质及残基之间的组合预测可能形成的二级结构。“疏水性”是氨基酸的一种重要性质,疏水性的氨基酸倾向于远离周围水分子,将自己包埋进蛋白质的内部。这一趋势加上空间立体条件和其它一些因素决定了一个蛋白质最终折叠成的三维空间构象。目前已经总结出α螺旋和β折叠的预测规则。(4)同源分析法将待预测的片段与数据库中已知二级结构的片段进行相似性比较,利用打分矩阵计算出相似性得分,根据相似性得分以及数据库中的构象态,构建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性大于30%的序列,则预测准确率可大大上升。(5)综合方法在实际进行蛋白质二级结构预测时,往往会综合应用各种分析方法和相关数据。综合方法不仅包括各种预测方法的综合,而且也包括结构实验结果、序列对比结果、蛋白质结构分类预测结果等信息的综合。最常见的综合方法是同时使用多个软件进行预测,通过分析各个软件的特点以及各个软件预测结果,最终形成二级结构一致性的预测结果。
nnPredict(http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html)
预测每个氨基酸的二级结构类型。它将蛋白质结构类型分为全α蛋白、全β蛋白和α/β蛋白,输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。这个方法对全α蛋白能达到79%的准确率。二级结构预测的程序:PredictProtein(http://cubic.bioc.columbia.edu/predictprotein/)
提供了序列搜索和结构预测服务。它先在SWISS-PROT中搜索相似序列,构建多序列比对的特征简图,再在数据库中搜索相似的特征简图,然后来预测相应的结构特征,包括二级结构。返回的结果包含大量预测过程中产生的信息,还包含每个残基位点的预测可信度。这个方法的平均预测准确率达到72%。SOPMA(http://pbil.ibcp..fr/)
一种独特的自优化预测方法,它是用五种相互独立的方法进行预测,然后将预测结果汇集成“一致预测结果”,采用的二级结构预测方法包括GOR方法、Levin同源预测方法、双重预测方法、PHD方法和SOPMA方法。其它特殊局部结构的预测蛋白质还存在一些特殊的局部结构,如膜蛋白的跨膜螺旋、信号肽、卷曲螺旋等,具有明显的序列特征和结构特征,也可用计算方法加以预测。COILS(http://www.ch.embnet.org/software/COILS_form.html)
卷曲螺旋预测方法,将序列与已知的平行双链卷曲螺旋数据库进行比较,得到相似性得分,并据此算出序列形成卷曲螺旋的概率。
TMpred
(http://www.ch.embnet.org/software/TMPRED_form.html)
预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通过加权打分进行预测。SignalP(http://www.cbs.dtu.dk/services/SignalP/)
信号肽(signalpeptide)是未成熟蛋白质中,可被细胞转运系统识别的特征氨基酸序列。预测蛋白质序列中信号肽的剪切位点。蛋白质的三维结构的预测蛋白质三维结构预测是最复杂和最困难的预测技术。研究发现,序列差异较大的蛋白质序列也可能折叠成类似的三维构象,自然界里的蛋白质结构骨架的多样性远少于蛋白质序列的多样性。尽管由于蛋白质的折叠过程仍然不十分清楚,但也发展出了一些有一定作用的三维结构预测方法。三维结构的预测方法:1、同源模型化方法主要思想:对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。依据:任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。2、线索化方法(折叠识别方法)远程同源:有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%。线索化的主要思想:建立一个从目标序列到已知结构的线索,利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。线索化目标是为目标蛋白质寻找合适的蛋白质模板,这些模板蛋白质与未知序列没有显著的序列相似性,但却是远程同源的。未知序列与结构数据库核心折叠比对取最佳核心折叠建立结构模型3、从头预测方法在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,即(直接)仅仅根据序列本身来预测其结构。目前这种方法还难以产生准确的预测结构。相关资源:SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html)
自动蛋白质同源模建服务器。CPHmodels(http://www.cbs.dtu.dk/services/CPHmodels/)
同源模建预测蛋白质结构。预测方法评价对各种方法所得到的蛋白质结构预测结果需要进行验证,以确定预测方法是否可行,确定其适应面。验证的方法是取已知结构的蛋白质,对这些蛋白质进行模拟结构预测,并将预测结构与真实结构进行比较,分析两者之间的差距。为了客观地评价各种预测方法,已经设立了权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在马里兰生物技术研究中心的CASP就是这样一个系统(/casp4/)。蛋白质分子设计蛋白质工程通过生物技术手段对蛋白质的分子结构或者对编码蛋白质的基因进行改造,以便获的更适合人类需要的蛋白质产品的技术。蛋白质的分子设计是为有目的的蛋白质工程改造提供设计方案。这是一门新兴的研究领域,其本身在不断地发展,其内容也在不断地更新。蛋白质分子设计的过程首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。具体步骤:(1)建立所研究蛋白质的结构模型。可通过PDB等蛋白质三维结构数据库查阅蛋白结构,也可通过X射线晶体学、二维核磁共振等测定结构,还可根据类似物的结构或其他结构预测方法建立起结构模型。(2)找出对所要求的性质有重要影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 便携式牙刷调查问卷
- 珍惜时间班会
- 双十二新品炫酷上市
- 《生物竞赛辅导》课件
- 《侵入岩研究方法》课件
- 《小儿推拿法讲座》课件
- 遂平县嵖岈山镇历史遗留废弃矿山生态修复项目建设项目环境影响报告表【模板】
- 主体结构复习试题
- 《环形的面积》课件
- 复合函数求积课程设计
- 国开2024年秋《休闲农业概论》形考任务1-4答案
- 2024年教师资格考试高级中学面试生物试题与参考答案
- 年终总结数据对比分析图表
- 2024-2025学年统编版初二上学期期末历史试卷及答案指导
- 一对一教学管理制度
- 一年级数学计算题专项练习1000题集锦
- 2024年2024年离婚协议书模板电子版
- 意义生活:符号学导论学习通超星期末考试答案章节答案2024年
- 人教版数学八年级上册 期末复习专项练习题(选择+填空)(含简单答案)
- 2023年辅警考试公安基础知识考试题库及答案
- 2025届初中学生化学素质和实验能力竞赛试题(初赛)
评论
0/150
提交评论