第11讲 蛋白质高级结构预测_第1页
第11讲 蛋白质高级结构预测_第2页
第11讲 蛋白质高级结构预测_第3页
第11讲 蛋白质高级结构预测_第4页
第11讲 蛋白质高级结构预测_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一讲蛋白质高级结构预测Left:themodelwasgeneratedbyROSETTARight:themodelwasgeneratedbyI-TASSER蛋白质高级结构三维结构功能作用机制分子间互作功能注释指导实验验证功能确认功能位点设计和改造蛋白药物靶标设计同源建模法(Homologymodeling)线索化法/折叠识别法/串线法(Threading/Foldrecognition)从头预测法(Abinitio/Denovomethods)蛋白质三级结构预测方法依据:a、一个蛋白质的结构由其氨基酸序列唯一的决定。由一级结构,在理论上,足以获取其二级、三级结构。b、三级结构的保守型远远大于一级结构的保守型。主要思想:

对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。1.蛋白质结构预测之同源建模同源建模的过程2.将模板结构的坐标拷贝到目标U,仅拷贝匹配残基的坐标PDB数据库1.PDB数据库、BLAST(或PSI-BLAST)3、模型优化,主链生成、环区建模、加氢4.

合理性检测同源建模方法特点绕过了二级结构预测目前蛋白质结构预测方法中最成功、最准确、使用最多局限是:仅仅是一种技术手段,而非理论应用范围收已有同源结构的限制Loop区域准确率差同源建模在线服务器和软件Swiss-modelHOMCOS1.0ESyPred3DNameMethodDescription3D-JIGSAWFragmentassemblyAutomatedwebserverRaptorXremotehomologydetection,protein3Dmodeling,bindingsitepredictionAutomatedwebserverandDownloadableprogramBiskitwrapsexternalprogramsintoautomatedworkflowBLASTsearch,T-Coffeealignment,andMODELLERconstructionCABSReducedmodelingtoolDownloadableprogramCPHModelFragmentassemblyAutomatedwebserverEasyModellerGUItoMODELLERStandalonewindowsexecutableESyPred3DTemplatedetection,alignment,3DmodelingAutomatedwebserverGeneSilicoConsensustemplatesearch/fragmentassemblyWebserverGeno3DSatisfactionofspatialrestraintsAutomatedwebserverHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityLIBRAILIghtBalanceforRemoteAnalogousproteins,ver.IWebserverLOMETSLocalMetathreadingserverMeta-servercombining9differentprogramsMODELLERSatisfactionofspatialrestraintsStandaloneprogrammainlyinFortranandPythonProtinfoCMComparativemodellingofproteinstructureusingminimumperturbationandloopbuildingWebserverBHAGEERATH-HCombinationofabinitiofoldingandhomologymethodsProteintertiarystructurepredictionsSTRUCTUROPEDIAWebInterfacetoMODELLERHomologymodelingofproteinsinmonomericormultimericformsaloneandincomplexwithpeptidesandDNAaswellasintroductionofmutationsandpost-translationalmodifications(PTMs)intoproteinstructuresSWISS-MODELLocalsimilarity/fragmentassemblyAutomatedwebserver(basedonProModII)TIP-STRUCTFASTAutomatedComparativeModelingWebserverandknowledgebaseWHATIFPositionspecificrotamersStandaloneprogramandwebinterfaceYasaraDetectionoftemplates,alignment,modelingincl.ligandsandoligomers,hybridizationofmodelfragmentsGraphicalinterfaceortextmode(clusters)SWISS-MODELSWISS-MODEL:网址/非专业人士应用最为广泛的一个在线建模服务器。特点:简单、自动化、对学术团队免费。SWISS-MODEL:

//SWISS-MODEL.htmlAutomatedmodeAutomatedmode:自动模式,可以称为是最傻瓜的方式提交自己的氨基酸序列+邮箱即可适用:一致性较高时邮箱模型命名氨基酸序列PDB登录号PDB模板AlignmentmodeAlignmentmode:比对模式提交目标蛋白与模板蛋白的序列比对结果(FASTA,MSF,ClustalW等格式)适用:a、较高的相似性b、利用Auto模式未必能找到最合适模板的情况

c、使用者有目的的使用特定的模板蛋白(比如具有更为相似的活性位点结果,而不是更为相似的整体结构)邮箱模型命名比对后的序列比对文件ProjectmodeProjectmode:项目模式:

难以直接通过序列比对获得模板,需要人工插入调节(借助蛋白结构编辑软件deepview),可以将前两种模式模建出的蛋白进行人为调整适用:相似性不高HOMCOS1.0HOMCOS1.0:tein.osaka-u.ac.jp/homcos/同源二聚体建模异源二聚体建模识别可能的互作蛋白ESyPred3DESyPred3D:http://www.unamur.be/sciences/biologie/urbm/bioinfo/esypred/评价:自动建模预测服务程序,ESyPred3D在目标-模板比对这一步做出的结果较好,且在预测序列与模板序列相似度差时有较好的模型预测效果。Modeller该软件由Salilab开发,目前最新的版本是9.11,可在win下和linux运行,需要对应版本的python(<3.0)。完全免费。主要功能包括:多聚体建模,二硫键建模,杂原子建模等(配体、辅酶等)。自带一套模建结构后的优化、分析。But!该软件完全是命令行模式,操作相对复杂,可控制的地方多。Easymodeller对于习惯于GUI的我们来说,modeller操作不太方便。于是。。。印度Hyderabad大学的KuntalKumarBhusan为其编写了一个GUI界面,即为EasyModeller。EasyModeller,目前最新版本为4.0。之后,又有SWIFTMODELLER,UCSFChimerainterface2.蛋白质三级结构预测之线索化方法

Threading/foldrecognition线索化方法又称蛋白质折叠类型识别依据:蛋白质折叠模式的有限性:一些序列(小于25%,远程同源)/功能不同的蛋白质采用类似的结构,蛋白质折叠模式的种类是有限的。序列中的残基的结构信息比残基本身更加保守。Physicalforcesfavorcertainstructures.Structureisbetterconservedthansequence蛋白质结构分类数据库SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)Numberoffoldsislimited.Currently~700,Total:1,000~10,000CATH的结构层次有限的蛋白质折叠类型258种类型165种类型141种类型334种类型50种类型90%ofnewstructuressubmittedtoPDBinthepastthreeyearshavesimilarstructuralfoldsinPDB目标序列与数据库核心折叠比对取最佳核心折叠结构模型主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。具体做法是将结构转换为含有这三个结构的字符串,然后对这些字符串进行比较(sequence-structure

alignment)。线索技术的首要任务是建立核心折叠数据库在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模型的根据。evaluationwithcompatibilityfunctionsthestructuremostcompatiblewiththesequence

ConceptofThreadingThread(alignorplace)aqueryproteinsequenceontoatemplatestructurein“optimal”wayGoodalignmentgivesapproximatebackboneQuerysequence:MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTETemplatesetThreadingproblem

Threading:Givenasequence,andafold(template),computetheoptimalalignmentscorebetweenthesequenceandthefold.Ifwecansolvetheaboveproblem,thenGivenasequence,wecantryeachknownfold,andfindthebestfoldthatfitsthissequence.Becausethereareonlyafewthousandsfolds,wecanfindthecorrectfoldforthegivensequence.ThreadingisNP-hard.ProteinThreading–structuredatabaseBuildatemplatedatabaseProteinThreading–energyfunctionhowwellaresiduefitsastructuralenvironment:E_showpreferabletoputtwoparticularresiduesnearby:E_palignmentgappenalty:E_gtotalenergy:E_p+E_s+E_gfindasequence-structurealignmenttominimizetheenergyfunction序列-结构最佳对齐方式,能量最小化MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTEAssessingPredictionReliabilityPredictionofProteinStructuresExamples–afewgoodexamplesPredictionofProteinStructuresNotsogoodexampleExistingPredictionProgramsPROSPECT:/protein_pipelineFUGU:http://www-cryst.bioc.cam.ac.uk/~fugue/prfsearch.htmlTHREADER:http://bioinf.cs.ucl.ac.uk/threader/NameMethodDescriptionRaptorXRemotetemplatedetection,single-templateandmulti-templatethreading,totallydifferentfromandmuchbetterthantheoldprogramRAPTORdesignedbythesamegroupWebserverwithjobmanager,automaticallyupdatedfoldlibrary3D-PSSM3D-1Dsequenceprofiling(replacedbyPhyre)WebserverBioingbuEvolutionaryinformationrecognitionWebserverFALCON@homeSingle-templateandmulti-templatethreading,ahigh-throughputserverbasedonvolunteercomputingWebserverwithjobmanagerHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityNovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERCombinationofabinitiofoldingandthreadingmethodsStructuralandfunctionpredictionsLOOPPMultiplemethodsWebservermGenTHREADER/GenTHREADERSequenceprofileandpredictedsecondarystructureWebserverMUSTERprofile-profilealignmentWebserverPhyreandPhyre2Remotetemplatedetection,alignment,3Dmodeling,multi-templates,abinitioWebserverwithjobmanager,automaticallyupdatedfoldlibrary,genomesearchingandotherfacilitiesRAPTORIntegerprogrammingbasedfoldrecognitionFreedemoSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingFreedemo,interactivewebserverandstandaloneprogramincluding:3Dthreadingandflexible3dthreadingSUPERFAMILYHiddenMarkovmodelingWebserver/standaloneSPARKS-X3DstructuremodelingbyFoldrecognitionaccordingtoSequenceprofilesandstructuralprofilesWebserverBBSP-BuildingBlocksStructurePredictorHybridtemplate-basedFreeapplicationplusdatabase

I-TASSAR

I-TASSAR:/I-TASSER/也可以下载本地安装包评价:根据结果质量检验,该服务器应该是自动建模的软件里是结果最详细的,二级结构、top10模型、配体结合位点等等。缺点:计算结果时间比较长

结果需要进一步优化FlowchartofI-TASSERproteinstructuremodelling3.蛋白质三级结构预测之从头预测在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下使用根据序列本身来预测其结构可以用来预测任何一种蛋白质是三种方法中难度最大的基于一种假设-蛋白质折叠为能量最低的形式准确率较同源模建法要低(序列相似性>30%)能量函数和优化需要考虑的相互作用:疏水作用氢键二硫桥静电作用范德华力溶剂作用NameMethodDescriptionEVfoldEvolutionarycouplingscalculatedfromcorrelatedmutationsinaproteinfamily,usedtopredict3Dstructurefromsequencesaloneandtopredictfunctionalresiduesfromcouplingstrengths.Predictsbothglobularandtransmembraneproteins.WebserverFALCONAposition-specifichiddenMarkovmodeltopredictproteinstructurebyiterativelyrefiningthedistributionsofdihedralanglesWebserverQUARKMonteCarlofragmentassemblyOn-lineserverforproteinmodeling(bestforabinitiofoldinginCASP9)NovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERThreadingfragmentstructurereassemblyOn-lineserverforproteinmodelingROSETTARosettahomologymodelingandabinitiofragmentassemblywithGinzudomainpredictionWebserverRosetta@homeDistributed-computingimplementationofRosettaalgorithmDownloadableprogramCABSReducedmodelingtoolDownloadableprogramCABS-FOLDServerfordenovomodeling,canalsousealternativetemplates(consensusmodeling).WebserverBhageerathAcomputationalprotocolformodelingandpredictingproteinstructuresattheatomiclevel.WebserverAbaloneMolecularDynamicsfoldingProgramPEP-FOLDDenovoapproach,basedonaHMMstructuralalphabetOn-lineserverforpeptidestructurepredictionSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingInteractivewebserverandstandaloneprogramincluding:CABSabinitiomodelingFlowchartoftheROSETTAprotocol

方法特点工具同源建模法(Homology/Comparativemodelling)基于模板的蛋白结构预测;对于序列相似度的序列模拟比较有效最常用的方法SWISS-MODEL线索化法/折叠识别法

(Threading/Foldrecognition)基于模板的蛋白结构预测;“穿”入已知的各种蛋白质折叠骨架内适于对蛋白质核心结构进行预测计算量大PHYRETHREADER,从头预测法(Abinitio/Denovomethods)不依赖模板的蛋白结构预测,直接预测;基于分子动力学,寻找能量最低的构象;计算量大,目前只能做小分子预测;理论意义极大HMMSTR/ROSSETA4.蛋白质三维结构预测方法比较蛋白质三维结构预测方法比较二5.模型评估在模型使用前要对其进行评估!同源模建结果评价与改进策略PROCHECK、WHATCHECK、ERRAT、Verify_3D、PROVEUCLA-DOE的SAVES服务器包括了这五种常用的检测,其网址为:/SAVES/除SAVES外,Molprobity也是一个常用的在线模型分析工具,其网址为:/index.php

PROCHECK:以PDB中高分辨的晶体结构参数为参考,给出提交模型的一系列立体化学参数(主链)。其输出的结果包括:拉氏图,主链的键长与键角,二级结构图,平面侧链与水平面之间的背离程度等。WHATCHECK:包含大量的检测项,可以针对提交的蛋白结构与正常结构之间的差异,产生一个非常长而且详细的报告。ERRAT:计算0.35nm范围之内,不同原子类型对之间形成的非键相互作用的数目(侧链)。原子按照C、N、O/S进行分类,所以有六种不同的相互作用类型:CC、CN、CO、NN、NO、OO。得分>85比较好。Verify_3D:比较模型和氨基酸一级结构的关系,获得PASS评价即可。PROVE:与预先计算好的一系列标准体积之间的差别。用Z-score

来表示。Z-score作为一个统计学值,可以显示模板蛋白质和待测蛋白之间的匹配程度,当Z-score较低时,就意味着没有匹配搜索的结构模型提交SAVES服务器(StructuralAnalysisandVerificationServer)进行检验/SAVES/PROCHECKPROCHECK:本部分主要需要的是拉氏图(RamachandranPlot),可下载ps格式、PDF格式以及JPG格式。落在核心区+允许区+最大允许区的碱基百分比大于95%的模型质量很好。RamachandranplotVerify_3D78.74%oftheresidueshadanaveraged3D-1Dscore>0.2ERRATOverallqualityfactor值越高越好,一般高解析度的晶体结构该值可以达到95,而对于解析度一般的来说该值只能到91左右。本例中的ERRAT值为68.280,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论