蛋白质结构与功能预测课件_第1页
蛋白质结构与功能预测课件_第2页
蛋白质结构与功能预测课件_第3页
蛋白质结构与功能预测课件_第4页
蛋白质结构与功能预测课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、蛋白质结构与功能预测2007年12月DNA sequenceProtein sequenceProtein structureProtein function蛋白质序列分析蛋白质一级序列蛋白质基本理化性质分析蛋白质亲疏水性分析跨膜区结构预测卷曲螺旋预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构预测蛋白质序列信号位点分析蛋白质超二级结构蛋白质结构域分析蛋白质三级结构蛋白质三维结构模拟蛋白质分类蛋白质家族分析蛋白质序列分析主要内容ExPASy(Expert Protein Analysis System)Tools()蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质:相对分子质量 氨基酸组成

2、等电点(PI) 消光系数半衰期 不稳定系数总平均亲水性 实验方法:相对分子质量的测定、等电点实验、沉降实验缺点:费时、耗资基于实验经验值的计算机分析方法1.蛋白质基本理化性质分析 基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy 开发的针对蛋白质基本理化性质的分析:Protparam 工具 http:/相对分子质量 氨基酸组成等电点(PI) 消光系数半衰期 不稳定系数总平均亲水性 工具网站备注AACompldent利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白Compute pI/Mw计算蛋白质序列的等电点和分子量ProtParam对氨基酸序列多个物理和化学参

3、数(分子量、等电点、吸光系数等)进行计算PeptideMass计算相应肽段的pI和分子量SAPS利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白质理化性质分析工具AACompIdent PeptideMass蛋白质理化性质分析Protparam 工具 计算以下物理化学性质:相对分子质量 理论 pI 值氨基酸组成 原子组成消光系数 半衰期不稳定系数 脂肪系数总平均亲水性主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入S

4、wiss-Prot/TrEMBL AC号打开protein.txt,将蛋白质序列粘贴在搜索框中输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果 功能域用户自定义区段点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果氨基酸数目相对分子质量理论 pI 值氨基酸组成正/负电荷残基数14消光系数半衰期原子组成分子式总原子数不稳定系数脂肪系数总平均亲水性40 unstable(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid

5、chain-anchored membrane proteins(e)-GPI-anchored membrane proteins蛋白质亲疏水性/跨膜区分析蛋白质亲疏水性分析疏水作用是蛋白质折叠的主要驱动力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步氨基酸疏水分析为蛋白质二级结构预测提供佐证可用于分析蛋白质相互作用位点-抗原位点预测(预测准确率达56%)是分析蛋白质跨膜区重要一步螺旋跨膜区主要是由20-30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成亲水残基往往出现在疏水残基之间,对功能有重要的作用基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量TMpr

6、ed- SOSUI- 蛋白质跨膜区分析常用蛋白质跨膜区域分析工具工具网站备注DAS用Dense Alignment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOP由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUI由Nagoya大学开发一个具有图形显示跨膜区的程序TMAP基于多序列比对来预测跨膜区的程序TMHMM基于HMM方法的蛋白质跨膜区预测工具TMpred基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPred是一个位于法国的蛋白质拓扑结构预测程序TMHMM ProtScale工具 氨基酸标度表示氨基酸在某种实验状态下相对其他

7、氨基酸在某些性质的差异,如疏水性、亲水性等收集56多个文献中提供的氨基酸标度默认值以Hphob. Kyte & Doolittle做疏水性分析特异性氨基酸标度,如Hopp & Woods(1981)针对抗原片段定位;Accessible residues(1979)针对氨基酸溶剂可及性定位;Chou & Fasman (1978)针对氨基酸二级结构疏水性分析蛋白质亲疏水性分析主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入S

8、wiss-Prot/TrEMBL AC号打开protein.txt,将一条蛋白质序列粘贴在搜索框中计算窗口(7-11)相对权重值 权重值变化趋势 氨基酸标度是否归一化输出结果输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段功能域用户自定义区段所用氨基酸标度信息分析所用参数信息输出结果图形结果 文本结果 序列 参数 每个位置 的得分跨膜区分析TMpred工具:预测跨膜区和跨膜方向依靠跨膜蛋白数据库Tmbase主要参数/选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式最短和最长的跨膜螺旋疏水区长度输入序列名(可选)选择

9、序列的格式贴入protein.txt蛋白质序列输出结果包含四个部分可能的跨膜螺旋区相关性列表可能的跨膜螺旋区相关性列表位置分值片段中点位置 跨膜拓扑模型及图示建议的跨膜拓扑模型每一位置计算分值最优拓扑结构SOSUI工具: - /以图形方式返回结果,需要Java Applet程序输入氨基酸单字母运行平均疏水值预测的跨模螺旋区域两种跨膜Helix预测区域的螺旋示意图平均疏水值预测的跨模螺旋区域两种跨膜Helix33亲疏水轮廓跨膜蛋白序列“边界”原则 -Landolt Marticorena et al., 1993胞外末端Asp、Ser和Pro胞外-内分界区域Trp跨膜区Leu、Ile、Val、M

10、et、Phe、Trp、Cys、Ala、Pro和Gly胞内-外分界区域Tyr、Trp和Phe胞内末端Lys和Arg两股或两股以上螺旋相互缠绕而形成超螺旋结构存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子运动、膜通道、分子识别等重要的生物功能,37蛋白质卷曲螺旋域分析 典型的有亮氨酸拉链,存在7残基 重复结构(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置 残 基为亲水性COILS- PEPCOIL- 蛋白质卷曲螺旋域分析工具网站备注Coils 主流的预测螺旋卷曲工具Paircoil2由MIT大

11、学开发的基于残基配对概率算法的预测工具PEPCOIL由EMBOSS维护的预测卷曲螺旋程序,同Coils类似SOCKET server一个分析蛋白质结构中卷曲螺旋的工具,其输入数据格式为蛋白质结构数据TRESPASSER由Nottingham大学开发的亮氨酸拉链结构识别工具2ZIP预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋 蛋白质卷曲螺旋预测工具COILS- COILS蛋白质卷曲螺旋预测方法基于Lupas算法,是目前主流的卷曲区域预测算法一般滑动窗口的大小采用7的倍数蛋白质卷曲螺旋分析选择滑动窗口大小选择打分矩阵和权重选择输入格式,选择“SwissProtID or AC”查询内容,输入“G

12、O45_HUMAN”图形结果蛋白质二级结构预测 基本的二级结构螺旋,折叠, 转角,无规则卷曲(coils)以及模序(motif)等蛋白质局部结构组件 分析方法:基于统计和机器学习方法进行预测Chou-Fasman算法GOR算法多序列列线预测基于神经网络的序列预测基于已有知识的预测方法(knowledge based method)混合方法(hybrid system method)工具网站备注BCM SearchLauncher 包括了常见的蛋白质结构分析程序入口,一般分析可以以此服务器作为起点HNN基于神经网络的分析工具,含序列到结构过程和结构到结构处理Jpred基于Jnet神经网络的分析程

13、序,并采用PSI-BLAST来构建序列Profile进行预测,对于序列较短、结构单一的蛋白预测较好nnPredict预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋NNSSP基于双层前反馈神经网络为算法,还考虑到蛋白质结构分类信息PREDATOR预测时考虑了氨基酸残基间的氢键蛋白质二级结构分析工具工具网站备注PredictProtein提供多项蛋白质性质分析,并有较好准确性Prof基于多重序列比对预测工具PSIpred提供跨膜蛋白拓扑结构预测和蛋白profile折叠结构识别工具SOPMA可以比较各种分析方法得到的结果,也可输出 “一致性结果”SSPRED基于数据库搜索相似蛋白并构建多重序列比对蛋

14、白质二级结构分析工具(续)蛋白质二维结构预测PredictProtein可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准需要注册帐号用于学术研究PredictProtein提交界面详解提交邮件地址(必填)蛋白名称(可选)分析方法1D序列预测PROFsec(默认)基于轮廓(profile)神经网络预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)神经网络预测残基溶剂可及性PHDhtm(默认)基于多序列比对中预测跨膜区位置和拓扑结构ASP(默认)识别二级结

15、构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别细菌中Beta桶结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置无序结构识别PROFbval识别序列标准骨架的B-value值UCON预测蛋白质中非3D结构区域折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性来预测蛋白质结构域CHOP (coming soon)预测蛋白质结构域结构

16、表面识别ConSeq (coming soon)预测蛋白质结构表面结构功能关键残基分析方法程序详解跨膜螺旋预测(PHDhtm)专家选项Ambivalent序列识别(ASP)专家选项CHOP结构域分析工具专家选项比对内容从SWISS-PROT数据库返回BLAST搜索结果MaxHom参数选项最低序列比对一致性空位间隔罚分空位延伸罚分比对矩阵最大击中值选择保存分析结果是否返回多序列比对结果HTML结果形式AGAPE结果PROF/PHD结果形式以下拉框中所指定的输入格式将待测序列粘贴此提交栏服务器运行程序信息ProSite模体搜索结果低复杂区域过滤程序ProDom结构域搜索结果二硫键识别结果PHD程序

17、信息PHD预测结果PROF预测结果球状蛋白预测结果Ambivalent序列识别结果PredictProtein分析结果PredictProtein分析结果跨膜区非跨膜区LoopHelixSheet结构域分析结构域是蛋白序列的功能、结构和进化单元 分析方法序列比对基于蛋白质家族的位置特异性矩阵或概形矩阵基本类型 : 折叠折叠/折叠+折叠57工具网站备注CDD通过比较目标序列和一组位置特异性打分矩阵进行RPS-BLAST来确定目标序列中的保守结构域HAMAP通过专家预测系统产生的微生物家族同源蛋白数据InterPro蛋白质家族、结构域和功能位点的联合资源数据库,整合了多个数据库和工具的结果,并提供

18、相应的链接Pfam每个蛋白家族包含了多序列比对、pro和注释文件ProDom从SWISS-PROT/TrEMBL数据库中的非片段蛋白序列数据构成,每条记录包含一个同源结构域多重比对和家族保守一致性序列SMART由EMBL建立,集成了大部分已知蛋白功能域数据,注释包括了功能类型、三维结构、分类信息模体、结构域数据库工具网站备注TIGRFAMs由TIGR实验室维护的蛋白质家族和结构域数据库PRINTS蛋白质模体指纹数据库,提供了FingerPRINTScan、FPScan和GRAPHScan等指纹识别工具DOMO同源蛋白结构域家族数据库,有多个镜像网站BLOCKS收录了通过高度保守蛋白区域比对出的

19、无空位片段eMOTIF由斯坦福大学维护。从BLOCKS+数据库和PRINTS数据库中收集了生物功能高度保守的高特异性蛋白序列模体、结构域数据库蛋白质三维结构预测方法特点工具同源建模法( Homology/Comparative modelling )基于序列同源比对,对于序列相似度30的序列模拟比较有效,最常用的方法 SWISS-MODEL, CPHmodels 串线法/折叠识别法 (Threading/Fold recognition)“穿”入已知的各种蛋白质折叠骨架内,适于对蛋白质核心结构进行预测,计算量大THREADER,3D-PSSM从头预测法( Ab initio/De novo m

20、ethods )基于分子动力学,寻找能量最低的构象,计算量大,只能做小分子预测HMMSTR/ ROSSETA同源建模法分析步骤:多序列比对与已有晶体结构的蛋白质序列比对确定是否有可以使用的模板序列相似度30%序列相似度30%,结合功能,蛋白质一级序列、二级结构或结构域信息构建三维模型三维模型准确性检验Whatcheck 程序Ramachandran plot计算检验手工调整多序列比对,重新拟和,构建新的模型 *常用数据库数据库网站备注PDB主要的蛋白质三维结构数据库MMDBNCBI维护的蛋白质结构数据库Psdb从PDB和NRL-3D数据库中衍生出的数据库,含二级结构和三维结构信息3DinSig

21、ht整合了结构、性质(氨基酸组成、热力学参数等)、生物学功能(突变点,相互作用等)的综合数据库,FSSP根据结构比对的蛋白质结构分类数据库SCOP蛋白质结构分类数据库,将已知结构蛋白进行有层次地分类CATH另一个有名的蛋白质结构和结构域主要结构分类库MODBASE用同源比对法生成的模型结构数据库Enzyme Structure从PDB数据库中整理已知结构的酶蛋白数据库HSSP根据同源性到处的蛋白质结构数据库模板搜索与比对工具网站备注PSI-BLAST位置特异性叠代BLAST,可用来搜索远源家族序列FASTA3位于EBI的序列比对工具SSEARCH采用Smith/Waterman法来进行序列比对

22、ClustalW多序列比对工具,位于EBIT-Coffee用多种方法(如ClustalW、DIalign等)来构建多序列比对Multalin一个老牌的多序列比对工具Dali三维结构比对网络服务器VAST基于向量并列分析算法的三维结构比对工具SAM-T99用HMM法搜索蛋白质远源同源序列同源建模法工具网站备注SWISS-MODEL完整建模程序,采用同源性鉴定来确定模板蛋白,用户也可以自定义模板进行分析CPHmodels基于神经网络的同源建模工具,用户只需提交序列,无高级选项EsyPred3D采用神经网络来提高同源建模准确性的预测工具3Djigsaw根据同源已知结构蛋白来建模的预测工具MODELL

23、ER一个广泛使用的同源建模软件,需要用户对脚本有一定的了解串线法工具网站备注3D-PSSM第一个运用1D-3D序列profile来预测蛋白质折叠结构的网络服务器Fugue以序列结构比对搜索数据库来预测蛋白质折叠HHpred基于HMM-HMM比对搜索多个数据库来预测给定序列的的折叠结构LOOPP学习、观察和输出蛋白质模式和结构工具THREADER一个老牌的线索分析软件,对搜索远源蛋白序列较敏感PROSPECT蛋白质结构预测和评价工具包,能以一种非常简单的方式运行,对于高级用户,也提供了很多的可选项123D+结合了序列概形,二级结构信息和接触势能来将待测蛋白“穿入”一系列结构来预测结构SAM-T0

24、2基于HMM方法的蛋白质结构预测GenThreader使用结构评分和基于神经网络序列比对来也测蛋白折叠结构蛋白质三维结构预测SWISS-MODEL工具同源建模方法与PDB数据库已知结构的蛋白质序列比对进行预测主要参数/选项粘贴protein.txt中一条蛋白质序列输入用户Email(选填) 比对e值参照模板序列数目输出结果下载pdb格式文件与模板序列比对结果,并显示二级结构区域3D-PSSM工具由英国伦敦帝国理工学院维护,其数据库中含有9864个蛋白折叠结构3D-PSSM先用PSI-BLAST标准方法通过多序列比对得到轮廓(profile),然后对家族中的一系列成员进行结构比对得出该家族的结构轮廓,接着用线串法将模板结构轮廓和待测蛋白的序列轮廓进行1D-3D轮廓之间的比对,此外也考虑了溶剂可及性和二级结构信息输入用户Email(学术邮箱,必需)蛋白质描述(选填)序列提交框(氨基酸单字母)输入用户Email(必需)蛋白质描述(选填)序列提交框(氨基酸单字母)Phyre - 3d-PSSM的升级版,增加了fold数据,并且性能上提高10-15,采用了新的分析界面二级结构预测序列比对结果序列比对一致性模板长度靶标蛋白模型模板蛋白结构分类信息折叠子描述工具网站备注Swiss-PdbViewer一个界

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论