版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9讲 蛋白质结构分析和预测生物信息学DNA sequenceProtein sequenceProtein structureProtein function蛋白质序列分析蛋白质一级序列蛋白质基本理化性质分析蛋白质亲疏水性分析跨膜区结构预测卷曲螺旋预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构预测蛋白质序列信号位点分析蛋白质超二级结构蛋白质结构域分析蛋白质三级结构蛋白质三维结构模拟蛋白质分类蛋白质家族分析蛋白质序列分析主要内容ExPASy(Expert Protein Analysis System)Tools(/tools/)蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质:相对分子
2、质量 氨基酸组成等电点(PI) 消光系数半衰期 不稳定系数总平均亲水性 实验方法:相对分子质量的测定、等电点实验、沉降实验缺点:费时、耗资基于实验经验值的计算机分析方法1.蛋白质基本理化性质分析 基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy 开发的针对蛋白质基本理化性质的分析:Protparam 工具 /tools/protparam.html相对分子质量 氨基酸组成等电点(PI) 消光系数半衰期 不稳定系数总平均亲水性 工具网站备注AACompldent/tools/aacomp/利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白Compute pI/Mw/
3、tools/pi_tool.html计算蛋白质序列的等电点和分子量ProtParam/tools/protparam.html对氨基酸序列多个物理和化学参数(分子量、等电点、吸光系数等)进行计算PeptideMass/tools/peptide-mass.html计算相应肽段的pI和分子量SAPShttp:/www.isrec.isb-sib.ch/software/SAPS_form.html利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白质理化性质分析工具AACompIdent PeptideMass蛋白质理化性质分析Protparam 工具 /tools/protparam.ht
4、ml计算以下物理化学性质:相对分子质量 理论 pI 值氨基酸组成 原子组成消光系数 半衰期不稳定系数 脂肪系数总平均亲水性主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入Swiss-Prot/TrEMBL AC号打开protein.txt,将蛋白质序列粘贴在搜索框中输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果 功能域用户自定义区段点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果氨基酸数目相
5、对分子质量理论 pI 值氨基酸组成正/负电荷残基数14消光系数半衰期原子组成分子式总原子数不稳定系数脂肪系数总平均亲水性40 unstable(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins蛋白质亲疏水性/跨膜区分析17蛋白质亲疏水性分析疏水作用是蛋白质折叠的主要驱动力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第
6、一步氨基酸疏水分析为蛋白质二级结构预测提供佐证可用于分析蛋白质相互作用位点-抗原位点预测(预测准确率达56%)是分析蛋白质跨膜区重要一步螺旋跨膜区主要是由20-30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成亲水残基往往出现在疏水残基之间,对功能有重要的作用基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量TMpred- /software/TMPRED_form.htmlSOSUI- http:/bp.nuap.nagoya-u.ac.jp/sosui/ 蛋白质跨膜区分析常用蛋白质跨膜区域分析工具工具网站备注DAShttp:/www.sbc.su.se/mik
7、los/DAS/用Dense Alignment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPhttp:/www.enzim.hu/hmmtop/由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具
8、TMpred/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序TMHMM ProtScale工具 /tools/protscale.html氨基酸标度表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等收集56多个文献中提供的氨基酸标度默认值以Hphob. Kyte & Doolittle做疏水性分析特异性氨基酸标度,如Hopp & Woods(1
9、981)针对抗原片段定位;Accessible residues(1979)针对氨基酸溶剂可及性定位;Chou & Fasman (1978)针对氨基酸二级结构疏水性分析蛋白质亲疏水性分析主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入Swiss-Prot/TrEMBL AC号打开protein.txt,将一条蛋白质序列粘贴在搜索框中计算窗口(7-11)相对权重值 权重值变化趋势 氨基酸标度是否归一化输出结果输入Swiss-
10、Prot/TrEMBL AC号分不同的功能域肽段功能域用户自定义区段所用氨基酸标度信息分析所用参数信息输出结果图形结果 文本结果 序列 参数 每个位置 的得分跨膜区分析TMpred工具:/software/TMPRED_form.html预测跨膜区和跨膜方向依靠跨膜蛋白数据库Tmbase主要参数/选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式最短和最长的跨膜螺旋疏水区长度输入序列名(可选)选择序列的格式贴入protein.txt蛋白质序列输出结果包含四个部分可能的跨膜螺旋区相关性列表可能的跨膜螺旋区相关性列表位置分值片段中点位置
11、 跨膜拓扑模型及图示建议的跨膜拓扑模型每一位置计算分值最优拓扑结构SOSUI工具: - http:/bp.nuap.nagoya-u.ac.jp/sosui/以图形方式返回结果,需要Java Applet程序输入氨基酸单字母运行平均疏水值预测的跨模螺旋区域两种跨膜Helix预测区域的螺旋示意图平均疏水值预测的跨模螺旋区域两种跨膜Helix33亲疏水轮廓跨膜蛋白序列“边界”原则 -Landolt Marticorena et al., 1993胞外末端Asp、Ser和Pro胞外-内分界区域Trp跨膜区Leu、Ile、Val、Met、Phe、Trp、Cys、Ala、Pro和Gly胞内-外分界区域T
12、yr、Trp和Phe胞内末端Lys和Arg两股或两股以上螺旋相互缠绕而形成超螺旋结构存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子运动、膜通道、分子识别等重要的生物功能,37蛋白质卷曲螺旋域分析 典型的有亮氨酸拉链,存在7残基 重复结构(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置 残 基为亲水性COILS- /software/COILS_form.htmlPEPCOIL- http:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html蛋白
13、质卷曲螺旋域分析工具网站备注Coils /software/COILS_form.html主流的预测螺旋卷曲工具Paircoil2http:/cb/paircoil2/paircoil2.html由MIT大学开发的基于残基配对概率算法的预测工具PEPCOILhttp:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html由EMBOSS维护的预测卷曲螺旋程序,同Coils类似SOCKET serverhttp:/www.lifesci.sussex.ac.uk/research/woolfson/html/coiledcoils/socket/ser
14、ver.html一个分析蛋白质结构中卷曲螺旋的工具,其输入数据格式为蛋白质结构数据TRESPASSERhttp:/comp.chem.nottingham.ac.uk/cgi-bin/trespasser/trespasser.cgi由Nottingham大学开发的亮氨酸拉链结构识别工具2ZIPhttp:/2zip.molgen.mpg.de/index.html预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋 蛋白质卷曲螺旋预测工具COILS- /software/COILS_form.htmlCOILS蛋白质卷曲螺旋预测方法基于Lupas算法,是目前主流的卷曲区域预测算法一般滑动窗口的大小采
15、用7的倍数蛋白质卷曲螺旋分析选择滑动窗口大小选择打分矩阵和权重选择输入格式,选择“SwissProtID or AC”查询内容,输入“GO45_HUMAN”图形结果2. 蛋白质二级结构预测1. Chou-Fasman predictions: Empirical2. Garnier, Osguthorpe and Robson (GOR): HMM3. David T. Jones: PSSM4. Frishman, Argos: Nearest neighbor methods 5. Sujun Hua: Support vector machine Chou-Fasman1. 预测三种主要
16、的二级结构:-helix, b-sheet,Coils2. 训练数据:15个已知构象的蛋白质结构,共2473个氨基酸残基3. 定义:蛋白质构象参数 (protein conformational parameters): 氨基酸残基在二级结构中的重要性P, P, Pc氨基酸在各种二级结构中的频率Inner Helix: Included in HelixP, P, Pc的计算P & P-helixb-sheet经验规则与预测性能1. 规则一:对于给定一个6aa的片段, P均值 1.03,并且P的均值 P的均值,则判定为-Helix2. 规则二:对于给定一个6aa的片段, P的均值 1.05,并
17、且 P的均值 P的均值,则判定为-sheet3. 预测性能:准确性50-60%;对于-sheet性能较差准确性65%Garnier, Osguthorpe and Robson (GOR):HMMDavid T. Jones: PSSMPSIPRED: PSSM + Neural Network准确性76.5%78.3%Frishman, Argos: Nearest neighbor methods准确性72%Sujun Hua: Support vector machine准确性76.2%3. 蛋白质三级结构预测(1) 结构基因组学(2) 蛋白质折叠的动力学(3) 蛋白质三级结构的预测:具
18、有最小自由能的构象A. Homology modelingB. ThreadingC. Ab inito Prediction结构基因组学 1. 人的基因组中包含22,00个基因2. 细胞内:通常3,000种蛋白质3. 序列与结构 2 million sequences in UniProt 33,000 protein structures in the PDB4. 目标:通过实验或者计算的手段解析所有蛋白质在自然条件下的三级结构55蛋白质折叠的动力学1. 蛋白质的折叠:细胞内:自发的;酶的介导;伴侣蛋白的介导体外:许多蛋白质不能自发折叠2. 动态:蛋白质的结构在自然条件下并不是固定的蛋白质
19、的功能常常依赖其构象的改变3. 自然条件下与变性之后的能量差非常小(5-15 kcal/mol) 大约等于1-2个氢键的能量4. 折叠过程中,熵与焓都发生改变56Protein Folding Code 1. 蛋白质结构预测/“蛋白质折叠”给定一个蛋白质的氨基酸序列,预测其三级结构 2. “反向折叠 给定一个蛋白质的结构,找出所有符合这个结构的氨基酸序列Homology Modeling1. 搜索已知三级结构的同源蛋白质序列 (模板)PSI-BLAST multiple sequence alignment (MSA)2. 选取与给定序列相似性最高的结构作为模板3. 将氨基酸残基替换到结构模板中对应的位置上,降低自由能4. 准确性好序列相似性高 模型可靠性高30% sequence identity5. 常用工具:MODELLER,Swiss-model 58Homology Modeling:Work WellThreading - Fold Recognition1. “搭积木”2. 实验发现: 蛋白质折叠的类型有限 (1,000)3. 问题: 能否根据不同的模版,预测给定蛋白质的折叠类型,并进一步拼装成三级结构?4. 计算要求:能量函数模版库(template library)5. 计算方法将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车维修服务客户满意度提升方案
- 个性化瑜伽训练方案
- 实验方法学课程设计
- 深基坑支护施工风险评估方案
- 锅炉脱硫脱硝设备选型方案
- 2024至2030年中国通讯配件数据监测研究报告
- 2024至2030年中国贝克曼温度计行业投资前景及策略咨询研究报告
- 2024至2030年中国羽毛毽子行业投资前景及策略咨询研究报告
- 2024至2030年中国狐必治药品数据监测研究报告
- 环保监测设备硬件和软件设施工方案
- 三元地理些子法
- 零星劳务合同模板(精选7篇)
- 检验科报告双签字制度
- 北京市海淀区乡镇地图可编辑PPT行政区划边界高清(北京市)
- 2022-2023学年湖南省长沙市长郡滨江中学物理九年级第一学期期中联考模拟试题含解析
- 幼儿园教学课件中班数学《水果列车》课件
- 小学语文五年级读写大赛试卷
- 二年级(上)音乐第四单元 单元分析
- 第一部分心理健康教育概论
- 集团公司后备人才选拔培养暂行办法
- 挡墙施工危险源辨识及风险评价
评论
0/150
提交评论