蛋白质结构与功能预测.ppt_第1页
蛋白质结构与功能预测.ppt_第2页
蛋白质结构与功能预测.ppt_第3页
蛋白质结构与功能预测.ppt_第4页
蛋白质结构与功能预测.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、DNA sequence,Protein sequence,Protein structure,Protein function,蛋白质序列分析主要内容,ExPASy(Expert Protein Analysis System)Tools(/tools/),蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质: 相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 实验方法: 相对分子质量的测定、等电点实验、沉降实验 缺点:费时、耗资 基于实验经验值的计算机分析方法,1.蛋白质基本理化性质分析,基于一级序列的组分分析 氨基酸亲疏水

2、性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析: Protparam 工具 /tools/protparam.html,相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 ,蛋白质理化性质分析工具,AACompIdent,PeptideMass,蛋白质理化性质分析,Protparam 工具 /tools/protparam.html 计算以下物理化学性质: 相对分子质量 理论 pI 值 氨基酸组成 原子组成 消光系数 半衰期 不稳定系数 脂肪系数

3、总平均亲水性,主要选项/参数,序列在线提交形式: 如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number) 如果分析新序列: 直接在搜索框中粘贴氨基酸序列,输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段,输出结果,点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果,正/负电荷残基数,13,原子组成,分子式,总原子数,不稳定系数,脂肪系数,总平均亲水性,40 unstable,(a)-Type I membrane protein (b)-Type II membrane protein

4、 (c)-Multipass transmembrane proteins (d)-Lipid chain-anchored membrane proteins (e)-GPI-anchored membrane proteins,蛋白质亲疏水性/跨膜区分析,蛋白质亲疏水性分析,疏水作用是蛋白质折叠的主要驱动力 分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步 氨基酸疏水分析为蛋白质二级结构预测提供佐证 可用于分析蛋白质相互作用位点-抗原位点预测(预测准确率达56%) 是分析蛋白质跨膜区重要一步,螺旋跨膜区主要是由20-30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成

5、 亲水残基往往出现在疏水残基之间,对功能有重要的作用 基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量 TMpred- /software/TMPRED_form.html SOSUI- http:/bp.nuap.nagoya-u.ac.jp/sosui/,蛋白质跨膜区分析,常用蛋白质跨膜区域分析工具,TMHMM,ProtScale工具 /tools/protscale.html 氨基酸标度 表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等 收集56多个文献中提供的氨基酸标

6、度 默认值以Hphob. Kyte & Doolittle做疏水性分析 特异性氨基酸标度,如Hopp & Woods(1981)针对抗原片段定位;Accessible residues(1979)针对氨基酸溶剂可及性定位;Chou & Fasman (1978)针对氨基酸二级结构疏水性分析,蛋白质亲疏水性分析,主要选项/参数 序列在线提交形式: 如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number) 如果分析新序列: 直接在搜索框中粘贴氨基酸序列,是否归一化,输出结果 输入Swiss-Prot/TrEMBL

7、 AC号分不同的功能域肽段,所用氨基酸标度信息,分析所用参数信息,输出结果,跨膜区分析,TMpred工具:/software/TMPRED_form.html 预测跨膜区和跨膜方向 依靠跨膜蛋白数据库Tmbase,主要参数/选项,序列在线提交形式: 直接贴入蛋白序列 填写SwissProt/TrEMBL/EMBL/EST的ID或AC,输出结果,包含四个部分 可能的跨膜螺旋区 相关性列表,跨膜拓扑模型及图示,SOSUI工具: - http:/bp.nuap.nagoya-u.ac.jp/sosui/ 以图形方式返回结果,需要Java Applet程序

8、,输入氨基酸单字母,运行,平均疏水值,预测的跨模螺旋区域,两种跨膜Helix,预测区域的螺旋示意图,平均疏水值,预测的跨模螺旋区域,两种跨膜Helix,32,亲疏水轮廓,跨膜蛋白序列“边界”原则 -Landolt Marticorena et al., 1993,胞外末端Asp、Ser和Pro 胞外-内分界区域Trp 跨膜区Leu、Ile、Val、Met、Phe、Trp、Cys、Ala、Pro和Gly 胞内-外分界区域Tyr、Trp和Phe 胞内末端Lys和Arg,两股或两股以上螺旋相互缠绕而形成超螺旋结构 存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子

9、运动、膜通道、分子识别等重要的生物功能,,36,蛋白质卷曲螺旋域分析,典型的有亮氨酸拉链,存在7残基 重复结构(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置 残 基为亲水性,COILS- /software/COILS_form.html PEPCOIL- http:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html,蛋白质卷曲螺旋域分析,蛋白质卷曲螺旋预测工具,COILS- /softw

10、are/COILS_form.html COILS蛋白质卷曲螺旋预测方法基于Lupas算法,是目前主流的卷曲区域预测算法 一般滑动窗口的大小采用7的倍数,蛋白质卷曲螺旋分析,选择滑动窗口大小,选择打分矩阵和权重,选择输入格式,选择“SwissProtID or AC”,查询内容,输入“GO45_HUMAN”,图形结果,蛋白质二级结构预测,基本的二级结构 螺旋,折叠, 转角,无规则卷曲(coils)以及模序(motif)等蛋白质局部结构组件 分析方法: 基于统计和机器学习方法进行预测 Chou-Fasman算法 GOR算法 多序列列线预测 基于神经网络的序列预测 基于已有知识的预测方法 (kno

11、wledge based method) 混合方法(hybrid system method),蛋白质二级结构分析工具,蛋白质二级结构分析工具(续),蛋白质二维结构预测,PredictProtein / 可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息 该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准 需要注册帐号用于学术研究,PredictProtein提交界面详解,提交邮件 地址(必填),蛋白名称(可选),分析方法,分析方法程序详解,跨膜螺旋预测(PHDh

12、tm)专家选项,Ambivalent序列识别(ASP)专家选项,CHOP结构域分析工具专家选项,比对内容,从SWISS-PROT数据库返回BLAST搜索结果,MaxHom参数选项,最低序列比对一致性,空位间隔罚分,空位延伸罚分,比对矩阵,最大击中值,选择保存分析结果,是否返回多序列比对结果,HTML结果形式,AGAPE结果,PROF/PHD结果形式,以下拉框中所指定的输入格式将待测序列粘贴此提交栏,PredictProtein分析结果,PredictProtein分析结果,结构域分析,结构域是蛋白序列的功能、结构和进化单元 分析方法 序列比对 基于蛋白质家族的位置特异性矩阵或概形矩阵,基本类型

13、 :,折叠,折叠,/折叠,+折叠,56,模体、结构域数据库,模体、结构域数据库,蛋白质三维结构预测,同源建模法分析步骤: 多序列比对 与已有晶体结构的蛋白质序列比对 确定是否有可以使用的模板 序列相似度30% 序列相似度30%,结合功能,蛋白质一级序列、二级结构或结构域信息 构建三维模型 三维模型准确性检验 Whatcheck 程序 Ramachandran plot计算检验 手工调整多序列比对,重新拟和,构建新的模型 *,蛋白质三维结构预测,SWISS-MODEL工具 http:/www.expasy.ch/swissmod/SWISS-MODEL.html 同源建模方法 与PDB数据库已知

14、结构的蛋白质序列比对进行预测,主要参数/选项,输出结果,3D-PSSM工具 http:/www.sbg.bio.ic.ac.uk/3dpssm/index2.html 由英国伦敦帝国理工学院维护,其数据库中含有9864个蛋白折叠结构 3D-PSSM先用PSI-BLAST标准方法通过多序列比对得到轮廓(profile),然后对家族中的一系列成员进行结构比对得出该家族的结构轮廓,接着用线串法将模板结构轮廓和待测蛋白的序列轮廓进行1D-3D轮廓之间的比对,此外也考虑了溶剂可及性和二级结构信息,输入用户Email(必需),蛋白质描述(选填),序列提交框(氨基酸单字母),Phyre -http:/www

15、.sbg.bio.ic.ac.uk/phyre/ 3d-PSSM的升级版,增加了fold数据,并且性能上提高10-15,采用了新的分析界面,二级结构预测,序列比对结果,序列比对一致性,模板长度,靶标蛋白模型,模板蛋白结构分类信息,折叠子描述,常用蛋白质三维结构观察和修改工具,Chime网络游览器插件,Chime- 基于游览器的三维结构观察工具 安装后在Internet Explorer下的 PLUGINS文件夹中会有: npchime.dll (plugins folder) npchime.zip (plugins folder, used for LiveConnect) NOTE: Do not unzip this file chimepro.html (plugins folder, the release notes for Chime) chime26.isu (plugins fold

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论