版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物信息学生物信息学谢文海谢文海 讲师讲师 第第五五章章 蛋白质蛋白质序列序列分析及结构预测分析及结构预测一、蛋白质的结构一、蛋白质的结构二、蛋白质数据库介绍二、蛋白质数据库介绍三、蛋白质序列分析三、蛋白质序列分析四、蛋白质结构四、蛋白质结构预测预测五、蛋白质五、蛋白质功能预测功能预测从多条免疫球蛋白序列中提取的从多条免疫球蛋白序列中提取的8 8个片段的多重比对个片段的多重比对疏水氨基酸色氨酸半胱氨酸保守结构域免疫球蛋白恒定区免疫球蛋白可变区回顾1.human beta globin (人(人珠蛋白)珠蛋白)2.horse beta globin (马(马珠蛋白)珠蛋白)3.human alp
2、ha globin (人(人珠蛋白)珠蛋白)4.horse alpha globin (马(马珠蛋白)珠蛋白)5.cyanohaemoglobin (蓝血红蛋白)(蓝血红蛋白)6. whale myoglobin (鲸肌红蛋白)(鲸肌红蛋白)7.Leghaemoglobin (豆血红蛋白)(豆血红蛋白)通过珠蛋白的比通过珠蛋白的比较构建系统发育较构建系统发育树判断生物进化树判断生物进化分歧时间分歧时间回顾DNA 序列蛋白序列蛋白结构功能结构是蛋白行使功能的前提蛋白质的结构主要分为四级蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构以及四级结一级结构、二级结构、三级结构以及四级结构构。一
3、级结构一级结构:蛋白质多肽链中氨基酸残基的排列顺序蛋白质多肽链中氨基酸残基的排列顺序MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE二级结构:主要由氢键维系的结构(二级结构:主要由氢键维系的结构(-螺旋螺旋、-折叠折叠)指指多肽多肽链中主链原子的局部空间排布即构象,不涉及侧链部分的构象链中主链原子的局部空间排布即构象,不涉及侧链部分的构象。螺旋、螺旋、 折叠折叠、 转角、无规卷曲转角、无规卷曲 、螺旋组合(螺旋组合()折叠组合(折叠组合()和)和螺旋螺旋折叠组合(折叠组合()螺旋螺旋(helix)的结构特征为:的结构特征为:(1)主链骨架围绕中心轴盘绕
4、形成右手螺旋;)主链骨架围绕中心轴盘绕形成右手螺旋;(2)螺旋每上升一圈是)螺旋每上升一圈是3.6个氨基酸残基,螺距为个氨基酸残基,螺距为0.54nm;(3)相邻螺旋圈之间形成许多氢键;)相邻螺旋圈之间形成许多氢键;(4)侧链基团位于螺旋的外侧)侧链基团位于螺旋的外侧。Ala、Glu、Leu、Met 促进形成促进形成 Pro、 Gly、Tyr、Ser不利于形成不利于形成(1)若干条肽链或肽段平行或反平行排列成片;)若干条肽链或肽段平行或反平行排列成片;(2)所有肽键的)所有肽键的C=O和和NH形成链间氢键;形成链间氢键;(3)侧链基团分别交替位于片层的上、下方。)侧链基团分别交替位于片层的上、
5、下方。 折叠折叠(sheets) 的结构特征为:的结构特征为:a.反反平行和平行的多个平行和平行的多个折叠链形成一个完整折叠链形成一个完整折叠结构的氢键示意图折叠结构的氢键示意图;b.来自来自人人pi型谷胱甘肽型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分转硫酶中单个亚基中连续主链的部分折叠结构折叠结构(2DGQ.pdb)侧面视侧面视图,可见转角图,可见转角(turn); c.来自来自人人pi型谷胱甘肽型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分转硫酶一个亚基中连续主链的部分折叠结构顶部视图,可见转角折叠结构顶部视图,可见转角(turn);d.来自来自人信号传递蛋白人信号传递蛋白SMAD4
6、(1DD1.pdb)的一个亚基中部分的一个亚基中部分折叠结构顶部视图,可见到大折叠结构顶部视图,可见到大的环区的环区(loop)。 多肽链多肽链180回折部分,通常由四个氨基酸残基构成,借回折部分,通常由四个氨基酸残基构成,借1. 4残基残基之间形成的氢键维系。之间形成的氢键维系。 Asp、Asn、Ser、Thr、Gln 、Pro 常出现在常出现在转角转角转角的结构特征为:转角的结构特征为:来自来自人细胞珠蛋白人细胞珠蛋白(2DC3.pdb)的两段的两段螺旋由螺旋由转角连接,用粗树枝状显转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。示了两段螺旋末端的脯氨酸。无规卷曲无规卷曲的结构特征为:的结
7、构特征为: 无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法识别无规卷曲往无法识别无规卷曲(缺失其座标缺失其座标),即使有座标则其温度因子也较高,即使有座标则其温度因子也较高。无规卷曲同。无规卷曲同环的区分主要是其长度和其形状的波动性。环的区分主要是其长度和其形状的波动性。 超二级结构超二级结构(supersecondary structure)指位于同一主链的多个二级指位于同一主链的多个二级结构组
8、装形成的特定组装体,可直接作为三级结构的或结构域的组成单元结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。构形成的模体。 (1)转角或转角或环等连接连续四个环等连接连续四个螺旋形成的四螺旋形成的四螺旋捆;螺旋捆;(2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的含有强亲水侧链氨基酸的螺旋组成的亮氨酸拉链螺旋组成的亮氨酸拉链(Leucine zi
9、pper);(3)一条主链中相邻七个两亲)一条主链中相邻七个两亲螺旋通过过度结构形成的七次穿膜螺旋螺旋通过过度结构形成的七次穿膜螺旋组;组;(4)连续主链中两段)连续主链中两段螺旋连接三段螺旋连接三段折叠链形成的折叠链形成的Rossmann折叠;折叠;(5)转角连接转角连接a螺旋构成的螺旋构成的a-螺旋螺旋-转角转角-螺旋;螺旋;(6)环连接环连接螺旋构成的螺旋构成的螺旋螺旋-环环-螺旋等。螺旋等。(7)-折叠都为超二级结构。折叠都为超二级结构。 二级结构进一步折叠形成的结构域三级结构三级结构:蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或
10、折迭形成具有一定规律的三维空间结构,称为蛋白质的三级结构折迭形成具有一定规律的三维空间结构,称为蛋白质的三级结构(tertiary structure)。蛋白质三级结构的稳定主要靠次级键,包括)。蛋白质三级结构的稳定主要靠次级键,包括氢键、疏水键、盐键以及范德华力(氢键、疏水键、盐键以及范德华力(Van der Wasls力)等。力)等。四级结构四级结构:具有二条或二条以上独立三级结构的多肽链组成的蛋白具有二条或二条以上独立三级结构的多肽链组成的蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质的四级结构(质的四级结构(qua
11、rternary structure)。其中,每个具有独立)。其中,每个具有独立三级结构的多肽链单位称为亚基(三级结构的多肽链单位称为亚基(subunit)。)。蛋白质的一级结构决定了蛋白质的二级、三级、四级结构蛋白质的一级结构决定了蛋白质的二级、三级、四级结构如如PIR、SWISS-PROT、NCBI , 这些数据库的这些数据库的数据主要以蛋白质的序列为主数据主要以蛋白质的序列为主, 并赋予相应的注释并赋予相应的注释; 如如PROSITE、Pfam, 这些数据库主要这些数据库主要收集了蛋白质的保守结构域和功能域的特征序列收集了蛋白质的保守结构域和功能域的特征序列; 如如PDB 等等, 这些数
12、据库主要以蛋白质的结构测这些数据库主要以蛋白质的结构测量数据为主量数据为主; 如如SCOP、CATH、FSSP 等等, 这其中有以序列这其中有以序列比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据库之分。库之分。依据蛋白质的结构层次依据蛋白质的结构层次, 将蛋白质数据库分为将蛋白质数据库分为: 蛋白质数据库蛋白质数据库r 这些数据库种类有差别这些数据库种类有差别, 但内部是相互联系的但内部是相互联系的.r 每个数据库都有指针指向其他数据库每个数据库都有指针指向其他数据库, 而且数而且数据库之间的序列以及相应的结构是共享的据
13、库之间的序列以及相应的结构是共享的, 同一同一种蛋白质依次会出现在不同的数据库种蛋白质依次会出现在不同的数据库.r这样的数据沟通有助于更深层地挖掘蛋白质的这样的数据沟通有助于更深层地挖掘蛋白质的内在生物信息内在生物信息, 这些数据库是融序列信息的索取、这些数据库是融序列信息的索取、处理、存储、输出于一身的。处理、存储、输出于一身的。(1)PIR(protein information resource, PIR)和和PSD (protein sequence database, PSD) /pirwww PIR-PSD 是一个综合全面的、非冗余的
14、、专业注释的、分类完整的蛋白是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白质序列数据库。质序列数据库。PIR-PSD 的序列来自于将的序列来自于将GenBank/ EMBL/ DDBJ 三大三大数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用数据库的编码序列的翻译而成的蛋白质序列、发表的文献中的序列和用户直接提交的序列。户直接提交的序列。(2)SWISS-PROT/ TrEMBL数据库数据库 /swissprot数据库由蛋白质序列条目构成数据库由蛋白质序列条目构成, 每个条目包含蛋白质序列、引用文献信每个条目包含蛋白质序列、引用文献信息息、分类
15、学、分类学信息、注释等信息、注释等, 注释中包括蛋白质的功能、转录后修饰位点、注释中包括蛋白质的功能、转录后修饰位点、特殊特殊位点和位点和区域、二级结构、四级结构、与其他序列的相似性、序列区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系残缺与疾病的关系、序列、序列变异体等信息。变异体等信息。模体数据库模体数据库(1)PROSITE 蛋白质家族及结构域数据库蛋白质家族及结构域数据库( /prosite/ ) PROSITE 数据库收集了有显著生物学意义的蛋白质位点序列、蛋白质特征序列谱库以及序列模型, 并能依据这些特征属性快速可靠地鉴定出一个未知功能
16、蛋白质序列属于哪个蛋白质家族, 即使在蛋白质序列相似性很低的情况下, 也可以通过搜索隐含的功能结构模体(motif)来鉴定, 因此是有效的序列分析数据库。 PROSITE 中涉及的序列模式包括酶的催化位点、配体结合位点、金属离子结合位点、二硫键、小分子或者蛋白质结合区域等, 此外PROSITE 还包括由多序列比对构建的序列表谱( profile) , 能更敏感地发现序列中的信息。PROSITE同时数据库提供了序列分析工具同时数据库提供了序列分析工具: ScanProsite 是用于搜索所提交的序列数据是否包是用于搜索所提交的序列数据是否包含含 PROSITE 数据库中的序列模式或者数据库中的序
17、列模式或者SWISS-PROT 数据库中已提交的序列模式数据库中已提交的序列模式; MotifScan 用于查找未知序列中所有可能的已知结用于查找未知序列中所有可能的已知结构组件构组件, 数据库包括数据库包括PROSITE序列表谱、序列表谱、PROSITE 模式、模式、Pfam 收集的隐马尔可夫模式收集的隐马尔可夫模式( HMM)。(2) PRINTS Fingerprint Database www.bioinf.man.ac.uk/dbrowser/PRINTS/ 这个数据库包含1 500 个蛋白质指纹图谱, 编码9 136 个单一模体。(3) BLOCKS ( www.blocks.fh
18、/ )BLOCKS 是通过一些高度保守的蛋白质区域比对出来的无空位的片段。模体数据库模体数据库蛋白质结构域数据库蛋白质结构域数据库 (1 ) 蛋白质家族序列比对以及隐马尔可夫模式数据库蛋白质家族序列比对以及隐马尔可夫模式数据库Pfam( protein families database of alignments and HMMs)Pfam 是蛋白质家族序列比对以及隐马尔可夫模式数据库,其网址是: www.sanger.ac.uk/Software/Pfam/index.shtml。 (2) 蛋白质结构域数据库蛋白质结构域数据库ProDom http:/prodes.toulo
19、use.inra.fr/prodom/doc/prodom.html (3) SMART SMART 是一个简单的结构研究工具, 可对可转移的遗传因子进行鉴定和注解, 以及分析结构域结构, 可以检测出500 多个参与信号传导、胞外和染色体相关蛋白质的结构域家族, 对这些结构域又在系统进化树分布、功能分类、三级结构和重要的功能残基方面做了注解。 http:/smart.embl-heidelberg.de/PDB( protein data bank , PDB) /pdb/PDB 包括了蛋白质、核酸、蛋白质-核酸复合体以及病毒等生物大分子结构数据, 主要是蛋
20、白质结构数据, 这些数据来源于几乎全世界所有从事生物大分子结构研究的研究机构, 并由结构生物学合作研究协会(RCSB) 维护和注释。(1) CATH 数据库数据库 www.biochem.ucl.ac.uk/bsm/cathnew/index.html(2) SCOP 蛋白质结构分类数据库蛋白质结构分类数据库( structural classification of protein database,SCOP) scop.mrclmb.cam.ac.uk/scop/index.html蛋白质序列分析蛋白质序列分析蛋白质一级序列蛋白质一级序列蛋白质基本理化性质分析蛋白质基本理化性质分析蛋白质亲
21、疏水性分析蛋白质亲疏水性分析跨膜区结构预测跨膜区结构预测卷曲螺旋预测卷曲螺旋预测翻译后修饰位点预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构蛋白质二级结构预测蛋白质二级结构预测蛋白质序列信号位点分析蛋白质序列信号位点分析蛋白质超二级结构蛋白质超二级结构蛋白质结构域分析蛋白质结构域分析蛋白质三级结构蛋白质三级结构蛋白质三维结构模拟蛋白质三维结构模拟蛋白质分类蛋白质分类蛋白质家族分析蛋白质家族分析蛋白质理化性质是蛋白质研究的基础蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质:蛋白质的基本性质:相对分子质量相对分子质量 氨基酸组成氨基酸组成等电点(等电点(PIPI) 消光系数消光系数半衰期半
22、衰期 不稳定系数不稳定系数总平均亲水性总平均亲水性 实验实验方法:方法: 相对分子质量的测定、等电点实验、沉降实验相对分子质量的测定、等电点实验、沉降实验 缺点:费时、耗资缺点:费时、耗资基于实验经验值的计算机分析方法基于实验经验值的计算机分析方法1.1.蛋白质基本理化性质分析蛋白质基本理化性质分析 基于一级序列的组分分析基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考氨基酸亲疏水性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析:开发的针对蛋白质基本理化性质的分析: Protparam 工具工具 /tool
23、s/protparam.html相对分子质量相对分子质量 氨基酸组成氨基酸组成等电点(等电点(PI) 消光系数消光系数半衰期半衰期 不稳定系数不稳定系数总平均亲水性总平均亲水性 工具工具网站网站备注备注AACompldent/tools/aacomp/利用未知蛋白质的氨基酸组利用未知蛋白质的氨基酸组成确认具有相同组成的已知成确认具有相同组成的已知蛋白蛋白Compute pI/Mw/tools/pi_tool.html计算蛋白质序列的等电点和计算蛋白质序列的等电点和分子量分子量ProtParam/to
24、ols/protparam.html对氨基酸序列多个物理和化对氨基酸序列多个物理和化学参数(分子量、等电点、学参数(分子量、等电点、吸光系数等)进行计算吸光系数等)进行计算PeptideMass/tools/peptide-mass.html计算相应肽段的计算相应肽段的pI和分子量和分子量SAPSh t t p : / / w w w . i s r e c . i s b -sib.ch/software/SAPS_form.html利用蛋白质序列统计分析方利用蛋白质序列统计分析方法给出待测蛋白的物理化学法给出待测蛋白的物理化学信息信息蛋白质理化性质分析工具蛋
25、白质理化性质分析工具AACompIdent PeptideMass Protparam 工具 /tools/protparam.html计算以下物理化学性质:计算以下物理化学性质: 相对分子质量 理论 pI 值 氨基酸组成 原子组成 消光系数 半衰期 不稳定系数 脂肪系数 总平均亲水性主要选项主要选项/参数参数序列在线提交形式: 如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number) 如果分析新序列: 直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot/TrEM
26、BL AC号号打开打开protein.txt,将蛋白质序列将蛋白质序列粘贴在搜索框中粘贴在搜索框中 输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果输出结果 功能功能域域用户自定义区用户自定义区段段点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果氨基酸数目氨基酸数目相对分子质量相对分子质量理论理论 pI 值值氨基酸组成氨基酸组成正正/负电荷残基数负电荷残基数37消光系数消光系数半衰期半衰期原子组成原子组成分子式分子式总原子数总原子数不稳定系数不稳定系数脂肪系数脂肪系数总平均亲水总平均亲水性性40 unsta
27、ble(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins2 2、蛋白质、蛋白质亲疏水性亲疏水性/ /跨膜区分析跨膜区分析3 3、蛋白质、蛋白质亲疏水性分析亲疏水性分析氨基酸侧链的疏水性用从各氨基酸减去甘氨酸疏水性之值来表示,蛋白质的疏水性在保持蛋白质三级结构的形成和稳定中起着重要作用。疏水作用是蛋白质折叠的主要驱动
28、力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步氨基酸疏水分析为蛋白质二级结构预测提供佐证可用于分析蛋白质相互作用位点-抗原位点预测(预测准确率达56%)是分析蛋白质跨膜区重要一步海参溶菌酶亲水性海参溶菌酶亲水性/疏水性分析疏水性分析Score 0,表示疏水性; Score 0,表示亲水性 螺旋跨膜区主要是由螺旋跨膜区主要是由20-30个疏水性氨基酸(个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成等)组成 亲水残基往往出现在疏水残基之间,对功能有重要的亲水残基往往出现在疏水残基之间,对功能有重要的作用作用 基于亲基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布疏水量和
29、蛋白质膜区每个氨基酸的统计学分布偏好性量偏好性量 TMpred/software/TMPRED_form.html SOSUI- http:/bp.nuap.nagoya-u.ac.jp/sosui/ 4 4、蛋白质、蛋白质跨膜区分析跨膜区分析常用蛋白质跨膜区域分析工具常用蛋白质跨膜区域分析工具工具工具网站网站备注备注DAShttp:/www.sbc.su.se/miklos/DAS/用用Dense Alignment Surface(DAS)算法来预测无同源)算法来预测无同源家族的蛋白跨膜区家族的蛋白跨膜区HMMTOPhttp:/www.enzi
30、m.hu/hmmtop/由由Enzymology研究所开发研究所开发的蛋白质跨膜区和拓扑结构的蛋白质跨膜区和拓扑结构预测程序预测程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由由Nagoya大学开发一个具大学开发一个具有图形显示跨膜区的程序有图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜基于多序列比对来预测跨膜区的程序区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于基于HMM方法的蛋白质跨方法的蛋白质跨膜区预测工具膜区预测工具T
31、Mpred/software/TMPRED_form.html基于对基于对TMbase数据库的统数据库的统计分析来预测蛋白质跨膜区计分析来预测蛋白质跨膜区和跨膜方向和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一个位于法国的蛋白质拓是一个位于法国的蛋白质拓扑结构预测程序扑结构预测程序TMHMM ProtScale工具工具 /tools/protscale.html 氨基酸标度氨基酸标度 表示氨基酸在某种实验状态下相对其他氨
32、基酸在某些性表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等质的差异,如疏水性、亲水性等 收集收集56多个文献中提供的氨基酸标度多个文献中提供的氨基酸标度 默认值以默认值以Hphob. Kyte & Doolittle做疏水性分析做疏水性分析 特异性氨基酸标度,如特异性氨基酸标度,如Hopp & Woods(1981)针对抗原片)针对抗原片段定位;段定位;Accessible residues(1979)针对氨基酸溶剂可及)针对氨基酸溶剂可及性定位;性定位;Chou & Fasman (1978)针对氨基酸二级结构疏)针对氨基酸二级结构疏水性
33、分析水性分析5 5、蛋白质、蛋白质亲疏水性分析亲疏水性分析主要选项主要选项/ /参数参数序列在线提交形式:序列在线提交形式:如果分析如果分析SWISS-PORT和和TrEMBL数据库中序列数据库中序列 直接填写直接填写Swiss-Prot/TrEMBL AC号号(accession number) 如果分析新序列:如果分析新序列: 直接在搜索框中粘贴氨基酸序列直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot/TrEMBL AC号号打开打开protein.txt,将一条蛋白质序列将一条蛋白质序列粘贴在搜索框中粘贴在搜索框中计算窗口(计算窗口(7-11)相对权重值相对权重值 权重值变化趋势
34、权重值变化趋势 氨基酸标度氨基酸标度是否归一化是否归一化输出结果输出结果 输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段功能功能域域用户自定义区用户自定义区段段所用氨基所用氨基酸标度信酸标度信息息分析所用分析所用参数信息参数信息输出结果输出结果图形结果图形结果 文本结果文本结果 序列序列 参数参数 每个位置每个位置 的得分的得分(3 3) 跨膜区分析跨膜区分析蛋白质含有跨膜区提示它可能作为膜受体起作用,也可蛋白质含有跨膜区提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白或离子通道蛋白。能是定位在膜上的锚定蛋白或离子通道蛋白。例例,使用,使用TMHMM Server v
35、.2.0TMHMM Server v.2.0在线分析在线分析http:/www.cbs.dtu.dk/services/TMHMM/http:/www.cbs.dtu.dk/services/TMHMM/铝激活苹果酸的转运蛋白铝激活苹果酸的转运蛋白(TaALMT1)跨膜结构分析跨膜结构分析6 6、跨、跨膜区分析膜区分析 TMpred工具工具:/software/TMPRED_form.html 预测跨膜区和跨膜方向 依靠跨膜蛋白数据库Tmbase主要参数主要参数/ /选项选项 序列在线提交形式:序列在线提交形式: 直接贴入蛋白序列直接贴入蛋白序列
36、填写填写SwissProt/TrEMBL/EMBL/EST的的ID或或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列输出结果输出结果 包含四个部分包含四个部分 可能的跨膜螺旋区可能的跨膜螺旋区 相关性列表相关性列表可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表位置位置分值分值 片段中点位置片段中点位置 跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型每一位置计算分值每一位置计算分值最优拓最优拓扑结构扑结构 SOSUI工具工具: - ht
37、tp:/bp.nuap.nagoya-u.ac.jp/sosui/ 以图形方式返回结果,需要Java Applet程序输入氨基酸单字母输入氨基酸单字母运行运行平均疏水值平均疏水值预测的跨模螺旋区预测的跨模螺旋区域域两种跨膜两种跨膜Helix预测区域的螺旋示意预测区域的螺旋示意图图平均疏水值平均疏水值预测的跨模螺旋区预测的跨模螺旋区域域两种跨膜两种跨膜Helix59亲疏水轮亲疏水轮廓廓跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 -Landolt Marticorena et al., 1993 胞外末端Asp、Ser和Pro 胞外-内分界区域Trp 跨膜区Leu、Ile、Val、Met、Phe
38、、Trp、Cys、Ala、Pro和Gly 胞内-外分界区域Tyr、Trp和Phe 胞内末端Lys和Arg 两股或两股以上螺旋相互缠绕而形成超螺旋结构 存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子运动、膜通道、分子识别等重要的生物功能,637 7、蛋白质、蛋白质卷曲螺旋域分析卷曲螺旋域分析 典型的有亮氨酸拉链,存在7残基 重复结构(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置 残 基为亲水性 蛋白质中由蛋白质中由2-72-7条条螺旋链相互缠绕形成类似麻花状结构螺旋链相互缠绕形成类似麻花状结
39、构的总称;的总称; 主要存在形式是主要存在形式是2-52-5条相互缠绕形成的平行或反平行同寡条相互缠绕形成的平行或反平行同寡聚体或异寡聚体;聚体或异寡聚体; 是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、动是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等;力蛋白、膜蛋白、酶等; 七肽重复区。七肽重复区。蛋白质卷曲螺旋域分析蛋白质卷曲螺旋域分析工具工具网站网站备注备注Coils /software/COILS_form.html主流的预测螺旋卷曲工具主流的预测螺旋卷曲工具Paircoil2http:/groups.csail.mi
40、/cb/paircoil2/paircoil2.html由由MIT大学开发的基于残大学开发的基于残基配对概率算法的预测工基配对概率算法的预测工具具PEPCOILhttp:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html由由EMBOSS维护的预测卷维护的预测卷曲螺旋程序,同曲螺旋程序,同Coils类似类似S O C K E T serverhttp:/www.lifesci.sussex.ac.uk/research/woolfson/html/coiledcoils/socket/server.html一个分析蛋白质结构中卷一个分析蛋白质结构中卷曲螺旋的工具,其输入数曲螺旋的工具,其输入数据格式为蛋白质结构数据据格式为蛋白质结构数据TRESPASSERhttp:/comp.chem.nottingham.ac.uk/cgi-bin/trespasser/trespasser.cgi由由Nottingham大学开发的大学开发的亮氨酸拉链结构识别工具亮氨酸拉链结构识别工具2ZIPhttp:/2zip.molgen.mpg.de/index.html预测蛋白质序列中潜在的预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺亮氨酸拉链结构和卷曲螺旋旋 蛋白质卷曲螺旋预测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 固定总价合同计量规则规范
- 沈阳理工大学《材料成型与工艺应用设计》2022-2023学年第一学期期末试卷
- 国有企业代理采购合同管理制度
- 国有文物社会力量合作合同范本
- 合同法定解除的五种情形举例说明
- 大班游戏《一朵美丽的花》微课件
- 2024年广西客运资格证考试内客
- 2024建筑工程供货合同
- 2024上海市技术咨询合同范本
- 沈阳城市学院《习近平法治思想概论》2021-2022学年第一学期期末试卷
- 《梯形的面积》(课堂PPT)
- 天然气脱硫(课堂运用)
- 幼儿园教师师德师风考核表(共2页)
- 《施工组织设计专项施工方案资料》古建筑油漆彩画施工方案
- 城镇职工医疗保险运行中的问题分析及措施
- 阿拉丁神灯介绍ppt[共27页]
- 人教版英语选择性必修一Unit 1 People of Achievement(Reading and Thinking)教案(2课时)
- 学校食堂五常法管理制度
- 毕业设计500kv变电站设计
- 讲故事社团活动教案
- 五四制新青岛版二年级科学上册14《身边的动植物资源》课件
评论
0/150
提交评论