蛋白质序列分析_第1页
蛋白质序列分析_第2页
蛋白质序列分析_第3页
蛋白质序列分析_第4页
蛋白质序列分析_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1蛋白质序列分析蛋白质序列分析/http:/www.ebi.ac.uk/swissprot//prosite/http:/scop.mrc-lmb.cam.ac.uk/scop/index.html/http:/ekhidna.biocenter.helsinki.fi/daliProfile 为对保守区域每一位置氨基酸保守情况为对保守区域每一位置氨基酸保守情况进行打分构建的权重矩阵。进行打分构建的权重矩阵。第一行为该区域出现的氨基酸,每一行为蛋白序列第一行为

2、该区域出现的氨基酸,每一行为蛋白序列中一个位置,在该位置对各种氨基酸的保守情况都给出中一个位置,在该位置对各种氨基酸的保守情况都给出一个分值,分值越高表示出现概率越大一个分值,分值越高表示出现概率越大1. 基本流程基本流程实验数据实验数据蛋白质序列蛋白质序列理化特性分析理化特性分析跨膜区、等电点、亲水性、疏水性、跨膜区、等电点、亲水性、疏水性、酶切特性、电荷等酶切特性、电荷等数据库检索数据库检索多序列比对、结构域搜索多序列比对、结构域搜索二级结构预测二级结构预测如有如有PDB中同源体中同源体蛋白质折叠识别蛋白质折叠识别折叠家族分析折叠家族分析序列与结构比对序列与结构比对比较建模比较建模三级结构

3、预测三级结构预测三维蛋白模型三维蛋白模型蛋白质序列分析及结构预测的基本流程蛋白质序列分析及结构预测的基本流程c1tehaC1hldaD1teha1(GRoES)D1teha2(GRoES)第四节第四节 蛋白质功能预测蛋白质功能预测1. 根据序列预测功能的一般过程根据序列预测功能的一般过程尽管蛋白质的许多特性可直接从序列上分析获得,如尽管蛋白质的许多特性可直接从序列上分析获得,如疏水性,跨膜螺旋疏水性,跨膜螺旋(transmenbrane helix)(transmenbrane helix)或前导序列或前导序列(leader sequence)(leader sequence)等。总的来说,根

4、据序列预测蛋白等。总的来说,根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是否质功能的唯一方法是通过数据库搜寻,比较该蛋白是否与已知功能的蛋白质相似。与已知功能的蛋白质相似。比较未知蛋白序列与已知蛋白质序列的相似性;比较未知蛋白序列与已知蛋白质序列的相似性;查找未知蛋白中是否包含与特定蛋白质家族或功能查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。域有关的亚序列或保守区段。根据序列预测蛋白质功能的技术路线根据序列预测蛋白质功能的技术路线2. 通过比对数据库相似序列确定功能通过比对数据库相似序列确定功能 具有相似序列的蛋白质具有相似的功能。最可靠的确定具有相似

5、序列的蛋白质具有相似的功能。最可靠的确定蛋白质功能的方法是进行数据库的相似性搜索。一个显著蛋白质功能的方法是进行数据库的相似性搜索。一个显著的匹配应至少超过的匹配应至少超过8080个氨基酸的区段有个氨基酸的区段有25%25%的相同序列。的相同序列。 一般策略是先进行一般策略是先进行BLASTBLAST检索,如不能提供相关结果,检索,如不能提供相关结果,再运行再运行FASTAFASTA;如;如FASTAFASTA也不能得到有关蛋白质功能的线索也不能得到有关蛋白质功能的线索,可选用完全根据,可选用完全根据Smith-WatermanSmith-Waterman算法设计的搜索程序,算法设计的搜索程序

6、,例如例如BLITZ(BLITZ(www.ebi.ac.uk/searches/blitz.htmlwww.ebi.ac.uk/searches/blitz.html) )。BLITZBLITZ不做近似估计不做近似估计(BLAST(BLAST和和FASTAFASTA根据根据Smith-WatermanSmith-Waterman算法做近算法做近似估计似估计) ),所以很花时,但非常灵敏。通常,所以很花时,但非常灵敏。通常BLITZBLITZ程序能够发现超过程序能够发现超过几百个残基但序列相同比率低于几百个残基但序列相同比率低于202025%25%的匹配,这些匹配可能达到的匹配,这些匹配可能达到

7、显著,但会被那些应用近似估计的程序错过。显著,但会被那些应用近似估计的程序错过。n选用计分矩阵选用计分矩阵(scoring matrix)(scoring matrix)十分关键十分关键选用的矩阵必须与匹配水平相一致,例如,选用的矩阵必须与匹配水平相一致,例如,PAM250PAM250应用应用于远距离匹配于远距离匹配(25%(25%相同比率相同比率) ),PAM40PAM40应用于不很相近的应用于不很相近的蛋白质序列,而蛋白质序列,而BLOSUM62BLOSUM62是一个通用矩阵;是一个通用矩阵;使用不同矩阵,可以发现始终出现的匹配序列,这是一使用不同矩阵,可以发现始终出现的匹配序列,这是一条

8、减少误差的有效办法。条减少误差的有效办法。n选用不同的数据库选用不同的数据库通常可以使用的数据库是无冗余蛋白序列数据库通常可以使用的数据库是无冗余蛋白序列数据库SWISS-SWISS-PROTPROT和和PDBPDB。其它一些数据库也可以试试,如可用其它一些数据库也可以试试,如可用BLASTPBLASTP搜索复合蛋搜索复合蛋白质序列库白质序列库OWL OWL ( (www.biochem.ucl.ac.uk/bsm/dbbrowser/OWL/owl_blast.html) )http:/scop.mrc-lmb.cam.ac.uk/scop/index.html第四节第四节 蛋白质功能预测蛋白质功能预测1. 根据序列预测功能的一般过程根据序列预测功能的一般过程尽管蛋白质的许多特性可直接从序列上分析获得,如尽管蛋白质的许多特性可直接从序列上分析获得,如疏水性,跨膜螺旋疏水性,跨膜螺旋(transmenbrane helix)(transmenbrane helix)或前导序列或前导序列(leader sequence)(leader sequence)等。总的来说,根据序列预测蛋白等。总的来说,根据序列预测蛋白质功能的唯一方法是通过数据库搜寻,比较该蛋白是否质功能的唯一方法是通过数据库搜寻,比较该蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论