蛋白质二级结构预测软件_第1页
蛋白质二级结构预测软件_第2页
蛋白质二级结构预测软件_第3页
蛋白质二级结构预测软件_第4页
蛋白质二级结构预测软件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

蛋白质二级结构预测软件蛋白质二级结构预测软件第1页预测蛋白质二级结构算法大多以已知三维结构和二级结构蛋白质为依据,用过人工神经网络、遗传算法等技术构建预测方法。蛋白质二级结构预测软件第2页当前较为常见几个方法有:PHD、PSIPRED、Jpred、PREDATOR、PSA,其中最常见是PHD。PHD结合了许多神经网络结果,每个结果都是依据局部序列上下文关系和整体蛋白质性质(蛋白质长度、氨基酸频率等)来预测残基二级结构。那么,最终预测是这些神经网络每个输出算术平均值。这种结合方案被称为陪审团决定法(jurydecision)或者称为全部胜利者(winner-take-all)法。PHD被认为是二级结构预测标准。总来说,二级结构预测仍是未能完全处理问题,普通对于α螺旋预测精度很好,对β折叠差些,而对除α螺旋和β折叠等之外无规则二级结构则效果很差。蛋白质二级结构预测软件第3页PHD使用请见人工神经网络方法中“基于人工神经网络模型预测软件PHDsec使用介绍”.nnPredict:/~nomi/nnpredict.htmlnnpredict算法使用了一个双层、前馈神经网络去给每个氨基酸分配预测类型。在预测时,服务器使用FASTA格式文件,其中有单字符或三字符序列以及蛋白质折叠类(α、β或α/β)。残基被分为几类,如α螺旋(H)、β链(E)或其它(-)。若对给定残基未给出预测,则会标上问号(?),这说明无法作出可信分配。若没相关于折叠类信息,预测也能在不定折叠类情况下进行,而且这是缺省工作方式。据报道,对于最正确实例预测,nnpredict准确率超出了65%。PredictProtein:/predictprotein/我国镜像:/predictprotein/蛋白质二级结构预测软件第4页PredictProtein在预测中应用了略为不一样方法。首先,蛋白质序列被作为查询序列在SWISS-PROT库中搜索相同序列。当相同序列被找到后,一个名为MaxHom算法被用来进行一次基于特征简图多序列比对。MaxHom用迭代方法来结构比对:当第一次搜索SWISS-PROT后,全部找到序列与查询序列进行比对,并结构出一个比对后特征简图。然后,这个简图又被用来在SWISS-PROT中搜索新相同序列。由MaxHom产生多序列比对随即被置入一个神经网络,用PHD方法进行预测。SOPMA:http://pbil.ibcp.fr/蛋白质二级结构预测软件第5页位于法国里昂CNRS(CentreNationaldelaRechercheScientifique)使用独特方法进行蛋白质二级结构预测。它不是用一个,而是5种相互独立方法进行预测,并将结果聚集整理成一个“一致预测结果”。这5种方法包含:Garnier-Gibrat-Robson(GOR)方法、Levin同源预测方法、双重预测方法、PHD方法和CNRS自己SOPMA方法。简单说,SOPMA这种自优化预测方法建立了已知二级结构序列次级数据库,库中每个蛋白质都经过基于相同性二级结构预测。然后用次级库中得到信息去对查询序列进行二级结构预测。蛋白质二级结构预测软件第6页其它特殊局部结构预测软件其它特殊局部结构包含膜蛋白跨膜螺旋、信号肽、卷曲螺旋(CoiledCoils)等,含有显著序列特征和结构特征,也能够用计算方法加以预测。蛋白质二级结构预测软件第7页卷曲螺旋COILS:/software/COILS_form.html卷曲螺旋预测方法,将序列与已知平行双链卷曲螺旋数据库进行比较,得到相同性得分,并据此算出序列形成卷曲螺旋概率。COILS算法将查询序列在一个由已知包含卷曲螺旋蛋白结构数据库中进行搜索。程序也将查询序列与包含球状蛋白序列PDB次级库进行比较,并依据两个库搜索得分不一样决定输入序列形成卷曲螺旋概率。COILS能够下载到VAX/VMS系统上使用,也可经过简单Web界面使用。蛋白质二级结构预测软件第8页程序要求序列数据为GCG或FASTA格式,一次能够提交一条或多条序列。除了序列,用户还能在两种打分矩阵中选择一个:MTK是依据肌球蛋白、原肌球蛋白和角蛋白序列得到打分矩阵;或MTIDK,是依据肌球蛋白、原肌球蛋白、中间纤维类蛋白Ⅰ-Ⅴ、桥粒蛋白和角蛋白得到打分矩阵。程序作者引述了两种矩阵适用特点:MTK更适合检测双链结构,而MTIDK适合其它情形。用户还能开启一个选项给予每个卷曲a和d位置上残基(通常为亲水性)相同权重。假如COILS在无权重和有权重情况下得到结果相差很大,则可能表明存在正错误。程序作者警告说COILS是用来检测与溶液接触左手性卷曲螺旋,对于包埋或右手性卷曲螺旋则可能检测不到。若一个序列被提交到服务器,程序会整理出一张预测结果图,显示沿着序列各个个别形成卷曲螺旋倾向性。蛋白质二级结构预测软件第9页MacStripe:一个基于Macintoshi系统应用程序,使用了LupasCOILS预测方法,能输出较简单预测结果。MacStripe要求输入文件为FASTA、PIR或其它普遍文件格式,并象COILS一样产生一个图形文件,包含形成卷曲螺旋概率,以及用柱状图显示七连体重复模式连续性。蛋白质二级结构预测软件第10页信号肽SignalP:http://www.cbs.dtu.dk/services/SignalP/丹麦技术大学生物序列分析中心开发了SignalP这个强大信号肽及其剪切位点检测工具。该算法基于神经网络方法,用已知信号序列革兰氏阴性原核生物、革兰氏阳性原核生物及真核生物序列分别作为训练集。SignalP预测是分泌型信号肽,而不是那些参加细胞内信号传递蛋白。蛋白质二级结构预测软件第11页跨膜区域TMpred:/software/TMPRED_form.html预测蛋白质跨膜区段和在膜上取向,它依据来自SWISS-PROT跨膜蛋白数据库Tmbase,利用跨膜结构区段数量、位置以及侧翼信息,经过加权打分进行预测。TmpredWeb界面十分简明。用户将单字符序列输入查询序列文本框,并能够指定预测时采取跨膜螺旋疏水区最小长度和最大长度。输出结果包含四个个别:可能跨膜螺旋区、相关性列表、提议跨膜拓扑模型以及代表相同结果图。蛋白质二级结构预测软件第12页蛋白质预测分析网址

物理性质预测:

ComputePI/MWhttp://expaxy.hcuge.ch/ch2d/pi-tool.html

Peptidemasshttp://expaxy.hcuge.ch/sprot/peptide-mass.htmlTGREASE/pub/fasta/

SAPShttp://ulrec3.unil.ch/software/SAPS_form.html

基于组成蛋白质识别预测

AACompIdenthttp://expaxy.hcuge.ch/ch2d/aacompi.htmlAACompSimhttp://expaxy.hcuge.ch/ch2d/aacsim.htmlPROPSEARCHhttp://www.embl-heidelberg.de/prs.html

蛋白质二级结构预测软件第13页基于组成蛋白质识别预测

AACompIdenthttp://expaxy.hcuge.ch/ch2d/aacompi.htmlAACompSimhttp://expaxy.hcuge.ch/ch2d/aacsim.htmlPROPSEARCHhttp://www.embl-heidelberg.de/prs.html

蛋白质二级结构预测软件第14页二级结构和折叠类预测

nnpredict/~nomi/nnpredict

Predictproteinhttp://www.embl-heidelberg.de/predictprotein/SOPMAhttp://www.ibcp.fr/predict.html

SSPREDhttp://www.embl-heidelberg.de/sspred/ssprd_info.html

蛋白质二级结构预测软件第15页特殊结构或结构预测

COILShttp://ulrec3.unil.ch/software/COILS_form.html

MacStripe/matsudaira/macstripe.html

蛋白质二级结构预测软件第16页与核酸序列一样,蛋白质序列检索往往是进行相关分析第一步,因为数据库和网络技校术发展,蛋白序列检索是十分方便,将蛋白质序列数据库下载到当地检索和经过国际互联网进行检索均是可行。

由NCBI检索蛋白质序列

可联网到:“:80/entrz/query.fcgi?db=protein”进行检索。

利用SRS系统从EMBL检索蛋白质序列

联网到:http://srs.ebi.ac.uk/”,可利用EMBLSRS系统进行蛋白质序列检索。蛋白质二级结构预测软件第17页经过EMAIL进行序列检索

当网络不是很通畅时或并不急于得到较多数量蛋白质序列时,可采取EMAIL方式进行序列检索。

蛋白质基础性质分析

蛋白质序列基础性质分析是蛋白质序列分析基础方面,普通包含蛋白质氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功效域分析等到。蛋白质很多功效特征可直接由分析其序列而取得。比如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目标蛋白质向特定细胞器进行转移靶标(其中最经典例子是在羧基端含有KDEL序列特征蛋白质将被引向内质网。WEB中有很多这类资源用于帮助预测蛋白质功效。

蛋白质二级结构预测软件第18页疏水性分析

位于ExPASyProtScale程序(/cgi-bin/protscale.pl)可被用来计算蛋白质疏水性图谱。该网站充许用户计算蛋白质50余种不一样属性,并为每一个氨基酸输出对应分值。输入数据可为蛋白质序列或SWISSPROT数据库序列接收号。需要调整只是计算窗口大小(n)该参数用于预计每种氨基酸残基平均显示尺度。进行蛋白质亲/疏水性分析时,也可用一些windows下软件如,bioedit,dnamana等。蛋白质二级结构预测软件第19页跨膜区分析

有各种预测跨膜螺旋方法,最简单是直接,观察以20个氨基酸为单位疏水性氨基酸残基分布区域,但同时还有各种愈加复杂、准确算法能够预测跨膜螺旋详细位置和它们膜向性。这些技术主要是基于对已知跨膜螺旋研究而得到。自然存在跨膜螺旋Tmbase数据库,可经过匿名FTP取得(http://www.isrec.isb-sib.ch/ftp-server/tmbase),参见表一

资源名称网址说明

TMPRED/software/TMPRED_form.html基于对tmpred数据库统计分析PHDhtmhttp://www.embl-heidelberg.de/se...tprotein.htmlMEMSATftp://ftp.biochem.ucl.ac.uk

蛋白质二级结构预测软件第20页微机版本

蛋白质序列含有跨膜区提醒它可能作为膜受体起作用,也可能是定位于膜锚定蛋白或者离子通道蛋白等,从而,含有跨膜区蛋白质往往和细胞功效状态亲密相关。http://genome.cbs.dtu.dk/sevices/TMHMM-2.0“或“/software/TMPRED_form.html”

蛋白质二级结构预测软件第21页前导肽与蛋白质定位

在生物内,蛋白质合成场所与功效场所常被一层或多层细胞膜所隔开,这么就包括到蛋白质转运。合成蛋白质只有准确地定向运行才能确保生命活动正常进行。普通来说,蛋白质定位信息存在于该蛋白质本身结构中,并经过与膜上特殊受体相互作用而得以表示。在起始密码子之后,有一段编码疏水性氨基酸序列RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。含有信号肽蛋白质普通都是分泌到细胞外,可能作为主要细胞因子起作用,从而含有潜在应用价值。

http://genome.cbs.dtu.dk/sevices/signalP-2.0

蛋白质二级结构预测软件第22页卷曲螺旋分析

另一个能够直接从序列中预测功效motif是α-螺旋卷曲排列方式。在这种结构中,两种螺旋经过其疏水性界面相互缠在一起形成一个十分稳定结构。

蛋白质卷曲相关资源

资源网址

coiled-coilhttp://www.york.ac.uk/depts/biol/units/coils/coilcoil.htmlCOILS

/software/COILS_form.htmlEpitopeInfo

/Links.htm

蛋白质二级结构预测软件第23页蛋白质功效预测

基于序列同源性分析蛋白质功效预测

到少有80个氨基酸长度范围内含有25%以上序列一致性才提醒可能显著性意义。最快工具如BlastP能很轻易地发觉显著性片段,而无需使用十分耗时BLITZ软件。

基于NCBI/BLAST软件蛋白序列同源性分析

类似于核酸序列同源性分析,用户直接将待分析蛋白质序列输入NCBI/BLAST(/blast),选择程序BLASTP就可网上分析。基于WU/BLAST2软件进行分析

华盛顿大学BLAST软件(dove.embl-heidelberg.dl/blast2)也可进行蛋白质序列同源性分析。

蛋白质二级结构预测软件第24页基于motif、结构位点、结构功效域数据库蛋白质功效预测

蛋白质磷酸化与糖基化对蛋白质功效影响很大,所以对其分析也是生物信息学一个个别。

同时,分子进化方面研究表明,蛋白质不一样区域含有不一样进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质功效。在序列模式判定方面有两类技术,第一类是依赖于和一致性序列(consensussequence)或基序各残基匹配模式,该技术可用于十分轻易并快速搜索motif数据库。

Motif数据库-PROSITE

最好是PROSITE/prosite)

蛋白质二级结构预测软件第25页InterProScan综合分析网站

InterProScan是EBI开发一个集成了蛋白质结构域和功效位点数据库,其中把SWISS-PROT,TrEMBL.PROTSITE.PRINTS.PFAM.ProDom等数据库提供蛋白质序列中各种局域模式,如结构域,motif等信息统一起来,提供了一个较为全央分析工具。

www.ebi.ac.uk/interpro/scan.html

蛋白质二级结构预测软件第26页蛋白质结构功效域分析

简单模块构架搜索工具(simplemodulararchitectureresearchtool,SMART)一个很好蛋白质结构功效域数据,可用于蛋白质结构功效域分析,所得到结构域同时提供相关资源链接http://smart.embl-heidelberg.de/

蛋白质二级结构预测软件第27页蛋白质结构预测

PDB数据库

蛋白质基础立体结构数据库(PDB,)其中有大量工具用于查看PDB数据库中结构,如rasmol,可用于显于出蛋白质空间结构,下载地址:/microbio/rasmol)

蛋白质二级结构预测软件第28页PDBFinder数据库

是在PDB、DSSP、HSSP基础上建立二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息伴随PDB库每次公布新版,PDBFinder在EBI自动生成,网址为“www.sander.embl-heideberg.de/pdbfinder/

ftp://swift.embl-heidelberg.de/pdbfinder.

蛋白质二级结构预测软件第29页NRL-3D数据库

是全部已知结构蛋白质数据库,可用于查询蛋白序列时行相同性分析以确定其结构/Dan/protein/nrl3d.html

ISSD数据库

蛋白质序列数据库,其每个条目包含一个基因编码序列,同对应氨基酸序列对比,并给出对应多肽链结构数据。tein.bio.msu.su/issd

蛋白质二级结构预测软件第30页HSSP数据库

是依据同源性导出蛋白质二级结构数据库,每一条PDB项目都有一个对应HSSP文件,www.sander.embl-heidelberg.de/hssp

蛋白质结构分类数据库

对已知蛋白质三维结构进行手工分类得到数据库,位于剑桥站点也提供BLAST检索服务http://scop.mrc-lmb.cam.ac.uk/scop/

MMDB蛋白质分子模型数据库

是ENTREZ检索工具所使用三维结构数据库,以ASN格式反蚋PDB中结构和序列数据。NCBI同时提供一个配套三维结构显示程序Cn3D,/Structure/

Dali/FSSP数据库

基于PDB数据库中现有蛋白质三维结构,用自动结构对比程序Dali比较而形成折叠单元和家庭分类库。www.embl-ebi.ac.uk/dali

蛋白质二级结构预测软件第31页蛋白质二级结构预测

基于序列进行蛋白质二级结构方面已经有了大量文件描述,本质上,这些研究可被分为两大类:基于单一序列分析和基于多重序列对齐分析。

文件报道PHD程序是当前此方面最好程序,提供了从二级结构到折叠方面分析各种资源。其网址为www.embl-heidel-berg.de/predictprotein/predictprotein.html,也可经过email:predictprotein@embl-heidelberg.de进行数据分析。蛋白质二级结构预测软件第32页蛋白质三级结构预测

蛋白质同源家庭分析对于确立物种之间亲缘关系和预测新蛋白质序列功效有主要意义,同源蛋白质(homolog)深入划分为直系同源(ortholog)和旁系同源(paralog),前者指不一样物种中含有相同功效和共同起源基因,后者则指在同一物种内含有不一样功效,但也有共同起源基因,比如同是起源于珠蛋白α珠蛋白、β珠蛋白和肌红蛋白。

蛋白质分类数据库(ProtoMap)

是对SWISS-PROT数据库中全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到数据库。teinmap.cs.huji.ac.il

蛋白质二级结构预测软件第33页蛋白质序列多重对齐分析及进化分析

假如发觉一个未知蛋白质序列和较多不一样和种属或同一个属蛋白质序列含有较高同源性(大于30%)那么提醒待分析蛋白质序列可能是对应家族组员,从而可从分子时化角度对蛋白质序列进行综合分析。

常见在线蛋白工具

BCMSearchLauncher

/seq-search/

蛋白质二级结构预测软件第34页蛋白序列二级结构预测综合站点,从此出发,输入蛋白序列,能够依据需要,使用各种在线预测工具,包含Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMpred、SOUSI、Paircoil、ProteinHydrophilicity/HydrophobicitySearch、SOPM,使用十分方便。蛋白质二级结构预测软件第35页DAS

蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。

TopPred2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论