蛋白质三级结构预测(swiss-model同源建模)_第1页
蛋白质三级结构预测(swiss-model同源建模)_第2页
蛋白质三级结构预测(swiss-model同源建模)_第3页
蛋白质三级结构预测(swiss-model同源建模)_第4页
蛋白质三级结构预测(swiss-model同源建模)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、利用同源建模预测蛋白质的三级结构首先声明一下,以下纯属个人观点,方法步骤仅供参考,不可作为规范标准, 结果出来之后请自行分析结果。我用的是SWISS-MODE同源建模的方法进行的蛋白质高级结构预测,其实 这个方法是有限制条件的,不过作为一个选修课作业,我们不用深入探究,所以 有时不够严谨,大家知道就行!首先,同源建模的核心思想或者说是 原理是:对于一个未知结构的蛋白质, 找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋 白质建立结构模型那么,我们首先要做的就是找到和我们 Sbjct序列整理过后的氨基酸序列(就 是上次在二级结构预测中我所提到的,把所有的Sbjct整理成一条连

2、续的、不含空格和“一”的氨基酸序列,例如:【字母大小写没有影响】 vlqdsigyirilsmmdpvvdefdrayqqvkdfpdlmvdvre nggg nsgn gkkiceylihkpqphcvspdweiiprkd 同源的、相似度最高的、已知三级结构的蛋白质作为模版。打开 SWISS-MODE网站:/ ,选择“ Template Identification!,提交蛋白质序列进行 模板识别,如图所示,注意:邮箱必填, 名称随便填写,序列粘贴过去就行,下面会有很多选项,建议不知道的不要乱这个东东跟BLAST差不多,你等它自动刷新吧

3、,它会返回结果的,在结果页 面,你会看到跟BLAST差不多的结果,选择相似度最高的那个蛋白作为下一步的 三维模版(一般是第一个蛋白就是),如图:大家看红线标出的部分(是我标的), 那个就是我们要找的模版,大家也可以在结果页面的下面仔细看看, 找到最匹配 的蛋白。JIDZENniUN|“卄-II" Vw> 1»4r rf I& SWISS-MODEL WorkspaceModelling' TdfilaRepos fi ary Docuimetilaciofl叫涉Vork百 pac昱Setrnrs loqptnit 【PR二爼13 :: Pepticis

4、 討匕5】阳:”上讯丁袖音恂unLhtw:tiJWorkinie FW012 01IntflTpTflSflWil«sthHpprd EUas:t11WCHllcArch IciLdte LibrAci 弩亡柑亍th*uy./tti砒刚i i i ihMrpiuc |*/ Jlitwrpre scam Ms Cinidhedi. Here are tte WMlcsZPR335151- FetriilELae SALi Zxma.lLPF巧斫2 2 i - l«I1:lia.K_541这里还有一点要作说明,就是上图标出的代码是PDB编号,前四个表示PDB- Code,最后一

5、位表示Chain-ID,具体什么意思,大家有兴趣就去了解一些吧。接下来,去NCBI串串门吧,在NCBI中搜索上面查到的蛋白的 PDB号,一 般输入前四位就行啦,注意:搜索蛋白库(Protein)。找到以后,以FASTA格式 显示。接下来,我们再回到SWISS-MODE,接下来就是重点和难点啦,在线提交序列进行同源建模分析,这个在线提交不是大家想象的那么容易,这个耗费了我大部分的时间,说到这里我就想画个圈圈诅咒它,大家 注意啦SWISS-MODEL是 一个自动化的蛋白质比较建模服务器,该服务器提供用户 三种模式可选择:Automatic mode(简捷模式):用于建模的氨基酸序列或是 Swiss

6、-Prot/TrEMBL (/sprot )编目号(accession)可以直接通过 web界面提交。 服务器会完全自动地为目标序列建立模型。用户可以选择指定模板结构,模板可以来自由PDB数据库( )抽取得到的内建模板库,也可以上传PDB格式的坐标文件。Alignment mode (联配模式):这个模式需要多序列联配的结果,序列中至 少包括目标序列和模板(最多可输入 5条序列)。服务器会基于比对结果建模。 用户需要指明哪一条序列作为目标序列,哪一条又作为模板。Project mode(项目模式):这种模式允许用户提交经

7、过手工优化的请求给服 务器。DeepView被用来建立一个项目文件,它包含了模板结构,以及目标序列 与模板的联配结果。这个结果也要上传到服务器。这种方式提供对建模过程中细节的控制,例如选择不同的模板,手工编辑目标序列和模板的联配结果, 以便正 确地定下插入和删除的位置。项目模式还能够用于重复改进 Automatic mode的 结果。我 选择的是Alignment mode (联配模式),其他两种模式大家也可以试试,谁愿意试谁试,我是不尝试啦 0(丿口)0Swiss institute of BknfformalicsBIOZENTRUMU« it 3-KelI he CflHlsr

8、 h»r 關e Itcd «r . !o 'jdffn(傍 SWISS-MODEL.Aignmenl M 曲M-5i3e-lTookTEmp hif idmtin rauoriSWucture Assess 仃1 &xi1TiHip n* Li&rarSVYISS-UOKL IS amir, automzled prcleln-_ J'_ IL -.1.<. u _ L-d _ Ld L.-WE rhe E)«FASp wtft事irnni rteepview|3wi5s R&wiewe" me purpos

9、e c* IhkE &tr<BT is -D make ProtBin h'bdel inc acoemNeto in罚dm讥:训制TeamTcir9ie?i snrrtedr Ronin KHwLorian 站 Berdan-Ks-istant - Arr 口汜mi*a LeaderWDELMethod DyelopmeiM 釘diuser 5-uioportSWEMflDDEL 沖oris 阳amars new? Find eq陕 口叶;&n SWISS MODEL Btog timr news 处 iwntt< Foil aw us on Fceboo

10、ikReHerescM;WhenpuEllsri orrepM电 e uHs usin 3州 MOO EL pH " Q clo Ihs rtI叭ont &u Nicaton. .rr Did K., Bnrdgh L, Keptand Sowade T. £2006). The S&MOOEL Workpan:& eie34d wvirn n nwrw lor prswim丽IwmcJlciWi- mfl-wiingBIC"iHfWniatiC£a 22 1h201. KJrF Arnold K Kunzli u, titira

11、ii L,进去后,把邮箱填上,项目名称随便填,很多格式,但是还就对FASTA格式比较熟悉,就选,虽然给岀了FASTA吧,接下来,就是见证奇迹的时刻,Alig nment In put Format成败在此一举,我们要在一个框里写入两个FASTA格式的氨基酸序列,首先,把你要查询的氨基酸序列粘贴进去,接下来我们要开始创造标准FASTA格式了,在序列前面加上“> ”,FASTA格式里都是以此开头的,然后在“>”后面紧接着写上“Query ” (其实写什么都可以,主要起识别作用),然后按下回车键,序列在第二行,名称在第一行,这才正确;另外,我们见到的FASTA格式每行好像都是 70个字母

12、组成的序列吧, 给序列排排版吧,一行70个,满了就换行(这步不知道是不是必须的?)。紧接着,回车一下,在下一行粘贴上我们在NCBI上查询到的那个模版的 FASTA格式,直接粘贴就可以啦(杯_")如图所示:然后提交。wenrkdskcklf llts-Vtf ate皂日土匸丄山盜亡son已丄丄丄口亡匚匸二口己匸口:!二匚工匸f littJiQHyf匸丄匸匸r epsf 3png £pn_ej ks inxz'hiyev血丸.Crystal Structure Of 氏 HiTohetical Prot-eLn (13ac.iiiLl_0017S) rxQ> Sa

13、cLeroldes ZJhIEqcjtlLs Accc -392 Ac 1专0 A EesolctJloii fitrVFYHDKQI D1T5TF Y1AE1PLTP S QFEZ DFKEIMQI-JXENY 31YQHZHIUX DSLYQACDJlS VPQiQTTTDTGLIVQE LSAIQCL&lEAI TCTKRlTANQRVAflE 口 FLFVEftPBEYLTE YGTQDKDR1 iAlNGLPrKQjtl IQNEKYI EZLSTkPRaBXRTVEaTRSYaOTLRNYI LLRLGQETlTVTLPLKQRDy FP DfirEETXTS RI tD

14、SIGYLIlKIXXriPKEDKAVYPKVBlDLPYLllDVRRNGGGNSXGVNlCKfFIREAQPMCVSKSflXtPOr tipbad sn alignrneint fits-然后,又出来一个界面 -_-|,大家选择一下Target Sequenee和Template Seque nee就行了,它会自动识别我们提交的两条序列的,如果没有下拉框选项 可以选择,那么恭喜你,返回重做,肯定某个环节出问题啦。后面还有两个要填 写的框框,PDB-Code和Chain-ID,这个给大家说过了,前四位和最后一位,不懂 就百度吧。如图所示:SIBJOZENFRUMI Mvrwlbl 皿i

15、11* m hi “w *i3Im ” ft* :A0 SWISS-MODEL WorkspacModelingmyWorkspaceSettings logout Workunit: P000013Tile:Situi: submission backPlease select sequences from your alignment'T旳Et SequmritETemplate Stqjrrcaloury|qi 证 94744F0 pdb 4GHN A=DB-Ccd& 4GHMChan-D Asubrntt alignment终于,我们可以提交了,耐心的等待它出结果吧,不

16、要关闭网页等它回复邮件,貌似它没有给我发邮件,还是乖乖的等待它自动刷新吧其实,关闭网页应该也可以,这个网站给我邮件发送了一个登陆密码, 用邮箱做用户名可以登陆SWISS-MODE,在myWorkspace 中可以看到已提交的序 列。霸 SWISS-MODEL WorkspaceModelling Tools| Siting* k»gciul)*出1 毋!I tiffnRepos 直 DryDcnCuRii&ltaliDnWorktpace WQituriitin*P0MDO8Teinnplate Ident-iTcaJion计POMOT1Pdodlling - Aliqnim

17、nl Med色Rndl&rPOMOf2Tempi ale kntifk:sliDnD1POOTOT3Fdodellingi - Aliqniment MedeshiliA*M » >*>*>*> OO00Symbots; O submission not finished“ queuedA mniung皆 nleQ'&toppadl ini3hedNum bier of days until vuorku n rt will b 帘 dueled'O T days- IbI"1day& If*O w ite c

18、teiSd MM*3 keep 7 day$ tong&r1 dfPte workunit结果 出来(三三)/啦啦啦,可是我看不懂>_<%我能告诉大家的是, 这个结果页面可以以 PDF格式输出,结果自己慢慢分析吧,如图所示:HIDZENTHUIML Inr ILiriiuai电 4*1 亠申(J 耳 J .峠屬 SWISS-MODEL WorkspaceMdelliriiTm&l 肯空 rtdfy DOUBTientMiOf| rrWoikEpa“ | logout UUotlujn撤 Pawn Fiiidor Ovgiviuw1 101PrintlsM 由也pag

19、e菇 兰Model Summafy 9Mod«l inlcrniation;Mod日|嗣 r&idw rsng&1 to 158Qua lily iinfcMrTiaiiiofl:cto梧胆卜QWEAM 尹 Sco佬-9D8IWainiitg; Low QMLAN Z scor«j Chily mernbrianE pnLsns ot imodEds E poor quairiy btb >exp9cisd Ld rsach suchi Iet scareslogs TerTplalesi* Ajiy 时咱卜ModeHing*diispla|i ino

20、delj as pdb/ 启吕DeepL 卅 prcjeciji1 in dcinlMd mod 色U 會茸pdbll - asprojMt|i - as |n电幻小Global Uudd 5叭 tlblliiirti 9 MJQUFAM4 日 lobta I 5cxh es: ©Local scores在结果输出的PDF中,我们可以看到一些打分,我 C ?v )想,我们能给老师 的也就是这些数据吧,也许他能看懂呢,嘿嘿GlobAl MtMKlbaiimacicMiGMEAN4 global scores:OkEAFiscarM:tsiimsiad Aiislui电 rroa&

21、;J <i3rf/Scm com pcmertsLocal $coiea: caonng by 趁如 upmiw:&TOTplot-0CO40 M 10Crtorng luicncii:errrSNf worez-scoreaction 凶出rjy73dMMl-atarr paiwse energyi49o.ee-5.14SolvatKn energ/1&33-4.t20Qn日PQle和于“437-341C.0Q4-are-MFPF44 ok?rial cors:he QMEANI4 score -s a cjrrpaste scjne axisisdnc(/ Hlinear gambir aton of 4 statimliciil zotential terms lestirratd model re-iabiity tietwesn 0-1). The p&eud

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论