用Polyphen2和SIFT进行突变预测_第1页
用Polyphen2和SIFT进行突变预测_第2页
用Polyphen2和SIFT进行突变预测_第3页
用Polyphen2和SIFT进行突变预测_第4页
用Polyphen2和SIFT进行突变预测_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、三个网址三个网址 Polyphen2:/pph2/ SIFT:/ Uniport database: http:/ 这个网址用于查找蛋白质序列和获取这个网址用于查找蛋白质序列和获取FASTA格式格式数据准备数据准备 两个网站均为在线提交数据,提交的数据文件格式可有以下两种:第一种为蛋白质的氨基酸序列,按照格式编写第二种为蛋白质在Uniport database中的ID获取蛋白质序列或获取蛋白质序列或ID 可以在NCBI中查找,也可以直接在Uniport database中查找查询结果 仔细核对以上

2、数据,ID就是所在polyphen2中需要号码,以human DAX-1为例,ID为P51843IDID蛋白质名称蛋白质名称种属种属 点击所需要的蛋白质ID链接,在出现的页面中可以详细查看DAX-1的信息,再次核对是否正确,注意右上角的几列标签,如图点击,获取点击,获取FASTAFASTA格式数据,此数据可能会被下载,格式数据,此数据可能会被下载,下载后可以用记事本程序打开,或者有时会在浏览器下载后可以用记事本程序打开,或者有时会在浏览器中直接打开,可以将其中数据全部复制备用,下方即中直接打开,可以将其中数据全部复制备用,下方即是打开的是打开的FASTAFASTA数据,最上面是蛋白质的信息(含

3、数据,最上面是蛋白质的信息(含IDID、名称、种属),下方是氨基酸序列名称、种属),下方是氨基酸序列sp|P51843|NR0B1_HUMAN Nuclear receptor subfamily 0 group B member 1 OS=Homo sapiens GN=NR0B1 PE=1 SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYS

4、LLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELF

5、FRPIIGTVSMDDMMLEMLCTKI成都家教,成都家教网Polyphen2应用 进入网站:/pph2/在这里以我们以前在这里以我们以前发现的发现的DAX-1 DAX-1 L262PL262P这个突变举这个突变举例,在红框出填入例,在红框出填入已经查到的已经查到的IDID,下,下方方FASTAFASTA数据可以数据可以不用输;绿框中输不用输;绿框中输入突变氨基酸位置;入突变氨基酸位置;在在AA1AA1中选择中选择L L,AA2AA2中选择突变后中选择突变后的的P P,最后点,最后点SubmitSubmit运行画面每隔每隔5-10

6、5-10秒点秒点refreshrefresh刷新页刷新页面,直至面,直至ResultsResults中出现中出现ViewView,然后点击然后点击ViewView结果一般突变预测一般突变预测看第二条图看第二条图HumVarHumVar的结果,的结果,分数越接近分数越接近1.01.0,损害可能越大,损害可能越大,越接近越接近0 0,损害,损害可能性越小:可能性越小:结果分为结果分为benignbenign,possibly possibly damagingdamaging以及以及probably probably damagingdamaging注:注:possiblypossibly为为有可

7、能,有可能,probablyprobably为很可为很可能能成都家教,成都家教网练习 小常所发现的SF-1基因一处SNP:G146A,请用Polyphen2 进行预测,蛋白质功能是否受到影响? 最后结果SIFT 进入网站:/ 在single protein tools中找到SIFT sequence,点击打开进入数据提交新页面填入自己填入自己emailemail,SIFTSIFT运算时间在运算时间在20min20min左右,你左右,你可以等,也可以让他把邮件发送过来可以等,也可以让他把邮件发送过来蛋白质蛋白质FASTAFASTA数据,将下载好的蛋白质数据,

8、将下载好的蛋白质FastaFasta数据上传即可数据上传即可或者将用记事本或浏览器打开的或者将用记事本或浏览器打开的FastaFasta数数据据copycopy至此数据框中,蛋白质序列可以至此数据框中,蛋白质序列可以截选,但必须有截选,但必须有第一行的蛋白质信息数第一行的蛋白质信息数据据此处填蛋白质突变或此处填蛋白质突变或SNPSNP位点信息,位点信息,如如S578NS578N,L262PL262P,G146AG146A等等成都家教,成都家教网SIFT预测AR S578N功能变化 在Uniport中搜索Androgen Receptor,下载FASTA数据,如下图为浏览器打开后的结果sp|P1

9、0275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAK

10、ELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYG

11、DMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYI

12、KELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此为第一行蛋白质信息,如果采用此为第一行蛋白质信息,如果采用copycopy至数据输入框,而不是采用文件上传方法,至数据输入框,而不是采用文件上传方法,红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分注意:一般来说用文件上传方注意:一般来说用文件上传方法比较简单,但法比较简单,但SIFTSIFT对氨基酸序对氨基酸序列有要求,大于列有要求,大于500500

13、的氨基酸序的氨基酸序列不能分析,故像列不能分析,故像ARAR这种有这种有919919个个AAAA的就不能采用直接上传模的就不能采用直接上传模式,而要将氨基酸序列裁剪过式,而要将氨基酸序列裁剪过后按后按FastaFasta格式黏贴至数据框中格式黏贴至数据框中成都家教,成都家教网sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGED

14、GSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLD

15、YGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCG CKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNN

16、QPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ我们需要先编辑我们需要先编辑FASTAFASTA数据,在记事本中打开,首先找到第数据,在记事本中打开,首先找到第578578位的位的S S(红色标

17、出),(红色标出),因为因为SIFTSIFT最佳预测大小为最佳预测大小为300-400300-400左右的氨基酸序列,那么我们将之前的左右的氨基酸序列,那么我们将之前的400400个氨基个氨基酸删除(蓝色部分),那么我们的突变位点就从酸删除(蓝色部分),那么我们的突变位点就从S578NS578N变为变为S178NS178N,最后将末尾的,最后将末尾的139139个氨基酸也一并删除(咖啡色),保留中间个氨基酸也一并删除(咖啡色),保留中间389389个氨基酸,加上第一行的蛋白质个氨基酸,加上第一行的蛋白质信息,这就是我们需要提交的数据信息,这就是我们需要提交的数据成都家教,成都家教网将刚才编辑好

18、的数据填入这个框中(之前介绍过将刚才编辑好的数据填入这个框中(之前介绍过这个数据输入框)这个数据输入框)此框中填入突变信息此框中填入突变信息S178NS178N页面中其他选项保持默认就可页面中其他选项保持默认就可以,一般不需要更改,最后提以,一般不需要更改,最后提交就可以交就可以成都家教,成都家教网 现在大家可以泡杯咖啡或茶,聊聊天,过个5-10分钟就可以出结果,一般不超过20分钟,如果出错,会有错误信息提示给你。如果你填好了邮箱,也可以不必等,过一会收邮件就可以。 结果会有一堆英文,看了头痛,直接找到Scaled Probabilities for Entire Protein和Predictions of substitutions entered两处链接,分别点击进去。 Scaled Probabilities for Entire Protein给出了所提交氨基酸每个位点发生突变后的计算分数,只要分数小于0.05就认为可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论