NCBI在线BLAST使用方法与结果详解_第1页
NCBI在线BLAST使用方法与结果详解_第2页
NCBI在线BLAST使用方法与结果详解_第3页
NCBI在线BLAST使用方法与结果详解_第4页
NCBI在线BLAST使用方法与结果详解_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、NCBI在线BLAST使用方法与结果详解BLAST (Basic Local Alig nment Search Tool)是一套在蛋白质数据库或 DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似 性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST采用一种局部的算法获得两个序列中具有相似性的序列。Blast中常用的程序介绍:1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一 地同每条所查序列作一对一的序列比对。2、BLAST)是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列( 条核酸序列会被翻译成可能的六

2、条蛋白),再对每一条作一对一的蛋白序列比对。3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同 所查序列作一对一地核酸序列比对。4、TBLAST是蛋白序列到核酸库中的一种查询。与 BLAST)相反,它是将库中的 核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和 所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这 样每次比对会产生36种比对阵列。NCBI 的在线 BLAST /Blast.cgiF面是具体操作方法

3、 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等), 也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。 这里以常用的核酸库作为例子。BLAST Assembled GenomesChoose 常 species genome to search, or list all qenoinic BLAST databases一HumanMouseRatArai>idQDsis tfta阳rtaOryza 鈕iva口匸 tai/fu占D旳恺NqdDtvsop百lia irtel占nogssttF 口GaJ伽馆Hug 珀fsafe他螢

4、JWF亡旳&63Mis meP#相raBasic BLAST 昔酸库的BI抽为例Choose a BLASTprogram to run.nucleotide blastblastKSearch a nucleotide database using a nucleotide quer/AfgaHthm* blastn, niegablast, discontiguous megablastSearch protein database using a pratein queryAtgonthms blastp,卩si-blast,卩hi-blastSearch prMein data

5、base using translated nucleotide querySearch tianslawd nucleotide database using a 卩roteiin querySearch translated nucleotide database using a translated nucleotide query2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 - p IPIN 0I 旦 ni" r Hrv Bd 离t- c r II ' A- a-一 - i - :

6、l IT , T* * -r *r"siT- 2 T. ' 一 _ rLFI 他VHIkw3, blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。Search database nr using Megablast (Opdrtiize far highly si milar sequences) 0Show results tn 划 new windowy Alqonthm pjhatrieters一 GonprM ParametieraMdIb: Parameter values that difh< max targ

7、et sequences w100 D、显示的最大结果数SaJecIthe-msiSinnufT? number of aligned seqtierces lai display 0Short queriesScaring Paramoters0 Ajtomitically adjust parimelers for short input sequences &E值M韻di/M诒m可忙h Scores 石ap CostsFilters and Maskin gFilterLaw compiGKity regions ySpecies-specific repeals for Hum

8、朗MaskMask far lookup twble only 藝Mask lower case letters 切点BLAST®行(LblSst3Search(1 atbase nr using lUlegablast (Optimize far highi/similarsequences) 0Show results in a new window4,注意一下你输入的序列长度。注意一下比对的数据库的说明。5, blast结果的图形显示。没啥好说的。Distribution of 160 Blast Hits on the Query Sequence 垃6, blast结果的描

9、述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。ClJ?-.7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),致性(Identities),缺失或插入(Gap®。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Iden tities这一值,才匹配到1344bP,而输入的序列长度也是为1344bp (看上面的图),就说明比对到的序列要长一点。由Qurey (起始1)和Sbjct(起始35)的起始位置可知,5'端是是多了一段的。有时也要注意 3'端的。V Alignme

10、nts 匚| Select AllGet selected sequgnces Distgncg trws of rgsults Multiple 引iqnrnent这里是bl抑结果的详細比对的结果rlcTh IBC172 716.1 I ESynthetic construct Mus muscu丄us clone IMAcjE; 100059524, W(JC gene (963002512 iRihJ itiRWA., encodes>RIEEH cDHA 9630025121卷豔苗4能喙邑乩比对到的序列长度也是需要i主意的GETJE ID: ED8 0£? 963 OU

11、Z 5I2 iRik | RIKEN cDlJA 9630025121 gene Mum tnus cuius (10 or fewer FulxMed linXs)暂前 S已=2硼b山 也恂 &T: = 0-口啟洋专 仔列 X血= 13钊/13阳余吠垃;Eg = 口/4344 (皿)斗聂疋有 旦3trand=PiTis/Pliis-".Ouery在库里柱j说 比对至订 的序列5已"35 j£1AT(SfiAGSAAA.TeCT<STCCTTCCSGCATST&5CCATT(SATTTTTCT<!CAGAA(SAeA(SS-ACATGG

12、AGGAAA.TGCTGTCCTTCCGGGATGTG<;CCATTGATTTTTCTCCAGAAGAGAGGG-AC&094Stijct95TACCT«(i(TCCT(SCTC;X(ST(5CATCT(TACA5AAC(STCATCCT(i<SA(SAATTATA(CCACI I I I I I I I I I I I I I I I I I I II II I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I ITACC TGG GTGC TGC TCAGT(5G

13、GAT GTSTACA GA&AC GTGATGG TGGAGAATTATA GC C AC120154Qmery121Sbjct155CTTSTGTTCCTdGGTCTTGCTGTTGCTAAGCCATACTTCGTAACATTTCTGGAGCAAAAC I I I I I I I I I I I I I I I I I I I II II I I H I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I CTTGTGTTCCTGegJTTGCTGTTGCTA/GCCATACTTGGTAHCATTTCTG 碍 GGAAHACIBOQueryIGlCAAGGGTCTPCAGTGTGAJUlAGCCACGCACCAGCCACCArCCCAGiAACAACAGGCAAT2 40sbjct215CAAGGGTGTrCAGGTGTGAAAAGCCACeCAGCAGCC 魚 CCATCCCAG15AACAACAGGCAAT274Q

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论