NCBI在线BLAST使用方法与结果详解_第1页
NCBI在线BLAST使用方法与结果详解_第2页
NCBI在线BLAST使用方法与结果详解_第3页
NCBI在线BLAST使用方法与结果详解_第4页
NCBI在线BLAST使用方法与结果详解_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、NCBI在线BLAST使用方法与结果详解NCBI在线BLAST使用方法与结果详解BLAST( Basic Local Alignment Search Tool )是一套在蛋白质 数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅 速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种 对相似性的统计说明。BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。Blastxx 常用的程序介绍:1、BLASTP是蛋白序列到蛋白xx的一种查询。xx存在的每条已知序 列将逐一地同每条所查序列作一对一的序列比对。2、BLAST)是核酸序列到蛋白库中的一种查询。先将核酸序

2、列翻 译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白) ,再对每 一条作一对一的蛋白序列比对。3、BLASTN是核酸序列到核酸xx的一种查询。xx存在的每条已 知序列都将同所查序列作一对一地核酸序列比对。4、TBLAST是蛋白序列到核酸库中的一种查询。与BLAST)相反, 它是将库中的核酸序列翻译成蛋白序列, 再同所查序列作蛋白与蛋白 的比对。5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库 中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生 6条可能的蛋白序列),这样每次比对会产生36种比对阵列。NCBI的在线BLAST下面是具体操作方法1,进入在线BLAST界面

3、,可以选择blast特定的物种(如人, 小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的 blast程序上面已经有了介绍。这里以常用的核酸库作为例子。BLAST Assembled GenomesChoose 占 species genome to search, nr list allBLAST M击t呂hnsESHumanMouseRatO/yza gliva吕as taunjw DEo 恺 Mo口Qrosop珀仙melartogasta Raj?问如缈esMY阳AqZs耐锐恥阳tiucleslideblasthlastxBasic BLAST以械昔酸库的吕品伪例Choos

4、e a BLAST program to run.Search a nucleotide database using a nucleotide quer/Afgohthm: blastn, mega blast, diwe: ontiguouis megablastSearch protein database using a protein query Aigoritbms bhstp, psi-blast, phi-blastSearch protein H吕teb刍w色 uirg a translated nudeotide querySearch translated nucleot

5、ide database using a protein querySearch transla-ted nucleotide database using a translated nucleotide query2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数 据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数 默认。-> -上 MB| r J.X'借 FT iu.VP""3, blast参数的设置。注意显示的最大的结果数跟 E值,E值是 比较重要的。筛选的标准。最后会说明一下。BLASTSearch database nr u

6、sing Megablast (Opdmiz& for highly similar sequences) 0Show results in a n&w windowMale: Parameter values that(IifftG enBcaL-ParAOietersMax target sequences显示的最大结果数ma4imD#ri number of aligned sequencesto display &Short iueriesFiltermask0 Automatically adjust prmfters for short input sequ

7、ences 电Scaring ParametersM韻uh/M祜ni咼忙h .2 v炖Scores_CostsLinear7 ©Filters and Maskin g叵1 Low complexity regions Species-specific repeats for Human 酗回 Mask for lookup table only g Mask lower case letters 妙 点ELAET运行Search datahase nr UGiing IVIegoblast (Optirnize foi highl/similar sequences) WShow

8、results in a new window4, 注意一下你输入的序列 xx。注意一下比对的数据库的说明5, blast结果的图形显示。没啥好说的Color k«y for alignment scores0250500750100012506, blast结果的描述区域。注意分值与 E值。分值越大越靠前 了,E值越小也是这样。Distribution of 100 Blast Hits on the Query Sequence <40405050-8030-200>=200Mouse-over to show defline and scores, click to

9、 show alignmervte乙blast结果的详细比对结果。注意比对到的序列XX。评价一个blast结果的标准主要有三项,E值(Expect),致性(Identities),缺失或插入(Gap9。加上xx的话,就有四个标准了。如图中显示, 比对到的序列xx为1405,看Identities这一值,才匹配到1344bp,而输入的序列xx也是为1344bp(看上面的图),就说明比对到的序 列要长一点。由Qurey(起始1)和Sbjct(起始35)的起始位置可知, 5'端是是多了一段的。有时也要注意 3'端的。p AlianmentsSelect AllGmt smlEctEi

10、d sequeric:日夕 Dgue trwe ofesults: Multiple mliRrimunt这里是打1词结果的详细比对的结果Synthetic construct 凶 11 已 musculus clone IMAE: 100065524, w(?CRIKEN cDNA 9630025121 grene (963OO25I2 lRik) toRNA, encodes益器盤显嚣芈犬-比对到的序列长度也是需雯注寬的尸比对到的序列长度也是需雯注言的GENE TD:如8。丘了 9E3ClCl2Fl21RjJc I RIKEW cDIJA 963 0025121 gene Mua musc

11、uius(10 or fever PubMed links)暑右的 Score = 293 bXts (1344J/ fcxpeot =门一口一M躬二g塑嘍矍11 - identitiea二左刎灯344%MU如 必弊二口/1扃4 (皿)*_一育心一胆 Strand=PlTi3/PliisV -X Query 1 ATGGAG&AAA.TGCTGTCCTTr:CGGGiATGTGGCCATTGATTTTTCTCCJlGAAGAGAGG&AC 60 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I

12、 I I I I I I I I I I I I I I I I I I I I I I I I I IATGGAG(iAAA.TGC TT 亡 C TTC C GG GATGTGG C CATTGATTTTTC TCCA GAAGAGA GGGAC 5 4ty c r e bru 旨<*Q ®到列 库对序 #比的TACCTGGTCCTGCTCAGTATCTTACASAG-ACTGATiS CT 各创LejaTTATAGCCa 亡 INDI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I

13、 I I I I I I I I I I I I I I I I I I I I I I I ITAC C TCG 苦 £(:U TGC TCAGTGGAT CT&TACA GAGAC GTGATG 亡 TGlGJlATT址A GC 亡直 U 1S4211C TTGTGT TC C TGGGTC TTGCTGTT GC TAAGC CATAC TTGGTAACA TTTC TGGAGCAAAAC 180 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I

14、 I I I I I I I I I I I I I I I IC TTGTGT TC C TGGGTC TTG 匚 HGTT GC TAAGC CATAC TTGGTAACA TTT C TGGAGCAAAAC 2HQuery 181Sbjct MWCAAGGGTCTrCAGGTGrGAAAAGCCACGCAGCAGCCACCATCCCAGGAA匚AACAGGCAAT 240 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IQuer

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论