Blast结果的详细解析_第1页
Blast结果的详细解析_第2页
Blast结果的详细解析_第3页
Blast结果的详细解析_第4页
Blast结果的详细解析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Blast结果的详细解

析-CAL-FENGHAI.-(YICAI)-CompanyOnelBlast结果的详细解析Postedon2009年7月9日byboyun要使用程序对blast结果进行解析、分析,就必须对BLAST的结果形式有深入的了解,本篇文章将向你详细说明Blast结果的数据结构,供参考。这里的指的是blast默认的结果,也是我们应用最多的结果。3.14.1・结果文件的结构一个BLAST的结果文件,大致结构如下:每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Referenee信息。接下来包含一个或多个Query,每个query包含以下内容:QueryinformationSequencesproducingsignificantalignmentsSubjectsQueryinformation是对一个query序列的基本信息描述,Sequencesproducingsignificantalignments是对所有subjects的简要list。每个subjects是query序列在数据库中比对上的一条序列。HEADER每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Referenee信息。BLASTN込*2.16[脈-聖0笫]Refeience:Altaclial,StephenF.3ThomasL.Madden^AlejandroA.5chaffei,JinghuiZhangjZliengZhangjWebbMillerjandDavidLipman(1997)s:G-appedBLASTand.PSI-BLAST:ane屮genexaizionofproteinda'tabaseseaxchprogTajns^NucleicAcidsRes;.25t5389-'34O2.blast结果解读-headerQUERY每个blast结果文件包含一个或多个Query,每个query包含以下内容:QueryinformationSequencesproducingsignificantalignmentsSubjectsQuaxy^g.i1501174311gt-:AAFYO1O28135.11Metsgenomesequence序列口称AG201S600,'.luliolegenome-EequenjCE'(162Letters)长度壬Database'/espor12/^rs_,root/bla.stdb/neb1/blast/db^FAS;'A/env_nt5jOGlj419-:se(iueiices;53OOS/^S^S76totalLetters数据库Seaichjug・・・i*・・i・・i*・・i・・・b*・i・;•・b**:i・:、-*・」ii.>■・i・:、■匚■・done團左的信丿息blast结果解读-QueryQUERYINFORMATIONQueryinformation是对一个query序列的基本信息描述。该部分包括Name:Fasta序列对于序列描述的部分(见本文档部分说明)Accession:接收号,或者locationDescription:序列描述Length:序列的长度Database:用户使用的数据库信息SEQUENCESPRODUCINGSIGNIFICANTALIGNMENTS该处的信息是所有subjects的简要list。ScoreE^querLcesproducingsignificantalignments:ValueTOC\o"1-5"\h\zgb|AAFT?)1028133.11MetagenamequinceAGZO19600.g2j^halegenam...3^1le_85Sb|AAGA^100225Qh11sequence3G3d50Q_fasta.sereen.Cont...2SQ4e-73-gb|AAFYD10^0890.11MetageiicinesequenceAGEO19600.ufholegenoin...1964e_48gtIAAF301001565.1!Meta-genonesequence3G34299_fa^ta.screen.'Cont..k.1S42e_44gtiAACYD20294238.1|Marineme-tageiione1096626825914.?^liolegenoBL..400^58blast结果解读-subjectslistSUBJECTS每个subjects是query序列在数据库中比对上的一条序列。每个subject部分包括Subject序列信息一个或多个alignmentSUBJECT序列信息Subject序列信息包括该序列的:Name:Fasta序列对于序列描述的部分Accession:接收号,或者locationDescription:序列描述Length:序列的长度/■gt|AAFYO1028133.1|Metageiiomesequence^33019600.g2jwholegename序列名称Accession辱止倍息Length—.162氏度BLAST-subjectsALIGNMENT一个query序列和一个subject序列的比对结果,可能是一个或多个alignment,每个alignment包括如下信息,其中strand,frame和positives三项,随着所用blast程序的不同而有变动:Score:281Expect:2e-54Percent_identityIdentitiesbits:110LengthMismatches=Length-IdentitiesGaps:为空时,Gaps=0Strand(blastn)Frame(blastx,tblastn,tblastx)Positives(blastp,blastx,tblastn,tblastx)Query_startQuery_endSubject_startSubject_endScots=1889bi-ts(953^1;Ixpect=■0.0score?bits?Expec七Identities二1005/1031(97%)Gaps二S/1031(1%)-亠「,identity(1005^Length.(1031?j'.Peicent_id.entity(97),Gaps(6)S"tTand=Fliis-fFlii^'Q|MHstrand(3uezystazPQueiy:LlbS^'Caagatgltatcgactat七@:匚玄匚1:言1:匚巨玄1:1:^匚2匚七1;玄1:221:1:匡玄€€1:2玄匚玄1:匚1:€1:匚玄1:1212llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllSbjet:1573caagatgt+atcgactat七呂c七匚呂a/t土百匚a匚七土3七:&呂七七呂:宝呂百七方3匚:且七匚七呂土匚:日七1632Sutijectst:artQueTy已匸lcIQuezy:2173paattcra+ct2183lllllllllllSb:2593^!gaattcga-tct刃皺寻BSubjectendSccxe=1S18bits(ElSijExpect=下一''1^^lignmen-tIdentities可S3&/S46血8切Stiand=PIlisXPlus'Queiy:210gcatagcattaatttgcattattaccga七童童1:21:包§:1:童1:匚1:1:1:匚]111111]11111^11)!1玄1:1:童匚1:260iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiuiimmSbjet:630gcata.gc^-ttaatttgcatta/ttauega七农^七玄弋1§:七黑七(;弋弋*匚七七亡亡弋弋亡七七七玄七弋誉匚七689BLAST-subjects3・14.9・数据结构总结比对结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论