草莓转录组分析报告_第1页
草莓转录组分析报告_第2页
草莓转录组分析报告_第3页
草莓转录组分析报告_第4页
草莓转录组分析报告_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分析要 分析流程及结 READ质量预处 READ质量评 序列拼 UNIGENE与公共数据库比 UNIGENE的KEGG注 UNIGENE表达丰 差异表达富集分 结果文件说 参考资 分析流程及结read质量预处理通过SolexaRNA的paired-end,得到了大量的样本数据。鉴于Solexa数据错误率对结果的影响,对原始数据进行质量预处理。(20Raw总Raw总Trim总结论:两个样本数据量满足5Grawdata要求。readRawClean00RawClean00质量预处理前Perbasesequencequality质量预处理后Perbasesequencequality图:质量预处理前Persequencequalityscores图:质量预处理后Persequencequalityscores图:质量预处理前SequenceLengthDistribution图:质量预处理前PerbaseGCcontent图:说明:质量预处理前,read的前10个base的CG含量分布不均匀,这与有关。质量预处理后PerbaseGCcontent图:说明:质量预处理后,read的前10个base的CG含量分布不均匀,这与有关。质量预处理前Perbasesequencecontent图:质量预处理后Perbasesequencecontent图:质量预处理前PersequenceGCcontent图:质量预处理后PersequenceGCcontent合并所有样本的有效reads进行denovo拼接,使用软件Trinity,版本 下最长的转录本作为Unigene(软件的Chrysalisclusters模块得到了98848个Unigene,大小95.5Mb。参数在RNA-Seq项目中仅具有参考价值,不是评估结果好坏的客观标准。UNIGENE 与公共数据库比较似性比对主要基于BLAST算法。BLASTBasicLocalAlignmentSearchTool,即"基于局部取相似度>30,且e<1e-5的注释,合并得到的所有注释详细信息,结果文件见列列描述QueryLengthSbjctLengthQueryAlignmentSbjctAlignment比对结果的E值UNIGENEKOG对unigene进行KOG功能分类预测:共有14267个unigene被注释上25种KOG分类。 TORunigene的KOG注:各字母意义[Z][Y]Nuclear[P]Inorganiciontransportand[N]Cell[L] [K][I]Lipidtransportand[E]AminoacidtransportandUNIGENEKEGG对unigene进行KEGGPathway分析,利用KAAS预测得到对应的KO号,然后利用KO号对应到KEGGpathway上,分析与KEGG中酶注释的关系文件以及映射到pathway通路中去,共得到335张通路图。结果文件在/results/annotation/KEGG/下,包括All-Unigene_kegg.xls、All-Unigene_pathway.xlspathwayhtmljpg格式的unigeneko04141,Proteinprocessinginendosmic ko04075,nthormonesignal UNIGENEGO对得到的进行GO分类,统计在BiologicalProcess,CellularComponent,MolecularFunctionGOtermblastuniprot(swissprottrembl的结果),利用得到的uniprot号比对GOterm。Ontology的三大类:molecularfunction,cellularcomponent,biologicalprocess的各个层次所占数目,结果分别见/results/annotation/GO/文件夹中的xls以及txt文件。如下图所示,样本的功能在BiologicalProcess分类中主要于cellularprocess和metabolicprocess;在CellularComponent主要于cellpart和cell;在MolecularFunction分类中主要于binding和catalyticactivity。Level2水平下的GO注释的unigene数画图如UNIGENE使用软件bowtie2-2.2.2,使用single-end的map方法将read比对到unigene,允许一个reads比对到多个转录本上,此时每个reads在每个转录本上计1/n。RPKM:ReadsPerKilobaseofexonmodelperMillionmappedreads,isdefinedinthisway:MapAll00001st3rd差异表达富集分析PvalueFDRQvalueUP.CM1.CM2CM2CM1GO/KEGG类别的个数;样本编号DOWN.CM1.CM2CM2CM1GO/KEGG类别P<P<Q<Q< P P Q Q<<<<7455856954547693 /qualitycontr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论