




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析要 分析流程及结 READ质量预处 READ质量评 序列拼 UNIGENE与公共数据库比 UNIGENE的KEGG注 UNIGENE表达丰 差异表达富集分 结果文件说 参考资 分析流程及结read质量预处理通过SolexaRNA的paired-end,得到了大量的样本数据。鉴于Solexa数据错误率对结果的影响,对原始数据进行质量预处理。(20Raw总Raw总Trim总结论:两个样本数据量满足5Grawdata要求。readRawClean00RawClean00质量预处理前Perbasesequencequality质量预处理后Perbasesequencequality图:质量预处理前Persequencequalityscores图:质量预处理后Persequencequalityscores图:质量预处理前SequenceLengthDistribution图:质量预处理前PerbaseGCcontent图:说明:质量预处理前,read的前10个base的CG含量分布不均匀,这与有关。质量预处理后PerbaseGCcontent图:说明:质量预处理后,read的前10个base的CG含量分布不均匀,这与有关。质量预处理前Perbasesequencecontent图:质量预处理后Perbasesequencecontent图:质量预处理前PersequenceGCcontent图:质量预处理后PersequenceGCcontent合并所有样本的有效reads进行denovo拼接,使用软件Trinity,版本 下最长的转录本作为Unigene(软件的Chrysalisclusters模块得到了98848个Unigene,大小95.5Mb。参数在RNA-Seq项目中仅具有参考价值,不是评估结果好坏的客观标准。UNIGENE 与公共数据库比较似性比对主要基于BLAST算法。BLASTBasicLocalAlignmentSearchTool,即"基于局部取相似度>30,且e<1e-5的注释,合并得到的所有注释详细信息,结果文件见列列描述QueryLengthSbjctLengthQueryAlignmentSbjctAlignment比对结果的E值UNIGENEKOG对unigene进行KOG功能分类预测:共有14267个unigene被注释上25种KOG分类。 TORunigene的KOG注:各字母意义[Z][Y]Nuclear[P]Inorganiciontransportand[N]Cell[L] [K][I]Lipidtransportand[E]AminoacidtransportandUNIGENEKEGG对unigene进行KEGGPathway分析,利用KAAS预测得到对应的KO号,然后利用KO号对应到KEGGpathway上,分析与KEGG中酶注释的关系文件以及映射到pathway通路中去,共得到335张通路图。结果文件在/results/annotation/KEGG/下,包括All-Unigene_kegg.xls、All-Unigene_pathway.xlspathwayhtmljpg格式的unigeneko04141,Proteinprocessinginendosmic ko04075,nthormonesignal UNIGENEGO对得到的进行GO分类,统计在BiologicalProcess,CellularComponent,MolecularFunctionGOtermblastuniprot(swissprottrembl的结果),利用得到的uniprot号比对GOterm。Ontology的三大类:molecularfunction,cellularcomponent,biologicalprocess的各个层次所占数目,结果分别见/results/annotation/GO/文件夹中的xls以及txt文件。如下图所示,样本的功能在BiologicalProcess分类中主要于cellularprocess和metabolicprocess;在CellularComponent主要于cellpart和cell;在MolecularFunction分类中主要于binding和catalyticactivity。Level2水平下的GO注释的unigene数画图如UNIGENE使用软件bowtie2-2.2.2,使用single-end的map方法将read比对到unigene,允许一个reads比对到多个转录本上,此时每个reads在每个转录本上计1/n。RPKM:ReadsPerKilobaseofexonmodelperMillionmappedreads,isdefinedinthisway:MapAll00001st3rd差异表达富集分析PvalueFDRQvalueUP.CM1.CM2CM2CM1GO/KEGG类别的个数;样本编号DOWN.CM1.CM2CM2CM1GO/KEGG类别P<P<Q<Q< P P Q Q<<<<7455856954547693 /qualitycontr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 流量创业计划书范文怎么写
- 2025年工作室工作计划 15
- 大型被动隔振平台测试规范-编制说明
- 保密知识考试题库(研优卷)
- 2025年中国羽绒手套行业市场规模及未来投资方向研究报告
- 中外电视新闻节目比较
- 广西南宁市重点中学 2022-2023学年高二下学期期末英语试题(含答案)
- 小型辅助船艇管理制度
- 做好班主任 做一名有智慧的班主任 校园廉洁 73
- 教育机构如何支持数字化健康管理在养老中的发展
- 巨量-营销科学(初级)认证培训考试题库(含答案)
- 2024年河南省机关单位工勤技能人员培训考核高级工技师《职业道德》题库
- 初中生物教学课例2.3.1《植物细胞的结构和功能》课程思政核心素养教学设计及总结反思
- DBJ15 31-2016建筑地基基础设计规范(广东省标准)
- 山东省济南市历城区2023-2024学年七年级下学期期末语文试题(解析版)
- 2024年湖南省中考道德与法治试题卷(含答案解析)
- 极坐标法课件讲解
- 2023年《畜牧兽医综合知识复习题及答案》
- 八年级语文下册(部编版) 第四单元 经典演讲-单元主题阅读训练(含解析)
- 2024新高考英语1卷试题及答案(含听力原文)
- 2023-2024学年译林版四年级英语下册Unit8《How are you?》单元检测卷(含听力及答案)
评论
0/150
提交评论