报告展示项目数据基_第1页
报告展示项目数据基_第2页
报告展示项目数据基_第3页
报告展示项目数据基_第4页
报告展示项目数据基_第5页
免费预览已结束,剩余59页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、晶能生物技术():miRNA 表达谱结题R&D标准分析晶能生物技术( 2012/7/15)目录分析结果信息5原始数据的预处理7数据的质量控制与预处理分析72.12.2 Clean Data 长度分布统计82.3 Clean Data Reads 累计频度统计93序列组比对103.1 参考组比对103.2 Clean Data Reads组定位分布统计103.3 Clean Data Reads组比对错配统计113.4 Clean Data Reads组分布图11参考4.1组外显子,内含子比对14组特征区域比对与 Reads 统计144.组特征区域比对与 Reads 饼图分布图154.2组特征区

2、域比对与 Unique Reads 饼图分布图154.3已知 miRNA 前体比对统计信息16已知 miRNA 前体比配统计16鉴定的已知 miRNA 首位点碱基分布18鉴定的已知 miRNA 的各位点碱基分布统计195.已知 miRNA 成熟体比对统计信息226.1 已知 miRNA 成熟体比配统计226.6.2 鉴定的已知 miRNA 成熟体首位点碱基分布246.3 鉴定的已知 miRNA 成熟体的 Reads 各位点碱基分布统计25已知参考组 miRNA 前体比对统计信息287.8.重复序列比对298.1 重复序列比对基本统计298.2 重复序列比对类型与匹配 Reads 信息表308.

3、3 重复序列比对错配 Reads 数目统计308.4 重复序列比对 Reads 分布统计31Rfam 比对33Rfam 非编码 RNA 匹配的 Reads 总量饼图分布图34Rfam 非编码 RNA 匹配的 Unique Reads 总量饼图分布图349.3Rfam 非编码 RNA 匹配的(Unique) Reads 总量分布统计表359.4 Rfam 非编码 RNA 匹配 Read 序列信息表369.5 Rfam 非编码 RNA 匹配 Read 错配数目统计36miRNA 表达量计算37miRNA 表达量分布图38miRNA 表达量计算结果表38miRNA 差异表达分析39差异表达分析方法学

4、介绍3911.2 miRNA 差异表达分析结果表4111.3 miRNA 差异表达比对样本表达量合并表4211.4 miRNA 差异比对组样本表达量 FPKM 分布图4311.5 miRNA 差异比对组样本表达量 FPKM Boxplot 分布图4311.6 miRNA 差异比对组样本表达量 FPKM 散点分布图4411.7 miRNA 差异比对组样本表达量 FPKM 火山分布图44miRNA 差异比对组差异 miRNA 表达量 FPKM 热图45miRNA 差异比对组差异 miRNA 表达量 FPKM 散点分布图45miRNA 差异比对组差异 miRNA 表达量 FPKM 火山分布图4612

5、 新miRNA. 47新 miRNA 与其二级结构4712.1/已知 miRNA 二级结构与比对结果4812.212.3 新miRNA 注释坐标5012.4 新/已知 miRNA 合并注释坐标5012.5 新/已知 miRNA 前体序列合并5012.6 新/已知 miRNA 成熟体序列合并5012.7 新 miRNA 前体序列合并50新 miRNA 成熟体序列合并50新 miRNA Star 序列合并50Clean miRNA reads 简并序列分析5012.11 简并序列(Clean miRNA reads)组比对分析5112.12 简并序列(Clean miRNA reads)miRNA

6、 前体比对分析5212.13 miRNA结果表53Score 得分表5412.14 miRNA12.15 已知 miRNA reads 计数与计数归一化分析5512.16 已知/新合并 miRNA reads 计数与计数归一化分析55新/已知 miRNA 合并后表达量计算56新/已知 miRNA 合并后表达量计算5615. miRNA 靶. 5615.1 全部 miRNA 靶结果5715.2. 全部 miRNA 靶注释5715.3 差异 miRNA 靶与注释结果5715.4 3UTR 序列文件5716.miRNA 靶GO 功能分析5816.1 差异 miRNA 靶GO 功能分布图5916.2

7、差异 miRNA 靶GO 功能注释表5916.3 差异 miRNA 靶GO 功能富集度注释表6017. miRNA 靶Pathway 功能分析61富集度分析与超几何分布统计学检验62参考文献641分析结果信息2原始数据的预处理本实验采用 illumina Hiseq2000的单端 50bp模式对样本进行高通量。原始数据需经过引物与adaptor 序列去除,并经过对片段碱基的质量检验和长度筛选,最终选择质量可靠的片段。然后统计小 RNA(sRNA)的种类(用 unique 表示)及数量(用 total 表示),并对小 RNA 做长度分布统计,一般来说,小 RNA 的长度区间为 1830nt,长度

8、分布的峰能帮助判断小 RNA 的种类,如 miRNA 集中在 21 或 22nt,siRNA 集中在 24nt,piRNA集中在 30nt。Small RNA 选择长度大于 15bp,小于 32bp 的 read(clean data)保留下来用于后续分析。clean data 是指经过上述所有过滤处理步骤所保留下的序列(remained reads)数据。输出文件:(文件内容与说明见 1_clean_data_qc)2.1数据的质量控制与预处理分析输出文件: Percent(%)(百分比)Sistics(片段类型)Reads Num(数目)reads trimmeptor1524593.03

9、6031555reads trimmed QualityPercent147560.293847406reads_trimmed length65025612.9490403表格中各行含义reads trimmedadaptor过滤的包含 3接头和 5接头的 Read 总量reads trimmedQualityPercent过滤低质量碱基的总量,其中,质量较高的read 定义为:1-30 个碱基内不含N,质量低于 10 的位点不超过4 个且质量低于 13 的位点不超过 6 个的片段为高质量 Read.reads_trimmedlength长度超出 32bp,或低于 15bp 的reads 总

10、量基于clean data 统计相关数据的结构,特性:包含(1)Reads 长度分布与(2)累计频度分布。clean data将原始reads 经过去接头处理,去污染处理,去低质量碱基处理,去除 polyA 处理后剩余的reads 总量;这些Reads 适合用于后续分析。reads trimmed含 polyA/T 的readsPolyA/Treads trimmed采用 bwa 算法动态去除 3末端碱基质量低于 20 的碱基QualityDynamicstotal readIllumina Hiseq2000所得 Read 总量clean data420061583.65002846read

11、s trimmed PolyA/T160.00031862reads trimmed QualityDynamics35520.070733667total read50216541002.2Clean Data 长度分布统计输出文件: Figure_Length Distribution_Percent(Reads 长度分布图-绝对数目 Count 分布)输出文件: Figure_Length Distribution_Percent(Reads 长度分布图-百分比比例分布)2.3Clean Data Reads 累计频度统计输出文件: 输出文件: 注释:横坐标取对数;横坐标表示重复出现频度

12、计数(nOccurren)的对数,纵坐标表示当前重复频度小于等于横坐标次数的累计Reads 总数目。该分析目的是评估建库的质量和数据的冗余程度。注释,横坐标表示重复出现频度计数(nOccurren ),纵坐标表示当前重复频度小于等于横坐标次数的累计Reads 总数目。该分析目的是评估 建库的质量和数据的冗余程度。3序列组比对3.1 参考组比对将样本预处理后的 Clean data Reads 与参考组序列比对。比配采用 bowtie。序列比配需要考虑到 miRNA结构特点,选择多比对统计模式,比配参数和比配的条件要求保证: (1)保证 read 前 15bp 精确匹配,其他位置允许 2 错配碱

13、基匹配模式,(2)计算所有可能的匹配模式。针对比对分析结果,统计不同组序列结构区域上比配情况,和区间内各自所占比例(参见表-2)。输出文件:(文件内容与说明见 2_alignment_match_genome)3.2Clean Data Reads组定位分布统计输出文件: 表格中各列含义chr_length长度sense coveraged length正义链比对上的 Reads 所覆盖的总长度antisense reads反义链比对上的 Reads 总量antisense coveraged fraction反义链比对上的 Reads 所覆盖的总长度占该长度的比例total aligned

14、reads可比对到参考组的总 Reads 数目antisense coveraged length反义链比对上的 Reads 所覆盖的总长度sense coveraged fraction正义链比对上的 Reads 所覆盖的总长度占该长度的比例sense reads正义链比对上的 Reads 总量chr3.3 Clean Data Reads组比对错配统计输出文件: sleidReads Num1-mismatch reads459192Total matched reads3365491表格中各行含义1-mismatch reads组存在 1 碱基错配匹配的clean reads 总量与参考

15、组匹配的clean reads 总量Total matched reads与参考3.4Clean Data Reads组分布图分别统计参考组各或拼接 Scaffold 内,正负链,比配的 clean reads 总数目。输出文件: 注释:正反链匹配Reads 数目分别用蓝色与红色表示。柱状图每个柱子上面显示每条总共比配的clean reads 数目。纵坐标表示每条总共比配的clean reads 数目。=2 mismatch reads与参考组存在大于 2 碱基错配匹配的clean reads 总量Exact matched reads与参考组精确匹配的clean reads 总量=2 mis

16、match reads226075Exact matched reads2680224输出文件: 注释:正反链匹配Reads 数目分别用蓝色与红色表示。正反链以并排显示方式给出分布状态。注释正反链匹配Reads 数目分别用蓝色与红色表示。柱状图每个柱子上面显示每条总共比配的 clean reads 数目。纵坐标表示每条总共比配的相应clean reads数目。输出文件: 注释:正反链匹配Reads 数目分别用蓝色与红色表示。柱状图纵坐标、每个柱子上面显示每条总共比配的clean reads 占总体匹配到参考clean reads 数目的比例(百分比%)。纵坐标表示 百分比比例(%)输出文件:

17、注释:正反链匹配Reads 数目分别用蓝色与红色表示。正反链以并排显示方式给出分布百分比状态。注释正反链匹配 Reads 数目分别用蓝色与红色表示。柱状图纵坐标表示每条的正链或负链总共比配的 clean reads 占总体匹配到参考clean reads 数目的比例(百分比%)。纵坐标表示 百分比比例(%)附录: 参考组信息:UCSC Genome Browser assembly ID: galGal4Sequencing/Assembly provider ID: ICGSC Gallus_gallus-4.0 (GCA_000002315.2)Assembly date: Nov. 20

18、11GenBacID: GCA_000002315.2NCBI Genome information: NCBI genome/111 (Gallus gallus)NCBI Assembly information:NCBI genome/assembly/317958 (ICGSC Gallus_gallus-4.0 (GCA_000002315.2)BioProject information: NCBI Bioproject: 133424. 参考组外显子,内含子比对将 sRNA 比对到 mRNA 的内含子和外显子,找出来自 mRNA 降解片段的 sRNA。输出文件:(文件内容与说明见

19、3_alignment_match_exon_ron)4.1组特征区域比对与 Reads 统计输出文件: genomic featuresReads NumUnique Reads NumExon antisense959879185254ron antisense762046142857UTR3 antisense50622153UTR5 antisense945307174341CDS antisense101279211Downstrem1K antisense61609188913Upstream1K antisense20119472317表格中各行含义Exon antisense外

20、显子反义链匹配的 Reads 数目ron antisense内含子反义链匹配的 Reads 数目UTR3 antisense3UTR 反义链匹配的 Reads 数目UTR5 antisense5UTR 反义链匹配的 Reads 数目CDS antisenseCDS 反义链匹配的 Reads 数目Downstrem1K antisenseTSS 下游 1K 反义链匹配的 Reads 数目Upstream1K antisenseTSS 上游 1K 反义链匹配的 Reads 数目Reads Num与组特征区域(行)匹配的 Reads 总数目Unique Reads Num与组特征区域(行)匹配的非冗

21、余 Reads 总数目表格中各列含义Upstream1K senseTSS 上游 1K 正义链匹配的 Reads 数目Downstream1K senseTSS 下游 1K 正义链匹配的 Reads 数目CDS senseCDS 正义链匹配的 Reads 数目UTR5 sense5UTR 正义链匹配的 Reads 数目UTR3 sense3UTR 正义链匹配的 Reads 数目ron sense内含子正义链匹配的 Reads 数目Exon sense外显子正义链匹配的 Reads 数目Upstream1K sense7275838113Downstream1K sense11122396005

22、74CDS sense1169210654UTR5 sense36753112UTR3 sense20739101240225ron sense216071111526Exon sense208644612516634.2组特征区域比对与 Reads 饼图分布图给出每个组特征区域内比配的总 Read 数目输出文件: 4.3组特征区域比对与 Unique Reads 饼图分布图给出每个组特征区域内比配的总 Unique Read 数目;注释:Unique Reads 是指去除重复(duplicate reads)的非冗余Reads。输出文件: 5. 已知 miRNA 前体比对统计信息与 miRN

23、A 数据库(miRBase18.0)中所有 miRNA 前体(若 miRBase 中无该物种 miRNA 前体序列则用成熟 miRNA的序列)进行比对(参见第 6 部分),得到样品中已知 miRNA hairpin 的 reads 含量、不同长度 miRNA reads 的首位点碱基分布及鉴定得的所有 miRNA 的各位点碱基分布统计。结果文件保存位置:4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpin

24、s4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_

25、match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpins4_alignment_match_miRbase_hairpinhairpinsleTable_SleTable_S_alignment_miRbase_hairpin.csv_alignment_miRbase_hairpxtle Figure_Pie_Chart_for_Total_Read_Counts_match_miRBase_hairpin.jpegleFigu

26、re_Pie_Chart_for_Unique_Read_Counts_match_miRBase_hairpin.jpegleTable_miRNA_leTable_miRNA_nucleotides_bias_percent.csv_nucleotides_bias_percent.txtleTable_miRNA_1st_nucleotides_bias_percent.csvleTable_miRNA_1st_nucleotides_bias_percent.txtleTable_miRNA_leTable_miRNA_nucleotides_bias_counts.csv_nucle

27、otides_bias_counts.txtleTable_miRNA_1st_nucleotides_bias_counts.csvleTable_miRNA_1st_nucleotides_bias_counts.txt leFigure_Bars_miRNA_1st_nucleotides_bias.jegleFigure_miRNA_nucleotides_bias_at_each_ition.jpeg5.1 已知 miRNA 前体比配统计输出文件: SisticsTotal ReadsUnique ReadsAligned reads318036916462Unaligned rea

28、ds1020246225633注释:已知miRNA自 miRBase 数据库(V18版本); clean data 指去除Adaptor,并去除低质量碱基后的数据,长度在 15-32bp 范围的read。Unique Reads 指去除 duplicate reads 的非冗余reads。Unaligned reads(%)24.29%93.20%Aligned reads(%)75.71%6.80%Clean reads4200615242095表格中各行含义Aligned reads与已知 miRNA 前体匹配的reads 数目Unaligned reads与已知 miRNA 前体非匹配的

29、reads 数目与已知 mIRNA 前体(hairpin)比对、非比对 Reads 总体数目(比例)统计输出文件: 与已知 mIRNA 前体(hairpin)比对、非比对的 Unique Reads(非冗余 Reads)总体数目(比例)统计输出文件: Unaligned reads(%)与已知 miRNA 前体非匹配的reads 数目占总体 clean reads 百分比例Aligned reads(%)与已知 miRNA 前体匹配的reads 数目占总体 clean reads 百分比例Clean readsClean reads 总数目5.2 鉴定的已知 miRNA 首位点碱基分布统计长度

30、范围从 18-30 范围内与 hairpin 比配的所有 sRNA 首位碱基(A,)偏分布输出文件: 统计长度范围从 18-30 范围内与 hairpin 比配的所有 sRNA 首位碱基总数目计数统计。输出文件: sRNA 长度UACG1921sRNA片段长度23252729注释:长度为 18-30nt 的sRN段中,首位碱基为 U,A,C,G 的数量30282624222018注释:长度为 18 的 sRN段中,首位碱基为 U,A,C,G 分别占的比例(纵坐标)分别用不同颜色表示。统计长度范围从 18-30 范围内与 hairpin 比配的所有 sRNA 首位碱基(U,A,C,G)相对比例。

31、输出文件: sRNA 长度UACG1954.52.5111.8331.152157.673.1338.051.15sRNA片段长度2372.032.122.223.652578.963.2114.693.142778.662.1813.535.632970.818.389.5411.275.3 鉴定的已知 miRNA 的各位点碱基分布统计统计长度范围从 18-30 范围内与 hairpin 比配的所有 sRN段的各个碱基位置的碱基(偏)分布。输出文件: 注释:所以 sRN段中第 5 位碱基为 U,A,C,G 的数别所占相对比例(纵坐标)分别用不同颜色表示。统计长度范围从 18-30内与 hai

32、rpin 比配的所有 sRN段的各个碱基位置的碱基总数目。注释:长度为 18-30nt 的sRN段中,首位碱基为 U,A,C,G 的数量占个长度范围内总 sRNA 数目的百分比例。3069.627.596.3316.462877.278.755.228.752685.653.356.814.182491.690.956.930.442274.373.6220.941.072086.961.618.013.421820.562.8421.7554.85输出文件: sRNA 长度UACG28903204329031794911677653415475610609531055534909100617

33、251922375109866542310118108538217277611272982399271025792899104525404716773481210958761586741306430191322141642967256613234038104675116865884123770495097712481818302306813179303374174054720100179325146514371343599102250975737049023225197235248030121769139454942669029330523741216110747423827114563125

34、320623737575943412433558628211606405885441316054446222194631926227161085164954181174338051655827906033180697151070511072788182227181830313177977530611295490013958211202592180584594540222653091052348891116297253939652789842412147751845708825995250691102176316828202250863291135172634027535688753112164

35、81890211819636105704统计长度范围从 18-30 范围内与 hairpin 比配的所有 sRN段的各个碱基位置的碱基相对比例。输出文件: sRNA 长度UACG227.9913.615.6452.7544.8733.3633.1928.58654.257.4731.027.26834.1354.3347.54108.1131.167.9952.741234.4649.899.646.021451.668.077.3632.911627.2338.9329.913.93189.5725.749.655.092032.848.2447.1111.82246.3133.662.11

36、17.922473.719.981.285.042615.4540.5810.1533.82835.0218.2911.5535.14307.855.5962.2424.322918.2510.6247.0223.612741.0122.65.9130.482521.1235.455.3638.082323.3318.839.3318.54216.423.4352.417.771914.8219.9234.7230.531713.6652.1328.525.69153.3733.735.7357.171355.969.6330.024.39116.3756.7829.737.12933.092

37、8.029.3529.55728.2538.25.827.7557.8832.1352.917.0839.1554.288.6627.91168.072.8425.773.326. 已知 miRNA 成熟体比对统计信息与 miRNA 数据库(miRBase18.0)中所有物种已知的 miRNA 成熟体进行比对,得到样品中已知 miRNA 的含量、不同长度 miRNA 的首位点碱基分布及鉴定得的所有 miRNA 的各位点碱基分布统计。结果文件保存位置:5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_align

38、ment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_matures5_alignmen

39、t_match_miRbase_matures5_alignment_match_miRbase_matures5_alignment_match_miRbase_maturesleTable_SleTable_S_alignment_miRbase_mature.csv_alignment_miRbase_mature.txtle Figure_Pie_Chart_for_Total_Read_Counts_match_miRBase_hairpin.jpegleFigure_Pie_Chart_for_Unique_Read_Counts_match_miRBase_hairpin.jpe

40、gleTable_miRNA_leTable_miRNA_nucleotides_bias_percent.csv_nucleotides_bias_percent.txtleTable_miRNA_1st_nucleotides_bias_percent.csvleTable_miRNA_1st_nucleotides_bias_percent.txtleTable_miRNA_leTable_miRNA_nucleotides_bias_counts.csv_nucleotides_bias_counts.txtleTable_miRNA_1st_nucleotides_bias_coun

41、ts.csvleTable_miRNA_1st_nucleotides_bias_counts.txt leFigure_Bars_miRNA_1st_nucleotides_bias.jegleFigure_miRNA_nucleotides_bias_at_each_ition.jpeg6.1 已知 miRNA 成熟体比配统计输出文件: SisticsTotal ReadsUnique ReadsAligned reads318036916462Unaligned reads1020246225633注释:已知miRNA自 miRBase 数据库(V18版本); clean data 指去

42、除Adaptor,并去除低质量碱基后的数据,长度在 15-32bp 范围的read。Unique Reads 指去除 duplicate reads 的非冗余reads。表格中各行含义Aligned reads与已知 miRNA 成熟体匹配的reads 数目Unaligned reads与已知 miRNA 成熟体非匹配的reads 数目Unaligned reads(%)与已知 miRNA 成熟体非匹配的reads 数目占总体 clean reads 百分比例Aligned reads(%)与已知 miRNA 成熟体匹配的reads 数目占总体 clean reads 百分比例Clean re

43、adsClean reads 总数目Unaligned reads(%)24.29%93.20%Aligned reads(%)75.71%6.80%Clean reads4200615242095与已知 miRNA mature 比对、非比对 Reads 总体数目(比例)统计输出文件: 与已知 mIRNA 成熟体(mature)比对、非比对的 Unique Reads(非冗余 Reads)总体数目(比例)统计输出文件: 6.2 鉴定的已知 miRNA 成熟体首位点碱基分布统计长度范围从 18-30 范围内与 mature 比配的所有 sRNA 首位碱基(A,)偏分布。输出文件: 统计长度范围

44、从 18-30 范围内与 mature 比配的所有 sRNA 首位碱基总数目计数统计。输出文件: sRNA 长度UACG1921sRNA片段长度2325注释:长度为 18-30nt 的sRN段中,首位碱基为 U,A,C,G 的数量24222018注释:长度为 18 的 sRN段中,首位碱基为 U,A,C,G 分别占的比例(纵坐标)分别用不同颜色表示。统计长度范围从 18-30 范围内与 hairpin 比配的所有 sRNA 首位碱基(U,A,C,G)相对比例。输出文件: sRNA 长度UACG1954.52.5111.8331.152157.673.1338.051.15sRNA片段长度237

45、2.032.122.223.652578.963.2114.693.142778.662.1813.535.632970.818.389.5411.276.3 鉴定的已知 miRNA 成熟体的 Reads 各位点碱基分布统计统计长度范围从 18-30 范围内与 mature 比配的所有 sRN段的各个碱基位置的碱基(偏)分布。输出文件: 注释:所以 sRN段中第 5 位碱基为 U,A,C,G 的数目与分别所占相对比例(纵坐标)分别用不同颜色表示。注释:长度为 18-30nt 的sRN段中,首位碱基为 U,A,C,G 的数量占个长度范围内总 sRNA 数目的百分比例3069.627.596.33

46、16.462877.278.755.228.752685.653.356.814.182491.690.956.930.442274.373.6220.941.072086.961.618.013.421820.562.8421.7554.85统计长度范围从 18-30 范围内与 mature 比配的所有 sRN段的各个碱基位置的碱基总数目。输出文件: sRNA 长度UACG289032043290317949116776534154756106095310555349091006172519223751098665423101181085382172776112729823992710257

47、928991045254047167734812109587615867413064301913221416429672566132340381046751168658841237704950977124818183023068131793033741740547201001793251465143713435991022509757370490232251972352480301217691394549426690293305237412161107474238271145631253206237375759434124335586282116064058854413160544462221

48、9463192622716108516495418117433805165582790603318069715107051107278818222718183031317797753061129549001395821120259218058459454022265309105234889111629725393965278984241214775184570882599525069110217631682820225086329113517263402753568875311216481890211819636105704统计长度范围从 18-30 范围内与 mature 比配的所有 sRN

49、段的各个碱基位置的碱基相对比例。输出文件: sRNA 长度UACG227.9913.615.6452.7544.8733.3633.1928.58654.257.4731.027.26834.1354.3347.54108.1131.167.9952.741234.4649.899.646.021451.668.077.3632.911627.2338.9329.913.93189.5725.749.655.092032.848.2447.1111.82246.3133.662.1117.922473.719.981.285.042615.4540.5810.1533.82835.0218.2

50、911.5535.14307.855.5962.2424.322918.2510.6247.0223.612741.0122.65.9130.482521.1235.455.3638.082323.3318.839.3318.54216.423.4352.417.771914.8219.9234.7230.531713.6652.1328.525.69153.3733.735.7357.171355.969.6330.024.39116.3756.7829.737.12933.0928.029.3529.55728.2538.25.827.7557.8832.1352.917.0839.155

51、4.288.6627.91168.072.8425.773.327. 已知参考组 miRNA 前体比对统计信息与miRNA 数据库(miRBase18.0)中该物种的 miRNA 前体(若miRBase 中无该物种miRNA 前体序列则用成熟miRNA的序列)进行比对(参见第 6 部分),得到样品中已知 miRNA hairpin 的 reads 含量、不同长度 miRNA reads 的首位点碱基分布及鉴定得的所有 miRNA 的各位点碱基分布统计。结果文件保存位置:6_alignment_match_genome_hairpins6_alignment_match_genome_hairp

52、ins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins

53、6_alignment_match_genome_hairpins6_alignment_match_genome_hairpins6_alignment_match_genome_hairpinsleTable_SleTable_S_alignment_miRbase_hairpin.csv_alignment_miRbase_hairpxtle Figure_Pie_Chart_for_Total_Read_Counts_match_miRBase_hairpin.jpegleFigure_Pie_Chart_for_Unique_Read_Counts_match_miRBase_hai

54、rpin.jpegleTable_miRNA_leTable_miRNA_nucleotides_bias_percent.csv_nucleotides_bias_percent.txtleTable_miRNA_1st_nucleotides_bias_percent.csvleTable_miRNA_1st_nucleotides_bias_percent.txtleTable_miRNA_leTable_miRNA_nucleotides_bias_counts.csv_nucleotides_bias_counts.txtleTable_miRNA_1st_nucleotides_b

55、ias_counts.csvleTable_miRNA_1st_nucleotides_bias_counts.txt leFigure_Bars_miRNA_1st_nucleotides_bias.jegleFigure_miRNA_nucleotides_bias_at_each_ition.jpeg8. 重复序列比对将 sRNA 与重复序列进行比对,得到 repeat assote sRNA。重复序列自 RepBase 数据库( 当前版本的.)。 本项目共统计 151 类重复序列类型的可匹配 Reads 数目(Reads Num)与可匹配RepBase非冗余 Reads 数目(Uniq

56、ue Reads Num)。结果文件保存位置:7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeats7_alignment_match_repeatsleFigure_S leFigure_S leFigure_S leFigure_SleFigure_

57、S_Repeat Alignment Distribution_AlignReads.jpeg_Repeat Alignment Distribution_AlignReads_Percent.jpeg_Repeat Alignment Distribution_ReadCounts.jpeg_Repeat Alignment Distribution_UniqueReads.jpeg_Repeat Alignment Distribution_UniqueReads_Percent.jpegleTable_alignment_match_repeat.s leTable_repeat_mat

58、ch_alignment.csv leTable_repeat_match_alignment.txtleTable_repeat_match_sistics.csv8.1重复序列比对基本统计输出文件: Repeat FeatureReads NumUnique Reads Num2ARTEFACT214DNA220886DNA/CMC-Chapaev14128DNA/CMC-EnSpm37825110DNA/CMC-Transib17112DNA/Ginger141014DNA/hAT?6516DNA/h?0018DNA/hAT-9155(省略)17DNA/hAT-Blackjack2115

59、DNA/h1742413DNA/hAT11711DNA/Crypton229DNA/CMC-EnSpm?227DNA/CMC-Chapaev-3225DNA/Academ1513buffer1351RNA49005127198.2 重复序列比对类型与匹配 Reads 信息表QNAMERNAMESEQ2HWI-ST499:147:D0VKWACXX:2:1101:10005:719695S_DM#RNA1AAAACAAAACAGAACAACAACC4HWI-ST499:147:D0VKWACXX:2:1101:10019:410645S#rRNA1AAAACATCCTGGATGACCTC6HWI

60、-ST499:147:D0VKWACXX:2:1101:10035:1473545S#rRNA1AAAAGACCGGTTCACTTTAG8HWI-ST499:147:D0VKWACXX:2:1101:10062:1144555S#rRNA1AAAAGAGGGAGACCCAGGC表格中各列含义RNAME匹配的重复序列类型(亚类型)匹配的短序列 Reads 片段序列SEQ8.3 重复序列比对错配 Reads 数目统计输出文件: Sle idReads Num1-mismatch reads459192Total matched reads3365491表格中各行含义1-mismatch reads

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论