




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上 16srDNA信息分析1.标准信息分析(初级)1.1 基本数据处理(使用内部撰写的程序对原始的测序数据进行基本处理) 通过Illumina平台(Miseq)进行Paired-end测序,下机数据经过去除低质量reads(Q20, 90%标准过滤),并trim掉reads2 尾部100bp 低质量序列;每个样品数据产出详细统计结果见下表:表1-1 reads数据统计:# Samples# HQ reads (total)# HQ reads (mean±SD)CA17110,6516,509±2,175HC19163,6908,615±3
2、,081LK13127,4169,801±2,858Total49401,7578,199±2,992注:原来的样本中CA15由于原始Reads数太少(只有23条)而被删除,因此目前的样本总数为49个 1.2 去除 barcode 序列,引物序列及 tags过滤通过COPE软件(Connecting Overlapped Pair-End,V1.2.3.3),利用重叠关系将双末端测序得到的成对reads组装成一条序列。利用内部编写程序去除两端barcode 序列,引物序列。 Paired End Reads通过reads之间的overlap (19个碱基)关系拼接成Tags
3、;然后去掉barcode序列,引物序列。为了得到高质量的Tags,将拼接的Tags按照长度过滤,去嵌合体等的处理。(这里等的意思就是按照拼接条件过滤:1, 碱基的ASCII value值低于33的过滤掉。2.overlap取19个碱基,这19个碱基相互匹配率低于98%的过滤掉。3.去掉引物序列的时候,允许一个错配,错配多于一个的过滤掉。) 表1-2 tags的详细信息Sample IDRaw Tag NumFinal Tag numHC11756017,319HC296729,604HC31805317,826HC41218112,107HC51155811,477HC81148811,404
4、HC91635416,095HC102158421,270HC1179897926HC121156111,449HC132490924,660HC142297922,736HC152074720,549HC161485714,728HC172117121,002HC181070010,605HC191135911,247CA81620316,040CA101092510,560CA1182547,690CA1294799,053CA1479477,584CA1682218,093CA171066610,479CA181078710,651CA51634416,154CA960475,861CA
5、131029010,1652 高级信息分析2.1 OUT及其丰度分析2.1.1 OUT统计 拼接的Tags经过优化后,在0.97相似度下利用qiime(v1.8.0)软件将其聚类为用于物种分类的OTU(Operational Taxonomic Units),统计各个样品每个OTU中的丰度信息,OTU的丰度初步说明了样品的物种丰富程度。49个样品共产生3029个OTU,其中Singletons OTU(即丰度为1的OTU)个数为0,Non singletons OTU个数为3029。表4.样品OUT统计SampleNameOTUsTagsHC154117,319HC22699,604HC353
6、017,826HC421512,107HC520611,477HC821411,404HC945516,095HC1060021,270HC1226211,449HC1329424,660CA1045310,560CA117107,690CA126509,053CA145197,584CA162408,093CA1733010,479CA1828910,651CA533616,154CA93475,861HC111427,926CA1326910,165表5 OTU 统计IndexOTU numNo. of OTUs3029Assigned to families1,708 Assigned
7、to genera1,172 Assigned to species314No. of OTUs per sample368±147Min no. of OTUs per sample127Max no. of OTUs per sample7192.1.2 OTU分布的韦恩图如下:在0.97的相似度下,得到了每个样品的OTU个数,利用R(v3.1.1)画图软件绘出Venn图可以展示多样品共有和各自特有OTU数目,直观展示样品间OTU的重叠情况。结合OTU所代表的物种,可以找出不同环境中的核心微生物。图2-1 OTU venn 分析。不同颜色图形代表不同样品或者不同组别,不同颜色图形
8、之间交叠部分数字为两个样品或两个组别之间共有的OTU个数。同理,多个颜色图形之间交叠部分数字为多个样品或组别之间共有OTU个数。Venn图容许2-5个样品或组别。2.1.3 OUT水平的PCA图如下:R(v3.1.1)画图软件PCA 分析(Principal Component Analysis),即主成分分析,是一种分析和简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品OTU(97%相似性)组成可以反映样品的差异和距离,PCA运用方差分解,将
9、多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值两个特征值。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图2-2 基于OTU丰度的PCA分析。横坐标表示第一主成分,括号中的百分比则表示第一主成分对样品差异的贡献值;纵坐标表示第二主成分,括号中的百分比表示第二主成分对样品差异的贡献值。图中点分别表示各个样品。不同颜色代表样品属于不同的分组。2 .2 Core microbiome分析图表都是通过qiime(v1.8.0)软件得到的共有OTU数与样本数的关系:图2-3 覆盖所
10、有样本的微生物组。横坐标表示样品占的比率,纵坐标表示包含OUT的数目。 这些样本的core microbiome(即覆盖所有样本的微生物组)共包含17个OTUs,其物种分类信息如下表2-1。表2-1 覆盖所有样本的OTUsOTUTaxonomy levelTaxonomy nameGenusStreptococcusGenusCapnocytophagaSpeciesdisparGenusCampylobacterGenusFusobacteriumGenusStreptococcusGenusStreptococcusGenusPeptostreptococcusGenusGranulica
11、tellaGenusCampylobacterGenusNeisseriaGenusFusobacterium2008GenusNeisseria21908GenusNeisseriaGenusCampylobacterFamilyGemellaceae1212GenusGranulicatella2.3 生物多样性分析2.3.1 单个样品复杂性分析通过计算Shannon index, Chao1 index, Phylogenetic diversity (PD, whole tree) 和observed number of species共四个指数来进行生物多样性分析。通过qiime(v
12、1.8.0)软件计算样品的Alpha多样性值并用R(v3.1.1)软件做出相应的稀释曲线,盒型图。稀释曲线是利用已测得16S rDNA序列中已知的各种OTU的相对比例,来计算抽取n个(n小于测得Reads序列总数)Tags时各Alpha指数的期望值,然后根据一组n值(一般为一组小于总序列数的等差数列)与其相对应的Alpha指数的期望值绘制曲线。如样品有提供分组信息,且每组样品个数不小于3,将对组间的Alpha多样性指数进行差异分析。差异分析的检验方法为秩和检验,如果组数为2,采用两样品比较的Wilcoxon Rank-Sum Test(R中的wilcox.test);如果组数大于2,采用多样品
13、比较的Kruskal-Wallis Test(R中的kruskal.test)。最后利用Alpha多样性指数绘制盒形图。差异分析与作图均通过R软件(v3.1.1)进行。 基于 OTU 的结果,我们计算了样品的 Alpha 多样性(表2-2)。Alpha 多样性是对单个样品中物种多样性的分析。chao1多样性估算指数是根据所测得的 tags 数和 OTU 的数量以及相对比例来预测样品中微生物的种类(OTU 的数量),是基于已知结果所得相对值。Shannon 指数是一个综合 OTU 丰度和 OTU 均匀度两方面因素的一个多样性指数,Shannon 及observed number of speci
14、es、 Phylogenetic diversity (PD, whole tree) 指数越大,则表示该样品中的物种越丰富。表2-2 样品的 Alpha 多样性#Alphamean(CA)mean(HC)mean(LK)Pvalue(KW)p-vaule(CA-HC)p-vaule(CA-LK)p-vaule(HC-LK)chao1488.357.422.0.0.0.0.observed_species243.161.199.0.0.0.0.PD_whole_tree16.13.15.0.0.0.0.shannon3.2.3.0.0.0.0.Rarefaction分析(样本不分组):图2-4
15、 单个样品内的Alpha 多样性Rarefaction分析(样本分组):图2-5 每组样品内的Alpha 多样性。图中红色,黄色,蓝色线分别表示CA, HC, LK组的rarefaction分析结果图2-6为组Alpha多样性盒形图,更直观显示组间Alpha多样性差异。盒形图可以显示5个统计量(最小值,第一个四分位数,中位数,第三个中位数和最大值,及由下到上的5条线),异常值以“º”标出。 Alpha多样性的比较,以Shannon index为例可以看出多样性CA>LK>HC,其中CA/HC有明显差异(P=0.008, Students t test),而CA/LK, H
16、C/LK差异不显著2.3.2 样品间复杂度比较分析Beta多样性(Beta diversity)分析是用来比较一对样品在物种多样性方面存在的差异大小。本分析中通过QIIME(v1.8.0)软件,采用迭代算法,分别在加权物种分类丰度信息和不加权物种分类丰度信息的情况下,随机抽取各样品中75% Reads单独进行差异计算,迭代100次之后综合统计得到最终的统计分析结果表及PCoA展示图。Beta多样性热图使用R(v3.1.1)软件中的NMF包的aheatmap进行作图。 UniFrac是通过利用系统进化的信息来比较样品间的物种群落差异。其计算结果可以作为一种衡量beta diversity的指数,
17、它考虑了物种间的进化距离,该指数越大表示样品间的差异越大。报告中给出的UniFrac结果分为加权UniFrac(weighted UniFrac)与非加权UniFirac(unweighted UniFrac)2种,其中weighted UniFrac考虑了序列的丰度,unweighted UniFrac不考虑序列丰度。 从下面盒形图看,CA组内的物种丰度最大。Weighted Unifrac 图2-7 Beta多样性的盒形图Unweighted UnifracUnifrac距离的主坐标分析(PCoA)如下:Weighted UnifracUnweighted Unifrac图2-8 Beta
18、多样性的主坐标分析(PCoA)图。 如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图2-9 UniFrac距离分布heatmap。通过对UniFrac结果的聚类,具有相似beta多样性的样品聚类在一起,反应了样品间的相似性。2.3.3 物种组成分析本分析中分组后各水平的分类比较柱形图是用QIIME(v1.8.0)软件得到的,单个样品的群落分布柱形图和盒型图是根据QIIME(v1.8.0)软件计算的结果用R(v3.1.1)软件画的。 样品的群落分布图,直观的反应各样品的群落组成。从门水平
19、的群落分布图中可以看出,在这批样品中,占主要地位的门有 Firmicutes,Proteobacteria。2.3.3.1 门(phylum)水平比较 图2-10 分组后门水平的分类比较。从左至右分别为CA,HC,LK的物种组成。 图2-11样品的门水平群落分布图2.3.3.2 纲(class)水平比较图2-12 分组后纲水平的分类比较。从左至右分别为CA,HC,LK的物种组成。 图2-13样品的纲水平群落分布图2.3.3.3 属(genus)水平比较 图2-14样品的属水平群落分布图含量最高的25个属的物种组成如下: 可以看出,这些样本中含量最高的属为Streptococcus, Neiss
20、eria, Neisseriaceae (family), Campylobacter, Bacillus, Gemellaceae, TM7-32.3.4 多组样本的比较分析下面的表格都是通过QIIME(v1.8.0)软件计算出的,热图是用R(v3.1.1)软件画的。2.3.4.1.1 OTU水平的比较分析下表是在不同组样本间有显著差异的OTUs(P<0.05, Kruskal-Wallis test),共35个OTUP valueCA_meanHC_meanLK_meanLineage0.0.0.0.s_Streptococcus_infantis0.1.334E-059.02E-0
21、53.309E-05s_Streptococcus_infantisCU.OTU36090.0.4.302E-057.37E-05s_Streptococcus_infantisCU.OTU39510.0.0.0.s_Streptococcus_infantis0.4.506E-052.515E-050.s_Selenomonas_noxia0.0.2.728E-053.53E-05s_Prevotella_tannerae0.0.0.0.s_Haemophiluspara_influenzae0.4.681E-057.871E-050.s_Capnocytophaga_ochraceaCU.
22、OTU15120.0.5.314E-054.729E-05s_Campylobacter_rectusCU.OTU42480.3.144E-053.67E-050.s_Actinobacillus_porcinusCU.OTU46690.0.00.o_LactobacillalesCU.OTU28840.0.0.0.o_Gemellales0.0.0.0.g_Streptococcus0.1.213E-057.16E-050.g_Streptococcus0.0.2.432E-054.272E-05g_Streptococcus0.0.0.0.g_Prevotella0.0.2.607E-05
23、5.232E-05g_Leptotrichia0.08.912E-050.g_Cardiobacterium0.0.0.0.g_Capnocytophaga0.0.7.529E-050.g_Capnocytophaga0.0.00.g_BacillusOTU190.0.0.0.g_Abiotrophia0.0.0.0.f_StreptococcaceaeCU.OTU44370.6.529E-055.103E-060.f_StreptococcaceaeOTU20.4.005E-059.346E-060.f_PasteurellaceaeCU.OTU38810.0.6.821E-050.f_Ne
24、isseriaceaeCU.OTU20270.0.8.193E-050.f_Neisseriaceae0.0.0.0.01988f_GemellaceaeCU.OTU1600.0.8.61E-063.201E-05f_Clostridiaceae0.0.0.0.f_Clostridiaceae6.38E-056.461E-058.711E-050.f_Carnobacteriaceae0.0.0.0.f_Carnobacteriaceae0.0.0.0.f_CarnobacteriaceaeOTU100.0.00.c_BacilliCU.OTU310.0.2.232E-053.781E-05 p_Firmicutes2.3.4.2 属水平的比较分析首先,PCA分析能够看出3组样本之间有一定程度的差异:其次,通过Kruskal-Wallis test分析可以找出在不同组间有明显差异(P<0.05)的属如下(共19个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阶段性复习2024年特许金融分析师考试试题及答案
- 绩效管理中的关键绩效指标试题及答案
- 护理健康教育质控标准解读
- 齿轮链条年终总结
- 英语 第四册(五年制高职)2课件 Unit2 From Ideas to Products
- 山西省晋中市太谷区职业中学校2024-2025学年高一上学期期末考试地理试题(解析版)
- 食管癌患者放化疗护理
- 高效复习2024年CFA考试试题及答案
- 投资风险控制与管理试题及答案
- 高中生语文知识竞赛
- 膝关节病护理查房ppt
- 4.1ENSO南方涛动解析课件
- 《海水增养殖用环保浮球技术要求》标准及编制说明
- 诗词接龙(飞花令)PPT
- 名中医治肺结核肺痨九个秘方
- (完整word版)苏教版初一下册英语单词
- 床旁血液滤过
- 某化工厂拆除施工方案(完整资料)
- 搅拌功率计算-150818
- GB_T 39995-2021 甾醇类物质的测定(高清-现行)
- 《接合菌门》PPT课件.ppt
评论
0/150
提交评论