![高通量测序科研入门常用名词意义整理_第1页](http://file4.renrendoc.com/view/6468524823f1b18aee49ca82550e214a/6468524823f1b18aee49ca82550e214a1.gif)
![高通量测序科研入门常用名词意义整理_第2页](http://file4.renrendoc.com/view/6468524823f1b18aee49ca82550e214a/6468524823f1b18aee49ca82550e214a2.gif)
![高通量测序科研入门常用名词意义整理_第3页](http://file4.renrendoc.com/view/6468524823f1b18aee49ca82550e214a/6468524823f1b18aee49ca82550e214a3.gif)
![高通量测序科研入门常用名词意义整理_第4页](http://file4.renrendoc.com/view/6468524823f1b18aee49ca82550e214a/6468524823f1b18aee49ca82550e214a4.gif)
![高通量测序科研入门常用名词意义整理_第5页](http://file4.renrendoc.com/view/6468524823f1b18aee49ca82550e214a/6468524823f1b18aee49ca82550e214a5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录 TOC o 1-5 h z HYPERLINK l bookmark0 o Current Document 一、OTU分类和统计2 HYPERLINK l bookmark2 o Current Document 二、生物信息分析 2 HYPERLINK l bookmark4 o Current Document 三、16SrRNA 3 HYPERLINK l bookmark6 o Current Document 四、Alpha 多样性4 HYPERLINK l bookmark8 o Current Document 五、稀疏性分析 r rarefaction analysis
2、 )和稀疏性曲线(rarefaction curve ) 7 HYPERLINK l bookmark10 o Current Document 六、Shannon-Weiner指数8 HYPERLINK l bookmark12 o Current Document 七、Rank Abundance曲线9 HYPERLINK l bookmark14 o Current Document 八、微生物种属鉴定及相关分析 1.0 HYPERLINK l bookmark16 o Current Document 九、OTU群落聚类及相关分析 14 HYPERLINK l bookmark18 o
3、 Current Document 十、Rank Abundance 曲线15 HYPERLINK l bookmark20 o Current Document H一、韦恩图(Venn ) 1.6-、OTU分类和统计OTU(operationaltaxonomicunits)是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同 一标志。通常按照97%勺相似性阈值将序列划分为不同的 OTU每一个OTU!常 被视为一个微生物物种。相似性小于 97瓶可以认为属于不同的种,相似性小于 93%-95%可以认为属于不同的属。样品中的微生物多样性和不
4、同微生物的丰度 都是基于对OTUB分析。Coverage是指各样品文库的覆盖率,其数值越高,则样本中序列没有被测出的 概率越低。该指数实际反映了本次测序结果是否代表样本的真实情况。计算公式为:C=1-n1/N其中口1=只含有一条序列的OTU勺数目;N才由样中出现的 总的序列数目。分类水平统计表主要是对每个样本在分类学水平上的数量进行统计, 并且在表格 中列出了在每个分类学水平上的物种数目(只显示前 10个样本,如果样本超过10个,请查看结果中taxon_all.txt 文件) 其中SampleNamefe示样本名称;Phylum表示分类到门的 OTIM量;Class表示 分类到纲的OTU&量;
5、Order表示分类到目的OTU量;Family表示分类到科的 OTUJ&量;Genus表示分类到属的OT吸量;Species表示分类到种的OT吸量。二、生物信息分析.数据统计分析1)有效测序数据统计2)可供精准分析的数据统计.数据回归样品1)根据tag信息将测序数据回归各自样品.单样品微生物种类及丰度分析1)序列聚类 OTU(OperationalTaxonomicUnits )2)取样深度判定(RarefactionCurve )3)计算菌群多样性和丰度指数4)单样品群落结构分析.多样品间比较分析1)全样品相似度比对2)多样品OTU比较3)多样品群落结构分析4)PCA (Principalc
6、omponentanalysis )分析5)WeightedunifracPCA 分析6)组间显著性差异分析16SrRNA为核糖体的RNA勺一个亚基,16SrDNAft是编码该亚基的基因。细菌 rRNA (核糖体RNA按沉降系数分为3种,分别为5S、16S和23SrRNA 16SrDNAl 细菌染色体 上编码16SrRN片目对应的DNAff列,存在于所有细菌染色体基因中。16SrDNA细菌的系统分类研究中最有用的和最常用的 分子钟,其种类少, 含量大(约占细菌DNAt量的80% ,分子大小适中,存在于所有的生物中,其 进化具有良好的时钟性质,在结构与功能上具有高度的保守性2,素有“细菌化石”之
7、称。在大多数 原核生物中rDNA都具有多个拷贝,5S、16S、23SrDNA勺拷 贝数相同。16SrDNAS于大小适中,约1.5Kb左右,既能体现不同菌属之间的差 异,又能利用测序技术较容易地得到其序列,故被细菌学家和分类学家接受。16SrRNA 16SrDNA勺区另16S中的S是一个沉降系数,亦即反映生物大分子在离心场中向下沉降速 度的一个指标,值越高,说明分子越大。rDNA和rRNA中的小写字母r是 ribosome(核糖体)的缩写。rDNA指的是基因组中编码核糖体 RNA(rRNA)分子的 对应的DNAff列,也就是编码16SrRNA勺基因。rRNA指的是rDNA的转录产物, 它是构成核
8、糖体的重要成分,核糖体由许多小的rRNA分子组装而成,16SrRNA是其中一个组件.一般所分析的对象都是16srDNA因为DNAE取容易,也比较 稳定。16S rRNA具有多项功能。.对于核糖体蛋白的固定起到脚手架的作用。2.3末端包含反向的 SD序列,用来与 mRNA的AUG起始密码子结合。16S rRNA的 3端与S1、S21的结合被发现与蛋白质合成的开始有关系。.与23S进行交互,帮助两个 核糖体子单元的结合。(50S+30S ).在A site稳定密码子与反密码子的正确配对。16SrDNA定方法随着生物技术的飞速发展,传统的微生物鉴定方法常常难以鉴定众多的生长 习性复杂的微生物,因而基
9、于基因组序列的分子鉴定受到广泛关注。在细菌基因 组中,编码16SrRNAW rDNA基因具有良好的进化保守性,适宜分析的长度(约| 为1540bp),以及与进化距离相匹配的良好变异性,所以成为细菌分子鉴定的 标准标识序列。16SrDNA勺序歹U包含9或10个可变区(variableregion )和11 个恒定区(constantregion )。保守序列区域反映了生物物种间的亲缘关系,而 高变序列区域则能体现物种间的差异。16SrDN6子的序列特征为不同分类级别 的近缘种系统分类奠定了分子生物学基础。目前16SrDNA勺序列信息已经广泛应 用于菌种鉴定和系统发生学研究。16SrDNAR据分析
10、初始数据层面:质量统计,序列长度及分布统计,数据预处理,有效序列统 计。QTUU面:OTUb类学统计,Alpha多样性分析,稀疏性曲线,Shannon-Wiene 曲线,Rankabundance曲线。物种丰度层面:物种分类注释,Beta多样性分析,样本问OT必异分布分 析,OTU度分布聚类分析,主成分分析,显著性差异分析,样本组间差异分析。群落结构层面多样本物种分布比较,群落相似度比较, 群落相似度PCoA 分析,基于组间进化的差异显著性(Un)WeightedUnifrac 分析,RDA/CCA1群与 环境因子之间的关系分析,系统发育树的构建,含种类分级的进化树的构建。四、Alpha多样性
11、在微生物多样性分析的报告 中主要包括五个部分:Alpha多样性分析、Beta 多样性分析、物种组成分析、进化关系分析、相关性分析 ,其中Alpha多样性分 析是生态学中生物多样性的一个重要的组成部分,也是比较基础的一部分。Alpha多样性是指一个特定区域或生态系统内的多样性,是反映丰富度和均匀度的综合指标。Alpha多样性主要与两个因素有关:一是种类数目,即丰富度; 二是多样性,群落中个体分配上的均匀性。群落丰富( Communityrichness )的 指数主要包括Chao指数和ACE旨数。群落多样性(Communitydiversity )的指 数,包括Shannon指数和Simpson
12、指数。(Simpson指数是评价优势度,Shannon 是评价多样性;Simpson指数越高代表物种多样性越低;Simpson指数和Shannon 指数是相反关系)匕IDReadg(LOSOTUKEdw3仁口VEI70EshniaKL! andImm21U1Z?3145)128 (1-20.95觎%Z63 wii VW(2.f4( 2C】)Q+2W1 (Ok 1921, & 2082)n 曳 eooom10846154154 143.178)157(13. IM)0.箱76031(2.S9h 2. 6&)Ou 2041 (0L 1988.0. 213S)134, 000000士皿,leA310
13、B0312(194, IE幻14031,1Z】f ) 0. 99TSM2.祐 (2.6f 2.68)0lM2 g 1901, & 204n126.0000001005122130 (125, US)12T (173,140)0. 966072.M1(2. 65, 2.12)0L1969(0l 1EB4, Q. 2fl35)122.00000010004US:3h”27,3)131U23,15EQ. 997BO12.33ft色之3T)OlZ, . 10. 270Sh Q. 2B加i群落丰富度指OTU数目的指数,chaol在生态学中常用来估计物种总数,由 Chao(1984)OTU数目的指数,ch
14、aol在生态学中常用来估计物种总数,由 Chao(1984)只含有一演序列的口TV数目f如喇金心V),七只含存商条序列的cti:数n(如山阿皿”工Ace:用来估计群落中含有 OTU数目的指数,由 Chao提出,是生态学中估计物种总数的常用指数之一, 与Chaol的算法不同。 080胃4好该等级OTU中序列数的相对百分含量,即属于该 OTU的序列数除以总序列数,纵坐标轴上数 字,例如“108弋表相对丰度为100%, “1酰表相对丰度为10%,依次类推。八、微生物种属鉴定及相关分析分类学分析在之前的分析步骤中,已经将序列按照其自身的碱基组成的相似性,分归到各OTU中。在进行分类学分析时, 首先,将
15、每一条优质序列都与 SILVA 119数据库进行比对, 找出其最相近且 可信度达80%以上的种属信息。之后,将每一个OTU中的所有序列进行类比,找出同一 OTU中 的不同序列的最近祖先的种属信息。最后,将得到的结果记录在表格文件中。这样做,可以在保留最可能多的信息量的情况下,确保得出信息的准确性。使用软件:mothur10PFl nameA二CQT腐田EKjperidngdomphylimdasaoideirfamilygenusspeciescmji$2639711,SISAl GPXP&.k MTWHjoBxim 域Pm观s%向GaninfinaMbx“叩fjgSlRlilV-blyWid
16、y口而。珈IEurwult M .回心m uDTU221322C H制的Al第。IP.日盛旧闻rM*upi6*一箱域FiELgESelM中即中ui出uihcuUjiM iuwn bucci ifn01U3102?HU?的AJ GROLP,日就而或 rWXsuiM目TFinicucKAl1小。出10叱*(麻j . jih./iurcult 既ur把nMcuoma1加1J58522577Al乐琪只Bam伊喇即BaLiena日;th巾蝴fi日和lerdd值存*n*urcult bc urntetc-su12E51E24即骁再Al GROtPr日m MYiupi口龊1时dFimicub网W r#id5
17、、汕京Eiyvpflal 向Sd 出 Hwiuirurt- ulLi n 15 竞口 bat 匕ur575276222N由值加r加旌up日团:中金Fini监tk哥蚓皿畛%lwr Q(W岫 1 5V&l jilt 就史&SeliKumtmat% HUiriUf J: biff i.1251:21站d鱼Al GP.3LP.BjHt a加池伊昵呼&Finicj踮H-juLhxl:*耻如IITHMKWE蔚字笔=L,. dsk. lurtult pc rumn bactiiirCfTLfl215245195(7Al GFCiLPBjLir日ad前人日必皿加科Oacls1 adiiuKuHbied iim
18、erl bEeriiTiOTU name 为 OTU 编号;第二列至OTUsize列的前一列为各样本的序列在所有OTU中的含有情况。例如,第二行第二列的数字代表样品 A中有多少序列被划分入 OTU1中。OTUsize为该OTU中所含序列的数量;Taxonomy列为OTU对应的种属信息。种属信息按照分类学水平分为多列,我们将物种 的门、纲、目、科、属、种的信息进行了分类分析,便于对数据的筛选提取。例如,需要提 取所有含有属信息的 OTU的相关信息,可在excel中选取属这一列,在工具栏的数据项中, 点选筛选,查看该列第一行的单元格,在下拉菜单中的文本筛选项下方的区域内,取消选择“空白”,点确定,
19、即得到所有含有属信息的OTU言息。注:分类学数据库中会出现一些分类学谱系中的中间等级没有科学名称,以 norank作 为标记。分类学比对后根据置信度阈值的筛选,会有某些分类谱系在某一分类级别分值较低,在统计时以Unclassified 标记。6个水平分别提取信息,分将OTU6个水平分别提取信息,分例表:11分黑的热制z11345e1ag3 UsdjeIpjporkinjd&mi由口 iWIR11?B1920731晔i1531851仃14聊11133icm海phvl 师Prcrf-nnaclPfia41153S304839153S37&6131BD铝发181mas晅T - nxjtpgpe69U
20、5812B71&5S99网53395J125K?19S3的53512phyiumFi-micxrle3236邮4乳a117295154i72011S32Biphylumi日各口日疗用演三合1:12Ua的5015璇31TMS制4da.GamnroleDbactefia374B3300止.谢13a73119B?10C771420024013日96102751classTherrTotDae33932S351324310225T0叫1T563362204 Heflspoleobadlfai 的324224到470加316172152寸classClOStridiiEi切474a第1居TG5S113力
21、的日闪1日口吐1310T3a弼利S3V,如血10rdMPi?ucflnwia:3l#s10n2410WJI1J17I23BT33802ad中支 H jpqii 引电326bh-io?1?吃11231磔G32也弘597fficrd*TDtiubriarulti3:322129S3?砌打口,d314172Z3T1晶 Nnt1。而啊;iMIhXm2ma1061928oQW.咖cndtfThimcrt&gj et339329152079115243160225TOBJ1T5638622CM7)0 rde*Fl芯川工日3T4J4qD1?DLUrCIms辜而琮d211302J3139215用2491522
22、732126grn哥UnClassrfie-d432的r?0缄2431湖M2M3M24124familyDrear: 5p TillsceBe日0001123113204J3D2613与 rniyHlruTs3n-dacgae25142132159051W33637d32333&胞familyDes uMh b的威 E&e32322429-却*224SJ3U1722370串门皿eUnCla&s 市 K2651科l-UUb8466437蒋73258165J34JBZ38孕n加密Maur jbiLterdrrc001123110632皿926砂2genu ePsetidomo-nasa130011
23、41672306S0JtMMJmpeoHth -.iliedt34HdglEd“1M3Dg124bi21业2? 146EHAlOtJIlr9呼Huncu:uredtplGque-Ua 口 Tn 出口 K AHodin-ium口 g阳zcurn口 Annoe&opnryaO 心 yrOdmuiTiDwrF 四皿口一口 小呻3M%Maxiiffiipod 941 %other在图中显示other在图中显示多样品相似度树与柱状图组合分析13左边是样品间基于群落组成的层次聚类分析( bray-curtis算法),右边是样品的群落结构柱状图例图:GyFOOlniumGyFOOlniumpg 即Ani侯厢
24、 hryCochlodin umGonyiuljxColKzoumNsoceratiumHeTerodin(umKirKidm nrr.口l-nplnT+cn小 闩 irtniwtftninnTelonemanFil / OCyStiE一TinseirnisDubciscquella曰ythrqpsidiniiiniIwencielaTeleaulaKtrcKiibidiLmHeraconL&F im:j|kisPrymnesiuniCrry&ociwcmuiinaB jBtDdiiiiuinChytriddniifntixdridiunr口RlvzosptiMflaothers九、OTU群落
25、聚类及相关分析OTU(Operational Taxonomic Units )是在系统发生学研究或群体遗传学研 究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设 置的同一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个 菌。要了解一个样品测序结果中的菌种、 菌属等数目信息,就需要对序列进行归 类操作(cluster )。通过归类操作,将序列按照彼此的相似性分归为许多小组, 一个小组就是一个OTU根据客户指定的相似度(96% 97前者98% ,对所有 序列进行OTU划分并进行生物信息统计分析。通常在97%勺相似水平下的OTU进 行生物信息统计分析。14QTUnawAB口EFGHIJKLOTU sicQT晅*IM10C2104CN6前国.潴222旧询aorg7m7M?4WMF11M幅111Q1K3K?OTUSd器4-m33ffl&l俯?85WHKForw139fi而1?ra1-fcXJ1M3-&T3335册?FifidS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度办公室翻新与餐饮店改造设计施工合同
- 二零二五年度城市公共安全报警系统电路升级改造合同
- 提取公积金借款合同
- 销售抵押合同
- 电商零售平台开发合同
- 个人理财指南
- 农产品公共检测与溯源体系建设作业指导书
- 质量管理工具与方法应用作业指导书
- 平面设计聘用合同
- 2025年广西货运考试题目
- 人教版八年级下册物理期末考试试卷及答案
- 2024-2030年汽车启停电池市场运行态势分析及竞争格局展望报告
- 新高考物理一轮复习重难点练习专题32 光的干涉、衍射和偏振 电磁波(原卷版)
- 《项脊轩志》 高中语文
- 第十三届中等职业学校技能大赛(导游服务赛项)理论考试题库(含答案)
- 2023-2024学年五年级下册数学青岛版小升初测评卷(五四学制)
- 2024年陕西省中考语文试题
- 北京海淀人大附2025届高一数学第二学期期末监测试题含解析
- ALC板施工施工方案及工艺要求
- 漂流规划设计方案
- 移动取消宽带委托书
评论
0/150
提交评论