2018.宏基因组理论教程中文翻译01简介_第1页
2018.宏基因组理论教程中文翻译01简介_第2页
2018.宏基因组理论教程中文翻译01简介_第3页
2018.宏基因组理论教程中文翻译01简介_第4页
2018.宏基因组理论教程中文翻译01简介_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1宏基因组简介易生信2018年7月14日仅限学习使用,请勿传播。理论课程目录简介-定义、方法和数据库扩增子-微生物群落多样性PICRUSt-16S预测功能基因宏基因组分类学-分类和分箱宏基因组功能-数据库与通路宏转录组-数据、分类学和功能生物标记挖掘2学习目标描述:各类宏基因组计划的目标处理:数据采用合适的方法质控运行:扩增子、宏基因组的标准流程分析:使用统计、网络方法处理结果认识:宏基因组研究技术的局限性3本节学习目标理解:宏基因组领域名词,如微生物群体、OTU学会:正确选择宏基因组实验技术手段解释:测序文件的结构与特点获取:在线资源与参考数据库4宏基因组学定义Microbiome微生物组:

2、新词,研究微生物、基因组及与宿主互作的全部。Microbiota微生物群:与微生物组同义,仅指16S扩增子研究细菌组,如Gut microbiota。Metagenome宏基因组:狭义仅指宏基因组测序分析基因组和功能基因,广义泛指研究微生物组的学科。推荐阅读有声专栏-宏基因组专业词汇001宏基因组Microbiota, metagenome, microbiome区别5广义的宏基因组探索微生物与其栖息环境的关系包括一系列实验和分析方法:培养组学 culturomics扩增子测序宏基因组宏转录组宏蛋白组宏代谢组宏表观组6为什么宏基因组学这么热?传统研究的困境:多种环境下可培养微生物可能小于1%。

3、此文存在重要争议,起码人类、模式生物等相关微生物组中相对丰度的大部分已经培养。在任何情况下,你不可以培养所有的微生物?宏基因组提供高效揭示微生物群落结构和功能的方法!7Amann et al., 1995: PMID 7535888本领域常用测序平台SangerIon TorrentRoche 454Illumina *SeqPacific BiosciencesNanopore8本世纪初10年测序通量提高了100亿倍ER Mardis. Nature 470, 198-203 (2011) doi:10.1038/nature09796 9人体微生物组10Human gut microbio

4、me: 2-3 million genesTypically 160 “species” at any given sampling timeHost: 25,000 genesQin et al., Nature (2010)Cell:人体肠道细菌与自身细胞的比例究竟是多少?宏基因组学简史它们的故事11测序发展史:150年的风雨历程Nature: 测序技术的前世今生121970s1976: Maxam-Gilbert 测序1977: 双脱氧终止法(64,000 citations; 诺奖)1975: Sanger 双向测序1960: 脱嘌呤嘧啶追踪测序1955: 胰岛素蛋白测序1970: N

5、eedleman-Wunsch 全局比对算法1977: 16S, 发现古菌1965: 蛋白结构与测序路线(Eck, Dayhoff)Frederick Sanger1979: 自动化序列组装 (Staden)1977: Staden packageMargaret DayhoffStaden (1979)快速下降的计算机价格,使大多数测序实验室拥有个人电脑成为可能。DNA测序是很快速的过程,有计算机的的加入使用快速确定序列成为可能(生物信息时代到来)。“The continuing rapid fall in the cost of computer components is making

6、it possible for most DNA sequencing laboratories to have their own small computer. The fact that DNA sequencing is now a fast procedure, and the availability of computers gives the possibility of more efficient overall strategies for sequence determination.”13 Nucleic Acids Research 14PhiX174 phage

7、genome: Sanger et al., 1977T4 genome map:Wood and Revel, 1976151980s1985: 章鱼泉5S rRNA测序1988: NCBI成立Norm Pace 1987:系统地理学Phylogeography1980: “Dr. Dayhoff 在计算机上建立了数据库和成熟和检索系统,可通常电话网络接入。 1984: 深海热泉5S rRNA 测序(pre-PCR!)1989: 核糖体数据库计划启动Mid 1980s: 数据共享协议 NIH EMBL - JNIG161990s1995: Haemophilus influenzae基因组测

8、序1991: Schmidt et al. 16S克隆并测序1998: “Metagenomics” 提出Jo Handelsman1999: ARISA (Fisher and Triplett)1998: Illumina 成立Fisher, M. M., & Triplett, E. W. (1999). Automated approach for ribosomal intergenic spacer analysis of microbial diversity and its application to freshwater bacterial communities.Appl

9、ied and environmental microbiology,65(10), 4630-4636.172000s2001: “Microbiome”Jill B2000: 宏基因组学发现视紫质2004:排泄酸性矿水宏基因组2005:排泄酸性矿水宏转录组、宏蛋白组2007: 全球海洋2004:马尾藻海2005: 肥胖 / 瘦 双胞胎2005: Roche 454 焦磷酸测序2008: 人类微生物组计划2008: 宏基因组计划2009: Mothur 发布Pat Schloss Oded Bjrbni.technion.a

10、c.il182010s2014: Oxford Nanopore MinION2010: 地球微生物组计划“The microbiome of”:旱冰接吻手机啤酒爱尔兰橄榄球员2013: Mouse microbiome from strictly bioinformatics lab 2011: Illumina MiSeq2010: Illumina HiSeq 20002010: PacBio RS2012: Built environmentmicrobiomeJessica Green2010: QIIME pipelineRob Knight2013:Citizen science

11、2015: Kitty Microbiome高水平的工作流程分析从学习工作流开始19概述20微生物取样产出“宏组学” 数据数据处理(如质控)分析扩增子(标记基因,Marker genes)21DNA提取扩增测序质控(聚类)比对多样性分析宏基因组22DNA提取随机打段测序质控, (组装 , 注释) 比对多样性功能分析宏转录组23RNA提取rRNA消减cDNA建库测序质控(组装 ,注释)比对基因表达功能宏基因组分析的关注点学经验,少跳坑24数据质量测序错误实验过程中引物、PCR、测序引入错误率, 错误类型 (PacBio: 10% random, Illumina 0.1% substitutio

12、n) 嵌合体扩增产物中极丰富1 - 20%,De novo去除和基于参考数据库SILVA去除数据获取Metadata: 研究复杂生态系统 多环境因子收集(尽量避免缺失)公共数据: NCBI发表文章中的数据编号(整理数据和metadata不完整不可用)25可比性 / 可重复性16S: 不同的可变区产生不同的结果不同区段扩增效率、变异程度不同;如何比较不同区段的序列呢?不同的测序平台、取样方式结果不同不同测序平台存在扩增、错误偏好;取样及处理严重影响群落结果?如保存/处理工作流复杂和过多的工具评估微生物组工具非常困难(缺少微生物组标准样)很难建立组分清楚的人工样品(大量不可培养)使用模拟群体和模拟

13、数据(过于简单,人为混合)根际土Rhizosphere/Rhizoplane如何取Microbiome: 室温存储样本方法比较引物评估:不同区段引物扩增效果评估DNA提取也能发Nature?Nat. Methods: 宏基因组软件评估人工重组宏基因组基准数据集NB:实验vs分析,谁对结果影响大精度与连锁宏基因组区分株水平不够准确,因为无法准确区分测序错误与微小变异如何组装宏基因组? 长序列有更多信息组装中,会产生嵌合体叠连群(不同物种序列重叠被拼接)分类注释与OTUsRDP分类预测+物种注释OTUs 任选, 准系统发生quasi-phylogenetic种子 / 代表性序列?De novo97%29功能注释的问题蛋白功能预测评估(Radivojac et al., Nat Meth 2013)数据库间错误的注释(Schnoes et al., PLoS Comp Biol 2009)覆盖度Coverage vs 准确度Accuracy公共资源数据库那里找3016SGreenGenes: MacDonald et al. ISME J (2012)SILVA: Quast et al. NAR (2013)rrnDB: Stoddard et al. NAR (2014)RDP II: Cole et al. NAR (2013)GenomesPATRICGenBank Gen

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论