高通量测序的应用与进展_第1页
高通量测序的应用与进展_第2页
高通量测序的应用与进展_第3页
高通量测序的应用与进展_第4页
高通量测序的应用与进展_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高通量测序应用与进展高通量测序应用与进展 报告纲要报告纲要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序简介高通量测序简介 高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行测序并行测序,又称为,又称为下一代测序技术下一代测序技术,其使得可对一个物种的转录组和基因组进,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为行深入、细致、全貌的分析,所以又被称为深度测序深度测序。 H

2、igh-throughput Sequencing Next Generation Sequencing Deep Sequencing3 高通量测序流程高通量测序流程文库扩增低通量A Sanger测序 B 高通量测序并行测序高通量无需建立文库,两端加测序接头PCR扩增 报告纲要报告纲要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序技术的起源与发展高通量测序技术的起源与发展 1992年Lynx Therapeutics MPSS 2003年P

3、olony Sequencing(哈佛) 2005年454 Pyrosequencing 2006年Solexa Sequencing-by-Synthesis 2007年ABI SOLiD 2008年Helicos tSMS Sequencing 2010年Ion torrent Semiconductor Sequensing 2011年Pacific Biosciences SMRT Sequensing6 高通量测序技术的传承关系图高通量测序技术的传承关系图Lynx MPSSSolexaABI SOLiD454Ion TorrentHelicosSMRTIllumina SolexaR

4、oche 454Polony SeqABI Ion Torrent 现有主要高通量测序仪开发商现有主要高通量测序仪开发商测序仪品牌技术原理开发商Roche 454焦磷酸测序RocheIllumina Solexa 边合成边测序IlluminaABI SOLiD基于磁珠的大规模并行连接测序ABIHelicos单分子荧光测序 HelicosIon Torrent半导体测序ABISMRT单分子实时测序 Pacific Bio 454 Pyrosequencing 基于磁珠的焦磷酸测序:A 磁珠制备设备B 454测序仪C 454测序原理 454 测序流程测序流程 454 测序流程与测序流程与Base

5、Calling 454 的特点与主要应用的特点与主要应用 读长较长,400600bp 通量较低,1Run 1M 序列,400600Mb 相对成本较高 主要应用:de novo测序 Illumina Solexa简介简介 桥式PCR 边合成边测序 可逆终止物HiSeq 2000 Illumina Solexa 测序流程测序流程 Illumina Solexa 桥式桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle de

6、naturation2nd cycle annealingdioldioldioldioldioldiol2nd cycle extension Illumina Solexa Base Calling123789456T T T T T T T G T T G C T A C G A T Solexa 的特点与主要应用的特点与主要应用 读长较短,100150bp 通量高,25G每天,120-150G每Run 主要应用:RNA测序、表观遗传学研究 ABI SOLiD 简介简介 SOLiDSequencing by Oligo Ligation/Detection Oligo连接测序:通过连接酶

7、连接,再对oligo上荧光基团进行检测SOLiD 5500 xl ABI SOLiD测序前期制备测序前期制备A 样品片段化磁珠连接B 乳化PCR3末端修饰C 磁珠富集转到测序玻片 ABI SOLiD测序原理测序原理 ABI SOLiD荧光结合和结果示例荧光结合和结果示例SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!4626=(8.)43),(95,A. SOLiD Oligo荧光基团模式

8、图B. SOLiD 测序结果示例(Color Space) SOLiD 的特点与主要应用的特点与主要应用 读长较短,50-75bp 精度高,可达Q40 通量高, 20-30G每天,1Run 可达120G 主要应用:基因组重测序、SNP检测等 三种平台的技术差异三种平台的技术差异平台平台454454SolexaSolexaSOLiDSOLiDPCR磁珠乳化PCR桥式PCR磁珠乳化PCR测序载体磁珠玻片玻片测序方式焦磷酸、荧光可逆终止物、荧光连接酶、荧光结果序列FastQFastQCSFastQ 三种平台的效能参数差异三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度Solexa H

9、iSeq2000Single-end: 1 x 35 bpPaired-end: 2 x 50 bpPaired-end: 2 x 100 bp25 Gb/d1.5d4d8d50 bp 85%以上以上Q30100 bp 80%以上以上Q30SOLiD 5500 xlSingle-end: 75 bpPaired-end: 75 x 35 bpMate-pair: 60 x 60 bp20 30 Gb/d1d/ 1lane7d/ 12 lane7d/ 12 laneQ40454 GS FLX400 - 600 bp400 600 Mb/Run10hQ20 报告纲要报告纲要 高通量测序简介高通量测

10、序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序应用范围高通量测序应用范围 DNADNA测序测序全基因组全基因组de novo测序测序基因组重测序基因组重测序宏基因组测序宏基因组测序人类外显子组捕获测序人类外显子组捕获测序 RNARNA测序测序转录组测序转录组测序小小RNA测序测序电子表达谱测序电子表达谱测序 表观基因组研究表观基因组研究ChIP-SeqDNA甲基化测序甲基化测序 基因组测序基因组测序 基因组测序是对物种的基因组测序是对物种的基因组基因组DNADNA打

11、断后进行高通打断后进行高通量测序,根据是否有已知基因组数据主要分为量测序,根据是否有已知基因组数据主要分为de novo全基因组测序和全基因组测序和基因组重测序基因组重测序。 De novo 基因组测序是对基因组测序是对未知基因组序列未知基因组序列的物种的物种进行基因组从头测序,利用生物信息学分析手段进行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因对序列进行拼接、组装,从而获得该物种的基因组图谱。组图谱。 全基因组重测序是对全基因组重测序是对已知基因组序列已知基因组序列的物种进行的物种进行不同个体的基因组测序,并在此基础上对个体或不同个体的基因组测序,并在此

12、基础上对个体或群体进行差异性分析。群体进行差异性分析。 基因组测序策略基因组测序策略Paired-EndMate-End基因组测序流程两种测序策略 Paired-end 原理原理29100bps100bps3000bps Paired-end 基因组重排分析基因组重排分析 Paired-end和测序深度对测序效果的影响和测序深度对测序效果的影响 Jun Wang, et al. Nature 456, 60-65(6 November 2008) 基因组测序的生物信息学分析基因组测序的生物信息学分析 数据产出处理数据产出处理:图像识别与:图像识别与Base Calling去除接去除接头序列、检

13、测与去除污染序列等;头序列、检测与去除污染序列等; 基因组组装基因组组装:原始数据统计、测序深度分析、组:原始数据统计、测序深度分析、组装结果统计等;装结果统计等; 基因组注释基因组注释:Coding Gene注释、注释、RNA分类注释分类注释、重复序列注释等;、重复序列注释等; 基因功能注释基因功能注释:GO功能分类、功能分类、Interpro功能分类功能分类等;等; 比较基因组及分子进化分析比较基因组及分子进化分析:SNP/InDel/CNV检检测等。测等。 References1、Erin D. Pleasance, Philip J. Stephens, Sarah O Meara,

14、et al. A small-cell lung cancer genome with complex signatures of tobacco exposure. Nature, 2010, 463:184-190.2、Michael James Clark, Nils Homer, Brain D. O Connor, et al. U87MG Decoded: The Genomic Sequence of a Cytogenetically Aberrant Human Cancer Cell Line. PloS Genetics, 2010, 6(1):e1000832.3、We

15、i Chen, Reinhard Ullmann, Claudia Langnick, et al. Breakpoint analysis of balanced chromosome rearrangements by next-generation paired-end sequencing. European Journal of Human Genetics, 2010, 18: 539-543.4、Van Tassell CP, Smith TP, Matukumalli LK, Taylor JF, Schnabel Rd, et al. Whole-genome sequenc

16、ing and variant discovery in C. elegans. Nat Methods, 2008, 5(2): 183-188.5、Jun Wang, Wei Wang, Ruiqiang Li, et al. The diploid genome sequence of an Asian individual. Nature 456, 60-65(6 November 2008)6、Huang SW, Li RQ, Wang J, et al. The Genome of the Cucumber (Cucumis sativus Linnaeus).Nature Gen

17、etics 2009; doi:10.1038/ng.4757、David Hernandez, et al. De novo bacterial genome sequencing: Millions of very short reads assembled on a desktop computer. Genome Res.2008.18:802-809 33 基因组重测序案例分析基因组重测序案例分析 Erin D. Pleasance, et al. The compendium of somatic mutations in a small-cell lung cancer geno

18、me. Nature, 2010, 463:184-190. 此研究用高通量测序对一个此研究用高通量测序对一个小细胞肺癌小细胞肺癌细胞细胞系系NCIH209基因组进行重测序,以探讨基因组进行重测序,以探讨吸烟引发该细胞系基因组中特定碱基及其周吸烟引发该细胞系基因组中特定碱基及其周围序列的突变及细胞损伤修复原理。围序列的突变及细胞损伤修复原理。 肺癌基因组变异情况统计图肺癌基因组变异情况统计图 基因组重排和基因组重排和CNV分析分析 从头基因组测序案例从头基因组测序案例David Hernandez, et al. De novo bacterial genome sequencing: Mil

19、lions of very short reads assembled on a desktop computer. Genome Res.2008.18:802-809 此研究对此研究对Staphylococcus aureusstrain MW2和和Helicobacter acinonychisstrain Sheeba两种细菌基因组进行从头测序,并两种细菌基因组进行从头测序,并比较了几种拼接方法的效果。比较了几种拼接方法的效果。 多种拼接软件拼接结果比较多种拼接软件拼接结果比较 多种拼接软件拼接结果比较多种拼接软件拼接结果比较五种拼接方法的拼接结果比对五种拼接方法的拼接结果比对 宏基因

20、组测序宏基因组测序 宏基因组测序是对某一特定环境,如肠道、土壤、海水等中的所有微生物进行基因组测序。通过此方法可对该环境中的微生物种类和优势物种进行检测,揭示微生物群落多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系 。自然环境中很多微生物无法分离培养,而此方法无需对微生物进行分离培养。 宏基因组测序方法现在有全基因组的宏基因组测序和16S/18S rRNA宏基因组测序。 全基因组的宏基因组测序全基因组的宏基因组测序 通过高通量测序技术,对环境样品的总 DNA 直接进行全基因组的宏基因组测序,能够实现微生物群落的物种分类研究、群落结构、系统进化、功能注释以及物种间的代谢网络

21、研究,挖掘具有应用价值的基因资源,开发新的微生物活性物质。与传统的 Sanger法相比,速度快,性价比高,周期短,单个样品的测序量可以接近饱和。 宏基因组测序信息分析主要内容宏基因组测序信息分析主要内容 拼接组装 物种分类组成分析 基因预测和功能注释 生成Profiling table 主成分分析(PCA) 筛选与样品分组显著相关的因子 多样品间比较分析 16S/18S rRNA宏基因组测序宏基因组测序 16S/18S rRNA是微生物群落分析和细菌进化研究以及分类研究最常用的靶分子,采用新一代测序技术,对16S/18S rDNA的可变区进行测序分析,不需进行克隆筛选,能全面的反映微生物群体的

22、物种组成,真实的物种分布及丰度信息。 16S/18S rRNA测序信息分析内容测序信息分析内容 物种分类、物种丰度分析 OTU(OperationalTaxonomic Units )分析 多样性分析 系统进化分析 多样品间的比较分析 ReferenceslMeyer, F; Paarmann D, DSouza M, Olson R, Glass EM, Kubal M, (2008). The metagenomics RAST server - a public resource for the automatic phylogenetic and functional analysis

23、 of metagenomes.BMC Bioinformatics9: 0.doi:10.1186/1471-2105-9-386.lGeorge I et al. (2010). Application of Metagenomics to Bioremediation.Metagenomics: Theory, Methods and Applications. Caister Academic Press.lWong D (2010). Applications of Metagenomics for Industrial Bioproducts.Metagenomics: Theor

24、y, Methods and Applications. Caister Academic Press.lNelson KE and White BA (2010). Metagenomics and Its Applications to the Study of the Human Microbiome.Metagenomics: Theory, Methods and Applications. Caister Academic Press.lCharlesT (2010). The Potential for Investigation of Plant-microbe Interac

25、tions Using Metagenomics Methods.Metagenomics: Theory, Methods and Applications. Caister Academic Press.lAllen, EE; Banfield, JF (2005). Community genomics in microbial ecology and evolution.Nature Reviews Microbiology3(6): 489498.lZheng, Hao; Wu, Hongwei (2010). Short prokaryotic DNA fragment binni

26、ng using a hierarchical classifier based on linear discriminant analysis and principal component analysis.J Bioinform Comput Biol.8(6): 9951011. 人类外显子组捕获测序人类外显子组捕获测序 外显子组是指全部外显子组是指全部外显子区域外显子区域的集合,该区的集合,该区域包含合成蛋白质所需要的重要信息,涵盖域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的了与个体表型相关的大部分功能性变异大部分功能性变异。 与全基因组重测序相比,外显子组测序只与全基因

27、组重测序相比,外显子组测序只需针对外显子区域的需针对外显子区域的DNA,覆盖度覆盖度更深、更深、数据数据准确性准确性更高,更加简便、更高,更加简便、经济经济、高效。、高效。46 人类外显子组捕获测序原理人类外显子组捕获测序原理 人类外显子组捕获测序分析流程人类外显子组捕获测序分析流程 检测序列变异分析示例检测序列变异分析示例检测到检测到SNP数统计数统计序列序列InDel检测检测 References1、Wei X,Walia V,et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma. Nat G

28、enet.2011 Apr 15. Epub ahead of print2、Janel O. Johnson, J. Raphael Gibbs,et al. Exome Sequencing in Brown-Vialetto-Van Laere Syndrome. Am J Hum Genet.2010 October 8;87(4): 567569.3、Teer JK,Mullikin JC.Exome sequencing: the sweet spot before whole genomes. Hum Mol Genet.2010 Oct 15;19(R2):R145-51. E

29、pub 2010 Aug 12.4、Ley TJ, Mardis ER, Ding L, et al. DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature 2008; 456(7218):66-725、Gnirke A, Melnikov A, Maguire J, et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing.

30、Nat Biotechnology 2009; 27(2):182-9.6、Murim Choia, Ute I. Scholla, Weizhen Jia, et al. (2010) Genetic diagnosis by whole exome capture and massively parallel DNA sequencing.PNAS. 106: 19096-19101.7、Sarah B Ng, Kati J Buckingham, Choli Lee, et al. (2010) Exome sequencing identifies the cause of a men

31、delian disorder.Nature Genetics42, 30 - 35.50 人类外显子组捕获测序案例人类外显子组捕获测序案例 Wei X,Walia V,et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma. Nat Genet.2011 Apr 15. Epub ahead of print 黑色素瘤黑色素瘤发生率一直在上升,此研究对黑色发生率一直在上升,此研究对黑色素瘤细胞进行外显子组捕获测序,发现了和素瘤细胞进行外显子组捕获测序,发现了和其相关的其相关的高频突变基因高频突变基

32、因。 七个新发现的非同义高频突变位点七个新发现的非同义高频突变位点 单个基因中突变位点分析单个基因中突变位点分析基因基因GRIN2A模式图,箭头表示突变位点模式图,箭头表示突变位点 转录组测序简介转录组测序简介 转录组即特定细胞在某一功能状态下所能转录出转录组即特定细胞在某一功能状态下所能转录出来的所有来的所有RNA的总和,包括的总和,包括mRNA和非编码和非编码RNA(Non-codingRNA)。 第二代测序系统可精确检测单个碱基,并且第二代测序系统可精确检测单个碱基,并且不受到研究中先验信息的干扰,科研人员能够快不受到研究中先验信息的干扰,科研人员能够快速地获得某一物种特定器官或组织在某

33、一状态下速地获得某一物种特定器官或组织在某一状态下几乎所有几乎所有mRNA转录本序列,从而能够开展:转录本序列,从而能够开展:UTRs区域界定区域界定、可变剪切研究可变剪切研究、低丰度新转录本低丰度新转录本发现发现、融合基因鉴定融合基因鉴定、cSNP(编码序列单核苷酸(编码序列单核苷酸多态性)研究等。多态性)研究等。 转录组测序测序流程转录组测序测序流程全转录组总RNApolyT富集mRNA去除rRNANon-coding RNA转录组mRNARNA片段化、纯化、检测产量连接两端接头序列逆转录生成cDNA选择适当长度cDNA进行扩增纯化扩增产物,评估产量上机进行高通量测序 转录组测序测序流程转

34、录组测序测序流程无参考序列测序流程无参考序列测序流程有参考序列测序流程有参考序列测序流程 转录组主要分析内容转录组主要分析内容无参考序列无参考序列转录组分析内容转录组分析内容有参考序列有参考序列转录组分析内容转录组分析内容1 测序数据产量统计,数据成分和质量评估;2 Contig及Scaffold长度分布3 Unigene的长度分布和功能注释,GO分类,Pathway分析,差异表达分析4 蛋白功能预测与分类,差异表达基因GO富集和 Pathway富集分析。 1 基本数据统计,比对参考序列2 序列在基因组上在分布3 测序深度分析、随机性评估和基因差异表达分析4 新基因预测,基因可变剪接鉴定和基因

35、融合鉴定等。 ReferencesMaher CA, Kumar-Sinha C, Cao X, et al. Transcriptome sequencing to detect gene fusions in cancer. Nature, 2009 Mar 5;458(7234):97-101.Guojie Zhang, Guangwu Guo, Xueda Hu, et al. Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome. Gen

36、ome Res.2010 May;20(5):646-54.Murchison EP,Tovar C,Hsu A, et al. The Tasmanian devil transcriptome reveals Schwann cell origins of a clonally transmissible cancer. Science.2010 Jan 1;327(5961):84-7.Brain B. Tuch, Rebecca R. Laborde, Xing Xu et al. Tumor Transcriptome Sequencing Reveals Allelic Expre

37、ssion Imbalances Associated with Copy Number Alterations. PloS ONE, 2010, 5(2):e9317Fuchou Tang, Catalin Barbacioru, Ellen Nordman et al. RNA-Seq analysis to capture the transcriptome landscape of a single cell. Nature Protocols, 2010, ePub Febrary 25.Sohrab P. Shah, Ryan D. Morin, Jaswinder Khattra

38、 et al. Mutational evolution in a lobular breast tumor profiled at single nucleotide resolution. Nature, 2009, 461: 809-813Zhao et al.Transcriptome-guided characterization of genomic rearrangements in a breast cancer cell line.PNAS 106(6): 1886-91. (2009)Gregory R,Darby AC,Irving H, et al. A de novo

39、 expression profiling of Anopheles funestus, malaria vector in Africa, using 454 pyrosequencing. PLoS One.2011 Feb 25;6(2):e17418. Crawford JE, Guelbeogo WM, Sanou A, Traor A, Vernick KD, et al. (2010)De NovoTranscriptome Sequencing inAnopheles funestusUsing Illumina RNA-Seq Technology. PLoS ONE 5(1

40、2): e14202. doi:10.1371/journal.pone.0014202 有参考序列转录组测序案例有参考序列转录组测序案例 Maher CA, Kumar-Sinha C, Cao X, et al. Transcriptome sequencing to detect gene fusions in cancer. Nature, 2009 Mar 5;458(7234):97-101. 此研究使用此研究使用454和和Solexa两种高通量测序平两种高通量测序平台对台对前列腺癌前列腺癌细胞系细胞系VcaP和和LNCaP转录组转录组进行测序,以检测和研究前列腺癌细胞系中进行测序

41、,以检测和研究前列腺癌细胞系中基因融合基因融合表达情况。表达情况。 基因融合分析基因融合分析基因嵌合分析流程基因嵌合分析流程 MIPOL1-DGKB 基因融合模式基因融合模式 无参考序列转录组测序案例无参考序列转录组测序案例 Crawford JE, Guelbeogo WM, Sanou A, Traor A, Vernick KD, et al. (2010)De NovoTranscriptome Sequencing inAnopheles funestusUsing Illumina RNA-Seq Technology. PLoS ONE 5(12): e14202. doi:10

42、.1371/journal.pone.0014202 此研究通过对此研究通过对3个个按蚊按蚊样品进行高通量测序样品进行高通量测序,通过拼接组装后,和相近物种进行,通过拼接组装后,和相近物种进行比较基比较基因组学分析因组学分析。 De novo 序列拼接、组装和比对流程拼接结果统计拼接结果统计拼接和变异检测分析流程图拼接和变异检测分析流程图 比较基因组分析比较基因组分析各类功能基因中氨基酸在物种间差异比例各类功能基因中氨基酸在物种间差异比例差异同源蛋白差异同源蛋白GO分类分类进化关系分析进化关系分析 电子表达谱测序电子表达谱测序 对特定处理条件下的全基因组基因表达谱进行分对特定处理条件下的全基因

43、组基因表达谱进行分析,已被广泛用于功能基因组学和医学等研究领析,已被广泛用于功能基因组学和医学等研究领域。域。 电子表达谱测序(电子表达谱测序(Digital Gene Expression, DGE)又称为基因表达标签测序()又称为基因表达标签测序(mRNA tag profiling),其原理是通过两种),其原理是通过两种酶切酶切作用对基因作用对基因中一段长度为中一段长度为21nt的序列标签的序列标签进行测序。由于其进行测序。由于其测序只针对表达的基因进行测序,产生的数据量测序只针对表达的基因进行测序,产生的数据量相对较小,是研究基因表达谱的经济而快速的研相对较小,是研究基因表达谱的经济而

44、快速的研究手段。究手段。 又称又称Tag-SAGE 电子表达谱测序流程图电子表达谱测序流程图NlaIII限制性酶切限制性酶切 电子表达谱分析内容电子表达谱分析内容 图像识别与原始碱基数据读取。图像识别与原始碱基数据读取。 去污染、去接头,标签序列计数统计。去污染、去接头,标签序列计数统计。 基因组比对与统计基因组比对与统计,基因序列比对基因序列比对获得所表达的获得所表达的基因列表基因列表 基因基因差异表达差异表达分析。分析。 聚类与表达类型分析。聚类与表达类型分析。 GO基因富集与分类分析。基因富集与分类分析。 Pathway富集与分类分析。富集与分类分析。 蛋白相互作用网络分析。蛋白相互作用

45、网络分析。 反义链转录本与反义链转录本与新转录本检测新转录本检测。 References Morrissy AS, et al. Next-generation tag sequencing for cancer gene expression profiling. Genome Res. 2009.19 (10): 1825-1835. t Hoen PA, et al. Deep sequencing-based expression analysis shows major advances in robustness, resolution and inter-lab portabil

46、ity over five microarray platforms. Nucleic Acids Res, 2008. 36(21): e141 (1-11).style7 3. Hegedus Z, et al. Deep sequencing of the zebrafish transcriptome response to mycobacterium infection. Mol Immunol, 2009. 46(15): 2918-2930. Audic S and Claverie JM. The significance of digital gene expression

47、profiles. Genome Res.1997. 7(10): 986-995.Zhenhua Jeremy Wu, Clifford A. Meyer, Sibgat Choudhury, et al. Gene expression profiling of human breast tissue samples using SAGE-Seq. Genome Res. 2010. 20:1730-1739AndreaL.Eveland,NamikoSatoh-Nagasawa ,AlexanderGoldshmidt, et al. Digital Gene Expression Si

48、gnatures for Maize Development. Plant Physiol., 2010154:1024-1039Peter Ruzanov and Donald L. Riddle. Deep SAGE analysis of the Caenorhabditis elegans transcriptome. Nucleic Acids Research, 2010, Vol.38, No.10Saurabh Saha, Andrew B. Sparks, Carlo Rago, et al. Using the transcriptome to annotate the g

49、enome. Nature Biotechnology(2002)20, 508 - 512 电子表达谱测序案例分析电子表达谱测序案例分析 Morrissy AS, et al. Next-generation tag sequencing for cancer gene expression profiling. Genome Res. 2009. 19 (10): 1825-1835. 此研究用高通量电子表达谱测序(此研究用高通量电子表达谱测序(Tag-SAGE)和传统)和传统LongSAGE测序方法对癌症测序方法对癌症细胞进行研究,比较两种方法效果,揭示了细胞进行研究,比较两种方法效果,

50、揭示了电子表达谱在基因发现中的诸多优势,可发电子表达谱在基因发现中的诸多优势,可发现更多的基因,减少现更多的基因,减少GC偏好。偏好。 两种方法所检测到的基因数比较两种方法所检测到的基因数比较 GC偏好性和低丰度转录本检测效果偏好性和低丰度转录本检测效果 小小RNA测序测序 小小 RNA是指长度在是指长度在21-31nt的内源性的内源性非蛋白质编码非蛋白质编码RNA,广泛存在于高等和低等生物体内,其对广泛存在于高等和低等生物体内,其对mRNA的转录及转的转录及转录后水平等生命过程起到调节作用。录后水平等生命过程起到调节作用。 现已知小现已知小RNA可归纳成三类:微可归纳成三类:微RNA (mi

51、RNA),小干扰,小干扰RNA(siRNA)和与和与piwi相互作用的相互作用的RNA(piRNA)。 miRNA长度为长度为2124nt,产生于有典型茎环二级结构的原,产生于有典型茎环二级结构的原转录本转录本(pri-miRNA),在动植物的目标,在动植物的目标mRNA的的降解与抑降解与抑制制方面发挥重要作用。方面发挥重要作用。siRNA,长度在,长度在1925nt,产生于,产生于长双链长双链RNA,同样在动植物的目标,同样在动植物的目标mRNA的的降解与抑制降解与抑制方面发挥重要作用。方面发挥重要作用。piRNA,长度,长度2631nt,由与其相互,由与其相互作用的作用的Piwi蛋白定义,

52、目前研究表明其在蛋白定义,目前研究表明其在配子形成配子形成的过程的过程中起作用。中起作用。 小小RNA测序流程图测序流程图 小小RNA测序分析内容测序分析内容 基本分析:基本分析:原始数据读取,去接头、去污染序列,长度原始数据读取,去接头、去污染序列,长度分布统计,基因组比对等。分布统计,基因组比对等。 高级分析:高级分析:Small RNA的分类注释的分类注释miRNA / siRNA / piRNA的鉴定的鉴定新新miRNA预测预测 差异表达差异表达miRNA聚类分析等聚类分析等 References1、Eugene Berezikov, Nicolas Robine, Anastasia

53、 Samsonova, et al. Deep annotation of Drosophila melanogaster microRNAs yields insights into their processing, modification, and emergence. Genome Res. 2011. 21: 203-2152、Mi S, Cai T, Hu Y, Chen Y, Hodges E, et al. (2008) Sorting of Small RNAs into Arabidopsis Argonaute Complexes is Directed by the

54、5 Terminal Nucleotide. Cell.3、Montgomery TA, Howell MD, Cuperus JT, Li D, Hansen JE, et al. (2008) Specificity of ARGONAUTE7-miR390 Interaction and Dual Functionality in TAS3 Trans-Acting siRNA Formation. Cell4、Morin RD, O Connor MD, Griffith M, Kuchenbauer F, Delaney A, et al. (2008) Application of

55、 massively parallel sequencing to microRNA profiling and discovery in human embryonic stem cells. Genome Res.5、Hafner M, Landgraf P, Ludwig J, Rice A, Ojo T, et al. (2008) Identification of microRNAs and other small regulatory RNAs using cDNA library sequencing. Methods 44(1): 3-12. 小小RNA测序案例分析测序案例分

56、析 Eugene Berezikov, Nicolas Robine, Anastasia Samsonova, et al. Deep annotation of Drosophila melanogaster microRNAs yields insights into their processing, modification, and emergence. Genome Res. 2011. 21: 203-215 此研究对黑腹果蝇此研究对黑腹果蝇miRNA进行深度测序,进行深度测序,通过对其测序结果的注释和分析,揭示了黑通过对其测序结果的注释和分析,揭示了黑腹果蝇中腹果蝇中miRN

57、A的的编辑、修饰编辑、修饰等机制。等机制。 果蝇三种组织中果蝇三种组织中MiRNA表达情况表达情况 MiRNA表达模式分析表达模式分析 新新miRNA预测预测 miRNA编辑情况分析与统计编辑情况分析与统计 ChIP-Seq ChIP-Chromatin Immunoprecipitation染染色质免疫共沉淀,是指通过色质免疫共沉淀,是指通过蛋白免疫相互作蛋白免疫相互作用用,用抗体把和染色质相互作用的蛋白,如,用抗体把和染色质相互作用的蛋白,如组蛋白、转录因子等,沉淀下来,从而所获组蛋白、转录因子等,沉淀下来,从而所获取与其相结合的取与其相结合的DNA序列。序列。 ChIP-Seq就是通过高

58、通量测序对就是通过高通量测序对ChIP所得所得到的序列进行测序,从而进行蛋白和到的序列进行测序,从而进行蛋白和DNA相互作用相关研究。相互作用相关研究。 ChIP-Seq测序流程测序流程 ChIP-Seq分析内容分析内容ChIP Sequencing结果与结果与参考基因组参考基因组序列进行序列进行比对比对ChIP Sequencing reads在在全基因组的分布全基因组的分布唯一比对reads在repeats区域的分布唯一比对reads在各基因功能元件上的分布唯一比对reads的全基因组覆盖深度全基因组全基因组peak 扫描扫描peak扫描peak长度分布统计peak的全基因组覆盖度peak

59、在基因功能元件上的分布特征Peak相关基因相关基因分析筛选与分析筛选与GO功能富集分析功能富集分析多个样品的多个样品的差异分析差异分析基于peak相关基因的差异分析基于peak的差异分析 ChIP-Seq分析流程分析流程原始数据数据清理序列比对Peak 扫描Peak相关基因Unique Mapped序列分布分析Peak 分布Genome Browser可视化GO功能分析多个样品的差异分析多个样品的差异分析 ChIP-Seq 分析结果示例分析结果示例 ChIP-Seq分析结果示例分析结果示例 ReferencesJohnson DS, Mortazavi A et al. (2007) Geno

60、me-wide mapping of in vivo proteinDNA interactions. Science 316: 14971502 Jothi et al. (2008) Genome-wide identification of in vivo proteinDNA binding sites from ChIP-Seq data. Nucl Acids Res 36(16) 52215231.Bernstein, BE et al. (2005) Genomic maps and comparative analysis of histonemodifications in

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论