第七章 高通量基因组测序技术介绍11-25(1)_第1页
第七章 高通量基因组测序技术介绍11-25(1)_第2页
第七章 高通量基因组测序技术介绍11-25(1)_第3页
第七章 高通量基因组测序技术介绍11-25(1)_第4页
第七章 高通量基因组测序技术介绍11-25(1)_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高通量测序应用与进展高通量测序应用与进展南京师范大学南京师范大学比较基因组学与生物信息学实验室比较基因组学与生物信息学实验室 纲纲要要 高通量测序简介高通量测序简介 高通量测序平台的介绍高通量测序平台的介绍 高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析 相关生物信息学分析软件介绍相关生物信息学分析软件介绍 高通量测序简介高通量测序简介 高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行并行测序测序,又称为,又称为下一代测序技术下一代测序技术,其使得可对一个物种的转,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称

2、录组和基因组进行深入、细致、全貌的分析,所以又被称为为深度测序深度测序。 High-throughput Sequencing Next Generation Sequencing Deep Sequencing3 高通量测序流程高通量测序流程文库扩增文库扩增低通量低通量A Sanger测序测序 B 高通量测序高通量测序并行测序并行测序高通量高通量无需建立文库,无需建立文库,两端加测序接头两端加测序接头PCR扩增扩增 高通量测序技术的起源与发展高通量测序技术的起源与发展1992年年Lynx Therapeutics MPSS2003年年Polony Sequencing(哈佛)(哈佛)2005

3、年年454 Pyrosequencing2006年年Solexa Sequencing-by-Synthesis2007年年ABI SOLiD2008年年Helicos tSMS Sequencing2010年年Ion torrent Semiconductor Sequensing2011年年Pacific Biosciences SMRT Sequensing5Lynx Therapeutics MPSS极其复极其复杂,没有商业化,杂,没有商业化,2004年并入年并入solexa。Polony seq由哈佛由哈佛George Church实验室开发,使用连接测实验室开发,使用连接测序,后来

4、并入序,后来并入ABI SOLiD平台。平台。454焦磷酸测序由焦磷酸测序由454 Life Sciences开发,是第一个商业化高开发,是第一个商业化高通量测序平台,后被通量测序平台,后被Roche收购收购。Solexa在在lynx MPSS的基础上简的基础上简化开发了化开发了Sequencing by Synthesis,后被,后被Illumina收购。收购。ABI SOLiD在在Polony Seq基础上开发基础上开发了连接测序。了连接测序。Helicos是单分子测是单分子测序,其特点是没有序,其特点是没有PCR扩增过程扩增过程。2010的的Ion torrent和其他的不和其他的不同,

5、不是以荧光进行检测信号同,不是以荧光进行检测信号 高通量测序技术的传承关系图高通量测序技术的传承关系图Lynx MPSSSolexaABI SOLiD454Ion TorrentHelicosSMRTIllumina SolexaRoche 454Polony SeqABI Ion Torrent 现有主要高通量测序仪开发商现有主要高通量测序仪开发商测序仪品牌测序仪品牌技术原理技术原理开发商开发商Roche 454焦磷酸测序焦磷酸测序RocheIllumina Solexa边合成边测序边合成边测序IlluminaABI SOLiD基于磁珠的大规模基于磁珠的大规模并行连接测序并行连接测序ABIH

6、elicos单分子荧光测序单分子荧光测序HelicosIon Torrent半导体测序半导体测序ABISMRT单分子实时测序单分子实时测序Pacific Bio 454 高通量测序法高通量测序法 结合了结合了DNA扩增的乳扩增的乳胶系统(胶系统(emulsion system)和焦磷酸测序的方法和焦磷酸测序的方法, 即一即一种依靠生物发光进行种依靠生物发光进行DNA序列分析的新技术序列分析的新技术; 在在DNA聚合酶聚合酶, ATP硫酸化酶硫酸化酶, 荧光荧光素酶和双磷酸酶的协同作用素酶和双磷酸酶的协同作用下下, 将引物上每一个将引物上每一个dNTP的的聚合与一次荧光信号释放偶聚合与一次荧光信

7、号释放偶联起来联起来 。通过检测荧光信通过检测荧光信号释放的有无和强度号释放的有无和强度, 就可就可以达到实时测定以达到实时测定DNA序列序列的目的。的目的。基本原理基本原理454测序原理测序原理 基于磁珠的焦磷酸测序:基于磁珠的焦磷酸测序:A 磁珠制备设备磁珠制备设备B 454测序仪测序仪 454 测序流程测序流程 将基因组打成较短的将基因组打成较短的DNA片段,再将片段与接头相连,以使其片段,再将片段与接头相连,以使其更容易与磁珠结合在一起。将更容易与磁珠结合在一起。将PCR产物包被于产物包被于“油包水油包水”的乳化剂中,的乳化剂中,每一滴乳化剂内除每一滴乳化剂内除PCR产物外,还含有一个

8、结合了一个产物外,还含有一个结合了一个DNA片段的磁片段的磁珠,这样,珠,这样,PCR扩增过程就可以在每一滴乳化剂内独立进行,而没有扩增过程就可以在每一滴乳化剂内独立进行,而没有其它竞争性或者污染性序列的影响,使整个其它竞争性或者污染性序列的影响,使整个DNA片段进行平行扩增。片段进行平行扩增。454测序测序-DNA样品制备样品制备 扩增反应完成后,每个磁珠上的扩增反应完成后,每个磁珠上的DNA片段拥有了成千上万个相同的片段拥有了成千上万个相同的拷贝。经过富集以后,这些片段仍然和磁珠结合在一起,随后就可以放拷贝。经过富集以后,这些片段仍然和磁珠结合在一起,随后就可以放入到入到PicoTiter

9、Plate板(一种光纤载板)的样品孔内供后继测序使用了。板(一种光纤载板)的样品孔内供后继测序使用了。 在光纤在光纤PicoTiter Plate板样品孔内还有测序过程所需的酶类及引板样品孔内还有测序过程所需的酶类及引物(引物与物(引物与DNA片段末端的接头序列互补),当未经荧光标记的核片段末端的接头序列互补),当未经荧光标记的核苷酸流经过样品孔时,每次只允许一个互补苷酸流经过样品孔时,每次只允许一个互补dNTP接入,进行互补接入,进行互补新链的合成。新链的合成。 每当一个核苷酸连接到新链上时,就会释放一分子的焦磷酸每当一个核苷酸连接到新链上时,就会释放一分子的焦磷酸盐(盐(PPi),而后),

10、而后PPi与相应底物反应形成与相应底物反应形成1分子分子ATP,ATP再驱动再驱动荧光素酶转变为氧化荧光素酶,而氧化荧光素酶可以发出可见光,荧光素酶转变为氧化荧光素酶,而氧化荧光素酶可以发出可见光,可被检测仪器捕获,形成峰图。该技术的序列阅读长度介于可被检测仪器捕获,形成峰图。该技术的序列阅读长度介于100到到150个核苷酸之间。个核苷酸之间。 454测序测序-结果结果 454 的特点与主要应用的特点与主要应用 读长较长,读长较长,400600bp 通量较低,通量较低,1Run 1M 序列,序列,400600Mb 相对成本较高相对成本较高 主要应用:主要应用:de novo测序测序 454 高

11、通量测序法优势高通量测序法优势 该方法是一种结合了一种乳胶材料和皮升级反应孔的焦磷酸该方法是一种结合了一种乳胶材料和皮升级反应孔的焦磷酸盐测序法。它一个典型的反应可以在盐测序法。它一个典型的反应可以在4小时内测出小时内测出2千千5百万个碱百万个碱基,其准确率可达到基,其准确率可达到99。利用。利用Sanger毛细管电泳法测序平均每毛细管电泳法测序平均每个小时可读个小时可读6万万7千个碱基,平均准确率为千个碱基,平均准确率为99.4。事实上,这种新。事实上,这种新的测序方法单个反应的读取碱基数和准确率都不及毛细管电泳的测序方法单个反应的读取碱基数和准确率都不及毛细管电泳法,它之所以能最后平均起来

12、比经典方法强在于普通测序一次只法,它之所以能最后平均起来比经典方法强在于普通测序一次只能利用能利用96孔板进行反应,而这种新型测序所采用的介质玻片上面孔板进行反应,而这种新型测序所采用的介质玻片上面有一百六十万个孔,平均下来自然比传统方法强。有一百六十万个孔,平均下来自然比传统方法强。 Illumina Solexa简介简介 桥式桥式PCR 边合成边测序边合成边测序 可逆终止物可逆终止物HiSeq 2000 Illumina Solexa 测序流程测序流程Randomly fragment genomic DNA and ligateadapters to both ends of the f

13、ragments.Bind single-stranded fragments randomly to the inside surface of the flow cell channels.Add unlabeled nucleotides and enzyme to initiate solid-phase bridge amplification.4. Fragments Become Double Stranded5. Denature The Double- stranded Molecules6. Complete AmplificationThe enzyme incorpor

14、ates nucleotides to build doublestranded bridges on the solid-phase substrate.Denaturation leaves single-stranded templates anchored to the substrate.Several million dense clusters of double stranded DNA are generated in each channel of the flow cell.First chemistry cycle: to initiate the first sequ

15、encingcycle, add all four labeled reversible terminators, primers and DNA polymeraseenzyme to the flow cell.After laser excitation, capture the image of emitted fluorescencefrom each cluster on the flow cell. Record the identity of the first base for each cluster.Second chemistry cycle: to initiate

16、the next sequencing cycle, add all four labeled reversible terminators and enzyme to the flow cell. Illumina Solexa 测序流程测序流程After laser excitation, collect the image data as before. Record the identity of the second base for each cluster.Repeat cycles of sequencing to determine the sequence of bases

17、 in a given fragmenta single base at at time.Align data, compare to a reference, and identify sequence differences. Illumina Solexa 桥式桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldioldioldio

18、ldiol2nd cycle extension Illumina Solexa Base Calling123789456T T T T T T T G T T G C T A C G A T Solexa 的特点与主要应用的特点与主要应用 读长较短,读长较短,100150bp 通量高,通量高,25G每天,每天,120-150G每每Run 主要应用:主要应用:RNA测序、表观遗传学研究测序、表观遗传学研究 Solexa 的这种方法,可在一个反应中同时加入的这种方法,可在一个反应中同时加入4 种核种核苷的标签,采用边合成边测序(苷的标签,采用边合成边测序( SBS sequencing by

19、synthesis ),可减少因二级结构造成的一段区域的缺失。并),可减少因二级结构造成的一段区域的缺失。并具有所需样品量少,高通量,高精确性,拥有简单易操作的具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点,此反应可以同时检测上亿个自动化平台和功能强大等特点,此反应可以同时检测上亿个核苷酸片断核苷酸片断 , 因此在同一个芯片或几个芯片上花费很少(只因此在同一个芯片或几个芯片上花费很少(只需常规方法的需常规方法的 1 )的成本就可测试全基因组。)的成本就可测试全基因组。SolexaSolexa方法的优点方法的优点 ABI SOLiD 简介简介 SOLiDSeque

20、ncing by Oligo Ligation/Detection Oligo连接测序:通过连接酶连接,再对连接测序:通过连接酶连接,再对oligo上荧上荧光基团进行检测光基团进行检测SOLiD 5500 xl ABI SOLiD测序前期制备测序前期制备A 样品片段化样品片段化磁珠连接磁珠连接B 乳化乳化PCR3末端修饰末端修饰C 磁珠富集磁珠富集转到测序玻片转到测序玻片 ABI SOLiD测序原理测序原理 ABI SOLiD荧光结合和结果示例荧光结合和结果示例SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111

21、302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!4626=(8.)43),(95,A. SOLiD Oligo荧光基团模式图荧光基团模式图B. SOLiD 测序结果示例(测序结果示例(Color Space) SOLiD 的特点与主要应用的特点与主要应用 读长较短,读长较短,50-75bp 精度高,可达精度高,可达Q40 通量高,通量高, 20-30G每天,每天,1Run 可达可达120G 主要应用:基因组重测序、主要应用:基因组重测序、SNP检测等检测等 三种平台的技术差异三种平台的技术差异平台平台454SolexaS

22、OLiDPCR磁珠乳化磁珠乳化PCR桥式桥式PCR磁珠乳化磁珠乳化PCR测序载体测序载体磁珠磁珠玻片玻片玻片玻片测序方式测序方式焦磷酸、荧光焦磷酸、荧光可逆终止物可逆终止物、荧光、荧光连接酶、荧光连接酶、荧光结果序列结果序列FastQFastQCSFastQ 三种平台的效能参数差异三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度Solexa HiSeq2000Single-end: 1 x 35 bpPaired-end: 2 x 50 bpPaired-end: 2 x 100 bp25 Gb/d1.5d4d8d50 bp 85%以上以上Q30100 bp 80%以上以上Q3

23、0SOLiD 5500 xlSingle-end: 75 bpPaired-end: 75 x 35 bpMate-pair: 60 x 60 bp20 30 Gb/d1d/ 1lane7d/ 12 lane7d/ 12 laneQ40454 GS FLX400 - 600 bp400 600 Mb/Run10hQ20 高通量测序应用范围高通量测序应用范围DNA测序测序全基因组全基因组de novo测序测序基因组重测序基因组重测序宏基因组测序宏基因组测序人类外显子组捕获测序人类外显子组捕获测序RNA测序测序转录组测序转录组测序小小RNA测序测序电子表达谱测序电子表达谱测序表观基因组研究表观基因

24、组研究ChIP-SeqDNA甲基化测序甲基化测序 基因组测序基因组测序基因组测序是对物种的基因组基因组测序是对物种的基因组DNA打断后进行高通量测序,根打断后进行高通量测序,根据是否有已知基因组数据主要分为据是否有已知基因组数据主要分为de novo全基因组测序和全基因组测序和基因基因组重测序组重测序。De novo 基因组测序是对基因组测序是对未知基因组序列未知基因组序列的物种进行基因组从的物种进行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组图谱。而获得该物种的基因组图谱。全基因组重测序是对全基因组重

25、测序是对已知基因组序列已知基因组序列的物种进行不同个体的基的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。因组测序,并在此基础上对个体或群体进行差异性分析。 基因组测序策略基因组测序策略Paired-EndMate-End基因组测序流程两种测序策略基因组测序流程两种测序策略 Paired-end 原理原理35100bps100bps3000bps Paired-end 基因组重排分析基因组重排分析 基因组测序的生物信息学分析基因组测序的生物信息学分析 数据产出处理数据产出处理:图像识别与:图像识别与Base Calling去除接头序列、去除接头序列、检测与去除污染序列等

26、;检测与去除污染序列等; 基因组组装基因组组装:原始数据统计、测序深度分析、组装结果统:原始数据统计、测序深度分析、组装结果统计等;计等; 基因组注释基因组注释:Coding Gene注释、注释、RNA分类注释、重复序分类注释、重复序列注释等;列注释等; 基因功能注释基因功能注释:GO功能分类、功能分类、Interpro功能分类等;功能分类等; 比较基因组及分子进化分析比较基因组及分子进化分析:SNP/InDel/CNV检测等。检测等。 基因组重测序案例分析基因组重测序案例分析 Erin D. Pleasance, et al. The compendium of somatic mutati

27、ons in a small-cell lung cancer genome. Nature, 2010, 463:184-190. 此研究用高通量测序对一个此研究用高通量测序对一个小细胞肺癌小细胞肺癌细胞系细胞系NCIH209基因组进行重测序,以探讨吸烟引发该细胞系基因组中特基因组进行重测序,以探讨吸烟引发该细胞系基因组中特定碱基及其周围序列的突变及细胞损伤修复原理。定碱基及其周围序列的突变及细胞损伤修复原理。 肺癌基因组变异情况统计图肺癌基因组变异情况统计图 基因组重排和基因组重排和CNV分析分析 从头基因组测序案例从头基因组测序案例David Hernandez, et al. De n

28、ovo bacterial genome sequencing: Millions of very short reads assembled on a desktop computer. Genome Res. 2008.18: 802-809 此研究对此研究对Staphylococcus aureus strain MW2和和Helicobacter acinonychis strain Sheeba两种细菌基因组进两种细菌基因组进行从头测序,并比较了几种拼接方法的效果。行从头测序,并比较了几种拼接方法的效果。 多种拼接软件拼接结果比较多种拼接软件拼接结果比较 多种拼接软件拼接结果比较多种

29、拼接软件拼接结果比较多种拼接方法的拼接结果比对多种拼接方法的拼接结果比对 宏基因组测序宏基因组测序 宏基因组测序是对某一特定环境,如肠道、土壤、海水等宏基因组测序是对某一特定环境,如肠道、土壤、海水等中的所有微生物进行基因组测序。通过此方法可对该环境中的所有微生物进行基因组测序。通过此方法可对该环境中的微生物种类和优势物种进行检测,揭示微生物群落多中的微生物种类和优势物种进行检测,揭示微生物群落多样性、种群结构、进化关系、功能活性、相互协作关系及样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系与环境之间的关系 。自然环境中很多微生物无法分离培养。自然环境中很多微生物无法分离培

30、养,而此方法无需对微生物进行分离培养。,而此方法无需对微生物进行分离培养。 宏基因组测序方法现在有全基因组的宏基因组测序和宏基因组测序方法现在有全基因组的宏基因组测序和16S/18S rRNA宏基因组测序。宏基因组测序。 全基因组的宏基因组测序全基因组的宏基因组测序 通过高通量测序技术,对环境样品的总通过高通量测序技术,对环境样品的总 DNA 直接进行全直接进行全基因组的宏基因组测序,能够实现微生物群落的物种分类基因组的宏基因组测序,能够实现微生物群落的物种分类研究、群落结构、系统进化、功能注释以及物种间的代谢研究、群落结构、系统进化、功能注释以及物种间的代谢网络研究,挖掘具有应用价值的基因资

31、源,开发新的微生网络研究,挖掘具有应用价值的基因资源,开发新的微生物活性物质。与传统的物活性物质。与传统的 Sanger法相比,速度快,性价比高法相比,速度快,性价比高,周期短,单个样品的测序量可以接近饱和。,周期短,单个样品的测序量可以接近饱和。 宏基因组测序信息分析主要内容宏基因组测序信息分析主要内容 拼接组装拼接组装 物种分类组成分析物种分类组成分析 基因预测和功能注释基因预测和功能注释 生成生成Profiling table 主成分分析(主成分分析(PCA) 筛选与样品分组显著相关的因子筛选与样品分组显著相关的因子 多样品间比较分析多样品间比较分析 16S/18S rRNA宏基因组测序

32、宏基因组测序 16S/18S rRNA是微生物群落分析和细菌进化研究是微生物群落分析和细菌进化研究以及分类研究最常用的靶分子,采用新一代测序以及分类研究最常用的靶分子,采用新一代测序技术,对技术,对16S/18S rDNA的可变区进行测序分析,的可变区进行测序分析,不需进行克隆筛选,能全面的反映微生物群体的不需进行克隆筛选,能全面的反映微生物群体的物种组成,真实的物种分布及丰度信息。物种组成,真实的物种分布及丰度信息。 16S/18S rRNA测序信息分析内容测序信息分析内容 物种分类、物种丰度分析物种分类、物种丰度分析 OTU(Operational Taxonomic Units )分析)

33、分析 多样性分析多样性分析 系统进化分析系统进化分析 多样品间的比较分析多样品间的比较分析 人类外显子组捕获测序人类外显子组捕获测序 外显子组是指全部外显子组是指全部外显子区域外显子区域的集合,该区域包的集合,该区域包含合成蛋白质所需要的重要信息,涵盖了与个体含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的表型相关的大部分功能性变异大部分功能性变异。 与全基因组重测序相比,外显子组测序只需与全基因组重测序相比,外显子组测序只需针对外显子区域的针对外显子区域的DNA,覆盖度覆盖度更深、数据更深、数据准确准确性性更高,更加简便、更高,更加简便、经济经济、高效。、高效。49 人类外显子组捕获测序

34、原理人类外显子组捕获测序原理 人类外显子组捕获测序分析流程人类外显子组捕获测序分析流程 检测序列变异分析示例检测序列变异分析示例检测到检测到SNP数统计数统计序列序列InDel检测检测 人类外显子组捕获测序案例人类外显子组捕获测序案例 Wei X, Walia V, et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma. Nat Genet. 2011 Apr 15. Epub ahead of print 黑色素瘤黑色素瘤发生率一直在上升,此研究对黑色素瘤发生率一直在上升,此研究对黑色素瘤细胞进

35、行外显子组捕获测序,发现了和其相关的细胞进行外显子组捕获测序,发现了和其相关的高频突变基因高频突变基因。 七个新发现的非同义高频突变位点七个新发现的非同义高频突变位点 单个基因中突变位点分析单个基因中突变位点分析基因基因GRIN2A模式图,箭头表示突变位点模式图,箭头表示突变位点 转录组测序简介转录组测序简介转录组即特定细胞在某一功能状态下所能转录出来的所有转录组即特定细胞在某一功能状态下所能转录出来的所有RNA的总和,的总和,包括包括mRNA和非编码和非编码RNA(Non-coding RNA)。 第二代测序系统可精确检测单个碱基,并且不受到研究中先验信息第二代测序系统可精确检测单个碱基,并

36、且不受到研究中先验信息的干扰,科研人员能够快速地获得某一物种特定器官或组织在某一状态下的干扰,科研人员能够快速地获得某一物种特定器官或组织在某一状态下几乎所有几乎所有mRNA转录本序列,从而能够开展:转录本序列,从而能够开展:UTRs区域界定区域界定、可变剪切可变剪切研究研究、低丰度新转录本发现低丰度新转录本发现、融合基因鉴定融合基因鉴定、cSNP(编码序列单核苷酸(编码序列单核苷酸多态性)研究等。多态性)研究等。 转录组测序测序流程转录组测序测序流程全转录组总全转录组总RNApolyT富集富集mRNA去除去除rRNANon-coding RNA转录组转录组mRNARNA片段化、纯化、检测产量

37、片段化、纯化、检测产量连接两端接头序列连接两端接头序列逆转录生成逆转录生成cDNA选择适当长度选择适当长度cDNA进行扩增进行扩增纯化扩增产物,评估产量纯化扩增产物,评估产量上机进行高通量测序上机进行高通量测序 转录组测序测序流程转录组测序测序流程无参考序列测序流程无参考序列测序流程有参考序列测序流程有参考序列测序流程 转录组主要分析内容转录组主要分析内容无参考序列无参考序列转录组分析内容转录组分析内容有参考序列有参考序列转录组分析内容转录组分析内容1 测序数据产量统计,数据成分和测序数据产量统计,数据成分和质量评估;质量评估;2 Contig及及Scaffold长度分布长度分布3 Unige

38、ne的的长度分布长度分布和和功能注释功能注释,GO分类,分类,Pathway分析,差异表分析,差异表达分析达分析4 蛋白功能预测与分类,蛋白功能预测与分类,差异表达差异表达基因基因GO富集和富集和 Pathway富集分析。富集分析。 1 基本数据统计,基本数据统计,比对参考序列比对参考序列2 序列在序列在基因组上基因组上的的分布分布3 测序测序深度深度分析、随机性评估和分析、随机性评估和基因基因差异表达差异表达分析分析4 新基因新基因预测,基因预测,基因可变剪接可变剪接鉴鉴定和定和基因融合基因融合鉴定等。鉴定等。 有参考序列转录组测序案例有参考序列转录组测序案例 Maher CA, Kumar

39、-Sinha C, Cao X, et al. Transcriptome sequencing to detect gene fusions in cancer. Nature, 2009 Mar 5;458(7234):97-101. 此研究使用此研究使用454和和Solexa两种高通量测序平台对两种高通量测序平台对前前列腺癌列腺癌细胞系细胞系VcaP和和LNCaP转录组进行测序,以转录组进行测序,以检测和研究前列腺癌细胞系中检测和研究前列腺癌细胞系中基因融合基因融合表达情况。表达情况。 基因融合分析基因融合分析基因嵌合分析流程基因嵌合分析流程 MIPOL1-DGKB 基因融合模式基因融合

40、模式 无参考序列转录组测序案例无参考序列转录组测序案例 Crawford JE, Guelbeogo WM, Sanou A, Traor A, Vernick KD, et al. (2010) De NovoTranscriptome Sequencing in Anopheles funestus Using Illumina RNA-Seq Technology. PLoS ONE 5(12): e14202. doi:10.1371/journal.pone.0014202 此研究通过对此研究通过对3个个按蚊按蚊样品进行高通量测序,通过样品进行高通量测序,通过拼接组装后,和相近物种进

41、行拼接组装后,和相近物种进行比较基因组学分析比较基因组学分析。 De novo 序列拼接、组装和比对流程序列拼接、组装和比对流程拼接结果统计拼接结果统计拼接和变异检测分析流程图拼接和变异检测分析流程图 比较基因组分析比较基因组分析各类功能基因中氨基酸在物种间差异比例各类功能基因中氨基酸在物种间差异比例差异同源蛋白差异同源蛋白GO分类分类进化关系分析进化关系分析 电子表达谱测序电子表达谱测序 对特定处理条件下的全基因组基因表达谱进行分析,已被对特定处理条件下的全基因组基因表达谱进行分析,已被广泛用于功能基因组学和医学等研究领域。广泛用于功能基因组学和医学等研究领域。 电子表达谱测序(电子表达谱测

42、序(Digital Gene Expression, DGE)又称为)又称为基因表达标签测序(基因表达标签测序(mRNA tag profiling),其原理是通),其原理是通过两种酶切作用对基因中一段长度为过两种酶切作用对基因中一段长度为21nt的序列标签进行的序列标签进行测序。由于其测序只针对表达的基因进行测序,产生的数测序。由于其测序只针对表达的基因进行测序,产生的数据量相对较小,是研究基因表达谱的经济而快速的研究手据量相对较小,是研究基因表达谱的经济而快速的研究手段。段。 又称又称Tag-SAGE 电子表达谱测序流程图电子表达谱测序流程图NlaIII限制性酶切限制性酶切 电子表达谱分析

43、内容电子表达谱分析内容图像识别与原始碱基数据读取。图像识别与原始碱基数据读取。去污染、去接头,标签序列计数统计。去污染、去接头,标签序列计数统计。基因组比对与统计基因组比对与统计,基因序列比对基因序列比对获得所表达的获得所表达的基因列表基因列表基因基因差异表达差异表达分析。分析。聚类与表达类型分析。聚类与表达类型分析。GO基因富集与分类分析。基因富集与分类分析。Pathway富集与分类分析。富集与分类分析。蛋白相互作用网络分析。蛋白相互作用网络分析。反义链转录本与反义链转录本与新转录本检测新转录本检测。 电子表达谱测序案例分析电子表达谱测序案例分析 Morrissy AS, et al. Ne

44、xt-generation tag sequencing for cancer gene expression profiling. Genome Res. 2009. 19 (10): 1825-1835. 此研究用高通量电子表达谱测序(此研究用高通量电子表达谱测序(Tag-SAGE)和)和传统传统LongSAGE测序方法对癌症细胞进行研究,测序方法对癌症细胞进行研究,比较两种方法效果,揭示了电子表达谱在基因发比较两种方法效果,揭示了电子表达谱在基因发现中的诸多优势,可发现更多的基因,减少现中的诸多优势,可发现更多的基因,减少GC偏偏好。好。 两种方法所检测到的基因数比较两种方法所检测到的基

45、因数比较 小小RNA测序测序小小 RNA是指长度在是指长度在21-31nt的内源性非蛋白质编码的内源性非蛋白质编码RNA,广泛存在于,广泛存在于高等和低等生物体内,其对高等和低等生物体内,其对mRNA的转录及转录后水平等生命过程起的转录及转录后水平等生命过程起到调节作用。到调节作用。现已知小现已知小RNA可归纳成三类:微可归纳成三类:微RNA (miRNA),小干扰,小干扰RNA(siRNA)和与和与piwi相互作用的相互作用的RNA(piRNA)。miRNA长度为长度为2124nt,产生于有典型茎环二级结构的原转录本,产生于有典型茎环二级结构的原转录本(pri-miRNA),在动植物的目标,

46、在动植物的目标mRNA的降解与抑制方面发挥重要作用。的降解与抑制方面发挥重要作用。siRNA,长度在,长度在1925nt,产生于长双链,产生于长双链RNA,同样在动植物的目标,同样在动植物的目标mRNA的降解与抑制方面发挥重要作用。的降解与抑制方面发挥重要作用。piRNA,长度,长度2631nt,由与,由与其相互作用的其相互作用的Piwi蛋白定义,目前研究表明其在配子形成的过程中起蛋白定义,目前研究表明其在配子形成的过程中起作用。作用。 小小RNA测序流程图测序流程图 小小RNA测序分析内容测序分析内容 基本分析:基本分析:原始数据读取,去接头、去污染序列,长度分布统计,基原始数据读取,去接头

47、、去污染序列,长度分布统计,基因组比对等。因组比对等。 高级分析:高级分析:Small RNA的分类注释的分类注释miRNA / siRNA / piRNA的鉴定的鉴定新新miRNA预测预测 差异表达差异表达miRNA聚类分析等聚类分析等 小小RNA测序案例分析测序案例分析 Eugene Berezikov, Nicolas Robine, Anastasia Samsonova, et al. Deep annotation of Drosophila melanogaster microRNAs yields insights into their processing, modifica

48、tion, and emergence. Genome Res. 2011. 21: 203-215 此研究对黑腹果蝇此研究对黑腹果蝇miRNA进行深度测序,通过对其测序结进行深度测序,通过对其测序结果的注释和分析,揭示了黑腹果蝇中果的注释和分析,揭示了黑腹果蝇中miRNA的的编辑、修饰编辑、修饰等机制。等机制。 果蝇三种组织中果蝇三种组织中MiRNA表达情况表达情况 MiRNA表达模式分析表达模式分析 新新miRNA预测预测 miRNA编辑情况分析与统计编辑情况分析与统计 ChIP-Seq ChIP-Chromatin Immunoprecipitation染色质免疫染色质免疫共沉淀,是指通

49、过蛋白免疫相互作用,用抗体把共沉淀,是指通过蛋白免疫相互作用,用抗体把和染色质相互作用的蛋白,如组蛋白、转录因子和染色质相互作用的蛋白,如组蛋白、转录因子等,沉淀下来,从而所获取与其相结合的等,沉淀下来,从而所获取与其相结合的DNA序序列。列。 ChIP-Seq就是通过高通量测序对就是通过高通量测序对ChIP所得到的序所得到的序列进行测序,从而进行蛋白和列进行测序,从而进行蛋白和DNA相互作用相关相互作用相关研究。研究。 ChIP-Seq测序流程测序流程 ChIP-Seq分析内容分析内容ChIP Sequencing结果与参考基因组序列进行比对结果与参考基因组序列进行比对ChIP Sequen

50、cing reads 在全基因组的分布在全基因组的分布唯一比对唯一比对reads 在在repeats 区域的分布区域的分布唯一比对唯一比对reads 在各基因功能元件上的分布在各基因功能元件上的分布唯一比对唯一比对reads 的全基因组覆盖深度的全基因组覆盖深度全基因组全基因组peak 扫描扫描peak 扫描扫描peak 长度分布统计长度分布统计peak 的全基因组覆盖度的全基因组覆盖度peak 在基因功能元件上的分布特征在基因功能元件上的分布特征Peak相关基因分析筛选与相关基因分析筛选与GO功能富集分析功能富集分析多个样品的差异分析多个样品的差异分析基于基于peak 相关基因的差异分析相关

51、基因的差异分析基于基于peak 的差异分析的差异分析 ChIP-Seq分析流程分析流程原始数据原始数据数据清理数据清理序列比对序列比对Peak 扫描扫描Peak相关基因相关基因Unique Mapped序列分布分析序列分布分析Peak 分布分布Genome Browser可视化可视化GO功能分析功能分析多个样品的差异分析多个样品的差异分析 ChIP-Seq 分析结果示例分析结果示例 ChIP-Seq分析结果示例分析结果示例 DNA甲基化测序甲基化测序 DNA甲基化对甲基化对机体发育和基因表达机体发育和基因表达有很重要的调控作用,有很重要的调控作用,和各种和各种癌症的发生和发展癌症的发生和发展也有很大相关性,所以对基因组也有很大相关性,所以对基因组DNA甲基化进行研究是一直来的热门课题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论