三代基因组测序技术原理简介_第1页
三代基因组测序技术原理简介_第2页
三代基因组测序技术原理简介_第3页
三代基因组测序技术原理简介_第4页
三代基因组测序技术原理简介_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十数年时间,测序技术已获得了相称大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。即使就现在形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药品研发,育种等领域产生巨大的推动作用。在这里我重要对现在的测序技术以及它们的测序原理做一种简朴的小结。图1:测序技术的发展历程生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义。以上(图1)所描述的是自沃森和克里克在1953年建立DNA双螺旋构造以来,整个测序技术的发展历程。第一代测序技术第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解).并在1977年,桑格测定了第一种基因组序列,是噬菌体X174的,全长5375个碱基1。自此,人类获得了窥探生命遗传差别本质的能力,并以此为开端步入基因组学时代。研究人员在Sanger法的数年实践之中不停对其进行改善。在,完毕的首个人类基因组图谱就是以改善了的Sanger法为其测序基础,Sanger法核心原理是:由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此能够用来中断DNA合成反映,在4个DNA合成反映体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后能够根据电泳带的位置拟定待测分子的DNA序列(图2)。这个网址为sanger测序法制作了一种小短片,形象而生动。值得注意的是,就在测序技术起步发展的这一时期中,除了Sanger法之外还出现了某些其它的测序技术,如焦磷酸测序法、链接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序办法2–4,而连接酶测序法是后来ABI公司SOLID技术使用的测序办法2,4,但他们的共同核心手段都是运用了Sanger1中的可中断DNA合成反映的dNTP。

图2:Sanger法测序原理第二代测序技术总的说来,第一代测序技术的重要特点是测序读长可达1000bp,精确性高达%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是最抱负的测序办法。通过不停的技术开发和改善,以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为标记的第二代测序技术诞生了。第二代测序技术大大减少了测序成本的同时,还大幅提高了测序速度,并且保持了高精确性,以前完毕一种人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但在序列读长方面比起第一代测序技术则要短诸多。表1和图3对第一代和第二代测序技术各自的特点以及测序成本作了一种简朴的比较5,下列我将对这三种重要的第二代测序技术的重要原理和特点作一种简朴的介绍。

图3.测序成本的变化IllumineIllumina公司的Solexa和Hiseq应当说是现在全球使用量最大的第二代测序机器,这两个系列的技术核心原理是相似的2,4。这两个系列的机器采用的都是边合成边测序的办法,它的测序过程重要分为下列4步,如图4.

(1)DNA待测文库构建运用超声波把待测的DNA样本打断成小片段,现在除了组装之外和某些其它的特殊规定之外,重要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。

(2)FlowcellFlowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有诸多接头,这些接头能和建库过程中加在DNA片段两端的接头互相配对(这就是为什么flowcell能吸附建库后的DNA的因素),并能支持DNA在其表面进行桥式PCR的扩增。

(3)桥式PCR扩增与变性桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增,如图所示。通过不停的扩增和变性循环,最后每个DNA片段都将在各自的位置上集中成束,每一种束都含有单个DNA模板的诸多分拷贝,进行这一过程的目的在于实现将碱基的信号强度放大,以达成测序所需的信号规定。

(4)测序测序办法采用边合成边测序的办法。向反映体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4中dNTP(犹如Sanger测序法)。这些dNTP的3’-OH被化学办法所保护,因而每次只能添加一种dNTP。在dNTP被添加到合成链上后,全部未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完毕荧光信号的统计,最后运用计算机分析将光学信号转化为测序碱基。这样荧光信号统计完毕后,再加入化学试剂淬灭荧光信号并去除dNTP3’-OH保护基团,方便能进行下一轮的测序反映。Illumina的这种测序技术每次只添加一种dNTP的特点能够较好的地解决同聚物长度的精确测量问题,它的重要测序错误来源是碱基的替代,现在它的测序错误率在1%%之间,测序周期以人类基因组重测序为例,30x测序深度大概为1周。

图4.Illumina测序流程Roche454Roche454测序系统是第一种商业化运行二代测序技术的平台。它的重要测序原理是(图5abc)2:(1)DNA文库制备454测序系统的文献构建方式和illumina的不同,它是运用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测DNA变性后用杂交引物进行PCR扩增,连接载体,构建单链DNA文库(图5a)。(2)EmulsionPCR(乳液PCR,其实是一种注水到油的独特过程)454固然DNA扩增过程也和illumina的截然不同,它将这些单链DNA结合在水油包被的直径约28um的磁珠上,并在其上面孵育、退火。乳液PCR最大的特点是能够形成数目庞大的独立反映空间以进行DNA扩增。其核心技术是“注水到油”(水包油),基本过程是在PCR反映前,将包含PCR全部反映成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反映空间。抱负状态下,每个小水滴只含一种DNA模板和一种磁珠。这些被小水滴包被的磁珠表面含有与接头互补的DNA序列,因此这些单链DNA序列能够特异地结合在磁珠上。同时孵育体系中含有PCR反映试剂,因此确保了每个与磁珠结合的小片段都能独立进行PCR扩增,并且扩增产物仍能够结合到磁珠上。当反映完毕后,能够破坏孵育体系并将带有DNA的磁珠富集下来。进过扩增,每个小片段都将被扩增约100万倍,从而达成下一步测序所规定的DNA量。(3)焦磷酸测序测序前需要先用一种聚合酶和单链结合蛋白解决带有DNA的磁珠,接着将磁珠放在一种PTP平板上。这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一种磁珠,通过这种办法来固定每个磁珠的位置,方便检测接下来的测序反映过程。测序办法采用焦磷酸测序法,将一种比PTP板上小孔直径更小的磁珠放入小孔中,启动测序反映。测序反映以磁珠上大量扩增出的单链DNA为模板,每次反映加入一种dNTP进行合成反映。如果dNTP能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团会与反映体系中的ATP硫酸化学酶反映生成ATP。生成的ATP和荧光素酶共同氧化使测序反映中的荧光素分子并发出荧光,同时由PTP板另一侧的CCD摄影机统计,最后通过计算机进行光信号解决而获得最后的测序成果。由于每一种dNTP在反映中产生的荧光颜色不同,因此能够根据荧光的颜色来判断被测分子的序列。反映结束后,游离的dNTP会在双磷酸酶的作用下降解ATP,从而造成荧光淬灭,方便使测序反映进入下一种循环。由于454测序技术中,每个测序反映都在PTP板上独立的小孔中进行,因而能大大减少互相间的干扰和测序偏差。454技术最大的优势在于其能获得较长的测序读长,现在454技术的平均读长可达400bp,并且454技术和illumina的Solexa和Hiseq技术不同,它最重要的一种缺点是无法精确测量同聚物的长度,如当序列中存在类似于PolyA的状况时,测序反映会一次加入多个T,而所加入的T的个数只能通过荧光强度推测获得,这就有可能造成成果不精确。也正是由于这一因素,454技术会在测序过程中引入插入和缺失的测序错误。

图5.Roche454测序流程

Solid技术Solid测序技术是ABI公司于开始投入用于商业测序应用的仪器。它基于连接酶法,即运用DNA连接酶在连接过程之中测序(图6)2,4。它的原理是:

图6-a.Solid测序技术(1)DNA文库构建

片段打断并在片段两端加上测序接头,连接载体,构建单链DNA文库。

(2)EmulsionPCRSolid的PCR过程也和454的办法类似,同样采用小水滴emulsionPCR,但这些微珠比起454系统来说则要小得多,只有1um。在扩增的同时对扩增产物的3’端进行修饰,这是为下一步的测序过程作的准备。3’修饰的微珠会被沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域(图6-a)。Solid系统最大的优点就是每张玻片能容纳比454更高密度的微珠,在同一系统中轻松实现更高的通量。

(3)连接酶测序这一步是Solid测序的独特之处。它并没有采用以前测序时所惯用的DNA聚合酶,而是采用了连接酶。Solid连接反映的底物是8碱基单链荧光探针混合物,这里将其简朴表达为:3’-XXnnnzzz-5’。连接反映中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、TexasRed、CY3、6-FAM这4种颜色的荧光染料(图6-a)。这个8碱基单链荧光探针中,第1和第2位碱基(XX)上的碱基是拟定的,并根据种类的不同在6-8位(zzz)上加上了不同的荧光标记。这是Solid的独特测序法,两个碱基拟定一种荧光信号,相称于一次能决定两个碱基。这种测序办法也称之为两碱基测序法。当荧光探针能够与DNA模板链配对而连接上时,就会发出代表第1,2位碱基的荧光信号,图6-a和图6-b中的比色版所示的是第1,2位碱基的不同组合与荧光颜色的关系。在统计下荧光信号后,通过化学办法在第5和第6位碱基之间进行切割,这样就能移除荧光信号,方便进行下一种位置的测序。但是值得注意的是,通过这种测序办法,每次测序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在测到末尾后,要将新合成的链变性,洗脱。接着用引物n-1进行第二轮测序。引物n-1与引物n的区别是,两者在与接头配对的位置上相差一种碱基(图6-a.8)。也即是,通过引物n-1在引物n的基础上将测序位置往3’端移动一种碱基位置,因而就能测定第0、1位和第5、6位……第二轮测序完毕,依这类推,直至第五轮测序,最后能够完毕全部位置的碱基测序,并且每个位置的碱基均被检测了两次。该技术的读长在2×50bp,后续序列拼接同样比较复杂。由于双次检测,这一技术的原始测序精确性高达%,而15x覆盖率时的精确性更是达成了%,应当说是现在第二代测序技术中精确性最高的了。但在荧光解码阶段,鉴于其是双碱基拟定一种荧光信号,因而一旦发生错误就容易产生连锁的解码错误。

图6-b.Solid测序技术第三代测序技术测序技术在近两三年中又有新的里程碑。以PacBio公司的SMRT和OxfordNanoporeTechnologies纳米孔单分子测序技术,被称之为第三代测序技术。与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。其中PacBioSMRT技术其实也应用了边合成边测序的思想5,并以SMRT芯片为测序载体。基本原理是:DNA聚合酶和模板结合,4色荧光标记4种碱基(即是dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。同时这个DNA聚合酶是实现超长读长的核心之一,读长重要跟酶的活性保持有关,它重要受激光对其造成的损伤所影响。PacBioSMRT技术的一种核心是如何将反映信号与周边游离碱基的强大荧光背景区别出来。他们运用的是ZMW(零模波导孔)原理:犹如微波炉壁上可看到的诸多密集小孔。小孔直径有讲究,如果直径不不大于微波波长,能量就会在衍射效应的作用下穿透面板而泄露出来,从而与周边小孔互相干扰。如果孔径不大于波长,能量不会辐射到周边,而是保持直线状态(光衍射的原理),从而可起保护作用。同理,在一种反映管(SMRTCell:单分子实时反映孔)中有许多这样的圆形纳米小孔,即ZMW(零模波导孔),外径100多纳米,比检测激光波长小(数百纳米),激光从底部打上去后不能穿透小孔进入上方溶液区,能量被限制在一种小范畴(体积20X10-21L)里,正好足够覆盖需要检测的部分,使得信号仅来自这个小反映区域,孔外过多游离核苷酸单体仍然留在黑暗中,从而实现将背景降到最低。另外,能够通过检测相邻两个碱基之间的测序时间,来检测某些碱基修饰状况,既如果碱基存在修饰,则通过聚合酶时的速度会减慢,相邻两峰之间的距离增大,能够通过这个来之间检测甲基化等信息(图7)。SMRT技术的测序速度很快,每秒约10个dNTP。但是,同时其测序错误率比较高(这几乎是现在单分子测序技术的通病),达成15%,但好在它的出错是随机的,并不会像第二代测序技术那样存在测序错误的偏向,因而能够通过多次测序来进行有效的纠错。

图SMRT测序原理OxfordNanoporeTechnologies公司所开发的纳米单分子测序技术与以往的测序技术皆不同,它是基于电信号而不是光信号的测序技术5。该技术的核心之一是,他们设计了一种特殊的纳米孔,孔内共价结合有分子接头。当DNA碱基通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),敏捷的电子设备检测到这些变化从而鉴定所通过的碱基(图8)。该公司在去年基因组生物学技术进展年会(AGBT)上推出第一款商业化的纳米孔测序仪,引发了科学界的极大关注。纳米孔测序(和其它第三代测序技术)有望解决现在测序平台的局限性,纳米孔测序的重要特点是:读长很长,大概在几十kb,甚至100kb;错误率现在介于1%至4%,且是随机错误,而不是聚集在读取的两端;数据可实时读取;通量很高(30x人类基因组有望在一天内完毕);起始DNA在测序过程中不被破坏;以及样品制备简朴又便宜。理论上,它也能直接测序RNA。纳米孔单分子测序计算尚有另一大特点,它能够直接读取出甲基化的胞嘧啶,而不必像传统办法那样对基因组进行bisulfite解决。这对于在基因组水平直接研究表观遗传有关现象有极大的协助。并且改办法的测序精确性可达%,并且一旦发现测序错误也能较容易地进行纠正。但现在似乎还没有应用该技术的有关报道。

图8.纳米孔测序

其它测序技术现在尚有一种基于半导体芯片的新一代革命性测序技术——IonTorrent6。该技术使用了一种充满小孔的高密度半导体芯片,一种小孔就是一种测序反映池。当DNA聚合酶把核苷酸聚合到延伸中的DNA链上时,会释放出一种氢离子,反映池中的PH发生变化,位于池下的离子感受器感受到H+离子信号,H+离子信号再直接转化为数字信号,从而读出DNA序列(图9)。这一技术的发明人同时也是454测序技术的发明人之一——JonathanRothberg,它的文库和样本制备跟454技术很像,甚至能够说就是454的翻版,只是测序过程中不是通过检测焦磷酸荧光显色,而是通过检测H+信号的变化来获得序列碱基信息。IonTorrent相比于其它测序技术来说,不需要昂贵的物理成像等设备,因此,成本相对来说会低,体积也会比较小,同时操作也要更为简朴,速度也相称快速,除了2天文库制作时间,整个上机测序可在小时内完毕,但是整个芯片的通量并不高,现在是10G左右,但非常适合小基因组和外显子验证的测序。

图9.IonTorrent

小结以上,对各代测序技术的原理做了简要的叙述,这三代测序技术的特点比较汇总在下列表1和表2中。其中测序成本,读长和通量是评定该测序技术先进与否的三个重要指标。第一代和第二代测序技术除了通量和成本上的差别之外,其测序核心原理(除Solid是边连接边测序之外)都是基于边合成边测序的思想。第二代测序技术的优点是成本较之一代大大下降,通量大大提高,但缺点是所引入PCR过程会在一定程度上增加测序的错误率,并且含有系统偏向性,同时读长也比较短。第三代测序技术是为理解决第二代所存在的缺点而开发的,它的根本特点是单分子测序,不需要任何PCR的过程,这是为了能有效避免因PCR偏向性而造成的系统错误,同时提高读长,并要保持二代技术的高通量,低成本的优点。表1:测序技术的比较第X代公司平台名称测序办法检测办法大概读长(碱基数)优点相对局限性第一代ABI/生命技术公司3130xL-3730xL桑格-毛细管电泳测序法荧光/光学600-1000高读长,精确度一次性达标率高,能较好解决重复序列和多聚序列通量低;样品制备成本高,使之难以做大量的平行测序第一代贝克曼GeXP遗传分析系统桑格-毛细管电泳测序法荧光/光学600-1000高读长,精确度一次性达标率高,能较好解决重复序列和多聚序列;易小型化通量低;单个样品的制备成本相对较高第二代Roche/454基因组测序仪FLX系统焦磷酸测序法光学230-400在第二代中最高读长;比第一代的测序通量大样品制备较难;难于解决重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵第二代IlluminaHiSeq,HiSeq2500/MiSeq可逆链终止物和合成测序法荧光/光学2x150很高测序通量仪器昂贵;用于数据删节和分析的费用很高第二代ABI/Solid5500xlSolid系统连接测序法荧光/光学25-35很高测序通量;在广为接受的几个第二代平台中,所要拼接出人类基因组的试剂成本最低测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;仪器昂贵第二代赫利克斯Heliscope单分子合成测序法荧光/光学25-30高通量;在第二代中属于单分子性质的测序技术读长短,推高了测序成本,减少了基因组拼接的质量;仪器非常昂贵第三代太平洋生物科学公司PacBioRS实时单分子DNA测序荧光/光学~1000高平均读长,比第一代的测序时间减少;不需要扩增;最长单个读长靠近3000碱基并不能高效地将DNA聚合酶加到测序阵列中;精确性一次性达标的机会低(81-83%);DNA聚合酶在阵列中降解;总体上每个碱基测序成本高(仪器昂贵);第三代全基因组学公司GeXP遗传分析系统复合探针锚杂交和连接技术荧光/光学10在第三代中通量最高;在全部测序技术中,用于拼接一种人基因组的试剂成本最低;每个测序环节独立,使错误的累积变得最低低读长;

模板制备妨碍长重复序列区域测序;样品制备费事;尚无商业化供应的仪器第三代IonTorrent/生命技术公司个人基因组测序仪(PGM)

合成测序法以离子敏感场效应晶体管检测pH值变化100-200对核酸碱基的掺入可直接测定;在自然条件下进行DNA合成(不需要使用修饰过的碱基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论