测序技术介绍优制材料_第1页
测序技术介绍优制材料_第2页
测序技术介绍优制材料_第3页
测序技术介绍优制材料_第4页
测序技术介绍优制材料_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、测序技术介绍测序技术介绍1高级教学测序技术发展史2高级教学一代测序1954 年,whitfeld 等用化学降解法测定多聚核糖核苷酸序列,是关于dna 测序技术的较早报道。1977 年,sanger 发明dna 双脱氧核苷酸末端终止测序法(chain terminator sequencing),a.m.maxam 和w. gilbert 发明dna 化学降解测序法(chemical degradation sequencing),2 项技术的出现,标志第1 代测序技术诞生。3高级教学sanger 测序法的原理每一次dna 测序反应都由4 个独立反应组成;由于dna 双链中核苷酸以3,5-磷酸二

2、酯键相连,因此在测序过程中掺入2,3-双脱氧核苷三磷酸ddntp(不含3-oh),当ddntp 位于dna 双链的延伸末端时, 无羟基3端不能与其他脱氧核苷酸形成3,5-磷酸二酯键, 因此,dna 双链合成便终止;若在终止位点掺入ddatp,则新生链末端为a,若掺入ddttp、ddctp、ddgtp,相应地,新生链末端则是t、c 或g。4高级教学5高级教学6高级教学7高级教学8高级教学该测序技术的具体做法如下:将模板、引物、4 种dntp(其中含有一种为放射性同位素标记的核苷酸)与dna 聚合酶共同保温,形成的混合物包含许多长短不一的片段, 最后利用聚丙烯酰胺变性凝胶电泳(sds-page)分

3、离该混合物,得到放射性同位素自显影条带图谱,人们依据凝胶电泳图即可读出dna 双链的碱基序列组成。9高级教学10高级教学11高级教学12高级教学自动化测序实际上已成为当今 dna序列分析的主流。美国pe abi公司已生产出373型、377型、310型、3700和3100型等dna测序仪,其中310型是临床检测实验室中使用最多的一种型号。13高级教学测序过程中的常见问题分析在进行dna测序时,紧接引物的10 30 bases有时不一定能完全读清楚。 由于dna结构上的原因,有时会出现反应中途无法进行之情况。如:g/c rich; g/c cluster;poly a、 poly t的连续结构等。

4、此外,另一种情况为反应中途出现的套峰现象,此种情况一般为dna结构中的重复序列,造成测序用引物和模板之间有二个以上的结合位点。具体问题分析如下:1 1: 测序结果有很多套峰,出现很多测序结果有很多套峰,出现很多n n值值原因分析:pcr产物直接进行测序,在pcr产物长度以后将无反应信号,机器将产生许多n值。 在序列的起始端出现n值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何值。有时,引物二聚体或者起始端小片段的丢失,也会出现n值。模版本身含杂合序列,有等位基因。14高级教学测序过程中的常见问题分析2 2:为什么找不到我的:为什么找不到我的pcrpcr引物序列?引物序列?

5、用pcr引物作为测序引物,所测序列是从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。3 3:测序结果和文献资料不一样,为什么:测序结果和文献资料不一样,为什么? ?原因有很多,如同一种动物,在不同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是pcr产物克隆测序, 那还有pcr过程中的错配因素等等。我们提供的测序结果是客户样品序列的忠实结果,不能保证和文献序列完全一致。4 4:过短的:过短的pcrpcr产物为什么不适于直接测序?产物为

6、什么不适于直接测序?首先由于一般的pcr产物纯化试剂盒要求产物片段大于200bp,过短的pcr产物不能进行纯化;再者,测序的前50bp和后50bp的序列是不好的,所以不适于直接测序。15高级教学测序过程中的常见问题分析5 5:酒精如果没有挥发完全:酒精如果没有挥发完全, ,在约在约300bp300bp处会出现连续异常的处会出现连续异常的g g峰,酒精挥发时峰,酒精挥发时间过长会导致间过长会导致dnadna断裂。断裂。第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组dna,就很好地说明了样品为杂合子,该位点可能存在snp现象(t/g)。如果判读为干扰峰,我们只需认定样品此处

7、碱基为t为行了。第二个峰,错位干扰。如果不判读为干扰峰,则说明样本可能比预期多一个碱基(g),如果判读为干扰峰,我们仍只需认定样品此处碱基为t为行了。16高级教学测序过程中的常见问题分析6 6:为什么用:为什么用pcrpcr产物或质粒测序时,经常会出现套峰现象产物或质粒测序时,经常会出现套峰现象? ?下图是pgem-t载体测序的结果,在83位点处测序结果出现双峰,即模板中含有两个或两个以上的相同载体,但是插入片段不同。 解决办法:重新挑取单克隆或者重新提取质粒。需要注意的是,重新进行pcr反应或者酶切鉴定仅能证明该克隆含有插入片段,并不足以证明模板的单一。17高级教学测序过程中的常见问题分析7

8、 7:polypoly结构的测序结果结构的测序结果以polyt为例,在polya/t结构之后往往出现移码现象,而在polyg/c之后会往往导致测序信号的衰减。解决办法:使用反向引物对模板进行测序,测到该poly结构处,即可完成模板全长的拼接。18高级教学第二代测序技术(next-generation sequencing)19高级教学各自的优点454 测序平台得到的片段能够达到400 bp,并且读长的质量高;solexa 测序平台的性价比最高,在数据量相同的情况下,测序成本仅为454 测序平台的1/10;solid 测序平台准确度能够达到99.94%,在片段覆盖率为15时,测序准确度可接近10

9、0%。20高级教学 2005年底,454公司推出第一个基于焦磷酸测序原理的高通量基因组测序系统genome sequencer 20 system,这是核酸测序技术发展史上里程碑式的事件。随后,罗氏公司以1.55亿美元收购了454公司,并在2006年推出了更新的gs flx测序系统,该系统可在10小时的运行中获得100万条读长(reads),46亿个碱基信息(base pair),且准确率达到99%以上。2008年,gs flx系统再次升级,通量提高了5倍,读长和准确率也有所增加。虽然454 gs测序平台也许不是市场占有率最高的测序仪,但截至2011年3月,利用该系统进行研究的论文已发表超过1

10、000余篇,而它在读长上的优势明显胜于另两套系统,因此在从头测序(de novo)和宏基因组测序(meta genome)方面有着不可替代的地位。21高级教学 2006年,solexa公司也推出了自己的ngs系统genome analyzer,简称ga。这套基于dna簇(dna cluster)、桥式pcr(bridge pcr)和可逆阻断(reversible terminator)等核心技术的系统具有高通量、低错误率、低成本、应用范围广等优点。2007年,illumina公司以6亿美元的高价收购了solexa,使ga得以商品化。ga最早期的版本一次运行可获得1gb的数据,因此也有1gb a

11、nalyzer的含义,而最新的hiseq2000平台则能够在10天的运行中获得300gb以上的数据,读取的碱基长度达到150bp左右。更有消息称,illumina已完成了600gb的运行测试并在部分客户中开展了前期体验,tb(1000gb)级的测试run也将于年内进行。据不完全统计,illumina公司已售出超过600台/套ga iix和hiseq2000平台,2010年仅深圳华大基因研究院一家就购买了128台hiseq2000,一举成为全球最大的基因组测序与分析中心,illumina公司在测序领域的影响力由此可见一斑。22高级教学 在sanger测序时代,美国应用生物系统公司(abi)一直是

12、该行业的龙头老大,其垄断地位无人能撼,从早期的377到全自动化的3730 xl,abi的测序仪被广泛应用在基因组学研究的各个方面。然而在第二代测序技术迅猛发展之初,abi起步较晚,显得有些漫不经心。直到2005年454公司推出gs平台,abi的领先地位受到威胁,这才开始发力,迅速收购了研发ngs的一家小公司agencourt,并于2007年推出了它的solid测序平台。此后solid不断升级,目前已到solid 5版本(solid 5500 xl)。solid的全称是sequencing by oligo ligation detection,即寡聚物连接检测测序,其基本原理是通过荧光标记的8

13、碱基单链dna探针与模板配对连接,发出不同的荧光信号,从而读取目标序列的碱基排列顺序。在该方法下,目标序列的所有碱基都被读取了两遍,因此solid最大的优势就是它的高准确率。据悉,solid 5平台的测序通量已达到30gb/天,成本低于60美元/gb,准确率高达99.99%。并且由于solid系统采用的不是pcr反应进行dna合成与测序,因此对于高gc含量的样本,solid系统具有非常大的优势。23高级教学454测序原理焦磷酸测序法(pyrosequencing)的原理24高级教学454测序原理焦磷酸测序法(pyrosequencing)的原理25高级教学454测序原理焦磷酸测序法(pyros

14、equencing)的原理26高级教学454测序原理l 在454测序仪中,a、t、g、c四种碱基是分别存储在单独的试剂瓶中的,每步反应四种碱基依次加入反应池,当碱基配对结合,就会释放出一个焦磷酸(ppi),而这个焦磷酸在酶的作用下,将荧光素氧化成氧化荧光素,并发出光信号,从而读取出这一位置的碱基信息。454测序仪的整个实验步骤可大致概括为: 样品处理 文库制备 empcr 反应板准备 上机测序27高级教学454测序原理1.样品处理: 样品处理主要是针对大片段的dna分子,如基因组dna、fosmid或bac质粒等,利用超声或氮气打断将这些dna分子片段化,然后采用琼脂糖凝胶电泳回收或磁珠纯化,

15、选择500-800bp的dna片段。对于非编码rna或pcr产物,则不需要这一步骤。28高级教学454测序原理2.文库制备包括接头连接和磁珠纯化两步,454的文库接头分a、b两种,各44bp,由20bp的pcr引物、20bp的测序引物及4bp(tcag)的“key”碱基构成,其中b接头的5端带有生物素(biotin)标记,用于磁珠纯化步骤。经过磁珠结合与dna变性之后,只有a+目的片段+b形式的连接产物得以富集,另两种形式(aa、bb)的产物都被去除。29高级教学454测序原理3. empcr(乳液pcr)是454测序的一个关键步骤,将富集到的文库与测序磁珠、各反应物混合,加入特定的矿物油和表

16、面活性剂,再利用振荡器剧烈振荡,使反应体系形成油包水(water-in-oil)的稳定乳浊液。在理想条件下,每一个液滴,或称微反应器(microreactor)中将只包含一个磁珠和一条单链dna,通过控制该步骤的条件,1ml乳液中可以形成至少10的6次方个理想的微反应器。经过pcr扩增后,每一个磁珠上将形成密集的dna簇,这些dna序列完全相同,即可用于后续的步骤。随后,乳液混合物被打破,扩增的片段依然结合在磁珠上。30高级教学454测序原理4.454测序的反应板称为ptp(pico titer plate),含有350万个由光纤组成的小孔,每个孔的直径为29m,而测序磁珠的直径为20m,因此

17、每个孔中仅能容纳一个磁珠。将磁珠与测序试剂加入ptp中,使之可用于上机测序。31高级教学454测序原理5.测序步骤如前所述,四种碱基在泵的控制下依次加入反应板,反应完成后再洗去,每延伸一个或若干个碱基,就会发出一次光信号,通过记录信号的有无和强度,即可测定dna序列。32高级教学33高级教学454测序原理优缺点: 454测序准确度较高,当读长超过400bp时,其准确性仍能达到99%以上; 主要的错误来自于同聚物,即相同碱基的连续延伸,如atttg这样一段序列,a和g的读取没有问题,但t只记录了一次光信号,仅信号强度与atg序列的t有所不同,因此同聚物越长,可能产生的误差就越大。 目前,由于45

18、4测序仪在读长上的明显优势,它在大基因组从头测序(de novo)、转录组分析、基因组结构分析等领域有着广泛的应用。34高级教学solexa测序35高级教学solexa测序常用术语:sbssbs:边合成边测序反应,每次sbs会延伸一个碱基,大约耗时70分钟。runrun:单次上机测序反应,可以产生4g-75g测序通量不等。lanelane:单泳道,每条泳道可以直接物理区分测序样品,1次run最多可以同时上样8条lane。channelchannel:lane的同义词。tiletile:小区,每条lane中排有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点。clustercl

19、uster:簇,在solexa测序技术中会采用桥式pcr方式生产dna簇,每个dna簇才能产生亮度达到ccd可以分辨的荧光点。36高级教学solexa测序indexindex:标签,在solexa多重测序(multiplexed sequencing)过程中会使用index来区分样品,并在常规测序完成后,针对index部分额外进行7个循环的测序,通过index的识别,可以在1条lane中区分12种不同的样品。barcode:barcode: index同义词fastafasta:一种序列存储格式。一个序列文件若以fasta格式存储,则每一条序列的第一行以“”开头,而跟随“”的是序列的id号(即

20、唯一的标识符)及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“”和序列的id号开始,以此类推。37高级教学solexa测序fastqfastq:fastq是solexa测序技术中一种反映测序序列的碱基质量的文件格式。第一行以“”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面紧跟的内容与第一行一样,同样是该序列的描述信息;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。pf%pf%:pf%是指符合测序质量标准

21、的簇的百分比(multiplexed sequencing),与测序的通量相关联。readread:solexa是成簇反应的,每个簇对应一条dna序列片段,成为一个read。38高级教学solexa测序39高级教学solexa测序40高级教学solexa测序41高级教学solexa测序42高级教学solexa测序43高级教学solexa测序44高级教学solexa测序45高级教学solexa测序46高级教学solexa测序应用:solexa平台的应用范围极广,几乎囊括了目前基因组学研究的所有方面,例如基因组从头测序(de novo)、重测序(re-sequencing)、基因组结构分析、转录组

22、测序、表达谱分析、小rna及非编码rna测序、表观遗传学研究等等。47高级教学solid测序48高级教学solid测序49高级教学solid测序50高级教学solid测序51高级教学solid测序52高级教学solid测序53高级教学solid测序54高级教学solid测序55高级教学solid测序56高级教学solid测序57高级教学solid测序58高级教学solid测序59高级教学solid测序60高级教学solid测序61高级教学solid测序62高级教学solid测序63高级教学三者比较测序技术读取长度(测序技术读取长度(),在种测序技术中最长,可以对未知基因组),在种测序技术中最长

23、,可以对未知基因组进行从头测序,但其通量最低(进行从头测序,但其通量最低()。当遇到(如)。当遇到(如 等)时,等)时,碱基个数和荧光信号强度不成线性关系,即判断重复碱基碱基个数和荧光信号强度不成线性关系,即判断重复碱基有困难。有困难。64高级教学三者比较属于高度自动化的系统,读属于高度自动化的系统,读取片段比其它种类的测序多,适合进行大量小片段的测序(如取片段比其它种类的测序多,适合进行大量小片段的测序(如),其测序通量大,),其测序通量大,其新机型产出量为,其新机型产出量为,但基于可逆反应时随反应轮数增加效率降低、信号减弱,并且但基于可逆反应时随反应轮数增加效率降低、信号减弱,并且读长(通

24、常为)比短,给从头读长(通常为)比短,给从头测序拼接带来困难。测序拼接带来困难。65高级教学三者比较技术每个碱基读取次,有非常高的技术每个碱基读取次,有非常高的准确性,特别是针对的检测。此外,灵活的系统和准确性,特别是针对的检测。此外,灵活的系统和完善的磁珠编码系统可以进行样品的来分完善的磁珠编码系统可以进行样品的来分割测序区域,特别适用于具有高质量参考基因组序列物种割测序区域,特别适用于具有高质量参考基因组序列物种的重测序,但是该测序读长()最短,并且读取的重测序,但是该测序读长()最短,并且读取长度受反应轮数的限制,给从头测序拼接带来困难。长度受反应轮数的限制,给从头测序拼接带来困难。66高级教学第三代测序技术原理:脱氧核苷酸用荧光标记,显微镜可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入dna链的时候,它的荧光就同时能在dna链上探测到。当它与dna链形成化学键的时候,它的荧光

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论