第4章基因组测序与序列组装3+1陈竺_第1页
第4章基因组测序与序列组装3+1陈竺_第2页
第4章基因组测序与序列组装3+1陈竺_第3页
第4章基因组测序与序列组装3+1陈竺_第4页
第4章基因组测序与序列组装3+1陈竺_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章基因组测序与序列组装1、DNA测序的方法链终止法测序化学降解法测序自动化测序非常规DNA测序1.1链终止法测序(thechainterminationmethod)

基本原理:

通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。(一)DNA的酶法测序(双脱氧终止法)1955确定牛胰岛素结构,1958获诺贝尔化学奖1975设计出DNA测序法,1980获诺贝尔化学奖Sanger合成一段与待测DNA序列互补的DNA片段群1971年,吴瑞将引物延伸(primerextension)用于DNA测序。吴瑞发明的联接子(linker)和衔接子(adaptor)迄今仍然是克隆DNA的常用工具他主编的《重组DNA》曾风靡分子生物学和生物技术界。上世纪80年代后,吴瑞在水稻转基因技术上有先导性贡献。吴瑞(1928-2008)吴瑞在分子生物学和植物生物学等领域有重要贡献。技术路线与要求制备单链模板↓将单链模板与一小段引物退火↓加入DNA多聚酶4种脱氧核苷酸分别加入少量4种双脱氧核苷酸

↓将4种反应产物分别在4条泳道电泳↓根据4个碱基在4条泳道的终止位置读出基因序列A克隆于质粒中DNA→用碱或热变性BM13克隆单链DNAC噬粒克隆DNADPCR产生单链DNAA高酶活性B无5’→3´外切酶活性C无3´→5´外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子连接的是氢原子,不是羟基对DNA聚合酶的要求A高酶活性:

聚合酶在终止合成前,多聚核苷酸分子可延伸的有效长度B无5’→3´外切酶活性外切核酸酶活性C无3´→5´外切酶活性较读功能Klenow酶250bp测序酶sequenase

3’5’5’3’外切酶聚合酶NC5’3’外切酶小片段大片段(klenow片段)切除RNA引物损伤修复校读功能(常用的工具酶)聚合功能蛋白水解酶水解有限产物,68000和35000的片段,用途:双链DNA5'突出(5'overhang)末端的补平(fill-in);双链DNA3'突出(3'overhang)的打平(也称削平);5'突出末端的标记;随机引物法进行DNA标记;Sanger双脱氧法进行DNA测序;cDNA第二链的合成或定点突变反应第二链的合成。3'→5'外切酶活性──校对作用这种酶活性的主要功能是从3'→5'方向识别和切除不配对的DNA生长链末端的核苷酸。5'→3'外切酶活性──切除修复作用从5’→3’方向水解DNA生长链前方的DNA链,主要产生5’-脱氧核苷酸。A克隆于质粒中DNA对模板的要求小于3kb的可以进行,是包装在噬菌体中的单链DNA,容易丢失和重排。用碱或热变性,可能有未纯化的DNA沾染,干扰测序反应,但是最常用方法。BM13克隆单链DNAC噬粒克隆DNA10kb,质粒自身的复制起点,还有一个M13或者其他的单链DNA噬菌体的复制起点,大肠杆菌中含有噬粒和辅助噬菌体时,因携带噬菌体复制酶和外壳蛋白的基因,所以激活噬菌体DNA复制,产生单链噬粒噬菌体,比M13稳定。用标记了金属粒子的引物,磁性装置纯化后使用。对模板的要求DPCR产生单链DNA对引物的要求1.2化学降解法测序基本原理:

在选定的核苷酸碱基中引入化学基团,再用化合物处理,使DNA分子在被修饰的位置降解.技术路线将双链DNA样品变为单链↓每个单链的同一方向末端都用放射性同位素标记,以便显示DNA条带↓分别用不同方法处理,获得只差一个核苷酸的降解DNA群体↓电泳,读取DNA的核苷酸顺序Maxam-Gilbert法所用的化学技术

碱基特异修饰方法GPh8.0,用硫酸二甲酯对N7进行甲基化,使C8-C9键对碱基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤环的N原子位置脱嘌呤,并因此消弱腺嘌呤和鸟嘌呤的糖苷键C+T肼可打开嘧啶环,后者重新环化成五元环后易除去C1.5mol/LNaCl存在时,可用肼除去胞嘧啶化学法测序实例哌啶硫酸二甲酯1.3自动化测序基本原理与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,ddATP标记红色荧光ddCTP标记蓝色荧光ddGTP标记黄色荧光ddTTP标记绿色荧光.由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基.DNA序列分析仪:四色荧光基团标记的dNTP120台毛细管电泳装置24小时连续作业,一天工作量是1亿个碱基长度的DNA,4天就可测完水稻基因组光点测序脱氧三磷酸核苷酸连接到DNA3’-末端时会释放1个焦磷酸(PPi),焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮.1.4非常规测序DNA芯片测序将各种排列顺序的寡核苷酸点播在芯片上,每个点播的寡核苷酸在排列的方阵中都有指定的位置.待检测的DNA分子与芯片温浴,凡是能杂交的寡核苷酸都会在确定位置发出信号,然后根据获取的信息将寡核苷酸的顺序进行对比组装,拼接成完全的DNA顺序.利用基因芯片进行杂交测序的原理可测DNA片段的长度是芯片上排列的寡聚核苷酸数目的平方根。2、基因组测序2.1基因组测序的策略作图测序(克隆依次测序)按照大分子DNA克隆绘制的物理图分别在单个大分子DNA克隆内部进行测序和序列组装,然后将彼此相连的大分子克隆按排列次序搭建支架,最后以分子标记为向导将搭建好的支架逐个锚定到基因组整合图上。2、基因组测序2.1基因组测序的策略鸟枪法测序(全基因组随机测序)将整个基因组DNA打断成小片段后将其克隆到质粒载体中,然后随机挑选克隆对插入片段进行测序,以获得的测序序列构建重叠群。在此基础上进一步搭建序列支架,最后以分子标记为向导将序列支架锚定在基因组整合图上。基因组测序覆盖面:随机测序获得的序列总长与单倍体基因组序列总长之比,覆盖面越大,遗漏的序列越少。2.2基因组测序的覆盖面基因组测序覆盖率达到99.99%,覆盖面要达到8次以上。序列间隙:测序时遗漏的序列。2.3序列间隙和物理间隙2.3序列间隙和物理间隙物理间隙:构建基因组文库时丢失的DNA序列。1、碱基组成特殊,着丝粒附近,高度重复,缺少酶切位点,难已获得大分子克隆2、高度重复序列不稳定,在扩增中容易丢失3、某些基因的表达产物对宿主菌有毒性序列间隙:先设计探针,找到阳性克隆,然后设计引物,PCR,重建克隆体,测序物理间隙:原因:1、碱基组成特殊,着丝粒附近,高度重复,缺少酶切位点,难已获得大分子克隆2、高度重复序列不稳定,在扩增中容易丢失3、某些基因的表达产物对宿主菌有毒性,2.4插入片段的两端测序3序列的组装3.1随机测序与序列组装

随机测序也称”鸟枪法”.序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.优点:不需预先了解任何基因组的情况.ABCABCABCABC小片段测序计算机拼装ABC小片段测序计算机拼装鸟枪法(Shotgun)测序的问题CAATGCATTA……GCAGCCAATGCGAP错装实例:流感嗜血杆菌基因组的测序及顺序组装

Ceralagenomics公司1995超声波打断纯化的基因组DNA↓琼脂糖电泳收集1.6∼2.0Kb的区段、纯化

↓构建到质粒载体中↓随机挑选19687个克隆,进行28643次测序,得到可读顺序为11631485bp↓组装成140个覆盖全基因组范围的独立的顺序重叠群,↓各重叠群间仍有间隙(139个)

序列间隙(99个)物理间隙(23个)

↓↓

载体或宿主菌选用不当而被丢失的顺序测序时遗漏的测序解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库解决办法:利用其它宿主菌与载体重新构建文库解决办法:利用其它宿主菌与载体重新构建文库42个解决了23个解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库99个3.2指导测序与序列组装在人类基因组进入测序组装阶段就采用此方法:A构建平均为2Kb的人类基因组质粒文库,进行双向测序;B构建平均10Kb的人类基因组质粒文库,进行双向测序,读取2个端部顺序;C参考人类基因组图,特别是大量的STS位标作为基点,进行序列组装,排成重叠克隆群.建立在基因组图谱基础上的”鸟枪法”,即所谓”指导鸟枪法”或”指导测序”。限制测序:是指将一段染色体区段的DNA顺序进行组装.一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法.如高等植物拟南芥基因组的测序完全依据克隆重叠群,先进行各个BAC克隆的随机测序,再进行序列组装;

水稻基因组测序计划采取得策略与此相同.先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群(Contig),分别测序后拼装.这种策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段测序拼装两种策略的比较鸟枪法策略指导测序策略不需背景信息构建克隆群(遗传、物理图谱)时间短需要几年的时间需要大型计算机得到的是草图(Draft)得到精细图谱3.4其他测序路线重要区域优先测序人们对感兴趣的基因或与疾病相关的基因优先测序.如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序.3.6*106bp,224个基因座组成,93个是直接通过基因组测序发现的,MHC基因分布最密集,16kb一个基因多态性分布最密集的区域,有些座位的等位基因成员超过200.与风湿性关节炎,牛皮癣,阅读障碍、癌症有关。EST(Expressedsequencetag)测序优点:AmRNA可直接反转录成cDNA,而且cDNA文库也比较容易构建;B不必反复检测EST序列的准确性;CEST为基因的编码区,不包括内含子和基因间区域,一次测序的结果足以鉴定所代表的基因;EST是一种重要的基因组图分子标记,以EST为探针很容易从cDNA文库中筛选全基因,又可从BAC克隆中找到其基因组的基因序列.EST测序链终止法是1%,但是基因组测序是0.01%,要测3次以上。98年底,有100多万个人类EST,4.人类基因组计划

人类基因组计划(Humangenomeproject)于1990年启动,我国于1999年加入该计划,承担其中1%的任务,即人类3号染色体短臂上约30Mb的测序任务。

A.CeleraGenomics人类基因组的测序策略4.1人类基因组测序策略采集5个自愿者的DNA样品构建3种不同插入子大小的基因组文库2Kb,10Kb和50Kb完成约2700万次插入子末端测序,总长14800MbGenBank下载104018个BAC末端顺序PFP(政府资助的人类基因组计划)发表的公开数据主要为BAC克隆的顺序,共4443.3Mb随机测序与序列组装方法和指导测序与序列组装方法相结合进行序列组装B国际人类基因组测序策略构建BAC克隆↓限制性酶处理获得指纹↓根据指纹重叠方法组建BAC克隆重叠群↓根据STS标记,将BAC克隆重叠群标定在物理图上↓每个BAC克隆内部采用鸟枪法测序,组装↓将BAC插入顺序与BAC克隆指纹及重叠群比对,将已阅读的顺序锚定到物理图上4.2人类基因组测序结果基因数是3万、4万还是10万?人类遗传基因数量比原先估计的少很多。目前研究表明,人类基因组中约有3万至4万个蛋白编码基因,仅仅是果蝇基因数目的两倍,人有而鼠没有的基因只有300个。人类基因组研究的惊人发现19号染色体是含基因最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论