第五章-基因组测序技术_第1页
第五章-基因组测序技术_第2页
第五章-基因组测序技术_第3页
第五章-基因组测序技术_第4页
第五章-基因组测序技术_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章基因组测序技术一些主要模式生物基因组测序概况1995年7月,第一个基因组——流感嗜血杆菌(Haemophilusinfluenzae)的全序列发

表,大小为1.8Mb;

1996年10月,酿酒酵母(Saccharomycescerevisiae)

的基因组全部测序完成;

1997年9月,大肠杆菌(Escherichiacoli)基因组全部测

序完成,全长5Mb;2001年12月,线虫(Caenorhabditiselegans)基因组测序完成.一些主要模式生物基因组测序概况2000年:3月,Celera公司完成果蝇(Drosophilamelanogaster)基因组(180Mb)的全部测序工作,在当时所有已测序的基因组中是最大的

,同时这也证明了“全基因组鸟枪法”的可行性;

2000年12月,第一个植物基因组——拟南芥(Arabidopsisthaliana)基因组被全部测序

,大小为125Mb.一、测序流程1.构建生物基因组文库或cDNA文库DNA的提取和制备→酶切制备克隆用DNA片段

→与载体连接→转化受体细胞

→筛选鉴定→扩增培养。2.从基因组文库中提取DNA大片段,进行测序:将DNA用超声波(或限制性内切酶)切成能够测序的小片断(200-500bp)→小片断和载体结合,植入细菌中进行扩增(或用PCR扩增)→从细菌中提取出繁殖好的质粒→酶切,制取测序的DNA片段3.测序:上测序仪测序。4.利用重叠技术,排出DNA大片段的序列。二、DNA测序的方法双脱氧链终止法测序化学降解法测序自动化测序非常规DNA测序(一)Sanger的双脱氧链末端终止法

1.基本原理:通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。Cambridge的F.Sanger在1977年发明用双脱氧链终止法测定单链DNA的序列,其基本原理如下:

①DNA聚合酶能够用单链DNA作为模板,合成准确的DNA互补链;②该酶能够用2‘,3’--双脱氧核苷三磷酸作底物并将其聚合到新生寡核苷酸链的3‘-末端,从而终止其延伸反应。在DNA测序反应中,加入模板DNA,引物(特异性引物),DNA聚合酶,dA,dT,dG,dC和一种ddNTP。常用Klenow大片段,无5'→3'外切酶活性。基本原理:2.技术路线与要求制备单链模板↓将单链模板与一小段引物退火↓加入DNA多聚酶4种脱氧核苷酸分别加入少量4种双脱氧核苷酸

↓将4种反应产物分别在4条泳道电泳↓根据4个碱基在4条泳道的终止位置读出基因序列

A克隆于质粒中DNA→用碱或热变性BM13克隆单链DNAC噬粒克隆DNADPCR产生单链DNAA高酶活性B无5’→3´外切酶活性C无3´→5´外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子连接的是氢原子,不是羟基5ˊPP5ˊ3ˊHOOH3ˊ5ˊPOH3ˊP325ˊ5ˊPOH3ˊHODNA聚合酶,dATP,dTTP,dGTP,dCTPddGTPddATPddTTPddCTP制备单链DNA加放射性引物ddGTPddATPddTTPddCTP5ˊ

32P-GTCATGTGCTAG5ˊ

32PGTCATGTGCTA5ˊ

32PGTCATGTGCT5ˊ

32PGTCATGTGC5ˊ

32PGTCATGTG5ˊ

32PGTCATGT5ˊ

32PGTCATG5ˊ

32PGTCAT5ˊ

32PGTCA5ˊ

32PGTC5ˊ

32PGT5ˊ

32PG聚合产物分别在4个泳道电泳从下到上依次读出DNA片段的核苷酸序列(二)Maxam-Gilbert的化学降解法1.基本原理是用化学试剂处理具有末端放射性标记的DNA片段,造成碱基的特异性切割并产生一组具有不同长度的DNA链降解产物,经凝胶电泳分离和放射自显影之后,可直接读出待测DNA片段的核苷酸序列。2技术路线将双链DNA样品变为单链↓每个单链的同一方向末端都用放射性同位素标记,以便显示DNA条带↓分别用不同方法处理,获得只差一个核苷酸的降解DNA群体↓电泳,读取DNA的核苷酸顺序Maxam-Gilbert测序法的特异断裂32P32PATCGATCG32PATCGATATCGATSpecificReactiontoG

化學法無放射線片段不能顯像断裂处断裂处ATCGATCGATMaxam-Gilbert法所用的化学技术

5ˊPP5ˊ3ˊHOOH3ˊ5ˊHOOH5ˊ3ˊHOOH3ˊ5ˊ32PP325ˊ3ˊHOOH3ˊ5ˊ32POH3ˊ硫酸二甲酯甲酸肼肼+NaClGG+AT+CC碱性磷酸单酯酶除去5ˊ磷酸基多核苷酸磷酸激酶γ-32P-ATP分离单链DNA分别在4个试管中进行特异断裂GG+AT+CC5ˊ

32P-GTCATGTGCTAG5ˊ

32PGTCATGTGCTA5ˊ

32PGTCATGTGCT5ˊ

32PGTCATGTGC5ˊ

32PGTCATGTG5ˊ

32PGTCATGT5ˊ

32PGTCATG5ˊ

32PGTCAT5ˊ

32PGTCA5ˊ

32PGTC5ˊ

32PGT5ˊ

32PG断裂产物分别在4个泳道电泳从下到上依次读出DNA片段的核苷酸序列化学法测序实例哌啶改进的特异化学切割反应(三)自动化测序1.基本原理与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,ddTTP标记绿色荧光.由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基.(四)非常规测序1.毛细管电泳

用毛细管电泳取代聚丙烯凝胶平板电泳,节省时间,加快测序进程,其他程序同链终止法或化学测序法.2.光点测序

脱氧三磷酸核苷酸连接到DNA3’-末端时会释放1个焦磷酸(PPi),焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮.由此,往反应液中每次只加入1种核苷酸,当加入的核苷酸结合时,反应液发出亮点,并记录核苷酸种类;当核苷酸未结合时,反应液中的核苷酸酶迅速分解此核苷酸,由此来测定DNA序列.

3.DNA芯片测序基本原理将各种排列顺序的寡核苷酸点播在芯片上,每个点播的寡核苷酸在排列的方阵中都有指定的位置.待检测的DNA分子与芯片温浴,凡是能杂交的寡核苷酸都会在确定位置发出信号,然后根据获取的信息将寡核苷酸的顺序进行对比组装,拼接成完全的DNA顺序.利用基因芯片进行杂交测序的原理三、测序及序列的组装的策略(一)随机测序与序列组装

随机测序也称”鸟枪法”.

ABC小片段测序计算机拼装鸟枪法(Shotgun)测序的问题CAATGCATTA……GCAGCCAATGCGAP错装实例:流感嗜血杆菌基因组的测序及顺序组装超声波打断纯化的基因组DNA↓琼脂糖电泳收集1.6∼2.0Kb的区段、纯化

↓构建到质粒载体中↓随机挑选19687个克隆,进行28643次测序,得到可读顺序为11631485bp↓组装成140个覆盖全基因组范围的独立的顺序重叠群,↓各重叠群间仍有间隙

顺序间隙物理间隙

↓↓

载体或宿主菌选用不当而被丢失的顺序测序时遗漏的测序解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库解决办法:利用其它宿主菌与载体重新构建文库序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸.优点:不需预先了解任何基因组的情况.ABCABCABCABC小片段测序计算机拼装(二)限制测序限制测序:是指将一段染色体区段的DNA顺序进行组装.一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法.如高等植物拟南芥基因组的测序完全依据克隆重叠群,先进行各个BAC克隆的随机测序,再进行序列组装;

水稻基因组测序计划采取得策略与此相同.(三)指导测序与序列组装建立在基因组图谱基础上的”鸟枪法”,即所谓”指导鸟枪法”或”指导测序”。在人类基因组进入测序组装阶段就采用此方法,其基本步骤如下:A构建平均为2Kb的人类基因组质粒文库,进行双向测序;B构建平均10Kb的人类基因组质粒文库,进行双向测序,读取2个端部顺序;C参考人类基因组图,特别是大量的STS位标作为基点,进行序列组装,排成重叠克隆群.先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群(Contig),分别测序后拼装.这种策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段测序拼装两种策略的比较鸟枪法策略指导测序策略不需背景信息构建克隆群(遗传、物理图谱)时间短需要几年的时间需要大型计算机得到的是草图(Draft)得到精细图谱(四)其他测序路线1.重要区域优先测序人们对感兴趣的基因或与疾病相关的基因优先测序.如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序.2.EST(Expressedsequencetag)测序EST是一种重要的基因组图分子标记,以EST为探针很容易从cDNA文库中筛选全基因,又可从BAC克隆中找到其基因组的基因序列.优点:AmRNA可直接反转录成cDNA,而且cDNA文库也比较容易构建;B对cDNA文库大量测序,即可获得大量EST的序列;CEST为基因的编码区,不包括内含子和基因间区域,一次测序的结果足以鉴定所代表的基因;四、人类基因组计划

人类基因组计划(Humangenomeproject)于1990年启动,我国于1999年加入该计划,承担其中1%的任务,即人类3号染色体短臂上约30Mb的测序任务。

1.人类基因组计划的目的

阐明人类基因组30亿个碱基对的序列,发现所有人类基因,并搞清其在染色体上的位置;破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我;解码生命、了解生命的起源、了解生命体生长发育的规律;认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。2.人类基因组草图的完成

2000年6月26日是人类历史上值得纪念的一天。人类基因组的工作草图已经绘制完毕并于这天向全世界公布。最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构,序列错误率低于万分之一。二000年六月二十六日克林顿宣布人类基因组草图绘制完成美国国家人类基因组研究所所长弗朗西斯·柯林斯在介绍情况。

人类基因组草图基本信息由31.65亿bp组成含3~3.5万基因与蛋白质合成有关的基因占2%人类基因组人类蛋白质61%与果蝇同源43%与线虫同源46%与酵母同源2000年6月公共领域测序计划工作框架图2001年2月16日

人类基因组“精细图”完成,(99%),2003年4月14日人类基因组序列图亦称“完成图”(99.99%),提前绘制成功A.CeleraGenomics人类基因组的测序策略3.人类基因组测序策略采集5个自愿者的DNA样品构建3种不同插入子大小的基因组文库2Kb,10Kb和50Kb完成约2700万次插入子末端测序,总长14800MbGeneBank下载104018个BAC末端顺序PFP发表的公开数据主要为BAC克隆的顺序,共4443.3Mb随机测序与序列组装方法和指导测序与序列组装方法相结合进行序列组装B国际人类基因组测序策略构建BAC克隆↓限制性酶处理获得指纹↓根据指纹重叠方法组建BAC克隆重叠群↓根据STS标记,将BAC克隆重叠群标定在物理图上↓每个BAC克隆内部采用鸟枪法测序,组装↓将BAC插入顺序与BAC克隆指纹极重叠群对比,将已阅读的顺序锚定到物理图上4.人类基因组测序结果

基因数是3万、4万还是10万

人类遗传基因数量比原先估计的少很多。目前研究表明,人类基因组中约有3万至4万个蛋白编码基因,仅仅是果蝇基因数目的两倍,人有而鼠没有的基因只有300个。此结论是由两大科研小组的数据是从DNA水平上得出的;而“人类有10万多个基因”则是从RNA水平上得出的结论。所以,这些数据不能推翻“人类有10万个基因”的说法。人类基因组研究的惊人发现•19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少•目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能•人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”——不包含或含有极少基因的成分。基因组上大约有1/4的区域没有基因的片段。•35.3%的基因包含重复的序列。这说明那些原来被认为是“垃圾”的DNA也起重要作用,应该被进一步研究。什么是单核苷酸多态性人类99.9%的基因密码是相同的,而差异不到0.1%,不同人群仅有140万个核苷酸差异。这些差异是由“单一核苷酸多样性”(SNP)产生的,它构成了不同个体的遗传基础,个体的多样性被认为是产生遗传疾病的原因。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。5.人类基因组计划的意义随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发生巨大变化。人类基因研究的意义在于它可以支持和推动生命科学中一系列重要的基础性研究。如基因组遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、生产、分化的分子机理,疾病发生的机理等。(1)确定人类基因组中约5万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。(2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。(3)从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”的大小和组织,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中的影响与作用。

(4)研究空间结构对基因调节的作用。有些基因的表达调控序列与被调节基因从直线距离上看,似乎相距甚远,但若从整个染色体的空间结构上看则恰恰处于最佳的调节位置,因此,有必要从三维空间的角度来研究真核基因的表达调控规律。(5)发现与DNA复制、重组等有关的序列。DNA的忠实复制保障了遗传的稳定性,正常的重组提供了变异与进化的分子基础。局部DNA的推迟复制、异常重组等现象则导致疾病或者胚胎不能正常发育,因此,了解与人类DNA正常复制和重组有关的序列及其变化,将对研究人类基因组的遗传与进化提供重要的结构上的依据。(6)研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引发的分子病理学改变及其进程,为这些疾病的诊断、预防和治疗提供理论依据。(7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。了解有关病毒基因组侵染人类基因组后的影响,可能指导人类有效地利用病毒载体进行基因治疗。

(8)研究染色体和个体之间的多态性。这些知识可被广泛用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。此外,这些遗传信息还有助于研究人类历史进程、人类在地球上的分布与迁移以及人类与其他物种之间的比较。以人类基因组和拟南芥基因组为例说明你对生物基因组全序测定工作的科学意义与社会意义的认识(8分)中国科学院2002年

硕士学位研究生入学分子遗传学试题6.人类基因组计划的伦理学A个人DNA顺序的隐私权.如:”次等”基因携带者可能受到岐视,职业限制,医疗保险等问题;B基因专利问题7.后人类基因组计划

伴随着人类基因组计划的迅速进展,基因的全序列逐步被完整的测出,会出现大量的不知道任何功能信息的序列。因此,在HGP完成之后,即全部人类基因被定序之后,还需要:破解贮存于基因组之中的遗传语言;识别、分离、鉴定和克隆所有基因;搞清每个基因的功能及基因之间的相互作用和相互关系。水稻的基因组

2002年我国科学家完成了水稻基因组定序和初步分析。出人意表的是,水稻的基因竟比人类基因还要多得多。人类基因大约有3-4万个,水稻有46022-55615个基因。因此水稻基因组可说是继人类基因组之后,完成定序的最大基因组,也是至今已知最大的植物基因组。由于水稻是全球半数以上人口的主食,对解决全球粮食问题具有重要意义。基因组学概述基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和物种遗传信息的“总词典”控制发育的“总程序”生物进化历史的“总档案”基因组学(genomics)1986年提出,至今20年,已经发展成为遗传学中最重要的分支学科。对物种的所有基因进行定位、作图、测序和功能分析基因组学研究的最终目标获得生物体全部基因组序列鉴定所有基因的功能明确基因之间的相互作用关系阐明基因组的进化规律

经典遗传学在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。几个代表物种的基因组大小CREDIT:JOESUTLIFFScience,Vol291:1221.FishinginaMoreEffectiveWay!基因组学的研究内容结构基因组学功能基因组学蛋白质组学结构基因组学(structuralgenomics)基因定位基因组作图测定核苷酸序列功能基因组学(functionalgenomics)又称后基因组学(postgenomics)基因的识别、鉴定、克隆基因结构、功能及其相互关系基因表达调控的研究人类基因组计划1990,美国国立卫生研究所和能源部投资$30亿,启动了人类基因组计划,预计15年时间完成人类基因组全部序列的测定1996,完成标记密度为0.6cM的人类基因组遗传图谱,100kb的物理图谱2000,完成草图2001年2月,公布人类基因组图谱的修订版2002,完成测序工作基因组图谱的构建基因组计划的主要任务是获得全基因组序列但是,现在的测序方法每次只能测800~1000bp大量的测序片段要拼接要知道序列在Chr上的位置才能正确拼接基因组计划的第一个环节:构建基因组图谱基因组图谱遗传图谱(geneticmap)物理图谱(physicalmap)遗传图谱(geneticmap)采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。遗传标记有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻找基因组不同位置上的特征标记。包括:形态标记细胞学标记生化标记DNA分子标记多态性(polymophism)所有的标记都必须具有多态性!花色:白色、红色株高:高、矮血型:A、B、O型淀粉:糯、非糯所有多态性都是基因突变的结果!形态标记形态性状:株高、颜色、白化症等又称表型标记数量少很多突变是致死的受环境、生育期等因素的影响最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。控制性状的其实是基因,所以形态标记实质上就是基因标记。果蝇连锁图细胞学标记明确显示遗传多态性的染色体结构特征和数量特征染色体的核型染色体的带型染色体的结构变异染色体的数目变异优点:不受环境影响缺点:数量少、费力、费时、对生物体的生长发育不利生化标记又称蛋白质标记就是利用蛋白质的多态性作为遗传标记。

如:同工酶、贮藏蛋白优点:数量较多,受环境影响小缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息DNA分子标记简称分子标记以DNA序列的多态性作为遗传标记优点:不受时间和环境的限制遍布整个基因组,数量无限不影响性状表达自然存在的变异丰富,多态性好共显性,能鉴别纯合体和杂合体限制性片段长度多态性

(restrictionfragmentlengthpolymorphism,RFLP)

DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。

如有两个DNA分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的DNA片段长度就有差异,即多态性。可将RFLP作为标记,定位在基因组中某一位置上。人类基因组中有105个RFLP位点,每一位点只有两个等位基因。RFLP分析RFLP标记位共显性标记微卫星(microsatellite)标记微卫星又称为简单重复序列(simplesequencerepeat,SSR)。这种重复序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论