结构基因组学课件-讲授_第1页
结构基因组学课件-讲授_第2页
结构基因组学课件-讲授_第3页
结构基因组学课件-讲授_第4页
结构基因组学课件-讲授_第5页
已阅读5页,还剩145页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、结构基因组学 人类基因人类基因 表达具有表达具有 组织特异组织特异 性。某一性。某一 种组织细种组织细 胞在一般胞在一般 情况下只情况下只 表达特定表达特定 的一组基的一组基 因,称为因,称为 表达谱表达谱。 dna测序有一个极大的局限性:即使是最精确测序有一个极大的局限性:即使是最精确 的技术,在一个反应中也很难测出大于的技术,在一个反应中也很难测出大于750bp的的 序列。这就需要将大分子分解为片段。序列。这就需要将大分子分解为片段。 问题:分析基因组的重复区域时会发生错误。问题:分析基因组的重复区域时会发生错误。 因此,必须首先建立一个基因组的图谱,通过因此,必须首先建立一个基因组的图谱

2、,通过 标明基因和其他显著特征的位置,为测序提供指导。标明基因和其他显著特征的位置,为测序提供指导。 一旦得到了基因组的图谱,测序阶段可以采用以下一旦得到了基因组的图谱,测序阶段可以采用以下 方法进行:方法进行: 1. 全基因组鸟枪法全基因组鸟枪法(whole-genome shotgun method) 全基因组鸟枪法是一种快速获得真核基因组的方法。全基因组鸟枪法是一种快速获得真核基因组的方法。 2. 克隆重叠群法克隆重叠群法(clone contig method):():(作图法测作图法测 序,限制测序)。序,限制测序)。 这种逐步测序的方法花时间多,但精确。这种逐步测序的方法花时间多,

3、但精确。 全基因组鸟枪法测序和克隆重叠群法测序最后全基因组鸟枪法测序和克隆重叠群法测序最后 都必须将都必须将dna序列回归到基因组图上,因此序列回归到基因组图上,因此 基因组图的绘制是基因组测序和组装的核心内容基因组图的绘制是基因组测序和组装的核心内容 容之一,是基因组全面测序的必要前提。容之一,是基因组全面测序的必要前提。 传统上将基因组作图方法分为两类。传统上将基因组作图方法分为两类。 1. 遗传作图遗传作图 2. 物理作图物理作图 学习要点:学习要点: 1. 遗传图谱与物理图谱遗传图谱与物理图谱 2. 遗传作图的标记遗传作图的标记 3. 遗传作图的方法遗传作图的方法 任何一类图谱都有可识

4、别的标记。遗传图谱任何一类图谱都有可识别的标记。遗传图谱 的标记是什么呢?的标记是什么呢? 标记1 标记2 标记3 2.2.1 2.2.1 基因是首先被使用的标记基因是首先被使用的标记 在经典遗传学中,研究一种性状的遗传必须要求同在经典遗传学中,研究一种性状的遗传必须要求同 一性状至少一性状至少2种不同的存在形式或称表型。种不同的存在形式或称表型。 起初只有那些能通过视觉区分的基因表型用于研究。起初只有那些能通过视觉区分的基因表型用于研究。 最初的遗传图谱是在最初的遗传图谱是在20世纪初针对果蝇等生物使用世纪初针对果蝇等生物使用 基因作为标记构建的。基因作为标记构建的。 2.2.2 2.2.2

5、 用于遗传学作图的用于遗传学作图的dnadna标记标记 基因是非常有用的标记,但并不是理想的。原因:基因是非常有用的标记,但并不是理想的。原因: 1. 可用作标记的可用作标记的基因十分有限基因十分有限,许多性状都涉及,许多性状都涉及 多基因。多基因。 2. 高等生物基因组中存在高等生物基因组中存在大量的基因间隔区大量的基因间隔区,遗,遗 传图中留下大片的无标记区段。传图中留下大片的无标记区段。 3. 只有部分基因其等位基因成员可以通过常规实只有部分基因其等位基因成员可以通过常规实 验予以区分,因而产生的遗传图是不完整的。验予以区分,因而产生的遗传图是不完整的。 三种类型的三种类型的dna分子标

6、记:分子标记: 1. 限制性片段长度多态性限制性片段长度多态性(restriction fragment length polymorphisms, rflp) 2. 简单序列长度多态性简单序列长度多态性(simple sequence length polymorphisms, sslp) 3. 单核苷酸多态性单核苷酸多态性(single nucleotide polymorphisms, snp) 最早发现的最早发现的dnadna分子标记分子标记rflp:由于同源 染色体同一区段dna序列的差异,当用限制酶处理 时,可产生长度不同的限制性片段 对对rflp的检测主要是用的检测主要是用sou

7、thern杂交杂交的方法进行的方法进行 基本流程:基本流程: 组织或细胞组织或细胞基因组基因组dna限制性内切酶消化限制性内切酶消化 琼脂糖凝胶电泳琼脂糖凝胶电泳印迹转移至滤膜印迹转移至滤膜加入探针加入探针 杂交杂交洗膜洗膜放射自显影放射自显影获得反映个体特异性获得反映个体特异性 的的rflp图谱。图谱。 所用的探针位于染色体的不同位点,可以作为所用的探针位于染色体的不同位点,可以作为 一种分子标记,构建分子图谱。一种分子标记,构建分子图谱。 rflp标记的主要特点是:标记的主要特点是: (1)遍布于整个基因组;)遍布于整个基因组; (2)无表型效应)无表型效应,不受发育阶段及器官特异性限制不

8、受发育阶段及器官特异性限制 (3)共显性,可区分纯合子和杂合子共显性,可区分纯合子和杂合子; (4)结果稳定、可靠;)结果稳定、可靠; 用途:用途:rflp主要用于群体水平和系统发育研究上主要用于群体水平和系统发育研究上. 进行个体识别;绘制遗传图谱;目的基因定位;检进行个体识别;绘制遗传图谱;目的基因定位;检 测群体内或群体间序列差异程度;辅助育种等。测群体内或群体间序列差异程度;辅助育种等。 自自rflp问世以来,已经在基因定位及分型、遗传问世以来,已经在基因定位及分型、遗传 连锁图谱的构建、疾病的基因诊断等研究中得到了连锁图谱的构建、疾病的基因诊断等研究中得到了 广泛的应用。广泛的应用。

9、 共显性共显性: (两(两 个亲本的性个亲本的性 状在一个个状在一个个 体中同时出体中同时出 现,没有显现,没有显 隐关系)隐关系) sslp多态性信息量多态性信息量 由于重复单位的不同,微卫星存在着多种不同的类由于重复单位的不同,微卫星存在着多种不同的类 型。各类微卫星的频率在不同的生物体之间存在着显型。各类微卫星的频率在不同的生物体之间存在着显 著的差异。在著的差异。在人类人类基因组中,基因组中,最丰富的微卫星最丰富的微卫星是是(a)n(a)n、 (ac)n(ac)n、(aaan)n(aaan)n、(aan)n(aan)n和和(ag)n(ag)n。(at)n(at)n是植物是植物 基因组中

10、最丰富的微卫星。在基因组中最丰富的微卫星。在水稻水稻基因组中,基因组中,最丰富最丰富 的微卫星的微卫星是是(ga)n(ga)n和和(gt)n(gt)n。不同生物的基因组中,。不同生物的基因组中, 微卫星的丰度也差异较大。哺乳动物基因组中微卫星微卫星的丰度也差异较大。哺乳动物基因组中微卫星 的丰度约为植物基因组的的丰度约为植物基因组的5 5倍。在植物中,双子叶植倍。在植物中,双子叶植 物微卫星的丰度约为单子叶植物的物微卫星的丰度约为单子叶植物的3 3倍。倍。 1400 1200 1000 800 600 400 200 0 catg/gtac cttt/gaaa atc/tag gata/cta

11、t tgg/acc cag/gtc tct/ctc cgg/gcc att/taa ttg/aac gt/ca ga/ct ssr motif estimated number of ssr in the rice genome 在微卫星在微卫星dnadna中,简单序列的重复次数在同一中,简单序列的重复次数在同一 物种的不同品种或不同个体中存在着较大的差异。物种的不同品种或不同个体中存在着较大的差异。 也就是说,也就是说,微卫星座位上存在着非常丰富的等位基微卫星座位上存在着非常丰富的等位基 因因。例如,在水稻中,。例如,在水稻中,rflprflp座位的等位基因数为座位的等位基因数为2-2- 4

12、 4个,而微卫星的等位基因数为个,而微卫星的等位基因数为2-252-25个。从个。从多态性多态性 信息含量(信息含量(polymorphism information contentpolymorphism information content, picpic)来衡量,来衡量,rflprflp的的picpic值为值为0.390.39,而微卫星的,而微卫星的 picpic大于大于0.750.75。 多态性信息含量(多态性信息含量(polymorphism information contentpolymorphism information content,picpic):):在连锁分析中在连

13、锁分析中 一个遗传标记多态性可提供的信息量的度量。它是一个亲本为杂合子,另一亲一个遗传标记多态性可提供的信息量的度量。它是一个亲本为杂合子,另一亲 本为不同基因型的概率。本为不同基因型的概率。 复制滑移复制滑移 (replication slipping ):):在在dna复制过程中,当复制过程进行到模板链复制过程中,当复制过程进行到模板链 包含多个重复序列时,复制复合体会从模板链上暂时脱离,造成新合成链的包含多个重复序列时,复制复合体会从模板链上暂时脱离,造成新合成链的3端会端会 在短暂的时间内沿着模板链回缩,然后又与重复序列中的另外一组配对结合的现象。在短暂的时间内沿着模板链回缩,然后又与

14、重复序列中的另外一组配对结合的现象。 这样,复制会重新进行,但重复序列的某些部分会被多次复制。这样,复制会重新进行,但重复序列的某些部分会被多次复制。 ssr技术的优点是:技术的优点是: (1)在基因组中随机分布,检测的多态性频率高;)在基因组中随机分布,检测的多态性频率高; (2)pcr特异引物,重复性好;特异引物,重复性好; (3)共显性,操作相对简单。)共显性,操作相对简单。 问题是问题是: (1)ssr需要测序和设计引物,因而需要大量需要测序和设计引物,因而需要大量 的人力、物力和时间;的人力、物力和时间; (2)另外其种属特异性强,开发所需的费用高)另外其种属特异性强,开发所需的费用

15、高 昂,因此一些实验室进行了合作,共同开昂,因此一些实验室进行了合作,共同开 发微卫星引物。发微卫星引物。 3. snp(3. snp(单核苷酸多态性单核苷酸多态性) ) snp是指同一物种不同个体基因组是指同一物种不同个体基因组dna的等位序列上单个核的等位序列上单个核 苷酸存在差异的现象。其中最少一种在群体中的频率不小于苷酸存在差异的现象。其中最少一种在群体中的频率不小于 1;如果出现频率低于;如果出现频率低于1,则视作点突变。,则视作点突变。 snp只涉及单个碱基的变异,这种变异可只涉及单个碱基的变异,这种变异可 以由单个碱基的转换(包括以由单个碱基的转换(包括c与与t互换,互换, g与

16、与a互换),或颠换(包括互换),或颠换(包括c与与a、g与与 t、c与与g、a与与t互换)引起。互换)引起。 转换(转换(transition transition ):):核酸序列中一种核酸序列中一种嘌呤嘌呤( (或嘧啶或嘧啶) ) 被另一种被另一种嘌呤嘌呤( (或嘧啶或嘧啶) )置换。置换。 。 颠换(颠换(transversiontransversion ):):核酸序列中一种核酸序列中一种嘌呤嘌呤( (或嘧啶或嘧啶) ) 被任何一种被任何一种嘧啶嘧啶( (或嘌呤或嘌呤) )置换。置换。 根据根据snp在基因中的位置,在基因中的位置,snp可分为:可分为: 基因编码区基因编码区snp(c

17、oding snp, csnp) 基因周边基因周边snp(peripheral snp, psnp) 基因间基因间snp (intronicsnp, isnp) 从对生物的遗传性状的影响,从对生物的遗传性状的影响,csnp又可分为两种:又可分为两种: 1.同义同义csnp(synonymous csnp):snp引起的编码引起的编码 序列的改变并不影响其翻译的蛋白质的氨基酸序序列的改变并不影响其翻译的蛋白质的氨基酸序 列列; 2. 非同义非同义csnp(non-synonymous csnp):指碱:指碱 基序列的改变可使以其为蓝本翻译的蛋白质序列基序列的改变可使以其为蓝本翻译的蛋白质序列 发

18、生改变,从而影响了蛋白质的功能,这种改变发生改变,从而影响了蛋白质的功能,这种改变 常是导致生物性状改变的直接原因。常是导致生物性状改变的直接原因。 snp标记可用标记可用dna芯片技术检测:将不同的寡芯片技术检测:将不同的寡 核苷酸固定在芯片上,标记待测核苷酸固定在芯片上,标记待测dna,一次就,一次就 可检测很多可检测很多snp标记。标记。 尽管单一的尽管单一的snp所提供的信息量远小于现在常所提供的信息量远小于现在常 用的分子标记,但用的分子标记,但snp的数量极其丰富,并且的数量极其丰富,并且 可以自动化检验,因此其具有广泛的应用前景。可以自动化检验,因此其具有广泛的应用前景。 snp

19、数量比微卫星标记数要高出几个数量级。数量比微卫星标记数要高出几个数量级。 例如:例如:34个个snp这种相邻的界标构成的这种相邻的界标构成的 单体型(单体型(haplotype)就可以有)就可以有816种:种: haplotype:又称又称“单倍型单倍型”,“单元型单元型”。一条。一条 同源染色体上的等位基因或遗传标记所构成的组同源染色体上的等位基因或遗传标记所构成的组 合。合。 snp(single nucleotide snp(single nucleotide polymorphism)polymorphism)的一些特点的一些特点 人类不同群体中存在的人类不同群体中存在的snp 镰刀形

20、红细胞镰刀形红细胞 贫血症贫血症 2.3 2.3 遗传作图的方法遗传作图的方法 理论基础:理论基础:遗传学原理。遗传学原理。 基本方法:基本方法:两点测验法和三点测验法两点测验法和三点测验法 遗传作图遗传作图 (genetic mapping)(genetic mapping) 即遗传图谱即遗传图谱 的构建。它是利用遗传学的原理和方法,的构建。它是利用遗传学的原理和方法, 构建能反映基因组中遗传标记之间遗传关构建能反映基因组中遗传标记之间遗传关 系的图谱。因此,遗传作图中系的图谱。因此,遗传作图中“遗传遗传”二二 字,既是手段,也是目的。字,既是手段,也是目的。 部分连锁的原因是基因之间发生了

21、交换部分连锁的原因是基因之间发生了交换 从摩尔根时代开始,从摩尔根时代开始,连锁(连锁(linkagelinkage)分析)分析便成为遗传分析便成为遗传分析 的重要手段,更的重要手段,更是遗传作图的基础是遗传作图的基础。遗传标记之间的遗传。遗传标记之间的遗传 关系主要是通过连锁关系来反映。而连锁关系是通过重组关系主要是通过连锁关系来反映。而连锁关系是通过重组 率(率(percentage of recombinantspercentage of recombinants)来反映的。)来反映的。 重组型配子数重组型配子数 重组率重组率 (%) = (%) = x 100 x 100 配子总数配子

22、总数 19051905年创立了连锁分析,为遗传作图奠定了实验基础。年创立了连锁分析,为遗传作图奠定了实验基础。 果蝇的突变体果蝇的突变体: : 遗传作图的理论基础遗传作图的理论基础 根据连锁分析的结果,借助重组率可以绘制遗传图根据连锁分析的结果,借助重组率可以绘制遗传图 谱,确定遗传标记之间的遗传距离和排列顺序,形谱,确定遗传标记之间的遗传距离和排列顺序,形 成比较完整的连锁群,并由各连锁群构成基因组的成比较完整的连锁群,并由各连锁群构成基因组的 遗传图谱。遗传图谱。 连锁分析给出的遗传标记在染色体上的相对位置是连锁分析给出的遗传标记在染色体上的相对位置是 相当准确的,也提供了基因间的大致距离

23、,他们为相当准确的,也提供了基因间的大致距离,他们为 基因组测序提供了工作框架。基因组测序提供了工作框架。 图谱构建图谱构建 abab abab abab abab abababab abab abab f1f1基因型基因型表型表型 ab/abab/ab abab ab/abab/ab abab ab/abab/ab abab ab/abab/ababab 三点杂交试验分析 子代基因型子代基因型 观测数观测数 推测重组事件推测重组事件 abc/abcabc/abc 987987无重组,均为亲代基因型无重组,均为亲代基因型 abc/abcabc/abc abc/abcabc/abc 5151a

24、a和和bcbc之间发生一次重组之间发生一次重组 abc/abcabc/abc abc/abcabc/abc 6363abab和和c c之间发生一次重组之间发生一次重组 abc/abcabc/abc abc/abcabc/abc 2 2 发生二次重组,一次发生在发生二次重组,一次发生在c c与与a a 之间,一次发生在之间,一次发生在c c与与b b之间之间 abc/abcabc/abc 系谱分析作图系谱分析作图 细菌遗传作图采用的都是生化标记细菌遗传作图采用的都是生化标记 细菌基因作图的原理细菌基因作图的原理 用遗传学技术作图对于指导基因组计划的测序用遗传学技术作图对于指导基因组计划的测序 阶

25、段还是远远不够的,因为遗传图谱的局限性:阶段还是远远不够的,因为遗传图谱的局限性: 1. 遗传图的遗传图的分辨率有限分辨率有限:依赖于所得到的交:依赖于所得到的交 换数目。换数目。 2. 遗传图的遗传图的精确性较低精确性较低:重组热点的存在。:重组热点的存在。 3. 遗传图的遗传图的准确率有限准确率有限:环境因素和取样误:环境因素和取样误 差,分子标记的排列有时会出现差错。差,分子标记的排列有时会出现差错。 物理图谱是以物理图谱是以物理距离物理距离来表示各遗传标记来表示各遗传标记 之间或之间或dna序列两点之间在序列两点之间在dna分子上的分子上的 位置,以位置,以实际的碱基对长度实际的碱基对

26、长度来度量其物理来度量其物理 距离。距离。 3.1 限制性作图限制性作图 3.1.1 3.1.1 限制性作图限制性作图-小分子小分子dnadna 在连续出现在连续出现2个或多个相同酶切位点区段,其排列个或多个相同酶切位点区段,其排列 序列可有多种选择,此时采用序列可有多种选择,此时采用部分酶切的办法部分酶切的办法使使 该区段只发生一次酶切,这称为部分限制作图。该区段只发生一次酶切,这称为部分限制作图。 部分限制作图为构建完整的图谱提供了必须的信部分限制作图为构建完整的图谱提供了必须的信 息。但如果有多个限制位点,这种方法就显得力息。但如果有多个限制位点,这种方法就显得力 不从心。特别是内部含有

27、大小相同的片段时,重不从心。特别是内部含有大小相同的片段时,重 叠的片段无法区分,使排序变得非常复杂。叠的片段无法区分,使排序变得非常复杂。 一个较简单的变通策略使我们可以忽略大量的片一个较简单的变通策略使我们可以忽略大量的片 段。这种方法是将标记物加到要分析的段。这种方法是将标记物加到要分析的dna分子分子 两端,进行部分酶切处理后,很多产物成为两端,进行部分酶切处理后,很多产物成为不可不可 见见的,我们利用的,我们利用可见的可见的部分大小,确定那些未定部分大小,确定那些未定 位的切点与位的切点与dna分子末端的相对位置。分子末端的相对位置。 端粒端粒:用于保护线状的:用于保护线状的 dna

28、 不被细胞内的核酸酶降不被细胞内的核酸酶降 解,以形成稳定的结构。解,以形成稳定的结构。 着丝粒着丝粒:有丝分裂过程中纺锤丝的结合位点,:有丝分裂过程中纺锤丝的结合位点, 使染使染 色体在分裂过程中能正确分配到子细胞中色体在分裂过程中能正确分配到子细胞中 。在。在 yac 中起到保证一个细胞内只有一个人工染色体的作用。中起到保证一个细胞内只有一个人工染色体的作用。 自主复制序列:自主复制序列:一段特殊的序列,含有酵母菌中一段特殊的序列,含有酵母菌中 dna 进行双向复制所必须的信号。进行双向复制所必须的信号。 yac文库装载的文库装载的 dna片段的大片段的大 小一般可达小一般可达 200-5

29、00kb200-500kb,有,有 的可达的可达1mb以上。以上。 yac yac 载体的工作原理载体的工作原理 yacyac的主要缺点:的主要缺点: 1 1存在高比例的嵌合体存在高比例的嵌合体,即一个,即一个yacyac克隆含有两克隆含有两 个本来不相连的独立片段;个本来不相连的独立片段; 2 2部分克隆子不稳定部分克隆子不稳定,在转代培养中可能会发,在转代培养中可能会发 生缺失或重排;生缺失或重排; 3 3难与酵母染色体区分开难与酵母染色体区分开,因为,因为yacyac与酵母染色与酵母染色 体具有相似的结构体具有相似的结构; 4 4转化效率低。转化效率低。 细菌人工染色体(细菌人工染色体(

30、bac):):以细菌以细菌f f因子为基础,因子为基础, 人工构建的环状的人工构建的环状的dnadna分子。可以携带大于分子。可以携带大于100-100- 350kb350kb的外源的外源dnadna片段。片段。 选择标记:氯霉素抗性基因等。选择标记:氯霉素抗性基因等。 bacbac载体的优点:载体的优点: 较为稳定;没有嵌合现象;较为稳定;没有嵌合现象; 转化效率高;转化效率高; bacbac克隆易于操作和克隆易于操作和dnadna提取;提取; bacbac文库筛选方便。文库筛选方便。 定义:用荧光标定义:用荧光标 记的核酸探针在记的核酸探针在 染色体上进行的染色体上进行的 杂交方法,以确杂

31、交方法,以确 定与探针互补的定与探针互补的 核酸序列在染色核酸序列在染色 体上的位置和分体上的位置和分 布。布。 实验流程:实验流程: fish样本的制备样本的制备探针的制备探针的制备探针标记探针标记杂交杂交(染色体显带)(染色体显带) 荧光荧光显微镜显微镜检测检测结果分析。结果分析。 一段一段dna序列要成为序列要成为sts需满足两个条件:需满足两个条件: 1.它的序列必须是已知的,便于它的序列必须是已知的,便于pcr检测;检测; 2. sts必须在拟研究的染色体上有唯一的定位。必须在拟研究的染色体上有唯一的定位。 序列标签位点(序列标签位点(sequence-tagged sitesequ

32、ence-tagged site),),是是 已知核苷酸序列的已知核苷酸序列的dna片段,是基因组中任何片段,是基因组中任何 单拷贝的短单拷贝的短dna序列,长度在序列,长度在100500bp之间。之间。 任何任何dna序列,只要知道它在基因组中的位置,序列,只要知道它在基因组中的位置, 都能被用作都能被用作sts标签。标签。 寻找寻找sts的方法的方法 1)从)从est序列中寻找序列中寻找 2)sslp 3)随机基因组序列)随机基因组序列 1. sts在染色体上的位置是确定的。在染色体上的位置是确定的。 2. 两个不同的两个不同的sts出现在同一片段的机会取决出现在同一片段的机会取决 于它们

33、在基因组中的位置,彼此接近,同于它们在基因组中的位置,彼此接近,同 时出现在同一片段的机会就大,反之则小。时出现在同一片段的机会就大,反之则小。 辐射杂种作图辐射杂种作图 sts作图与连锁分析是一样的,不同之处仅在作图与连锁分析是一样的,不同之处仅在 于两个标记间的图距是根据于两个标记间的图距是根据分离频率分离频率来计算的。来计算的。 主要采用的方法是辐射杂种作图。主要采用的方法是辐射杂种作图。 dnadna顺序的组装顺序的组装 基因组的每条染色体长度可达数百万碱基对以上,将基因组的每条染色体长度可达数百万碱基对以上,将 链终止法阅读的小片段链终止法阅读的小片段dnadna组装成真实的排列顺序

34、是一组装成真实的排列顺序是一 项浩繁而精细的工作。项浩繁而精细的工作。dnadna顺序的组装主要有顺序的组装主要有3 3种方法:种方法: 鸟枪法(鸟枪法( shotgunshotgun );); 克隆重叠群法(克隆重叠群法(clone contigclone contig); 引导鸟枪法(引导鸟枪法( directed shotgun directed shotgun )。)。 第四章第四章 序列组装序列组装 测序与序列组装的有关概念测序与序列组装的有关概念 随机测序与序列组装随机测序与序列组装 鸟枪法的顺序组装是直接从已测序的小片段中鸟枪法的顺序组装是直接从已测序的小片段中 寻找彼此重叠的测

35、序克隆,然后依次向两侧邻接寻找彼此重叠的测序克隆,然后依次向两侧邻接 的序列延伸。这一方法不需要预先了解任何基因的序列延伸。这一方法不需要预先了解任何基因 组的情况,即使缺少遗传图谱和物理图谱,也可组的情况,即使缺少遗传图谱和物理图谱,也可 以完成整个基因组的组装。以完成整个基因组的组装。 鸟枪法的优势:鸟枪法的优势: 鸟枪法的主要优势在于:鸟枪法的主要优势在于:测序速度快,并且无测序速度快,并且无 须提供相关的遗传图谱和物理图谱。须提供相关的遗传图谱和物理图谱。 2020世纪世纪9090年代末,用鸟枪法在较短时间内成功地完成了年代末,用鸟枪法在较短时间内成功地完成了 流感嗜血杆菌的基因组测序

36、,引发了一场微生物基因组测流感嗜血杆菌的基因组测序,引发了一场微生物基因组测 序的热潮。这些研究项目的实施,表明鸟枪法测序可以组序的热潮。这些研究项目的实施,表明鸟枪法测序可以组 建一条流水工作线,一个科研小组可以分工合作,一部分建一条流水工作线,一个科研小组可以分工合作,一部分 人专门负责制备人专门负责制备dnadna,一部分人负责测序和数据分析。经,一部分人负责测序和数据分析。经 验证明,一个验证明,一个5mb5mb大小基因组的测序可以在一年内完成。大小基因组的测序可以在一年内完成。 鸟枪法鸟枪法 (a a)dnadna分子被打断分子被打断 ,产生小片段,产生小片段dnadna (b b)

37、小片段)小片段dnadna 分别测序分别测序 (c c)根据)根据dnadna序列序列 的重叠关系,构建的重叠关系,构建 重叠群重叠群 agccaatgcattagc atgcagccaatgcat 重叠群重叠群 dnadna序列序列 小片段小片段dnadna dnadna分子分子 鸟枪法序列组装鸟枪法序列组装 鸟枪法顺序组装流程鸟枪法顺序组装流程 流感嗜血杆菌的基因组测序流感嗜血杆菌的基因组测序 解决办法解决办法: :通过相邻已知通过相邻已知 顺序作为探针筛选已有顺序作为探针筛选已有 的基因组文库的基因组文库 解决办法解决办法: :利用其它宿主菌与利用其它宿主菌与 载体重新构建文库载体重新构

38、建文库 鸟枪法的局限:鸟枪法的局限: 对于结构复杂的大基因组而言,鸟枪法的序列组装对于结构复杂的大基因组而言,鸟枪法的序列组装 的起始阶段工作量非常大。的起始阶段工作量非常大。首先需要对小片段进行首先需要对小片段进行 序列分析,找出重叠群,需要分析的小片段的数量序列分析,找出重叠群,需要分析的小片段的数量 太大,达到现有计算机能力的极限。此外,太大,达到现有计算机能力的极限。此外,基因组基因组 中普遍存在的重复序列是十分棘手的问题,在序列中普遍存在的重复序列是十分棘手的问题,在序列 组装时可能出现错误连接,使某些片段从原位置跳组装时可能出现错误连接,使某些片段从原位置跳 到另一无关位置。到另一

39、无关位置。因此,对于缺少重复顺序的小基因此,对于缺少重复顺序的小基 因组(因组(5mb5mb)而言,鸟枪法仍为最佳的选择,但对)而言,鸟枪法仍为最佳的选择,但对 于大基因组而言,还需要更加有效的策略。于大基因组而言,还需要更加有效的策略。 重叠群法或图位法:重叠群法或图位法: 实践证明,在实践证明,在5mb5mb的范围内,用鸟枪法进行测序组装可以的范围内,用鸟枪法进行测序组装可以 获得较好的效果。因此,对于大基因组而言,可以先将基获得较好的效果。因此,对于大基因组而言,可以先将基 因组因组dnadna分解为若干个较大的分解为若干个较大的dnadna片段,构建基因组文库。片段,构建基因组文库。

40、每个大片段克隆可以独立进行鸟枪法测序,亦可以组建重每个大片段克隆可以独立进行鸟枪法测序,亦可以组建重 叠群后进行鸟枪法测序。因此称为克隆重叠群测序法。叠群后进行鸟枪法测序。因此称为克隆重叠群测序法。 更理想的是,重叠群经分子标记定位于遗传图谱或物理图更理想的是,重叠群经分子标记定位于遗传图谱或物理图 谱上,并利用分子标记验证顺序组装的结果。因此,该方谱上,并利用分子标记验证顺序组装的结果。因此,该方 法又称为图位法。法又称为图位法。 限定测序与序列组装限定测序与序列组装 将支架锚定到物理图上将支架锚定到物理图上 指导鸟枪法(指导鸟枪法( the directed shotgun approac

41、hthe directed shotgun approach )建立在建立在 基因组图谱基础上的基因组图谱基础上的”鸟枪法鸟枪法”。是对随机鸟枪法的改。是对随机鸟枪法的改 良和发展。要是为了克服随机鸟枪法组装中,由于重复良和发展。要是为了克服随机鸟枪法组装中,由于重复 序列引起的错误排序。序列引起的错误排序。 例如,在人类基因组测序中,要复盖例如,在人类基因组测序中,要复盖99%99%的基因组序的基因组序 列,就要完成列,就要完成70007000万次测序(按每次可读万次测序(按每次可读500bp500bp左右左右 算)。如果完全采用随机鸟枪法,要从算)。如果完全采用随机鸟枪法,要从700070

42、00万序列中寻万序列中寻 找重叠的序列,又要避免广泛存在的高密度重复顺序的找重叠的序列,又要避免广泛存在的高密度重复顺序的 干扰,显然是做不到的。干扰,显然是做不到的。 指导测序与序列组装指导测序与序列组装 人类基因组测序的安排:人类基因组测序的安排: (1 1)构建插入片段平均为)构建插入片段平均为2kb2kb的人类基因组质粒文的人类基因组质粒文 库,每个克隆经双向测序可读顺序约库,每个克隆经双向测序可读顺序约500bp500bp。 (2 2)构建插入片段平均为)构建插入片段平均为10kb10kb的人类基因组质粒的人类基因组质粒 文库,每个克隆经双向测序读取端部序列约文库,每个克隆经双向测序

43、读取端部序列约500bp500bp。 人类基因组中大多数重复顺序的长度在人类基因组中大多数重复顺序的长度在5kb5kb或略长,或略长, 10kb10kb文库的构建有助于在序列组装时校正重复顺序文库的构建有助于在序列组装时校正重复顺序 产生的差错。产生的差错。 (3 3)参考人类基因组图)参考人类基因组图, ,特别是大量的特别是大量的stssts位标作为位标作为 基点基点, ,进行序列组装,排成重叠克隆群。进行序列组装,排成重叠克隆群。 2kb clones2kb clones 10kb clones10kb clones10kb clones10kb clones 5kb 5kb 重复序列重复序列 10kb10kb克隆可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论