第十三章基因组学_第1页
第十三章基因组学_第2页
第十三章基因组学_第3页
第十三章基因组学_第4页
第十三章基因组学_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十三章基因组学 第九章基因工程和基因组学 第一节 基因组学 概述 v基因组学(genomics) : 遗传学研究进入分子水平后发展起来的 一个分支,主要研究生物体内基因组的分子 特征。 * 研究对象:以整个基因组为研究单位,而 不以单个基因为单位作为研究对象。 * 研究目标:认识基因组的结构、功能和进 化; 阐明整个基因组所包含的遗传信息和相 互关系; 充分利用有效资源,预防和治疗人类疾 病。 基因组基因组(Genome):又称染色体组,是指一个物种单又称染色体组,是指一个物种单 倍体的染色体数目,是生物体全部遗传物质的总和。倍体的染色体数目,是生物体全部遗传物质的总和。 基因组学基因组学(

2、Genomics):对生物体所有基因进行基因对生物体所有基因进行基因 组作图组作图(包括遗传图谱、物理图谱、转录图谱包括遗传图谱、物理图谱、转录图谱)、核苷、核苷 酸序列分析、基因定位和基因功能分析的一门科学。酸序列分析、基因定位和基因功能分析的一门科学。 最终目标:最终目标:获得生物体全部基因组序列,注解基因获得生物体全部基因组序列,注解基因 组所含的全部基因,鉴定所有基因的功能及基因间相组所含的全部基因,鉴定所有基因的功能及基因间相 互作用关系,并阐明基因组的复制及进化规律。互作用关系,并阐明基因组的复制及进化规律。 一、一、基因组学的概念基因组学的概念 生物生物基因组大小(基因组大小(b

3、p) T4T4噬菌体噬菌体 T4 phage2.02.0105 5 大肠杆菌大肠杆菌 Escherichia coli4.24.2106 6 酵母酵母 Sccharomyces cereviside1.51.5107 7 拟南芥拟南芥 Arabidopsis thaliana1.01.0108 8 线虫线虫 Caenorhbditis elegans1.01.0108 8 果蝇果蝇 Drosophila melanogaster1.651.65108 8 水稻水稻 Oryza sativa4.34.3108 8 小鼠小鼠 Mus musculus3.03.0109 9 人类人类Homo sap

4、iens3.33.3109 9 玉米玉米 Zea mays5.45.4109 9 小麦小麦Triticum aestivum1.61.61010 10 不同生物基因组大小 1. 人类基因组计划人类基因组计划 与曼哈顿原子与曼哈顿原子 计划、阿波罗登月计划并称的人类科学计划、阿波罗登月计划并称的人类科学 史上的重大工程。于史上的重大工程。于1990年首先在美国启年首先在美国启 动,后有德、动,后有德、 日、英、法、中等国的科学家先后正式加入。日、英、法、中等国的科学家先后正式加入。 (一)(一) 人类基因组人类基因组 19901990年,美国国会批准美国的年,美国国会批准美国的“人类基因组计划人

5、类基因组计划” 在在1010月月1 1日正式启动。其总体规日正式启动。其总体规 划是准备在划是准备在1515年内年内 (1990199020052005)至少投入)至少投入3030亿美元,分析人类的基因亿美元,分析人类的基因 组组30 30 亿个碱基对亿个碱基对。 20032003年,年,6 6国科学家宣布人类基因组序列图绘制成国科学家宣布人类基因组序列图绘制成 功,功,HGPHGP的所有目标全部实现。覆盖人类基因组所含的所有目标全部实现。覆盖人类基因组所含 基因区域的基因区域的99%99%,精确率达到,精确率达到99.99%99.99%,比原计划提前,比原计划提前 两年多,耗资两年多,耗资2

6、727亿美元。亿美元。 人类基因组计划人类基因组计划 人类基因组人类基因组 u核基因组核基因组DNA的总长约的总长约3109bp,含有,含有24 条线性条线性DNA分子,最长的有分子,最长的有250 Mb,最短的,最短的 55 Mb。 30亿个碱基对。亿个碱基对。 u线粒体基因组是长度为线粒体基因组是长度为16569 bp的环状的环状 DNA分子,每个细胞平均含有分子,每个细胞平均含有800个线粒体,个线粒体, 每个线粒体含每个线粒体含10个基因组拷贝。个基因组拷贝。 以每以每10cm 书写书写60个字母计算,个字母计算,30亿个碱基对连接的亿个碱基对连接的 长度可达长度可达5 000 km,

7、相当于北京到香港来回的距离。,相当于北京到香港来回的距离。 为人类的基因组研究提供重要的依据。为人类的基因组研究提供重要的依据。 19961996年,酵母菌基因组测序。年,酵母菌基因组测序。 19981998年年1212月,线虫完整基因组序列的月,线虫完整基因组序列的 20002000年年3 3月,果蝇的基因组测序月,果蝇的基因组测序 20012001年年1212月月1414日,拟南芥基因组的完整图谱。日,拟南芥基因组的完整图谱。 (二)(二) 其他生物基因组其他生物基因组 我国超级杂交稻(籼稻)基因组计划我国超级杂交稻(籼稻)基因组计划 2001年年7月启动月启动 2002年年4月月5日日S

8、cience。 材料:籼稻材料:籼稻“93119311”。 完成单位:华大基因研究中心、中科院遗传与发完成单位:华大基因研究中心、中科院遗传与发 育生物学研究所等育生物学研究所等1212个单位。个单位。 水平:水稻基因组的总基因数约为水平:水稻基因组的总基因数约为46022460225561555615 个,工作框架图序列已覆盖水稻整个基因组个,工作框架图序列已覆盖水稻整个基因组9292以上以上 的基因。的基因。 方法:方法:“鸟枪射击法鸟枪射击法”,利用国产曙光,利用国产曙光20002000、曙、曙 光光30003000超级计算机超级计算机(1000(1000亿次亿次/ /秒秒) )对随机对

9、随机DNADNA碎片进行碎片进行 排序和组装。排序和组装。 水稻基因组计划水稻基因组计划 国际水稻(粳稻)基因组计划始于国际水稻(粳稻)基因组计划始于1998年,日本、年,日本、 美国、中国、法国等国家和地区参加。中国负责第美国、中国、法国等国家和地区参加。中国负责第 4号染色体:号染色体:36 Mb (占占910%)。 国际水稻基因组测序计划国际水稻基因组测序计划 2002年年12月月21日日Nature,中国第四号染色体。,中国第四号染色体。 材料:粳稻材料:粳稻“日本晴日本晴”。 完成单位:中科院国家基因研究中心等完成单位:中科院国家基因研究中心等4 4家单位。家单位。 水平:第四号染色

10、体中的总碱基数目为水平:第四号染色体中的总碱基数目为0.350.35亿碱亿碱 基对,覆盖全长序列基对,覆盖全长序列9898的区域,只剩下的区域,只剩下7 7个小空洞,个小空洞, 碱基序列的精确度达到碱基序列的精确度达到99.99%99.99%。完整测定的着丝粒序。完整测定的着丝粒序 列在高等生物中属于首次。列在高等生物中属于首次。 国际水稻基因组测序计划国际水稻基因组测序计划 u水稻是第一个完成基因组全序列测定的农作物,核水稻是第一个完成基因组全序列测定的农作物,核 基因组含有基因组含有12条染色体,总长约条染色体,总长约389Mb,1号染色体号染色体 最大为最大为43.2Mb,10号染色体最

11、小号染色体最小22.6Mb。全基因组。全基因组 预测约含有预测约含有4万个基因。万个基因。 u水稻双链闭环线粒体基因组大小为水稻双链闭环线粒体基因组大小为491kb,叶绿体,叶绿体 基因组基因组134.5kb C值:值:是指一个单倍体是指一个单倍体 基因组中基因组中DNA的总量。的总量。 值悖理值悖理 (C value paradox):):物种的物种的C 值和它的进化复杂性之值和它的进化复杂性之 间无严格对应关系的现间无严格对应关系的现 象称为象称为C 值悖理,是复值悖理,是复 杂生物基因组的一个普杂生物基因组的一个普 遍特征遍特征 (三)(三) C值悖理和值悖理和N值悖理值悖理 (三)(三

12、) C值悖理和值悖理和N值悖理值悖理 N值:值:是指生物体所含有的基因数目。是指生物体所含有的基因数目。 N值悖理(值悖理(N value paradox):复杂性:复杂性 不同的生物种属所具有的基因数目与其生物不同的生物种属所具有的基因数目与其生物 结构的复杂性不成比例的现象。结构的复杂性不成比例的现象。 如结构比较简单的线虫含有的基因数为如结构比较简单的线虫含有的基因数为1.91.9 万个万个, , 比线虫更复杂的果蝇基因数为比线虫更复杂的果蝇基因数为1.81.8万万 个个, , 水稻的基因数约水稻的基因数约4 4万个万个, , 最复杂的人类最复杂的人类 其基因总数约其基因总数约3 3万个

13、。万个。 四、基因组学研究内容四、基因组学研究内容 (一)结构基因组学(一)结构基因组学(structural genomics) 通过基因作图、核苷酸序列分析确定基因通过基因作图、核苷酸序列分析确定基因 组成、进行基因定位的科学。组成、进行基因定位的科学。 遗传信息在染色体上遗传信息在染色体上,但染色体不能直接用但染色体不能直接用 来测序来测序,必须将基因组这一巨大的研究对象进必须将基因组这一巨大的研究对象进 行分解行分解,使之成为较易操作的小的结构区域使之成为较易操作的小的结构区域,这这 个过程就是基因作图。完成基因组图谱构建个过程就是基因作图。完成基因组图谱构建 之后,就可以利用图谱进行

14、基因组序列测定之后,就可以利用图谱进行基因组序列测定 和组装。和组装。 四、基因组学研究内容四、基因组学研究内容 (二)功能基因组学(二)功能基因组学(functional genomics) u利用结构基因组所提供的信息和产物,研利用结构基因组所提供的信息和产物,研 究基因组功能表达的一门分支学科。究基因组功能表达的一门分支学科。 u主要研究内容主要研究内容: 基因的识别、鉴定和克隆。包括新策略、新技术、基因的识别、鉴定和克隆。包括新策略、新技术、 新方法的创立和各种基因组数据的建立;新方法的创立和各种基因组数据的建立; 基因结构与功能及其相互关系的研究。包括基因基因结构与功能及其相互关系的

15、研究。包括基因 变异体的系统鉴定和目录的绘制;基因表达谱的编变异体的系统鉴定和目录的绘制;基因表达谱的编 制、基因结构与功能关系的鉴定、基因相互作用网制、基因结构与功能关系的鉴定、基因相互作用网 络图的编制;络图的编制; 基因表达调控的研究基因表达调控的研究 四、基因组学研究内容四、基因组学研究内容 (三)蛋白质组学(三)蛋白质组学(proteomics) 研究细胞内蛋白质组成及其活动规律。旨研究细胞内蛋白质组成及其活动规律。旨 在阐明生物体全部蛋白质的表达模式及功能在阐明生物体全部蛋白质的表达模式及功能 模式模式,内容包括鉴定蛋白质表达、存在方式、内容包括鉴定蛋白质表达、存在方式、 结构、功

16、能和相互作用方式等。结构、功能和相互作用方式等。 基因是遗传信息的携带者基因是遗传信息的携带者,而全部生物功能而全部生物功能 的执行者却是蛋白质的执行者却是蛋白质, 仅仅从基因的角度来研仅仅从基因的角度来研 究是远远不够的。究是远远不够的。 第第 2节节 基因组图谱构建基因组图谱构建 基因组计划的目的是获得全基因组序列,并对其进行基因组计划的目的是获得全基因组序列,并对其进行 解读。解读。DNA测序每次反应仅能读取测序每次反应仅能读取1000bp的长度,的长度, 因此,基因组测序的基础是基因组图谱的构建。因此,基因组测序的基础是基因组图谱的构建。 鸟枪射击法鸟枪射击法 (shotgun) 基因

17、基因 组序列测定组序列测定 第第 2节节 基因组图谱构建基因组图谱构建 基因组测序策略基因组测序策略 重叠群法重叠群法 相互存在重叠序列的一组克隆。根据重相互存在重叠序列的一组克隆。根据重 叠群的相对位置讲各个克隆首尾相连,长度可达百万叠群的相对位置讲各个克隆首尾相连,长度可达百万 级级bp。对单个重叠群,采用鸟枪法测序,然后进行。对单个重叠群,采用鸟枪法测序,然后进行 组装。这是由上而下(组装。这是由上而下(up to down)的测序策略。)的测序策略。 直接鸟枪法直接鸟枪法 首先进行全基因组鸟枪法测序,再用首先进行全基因组鸟枪法测序,再用 分子标记为起点强鸟枪分子标记为起点强鸟枪DNA片

18、段组装。这是由下而片段组装。这是由下而 上(上(bottom to up)的测序策略。这种方法依赖于高)的测序策略。这种方法依赖于高 密度分子标记基因组图谱。密度分子标记基因组图谱。 基因组图谱分为遗传图谱和物理图谱。基因组图谱分为遗传图谱和物理图谱。 (一)遗传标记(一)遗传标记 u遗传标记就是遗传物质的特殊的易于识别的遗传标记就是遗传物质的特殊的易于识别的 多态性表现形式,它包括形态标记、细胞学标多态性表现形式,它包括形态标记、细胞学标 记、生化标记和分子标记。记、生化标记和分子标记。 形态标记:主要指可以观察到的一些性状形态标记:主要指可以观察到的一些性状,如种皮颜如种皮颜 色、眼色、株

19、高等。色、眼色、株高等。 细胞学标记:细胞学标记是指能明确显示遗传多态细胞学标记:细胞学标记是指能明确显示遗传多态 性的细胞学特征。性的细胞学特征。 生化标记:主要是同工酶及种子贮藏蛋白,有时又生化标记:主要是同工酶及种子贮藏蛋白,有时又 称蛋白质标记。称蛋白质标记。 分子标记:主要指分子标记:主要指DNA水平上的标记。水平上的标记。 DNA标记标记 以以DNA为基础的分子标记主要包括为基础的分子标记主要包括 基于杂交的分子标记,如基于杂交的分子标记,如RFLP。 基于基于PCR的分子标记,如的分子标记,如RAPD、AFLP、 SSR (又称又称microsatellite )、AFLP 等。

20、等。 基于基于DNA序列和芯片的分子标记,如序列和芯片的分子标记,如SNP (single nucleotide polymorphism)。)。 RAPD由由Williams 等(等(1990)和)和Welsh等等 (1990)分别发展起来的分子标记技术。这)分别发展起来的分子标记技术。这 一技术是以基因组一技术是以基因组DNA为模板,采用随机设为模板,采用随机设 计的单个寡核甘酸序列(一般为计的单个寡核甘酸序列(一般为10bp)为引)为引 物,通过物,通过PCR扩增,产生不连续的扩增,产生不连续的DNA产物,产物, 用于检测用于检测DNA序列的多态性序列的多态性。 RAPD (Random

21、 amplified polymorphic DNA) 重复序列重复序列 串联重复序列(串联重复序列(tandem repeated tandem repeated sequencesequence),其重复单位首尾相连,成串排列),其重复单位首尾相连,成串排列 (Flavell 1986Flavell 1986)。)。 散布重复序列(散布重复序列(interspersed repeated interspersed repeated sequencesequence),其重复单位与其它无关序列或单),其重复单位与其它无关序列或单 拷贝序列相间排列。拷贝序列相间排列。 SSR (simple

22、sequence repeats) 或微卫星或微卫星(microsatellite ) 微卫星微卫星DNA序列或序列或SSR又称短串联重复序列又称短串联重复序列 (short sequence repeat,STR),它是由几个),它是由几个 核甘酸(一般核甘酸(一般16个)为重复单位簇集而成的串个)为重复单位簇集而成的串 联重复序列,可随机的分布在整个基因组的不联重复序列,可随机的分布在整个基因组的不 同位置上。微卫星长度具有高度变异性,并且同位置上。微卫星长度具有高度变异性,并且 这种多态性常常表现复等位性,两端的序列多这种多态性常常表现复等位性,两端的序列多 是相对保守的单拷贝序列,因而

23、可以根据两端是相对保守的单拷贝序列,因而可以根据两端 的序列设计一对特异引物,扩增每个位点的微的序列设计一对特异引物,扩增每个位点的微 卫星序列,从而揭示其卫星序列,从而揭示其长度的多态性(长度的多态性(simple sequence length polymorphism,SSLP)。)。 SSR ISSR是一种新型的分子标记。与是一种新型的分子标记。与SSR 相反,直接用同位素标记相反,直接用同位素标记SSR序列,序列, 扩增扩增2个个SSR间的单拷贝序列。为了增间的单拷贝序列。为了增 加扩增的特异性,在引物的加扩增的特异性,在引物的5和和3端分端分 别加入别加入12个选择性碱基,引物长度

24、个选择性碱基,引物长度 1618bp。 ISSR(inter-ssr) AFLP结合了结合了RFLP和和RAPD技术的优点。技术的优点。 AFLP的基本原理是基于的基本原理是基于PCR的扩增基因组的扩增基因组 DNA限制性片段多态性。基因组限制性片段多态性。基因组DNA先用限制先用限制 性内切酶切割,然后将双链接头(性内切酶切割,然后将双链接头(adapter)连)连 接到接到DNA片段的末端,通过选择在片段的末端,通过选择在3端分别添端分别添 加加13个选择性碱基的不同引物,选择性地识个选择性碱基的不同引物,选择性地识 别具有特异配对顺序的酶切片段并与之结合,别具有特异配对顺序的酶切片段并与

25、之结合, 从而实现特异扩增。从而实现特异扩增。 AFLP ( Amplicon fragment length polymorphism) AFLP反应过程示意图反应过程示意图 遗传信息由遗传信息由DNA mRNA 蛋白质。蛋白质。 一个典型的真核生物一个典型的真核生物mRNA分子:分子:5- U TR ( 5端端 转录非翻译区转录非翻译区) , ORF (开放阅读框架开放阅读框架) ,3- U TR ( 3端端 转录非翻译区转录非翻译区) ,polyA 任何一个基因,任何一个基因,cDNA 的的5端或端或3端的有限序列即端的有限序列即 可特异性地代表生物体某种组织某个时期的一个表达可特异性地

26、代表生物体某种组织某个时期的一个表达 基因。基因。EST 的数目可以显示所代表的基因的拷贝数的数目可以显示所代表的基因的拷贝数 EST (expressed sequence tags) 从组织细胞中提取总从组织细胞中提取总mRNA ,构建成标准,构建成标准 cDNA 文库,然后从中挑取大量克隆,利用文库,然后从中挑取大量克隆,利用 载体通用引物测出插入载体的载体通用引物测出插入载体的cDNA 片段片段5端端 或或3端端300 - 500 碱基的序列。碱基的序列。 将测序所得的将测序所得的EST 与与dbEST 等数据库中的等数据库中的 数据进行比较分析数据进行比较分析,根据核酸或蛋白质序列的

27、根据核酸或蛋白质序列的 同源性比较,可以鉴定出哪些同源性比较,可以鉴定出哪些EST 代表已知代表已知 基因,哪些基因,哪些EST 代表未知基因。代表未知基因。 EST 序列标签位点(序列标签位点(sequence tagged site) 是一小段是一小段DNA序列。每个基因组仅序列。每个基因组仅1个拷贝,个拷贝, 很容易分辨。很容易分辨。STS要满足要满足2个条件:个条件: 是一段已知的序列,可据此涉及是一段已知的序列,可据此涉及PCRPCR引物来检测引物来检测 不同不同DNADNA片断中是否存在片断中是否存在 这一序列。这一序列。 STSSTS在染色体上必须是独一无二的。如果在基在染色体上

28、必须是独一无二的。如果在基 因组中有多个位点出现,作图数据将含混不清。因组中有多个位点出现,作图数据将含混不清。 常见的寻找常见的寻找STS的方法:的方法: EST、 SSLP、 随机基因组序列随机基因组序列 STS 单核苷酸多态性是指基因组序列中由于单单核苷酸多态性是指基因组序列中由于单 个核苷酸个核苷酸(,)的替换而引起的多态性。通常的替换而引起的多态性。通常 SNPs不包括碱基的插入、缺失以及重复序列拷贝数不包括碱基的插入、缺失以及重复序列拷贝数 的变化。这种标记只有两种等位基因。的变化。这种标记只有两种等位基因。 人类基因组的编码基因中有人类基因组的编码基因中有2020万个万个SNPs

29、, SNPs, 在非编码在非编码 区的数目可能还要多区的数目可能还要多1010倍以上。倍以上。 单倍型:当前常用术语单倍型:当前常用术语“happlotype”(单倍型单倍型)代代 替术语替术语“allele”(等位基因等位基因)。在给定的一条染色体的。在给定的一条染色体的 紧密连锁的位点上多个等位基因的集合紧密连锁的位点上多个等位基因的集合,通常通常34个个 相邻等位基因彼此靠近而构成的单倍型可作为一个相邻等位基因彼此靠近而构成的单倍型可作为一个 整体而遗传整体而遗传(称为单倍型块称为单倍型块(haploblock) SNP ( single nucleotide polymorphism

30、) 特性特性RFLPRAPDSSRISSRAFLP 分布分布 普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在 遗传遗传共显性共显性多数显性多数显性共显性共显性多数显性多数显性多数显性多数显性 多态性多态性中中高高高高高高非常高非常高 等位检测等位检测是是不是不是是是不是不是不是不是 检测位点数检测位点数1311015050更多更多20100 样品信息量样品信息量低低中中高高高高高高非常高非常高 基因组区域基因组区域底拷贝编码底拷贝编码整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组 技术难度技术难度中等中等简单简单简单简单简单简

31、单中等中等 重复性重复性高高中等中等高高高高高高 DNA样品量样品量230g1100ng50-100ng250ng100ng 反射线反射线一般是一般是不是不是不是不是不是不是一般是一般是 耗费时间耗费时间慢慢快快快快快快中等中等 可靠性可靠性高高中等中等高高高高高高 (二)(二) 遗传图谱的构建遗传图谱的构建 1 人类基因组遗传图谱的构建人类基因组遗传图谱的构建 人类的遗传图谱是利用人类的遗传图谱是利用家系分析法家系分析法,在对,在对8 个家系的个家系的134个成员的分析中个成员的分析中(186个减数分裂个减数分裂) ,主要根据,主要根据5264个个STR标记绘制而成的。标记绘制而成的。 利用

32、这些家系的资料绘制第利用这些家系的资料绘制第1至至22号染色体号染色体 图谱。对于图谱。对于X染色体图谱,还利用了来自另外染色体图谱,还利用了来自另外 12个家系,个家系,170个成员个成员(105个减数分裂个减数分裂)的资料的资料 绘制而成。绘制而成。 最后,将最后,将5264个标记定位在个标记定位在2335个位点(其个位点(其 中有些标记相距很近而作为一个位点)。中有些标记相距很近而作为一个位点)。 2 植物基因组遗传图谱的构建植物基因组遗传图谱的构建 作图群体作图群体 常用的遗传作图群体有常用的遗传作图群体有F2群体、群体、 回交群体、加倍单倍体回交群体、加倍单倍体 (double ha

33、ploid,DH)群体、)群体、 重组近交系(重组近交系(recombinant inbred lines,RIL)群体、近)群体、近 等基因系(等基因系(nearisogenic lines, NIL)群体等(徐云碧,)群体等(徐云碧, 1994)。)。 遗传标记的染色体定位遗传标记的染色体定位 标记间的连锁分析标记间的连锁分析 LINKAGE、Mapmaker、JoinMap 二、二、 物理图谱绘制物理图谱绘制 (一(一 )限制性作图)限制性作图 (二)基于克隆的基因组作图(二)基于克隆的基因组作图 (三)(三) 原位杂交原位杂交 (四)序列标签位点(四)序列标签位点(STS)作图)作图

34、(五)(五) 人类基因组图谱人类基因组图谱 重叠群(重叠群(contigous DNA clones, contigs) 从从1个感兴趣的位置开始,利用第个感兴趣的位置开始,利用第1个元件的末端部个元件的末端部 分来辩别第分来辩别第2个元件,沿染色体个元件,沿染色体“行走行走”(walk)。通)。通 过鉴别目标位点两测的过鉴别目标位点两测的2个个DNA标记,从标记,从1个标记向另个标记向另 1个标记的行走。个标记的行走。 沿染色体鉴别一系列重叠群是大规模研究的基础。沿染色体鉴别一系列重叠群是大规模研究的基础。 在特定区域的染色体行走可以提供分离通过遗传图谱在特定区域的染色体行走可以提供分离通过

35、遗传图谱 定位在该区域基因的方法。集中全部染色体的重叠群定位在该区域基因的方法。集中全部染色体的重叠群 ,可以为以后研究提供有效克隆来源。,可以为以后研究提供有效克隆来源。 染色体行走考虑的根本是每染色体行走考虑的根本是每“步步”的大小,较大的的大小,较大的 步加快积聚相邻克隆的进程。步加快积聚相邻克隆的进程。 (二)(二) 基于克隆的基因组作图基于克隆的基因组作图 区域作图区域作图 Regional mapping 区域作图区域作图 Regional mapping Minimal tiling path selected for sequencing. 区域作图区域作图 Regional

36、mapping (三)(三) 原位杂交原位杂交 荧光原位杂交(荧光原位杂交(fluorescent in situ hybridization, FISH) 基因组原位杂交(基因组原位杂交(genome in situ hybridization, GISH ) (四)序列标签位点(四)序列标签位点(STS)作图)作图 辐射杂交系辐射杂交系 是含有另一种生物染色体片是含有另一种生物染色体片 断的啮齿类细胞。带有人类染色体片段的断的啮齿类细胞。带有人类染色体片段的 辐射杂交系辐射杂交系 DNA库库 YAC/BAC 克隆作图克隆作图 获得大分子获得大分子DNA克隆文库以后,克隆文库以后, 用用PC

37、R的方法检测的方法检测STS,根据重叠的,根据重叠的STS 标记绘制克隆连锁图。标记绘制克隆连锁图。 (四)序列标签位点(四)序列标签位点(STS)作图)作图 当两个片段含有同一当两个片段含有同一STS顺序时,则这两个片段顺序时,则这两个片段 彼此重叠。如果它们彼此邻接,这两个彼此重叠。如果它们彼此邻接,这两个STS总会同总会同 时出现在相同片段上。如果它们相距甚远,有时会时出现在相同片段上。如果它们相距甚远,有时会 在同一片段,有时则在不同片段。在同一片段,有时则在不同片段。 要将一组要将一组STS作图定位,必需收集来自同一染色作图定位,必需收集来自同一染色 体或整个基因组随机断裂的体或整个基因组随机断裂的DNA片段。不同片

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论