基因组学与后基因组学(1)_第1页
基因组学与后基因组学(1)_第2页
基因组学与后基因组学(1)_第3页
基因组学与后基因组学(1)_第4页
基因组学与后基因组学(1)_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十八章、基因组学第十八章、基因组学 基因组:生物细胞中单套染色体的所含 DNA序列的全部组成。 人类基因组:22条常染色体和X,Y染色 体的DNA组成。 基因组大小基因组大小 种类 Mb 大肠杆菌 4.64 啤酒酵母 12.1 线 虫 100 果 蝇 140 蝗 虫 5000 小 鼠 3300 豌 豆 4800 玉 米 5000 小 麦 17000 人 3000 分类最小基因组分类最小基因组 支原体 0.58 X 106 细菌 2.8 X 106 酵母 3.0 X 107 霉菌 5.5 X 107 蠕虫 1.1 X 108 昆虫 0.5 X 109 鸟类 0.2 X 1010 两栖类 0.1

2、 X 1010 哺乳类 2.8 X 1010 DNA序列的分类序列的分类 基因序列和非基因序列 基因序列:以起始密码子开始,终止密码子 结束的一段DNA序列,称为开放阅读框 (open reading frame, ORF) 非基因序列:基因序列以外的DNA序列。 编码序列和非编码序 编码序列:编码RNA和蛋白质的DNA序列。 非编码序:内含子和基因的间隔序列。 单一序列和重复序列 单一序列: 基因组中只有一份的DNA序列。 重复序列:基因组中重复出现的序列。例如, STR,SNP,微卫星DNA等。 什么是基因?什么是基因? 基因在哪里?基因在哪里? 寻找基因的思路:寻找基因的思路: 基因定位

3、基因定位 基因克隆基因克隆 基因分离基因分离 将基因定位于染色体上将基因定位于染色体上 有大到小,由粗到细,精细定位有大到小,由粗到细,精细定位 克隆目的基因片段克隆目的基因片段 功能克隆功能克隆 克隆(致病)基因的一克隆(致病)基因的一 种策略。种策略。 收集所要克隆的基因的收集所要克隆的基因的 蛋白质产物及其功能的蛋白质产物及其功能的 信息,用以分离基因,信息,用以分离基因, 并对基因进行定位。并对基因进行定位。 性状性状 (疾病)(疾病) 蛋白质产蛋白质产 物(生物物(生物 学功能)学功能) 从氨基酸序列从氨基酸序列 出发设计出发设计 DNA引物,从引物,从 文库调取基因文库调取基因 得

4、到基得到基 因序列因序列 染色体定染色体定 位位 分析异常基因的产物(蛋白质):分析异常基因的产物(蛋白质): 纯化蛋白质,弄清它是如何引起临床症状的有两纯化蛋白质,弄清它是如何引起临床症状的有两 条不同的路线:条不同的路线: 1. 进行氨基酸序列测定,据此推测可能的核苷酸序进行氨基酸序列测定,据此推测可能的核苷酸序 列,合成寡核苷酸探针,然后用探针从列,合成寡核苷酸探针,然后用探针从cDNA文库文库 或基因组文库中筛选对应的编码基因;或基因组文库中筛选对应的编码基因; 将异常蛋白质制成相应的抗体,从将异常蛋白质制成相应的抗体,从cDNA表达文库表达文库 中筛选相应克隆。得到克隆后,就可以通过

5、中筛选相应克隆。得到克隆后,就可以通过DNA 序列分析确定导致疾病的分子缺陷。序列分析确定导致疾病的分子缺陷。 绝大部分分子病、遗传性代谢缺陷(酶)病绝大部分分子病、遗传性代谢缺陷(酶)病 如白化病(如白化病(albinism)、苯丙酮尿症)、苯丙酮尿症 (phenylkeonuria, PKU)和镰刀形细胞贫血病)和镰刀形细胞贫血病 (sickle-cell disease)等,都是采取的这一策略。)等,都是采取的这一策略。 血红蛋白病血红蛋白病镰刀形细胞贫血症镰刀形细胞贫血症 正常正常HbAHbA四条多肽链(四条多肽链(2 2条条 链,两条链,两条 链)链) 定位克隆定位克隆 又称为又称为

6、“逆向遗传逆向遗传 学学”,始于,始于2020世纪世纪8080 年代后期年代后期 利用遗传连锁或细胞利用遗传连锁或细胞 学定位技术将致病基学定位技术将致病基 因定位于染色体的特因定位于染色体的特 定区带。定区带。 定位:通过连锁分析定位:通过连锁分析 找出与目的基因紧密找出与目的基因紧密 连锁的遗传标记在染连锁的遗传标记在染 色体上的位置。色体上的位置。 克隆:从定位的染色克隆:从定位的染色 体区段内分离克隆所体区段内分离克隆所 要的基因,并进一步要的基因,并进一步 研究其功能。研究其功能。 疾病 遗传标记, 染色体定位 基因 序列 mRNA cDNA 蛋白质产物 生物学功能 定位克隆:通过遗

7、传标记定位克隆:通过遗传标记 ,先获得某一表型基因,先获得某一表型基因 在染色体上的定位在染色体上的定位 ,再在候选区域内选择已知基,再在候选区域内选择已知基 因因 ,进行致病突变的筛选,进行致病突变的筛选 ,并获得,并获得cDNA及全基及全基 因。因。 基本思路是通过连锁分析原理进行基本思路是通过连锁分析原理进行 基因定位。基因定位。 若多态标记与待定基因距离较远若多态标记与待定基因距离较远 ,则它们在,则它们在 向子代传递时会发生自由分离向子代传递时会发生自由分离 ,呈,呈“连锁平衡连锁平衡” ;反之;反之 ,则不发生自由分离,则不发生自由分离 ,而呈现,而呈现“共分离共分离” 现象现象

8、,即,即“连锁不平衡连锁不平衡”。据此可在染色体上定。据此可在染色体上定 位与某一位与某一DNA标记相连锁的基因。标记相连锁的基因。 将基因定位于染色体将基因定位于染色体 特定区段特定区段 2. 候选基因筛选鉴定候选基因筛选鉴定 定位克隆的主要目的之一是将目定位克隆的主要目的之一是将目 标基因定位于特定染色体上。标基因定位于特定染色体上。 主要方法:主要方法: 家系调查法家系调查法 体细胞杂交法体细胞杂交法 核酸杂交技术核酸杂交技术 等等等等 A-1型短指(趾)症法拉比(型短指(趾)症法拉比(Farabee) 1903年在他的哈佛大学医学院博士毕业论文年在他的哈佛大学医学院博士毕业论文 中首先

9、报道了,即世界上第一例孟德尔常染中首先报道了,即世界上第一例孟德尔常染 色体显性遗传病,以后作为遗传学的经典例色体显性遗传病,以后作为遗传学的经典例 子被全世界的生物学和遗传学教材广泛引用子被全世界的生物学和遗传学教材广泛引用 。 贺林实验室利用布依族、苗族贺林实验室利用布依族、苗族 和汉族的三个和汉族的三个A-1型短指(趾)症大型短指(趾)症大 家系,对该病的致病基因进行了精家系,对该病的致病基因进行了精 确定位(位点定在确定位(位点定在2q35-36区)、克区)、克 隆,并首次发现了人隆,并首次发现了人IHH基因和该基因和该 基因上的三个突变位点是导致基因上的三个突变位点是导致A-1型型

10、短指(趾)症的直接原因。短指(趾)症的直接原因。 用遗传标记进行基因定位用遗传标记进行基因定位 形态标记形态标记 morphological markers 细胞标记细胞标记 cytological markers 生化标记 biochemical markers 分子标记分子标记 molecular markers 分子遗传标记分子遗传标记 在核酸分子水平,对具有相对差异在核酸分子水平,对具有相对差异 的等位基因的等位基因DNADNA多态性的标记,广泛存多态性的标记,广泛存 在于高等生物编码区和非编码区,又在于高等生物编码区和非编码区,又 称为称为DNADNA分子标记,是分子标记,是DNAD

11、NA水平上遗传水平上遗传 变异的直接反映。变异的直接反映。 特点特点: 1. 直接以直接以DNA形式表现,在生物体各发育阶段形式表现,在生物体各发育阶段,各各 组织均可检测到。组织均可检测到。 2.数量多,遍及整个基因组。数量多,遍及整个基因组。 3.多态性高,自然界存在许多等位突变,无需专门多态性高,自然界存在许多等位突变,无需专门 创造特殊的遗传材料创造特殊的遗传材料 4. 中性,不影响目标性状的表达,与不良性状无中性,不影响目标性状的表达,与不良性状无 必然连锁必然连锁 5. 许多分子标记表现为共显性(许多分子标记表现为共显性(codominance), 能够鉴别出纯合基因型与杂能够鉴别

12、出纯合基因型与杂 合基因型,提供完整合基因型,提供完整 的遗传信息的遗传信息 分子遗传标记发展分子遗传标记发展 RFLP restrict fragment length polymorphism 限制性片段长度多态性限制性片段长度多态性 SSLP simple sequence length polymorphism 简单序列长度多态性简单序列长度多态性 SNP single nucleotide polymorphism 单核苷酸多态性单核苷酸多态性 SSLP simple sequence length polymorphism 简单序列长度多态性简单序列长度多态性 ,又称为又称为VNT

13、R variable number tandem repeat 数目可变的数目可变的 串联重复多态性串联重复多态性 指重复单位相对较小指重复单位相对较小, ,由重复单位的序列差由重复单位的序列差 异和数目变化异和数目变化, ,可形成丰富的多态性。可形成丰富的多态性。 包括包括: : 小卫星序列小卫星序列 minisatellite 微卫星序列微卫星序列 microsatellite , 小卫星小卫星DNA标记标记 minisatellite,核心序列为,核心序列为11 60bp ,主要存在于染色体靠近端粒处,由,主要存在于染色体靠近端粒处,由 于其拷贝数变化,在不同个体间中存在串联于其拷贝数变

14、化,在不同个体间中存在串联 数目的差异,若在重复序列两侧有限制性内数目的差异,若在重复序列两侧有限制性内 切酶酶切位点,则切下来的片段会呈现出多切酶酶切位点,则切下来的片段会呈现出多 态性。可用于态性。可用于DNA 指纹,指纹,DNA Finger。 微卫星微卫星DNA标记标记 microsatellite,指以,指以27个个 碱基为核心单位串联重复而成的一类序列碱基为核心单位串联重复而成的一类序列 (微卫星(微卫星DNA microsatellite DNA,又称为,又称为 STR short tandem repeat 短串联重复序列)短串联重复序列), 由于核心序列重复数目的变化而在群体

15、中呈由于核心序列重复数目的变化而在群体中呈 现出遗传多态性,但在同一家系内具有高度现出遗传多态性,但在同一家系内具有高度 的遗传保守性,以孟德尔方式遗传。散布于的遗传保守性,以孟德尔方式遗传。散布于 整个基因组中。整个基因组中。 SNP single nucleotide polymorphism 单核苷酸多单核苷酸多 态性,是指在基因组内特定核苷酸位置上存在态性,是指在基因组内特定核苷酸位置上存在 两种不同碱基,其中最少一种在群体中的频率两种不同碱基,其中最少一种在群体中的频率 不小于不小于1。 SNP分为两种形式:分为两种形式: 基因编码区的基因编码区的SNP,称为,称为cSNP 遍布于基

16、因组内的大量单碱基变异遍布于基因组内的大量单碱基变异 SNPSNP分析的特点:分析的特点: (1 1)SNPSNP数量大,分步密集,平数量大,分步密集,平 均每均每1000bp1000bp就有一个就有一个SNPSNP (2 2)SNPSNP比比STRSTR扩增更有效,不会扩增更有效,不会 产生假带产生假带 (3 3)由于)由于SNPSNP是二态的,易于自是二态的,易于自 动化批量检测,易于用计算机分动化批量检测,易于用计算机分 析结果析结果 SNP与与RFLP和和STR等等DNA标记的主要不同在标记的主要不同在 于:于: 不再以不再以“长度长度”的差异作为检测手段的差异作为检测手段 而是直接以

17、序列的差异作为标记。但而是直接以序列的差异作为标记。但 SNP单个基因座的多态性很差,只有单个基因座的多态性很差,只有 二态,为此采用多个二态,为此采用多个SNP基因座进行基因座进行 “单倍型单倍型”分析十分重要。分析十分重要。 SNP是继人类基因组计划之后又是继人类基因组计划之后又 一国际研究竞争新热点,该项一国际研究竞争新热点,该项 目研究是阐明基因组功能及特目研究是阐明基因组功能及特 点的重要基础。点的重要基础。SNP是人类基因是人类基因 组组DNA序列变异的主要形式,序列变异的主要形式, 是决定人类疾病的重要遗传基是决定人类疾病的重要遗传基 础。础。 其他遗传标记举例其他遗传标记举例

18、AFLP amplified fragment length polymorphism 扩增片段长度多态性扩增片段长度多态性 RAPD random amplified polymorphism DNA 随机扩增多态性随机扩增多态性 SSCP single strand conformation polymorphism 单链构象多态性单链构象多态性 AFLP amplified fragment length polymorphism 扩扩 增片段长度多态性增片段长度多态性 通过通过DNA PCR扩增基因组扩增基因组DNA的的 模板,随后用电泳将扩增片段分离,通过模板,随后用电泳将扩增片段分

19、离,通过DNA谱带谱带 鉴别多态性。鉴别多态性。 RAPD random amplified polymorphism DNA 随机扩增多态性随机扩增多态性 用于扩增多态性用于扩增多态性DNA的引物是的引物是 随机的。在做多态性分析时,用一组引物(随机的。在做多态性分析时,用一组引物(20 40个)在基因组全序列上扫描可获得基因组多态个)在基因组全序列上扫描可获得基因组多态 性的丰富信息。性的丰富信息。 SSCP single strand conformation polymorphism 单单 链构象多态性链构象多态性 是基于是基于PCR扩增而新发展起来的扩增而新发展起来的 DNA多态性分

20、析,利用多态性分析,利用PCR特异的扩增出基因组的特异的扩增出基因组的 目的目的DNA片段,变性后形成的单链片段,变性后形成的单链DNA在自然条件在自然条件 下能形成一定的空间构象,并且这种空间构象由下能形成一定的空间构象,并且这种空间构象由 DNA链的碱基序列决定,若碱基发生变化,将在链的碱基序列决定,若碱基发生变化,将在 电泳图谱上表现出不同生物个体的特异性,即多电泳图谱上表现出不同生物个体的特异性,即多 态性。态性。 用用原位杂交原位杂交 in situ hybridazation和和 荧光原位杂交荧光原位杂交 fluorescence in situ hybridazation ,FI

21、SH 进行基因定位:进行基因定位: 将将DNADNA探针用同位素或荧光染料标记探针用同位素或荧光染料标记 ,按照碱基互补配对原则,与固定在,按照碱基互补配对原则,与固定在 玻片上的中期染色体杂交后,在荧光玻片上的中期染色体杂交后,在荧光 显微镜下呈现不同颜色的荧光。显微镜下呈现不同颜色的荧光。 FISH FISH是一项十分灵敏的技术,可以是一项十分灵敏的技术,可以 检测出非整倍体,基因扩增,微小的检测出非整倍体,基因扩增,微小的 染色体重排或易位染色体重排或易位等染色体变异等染色体变异 原位杂交原位杂交 基因定位基因定位 多色多色FISH M-FISH技术技术 荧光原位杂交荧光原位杂交 FIS

22、H在肿瘤发生发展相关染色体变异在肿瘤发生发展相关染色体变异 方面的研究应用:方面的研究应用: 比较基因组杂交技术比较基因组杂交技术 comparative genomic hybridization, CGH 利用同一种生物异常细胞的基因组利用同一种生物异常细胞的基因组 做探针,与正常细胞基因组杂交,通做探针,与正常细胞基因组杂交,通 过对杂交信号分析,发现不同,寻找过对杂交信号分析,发现不同,寻找 相关基因相关基因。 利用利用染染 色体步色体步 移移确定确定 基因位基因位 置置 定位候选克隆定位候选克隆 该方法是定位克隆的该方法是定位克隆的 进一步发展进一步发展 将疾病相关基因定位将疾病相关

23、基因定位 于染色体相关区域于染色体相关区域 该染色体区域得到若该染色体区域得到若 干候选基因干候选基因 进一步分析得到目的进一步分析得到目的 cDNAcDNA 蛋白质功能研究蛋白质功能研究 疾疾 病病 染色体定位染色体定位 若干候选基若干候选基 因因 确定目确定目 的基因的基因 蛋蛋 白白 质质 功功 能能 筛选染色体定位只是定位克隆的第一步筛选染色体定位只是定位克隆的第一步 。由于筛选、确认的困难。由于筛选、确认的困难 ,使其成为定位,使其成为定位 克隆策略的克隆策略的“瓶颈瓶颈”。目前获得基因序列的方法大致。目前获得基因序列的方法大致 有有: : (1)(1)对对 50 0 50 0的关键

24、部位进行直接测序;的关键部位进行直接测序; (2)(2)比较基因组作图和测序;比较基因组作图和测序; (3)(3)基因结构特征分析;基因结构特征分析; (4)(4)捕获,主要有岛捕捉层析捕获,主要有岛捕捉层析 法、外法、外 显子捕捉法、直接筛选法等方法显子捕捉法、直接筛选法等方法 差异表达差异表达 原理原理: 比较不同个体或不同细胞来源比较不同个体或不同细胞来源 ,即,即 通常所指的样本通常所指的样本 (tester,) 和参照和参照 (driver, ) 的蛋白质或的蛋白质或RNA两者之间的差异两者之间的差异 ,如,如 缺失或特异表达部分,缺失或特异表达部分, 从而发现新基因从而发现新基因

25、1. 差异性表达差异性表达mRNA方法方法 (1)mRNA差异显示(差异显示(mRNA-Differential Display,mRNA-DD) (2)抑制性消减杂交()抑制性消减杂交(Suppression Subtractive Hybridization,SSH) (3)cDNA代表性差异分析(代表性差异分析(cDNA Representational Difference Analysis,cDNA-RDA) (4)cDNA microarray 2. 差异性表达蛋白质差异性表达蛋白质 消减杂交消减杂交(subtractive hybrization) 利用目的基因在两种组织或细胞中

26、表达的差异利用目的基因在两种组织或细胞中表达的差异 ,或者在不同发育阶段、不同状态下表达差异,或者在不同发育阶段、不同状态下表达差异, 通过其通过其mRNA或单链或单链cDNA进行杂交,除去两进行杂交,除去两 者之间相同的基因成分,使表达有差异的基因得者之间相同的基因成分,使表达有差异的基因得 到充分富集。它的实质是对两组基因转录本全面到充分富集。它的实质是对两组基因转录本全面 比较,去同存异,分离差异表达基因比较,去同存异,分离差异表达基因 Subtractive cloning cDNA-RDA技术技术 cDNA-RDA(cDNA- Representative Difference An

27、alysis)技术是)技术是1994年年 Huband和和Schatz在在RDA和和mRNA-DD二者基础上二者基础上 建立的一种基因克隆新方法建立的一种基因克隆新方法 在在代表性差异分析基础上,以代表性差异分析基础上,以mRNA表达表达 水平的差异为差减目标,因而兼有水平的差异为差减目标,因而兼有RDA和和 mRNA-DD的优点的优点,这一方法克服了这一方法克服了mRNA-DD 假阳性率高的缺点,排除与表型无关的基因,假阳性率高的缺点,排除与表型无关的基因, 通过消减杂交驱逐同源序列,降低了后期鉴定通过消减杂交驱逐同源序列,降低了后期鉴定 的工作量,但操作烦琐。的工作量,但操作烦琐。 特点:

28、特点: 肿瘤组织肿瘤组织Driver 正常组织正常组织Tester AAAAAA mRNA ds cDNA Mbo I 酶切酶切 连接接头连接接头PCR扩增扩增 无接头无接头换新接头换新接头 杂交杂交 无扩增无扩增线性扩增线性扩增指数扩增指数扩增 cDNA-RDA方法简要示意图方法简要示意图 因为同一种因为同一种mRNA经不同的剪接或翻经不同的剪接或翻 译后修饰加工可产生多种蛋白质,因此一译后修饰加工可产生多种蛋白质,因此一 个蛋白质组中蛋白质的数量超过相应基因个蛋白质组中蛋白质的数量超过相应基因 组的基因数目。组的基因数目。 蛋白质组研究常用方法:蛋白质组研究常用方法: 二维凝胶电泳技术,蛋

29、白质序列分析,质二维凝胶电泳技术,蛋白质序列分析,质 谱分析等等。谱分析等等。 差异性表达蛋白质差异性表达蛋白质 生物信息学方法生物信息学方法 通过序列的通过序列的ORFORF预测预测 建立建立cDNAcDNA文库文库 差减杂交得到均质化文库差减杂交得到均质化文库 cDNAcDNA序列测定序列测定 生物信息学分析,生物信息学分析,ORFORF预测预测 同源性比较,功能预测同源性比较,功能预测 生物信息学(生物信息学(bioinformatics) 是生物学,计算机科学,以及应用数学等学是生物学,计算机科学,以及应用数学等学 科相互交叉而形成的一门新兴学科。科相互交叉而形成的一门新兴学科。 以计

30、算机为主要工具,开发各种软件,对日以计算机为主要工具,开发各种软件,对日 益增长的益增长的DNA和蛋白质的序列和结构等相和蛋白质的序列和结构等相 关信息进行收集、储存、发行、提取、加工关信息进行收集、储存、发行、提取、加工 、分析和研究,同时建立理论模型,指导实、分析和研究,同时建立理论模型,指导实 验研究。验研究。 由数据库、计算机网络和应用软件三大部分由数据库、计算机网络和应用软件三大部分 构成,在基因组计划中发挥不可替代的作用构成,在基因组计划中发挥不可替代的作用 该定义包含两方面的内容该定义包含两方面的内容 一方面是发展强大有效的信息分析工具,一方面是发展强大有效的信息分析工具, 构建

31、适合于基因组研究的数据库,用于搜索构建适合于基因组研究的数据库,用于搜索 、管理、使用人类基因组和模式生物基因组、管理、使用人类基因组和模式生物基因组 的巨量信息;的巨量信息; 另一方面是配合实验研究,确定约另一方面是配合实验研究,确定约30亿个亿个 碱基对的人类基因组完整核苷酸顺序,找出碱基对的人类基因组完整核苷酸顺序,找出 人类全部约人类全部约10万个基因在染色体上的位置以万个基因在染色体上的位置以 及包括基因在内的各种及包括基因在内的各种DNA片段的功能。片段的功能。 该定义包含两方面的内容该定义包含两方面的内容 一方面是发展强大有效的信息分析工具,一方面是发展强大有效的信息分析工具, 构建适合于基因组研究的数据库,用于搜索构建适合于基因组研究的数据库,用于搜索 、管理、使用人类基因组和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论