基因和基因组_第1页
基因和基因组_第2页
基因和基因组_第3页
基因和基因组_第4页
基因和基因组_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、编辑ppt1 第二章第二章 基因和基因组基因和基因组 v染色体概述染色体概述 v真核生物基因组真核生物基因组 v原核生物基因组原核生物基因组 编辑ppt2 基因组(genome)是细胞或生物体的全套遗传 物质。就细菌和噬菌体而言,它们的基因组基因组 是指单个染色体上所含的全部基因,是指单个染色体上所含的全部基因,而二倍 体真核生物的基因组则是指维持配子或配子 体正常功能的最基本的一套染色体及其所携 带的全部基因。 编辑ppt3 v 染色体与染色体与DNA的关系的关系 染色体是遗传物质的染色体是遗传物质的主要主要载体载体,也就,也就 是说细胞内的是说细胞内的DNA主要在染色体上主要在染色体上 。

2、 (注意染色体外遗传基因的概念)注意染色体外遗传基因的概念) 一、一、 染色体概述染色体概述 v 什么是染色质?什么是染色质? 染色质与染色体是同一种物质,在不同染色质与染色体是同一种物质,在不同 时期有不同的表现形式。时期有不同的表现形式。 编辑ppt4 编辑ppt5 原核细胞原核细胞 编辑ppt6 v原核生物原核生物DNA一般位于核区里(一般位于核区里(拟核拟核)。)。 细菌细菌DNA是一条共价、闭合双链分子,通是一条共价、闭合双链分子,通 常也称为染色体。一般情况下含有常也称为染色体。一般情况下含有一条染色一条染色 体体。原核细胞都是。原核细胞都是单倍的单倍的。大都带有。大都带有单拷贝单

3、拷贝 基因基因;整个染色体;整个染色体DNA几乎全部由功能基几乎全部由功能基 因与调控序列所组成;几乎每个基因序列都因与调控序列所组成;几乎每个基因序列都 与它所编码的蛋白质序列呈线性对应状态。与它所编码的蛋白质序列呈线性对应状态。 (无内含子)(无内含子) 编辑ppt7 真核细胞真核细胞 编辑ppt8 原核细胞与真核细胞的主要区别原核细胞与真核细胞的主要区别 细胞大小细胞大小 较小,较小,110 m 较大,较大,10100 m 内膜系统内膜系统 无无 有有 细胞骨架细胞骨架 无无 有有 细胞核细胞核 拟核(无核膜核仁拟核(无核膜核仁) 有核膜核仁有核膜核仁 染色体染色体 单数单数 ,非组蛋白

4、,非组蛋白 多个多个,组蛋白组蛋白及非组及非组 与单个与单个 DNA组成组成 特征特征 原核细胞原核细胞 真核细胞真核细胞 蛋白与多个蛋白与多个DNA组成组成 编辑ppt9 染色体上的染色体上的DNA存在形式不同存在形式不同 编辑ppt10 端粒端粒 端粒端粒 人人 类类 染染 色色 体体 形形 态态 结结 构构 编辑ppt11 v真核细胞染色体特征真核细胞染色体特征: 真核细胞的真核细胞的体细胞体细胞染色体都是二倍体,染色体都是二倍体,而性而性 细胞的染色体为单倍体。细胞的染色体为单倍体。 1、分子结构和数目相对稳定、分子结构和数目相对稳定; 2、能够自我复制、能够自我复制; 3、能够指导蛋

5、白质的合成,从而控制整个生命过程、能够指导蛋白质的合成,从而控制整个生命过程; 4、能够产生遗传的变异。、能够产生遗传的变异。 编辑ppt12 二、真核生物基因组二、真核生物基因组 (一)概述(一)概述 真核生物的遗传物质主要集中在核膜包真核生物的遗传物质主要集中在核膜包 围着的细胞核中,围着的细胞核中,DNA和特殊的蛋白质和特殊的蛋白质 相结合组装成为染色体。在真核细胞中相结合组装成为染色体。在真核细胞中 每条染色体由一个每条染色体由一个DNA分子组成。分子组成。 编辑ppt13 真核生物的基因组一般比较庞大,例如人的 单倍体基因组由3109 bp碱基组成,按1000 个碱基编码一种蛋白质计

6、,理论上可有300万 个基因。但实际上,人细胞中所含基因总数 大概不会超过4万个。这就说明在人细胞基因 组中有许多DNA序列并不转录成mRNA用于指导 蛋白质的合成。DNA的复性动力学研究发现这 些非编码区往往都是一些大量的重复序列, 这些重复序列或集中成簇,或分散在基因之 间。 编辑ppt14 在基因内部也有许多能转录但不翻译的间隔序 列(内含子)。因此,在人细胞的整个基因 组当中只有很少一部份(约占2-3)的DNA 序列用以编码蛋白质。 真核生物基因组有以下特点:真核生物基因组有以下特点: 1.真核生物基因组DNA与蛋白质结合形成染 色体,储存于细胞核内,除配子细胞外,体 细胞内的基因的基

7、因组是双份的(即双倍 体,diploid),即有两份同源的基因组。 编辑ppt15 2.真核细胞基因转录产物为单顺反子。一个 结构基因经过转录和翻译生成一个mRNA分子 和一条多肽链。 3.存在重复序列,重复次数可达百万次以 上。 4.基因组中不编码的区域多于编码区域。 5.大部分基因含有内含子,因此,基因是 不连续的。 编辑ppt16 6.基因组远远大于原核生物的基因组,具有 许多复制起点,而每个复制子的长度较小。 编辑ppt17 (二)、真核生物基因组的(二)、真核生物基因组的C C值悖理值悖理 真核生物基因组较原核生物大得多,真核生物 基因组来源不同,分子量差别也很大。与大 肠杆菌染色体

8、DNA分子量相比,果蝇染色体 DNA分子量差不多是大肠杆菌染色体DNA的300 倍。而人含有比大肠杆菌多600800倍的DNA。 我们把一个物种单倍体基因组的DNA含量,通 常称为该物种的C值。每个物种的C值是相对 恒定的, 编辑ppt18 不同物种的C值差异极大,虽然DNA的含量与 物种间的差异有一定关系,但与物种间的复 杂性并没有严格的对应关系,这从不同物种 的单倍体基因组的C值(DNA数量)的比较中 可以明显看出。例如昆虫的C值大约是108碱 基对,而两栖类动物如两栖鲵(amphiuma) 的C值是8.61010碱基对。在昆虫与两栖类之 间,C值相差近千倍,而且两栖类的C值竟然 编辑pp

9、t19 比包括人类在内的哺乳类(3109 bp)的C 值还高,所以很难令人相信这样的差异与生 物复杂性有什么关系。我们很难解释牛与人 的DNA含量相等,而豌豆与蚕豆DNA含量却相 差7倍。这种C值与生物进化复杂性不相对应 的现象称为C值悖理(C value paradox), 这暗示着真核生物基因组中必然存在大量的 不编码基因产物的DNA序列。 编辑ppt20 (三)真核生物染色体组成(三)真核生物染色体组成 DNA 组蛋白组蛋白 非组蛋白非组蛋白 少量少量RNA 化化 学学 成成 分分 编辑ppt21 v组蛋白:组蛋白:Hl、H2A、H2B、H3及及H4 1、染色体中的蛋白质染色体中的蛋白质

10、 编辑ppt22 组蛋白的一般特性组蛋白的一般特性 进化上的极端保守性进化上的极端保守性 牛、猪、大鼠的牛、猪、大鼠的H4H4氨氨 基酸序列完全相同。牛的基酸序列完全相同。牛的H4H4序列与豌豆序列相序列与豌豆序列相 比只有两个氨基酸的差异(豌豆比只有两个氨基酸的差异(豌豆H4H4中的异亮氨中的异亮氨 基酸基酸60缬氨酸缬氨酸60,精氨酸,精氨酸77赖氨酸赖氨酸77)。)。 H3H3的保守性也很大,鲤鱼与小牛胸腺的的保守性也很大,鲤鱼与小牛胸腺的H3H3只差只差 一个氨基酸,小牛胸腺与豌豆一个氨基酸,小牛胸腺与豌豆H3H3只差只差4 4个氨基个氨基 酸。酸。 无组织特异性无组织特异性 到目前为

11、止,仅发现鸟类、到目前为止,仅发现鸟类、 鱼类及两栖类红细胞染色体不含鱼类及两栖类红细胞染色体不含H1H1而带有而带有H5H5, 精细胞染色体的组蛋白是鱼精蛋白。精细胞染色体的组蛋白是鱼精蛋白。 编辑ppt23 肽链上氨基酸分布的不对称性肽链上氨基酸分布的不对称性 碱性氨基酸碱性氨基酸 集中分布在集中分布在N端的半条链上。例如,端的半条链上。例如,N端的半条链端的半条链 上净电荷为上净电荷为+16,C端只有端只有+3,大部分疏水基团,大部分疏水基团 都分布在都分布在C端。端。 组蛋白的修饰作用组蛋白的修饰作用 包括甲基化、乙基化、磷包括甲基化、乙基化、磷 酸化及酸化及ADP核糖基化等。核糖基化

12、等。 富含赖氨酸的组蛋白富含赖氨酸的组蛋白H5 鸟类、两栖类、鱼类鸟类、两栖类、鱼类 红细胞分离的红细胞分离的H5均有种的特异性。均有种的特异性。 编辑ppt24 v非组蛋白非组蛋白 非组蛋白:非组蛋白:酶类、收缩蛋白、骨架蛋白、肌动蛋酶类、收缩蛋白、骨架蛋白、肌动蛋 白、肌球蛋白、微管蛋白、肌原蛋白等。白、肌球蛋白、微管蛋白、肌原蛋白等。 一般特性:一般特性: 非组蛋白的多样性非组蛋白的多样性 非组蛋白的量大约是组蛋白的非组蛋白的量大约是组蛋白的60%70%,但它,但它 的种类却很多,约在的种类却很多,约在20-100种之间,其中常见的种之间,其中常见的 有有15-20种。种。 非组蛋白的组

13、织专一性和种属专一性非组蛋白的组织专一性和种属专一性 编辑ppt25 常见的非组蛋白常见的非组蛋白 a.HMG蛋白蛋白(high mobility group protein) 这是一类能用低盐(这是一类能用低盐(0.35mol/L NaCl)溶液抽提、能溶于)溶液抽提、能溶于 2%的三氯乙酸、相对分子质量较低的非组蛋白,相对分的三氯乙酸、相对分子质量较低的非组蛋白,相对分 子质量都在子质量都在3.0104以下。这类蛋白能与以下。这类蛋白能与DNA结合,也能结合,也能 与与Hl作用,但很容易用低盐溶液抽提,说明它们与作用,但很容易用低盐溶液抽提,说明它们与DNA结结 合并不牢固。其功能可能与合

14、并不牢固。其功能可能与DNA的超螺旋结构有关。的超螺旋结构有关。 b. DNA结合蛋白结合蛋白 用用2mol/L NaCl除去全部组蛋白和除去全部组蛋白和70%非组蛋白后,还有非组蛋白后,还有 一部分蛋白必须用一部分蛋白必须用2mol/L NaCl和和5mol/L尿素才能与尿素才能与DNA 解离。说明这些蛋白与解离。说明这些蛋白与DNA结合比较紧密。其功能可能与结合比较紧密。其功能可能与 DNA的复制和转录有关。的复制和转录有关。 编辑ppt26 2、 染色体中的染色体中的DNA v真核细胞基因组含有大量的真核细胞基因组含有大量的重复序列重复序列, 功能功能DNA序列大多被非功能序列大多被非功

15、能DNA所所 隔开。许多隔开。许多DNA序列不编码蛋白质。序列不编码蛋白质。 这就是著名的这就是著名的C值反常值反常现象。现象。 编辑ppt27 真核细胞基因的结构真核细胞基因的结构 编辑ppt28 3.DNA序列的类型序列的类型 真核生物的一个显著特点就是富含重复序列这 些重复序列的长短不同,短的仅有几个甚至 两个核苷酸,长的有几百乃至上千个核苷酸。 重复序列的重复程度也不一样。重复多的可 在基因组中出现几十万到几百万次,称为高 度重复序列。重复几十到几千次称中度重复 序列。重复极少称为轻度重复序列。不重复 的序列则称为单一序列或单拷贝序列。 编辑ppt29 编辑ppt30 编辑ppt31

16、1)单拷贝序列(single copy sequence)或 单一序列(单一序列(unique sequence) 真核生物的大多数基因在单倍体中都是单拷贝 的。单拷贝序列最重要的作用是具有编码功 能。在单倍体基因组里,这些序列包括编码 蛋白质和酶的结构基因以及基因的间隔序列。 不重复序列长约7502000 bp,相当于一个 结构基因的长度,这类序列的cot值与基因组 中DNA的含量成正比。真核生物基因组中单拷 贝序列约在4070,但编码序列只占单 拷贝序列的一小部分,所以单拷贝序列除了 编码以外还应有其它功能。 编辑ppt32 2 2) )轻度重复序列(轻度重复序列(slightly rep

17、etitive slightly repetitive sequencesequence) 这种重复序列在基因组中只有210个拷贝, 主要是组蛋白和tRNA基因。轻度重复序列包 括两种情况:一是重复序列中的基因都是有 功能的,例如血红蛋白链的基因有胚胎型 和胎儿型,只是基因产物在氨基酸组成上是 各有差异;二是重复序列中的基因有的有功 能,有的没有功能,如假基因等。轻度重复 序列很难用点突变方法进行鉴定,因为任何 一个拷贝的失活都不能影响其它拷贝的活性。 编辑ppt33 3 3) )中度重复序列(中度重复序列(moderately repetitive moderately repetitive

18、 sequencesequence) 中度重复序列一般都是不编码的序列,有几十 至数千个拷贝,例如rRNA基因和tRNA基因等。 目前认为,大部分中度重复序列与基因表达 的调控有关,它们可能是与DNA复制、转录起 始和终止有关的酶及蛋白质因子的识别位点。 有短周期的分散重复序列和长周期的分散重 复序列两类中度重复序列: 编辑ppt34 A.短周期的分散重复序列,每个序列长约 100300bp,主要在人、爪蟾和海胆等中已 有发现; B.长周期的分散重复序列,每个大约5000bp。 长、短周期的中度重复序列的共同特征 是两端有类似于转座子两端的重复序列,这 种现象十分类似于逆转录病毒的结构。 编辑

19、ppt35 4 4) )高度重复序列(高度重复序列(highly repetitive highly repetitive sequencesequence) 大多数高等真核生物的DNA都含有20以上的高 度重复序列,由非常短的序列重复多次,可 达几百万个拷贝,串联成长长的一大簇集中 在异染色质区,特别是在着丝粒和端粒附近。 在这些高度重复序列中,常有一些AT含量很 高的简单高度重复序列,因为序列简单,缺 乏转录必要的启动子而不具转录能力。 编辑ppt36 编辑ppt37 高度重复高度重复DNA 中度重复中度重复DNA 重复单位重复单位 6100bp 300bp7000bp 重复次数重复次数

20、106108 101104 举例举例 端粒、着丝粒端粒、着丝粒 人人Alu家族家族 编辑ppt38 5)5)、串联重复序列、串联重复序列 真核生物基因组中的重复序列,根据其在基因 组中的分布方式又可分为两类:一类散在基 因组中,称为散在重复序列,如Alu家族;另 一类重复单位呈串联状,首尾相连排列在一 起,称为串联重复序列。卫星、小卫星和微 卫星是串联重复序列中最常见的三种类型。 编辑ppt39 A、卫星序列(、卫星序列(satellite sequencesatellite sequence) 当把断成约104 bp的DNA片段进行氯化铯(CsCl) 密度梯度离心分析时,发现除了一个主要的

21、DNA主峰外,旁边还出现不同密度的小峰。这 些小峰就像是主峰旁边的卫星,因此命名为 卫星DNA。 编辑ppt40 果蝇(果蝇(D.virilis)的卫星的卫星DNA 编辑ppt41 卫星序列是由寡核苷酸串联、重复排列构 成数量可变的串联重复序列(variable number of tandem repents,VNTR)。该区 AT含量高,其中重复序列为670bp的称为小 卫星DNA(minisatellite DNA), 它常位于 染色体端粒和着丝区,带有GCTGGGCAGARG(R 嘌呤)的核心同源序列,因此,探针杂交图 谱具有极强的个体特异性,称之为“ DNA指 纹图谱”。 编辑ppt

22、42 检测小卫星序列的方法称“DNA指纹技术”。 在基因组的间隔序列和内含子等非编码区内, 广泛存在着比小卫星DNA序列更短的一类小重 复单位。重复序列为16bp称为微卫星DNA (microsatellite DNA),如(A)n/(T)n、 (CA)n/(TG)n、(CT)n/(AG)n等。它均匀遍布 于基因组中,是重复序列中主要组成部分之 一,呈共显性遗传。微卫星序列的拷贝数在 个体间呈现高度变异,因而具有高度多态性, 已经成为真核生物 编辑ppt43 基因组绘制遗传图的重要分子标志。原位杂 交技术显示大量的卫星DNA容易在中期着丝粒 周围集中。推测它作用于DNA复制结束时分开 姊妹染色

23、单体缠绕成DNA双链的起始点,并认 为卫星DNA是DNA聚合酶识别的核苷酸序列, 因为着丝粒是复制最快的DNA序列。 编辑ppt44 B.AluAlu家族,分散重复家族,分散重复DNADNA Alu家族(Alu family)属于中度重复序列中最 为普遍的一类,也是研究最多的一种散在型 重复序列。由于此序列中含有限制性内切酶 Alu特异识别顺序(AGCT)而得名。Alu家 族在人类基因组中含量最丰富,平均每6 kb 的DNA就有一个,重复序列为300bp,此序列 可被Alu内切酶切成130bp和170bp两个片断是 其家族的共同特征。 编辑ppt45 Alu家族在人类基因组中的重复频率为310

24、5, 约占人类基因组的3%6%。 Alu家族中有80%88%同源性,它们之间 的差别多为点突变。人类Alu家族DNA的5 端 都有较精确的序列,但其3 端区长短不一。 两端都具有720bp的顺向重复序列,各个 Alu成员两端的顺向重复序列都有差异。 编辑ppt46 Alu序列由左右两个单体串联构成,前单体 长135bp,含有RNA聚合酶的转录控制区, 后单体长165bp,由于其中插入了另外的30bp 无关序列,致使此聚合酶控制区失效。 Alu家族的具体作用仍不清楚,但Alu序 列中有一个14bp区域与某些病毒(papova, heputitisB)中的复制起始的序列相同,因 此推测Alu家族与

25、真核细胞基因组的复制起始 点有关。 编辑ppt47 另外,有些Alu家族成员可在试管中被RNA聚 合酶转录为小的RNA,此类转录单位往往位 于其它转录单位附近。例如在人-球蛋白基 因群内就有两个这样的转录单元。而另一些 Alu家族成员往往包含在结构基因转录单位之 内,例如在细胞核RNA(nuclear RNA,nRNA) 之中。在一个nRNA分子内存在着多个Alu拷贝 将有助于该nRNA分子二级结构的形成。 编辑ppt48 所有这些暗示Alu家族成员可能与基因的转录、 调控有关。同时,Alu家族成员是可移动的成 分。Alu的转位与共转录过程结合进行,它们 以RNA为中间体,自我引物,逆转录成c

26、DNA, 然后插入另一位置,成为新的转录单位。这 种Alu成分的转位会引起DNA的重排,从而影 响细胞的分化。 编辑ppt49 6)6)、基因家族和基因簇、基因家族和基因簇 真核细胞中许多相关的基因常常按功能成套组 合,一套基因就是所谓的一个基因家族 (gene family)。一个基因家族中各成员表 达产物的结构和功能是密切相关的,但其表 达调控和表达水平以及表达产物的活性可能 很不相同,它们可以分散在同一染色体的不 同部位,甚至位于不同的染色体上。基因家 族通常可以分为简单多基因家族、复杂多基 因家族和受发育调控的复杂多基因家族。 编辑ppt50 一个家族的成员可以在染色体上紧密地排列在

27、一起,成为一簇,称为基因簇(gene cluster)。在人类基因组中有12个大的基因 簇,如-珠蛋白基因簇、-珠蛋白基因簇 和组蛋白基因簇等。 A.A.简单多基因家族简单多基因家族 简单多基因家族是指由一个或数个基因以串联简单多基因家族是指由一个或数个基因以串联 方式重复排列,各个基因含有单一的转录单方式重复排列,各个基因含有单一的转录单 元和非转录区。元和非转录区。编码5SrRNA的基因是一个典 型的简单多基因家族。 编辑ppt51 在高等真核生物中,有4种rRNA,即28S、18S、 5.8S和5SrRNA。前三种为主体rRNA,它们的 基因组成重复单元由RNA聚合酶共转录成一个 大分子

28、量的rRNA前体,然后再切割成3个独立 的rRNA分子。5SrRNA基因是独立的串联重复 单位,受另一个启动子的控制,每个重复单 元由5SrRNA基因和转录区之前的非转录区组 成。重复单元拷贝数差异很大,例如非洲爪 蟾约有2万个5SrRNA基因拷贝。 编辑ppt52 非洲爪蟾卵母细胞型非洲爪蟾卵母细胞型5S rRNA基因放入串联重复基因放入串联重复 单元单元 编辑ppt53 非洲爪蟾的非洲爪蟾的18S、5.8S及及28SrRNA基因是连在一起的,基因是连在一起的, 中间隔着不转录的间隔区,这些单位在中间隔着不转录的间隔区,这些单位在DNA链上串联重链上串联重 复约复约5000次次。在卵细胞形成

29、过程中这些基因可进行几千。在卵细胞形成过程中这些基因可进行几千 次不同比例的复制,产生次不同比例的复制,产生2106个拷贝,使个拷贝,使rDNA占卵占卵 细胞细胞DNA的的75%,从而使该细胞能积累,从而使该细胞能积累1012个核糖体。个核糖体。 编辑ppt54 一种是卵母细胞型,一种是体细胞型,大多数 是后一种类型,构成一个或几个基因簇,几 乎所有染色体上都有5SrRNA基因家簇。这么 大的数目足以满足卵子发生时期蛋白质迅速 合成的要求。 B.B.复杂的多基因家族复杂的多基因家族 复杂的多基因家族由几个相关基因家族构成相关基因家族构成, 基因家族间由间隔序列分开并作为独立的单 位被转录。组蛋

30、白基因(H1、H4、H2B、H3、 H2A)都属于这一类型。 编辑ppt55 组蛋白基因结构示意图组蛋白基因结构示意图 海胆和果蝇组蛋白基因家族的示意图。 编辑ppt56 海胆的5种主要组蛋白的基因串联构成一个单元, 它们多拷贝组成串联的重复基因簇,在整个 海胆基因组中重复约1000次。基因簇中每一 个基因分别被转录成单顺反子RNA,没有内含 子,而且各基因在同一条DNA链上按同一方向 转录,每个基因转录和翻译的速度都受到调 节。在不同组织中以及发育的不同时期表达 不同套的组蛋白基因。 编辑ppt57 果蝇中这5种组蛋白的基因也是成簇并串联重复, 但基因簇中每个基因都按照各自的方向进行 转录。

31、 组蛋白基因家族是重复序列中唯一已知具 有蛋白质编码功能的基因。组蛋白基因在DNA 开始合成前短暂地表达,基因活性与细胞周 期密切相关,当一段DNA被复制出来,马上就 有组蛋白与它偶联形成核小体。因此,在合 成DNA的短时间内必须大量合成组蛋白,这可 能是组蛋白基因串联成簇的一个原因。 编辑ppt58 C.受发育调控的复杂多基因家族受发育调控的复杂多基因家族 人类珠蛋白基因家族是典型的由发育调控 的复杂多基因家族。人类珠蛋白基因簇有二 种类型:-珠蛋白基因簇和-珠蛋白基因 簇。-珠蛋白基因簇位于16号染色体上,包包 括一个活化的括一个活化的,一个假基因一个假基因,2 2个个基基 因,因,2 2

32、个假基因个假基因和一个未知功能的和一个未知功能的基因,基因, 两个两个基因编码同样的蛋白质。基因编码同样的蛋白质。-珠蛋白基珠蛋白基 因位于因位于1111号号染色体上,大约染色体上,大约50 50 kbkb长,长, 编辑ppt59 珠蛋白基因家族结构图珠蛋白基因家族结构图 编辑ppt60 包括包括5 5个有功能的基因(个有功能的基因(、22、和和),), 还有一个假基因还有一个假基因。两个两个基因编码的蛋基因编码的蛋 白只有白只有一个氨基酸残基的差别一个氨基酸残基的差别,即,即G G蛋白在蛋白在1313 位是甘氨酸,而位是甘氨酸,而A A蛋白在这个位置上是丙氨酸蛋白在这个位置上是丙氨酸。 在发

33、育的在发育的不同阶段不同阶段,由,由不同的不同的类和类和类亚类亚 基基各各两个两个组成血红蛋白的组成血红蛋白的四聚体四聚体(表)。(表)。 编辑ppt61 胚胎期(胚胎期(8周以前)周以前) Hb Gower 1 Hb Gower 2 Hb Portland 胎儿期(胎儿期(841周)周) HbF 成人期成人期 HbA(98%) HbA2(2) 22 22 22 22 22 22 表表 表明了不同发育阶段血红蛋白的亚基表明了不同发育阶段血红蛋白的亚基 组成组成 编辑ppt62 人珠蛋白基因家族人珠蛋白基因家族 包括:包括:珠蛋白珠蛋白基因簇基因簇和和珠蛋白珠蛋白基因簇基因簇 编辑ppt63 在

34、人类珠蛋白基因簇中,基因排列的方式与它 们在个体发育阶段表达的顺序一致。首先是 胚胎期表达的基因,然后是胎儿期、成年期 的基因。在簇中,胚胎的链基因在2个 链(2和1)基因的前面,2和1分别 是胎儿和成年血红蛋白的成分;在簇中, 胚胎的链基因排在最前面,接着是胎儿的2 个链基因,最后是成年的和链基因。 -珠蛋白基因簇和珠蛋白基因簇和-珠蛋白基因簇都是从珠蛋白基因簇都是从 左至右依次转录的。左至右依次转录的。 编辑ppt64 7)7)、假基因、假基因 在多基因家族中,某些成员并不产生有功能的 基因产物,但其结构和DNA序列与有功能的基 因具有相似性。这些基因称为假基因。假基 因常用符号来表示。如

35、珠蛋白基因簇中的 1表示与1基因相似的假基因。假基因 与有功能的基因同源,原来也可以是有功能 的基因,由于发生缺失(deletion)、 编辑ppt65 倒位倒位( (inversion)inversion)与点突变与点突变( (point mutation)point mutation) 等等,使这一基因失去活性,成为无功能的基 因,即形成了假基因。 假基因的概念是1977年G.Jacq等人根据对非洲 爪蟾5SrRNA基因簇的研究提出的。5SrRNA基 因重复单位约700bp,其中有活性的编码序列 约120bp,而相邻的一个有101bp的序列的基 因与具有编码活性序列的5S基因的前101碱基

36、 序列是完全相同的, 编辑ppt66 但缺少了缺少了1919bpbp片断片断。所以在体内从未检测出过 这段与5SrRNA基因的复本序列基本相同的基 因转录出的rRNA,说明它是没有表达活性的, DNA序列分析表明:这个假基因上缺乏正常转 录的起始信号。 许 多 假 基 因 都 是 同 “ 亲 本 基 因 ” (parental gene)连锁的,而且共同编码区 及侧翼序列的DNA具有很高的同源性。珠蛋白 基因家族中的假基因是研究的 编辑ppt67 较为深入的例子。基因家族中的假基因、 1和2。1同3个有功能的-珠蛋 白的基因密切相关,将1假基因的核苷酸 序列同2功能基因比较发现,两者在上游序

37、列及间隔序列的同源性达73。据此可知, 1假基因是2功能基因突变而来的,由 于碱基突变而不能产生有功能的蛋白质。在 家族中,假基因1的结构特点是: 编辑ppt68 (1)缺乏内含子剪接加工的5,共同序列; (2)PolyA的信号由AATAAA突变成AATGAA; (3)转录起始密码子ATG为GTG所取代; (4)从38氨基酸开始有20个核苷酸缺失,造成 一个终止密码,使肽链提前终止。 根据珠蛋白的情况推断,每4个基因序列中就可 能存在有一个假基因。随着分析技术的提高, 会对较小的基因簇进行鉴定,发现更多的假 基因。 编辑ppt69 8)8)、断裂基因、断裂基因 一个基因的核苷酸序列中因插入了与

38、编码 氨基酸无关的核苷酸序列,使一个完整的基 因分隔成不连续的若干区段,我们称之为断 裂基因(split gene)。1997年Roberts和 Sharp实验室在研究腺病毒(adenovirus)的 mRNA合成时,发现病毒的双链DNA与它的mRNA 进行分子杂交时,在电镜下发现杂交链中有 一个个 编辑ppt70 突起的环,这环就是不能与mRNA互补配对的部 分。这一发现打破了每个结构基因是一段连发现打破了每个结构基因是一段连 续续DNADNA序列的传统观念序列的传统观念,使人们对基因结构的 认识产生了一次新的飞跃,因而他们两人获 得了1993年诺贝尔生理学与医学奖。 断裂基因中的序列有两部

39、分,一部分为表 达序列,即转录后在成熟的RNA中存在,称之 为外显子(extron)。 编辑ppt71 另一部分为不表达序列,即在mRNA成熟加工过 程中被除去,称之为内含子(intron)。断 裂基因的整个表达程序为:内含子和外显子 都被转录下来,称为初级转录物初级转录物,即核内不 均一RNA(hnRNA),又叫前体前体mRNAmRNA。在核内 经过转录后加工,除去除去内含子,拼接成成熟 的mRNA输送到细胞质,再翻译成多肽链。这 些内含子的删除和外显子的连接,外显子的连接,最后 编辑ppt72 形成成熟的RNA的过程称为RNA剪辑(RNA splicing)。当成熟的mRNA与原基因片段杂

40、 交时,内含子缺少互补序列而环凸出来。如 sharp等把分离出的组成腺病毒颗粒体的六邻 体mRNA与腺病毒DNA进行杂交,在电子显微镜 下观察,发现单链DNA中有三处核苷酸序列没 有相应的mRNA核苷酸序列与之配对而呈环状 结构(A、B和C),这些环状结构即为内含子 序列。因成熟的mRNA中这些序列 编辑ppt73 腺病毒六邻体腺病毒六邻体mRNA与其与其DNA杂交图杂交图 图释.a.腺病毒DNA ECORI酶切A片段,该片段从病毒DNA的 左端开始,在六邻体基因最后一个外显子的ECORI酶切部位 切断。六邻体基因由三个内含子(1kb、5kb和9kb)、3个短 外显子和一个长外显子(约3.5k

41、b)组成。b.六邻体基因成熟 mRNA和DNA ECORI酶切片段的杂合子结构模式图。 A、B、 C分别表示三个内含子。 编辑ppt74 已经被删除,所以杂交后DNA上的这些序列环凸 出来。基因的不连续性是真核基因独特的,基因的不连续性是真核基因独特的, 但是不连续性并不是所有真核基因中都可以但是不连续性并不是所有真核基因中都可以 找到的找到的。 A.A.内含子内含子 不同的断裂基因中内含子的个数和大小区别很 大。基因的大小很大程度上决定于其内含子 的个数和每个内含子的大小。 内含子的转录消耗了细胞的资源和能量,如 果对机体没有任何益处,进化是不会选择断 裂基因的。 编辑ppt75 所以就目前

42、人们的认识,内含子具有以下功能内含子具有以下功能: 1内含子可能携带某些信号作为基因的调控元 件。 内含子中存在许多重复序列,这些多重复内 含子的旁侧序列可能作为遗传调控元件。 2内含子具有各种剪接信号,通过对外显子的 选择性拼接,可以使一个基因产生多种基因 产物。 编辑ppt76 3内含子有自己特定的蛋白质编码。 4内含子在遗传上可以稳定基因簇。 B.B.外显子外显子 在DNA分子水平的基因概念(参第一节)中, 我们已知道一个外显子相当于蛋白质的一个 结构域。结构域是一种介于蛋白质二级结构 和三级结构之间存在的另一种结构层次,是 指蛋白质中一些相邻的二级结构片断聚集在 一起形成在空间 编辑p

43、pt77 上可明显区分的、相对独立的区域性结构。结 构域自身是紧密装配的,但结构域与结构域 之间关系松懈。两个结构域之间常有一段长 度不等的肽链相连,形成所谓的铰链区 (hinge region),使两个结构域很容易发 生相对运动。从蛋白质三级结构及其基因内蛋白质三级结构及其基因内 含子、外显子分布的许多例子中,可以观察含子、外显子分布的许多例子中,可以观察 到有些外显子表达出的多肽链经折叠经常相到有些外显子表达出的多肽链经折叠经常相 当于一个结构域,当于一个结构域,外显子的边界非常精确地 相当于结构域之间的联结处。 编辑ppt78 4、真核生物基因组的包装、真核生物基因组的包装 真核生物细胞

44、DNA的总长度因不同的种而异, 但与原核基因组相比,要大数千倍,每条染 色体中的DNA为单一线性DNA分子,长度可达 几厘米,它们必须以高度浓缩的形式被装进高度浓缩的形式被装进 直径约直径约5 51010m m的细胞核内的细胞核内。 真核生物基因组DNA被压缩的第一步是形成 核小体(nucleosome)的重复单位, 编辑ppt79 这也是染色质结构的基本单位。用一种切割 双链DNA的内切酶微球菌核酸酶消化染色质, 可以获得单个的核小体,每个核小体是由大核小体是由大 约约200200bpbp的的DNADNA环绕环绕4 4种组蛋白种组蛋白 (H2AH2A,H2BH2B, H3H3,H4H4)每种

45、每种2 2个拷贝组成的八聚体个拷贝组成的八聚体。其中 146 bp紧紧缠绕着组蛋白八聚体核心,其余 的用于连系两个核小体,称为连接DNA。组蛋 白H1不参与核小体的组成,而与连接DNA相结 合。 编辑ppt80 这些蛋白质保护DNA免受微球菌核酸酶的作用。 在核酸酶的连续消化作用下,组蛋白Hl丢失, 得到抗性极强的核小体核心核小体核心(nucleosome core)。不论染色体源于何处,都具有相似 的核小体结构。 核小体的组装分三步三步,即两对两对H H3 3、H H4 4组组 蛋白组成的四聚体蛋白组成的四聚体,首先与组成核小体的DNA 中段120120bpbp相结合相结合,随后,两个 编辑

46、ppt81 H2A、H2B组蛋白二聚体分别与其上下级的DNA 结合,形成完整的核小体核心形成完整的核小体核心,146bp长的 DNA以左手方式环绕组蛋白八聚体1.8圈,DNA 在核心两端各延伸10bp。1分子组蛋白H1与核 小体结合,使进出核小体核心两端的DNA区域 紧密靠拢而稳定。由于H1的存在,DNA达到 166bp,相当于绕组蛋白八聚体两圈。核小体 核心颗粒加上一个H1分子构成染色小体 编辑ppt82 (chromatosome)。两个核小体之间为DNA连 接区,平均长度为55bp(在不同的种或不同 的组织中其长度会在0100bp范围内变化) 称DNA连丝,然后再盘绕另一个组蛋白八聚体

47、核心,如此而不断重复。核小体作为基本结核小体作为基本结 构单位重复连结起来形成直径构单位重复连结起来形成直径1010nmnm串联排列串联排列 的的“念珠念珠”(beads on a stringbeads on a string),),这是染这是染 色体包装的一级结构。色体包装的一级结构。组蛋白H1的存在加强 了 编辑ppt83 “串珠”的组构,随后核小体进一步螺旋化,核小体进一步螺旋化, 每一圈由每一圈由6 6个核小体构成外径个核小体构成外径3030nmnm、内径内径1010nmnm、 螺距螺距1111nmnm的中空螺旋管(的中空螺旋管(solenoidsolenoid),),这是这是 染色

48、体包装的二级结构染色体包装的二级结构。螺旋管再次螺旋化螺旋管再次螺旋化 形成直径形成直径0.40.4m m的圆桶状超螺旋管(的圆桶状超螺旋管(super super solenoidsolenoid),),这是染色体包装的三级结构这是染色体包装的三级结构。 最后超螺旋管再螺旋,折叠形成超螺旋管再螺旋,折叠形成2 21010m m的染的染 色单体,即染色体包装的四级结构。色单体,即染色体包装的四级结构。 编辑ppt84 图图 染色质中核小体的结构。染色质中核小体的结构。 释放的释放的DNA以串珠形式存在,串珠由核小体通过连接以串珠形式存在,串珠由核小体通过连接 DNA连接而成,用微球菌核酸酶来剪

49、切,产生单个核小连接而成,用微球菌核酸酶来剪切,产生单个核小 体。经进一步消解切除大部分连接体。经进一步消解切除大部分连接DNA,产生单个的染产生单个的染 色小体。经进一步消化,与色小体。经进一步消化,与H1组蛋白结合的组蛋白结合的DNA也被切也被切 除,解离出核小体颗粒,它含有余下的除,解离出核小体颗粒,它含有余下的146bp的的DNA。 编辑ppt85 核小体核小体 由由5种组蛋种组蛋 白和白和200bp 左右的左右的DNA 组成。然后组成。然后 核小体在进核小体在进 一步压缩构一步压缩构 成更高级的成更高级的 结构。结构。 组蛋白八聚体组蛋白八聚体(2(2H H2A 2A+ + 2H 2

50、H2B 2B+2H+2H3 3+2H+2H4 4) )构成构成核心颗粒核心颗粒。 核心外缠绕约核心外缠绕约140140bpbp的的DNADNA片段。片段。H H1 1位于位于DNADNA与核心颗粒连接处与核心颗粒连接处。 编辑ppt86 压缩的染色质纤维模型压缩的染色质纤维模型 编辑ppt87 DNA双螺旋 核小体“串珠” “螺线管” “袢环” “放射环” 中期染色体 一级结构一级结构 二级结构二级结构 三级结构三级结构 “超螺线管超螺线管” 四级结构四级结构 染色质的四级结构模型染色质的四级结构模型 编辑ppt88 染色体的染色体的“袢环袢环”模型模型 v解释螺线管如何进一步包装成染色体?解

51、释螺线管如何进一步包装成染色体? 每一个袢环含每一个袢环含315个核小个核小 体,体,18个袢环形成微带个袢环形成微带。 编辑ppt89 编辑ppt90 编辑ppt91 真核生物基因组结构与功能的特点真核生物基因组结构与功能的特点 真核生物的基因组真核生物的基因组DNADNA都是都是双链线状双链线状的,并与蛋白的,并与蛋白 质结合形成染色体,而且质结合形成染色体,而且染色体数目染色体数目往往不是一条,往往不是一条, 而是而是多条多条 。 真核生物基因组除了配子真核生物基因组除了配子( (精于和卵子精于和卵子) )为单倍体外为单倍体外 ,体细胞一般为二倍体体细胞一般为二倍体,即含两份同源的基因组

52、,而,即含两份同源的基因组,而 原核生物的基因组则是单拷贝的。原核生物的基因组则是单拷贝的。 真核基因组一般比较庞大,结构复杂,基因是真核基因组一般比较庞大,结构复杂,基因是断断 裂基因裂基因(split gene)(split gene),即编码序列被非编码序列分隔开,即编码序列被非编码序列分隔开 来。非编码的顺序来。非编码的顺序(non-coding sequence(non-coding sequence,NCS)NCS)占占9090 以上,远远多于编码区以上,远远多于编码区 编辑ppt92 结构基因的转录产物为结构基因的转录产物为单顺反子单顺反子,即一分子,即一分子 mRNAmRNA只

53、能翻译成一种蛋白质。只能翻译成一种蛋白质。 真核生物基因组中含有真核生物基因组中含有大量重复顺序大量重复顺序。 真核生物基因组内功能相关的基因构成各种基真核生物基因组内功能相关的基因构成各种基 因家族,它们可串联在一起,亦可相距很远,因家族,它们可串联在一起,亦可相距很远,但但 即使串联在一起的成簇的基因也是分别转录的即使串联在一起的成簇的基因也是分别转录的。 编辑ppt93 三三 原核生物基因组原核生物基因组 v原核生物的基因组很小,大多只有一原核生物的基因组很小,大多只有一 条染色体,且条染色体,且DNADNA含量少,大都带有含量少,大都带有 单拷贝基因,只有很少数基因单拷贝基因,只有很少

54、数基因如如 rRNArRNA基因基因是以多拷贝形式存在;是以多拷贝形式存在; 编辑ppt94 大肠杆菌乳糖操纵子大肠杆菌乳糖操纵子 LacZ ( 半乳糖苷酶)半乳糖苷酶) 3510bp LacY ( 半乳糖苷通透酶)半乳糖苷通透酶) 780bp LacA ( 半乳糖乙酰酶)半乳糖乙酰酶) 825bp 结构基因结构基因 启动子启动子 (P) TGTTGACATTTATTTGTTATAATG CAT 69bp 47bp 操纵基因操纵基因 (O) 5 3 识别部位识别部位结合部位结合部位乳糖操纵子乳糖操纵子 调节基因(调节基因(R) 1040bp 操纵子:是由启动子、操纵基因以及由它所控制操纵子:是

55、由启动子、操纵基因以及由它所控制 的一系列结构基因所构成的。的一系列结构基因所构成的。 原核细胞基因的结构原核细胞基因的结构 编辑ppt95 ( (一一) )、原核生物基因组的特点、原核生物基因组的特点 原核生物基因组都很小,如大肠杆菌,整个基原核生物基因组都很小,如大肠杆菌,整个基 因组由因组由4.64.61010 6 6bp bp组成,相对分子质量为组成,相对分子质量为 2.42.410109 9,大约包括,大约包括3000300040004000个基因。个基因。SVSV40 40 病毒的分子量有病毒的分子量有3.03.010106 6,含有,含有 5 5个基因,而个基因,而 单链单链RN

56、ARNA病毒病毒QBQB只含有只含有4 4个基因。原核生物的个基因。原核生物的 基因组虽小,但其利用率很高,这表现在以基因组虽小,但其利用率很高,这表现在以 下下3 3个方面。个方面。 编辑ppt96 1 1基因组的序列绝大部分是用来编码蛋白质基因组的序列绝大部分是用来编码蛋白质 的,只有极少部分不转录,而不转录部分通的,只有极少部分不转录,而不转录部分通 常是控制基因表达的序列。常是控制基因表达的序列。 2 2存在着基因重叠的现象,即同一段存在着基因重叠的现象,即同一段DNADNA序列序列 能携带能携带2 2种不同的蛋白质的信息。种不同的蛋白质的信息。 3 3原核生物的基因是连续的,基本不存

57、在内含原核生物的基因是连续的,基本不存在内含 子成分,因此在转录后不需要剪接加工。并子成分,因此在转录后不需要剪接加工。并 且,绝大多数区域都无重复序列。且,绝大多数区域都无重复序列。 编辑ppt97 另外,原核生物基因组在其转录调控中的一原核生物基因组在其转录调控中的一 大特点是存在有操纵子结构大特点是存在有操纵子结构,即即 DNADNA序列中序列中 功能相关的功能相关的RNARNA或蛋白质基因往往前后排列在或蛋白质基因往往前后排列在 一起形成一个转录单位,从同一启动子开始一起形成一个转录单位,从同一启动子开始 转录形成一个多顺反子转录形成一个多顺反子mRNAmRNA,再被分别表达再被分别表

58、达 成不同的成不同的RNARNA或蛋白质。或蛋白质。 编辑ppt98 细菌基因组细菌基因组 在细菌中存在有两类在细菌中存在有两类DNADNA:一类是含有大量基一类是含有大量基 因的因的DNADNA分子,称为分子,称为细胞的染色体或基因组,细胞的染色体或基因组, 另一类是质粒另一类是质粒DNADNA分子分子,质粒携带的基因不妨,质粒携带的基因不妨 碍细胞的生长。每个细菌细胞只含有一个染碍细胞的生长。每个细菌细胞只含有一个染 色体色体DNADNA,细菌染色体外裹着稀疏的蛋白质,细菌染色体外裹着稀疏的蛋白质, 这些蛋白质有些与这些蛋白质有些与DNADNA的折叠有关,另一些则的折叠有关,另一些则 参与

59、参与DNADNA复制、重组及转录过程。大多数细菌复制、重组及转录过程。大多数细菌 编辑ppt99 染色体染色体DNADNA是是环状的环状的。细菌染色体的环化性使。细菌染色体的环化性使 得在缺少端粒(得在缺少端粒(telomeretelomere)的情况下,仍能的情况下,仍能 够完整的复制。如大肠杆菌在一天内可以从够完整的复制。如大肠杆菌在一天内可以从 一个单细胞增殖到每毫升一个单细胞增殖到每毫升 2 210109 93 310109 9个个 细胞的群体。大肠杆菌的基因组细胞的群体。大肠杆菌的基因组DNADNA为双股环为双股环 状状DNADNA,含有含有40004000个以上基因,总长度为个以上

60、基因,总长度为 4.64.610106 6碱基对碱基对, 编辑ppt100 DNADNA的总长度为的总长度为11001100至至14001400mm,而大肠杆菌而大肠杆菌 本身的长度只有几个微米,因此本身的长度只有几个微米,因此DNADNA必须折叠、必须折叠、 凝聚以适应细胞的容量。这种折叠、凝聚的凝聚以适应细胞的容量。这种折叠、凝聚的 结构集中分布在称为结构集中分布在称为核质体或拟核体核质体或拟核体 (nucleotidenucleotide)的区域的区域。在核质体中。在核质体中DNADNA成分成分 占占8080,其余为,其余为RNARNA和蛋白质。小心地将大肠和蛋白质。小心地将大肠 杆菌的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论