版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章第四章 真核生真核生物基因组构造物基因组构造 第一节第一节 真核生物基因组的组成真核生物基因组的组成支支原原体体细细菌菌酵酵母母霉霉菌菌蠕蠕虫虫昆昆虫虫鸟鸟类类两两栖栖类类哺哺 乳乳类类1010109108107106 C值悖理实际值悖理实际C-value paradox)植物植物鸟类鸟类哺乳动物哺乳动物爬行动物爬行动物两栖动物两栖动物硬骨鱼硬骨鱼软骨鱼软骨鱼棘皮动物棘皮动物甲壳动物甲壳动物昆虫昆虫软体动物软体动物蠕虫蠕虫霉菌霉菌藻类藻类真菌真菌格兰氏阳性菌格兰氏阳性菌格兰氏阴性菌格兰氏阴性菌支原体支原体阴影部分为一个门内阴影部分为一个门内C-值的范围值的范围 不同物种编码基因差别很大,
2、从不同物种编码基因差别很大,从500个到个到50000个,个,有有100倍的差距。倍的差距。 真核生物的基因数量通常在真核生物的基因数量通常在6000到到50000之间。之间。 人的基因组的全长为大约人的基因组的全长为大约3 X 109对碱基,编码对碱基,编码 3-4万个基因;万个基因; 但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量能够不超越能够不超越3000个,比很多细菌的基因数量还少。个,比很多细菌的基因数量还少。 对上式积分后重排,得出复性动力学方程:对上式积分后重排,得出复性动力学方程: CC011 k C0t C0为单链为单链DNA的起始浓
3、度,的起始浓度,C为单链为单链DNA在在t时辰的浓度,时辰的浓度,单位单位mol/L。 t为复性时间为复性时间,单位为单位为s秒。重组速率常数秒。重组速率常数k的的单位为单位为L/mol,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和DNA序列的复杂性。序列的复杂性。当当 C/ C0 = 1/2 时的时的C0t值定义为值定义为C0t1/2C / C0 = 1/2 = 1 / (1+ k C0t(1/2)Cot(1/2) = 1/k (mol. Sec / L)即复性反响即复性反响完成一半时完成一半时p 在控制反响条件初始浓度、温度、离子强度、片段大在控制反响条件初始
4、浓度、温度、离子强度、片段大小一样的前提下,小一样的前提下,DNA分子的分子的C0t (1/2)值,取决于核值,取决于核苷酸的陈列复杂性。苷酸的陈列复杂性。p DNA序列的复杂度序列的复杂度(complexity) X:最长的没有反复序列:最长的没有反复序列的核苷酸对的数值。的核苷酸对的数值。AAAAAAAA X = 1ATCGATCGATCG X = 4 N= 105 X = 105DNA序列的复杂性、初始浓度、片段大小、温度、离子强度序列的复杂性、初始浓度、片段大小、温度、离子强度DNA复性的影响要素:复性的影响要素:X= k Cot1/2n一样核苷酸数量的一样核苷酸数量的DNA,复杂性小
5、的,复杂性小的DNA分子复性分子复性快,快,Cot (1/2)值小;复杂性大的值小;复杂性大的DNA分子复性慢,分子复性慢,Cot (1/2) 大。大。nCot曲线:表示复性速度与曲线:表示复性速度与DNA顺序复杂性的关系。顺序复杂性的关系。Cot(1/2) = 1/k (mol. Sec / L) Cot曲线曲线2.利用复性动力学鉴定基因组序列利用复性动力学鉴定基因组序列原核生物原核生物Cot曲线的特点:曲线的特点:外形类似跨越外形类似跨越2-3个数量级,个数量级,Cot12不一样不一样单一序列,只是复杂性不同。单一序列,只是复杂性不同。复杂性复杂性X 1不同原核生物的不同原核生物的Cot曲
6、线曲线复性分数复性分数1-c/c0CotP74图图16真核生物真核生物DNA复性曲线的方复性曲线的方式图式图复性反响分为复性反响分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型 根据复性动力学特征的不同,将真核生根据复性动力学特征的不同,将真核生物物DNA序列分为序列分为4类:类: 零时复性序列零时复性序列 快速复性序列快速复性序列 中速复性序列中速复性序列 慢速复性序列慢速复性序列1零时复性序列: 具有反向反复构造也称回文构造,可在同一条链内构成双链区,变性后再复性时,在链间复性之前就已发生链内复性,因此不遵照二级反响动力学方程。由于这种序列的复性速度非常快,在动
7、力学上称为零时或瞬时复性序列。 DNA复性后可出现发卡形构造。这种序列经常是DNA复制酶、转录酶以及特异蛋白质的结合部位。2 2快速复性序列:快速复性序列: 也叫高度反复序列也叫高度反复序列Highly Highly repetitive sequencerepetitive sequence 大部分集中于异染色质区大部分集中于异染色质区 ,特别是在着丝粒和端粒区,特别是在着丝粒和端粒区,往往没有转录功能往往没有转录功能 。 占基因组的占基因组的10-60%,长度长度6 200bp ,反复次数在,反复次数在105以上。以上。P74图图16真核生物真核生物DNA复性曲线的方复性曲线的方式图式图复
8、性反响分为复性反响分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型3中速复性序列:中速复性序列:l基因组中反复次数基因组中反复次数105的反复顺序的反复顺序,反复单位平均长反复单位平均长度约度约300bp;l复性速度快于单拷贝顺序,慢于高度反复顺序。复性速度快于单拷贝顺序,慢于高度反复顺序。l多与单拷贝基因间隔陈列。多与单拷贝基因间隔陈列。l多为非编码序列,如多为非编码序列,如Alu序列序列l也有编码基因产物的,如也有编码基因产物的,如rDNA、tDNA、组蛋白基、组蛋白基因家族因家族, 普通往往以基因家族的方式存在。普通往往以基因家族的方式存在。也叫中度反复序列也
9、叫中度反复序列(moderate repetitive sequences)Alu familyAlu 家族:家族:长约长约300bp的片段,大多数片段含有一个的片段,大多数片段含有一个限 制 性 内 切 酶限 制 性 内 切 酶 A l u 的 酶 切 位 点的 酶 切 位 点AGCT; 均匀分散在整个基因组中的非反复序列间均匀分散在整个基因组中的非反复序列间; 在人类基因组中占在人类基因组中占1 3; 4慢速复性序列:慢速复性序列: C0t1/2普通在普通在103mol.s/L以上,复以上,复性速度极慢,在一个基因组中只需一性速度极慢,在一个基因组中只需一个拷贝或个拷贝或23个拷贝,也称非
10、反复序列个拷贝,也称非反复序列单一序列、单拷贝序列。单一序列、单拷贝序列。构造基因构造基因 (蛋白质基因蛋白质基因)大多是单拷贝大多是单拷贝序列。序列。P74图图16真核生物真核生物DNA复性曲线的方复性曲线的方式图式图复性反响分为复性反响分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型大部分构造基因大部分构造基因位于非反复的位于非反复的DNA序列内序列内第二节第二节 断裂基因断裂基因split gene 不延续基因不延续基因interrupted gene 编码某一编码某一RNARNA的基因中有些序列并不出如今成熟的基因中有些序列并不出如今成熟的的RNARNA序列
11、中,成熟序列中,成熟RNARNA的序列在基因中被其他的的序列在基因中被其他的序列隔开。序列隔开。一、断裂基来由外显子和内含子组成一、断裂基来由外显子和内含子组成1 1、断裂基因的发现、断裂基因的发现 经过成熟经过成熟mRNAmRNA或或cDNAcDNA与编码基因的与编码基因的DNADNA杂交实验而杂交实验而发现。发现。鸡卵清蛋白成熟鸡卵清蛋白成熟mRNA与与DNA杂交电镜图杂交电镜图DNAmRNA断裂基来由外显子和内含子组成。断裂基来由外显子和内含子组成。1978 Gilbert 首创这两个概念首创这两个概念 二、外显子二、外显子(外元、外元、 Exon)DNA 与成熟与成熟RNA间的对应区域
12、间的对应区域氨基酸的编码区氨基酸的编码区amino acid coding region 非间隔区非间隔区unspacer 原初转录物中经过原初转录物中经过RNARNA拼接反响而保管于成熟拼接反响而保管于成熟RNARNA中的序列或基因中与成熟中的序列或基因中与成熟RNARNA序列相对应的序列相对应的DNADNA序列。序列。2.断裂基因的构造断裂基因的构造1.外显子具有保守的序列外显子具有保守的序列 不同物种中的同源基因的外显子序列通常是保守不同物种中的同源基因的外显子序列通常是保守的。尤其是编码区内的外显子具有很强的保守性,但的。尤其是编码区内的外显子具有很强的保守性,但处于处于5和和3非编码
13、区的外显子有时会发生变化。非编码区的外显子有时会发生变化。2.外显子对应基因的功能性单位外显子对应基因的功能性单位外显子与蛋白质的构造域相对应。外显子与蛋白质的构造域相对应。3.不同基因能够存在相关的外显子不同基因能够存在相关的外显子不同基因中的某个或某几个外显子能够具有相关性。不同基因中的某个或某几个外显子能够具有相关性。三、内含子三、内含子(内元内元 、 Intron)DNA 与成熟与成熟RNA间的非对应区域间的非对应区域 氨基酸的非编码区氨基酸的非编码区uncoding region 间隔区间隔区spacer 但被转录但被转录 原初转录物中经过原初转录物中经过RNARNA拼接反响而被去除
14、的拼接反响而被去除的RNARNA序序列或基因中与这种列或基因中与这种RNARNA序列相对应的序列相对应的DNADNA序列。序列。R R环环R-loopR-loop:mRNAmRNA与编码单链与编码单链DNADNA杂交时,杂交时,不互补的内含子部分构成的环。不互补的内含子部分构成的环。鸡卵清蛋白成熟鸡卵清蛋白成熟mRNA与与DNA杂交电镜图杂交电镜图DNAmRNA断裂基因断裂基因前体前体mRNAIntrons 去除去除Exons 衔接衔接倍,它可以被胜利复制,不会呵斥阅读框的推移。相倍,它可以被胜利复制,不会呵斥阅读框的推移。相反,非对称外显子是不可复制的。反,非对称外显子是不可复制的。 肌钙蛋
15、白基因内含子的可变剪接,产生肌钙蛋白基因内含子的可变剪接,产生和和两种类型的蛋白两种类型的蛋白3.内含子存在的意义及与进化的关系内含子存在的意义及与进化的关系有利于储存更多的遗传信息,添加信息量。有利于储存更多的遗传信息,添加信息量。由于可变剪接的存在由于可变剪接的存在.添加了重组概率:添加了重组概率: 基因总长度添加基因总长度添加. 可变剪接的存在可变剪接的存在.有利于生物体的变异和进化:有利于生物体的变异和进化:添加了重组概率添加了重组概率,还会呵斥基因突变。还会呵斥基因突变。 第三节第三节 基因家族和基因簇基因家族和基因簇 Gene family 、 Gene cluster 基因家族基
16、因家族Gene familyGene family: :真核生物的基因组中许多来源一样,构真核生物的基因组中许多来源一样,构造类似、功能相关的一组基因。造类似、功能相关的一组基因。一、基因家族一、基因家族1.基因家族的成因基因家族的成因基因家族的各个成员都是由某一祖先基因经反复基因家族的各个成员都是由某一祖先基因经反复复制和突变产生的。复制和突变产生的。2.基因家族的特点基因家族的特点基因家族的各个成员之间来源一样,构造类似、基因家族的各个成员之间来源一样,构造类似、功能相关。功能相关。人类珠蛋白基因家族典型的基因家族人类珠蛋白基因家族典型的基因家族血红蛋白血红蛋白珠蛋白珠蛋白血红素血红素22
17、 22 不同的亚基由各自的基因不同的亚基由各自的基因编码编码血红蛋白血红蛋白 Hb Hb 发育过程中的珠蛋白的亚基组成发育过程中的珠蛋白的亚基组成两种亚基的编码基因分别构成两个不同的基因簇两种亚基的编码基因分别构成两个不同的基因簇, ,并存在于不同的染色体上。并存在于不同的染色体上。每个基因簇中的基因按其在发育过程中的表达次序从每个基因簇中的基因按其在发育过程中的表达次序从5 533陈列在编码链上陈列在编码链上( (其中包括有功能的基因和假基其中包括有功能的基因和假基因因) )22222% 97% 1%2% 97% 1% 类类 链链 类类 链链 3.假基因假基因 Pseudogenes :概念
18、:基因组中存在的一段与正常基因非常类似但不概念:基因组中存在的一段与正常基因非常类似但不能表达的能表达的DNA序列。序列。 分为两大类:分为两大类:一类保管了相应功能基因的间隔序列;一类保管了相应功能基因的间隔序列;另一类短少间隔序列,称为加工过的假基因或返座假另一类短少间隔序列,称为加工过的假基因或返座假基因。基因。 假基因假基因(pseudogene)具有与功能基因类似的序列,具有与功能基因类似的序列,但由于有许多突变以致失去了原有的功能,所以假但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的基因,常用基因是没有功能的基因,常用表示。表示。 大部分假基因在染色体上都位于正常基因
19、的附近,大部分假基因在染色体上都位于正常基因的附近,但也有位置在不同的染色体上的。但也有位置在不同的染色体上的。 假基因和正常基因的构造上的差别包括在不同部位假基因和正常基因的构造上的差别包括在不同部位上的程度不等的缺失或插入、在内含子和外显子邻接上的程度不等的缺失或插入、在内含子和外显子邻接区中的顺序变化、在区中的顺序变化、在5端启动区域的缺陷等。这些变端启动区域的缺陷等。这些变化往往使假基因不能转录构成正常的化往往使假基因不能转录构成正常的(mRNA),从而,从而不能表达。不能表达。 产生方式:产生方式:复制复制duplication即复制后基因发生序列变化而失去功即复制后基因发生序列变化
20、而失去功能,这样产生的假基因带有内含子,称为能,这样产生的假基因带有内含子,称为未加工假基因或复制假基因未加工假基因或复制假基因 。返座返座retrotransposition即即mRNA转录本经过反转录为转录本经过反转录为cDNA,再插入基因组,由于插入位点不适宜或序再插入基因组,由于插入位点不适宜或序列发生变化而导致失去功能。这种类型的列发生变化而导致失去功能。这种类型的假基因不含内含子,被称为已加工假基因假基因不含内含子,被称为已加工假基因或返座假基因。或返座假基因。二、基因簇二、基因簇gene cluster 概念:基因家族中来源一样、构造类似和功能相关的概念:基因家族中来源一样、构造
21、类似和功能相关的在染色体上彼此严密连锁的一组基因。在染色体上彼此严密连锁的一组基因。 它们属于同一个祖先的基因扩增产物,也经常包它们属于同一个祖先的基因扩增产物,也经常包括一些没有生物功能的假基因。括一些没有生物功能的假基因。 如:编码催化同一新陈代谢途径的不同步骤的酶的构如:编码催化同一新陈代谢途径的不同步骤的酶的构造基因造基因 。这些基因各自编码的酶常能组成多酶复合物。这些基因各自编码的酶常能组成多酶复合物。 细菌同一支配子中的几个构造基因也可称为基因簇细菌同一支配子中的几个构造基因也可称为基因簇 。串联反复基因簇的特点:串联反复基因簇的特点:各成员之间有高度的序列一致性各成员之间有高度的
22、序列一致性拷贝数高拷贝数高 : 几十几十 几百几百非转录的间隔区短而一致非转录的间隔区短而一致 组蛋白基因、组蛋白基因、rRNA rRNA 基因和基因和 tRNA tRNA基因往往以串联反基因往往以串联反复基因簇的方式出现。复基因簇的方式出现。正好满足细胞对组蛋白、正好满足细胞对组蛋白、rRNA rRNA 和和 tRNA tRNA的的 的大量需求。的大量需求。 由完全一样的基因簇成员所构成。由完全一样的基因簇成员所构成。1.串联反复序列串联反复序列 a. rRNA a. rRNA 基因家族基因家族 rDNA gene familyrDNA gene family海胆海胆450copies烟草烟
23、草750 copies果蝇果蝇100 copiesT 18s T 5.8s T 28s NT 18s T 5.8s T28s5.8s反复单位的组织情况:反复单位的组织情况:一个反复单位内的转录一个反复单位内的转录的间隔区内元的间隔区内元反复单位之间的反复单位之间的不转录间隔区不转录间隔区 b. b.组蛋白基因家族组蛋白基因家族Histone gene familyHistone gene familyH1H4H2BH3H2A一个反复单位一个反复单位( (基因簇基因簇 gene cluster) gene cluster)的组织情况:的组织情况:组织方式因不同生物而异:组织方式因不同生物而异:基
24、因次序、间隔区的长短、反复频率基因次序、间隔区的长短、反复频率不转录间隔区不转录间隔区海胆:海胆:组蛋白基因表达特点:组蛋白基因表达特点: 没有内元没有内元 没有多聚没有多聚A A尾巴尾巴 c. tRNA基因基因 tRNAtRNA约长约长 70 70 80 bp 80 bp,其基因约长,其基因约长140 bp (140 bp (内元内元) )串联反复陈列,但各反复单位内的各串联反复陈列,但各反复单位内的各tRNAtRNA基因可以不同基因可以不同d. 5SrRNA基因基因 简单多基因家族简单多基因家族成簇陈列、成簇陈列、102 102 103103个拷贝个拷贝123 3 不转录的间隔区不转录的间
25、隔区1 5S rRNA2 假基因假基因 反复单位间由高反复单位间由高 度反复序列隔开度反复序列隔开2.卫星卫星DNASatellite DNA: 将将DNA切成数百个碱基对的片段进展氯化铯密切成数百个碱基对的片段进展氯化铯密度梯度离心时,由于富含度梯度离心时,由于富含AT的简单高度反复序列的简单高度反复序列区段浮力密度较小,因此很容易和总体区段浮力密度较小,因此很容易和总体DNA分开,分开,即常会在主要的即常会在主要的DNA带之外有一个次要的带相伴带之外有一个次要的带相伴随。随。 根据反复频率和大小可分为根据反复频率和大小可分为卫星卫星DNA小卫星小卫星DNA微卫星微卫星DNA卫星卫星DNA的
26、重要特征是:序列长且复杂性低。的重要特征是:序列长且复杂性低。Mouse genome DNA30% GC in satellite DNACsCl 离心离心主带主带卫星带卫星带光光 的的 吸吸 收收 率率浮浮 力力 密密 度度卫星卫星DNA: 一个反复单位长一个反复单位长100几百几百bp,不能转录和翻译,不能转录和翻译,多分布于异染色质的着丝粒区。多分布于异染色质的着丝粒区。小卫星小卫星DNA: 一个反复单位长一个反复单位长10100bp,具有高度的可变性,具有高度的可变性,甚至同一群体中个体间反复次数变动很大,所以个体甚至同一群体中个体间反复次数变动很大,所以个体间长度变化很大间长度变化
27、很大DNA长度多态性长度多态性 但每个小卫星但每个小卫星DNA又都存在一段共有的中心序列,又都存在一段共有的中心序列,长长1015bp,富含富含GC。 存在于基因组的广泛区域:基因的间隔区,内含子,外显子,存在于基因组的广泛区域:基因的间隔区,内含子,外显子,调控区。调控区。 不同物种,微卫星含量不同:真核生物平均不同物种,微卫星含量不同:真核生物平均50150kb一一 个微卫个微卫星。星。 不同微卫星在不同物种中丰度不同:哺乳动物基因组中不同微卫星在不同物种中丰度不同:哺乳动物基因组中(AC)n最最丰富;植物基因组中丰富;植物基因组中 (AT)n最丰富。最丰富。 真核生物基因组中,二核苷酸微
28、卫星最丰富,三核苷酸微卫星比真核生物基因组中,二核苷酸微卫星最丰富,三核苷酸微卫星比二核苷酸微卫星低二核苷酸微卫星低10倍,四核苷酸微卫星更少。倍,四核苷酸微卫星更少。微卫星微卫星DNA:一个反复单位长一个反复单位长10bp以下。以下。 后两种卫星后两种卫星DNADNA又称为数目可变的串联反复序列又称为数目可变的串联反复序列( Variable number tandem repeats . VNTR )( Variable number tandem repeats . VNTR )或短串联反或短串联反复序列复序列short tandem repeats . STR short tandem
29、 repeats . STR 第四节第四节 真核基因组的包装真核基因组的包装一、概述:一、概述: * * 真核真核DNADNA组蛋白组蛋白 核小体核小体 * * 核小体折叠压积核小体折叠压积 染色质染色质chromatinchromatin 还包括非组蛋白和少量的还包括非组蛋白和少量的RNARNA * * 大部分细胞生活周期里以染色质的方式存在弥散状大部分细胞生活周期里以染色质的方式存在弥散状 M M期染色体方式期染色体方式 * * 染色质有两种类型染色质有两种类型 a a、常染色质:密度较低,一部分基因能被表达、常染色质:密度较低,一部分基因能被表达 b b、异染色质:密度较高,不被表达着丝粒、端粒、异染色质:密度较高,不被表达着丝粒、端粒 * * 组蛋白八聚体组蛋白八聚体Histone octamer Histon
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省漳州市十校联盟2024-2025学年高一上学期11月期中考试 数学 含解析
- 城乡给排水工程建设安全基础管理、构筑物、作业、设备管理、消防安全、隐患、事故预防技术服务报告模板
- 辽宁省鞍山市海城市某中学2024-2025学年九年级上学期开学考试数学试题(含答案)
- 文书模板-展览会合同书
- 2024年07版小学5年级上册英语第3单元寒假试卷
- 珠宝销售企业要缴哪些税费-记账实操
- 烃 单元复习-2024年高中化学讲义(选择性必修三)
- 2024年水果、坚果加工品项目资金需求报告代可行性研究报告
- 强化理论的运用原理
- 【沪科】期中模拟卷A【21-23章】
- 2024江苏省沿海开发集团限公司招聘23人高频难、易错点500题模拟试题附带答案详解
- 电气工程及其自动化职业规划课件
- 人教版2024七年级上册英语各单元单词短语句型汇编
- 2024年计算机二级WPS考试题库380题(含答案)
- 2024年人教版九年级英语单词默写单(微调版)
- 22G101三维彩色立体图集
- 大学生安全文化智慧树知到期末考试答案章节答案2024年中南大学
- 2024届高考专题复习:思辨类作文专题复习
- 申请工程工期顺延的函(联系单)
- 人教版小学英语单词表(完整版)
- 国家开放大学《心理健康教育》形考任务1-9参考答案
评论
0/150
提交评论