版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、田英芳 yingfang_ 第三章第三章 基因和基因组基因和基因组 基因?基因? 顺反子通过 顺反试验确定, 如两个位点可以 互补,则不属于 一个顺反子;如 两个位点不可以 互补,则属于同 一个顺反子。 上图为突变 发生在相同基因 无互补,下图为 突变发生在不同 基因,图中蓝条 表示基因,红点 表示突变位点。 中心法则中心法则 修改后的修改后的 中心法则中心法则 1961年Jacob和Monod提出操纵子学说操纵子学说,和结构基因、调节基 因、操纵基因等概念。 结构基因结构基因(Structure gene)是指为蛋白质或RNA编码的基 因,结构基因的突变可导致蛋白质或RNA一级结构的改变。
2、结构基因的5-端非编码区(5-untranslated region, 5-UTR)包括 RNA聚合酶的识别和结合位点,被称作启动子(Promoter), 结构基因的3-非编码区(3-UTR)包括促使转录终止的终止子 (terminator)序列,和真核生物的加尾信号等。 调节基因调节基因(regulator gene)的功能是产生调控蛋白质,调 控结构基因的表达。 操纵基因操纵基因(operator gene)的功能是与调控蛋白质结合, 控制结构基因的表达。调节基因和操纵基因的突变会影响一 个或多个基因的表达活性。 5 5、AGCCGACTATGTCGAAGCTTAGCCGACTATGTCG
3、AAGCTT、GCTTGACTATAAGACAGCTTGACTATAAGACA、 3 3 3 3、TCGGCTGATACAGCTTCTAATCGGCTGATACAGCTTCTAA、CGAACTGATATTCTGTCGAACTGATATTCTGT、 5 5 转录调控区转录调控区 贮存贮存RNARNA或蛋白质结构信息区或蛋白质结构信息区 转录终止区转录终止区 3.1基因(gene)的概念 狭义:基因是核酸中贮存遗传信息的遗传单位, 是编码多肽链或RNA所必需的全部核苷酸序列,以及 为保证转录所必需的调控序列,和编码区上游5-端和 下游3 -端的非编码序列。 广义:DNA或RNA分子中有特定遗传功能
4、的一段 序列。 从生化学上来说指的是一段DNA或RNA(病毒) 顺序,该顺序可以产生或影响某种表型,可以由于突 变生成等位基因变异体。 从遗传学上来说代表1个遗传单位、1个功能单位、 1个交换单位或1个突变单位。 3.23.2基因的类型基因的类型 3.2.1 3.2.1 基因家族和基因簇基因家族和基因簇 基因家族基因家族(gene family)是真核生物基因组中 来源相同、结构相似、功能相关的一组基因。基因家 族各成员序列上具有相关性,但相似的程度以及组织 方式不同。基因家族可能由某一共同祖先基因 (ancestral gene)经重复(duplication)和突变产生。 按照基因家族的成
5、员在染色体上的分布,可以 将基因家族分成两类。 串联重复基因串联重复基因(tandemly repeated genes),成 簇的基因家族(clustered gene family),或基因簇基因簇 (gene cluster),是基因家族的各成员紧密成簇排列 而成的串联重复单位,定位于染色体的特殊区域。在 染色体上的分布相对集中。 分散的基因家族分散的基因家族(interspersed gene family), 其家族成员在DNA上无明显的物理联系,甚至分散在多 条染色体上,各成员在序列上有明显的差别。 按照家族中各成员的序列相似程度分为: 简单得多基因家族:序列高度同源,同一转录 单
6、元重复排列成基因簇 如rRNA基因 复杂的多基因家族:几个功能相关基因,串联 重复排列,不同转录单元,如组蛋白基因家族 受发育调控的多基因家族:复杂多基因家族, 在染色体上排列顺序与其发育过程中的表达顺 序相关。 基因超家族(gene superfamily) 基因超家族是指一组由多基因家族及单基 因家族组成的更大的基因家族。它们的结构有程 度不等的同源性,因此它们可能起源于相同的祖 先基因,但是它们的功能并不一定相同,这一点 正是与多基因家族的差别所在。这些基因在进化 上也有亲缘关系,但亲缘关系较远,故将其称为 基因超家族。 3.2.1.1 简单的多基因家族简单的多基因家族 家族中各基因的全
7、序列或至少编码序列具有高度的同源 性,如rRNA基因家族。真核生物的rRNA基因串联重复排列在 一段很长的DNA区域内。重复单位内rRNA基因转录区的序列几 近相同,而非转录的间隔序列则有所不同。在低等真核生物 如酵母的rRNA基因家族中,28S, 18S, 5.8S和5S rRNA基因构 成一个转录单元,而高等真核生物的5S rRNA基因则单独作为 一个基因家族排列在其它部位。每个转录单元重复排列成基 因簇,基因之间由可转录的间隔区(TS)分开,各转录单元之 间由不可转录的间隔区(NTS)分开(图3-1)。 3.2.1.2 3.2.1.2 复杂的多基因家族复杂的多基因家族 复杂的多基因家族由
8、几个相关基因构成独立的转 录单元,家族间由间隔序列分开。例如,组蛋白基 因的5个成员(H1, H2A, H2B, H3, H4)就属于这一类型。 人类组蛋白基因分布在第7号染色体,拷贝数为30 40个。 3.2.1.3 3.2.1.3 受发育调控的复杂多基因家族:受发育调控的复杂多基因家族: 人类珠蛋白基因家族 基因排列的次序与它们在个体发育阶段基因表达的先后次序 一致。在家族中, (Xi)基因在胚胎早期(前8周)表达,胎 儿期(8周后)关闭,2和1在胎儿(8周后)和成人期都表达。在 家族中,基因排在最前面,在胚胎早期(8周内)表达,之后 关闭。G和A基因在胎儿期表达,出生前表达量逐渐衰减,
9、而出生后并不完全关闭,仍然少量表达。基因在胚胎期和成 年期都有少量表达。基因在胚胎期开始表达,表达量逐渐增 加,是成人阶段表达的主要基因(表3-1)。 16号染色体 11号染色体 3.2.1.4 超基因家族超基因家族 超家族基因超家族基因(gene superfamily)是指一组由多个基因家 族组成的更大的基因家族。在高等真核细胞内,有些基因 簇内含有数百个功能相关的基因,它们是由基因扩增后结 构上的轻微变化而形成的,在结构上有着不同程序的同源 性。这些基因或保持了原始基因的基本功能,或进化产生 了某些新功能。目前已发现了很多的超基因家族,典型的 例子有免疫球蛋白超基因家族、核受体超基因家族
10、、细胞 因子超基因家族等。 免疫球蛋白(immunoglobin, Ig)超基因家族包括2微球 蛋白、MHC I类链、II类和链、T细胞受体(TCR)的 链 和链、CD4和CD8等与免疫有关的大分子。还有许多与免 疫反应无关的蛋白质分子,如IgE受体亚基,神经黏附分 子L-1,白细胞介素IL-1和IL-6的受体等。 Superfamily is a set of genes all related by presumed descent from a common ancestor, but now showing considerable variation. Immunoglobulin
11、type and function is determined by the heavy chain. J is a joining protein in IgM and IgA; all other Ig types exist as tetramers. 3.2.2 3.2.2 假基因(假基因(pseudogene)pseudogene) 假基因常用符号表示,如1 表示与1 相 似的假基因. 假基因与有功能的基因同源,原来也可以是有功 能的基因,由于发生缺失(deletion)、例位(inversion) 或点突变(point mutaion)等,成为无功能的基因, 即形成了假基因,哺乳动
12、物基因组中的1/4基因为假基 因,可能为进化的痕迹。 传统的基因概念把基因 看作彼此独立的、非重叠的 实体。但是,随着DNA测 序技术的发展,在一些噬菌 体和动物病毒中发现,不同 基因的核苷酸序列有时是可 以共用的。也就是说,它们 的核苷酸序列是彼此重叠的。 这种具有独立性但部分序列 彼此重叠的基因称重叠基因重叠基因 (overlapping genes)或嵌套基嵌套基 因因(nested genes)。 近年来的研究发现,重叠基因在真核生物中是广泛存在的。 值得注意的是,高等真核生物中既存在大量的非编码序列,又普 遍存在重叠基因,其生物学意义目前所知甚少,有待于进一步深 入研究。 3.2.3
13、 重叠基因重叠基因 3.2.4 移动基因移动基因 移动基因移动基因(movable genes)又称转座因子转座因子 (transposable elements)。由于它可以从染色体的一个 位置转移到另一个位置,甚至在不同染色体之间转移, 因此也称跳跃基因跳跃基因(jumping genes)。 关于移动基因的详细介绍见第6章。 3.2.5 断裂基因断裂基因 3.2.5.1 断裂基因的概念断裂基因的概念 过去人们一直认为,基因是连续不断地排列在 一起一段DNA序列。但是对真核生物编码基因的研 究发现,在编码序列中间插有非编码的DNA间隔区, 这些间隔区称为内含子内含子(intron);而编码
14、区则称为外外 显子显子(exon)。含有内含子的基因称为不连续基因或断断 裂基因裂基因(split genes)。 mRNA的前体是核内不均一RNA,实验证据P47(如 何发现的,杂交、限制性酶切图谱) 不连续基因是普遍现象(原核极为少见,古细菌 和噬菌体中发现了断裂基因) 断裂基因共性:外显子排列顺序与产物相同,在 不同组织中其内含子成分相同,内含子突变不影 响蛋白产物 断裂基因是Roberts和Sharp于1997年在研究腺病毒六邻体外 壳蛋白质的mRNA时首先发现的,病毒DNA与它的mRNA进行分 子杂交时,在电镜下观察到未与mRNA配对的DNA形成多个突 环,称R环。R环的形成说明腺病
15、毒外壳蛋白质的基因具有 mRNA中不存在的序列,这些序列就是内含子。 图3-5中的(a)为 电子显微镜照片,(b) 为对电子显微镜照片 进行解释的示意图, (c)为腺病毒六邻体 外壳蛋白质基因结构 的示意图。后来发现, 鸡卵清蛋白质的基因 与其mRNA杂交也会 出现与其内含子数对 应的7个R环。 研究断裂基因的另一个方法是比较基因组DNA和 cDNA的限制性核酸内切酶图谱。cDNA是由成熟的 mRNA通过逆转录生成的,因而不含内含子。若用相 同的限制性核酸内切酶水解基因组DNA和cDNA,在 同样的条件下进行凝胶电泳,如果内含子中有限制性 核酸内切酶的水解位点,基因组DNA的电泳图谱中就 会有
16、相应的条带,而cDNA电泳图谱中的相应条带则 会缺失。 研究发现,断裂基因在表达时首先转录成初级转 录产物,即前体mRNA,然后经过后加工,除去内含 子序列的转录物,成为成熟的mRNA分子。这种删除 内含子、连接外显子的过程,称为RNA拼接或剪接。 Comparison of the restriction maps of cDNA and genomic DNA for mouse -globin shows that the gene has two introns that are not present in the cDNA. The exons can be aligned exa
17、ctly between cDNA and gene. 通过比较cDNA与基 因组DNA的限制性核酸 内切酶图谱,也可以分 析内含子的数量。 The ovalbumin gene, shown here, has introns A to G and exons 1 to 7 and L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol
18、II extends the primary transcript well beyond the cleavage and polyadenylation site (“extra RNA”) before terminating transcription. Termination signals for Pol II have not yet been defined. Overview of the processing of a eukaryotic mRNA 3.2.5.2 断裂基因的分子进化断裂基因的分子进化 在真核生物的进化过程中,断裂基因的比例在逐渐增加。 低等真核生物酿酒酵
19、母中的大多数基因是连续的。在高等真 核生物中,开始出现长基因,蝇类和哺乳动物基因很少小于 2kb,大多数长度在5100kb,含有几个到几十个内含子。但 当基因的长度大到一定程度后,DNA的复杂性与生物的复杂 性之间开始失去对应关系。例如,虽然属于同一个门,家蝇 细胞的DNA总量却是果蝇的6倍。在较高等的真核生物中,基 因大小主要取决于内含子的长度,与外显子的大小和数目关 系不大。动物细胞的内含子一般为80100kb,平均1127bp, 有保守的分支点序列及多聚嘧啶区段。植物细胞的内含子较 短,一般为802000bp,平均183bp。 DHFR(二氢叶酸 还原酶)有一个较大的 基因,由6个外显子
20、组 成,相对应mRNA长度 为2000bp,但是它的 DNA序列却十分长, 这是由于它的内含子非 常长的缘故,在三种哺 乳动物中,外显子基本 保持一样,内含子的相 对位置也不改变,但长 度变化却非常大,这就 导致了基因长度范围为 2531kp。 Mammalian genes for DHFR have the same relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns. 在基因的进化中,可
21、能发生外显子的复制,结果 在结构基因内出现了重复序列。在鸡的胶原蛋白质基 因中,一个54bp的外显子多次重复,某些外显子累积 突变,失去编码功能,就可能转化为内含子。 外显子作一种功能模块,可以组装到不同的基因 内。因此,在基因进化中,经常发生着外显子在不同 基因之间的复制、迁移和吸纳。例如,在多种脱氢酶 的基因内,均有几乎相同的与辅酶结合或脱氢酶催化 区域功能有关的外显子结构。另一个典型的例子是人 类低密度脂蛋白质(low density lipoprotein, LDL)受体 与其他蛋白质之间的关系。LDL受体基因由18个外显 子构成,中间的几个外显子也出现在生长因子前体的 基因内,其N端
22、的几个外显子也为血蛋白质互补因子 C9编码。 The LDL receptor gene consists of 18 exons, some of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the E
23、GF gene. LDL(低密度脂蛋白)受体基因的中心部分的一 系列外显子和EGF(表皮生长因子)前体基因同 源,在其N端的外显子序列和血蛋白补充因子C9 的基因同源,这说明LDL基因中一系列不同功能 的组份组合而具备了新的功能,而这些组份也存 在于别的蛋白中。 产生新基因的另一种方式是某 些内含子插入到外显子内,使外显 子变得更小,或将内含子切除,使 外显子变得更大。例如,珠蛋白超 家族包括血红蛋白(hematoglobin)、 肌红蛋白(myoglobin)和豆血红蛋白 (leghemoglobin),以及其它血红素结 合蛋白。血红蛋白分子是由2个-珠 蛋白和2个-珠蛋白分子构成的四聚 体
24、。肌红蛋白为单体,结构类似于 珠蛋白。豆血红蛋白类似于肌红蛋 白,可能是珠蛋白相关基因的共同 祖先。肌红蛋白和珠蛋白基因内第2 外显子负责与血红素结合,而豆血 红蛋白不同于珠蛋白和肌红蛋白, 它的基因有3个内含子,其中第2内 含子把血红素结合域的外显子又分 隔成2个外显子。可能的进化途径是, 豆血红蛋白丢失内含子,使珠蛋白 或肌红蛋白的两个外显子融合成了 一个。 The rat insulin gene with one intron evolved by losing an intron from an ancestor with two interruptions. 哺乳动物(除了啮齿 类
25、)和鸟类编码胰岛素的 基因是由同一基因演化分 离而来的。鸡的胰岛素基 因有2个内含子,大鼠的其 中一个基因与之有相同的 结构。这个共同性说明胰 岛素最初有2个内含子,而 大鼠的另一个基因只含有1 个内含子,说明它在演化 过程中首先进行复制,然 后从一个拷贝中精确地移 去了一个内含子。 原始的鱼类只有一种珠蛋 白链,硬骨鱼和两栖类有连锁 的基因和基因,说明在大约5 亿年前, 硬骨鱼进化期间,珠蛋 白祖先基因倍增,并变异形成 了基因和基因。哺乳类和鸟 类是在约3.5亿年前同两栖类分 开的,基因和基因的分开应 在此之前,也许发生在2.7亿年 前(图3-7)。随后,突变引起的 趋异进化形成了基因簇和基
26、 因簇的各个成员。 和珠蛋白基因间置换位点的差别是3.7%,单位进化时间, 即产生1%差异所需的百万年数为10.4,估算趋异的时间为 10.43.7百万年,大约在4000万年前。和基因间置换位点的 趋异度为9.6%,估算趋异的时间大约在1亿年前(图3-8)。 Actin (肌动蛋白) genes vary widely in their organization. The sites of introns are indicated in purple; the number identifies the codon interrupted by the intron. 根据内含子的保守序列组
27、分、二级结构以及剪接 机制可将其分为4种类型。 I型内含子主要出现在细菌、真菌线粒体和低等真核 生物的rRNA基因中,估计出现于35亿年前,主要特 点是具有自我剪接能力。 II型内含子的特点是转录初始产物自我剪接时,能形 成套索结构(lariat),可能与I型内含子同时或稍后出现。 III型内含子存在于大多数真核生物编码蛋白质的基因 中,其RNA产物在剪接时需要有酶和蛋白质的参与, 应在真核生物出现之后,即7亿10亿年出现。 IV型内含子出现在tRNA中,剪接时,由内切酶切除 内含子,连接酶连接外显子,应在真细菌和真核生物 分化之前,即大约17亿年前出现。 内含子比外显子变化快 用重复基因的内
28、含子片段和外显子片段分别 作探针,进行分子杂交实验发现,重复基因之间 的外显子序列着很大的同源性,但内含子序列几 乎没有同源性。说明在进化过程中,相关基因的 内含子比外显子变化快得多。虽然突变以相同的 频率发生在外显子和内含子上,但发生在外显子 上的突变将使基因编码的产物丧失功能,导致生 物体无法通过自然选择,这种突变就被淘汰了。 而内含子由于没有编码功能,可以自然的累积各 种突变,导致它产生了较大的变化。 外显子的差异主要由于碱基替代造成的,在被翻译的序 列内,若突变会引起AA序列的改变,则相应的生物可能在进 化中被淘汰。许多保留下来的变化并未影响密码子的含义, 因为这些发生变化的碱基常是密
29、码子的第三个碱基,或在非 翻译序列(如5-端和3-端序列)中。 而在内含子中,序列变化多是由于碱基插入或缺失或替 换造成的。内含子演化的速度比外显子快得多,不同物种相 同基因相比较,有时发现外显子是同源的,而内含子却有很 大差异。 在内含子、外显子中突变速率是相同的,但外显子通过 自然选择不易保留突变,而内含子由于不编码AA,可以自由 地发生突变,通过不断积累最终导致巨大差别,这种差异也 说明了内含子不具备序列特异性这个特征。 3.2.5.3 断裂基因的生物学意义断裂基因的生物学意义 (1) 增加基因表达产物的多样性- RNA选择性剪接 (2) 促进重组 (3) 增加基因组的复杂性 (4) 有
30、些内含子含有可读框(ORF) (5) 有些内含子含有部分剪接信号 (6) 有些内含子对基因表达有影响 3.3 基因组基因组 3.3.1 基因组的概念基因组的概念 基因组基因组(genome) 指的是细胞或生物体全套染色 体中所有的DNA,包括所有的基因和基因之间的间隔 序列。 原核生物基因组就是其细胞内构成染色体的 DNA分子, 真核生物的核基因组是指单倍体细胞核内整套 染色体所含有的DNA分子。核基因组+细胞器基因组 (动物细胞线粒体基因组 偶或植物细胞的叶绿体基 因组。 物种基因组大 小(bp) 基因数目平均外 显子数 平均基因 长度(kb) 平均mRNA 长度(kb) 大肠杆菌4.210
31、64 288010.95 酵母1.31076 10011.41.4 果蝇1.410813600411.32.7 哺乳动物3.3109约30 000716.62.2 表 3-2不同生物的基因数目和大小 表3.2总结了一些生物体的平均基因大小,可以看出从 低等到高等真核生物的mRNA的平均大小略有增加,而 平均外显子数目则明显增加。可见,真核生物基因的 大小在很大程度上取决于内含子的数目和长度。 真核生物单倍基因组所包含的全部DNA量是相对恒定的,称 该物种的C值值(C-value)。随着生物的进化,生物体的结构和功 能越复杂,其C值就越大。 另一方面,生物体复杂性和C值之间的关系也有令人不解 的
32、现象。一些物种C值的变化范围很窄,如鸟类、爬行类和哺 乳动物各门内C值的变化范围只有约2倍。但大多数昆虫、两栖 动物和植物的C值可以相差数十倍乃至上百倍。突出的例子是 肺鱼和百合属植物,具有比人类大得多的C值,两栖动物C值 小的在109bp以下,大的则高达1011bp,而哺乳动物的C值均为 109bp数量级。真核生物的C值与生物体复杂性之间对应关系的 的反常现象称C值悖理值悖理(C value paradox)。 3.3.2 病毒的基因组病毒的基因组 病毒的基本结构是由外壳蛋白质包裹着里面的遗 传物质核酸。病毒进入活的易感宿主细胞后,以其基 因组核酸为模板,借助于宿主细胞本身提供的原料, 消耗
33、宿主细胞的能量,以自我复制的方法进行繁殖。 根据病毒基因组的核酸类型,将病毒分为DNA病 毒和RNA病毒。根据宿主的不同,病毒又可分为动物 病毒、植物病毒和噬菌体。不同类型的病毒,有不同 的复制方式。 病毒是分子生物学研究中的重要模式物种。 3.3.2.1 病毒基因组的一般特点病毒基因组的一般特点 病毒核酸的大小仅为细菌基因组的0.1%10%,病毒基因 组具有以下结构特点: (1) 基因组很小,只能编码少数的蛋白质。有基因重叠, 即同一个DNA序列可以编码2种或2种以上的蛋白质。 (2) 病毒基因组可以由DNA或RNA组成,但一种病毒不会 既含有DNA,又含有RNA。核酸的结构可以是单链或双链
34、、 闭合环状或线状分子。 (3) 基因之间的间隔序列(spacer sequence)非常短,非编码 区只占基因组的很小部分。 (4) 功能上相关的基因一般集中成簇,转录产物一般多为 顺反子mRNA,之后加工成各个蛋白质的mRNA。 (5) 噬菌体的基因是连续的,但大多数真核细胞的病毒都 含有不连续基因。除正链RNA病毒外,真核细胞病毒的基因一 般先转录成mRNA的前体,再经剪接才能成为成熟的mRNA。 所以,真核细胞病毒基因的特性更像真核生物基因。 3.3.2.2 病毒的核酸病毒的核酸 病毒的DNA多数为双链结构 (dsDNA),如腺病毒。也有单 链DNA (ssDNA) ,如微小病毒科的病
35、毒。 病毒的RNA多数为单链线状结构,少数呈双链结构。不少 RNA病毒含有多个RNA片段,例如呼肠孤病毒(reovirus)有10个 双链RNA片段,轮状病毒有11个双链RNA片段,流感病毒有8 个单链RNA片段。如果病毒的单链RNA可直接作为mRNA,则 称为正链RNA。若病毒以其RNA链的互补序列作为mRNA,则 称为负链RNA。负链RNA病毒感染宿主细胞后,需要合成与其 基因组RNA互补的RNA,这一过程由依赖于RNA的RNA聚合酶 (RNA-dependent RNA polymerase)催化,但此酶在宿主细胞内不 存在,而是由病毒颗粒携带的。因此,只有用完整的负链RNA 病毒颗粒感
36、染宿主细胞,才能复制病毒。 positive strand virusnegative strand virus 噬菌体噬菌体 3.3.2.3 噬菌体的基因组噬菌体的基因组 噬菌体的基因组大小为4.85104bp,包括46个基因,分为 头部基因、尾部基因、调控(免疫)区、复制控制区和晚期基因调 控区等区域(图3-9)。 噬菌体依赖宿主细 胞的RNA聚合酶合成3 组RNA产物,有两种不 同的结果,即裂解生长 和溶原性反应。用外源 DNA替代噬菌体基因 组内与溶原化有关的基 因区段(如整合基因int、 切离基因xis和附着位点 att等),可构建重组 DNA分子,在基因工程 和基因文库构建方面有
37、广泛的应用。 3.3.2.4 X174噬菌体基因组噬菌体基因组 X174噬菌体基因组是单链 环状DNA,含5386个核苷酸。共11 个基因,构成3个转录单元,从3个 转录启动子Pa、Pb和Pd分别开始转 录基因A、B和D。在基因A和H之 间有一强终止信号,所有转录均可 在此位置终止。在基因J和F之间有 一个弱终止信号,部分转录在此位 置被终止,一部分mRNA继续转录 到基因H结束。基因D-(E)-J-F-G-H 都转录在同一条mRNA分子上(见图 3-4)。 X174噬菌体11个基 因的蛋白质产物都已被分 离,蛋白质编码的总长度 超过了DNA编码容量。将 蛋白质的一级结构与DNA 全部序列进行
38、比较,发现 X174噬菌体基因组内存 在部分基因重叠。 3.3.2.5 SV40病毒基因组病毒基因组 SV40病毒(simian vacuolating virus 40,SV40) 最初 是在猴肾细胞中分离出来的,能引起人的培养细胞转 化,在仓鼠和人体内可致肿瘤。SV40基因组只有5个 基因,要完全依靠哺乳动物细胞内的系统进行它的 DNA复制和基因表达。因此,常用SV40病毒作为模 式生物,研究真核生物的基因表达,和病毒致癌的机 制。SV40病毒的启动子和增强子被广泛用于真核生物 基因表达载体的构建。 SV40病毒的外壳是二十面对称体的球状颗粒,中 心包含有全长5243bp的双链环状DNA。
39、DNA与组蛋白 相连,形成24个核小体,称为微小染色体,是真核细 胞染色质的最小模型。 T抗原和t抗原基因以逆 时针方向转录,发生在 DNA复制之前,称为早期 基因及早期转录。Vp1、 Vp2和Vp3基因以顺时针方 向转录,发生在DNA复制 之后,称为晚期基因和晚期 转录。在早期和晚期基因之 间是SV40基因组的调控区, 约400bp,这个区域内的早 期和晚期基因调控序列及 DNA复制起位点等大部分 序列都被重叠使用。 此外,早期的T抗原和t抗原为基因重叠,t基因完全在T基因 之内,并通用共同的起始密码子。这种基因的重叠结构与基因表 达调控有关,能保证两个连续的基因在转录和翻译水平上偶联协 调
40、,进行有效的翻译。 SV40载体基因组只有5243bp,序列已确定,基 因组为共价闭合环DNA(cccDNA),酶切图谱及各种 功能的基因定位均已详细了解。病毒DNA较易制备, 但是,用SV40重组病毒转染细胞时,随着病毒的繁 殖,细胞会裂解,这对基因工程中的应用是很不理想 的。SV40 DNA分子小,插入的DNA不能大于2500bp。 SV40 DNA的早期功能区插入外源DNA,存在致癌的 隐患,为此,人们对病毒载体进行了改造,同时插入 tk, dhfr, neo, cat等标记基因,构成了适用于不同目的 的表达载体。pSV 载体就是以SV40为基础构建的一 群载体的总称。 蛋白质蛋白质 合
41、成时间合成时间功能功能 T抗原 早期启动DNA复制 t抗原早期 未知 VP1 晚期主要的病毒外壳蛋白 VP2 晚期次要的病毒外壳蛋白 VP3 晚期次要的病毒外壳蛋白 3.3.2.6 腺病毒基因组腺病毒基因组 腺病毒(adenovirus, Ad) 是一种无外壳的双链 DNA病毒,基因组长约36kb,衣壳(capsid)呈规则的 20面体结构,直径约80-110nm。 以病毒DNA开始复制为分界线,按转录时间的先 后,将腺病毒基因大致区分为早期(E14)和晚期转 录单位(L15)。各种腺病毒基因又可以进一步地分 为更小的转录单位,如E1区可以进一步分为E1A和E1B, 每个转录单位都至少有一个独
42、特的启动子。病毒的两 条链均有编码功能。 腺病毒易于培养纯 化,其基因组为线性双 链DNA,可插入较大的 外源DNA片段,最大的 可达约7kb,且可在宿主 细胞内大量扩增,宿主 细胞范围广泛,可用于 基因工程和基因治疗。 不足之处是Ad在细胞内 复制时可大量释出壳体 蛋白质,容易引起宿主 细胞介导的免疫反应, 使转导的细胞遭到免疫 攻击而被破坏。 逆转录病毒属 于正链RNA病毒, 其主要的结构基因 有种群特异性抗原 (group specific antigen, gag),聚合 酶(polymerase, pol) 和被膜蛋白质 (envelope, env),两 端有长末端重复序 列(lo
43、ng terminal repeat, LTR),5-端 有帽子结构,3-端 有polyA。 3.3.2.7 逆转录病毒基因组逆转录病毒基因组 人类免疫缺陷病毒(HIV)颗粒是至今发现的最复杂的逆转录 病毒。HIV的基本形态与其它逆转录病毒相似,有核心部分, 衣壳和包膜等3种主要结构。核心部分含两个单股正链RNA基 因组,两个单体在5-端由氢键相连。每个RNA基因组长9.2kb, 基因排列顺序为5-LTR-gag-pol-env-3-LTR,除上述3个结构基 因外,还有tat, rev, nef, vif, vpr和vpu 6个调节基因,编码6种调控 蛋白质,这在逆转录病毒中较少见。HIV的基
44、因编码区域有许 多重叠,除基因tat和rev两侧含有内含子外,大多数基因无内含 子,最大限度地利用了有限的RNA序列(图3-11)。 HIV的结的结 构及其与构及其与 宿主细胞宿主细胞 的附着的附着 3.3.3 原核生物的基因组原核生物的基因组 原核生物的细胞内没有明显的细胞核形态,其遗 传物质均为DNA,与蛋白质结合形成类核(nucleoid), 基因组大小在106bp以上。在双链DNA的两条链上都 有基因的编码序列。除类核构成的主基因组外,原核 生物还有许多独立的DNA小分子,称作质粒。 3.3.33.3.3原核生物基因组原核生物基因组 Prokaryotic genome Prokary
45、otic genome 以细菌为代表讲述,有称以细菌为代表讲述,有称bacteria bacteria genomegenome。细菌对医学分子生物学有重要贡献,是基因工程研。细菌对医学分子生物学有重要贡献,是基因工程研 究的主要材料之一。因为:究的主要材料之一。因为: , 可选择突变株进行研究,实验结果容易重复。可选择突变株进行研究,实验结果容易重复。 (1 1)遗传物质都是)遗传物质都是DNADNA; (2 2)主要的功能分子都是蛋白质;)主要的功能分子都是蛋白质; (3 3)基因密码是通用的,等等。)基因密码是通用的,等等。 1.1.基因组通常仅由基因组通常仅由 其其DNADNA是与蛋白
46、质结合,但并不形成染色体结构,只是习惯上将之称是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称 为染色体。细菌染色体为染色体。细菌染色体DNADNA在胞内形成一个致密区域,即类核在胞内形成一个致密区域,即类核 (nucleoidnucleoid),类核无核膜将之与胞浆分开。),类核无核膜将之与胞浆分开。 2.2.基因组中基因组中。 3.3. 操纵子(操纵子(operonoperon) 是指数个功能相关的结构基因串联在一起,是指数个功能相关的结构基因串联在一起, 构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的 转录终
47、止信号构成的基因表达单位。(见第六章)转录终止信号构成的基因表达单位。(见第六章) 4.4. 基因组中任何一段基因组中任何一段DNADNA不会用于编码不会用于编码2 2种蛋种蛋 白质。白质。 5.5. 6.6.非编码非编码DNADNA所占比例很少所占比例很少,基因组中的重复序列很少。编码 蛋白质结构基因多为单拷贝,但编码rRNA的基因往往是多拷 贝的,这有利于核糖体的快速组装。 . . . 启动子(promoter)、操纵基因(operator)、调控 序列、结构基因(structure gene)、终止子 (terminator)。(见第六章) DNA from a lysed E. col
48、i cell. In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation. E.coli细胞内的 DNA形成大量的双链 环状结构,每个环平 均40 kb,形成超螺旋 结构,底部固定在蛋 白质上,形成独立的 结构域。整个基因组 DNA约有100个左右 这种小的结构域。由 于每个小结构域相对 独立,不同小结构域 内的启动子对基因表 达的
49、调控有不同的敏 感性。 3.3.3.3 细菌的自主遗传物质质粒细菌的自主遗传物质质粒 质粒是细菌染色体外的可以自主复制的DNA 分子,大多数为环状超螺旋双链DNA,称为共价闭合 环状DNA。 质粒是双链的DNA分子,大小在1200kb之 间,和病毒不同,它们没有衣壳蛋白(裸DNA) 3.3.质粒与宿主细胞的关系质粒与宿主细胞的关系 (1 1)质粒对宿主的生存不是必需的,只是质粒对宿主的生存不是必需的,只是“友好友好”的的“借借 居居”宿主细胞中,宿主细胞中,宿主离开质粒照样的生存下去。宿主离开质粒照样的生存下去。 (酶(酶 和蛋白质)帮助,才能完成自身的复制(扩增)、转录。和蛋白质)帮助,才能
50、完成自身的复制(扩增)、转录。 ,作为对宿,作为对宿 主细胞的补偿(主细胞的补偿(“交房租交房租”)。)。 使宿主获得生存优势,与我们基因工程实验紧密相使宿主获得生存优势,与我们基因工程实验紧密相 关的,如抗生素抗性基因:关的,如抗生素抗性基因: AmpAmpr r 酶,水解酶,水解-内酰胺环内酰胺环, ,解除氨关毒性解除氨关毒性, ,使细菌抗氨关。使细菌抗氨关。 TetTetr r 膜蛋白膜蛋白, ,可阻止四环素进入细胞可阻止四环素进入细胞, ,使细菌抗四环素。使细菌抗四环素。 4.4.质粒发现和研究意义质粒发现和研究意义 质粒能够复制、传递和表达遗传信息,从分子质粒能够复制、传递和表达遗传
51、信息,从分子 遗传学观点来看是一种有机体,是比病毒更原始的生命形式,遗传学观点来看是一种有机体,是比病毒更原始的生命形式, 基因工程的重要基因工程的重要 任务之一就是严格改造质粒的同时,控制质粒不传递,若一个任务之一就是严格改造质粒的同时,控制质粒不传递,若一个 致癌质粒可以传递就会传到外都是。致癌质粒可以传递就会传到外都是。 A.A.都能独立自主的复制;都能独立自主的复制; B.B.都能便利的加以检测(抗生素抗性);都能便利的加以检测(抗生素抗性); C.C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯都能容易引进宿主细胞中去,也易从宿主细胞中分离纯 化(提质粒)。化(提质粒)。 质粒符
52、合上述质粒符合上述3 3个条件。个条件。 基因工程中主要使用人工构建的质粒。基因工程中主要使用人工构建的质粒。 3.4 真核生物的基因组真核生物的基因组 3.4.1 真核生物基因组的特点真核生物基因组的特点 (1) 基因组大 低等真核生物的基因组为107108bp,比原核细胞大10 倍以上。而高等真核生物可以达到51081010bp。 (2) 有染色体结构 细胞核DNA与组蛋白质及多种非组蛋白质稳定地 结合,形成多条呈线状的染色体,每条染色体DNA有多个复制起点(ori)。 (3) 重复序列和可移动序列多 真核细胞基因组DNA有大量重复序列, 这些重复序列的单位长度从几个至几千个碱基对不等,重
53、复次数从几次到 几百万次不等。与原核生物相比,真核生物基因组中的可移动DNA序列比 例较高。 (4) 多数基因为断裂基因 真核生物的绝大多数结构基因都含有内含子, 属于断裂基因。 (5) 基因表达的调控复杂 转录和翻译在时间和空间上被分隔,基因表 达的各个阶段均有特定的调控机制。功能上密切相关的基因通常分散存在 于染色体的不同位置,甚至不同的染色体上。基因表达的调控更复杂,有 数目众多的调控因子,对功能上密切相关而又分离很远的基因表达进行调 控。 bp102 . 4 DNA tC. tCDNA 6 1/20 1/20 的复杂度任何 的 的任何 coliE 3.4.2 真核生物基因组的重复序列真核生物基因组的重复序列 3.4.2.1 DNA序列的复性动力学与序列重复频度序列的复性动力学与序列重复频度 根据DNA的复性动力学方程,C0t1/2与DNA序列复杂度有关, 序列越复杂,C0t1/2值越高,复性反应速度越慢。在一定长度的 DNA中特定序列的拷贝数越少
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国三通模具市场调查研究报告
- 2025年中国MP3反折板市场调查研究报告
- 2025至2031年中国猪爪脱毛机行业投资前景及策略咨询研究报告
- 2025至2031年中国牛腹肉行业投资前景及策略咨询研究报告
- 2025至2030年中国香菇蚝油数据监测研究报告
- 2025至2030年中国硅橡胶增爬裙数据监测研究报告
- 2025至2030年中国热敏收银纸数据监测研究报告
- 2025至2030年中国带电脑豪华型生化分析仪数据监测研究报告
- 二零二五年度地铁隧道水电暖消防安全保障合同2篇
- 二零二五个人住房贷款合同范本参考8篇
- 公务摄影拍摄技巧分享
- 仓储中心退货管理制度
- 丰田锋兰达说明书
- 白宫-人工智能行业:美国人工智能权利法案蓝图(英译中)
- 典范英语8-15Here comes trouble原文翻译
- 六安市叶集化工园区污水处理厂及配套管网一期工程环境影响报告书
- 运动技能学习与控制课件第一章运动技能学习与控制概述
- 工程设计费取费标准
- 清华大学考生自述
- 人机工程学与眼镜
- 中层后备干部培训心得体会范本
评论
0/150
提交评论