第二讲 基因的现代概念_第1页
第二讲 基因的现代概念_第2页
第二讲 基因的现代概念_第3页
第二讲 基因的现代概念_第4页
第二讲 基因的现代概念_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二讲 基因的现代概念吴 乃 虎中国科学院遗传与发育生物学研究所2005年8月目 录一、移动基因1概述2插入序列(1) 插入序列的发现(2) 原核生物转位因子的类型(3) 插入序列3转位子(1) 转位子概念(2) 转位子类别4转位作用机理(1) 转位作用概念(2) 转位作用类型(3) 转位作用分子机理*1.复制型转位*2.非复制型转位*3.保存型转位二、断裂基因1断裂基因概念(1) 定义(2) 表达程序(3) 若干概念2间隔子位置的测定(1) 实验步骤(2) 异源双链体分子定义3mRNA初级转录本的剪辑(1) 两步机理(2) mRNA差异剪辑三、重叠基因1重叠基因定义2重叠基因的发现3原核生物

2、重叠基因类型(1) 第一种类型(2) 第二种类型(3) 第三种类型4真核生物重叠基因的类型(1) 间隔子式重叠基因(2) 嵌套基因5重叠基因的分布6重叠基因的意义四、假基因1假基因的定义2假基因的拷贝数3假基因的类型(1) 重复的假基因(2) 加工的假基因(3) 加工的假基因的起源问题五、重复序列与重复基因1基因家族与基因簇的概念(差异)(1) 基因家族(2) 基因簇2重复序列(基因)3重复基因的特点4基因拷贝数与其表达量之间的关系基因的现代概念一、移动基因1概述*1.移动基因(movable genes),又叫做转位因子(transposable element)。它可以在染色体基因组上移动

3、,甚至在不同染色体分子之间跃迁,所以有时也称之为跳跃基因(jumping genes)。*2.移动基因最早是由美国冷春港(Cold Spring Habor Laboratory)的女科学家诺贝尔奖金获得者B. McClintock于上一世纪40年代,其母校康奈尔大学遗传学系在研究玉米时发现的,当时叫做“控制因子”(controlling elements),或称为激活-解离因子(Activator- Dissociation element, 简称Ac/Ds因子。*3.玉米中移动基因功能:a.这些控制因子可以插入到玉米染色体的靶子位点上,并抑制与之邻近的其它染色体基因的表达活性;b.控制因子

4、在染色体上没有固定的位置,似乎可以沿着染色体分子移动;c.控制因子在插入染色体之后的适当时间内又可以重新被删除焉,此时原先潜伏基因(dormant gene)的功能也往往得到恢复;d.由于控制因子本身不稳定,因此与之相关的基因也呈现出不稳定状态与高突变率的特性;*4.McClintock工作初期遭遇,与1983年荣获Nobel生物医学奖,获奖后的心态等简介。获Nobel奖后她在给冷春港定量生物学室实验室主任的信中说:请不要打扰我,仍然给我做我想做的工作。2插入序列(1)插入序列的发现在60年代末期,J. A. Shapiro在研究大肠杆菌高效突变即可影响一系列功能的突变时发现,这是由于一种大片

5、段DNA的插入作用造成的,并称这种DNA片段为插入序列(insertion sequences, IS)。随后的研究发现,除了E.coli之外,在其它的格兰氏阴性和格兰氏阳性细菌中也都广泛地存在着转位因子。(2)原核生物转位因子的类型:a.插入序列(insertion sequence, IS)原核生物的转位因子,其分子量小于2000bp的一般叫做插入序列。b.转位子(transposon, Tn)有时又叫做转座子(中文译名的差别),系指分子量大于2000bp的转位子。c.噬菌体型转位子例如Mu和D108等噬菌体,均属于第三种类型的转位子。移动基因 Movable genes转位因子 Tran

6、sposible elements跳跃基因 Jumping genes控制因子 Controlling elements激活-解离因子 Activator-Dissociation elements插入序列(IS) Insertion sequence转位子(Tn) Transposon(3)插入序列插入序列又叫IS因子,它是在细菌中首先发现的最简单的一类转位因子。其共同特征是:图2-1 转位子的形体图(a)简单的转位子,也叫做插入序列,它具有一个控制转位作用的转位酶基因,并往往被反向重复序列,即所谓的IR序列所包围。(b)复合的转位子Tn 1681,它具有两个插入序列(IS1)和一个热稳定的

7、大肠杆菌素1编码基因。在它们的末端具有一段反向重复序列(但其长度不一定相等,例如IS10转位因子的左边IR序列是17bp, 右边是22bp);当IS因子插入到靶位点之后,便会在其两端的外侧产生一段短的同向重复序列;IS因子一般只编码一种参与转位子作用的转位酶(transposase),它能够识别反向重复序列,并催化转位因子发生删除作用,从染色体上游离出来。图2-2 IS因子转位作用形成同向重复序列的原理(a)具有IS因子插入靶子位点的一段DNA分子;(b)在靶子位点形成交错的缺口;(c)IS因子同缺口位置的单链末端连接;(d)在靶子位点出现的裂口被补齐并封闭,形成短小的同向重复序列序列。IS因

8、子能够四处活动,几乎可以插入到大肠杆菌染色体的各个位置上;也可以插入到质粒和某些噬菌体基因组上;甚至可以插入到同一个基因的不同位点上;IS因子的插入作用可以正向也可以反向整合到基因组上。我们特称IS因子的这种移动方式为转位作用(transposition)。转位作用表2-1 若干种大肠杆菌IS因子的基本参数名称分子大小(bp)反向重复序列(bp)靶子位点的同向重复序列(bp)靶子位点选择IS1768239随机IS21327415热点IS414281811或12AAAN20TTTIS51195164热点IS10R1329229NGCTNGCNIS50R153199热点IS9031057189未知

9、3转位子(transposon)(1)转位子概念 转位子又叫转位因子(transposable element)或转座子,其英文定义:A segment of DNA that can move from one position in the genome to another.Transposon is a DNA sequence able to replicate and insert one copy at a new location in the genome.转位子(transposon)是在许多细菌中发现的另一类移动单元,它是由几个基因组成的特定的DNA片段,而且往往带有抗菌

10、素抗性基因。例如氨苄青霉素转位子就是其中一例。(2)转位子类别根据结构特征,转位子可以分为复合系和Tn3系两种不同的类别:a.复合转位子(Complex transposone)复合转位子是由2个同样的IS因子连接在抗菌素抗性片段的两侧构成的。复合转位子很容易携带着抗菌素抗性基因从细菌染色体转移到质粒或噬菌体基因组上。当发生这种情况时,转位子就会迅速地传播到其它细菌中去,这类转位作用是自然界中发生细菌抗药性的主要原因。b.Tn3转位子Tn3转位子结构比较复杂,长度约为5000bp,末端有一对38bp的IR序列,但不含有IS因子序列,每个Tn3均由3个基因组成:AmpR基因 编码b-内酰氨酶,提

11、供氨苄青霉素的抗性。 TnpA基因 编码1种长度为1015氨基酸的转位酶:它作用于转位子末端产生双键切割,使转位子从给体分子上删除下来;并在靶子位点作交错切割,使转位子插入进去。 TnpR基因 编码一种185个氨基酸的蛋白质。其功能有二:抑制TnpA基因合成活性;促进中间分解区又称中央解离位点res (resolution site)发生位点特异的切割;表2-2 若干种大肠杆菌复合转位子的基本参数名 称分子大小(bp)遗传记号末端组件组件取向组件关系Tn9033100KanRIS903反向同样Tn92500CanRIS1同向可能同样Tn109300TerRIS10RIS10L反向2.5%差异T

12、n55700KanRIS50RIS50L反向1bp差异4转位作用机理(1)转位作用概念*1.转位作用定义:The movement of a gene or set of genes from one site in the genome to another.移动基因的分子本质是一段能够插入到寄主基因组新位点的特异的DNA序列结构。*2.转位作用特点:a.是一种与recA基因无关的新的重组类型,其唯一结果是转位因子的转动;recA gene=重组作用基因b.转位因子插入位点是一段与之没有同源关系的核苷酸序列;c.转位过程涉及到DNA复制;*3.转位作用步骤:第一步,在靶DNA上造成交错的断裂

13、;第二步,转位子连接到靶DNA的突出的(延伸的)单链末端;第三步,连接留下的缺口(gap)的补齐与封闭(2)转位作用类型科学工作者对转位作用的机理认识经历了由肯定否定再肯定的反复过程,由表入深的过程,逐步深化的过程:*早期的研究工作认为转位子可以从一个位点转移或移位到另一个位点,故将此过程称为转位作用。*随后发现这种命名是错误的,因为在转位过程中,转位因子的一个拷贝仍留在原来的位点上,同时在新的位点出现第二个拷贝。因此转位与重组不同,转位过程必须进行DNA复制。进一步说,这种重组的唯一可能的后果是转位因子的移动。*最近(B. Lewin, 1994)根据最新研究进展表明,事实上转位作用有如下三

14、种不同的类型:a. 保存型转位(Conservative transposition)b. 复制型转位(Replicative transposition)c. 非复制型转位(Nonreplicative transposition)有些转位子仅能按照其中的一种机理发生转位,而有些转位子则可按照两种机现进行转位,例如IS1和IS903就可按复制型和非复制型两种机理转位,而噬菌体Mu则可按任何一种机理转位。图2-3 由交错切割形成的正向重复的靶DNA序列包翼在转位子的两侧,其延伸的末端同转位子连接。(A)在靶子位点发生交错切割;(B)转位子同单链末端连接;(C)补齐和封闭靶子位点的裂口。(Fro

15、m. B. Lewin P.1006)(3)转位作用的分子机理A复制型转位在复制型转位过程中,转位子发生复制,因此被转移的实体是一份原本的转位子。其中一份拷贝仍保留在原来的位置,而另一份拷贝则插入到基因组的新位点。因此,这种类型的转位作用是通过增加转位子的拷贝数得以实现的。Tn3转位子的转位作用便属于此种类型。*1.复制型转位的酶催活性复制型转位过程中涉及两种酶催活性,下面以Tn3转位子为例予以说明。图2-4 复制型转位产生的一个转位子拷贝插入到一个受体位点上。给体位点保持不变。因此,复制转位的结果是给体与受体各具有一个转位子拷贝。图2-5 非复制型转位中,转位子以一个物理实体从给体位点转移并

16、插入到一个受体位点。这样转移的结果使给体位点断裂,若不被修复,就将基因组造成致死效应。a.Tn3转位子编码的转位酶(Transposase)作用于转位子的末端,产生双链切割,使转位子从给体分子上删除下去;并在靶子位点作交错切割,使转位子插入进去。转位酶由tnpA基因编码b.Tn3转位子编码的另一种酶是解离酶(Resolvase)此种酶具有如下两重功能:作为阻抑物,抑制TnpA基因表达。解离酶功能,促使共合体结构中两个以同向重复形式存在的转位子之间发生位点特异的重组。解离酶由tnpR基因编码cointegrate共同体图2-6 TnA转位子具有一对末端反向重复序列(IR),一个中央位置的res位

17、点和3个基因。Res:site of resolution, 即解离位点。tnpA基因编码产物是一种转位酶,它同长度为38bp的末端反向重复序列中的一段约25bp的序列结合。我们相信转位酶可识别转位子的末端,而且同样能够在供转位子插入的靶DNA位点造成(形成)交错的具5bp延伸序列的断裂。tnpR基因编码产物是一种具有双功能的蛋白质。它一方面可以起到阻抑物的作用,抑制tnpA基因和自身基因(tnpR)的表达活性;另一方面又可起到解离酶的功能作用(resolvase, 解离酶)。*解离酶的功用是促进中央分解区发生位点特异的切割作用。DNA-protein复合物的foot printing试验证明

18、,TnpR解离酶是结合在res分解区,如图2-6所示,解离酶在分解区(res)中有3个各长30-40bp的结合位点,它们是彼此独立地同解离酶发生结合作用。这3个结合位点共有一段二重对称(dyad symmetry)的同源保守序列。所谓二重对称:系指旋转180后产生相同结构的对称体,它是用来描述双螺旋DNA分子中含有回文对称的区域。这种区域旋转180后得到相同的碱基序列。tnpR基因的突变导致转位频率上升,其原因是TnpR蛋白质抑制了tnpA和tnpR两个基因的转录活性。因此,TnpR蛋白质的失活作用就会使TnpA蛋白质的合成活性上升,从而最终导致转位频率的增加。这意味着:TnpA转位酶是转位作

19、用的一种限制因子。这一点无疑是很有用处的。res分解区(或叫解离位点)的功能鉴定:应用顺式作用缺失(cis-acting deletion)法,证明当res区缺失时,转位作用便被完全阻断了,并导致共合体的累积。在res缺失的情况下,解离反应可以被以RecA介导的一般重组所取代,但其效果必定的低效的。*2.复制型转位反应阶段:复制型转位过程(图2-7)包括如下两个阶段:a.第一阶段,含有转位子的一个复制子(replicon)同没有转位子的另一个复制子融合起来,这种由复制子融合而成的结构叫做共合体(cointegrate)。在这样形成的共合体中含有两份相同的转位子的拷贝,它们按同向重复的方式排列并

20、彼此结合成一体。何谓复制子(Replicon):所谓复制子乃是含有一个复制起始位点的基因组中的DNA复制单位(Replicon is a unit of the genome in which DNA is replicated; contains an origin for initiation of replication.)例如细菌染色体、病毒基因组、质粒基因组等,其DNA能够进行自主复制的遗传单元,均称为复制子,每一个复制子都含有一个启动复制的起点。真核细胞、染色体内的“复制子”称为复制单位。b.第二阶段,两个拷贝的转位子之间发生同源重组,能够再生(regenerate)出原来的给体复

21、制子,并释放出一个靶复制子(target replican)。此种靶复制子已经获得了一个转位子,其两侧由寄主靶序列的短同向重复序列包围。解离:这种通过两个拷贝的转位子之间的重组形成一个原给体复制子和一个靶复制子的反应叫做解离(resolution),它是由解离酶催化的。解离反应释放出两个各含有1份同样转位子拷贝的复制子个体(图2-7)。*3.共合体结构的形成我们以Mu噬菌体为例说明共合体结构(cointegrate structure)形成的过程:图2-7 转位作用能把一个给体复制子与一个受体复制子融合成一个共合体。解离作用释放出两个复制子,它们各含有一份转位子拷贝。Mu转位酶(transpo

22、sase),是一种能够识别末端的位点特异的核酸酶,它从转位子两端单链切割给体分子;同时转位酶在受体分子的靶位点作交错的单链切割形成5个碱基的单链延伸末端。给体分子与受体分子在缺口部位连接:转位子序列的每一端都与靶子位点上的一条单链延伸末端连接,形成一种交叉结构(crossover structure)它含有一对转位子。图2-8 Mu噬菌体的转位作用产生出一种交叉结构,它经过复制转变成一个共合体。(A)缺口形成。单链切割在转位子和靶位点形成交错末端。(B)交叉结构形成。转位子缺口末端与靶位点缺口末端连接。(C)共合体。一个分子的共合体具有两个拷贝的转位子。(D)共合体分子拉长,表明转位子是位于复

23、制子间的接合部。交叉结构在每一个交错末端(staggered ends)都具有一个单链区。这些单链区是一种假复制叉(pseudoreplication forks),供作DNA合成的模板。(使用这种延伸末端作引物进行复制,意味着必定会发生链的极性断裂在此位点产生一个3-OH末端)。如果从两个复制叉继续进行复制,就将会通过转位子按两链分开形式进行复制,并终止在该链的末端。(From Lewin P.1011)(此种复制可能是由寄主编码的功能完成的),此时,交叉结构便变成为一种共合体(cointegrate)在其上的两个复制子之间的交接处有两个同向重复排列的转位子。何谓共合体(cointegrat

24、e)?共合体是指由一个具一个转位子的复制子同另一个不具转位子的复制子融合而成的结构,在共合体的两个复制子结合部位具一对同向复制排列的转位子拷贝。B非复制型转位在非复制转位(nonreplicative transposition)中,转位子是以一种物理实体(physical entity)直接从基因组的一个位点转移到另一个位点,并因此得以保存。非复制转位按两种不同的机理进行。*1.以Mu噬菌体为例,它的非复制转位是通过给体DNA与靶DNA之间的连接作用实现的。IS因子、复合转位子Tn10和Tn5均按此种机理转位(见图1-3),它涉及转位子在转移过程从给体DNA删除下来。此种转位机理仅涉及转位酶

25、非复制型转位过程中删除下来的转位子,插入到靶子位点上,而在给体位点(donor site)留下空位。那么在非复制转位之后,给体分子将会发生什么变化呢?有两种可能性:一种可能性是此种给体DNA因此被破坏掉。由于细菌染色体具有一个以上的拷贝(多拷贝),因此它是能够忍受此种破坏的。另一种可能性是,寄主的修复体系能够识别这种双链断裂,并予以修复(repair sestems)。*2.非复制转位的另一种机理特称为保存型转位(Conservative transposition)(见下节)C保存型转位正如上节我们已经提到的,保存型转位是属于另一种类型的非复制型转位。Tn10转位子就是按此种机理进行转位的。

26、当发生保存型转位时,在转位子编码的转位酶作用下,转位子的末端发生双链切割后便从给体DNA分子上删除下来,而后也是在转位酶的作用下,靶子位点发生交错的切割,以使转位子插入进去(图2-9)。图2-9 保存型转位。与l噬菌体的整合与删除作用相比,在按保存型机理进行的转位子转位过程中不丧失任何核苷酸键。在保存型转位过程所涉及到的一系列事件中,每一个核苷酸键(nucleotide bond)都被保存下来。这个过程同l噬菌体的整合过程(integration)的机理是十分类似的。就连所涉及的转位酶也与l整合酶(integrase)有亲缘关系。表2-3 复制型转位与非复制型转位的比较复制型转位非复制型转位发

27、生复制不发生复制形成共合体不形成共合体给体中保留转位子给体中不留转位子形成交叉结构形成交叉结构二、断裂基因1断裂基因概念(1)定义真核蛋白质编码基因的序列结构分析发现,在它们的核苷酸序列中间插入有与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段。 我们称这种编码序列不连续的间断基因为断裂基因(split gene)。(2)表达程序断裂基因 DNA 转录,帽的形成polyA尾巴的加入 (tailing)初级转录物核内不均一RNA(hn RNA),即前体mRNA 发生删除与拚接成熟的mRNA 从细胞核进入细胞质蛋白质多肽链(3)若干概念*1.间隔子在mRNA成熟加工过程中,其转录物

28、被剪除掉的DNA部分叫间隔序列(intervening sequence)。或间隔子(introns)间隔子*2.表达子被保留下来的DNA部分叫编码序列(coding sequence)或表达子(exons)表达子*3.RNA剪辑这种间隔子的删除和表达子的连接形成最后成熟mRNA的过程叫做RNA剪辑(RNA splicing) RNA剪辑2间隔子位置的测定应用S1核酸酶作图法,可以测出在断裂基因中的间隔子的位置。(1)实验步骤提取细胞总RNA同含有一个间隔子的克隆的DNA片段进行核酸杂交形成异源双链体分子(hetroduplex)基因的间隔子序列由于没有相应的转录序列,而无法同mRNA分子杂交

29、,因此形成单链的环状结构(DNA-RNA杂种分子)。用S1核酸酶处理,使单链的DNA环状结构被降解成单核苷酸,于是DNA片段被分解成两个片段。凝胶电泳,测定这两个片段的分子量大小。间隔子位置推算(参见基因工程原理第3章有关内容)(2)异源双链体分子定义同一条双链DNA分子中的两条链分别来自两种不同的个体,如一种是野生型的一种是突变型的,因此在这样的双链DNA分子结构中,有一些甚至是大量的碱基是不能配对的,而形成单链的环状结构。3mRNA初级转录本的剪辑(1)两步机理(two-stop mechanism)剪辑法绝大多数真核生物基因的mRNA前体(pre-mRNA),有时也叫做核内不均一RNA(

30、hn RNA)(heterogeneons nuclear RNA),都含有许多间隔子,它们需要在mRNA穿过核膜进入细胞质进行转译之前,通过一种叫做两步机理的剪辑作用而被删除掉。*1.剪辑体(spliceosome):这是发生mRNA剪辑作用的一种特殊的高分子量的颗粒。它含有:pre-mRNA高密度的核内小核糖核蛋白(small nuclear ribonucleoprotein, snRNP)颗粒各种剪辑因子第一步,在剪辑位点(splice site)发生切割反应第二步,涉及3剪辑位点的切割及表达子的连接。*2.剪辑位点真核细胞mRNA的5及3的剪辑位点的保守序列。几乎所有的间隔子序列都是

31、以G-U开始,用A-G结束的。根据对许多表达子-间隔子边界序列的分析,已经得出了5末端和3末端的优选的保守的核苷酸序列,除了A-G之外,紧挨3剪辑位点上游序列的其它核苷酸,对于进行精确的剪辑作用,同样也是十分重要的。在间隔子的两端总是具有5GU和3AG的二核苷酸结构。这种特异性的二核苷酸连同围绕它们的25-30个核苷酸一起构成了表达子-间隔子剪辑位点。剪辑位点也叫做剪辑点(splice junction),它是启始RNA剪辑作用的一段特定的核苷酸序列。*3.套索RNA套索RNA(lariat RNA):因剪辑作用而被删除下来的间隔子形成的一种分支状中间体,称为套索RNA。(2)mRNA的差异剪

32、辑(differential splicing)*1.定义有些基因的初级转录本,在不同的细胞类型中或是在发育的不同阶段,可以按不同的途径剪辑形成不同的RNA分子,编码不同的蛋白质,我们称这种现象为mRNA的差异剪辑(differential splicing)或可变剪辑(alternative splicing)可变剪辑同一种蛋白质的mRNA前体,经过可变剪辑之后,往往会产生出不同形式的蛋白质,即蛋白质的异型体,以满足生物体的不同发育阶段或不同细胞类型的特殊需要,因此剪辑在发育过程中起到一种开关的作用。有关可变剪辑的机理,目前尚不知道。已经提出一种模型认为存在特殊的剪辑因子(splicing

33、factor)来指导优先使用一组特殊的表达子组合。图2-10 在两种不同器官中发生的可变剪辑途径在两种不同的器官中发生的可变剪辑,结果从同一种初级转录本产生出两种不同的转译产物,一种是降钙素肽,另一种是降钙素基因相关肽(CGRP=calcitonin-gene-related peptide),降钙素肽和降钙素基因相关肽是两种相关的激素。CT=降钙素(calcitonin)。三、重叠基因(Overlapping genes)1定义:核苷酸编码序列彼此重叠的、编不同蛋白质的两个或数个基因,称为重叠基因,又叫做嵌套基因(nested genes)。它最早是在大肠杆菌噬菌体中发现的,后来在真核细胞中

34、也发现有此类基因。2重叠基因的发现:已知大肠杆菌细胞中的fX174噬菌体单链DNA=5386个核苷酸。*1.5386/3=1795个氨基酸。因此它最多只能编码总数1795个氨基酸*2.氨基酸平均分子量MW=1101795110=197000*3.实际测得的fX174噬菌体编码的十一种蛋白质的分子量共为266000根据上述分析,F, Sanger在测定了fX174 DNA的核苷酸序列之后发现,它的同一部分DNA能够编码两种不同的蛋白质,从而发现了重叠基因。3原核生物重叠基因类型:(1) 第一种类型:一个基因的核苷酸序列完全包含在另一个基因的核苷酸序列当中,只是由于读码结构不同,因此编码着不同的蛋

35、白质产物。(2) 第二种类型:两个基因核苷酸序列的末端密码子相互重叠。例如A基因的终止密码子的3个核苷酸TGA与C基因的起始密码子ATG重叠了二个核苷酸:A基因终止密码子ATGAC基因起始密码子(3)第三种类型:在G4噬菌体中发现此类重叠基因重叠的核苷酸区段(由4个或5个核苷酸组成)同时为3个不同的基因编码,重叠部分的核苷酸序列是TGATG,编码K、A、B三个基因:基因B 苯丙氨酸 终止密码子基因A 丝氨酸 天冬氨酸 谷氨酸 T T C T G A T G A A A G4 DN序列基因K 甲硫氨酸 赖氨酸(起始密码子)4真核生物重叠基因类型现在已经知道不仅在原核生物中存在着重叠基因,而且在真

36、核生物中也发现有重叠基因。(1) 间隔子式重叠基因:一个基因的编码序列完全寓居于别个基因的间隔子序列当中。例如在果蝇的GART基因(这是一种编码嘌呤生物合成的重要酶蛋白的基因)的一个间隔子序列中,寓居着一个与之无关的编码蛹角质膜蛋白的基因,但两者转录方向相反。(2)嵌套基因:这是在高等真核生物中发现的另一类重叠基因,其特征是以基因的相反链编码。例如从人类基因组中克隆的一种编码819个氨基酸蛋白质的基因cDNA片段,其相反链(opposite strand)上还编码一个类固醇21-羟化酶基因。5重叠基因的分布*1.目前已经在fX174噬菌体、G40噬菌体、SV40病毒以及少数的真核基因中,发现了

37、重叠基因的存在。然而重叠基因在生物界中是否普遍存在?目前尚无法肯定。*2.但是我们相信,随着研究工作的不断深入,尤其是有关间隔子序列的测序和功能鉴定的深入,人们完全有可能发现另外的新型的重叠基因,也就是有关重叠基因的数量以及类型,都将会有不断定发展。6意义:重叠基因的发现,修正了关于基因间核苷酸序列互不重叠的概念!四、假基因目前已经在大多数真核生物中,都找到了其核苷酸序列同相应的(正常的)功能基因相比,大部分都是同源的,但却是无活性的不能转录的基因,即假基因(Pseudogenes)。1. 假基因的定义:一类同野生型基因序列大部分同源,但由于突变而失去活性的畸变的核苷酸序列。假基因可能是一种活

38、性基因在进化过程中保留下来的遗迹,它虽不能表达,但却是基因组的稳定成份。2. 假基因的拷贝数(1)已知小分子量的pol和pol RNA基因,通常有数百个假基因。(a)例如U1 snRNA(small nuclear RNA)大约有50100个功能基因,但却有5001000个范围的假基因,后者为前者的10倍;(b)再如,哺乳动物的7SL RNA基因族,只有4个活性基因,却拥有数百个的假基因,超过前者的数十倍乃至百多倍。(2)在蛋白质的编码基因中,假基因的拷贝数的数量则是比较低的,通常不会超过20个。3假基因的类型(1)重复的假基因*许多假基因都是同“亲本基因”(parental gene)连锁的

39、,而且同其编码区及侧翼序列的DNA具有很高的同源性。*鉴于产生此类假基因拷贝的一种可能的机理是,由含有“亲本基因”染色体区段串联重复形成,故称之为重复的假基因(Repeat pseudogene)。*一般认为在起初这种重复的基因是有功能的,但在进化的过程中,其中某一个基因发生独立的突变而丧失了功能,出现了进货的盲端,最终形成了假基因。*例如a-珠蛋白座位具有5个基因中,有两个是假基因,这两个假基因虽然没有功能活性,但却能稳定遗传:E1胚胎珠蛋白基因A1和A2成体珠蛋白基因yE1和yA1假基因图2-11 位于16号染色体上的人a-珠蛋白基因座在上图所示的这5个基因中,yA1显然是A1基因的重复或

40、者说是复制品(duplication),两者之间有73%的同源性,都含有间隔子及保守的5控制元件,而且它们在5及3侧翼DNA之间都具很高的同源性。但由于yA1基因中发生了许多突变而失去功能活性,故成假基因,该基因(yA1)很可能是在45百万年以前由野生型基因突变形成的。(2)加工的假基因*1.概念研究发现在真核生物染色体基因组中,除了重复的假基因之外,还存在着另外一类“加工的假基因”(processed pseudogene)。由于这类假基因没有与“亲本基因”连锁,而且其结构是同转录本而非“亲本基因”类似。例如:a. 没有启动子结构,b. 没有间隔子序列,c. 在基因的3-末端都有一段延伸的腺

41、嘌呤短序列,恰似mRNA分子3-末端的poly(A)尾巴。这些特征表明,此类假基因很可能是来自加工的RNA之DNA拷贝,因此,称之为加工的假基因。图2-12 人金属硫蛋白功能基因Mt-A与无功能的加工的假基因Mt-B的结构比较*2.加工假基因的结构特点人金属硫蛋白基因Mt-A的无功能复本Mt-B,是一种典型的加工的假基因。从图2-12可以看到,这个假基因显然是功能基因Mt-A mRNA的准确复本(或称Copy),其结构特点是:它准确地从帽位点开始,失去了间隔子,终止在poly(A)位点。正是根据这些结构特征,我们有理由相信Mt-B是来自金属硫蛋白基因Mt-A之加工的mRNA的DNA拷贝。所以说

42、它是一种典型的加工的假基因。*3.金属硫蛋白加工的假基因Mt-B失活的原因分析:a. 可能是因为它失去了转录控制信号,因此没法进行正常的转录,亦即是失去了转录活性;b. 可能是由于在编码区出现了一个终止密码子,因而使该基因失活。所以即便在5端加上一个功能的启动子(即转录控制信号),具此类似结构的加工假基因也仍然是没有活性的。(3)加工的假基因的起源问题细胞质mRNA反转录作用无间隔子假基因形成的分子机理:*1.如上所述,第二类假基因的许多特征表明,它们是来自加工的mRNA之DNA拷贝,因此被称之为加工的假基因。*2.此外,加工的假基因的两侧,通常还包翼着530bp的短同向重复序列(directly repeated sequence),而且这些重复序列DNA同其亲本基因完全没有关系。*3.加工假基因的形成,很可能是同反转录酶有关,这种酶可以RNA为模板形成DNA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论