分子生物学20092的课件资料_第1页
分子生物学20092的课件资料_第2页
分子生物学20092的课件资料_第3页
分子生物学20092的课件资料_第4页
分子生物学20092的课件资料_第5页
已阅读5页,还剩153页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分子生物学20092的课件资料第1页/共158页第二章DNA的结构1.DNA的右手双螺旋结构2.左手双螺旋DNA—Z-DNA3.双链环形DNA4.三链DNA5.超螺旋DNA第2页/共158页第三章基因的现代概念1.移动基因1.1插入序列(IS因子)1.2转位子(Tn)2.断裂基因3.假基因3.1重复的假基因3.2加工的假基因第3页/共158页4.重复基因4.1唯一序列与低度重复序列4.2中度重复序列4.3高度重复序列—卫星DNA5.重叠基因5.1完全重叠基因5.2头尾重叠5.3多级重叠第4页/共158页第四章基因组1.原核生物基因组概况1.1细菌的染色体基因组1.2质粒1.3病毒基因组2.真核生物基因组2.1真核生物核基因组2.2细胞器基因组第5页/共158页1.DNA的右手双螺旋结构在20世纪50年代初,有关DNA的结构已积累了不少资料。碱基分析表明,不同来源的DNA中总是A等于T,G等于C,即A/T=G/C=1,而[G+C]/[A+T]的比例却显示出很大的差别。DNA纤维的X-射线衍射图则指出,其中的原子沿长轴存在0.34nm和3.4nm两种周期,这提示分子可能具有螺旋构象。1953年Watson和Crick提出了DNA的双螺旋结构模型,合理的解释了上述现象。此模型描述的是B-DNA钠盐在一定湿度(相对湿度92%)下的结构。第二章DNA的结构第6页/共158页B-DNA的特征①由两条反平行的脱氧多核苷酸链围绕同一中心轴构成的右手双螺旋结构。第7页/共158页②在多核苷酸链中,脱氧核糖通过磷酸二酯键构成了主链。主链是亲水的,排在螺旋体的外侧,脱氧核糖环的平面与中心轴平行。这是DNA分子的骨架,是各种DNA分子都相同的部分。沿中心轴分布着四种碱基,碱基是疏水的,排在螺旋体的内侧。③多核苷酸链的方向是由核苷酸间的磷酸二酯键的走向决定的,一条从5ˊ→3ˊ,另一长从3ˊ→5ˊ。第8页/共158页④链间有螺旋的凹槽,其中一条窄而浅,叫小沟;一条宽而深,叫大沟。第9页/共158页⑤两条链上的碱基以氢键相联,A与T配对,G与C配对,碱基杂环上的氧呈酮基,氮呈氨基,从而使相互之间形成氢键,A与T以两个氢键相联,G与C以三个氢键相联。碱基的平面与中心轴垂直,而且螺旋的的轴心穿过氢键的中心。第10页/共158页⑥相邻碱基平面之间的距离为0.34nm,每一圈螺旋含10个碱基,它在中心轴上的距离为3.4nm。双螺旋的直径为2.0nm。0.34nm相当于碱基环的厚度,这表明碱基对是紧密堆积的,相互之间存在着堆积力。正是DNA双螺旋链中碱基间的疏水作用、碱基间的氢键和堆积力使DNA形成稳定的双螺旋结构。第11页/共158页B-DNA的双螺旋结构很稳定,但不是绝对的,它在环境中不停地运动,如室温下DNA溶液中有部分氢键断开,造成这些部位结构多变。水溶液及细胞中天然状态DNA大多为B-DNA,但若湿度改变(如相对湿度低于75%时)或由DNA钠盐变为钾盐、铯盐等则会引起构象变化,形成A-DNA、C-DNA等构象。第12页/共158页在核酸的右手螺旋中,螺旋盘绕的松紧程度受DNA分子内力的影响,若B-DNA盘绕过紧,则会变构为A-DNA。在纯化DNA时,采用乙醇沉淀法,在整个过程中大部分DNA由B-DNA经过C-DNA,最终变成A-DNA。由于它是B-DNA拧得更紧的状态,所以它在二级结构上发生了比较明显的变化。第13页/共158页B-DNA的碱基对平面与双螺旋的轴线呈垂直状态,而A-DNA的碱基对平面与轴线之间呈20°倾角。A-DNA的轴心不再穿过碱基对之间的的氢键中心,而是位于碱基对之外。这一偏轴心结构主要是由于DNA片段中核苷酸亲水—疏水性改变所致。B-DNA每一螺旋含有10个碱基对,而在A-DNA中则含有11个碱基对。B-DNA双螺旋中,在大沟、小沟的深度是相差不太大,只是大沟较宽。变成A-DNA后,大沟变窄、变深,小沟变宽、变浅。第14页/共158页由于大沟、小沟是DNA行使功能时蛋白质的识别位点,所以由B-DNA变为A-DNA后,蛋白质对DNA分子的识别也发生了相应变化。DNA脱水时由B-DNA变成A-DNA,DNA分子中的一条被相应的RNA所取代时,形成的DNA-RNA双螺旋也是A型结构。所以,当DNA处在转录状态时,DNA模板与由它转录所得的RNA形成的双链就是A型构象。由此可见A-DNA构象对基因表达具有重要意义。此外,由两条RNA链形成的双螺旋结构也是A型构象。第15页/共158页除A-DNA和B-DNA螺旋结构外,还存在着Bˊ-DNA、C-DNA、D-DNA等双螺旋结构。各种右手双螺旋DNA的结构参数如下:第16页/共158页2.左手双螺旋DNAZ-DNA是1979年由Rich提出的。Rich在对d(CGCGCG)结晶进行X-射线衍射分析后提出了Z-DNA结构模型。左手螺旋的Z-DNA是对右手螺旋结构模型的一个补充和发展,现已证明细胞内的B-DNA中有时会存在一小段Z-DNA螺旋结构。

Z-DNA有如下结构特点:①Z-DNA是左手螺旋,每个螺旋含12个碱基对,比A-DNA拧得更紧。②双螺旋中不存在深沟,只有浅沟。第17页/共158页③双螺旋的轴心也在碱基对之外,即轴心不穿过碱基对之间的氢键。④Z-DNA中磷酸二酯键的连接不再呈B-DNA中的光滑状,而是呈锯齿状,这就是Z-DNA名称的由来。第18页/共158页⑤Z-DNA中的碱基对不像B-DNA中那样位于双链的中央,G碱基的第8个碳位于双链之外(在B-DNA中,糖、磷酸键覆盖了C8位置)。由于Z-DNA上几乎不存在易被蛋白质识别的沟,Z-DNA可能借助于双链分子外围的G碱基与化学物质发生识别反应。

B-DNA是活性很高的DNA构象,B-DNA变构为A-DNA后,仍有活性,但若局部变构为Z-DNA后活性明显降低。第19页/共158页Z-DNA在天然DNA中的存在表明它应有自己独特的功能,Z-DNA的存在可能与基因表达的调控有关。现已提出两个Z-DNA调控转录的模式。邻近调控系统中,与调控区相邻的转录区被Z-DNA抑制,只有当Z-DNA转变为B-DNA后,转录得以活化。B-DNAZ-DNA不转录控制区转录区B-DNAB-DNA转录第20页/共158页远距离调控系统中,Z-DNA可通过改变负超螺旋水平,决定RNA聚合酶能否与模板链相结合而调节转录起始活性。

(上千bp)

B-DNA

B-DNA控制区转录区负超螺旋程度低,无扭曲张力,不转录

(上千bp)

B-DNA

Z-DNA负超螺旋程度高,有扭曲张力,转录第21页/共158页3.双链环形DNA生物体内的有些DNA是以双链环形DNA的形式存在的。有些环形DNA还可以进一步形成超螺旋,或称连锁状DNA。第22页/共158页

4.三链DNA早在1957年,Davis,Felsenfied及Rich等3人就提出了三链核酸结构的概念,他们以两条poly(U)和一条poly(A)链合成出一种三链物质。但当时并未引起人们的注意。主要原因是因为当时Watson和Crick的双螺旋模型刚提出不久,它解释了很多遗传现象,而三螺旋模型却对此无能为力。此外还由于这种三链结构是由RNA形成的而非DNA。于是除了少数物理化学家外,人们对这种实验室合成出的三链物质没有太多兴趣。第23页/共158页1987年,Mirkin等从准天然途径中发现了DNA的三螺旋结构,这为三螺旋DNA在生物体内存在的可能性带来了希望之光。以此为转机,对三链DNA研究的势头在国内外兴盛起来。Mirkin等在酸性溶液的质粒中发现了DNA的一种三链结构,称为H-DNA(“绞链”DNA)。第24页/共158页1990年底,白春礼等在用扫描隧道显微镜(STM)研究噬菌体λDNA-HindⅢ的变异结构时,发现了一种新的三链DNA结构,称为三辫状DNA。白春礼等人不仅从获得的图象上看到了由三条DNA链形成的发辫状三链结构,并且还观察到由双螺旋结构片段与三链辫状结构片段的衔接结构。这种前所未有的三链DNA结构引起了国内外学术界的关注。目前所发现的三链DNA都是由多聚嘌呤和多聚嘧啶片段构成的。在三链结构中,多聚嘌呤和多聚嘧啶(即原有的两条链)是反平行的双螺旋,第三条链则结合有双螺旋的大沟中。第25页/共158页三链DNA结构示意图第26页/共158页三链DNA的生物学作用目前仍知之甚少,对其生物学意义只能进行一些预测,但人们在研究工作中已经将热点集中在以下两个方面。①三链DNA有特异裂解正常DNA分子的功能,当第三条链与双链DNA特异地结合成三链DNA后,可使双链DNA在特异位点上裂解。所以,三链DNA充当了“分子剪刀”。第27页/共158页②三链DNA在基因转录过程中起诱导、阻断作用。第三条链的存在可能使一些调控蛋白或RNA聚合酶等难以与该区结合,因而阻断有关基因的转录。可以预想,人们一旦在细胞水平上掌握了这种功能后,就能够通过三链阻断转录机制来治疗一些遗传性疾病和病毒性疾病,如爱兹病、乙肝等。所以三链DNA的生物学作用是值得人们深入研究的问题。

第28页/共158页5.超螺旋DNA超螺旋DNA最早是在SV40(猿猴病毒40)和多瘤病毒中发现的。当SV40的DNA从被感染细胞中分离出来时,它与组蛋白结合形成核小体,如果使DNA与组蛋白分离,DNA就成为超螺旋。后来逐渐发现,形成超螺旋是病毒、细菌以及真核细胞DNA的普遍特性。超螺旋DNA是DNA高级结构的主要形式,可分为负超螺旋和正超螺旋两大类,它们在特殊情况下可以互变。第29页/共158页例如:

拓扑异构酶拓扑异构酶

负超螺旋松弛DNA正超螺旋

溴乙锭溴乙锭第30页/共158页B-DNA结构中,一般每转一圈有10个核苷酸对。平时,双螺旋总处在能量最低状态。若将DNA双螺旋额外地多转几圈或少转几圈,使每圈的核苷酸数目大于或小于10,就会出现双螺旋空间结构的改变,在DNA分子中产生额外的张力。若此时双螺旋的末端是自由的,可通过链的转动来释放这种额外的张力,从而保持原来的双螺旋结构;若此时DNA分子的末端是固定的或是环状分子,双链不能自由转动,额外的张力就不能释放而导致DNA分子内部原子空间位置的重排,造成扭曲,即出现超螺旋结构。第31页/共158页由此可见,B-DNA双螺旋分子的链间螺旋数若发生变化,就会出现超螺旋结构,而且超螺旋的绕数与B-DNA的链间螺旋数有密切关系。研究细菌中制备的质粒DNA(环状双链DNA)发现,天然状态下以负超螺旋为主,稍被破坏即出现开环结构,两条链均断开则呈线性结构。第32页/共158页电泳时,在直流电场的作用下,相同相对分子质量的超螺旋DNA比线性DNA迁移率大,线性比开环的迁移率大,以此可将不同形状的DNA分开,亦可判断质粒结构是否被破坏。琼脂糖凝胶电泳现已成为检测DNA螺旋程度的一种最直接的方法,它能够分离仅差一圈的超螺旋DNA。另外,由于超螺旋DNA具有更加致密的结构,在离心场中的沉降速度增加,所以超速离心也是分离超螺旋DNA的一种的效方法。第33页/共158页DNA分子的这一变化可以用一数学公式来表示:

L=T+W其中L为连接数,是指开环DNA分子两条链间的交叉次数。只要不发生链的断裂,L是个常数。T为双螺旋的盘绕数,W为超螺旋数,它们是变量。例如:某一B-DNA共有250碱基对,每一圈螺旋含10个碱基,所以,L和T都是25,这时W=0,不存在超螺旋。现在若将DNA分子的一端固定,另一端朝双螺旋相反的方向旋转2圈后使两端封闭(此时L=23),分子的张力可以按两种方式分布,一种在分子内保留一个单链区,即T也减为23。W仍然为0。第34页/共158页由于DNA趋向于保持B-DNA,因此张力分布的另一种方式为:使T维持原来的25,L既是定值,仍为23,为了满足上述方程,W必须等于-2,该DNA就成为超盘绕2次的负超螺旋。超螺旋是DNA三级结构的一种普遍形式,双螺旋DNA的松开导致负超螺旋,而拧紧则导致形成正超螺旋。第35页/共158页虽然超螺旋最早在环形DNA中发现,但许多证据表明线性DNA也可以超螺旋化。研究真核细胞染色体DNA在天然状态下的结构特点证明,染色体大多沿着两种主要DNA结合蛋白骨架形成大量连续的环状区域。每一个环中的DNA独立形成超螺旋并具有不同的张力,骨架的存在防止了将一个环中的DNA扭力传递到另一个环中去,而这些环大多是染色体的功能单位。第36页/共158页Z-DNA的形成也对DNA的超螺旋化有重要意义。如B-DNA中有一个右手螺旋转换成Z-DNA的左手螺旋圈,则T值就改变2,W也相应改变2,说明只要有一小段DNA由B-DNA转变为Z-DNA,DNA的超螺旋结构就可能发生很大变化,这种变化对基因表达的调控是不可缺少的。第37页/共158页超螺旋是DNA的一种受力状态,负超螺旋DNA分子所经受的张力会引起互补链的分开,导致局部变性(富含AT碱基对的区段),局部变性无凝是DNA复制和转录所必需的。负超螺旋DNA在功能上的这一重要意义已得到了实验的证实。第38页/共158页DNA可以在各个拓扑异构体之间转换,这种转换是一类被称为拓扑异构酶的蛋白质催化的。拓扑异构酶是一类催化DNA由一种拓扑异构体转变为另一种拓扑异构体的酶。这种转变是通过改变L值来实现的。原核生物的拓扑异构酶Ⅱ(又称为旋转酶)可利用ATP中的能量使DNA按左手方向松开,从而产生负超螺旋(真核细胞的同种酶除了ATP之外,还需要目前尚不清楚的蛋白质存在才能产生负超螺旋);拓扑异构酶Ⅰ则使细胞中的超螺旋DNA转变为无张力的、能量上占优势的松弛态DNA。第39页/共158页两种拓扑异酶的作用相互抗衡,在细胞中,两种酶的量是经过精细调节的,从而使DNA的负超螺旋程度恰到好处。

拓扑异构酶Ⅰ

负超螺旋DNA松弛态DNA

拓扑异构酶Ⅱ第40页/共158页Ⅰ型和Ⅱ型的拓扑异构酶都是通过催化DNA主链的磷酸二酯键断裂和重新连接来发挥作用的。即它们的功能是在DNA分子的一条链多核苷酸链上产生一个暂时的断口,形成的两个末端分别与拓扑异酶的两个亚基相连,然后使另一条末断裂的多核苷酸链穿过酶(亚基之间)和断口之后,两末端又重新相连,断口又闭合。第41页/共158页所不同的是拓扑异构酶Ⅰ作用的结果使L值增加1,所以负超螺旋数减少1。拓扑异构酶Ⅱ作用的结果使L值减少1,所以负超螺旋数增加1。但实际上它们的作用过程是相当复杂的。第42页/共158页真核生物细胞核中DNA的三级结构是另一种类型的超螺旋结构。在1974年,人们通过电子显微镜观察到染色质呈串珠状结构,基本重复单位就是核小体。第43页/共158页核小体内有组蛋白八聚体[(H2A、H2B)2、(H3、H4)2],外面缠绕着1.75圈长度约140bp的DNA,其外形呈矮圆柱状。相邻核小体之间由长约60bp的DNA连接,称为连接线(linker)。H1位于连接区,可能和核小体组装成更高一级的结构有关。所以,核小体是由五种组蛋白及200bp的DNA构成。第44页/共158页人类细胞核平均直径为5μm。细胞中3×109bp的DNA存在于22对常染色体和X、Y染色体中,如按每条染色体含1.5×108bp的DNA线性分子,每个核小体DNA平均为200bp计算,应有7.5×105个核小体存在,其伸展长度为7mm,远非细胞核所能容纳。X-射线衍射技术确定核小体直径约为11nm,要在有关核蛋白的协同下组成以6个核小体为一周,直径30nm的紧密结构,即光学显微镜下可见的染色质纤维,此时人类基因组已压缩到1mm的长度。第45页/共158页在两栖类未成熟的卵母细胞间期核中,可在光学显微镜下见到一种灯刷状染色体(lampbrushchromosome)结构,是在转录高度活跃的DNA与蛋白质形成核蛋白复合体的基础上构成的,灯刷染色体进一步形成大环状结构(loopeddomain),通过结合在大环基部的蛋白质相互连接或基部直接连接在染色质扣轴上,每个环的长度约为20~100kb,高度约为300nm。第46页/共158页含有这种环状结构的染色质DNA再进而盘绕成700nm的染色单体。经过这一系列的组装,人类DNA可通过2000个大环最终浓缩30万倍而组装在染色体中。第47页/共158页第三章基因的现代概念随着分子生物学和分子遗传学的不断进步,使得人们要给基因下一个确切的定义已越来越困难,因为基因的旧概念被不断突破:过去认为基因是为蛋白质编码的DNA片段以及一个基因一个酶,现在发现的许多非编码基因修正了这个概念。过去认为基因是可以表达的,现在却发现了许多非表达基因;如果把基因看成一段连续的DNA序列,这个概念被现在发现的断裂基因打破。第48页/共158页把基因看成一段固定的DNA序列,而又发现了许多可移动的基因。如果说基因是DNA链上的一段独立序列,那么它也要被现在发现的重叠基因修正。很长一段时间,人们认为基因始终在DNA上,遗传信息流总是从DNA→RNA,这个概念也要修正了,因为逆转录酶的发现证明了遗传信息可以从RNA反向流至DNA,特别是最近发现的反转子和反转录转座子等使基因的概念得到更大的发展。第49页/共158页1.移动基因移动基因又叫转位因子。由于它可以从染色体基因组上的一个位置移动到另一个位置,甚至在不同的染色体之间跃迁,因此又称为跳跃基因。移动基因是20世纪40年代美国冷泉港实验室的一位年轻的女科学家(B.McClintock)首先在玉米上发现的。由于它们的移动可引起染色体的重排,影响基因的表达,所以当时称为“控制因子”。根据移动基因的结构不同将它们分为两类:插入序列(insertionsequence,简称IS)和转座子(transposor,简称Tn)。第50页/共158页1.1插入序列(IS因子)插入序列,现在一般叫做IS因子,它是在细菌中首先发现的最简单的一类转位因子。其长度为数百个核苷酸对至一两千个核苷酸对,相当于1~2个基因的编码量。第51页/共158页IS因子的一个共同特征是,在它们的末端都有一段反向的重复序列(IR序列),但其长度并不一定相等。例如IS转位位子的左边IR序列是17bp,右边的是22bp,两者相差5bp。转位时往往还要复制宿主靶位点的一段DNA(4~15bp),形成了位于其两端外侧的一小段同向重复序列。IRIRIS宿主DNA宿主DNAIS反向重复的IR靶位点的同向重复序列第52页/共158页IS因子一般只编码一种参与转位作用的转位酶,它能够识别反向重复序列,并催化转位因子发生转位作用,即从原位点上解离下来,然后插入到新的位点上。可以插入到大肠杆菌染色体、质粒以及噬菌体基因组的各个位置上。既可以正向整合到基因组上,也可以反向整合到基因组上。第53页/共158页

1.2转位子(Tn)转位子是由几个基因组成的特定的DNA片段,而且往往带有抗菌素抗性基因,所以易于鉴定。根据结构特征的不同,转位子可分为复合系和Tn3系两种类别。复合转位子是由2个同样的IS因子连接在抗菌素抗性片段两侧构成的。IRIRIRIRTn1681热稳定性的大肠杆菌毒素1基因ISIS第54页/共158页在这些复合单位中,IS因子可以是反向重复的构型,也可以是正向重复的构型。第55页/共158页复合转位子很容易携带着抗菌素抗性基因从细菌染色体转移到质粒或噬菌体基因组上。当发生这种情况时,转位子就会随着这些载体分子迅速地传播到其它细菌中去。这类转位作用是自然界中发生细菌抗药性的主要原因。第56页/共158页Tn3系转位子结构比较复杂,长度约为5000bp。末端有一对38bp的IR序列,但不含有IS因子序列。每个转位子都带有3个基因:一个是编码对氨苄青霉素抗性的β-内酰胺酶(β-lactamase)基因,另外2个是与转位有关的基因TnpA和TnpR基因。TnpA是转位酶基因,TnpR则编码一小分子蛋白,该蛋白质既能阻遏TnpA基因,又能促进分隔区的位点专一性切割。IRIRTnpATnpRβ-Lac中间分隔区第57页/共158页2.断裂基因许多真核基因的编码序列不是连续排列的,它们往往被一些片段分隔成几个小片段。我们将这种编码序列不连续的的间断基因称为断裂基因。断裂基因最初是在腺病毒(adenovirus)中发现的。在1977年度美国冷泉港实验室学术年会上有人报告,腺病毒基因是断裂基因,以后在SV40病毒和许多真核基因中都发现了断裂基因。除干扰素基因和组蛋白基因之外,断裂基因是所有真核基因的普遍现象。第58页/共158页不连续的断裂基因的表达程序是:先转录出包括编码序列和间隔序列在内的原初转录物,即核不均一RNA(hnRNA);然后经过删除和连接,除去无关的DNA间隔序列转录物,便成为成熟的mRNA分子;它从细胞核中运输到细胞质,再翻译成多肽链。这些在加工成熟过程中被剪除掉的间隔序列又称为间隔子或内含子,被保留下来的编码序列又叫做表达子或外显子。而这种间隔子的删除和表达子的连接过程,称为RNA剪辑。第59页/共158页人β-珠蛋白基因的结构该基因编码成年人血红蛋白β-链。所有哺乳动物的β-珠蛋白基因都是由被2个间隔子分隔开的3个表达子构成。框内数字表示每个表达子或间隔子的核苷酸数。初级转录本(pre-mRNA)含有表达子和间隔子序列。由剪辑酶切除间隔子,将表达子连接起来;同时经过5′端的加“帽子”作用和3′端的加poly(A)作用等加工过程,成为成熟的mRNA。第60页/共158页不同的基因中外显子的数目不同,最多的可达40多个,如胶原蛋白的基因。外显子和内含子的连接区序列是高度保守的,这一序列提供了RNA加工过程中的剪接信号。序列分析表明,几乎每个内含子5′端起始的两个核苷酸都是GT,3′端最后的两个核苷酸总是AG。由于这两个核苷酸的高度保守性和存在的广泛性,有人把它称为GT—AG规律。这同时也表明在这些基因中可能存在着一个共同的剪接加工机制。但是在线粒体基因和酵母基因中不存在这类保守序列,暗示还可能存在着不同类型的加工过程。第61页/共158页3.假基因这是一类核苷酸序列与其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。例如,在珠蛋白、免疫球蛋白、组织相容性抗原以及肌动蛋白和微管蛋白基因家族中,都存在着这样的功能失活的假基因。假基因又可分为重复的假基因和加工的假基因。第62页/共158页3.1重复的假基因许多假基因都是和“亲本基因”连锁的,而且同其编码区及侧翼序列的DNA具有很高的同源性。可见产生此类假基因拷贝的一种可能的机理是,由含有“亲本基因”的染色体区段串联重复形成,故称为重复的假基因。第63页/共158页球蛋白基因家族中的假基因就属于这种类型。人类球蛋白α基因簇位于16号染色体上,长28kb以上,含有3个功能基因(ζ、α2、α1)、3个假基因(ψζ、ψα2、ψα1)和1个未知功能的θ基因。β基因簇位于11号染色体上,长50kb以上,含5个功能基因(ε、Gγ、Aγ、δ、β)和1个假基因(ψβ1)。人的α球蛋白基因ζα2α1ψζψα2ψα1θ人的β球蛋白基因εGγAγδβψβ1第64页/共158页一般认为,在起初这种重复的基因是有功能的,但在进化的某个时期出现了一种失活突变而丧失了表达活性。然而由于这种基因是重复的,具有多拷贝,因此一个拷贝的突变并不会影响到生物体的存活问题。于是在漫长的进化过程中,这个基因便逐渐积累起其它的突变,从而最终产生了今天这样的假基因序列。第65页/共158页3.2加工的假基因这类假基因没有与“亲本基因”连锁,而且其结构不是与“亲本基因”类似,而是与转录本类似的。例如,它们都没有启动子和间隔子,但在基因的3′-末端则都有一段延伸的腺苷酸短序列,恰似mRNA分子3′-末端的poly(A)尾巴。这些特征表明,此类假基因可能是来自加工成熟的mRNA之DNA拷贝,因此称之为加工的假基因。第66页/共158页

人的一种金属硫蛋白MT)功能基因Mt-ⅡA与无功能的加工假基因Mt-ⅡB在分子结构上的差异。第67页/共158页从图中可以看出,这个假基因显然是其功能基因的mRNA的准确拷贝。它是从帽子位点开始的,但已失去了相应的间隔子序列,并终止在poly(A)位点。同时在Mt-ⅡB假基因两侧还有一对短的同向重复序列。但由于失去了转录控制信号,因此加工的假基因是没有活性的,不能够转录出相应的转录本。第68页/共158页人类猜测这种加工的假基因的产生机理可能是,通过一种罕见的胞质mRNA反转录作用,形成cDNA,然后再以某种尚不知道的方式随机地重新插入到它的基因组中。而且,这种插入必须存在于生殖细胞或产生生殖细胞的性母细胞中,才能够遗传下去。第69页/共158页4.重复基因比较原核生物和真核生物基因组结构发现,几乎所有真核生物(除单细胞的酵母以外)的基因组DNA中,都具有重复序列,而且有些重复序列的拷贝数可高达百万以上。根据对多种生物DNA的详细分析,可将真核生物基因组分为四种不同类型的DNA序列:①不重复的唯一序列(只有一个拷贝);②低度重复序列(<10个拷贝);③中度重复序列(10到几百个拷贝);④高度重复序列(几百个到几百万个拷贝)。第70页/共158页4.1唯一序列与低度重复序列在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占DNA总量的40%~80%。不重复序列长约750—2000bp,相当于一个结构基因的长度。实际上结构基因基本上都属于不重复序列,如卵清蛋白、蚕的丝心蛋白、血红蛋白和珠蛋白等都是单拷贝基因。原核生物的基因都是不重复序列。第71页/共158页单拷贝基因通过基因扩增仍然可合成大量的蛋白质,如一个蚕的丝心蛋白可作为模板合成104个丝心蛋白mRNA,每个mRNA可存活4天,共合成105个丝心蛋白,这样,在几天内,一个单拷贝丝心蛋白基因就可以合成109个丝心蛋白分子。这种放大作用(特别是第二步放大作用)对单拷贝基因是十分重要的。重复序列基因没有这种放大作用。单拷贝基因这种高度表达的能力,对于克隆的外源基因在新的寄主细胞中实现功能表达显然是十分有用的。第72页/共158页4.2中度重复序列这类重复序列的重复次数在10几百次之间,占总DNA量的10%~40%。中度重复序列有两种类型:一种是成簇重复序列,另一种是分散重复序列。各种rRNA、tRNA以及某些结构基因(如组蛋白基因)等都属于成簇重复序列。例如,非洲爪蟾的18S、5.8S及28SrRNA基因是连在一起的,它们中间隔着不转录的间隔区,这些由18S、5.8S及28SrRNA基因及间隔区组成的单位在DNA上串联重复约500次。这些重复序列对迅速积累大量核糖体,以合成大量蛋白质供胚胎发育需用具有重要意义。第73页/共158页对绝大多数真核生物来说,组蛋白基因家族都是由5个主要基因(H1、H2A、H2B、H3、H4)串联形成基因簇。在海胆和果蝇等低等真核生物中,组蛋白的5个基因组成长约5000~6000bp的基因簇,每个基因簇都要重复上百甚至近千个拷贝。在高等真核生物中,组蛋白基因也是以基因簇形式存在,但每个基因组中仅有10~40个拷贝。另一种中度重复序列是分散重复序列,其长度因不同的物种而有所差异,变动范围在130~300bp之间,拷贝数可达数百个之多。第74页/共158页

4.3高度重复序列—卫星DNA这类DNA只在真核细胞中发现,占基因组的10%~60%,由6~200个核苷酸组成,在DNA链上可串联重复几百万次。由于碱基组成的不同,在CsCl密度梯度离心中易与其他DNA分开,形成两个以上的峰,即含量较大的主峰和高度重复序列小峰,后者又称卫星区带(峰),所以高度重复序列又称卫星DNA。第75页/共158页果蝇DNA在中性CsCl密度梯度离心中出现1条主带和3条卫星区带,人的DNA经CsCl密度梯度离心后可得到4条卫星区带。卫星DNA是高度浓缩的,是异染色质的组成部分,不转录,其功能还不清楚,可能与染色体的稳定性有关。它在染色体上的位置可用原位杂交方法进行鉴定,大部分高度重复的DNA在真核细胞染色体的两个重要结构——着丝粒和端粒处。第76页/共158页每个染色体只有一个着丝粒,它是蛋白质的附着点,这些蛋白质把染色体和有丝分裂纺锤体的微管连接起来,对细胞分裂时使染色体有序地分配到子代细胞中非常重要。在高等真核生物中,卫星DNA一般存在于着丝粒区,由一种或几种数以千计的短序列拷贝串联而成。典型的卫星序列为5~10bp。卫星DNA在着丝粒中的的确切功能还不清楚。人类染色体的着丝粒区有一类卫星DNA,它的最小重复单位是171bp,在着丝粒区串联高度重复排列。它既有染色体特异性,又具有染色体间的同源性,在人群中还具有高度的多态性。第77页/共158页端粒是染色体的物理末端。人的端粒是由串联的TTAGGG重复序列组成。端粒对染色体起保护作用,防止染色体重排、断裂等。端粒的长度随细胞分裂的不断进行而缩短,它决定着细胞的寿命,故称这为有丝分裂的生物钟。卫星DNA的功能尚不明确,一般认为与染色体折叠压缩和染色体的配对分离有关,将卫星DNA制成探针可用于分析染色体结构和演化,亲子鉴定,遗传性疾病的诊断等。第78页/共158页在基因组的间隔序列和内含子等非编码区内,广泛存在着另一类1~6bp的短小重复单位,称为微卫星DNA,如GACA、GATA、TCC、CT、CA等。微卫星DNA又称简单重复序列,它在人类基因组中出现的数目和频率不同,在基因组中分布广泛而表现出多态性。因此这些分散排列的简单重复序列是进行限制性片段长度多态性(RFLP)分析方便而有效的遗传标记,可在基因连锁诊断中广泛应用。

第79页/共158页在脊椎动物基因组中还存在着另一类高度重复的DNA序列家族,其重复单位散布在整个基因组的各个地方,中间被编码的DNA间断,因此称之为散在序列。其中长度小于500bp的叫做短散在序列(shortinterspersedelements,简称SINE);长度在5~7kb之间的叫做长散在序列(longinterspersedelements,简称LINE)。SINE序列与简单序列不同,它一般不是串联重复排列,而是以分散的形式重复出现在基因组的不同部位,每个基因组中大约有数千甚至上万个拷贝。第80页/共158页5.重叠基因长期以来,人们一直认为同一段DNA序列内,不可能存在着重叠的读码结构。但是,随着DNA核苷酸序列测定技术的发展,人们已经在一些噬菌体和动物病毒中发现,不同基因的核苷酸序列有时是可以共用的,也就是说它们的核苷酸序列是彼此重叠的。我们将这样的基因称为重叠基因或嵌套基因。第81页/共158页重叠基因首先是F.Sanger发现的,他在1977年测定了噬菌体ΦX174单链DNA的全部5375bp序列,如果使用单一的读码结构只能编码1795个氨基酸,按每个氨基酸的平均分子质量110计算,该噬菌体所合成的全部蛋白质的相对分子质量最多是197000。事实上,ΦX174基因组能编码11种蛋白质,相对分子质量总和为262000,超过预计相对分子质量的25%。因此,Sanger指出了重叠基因的存在。病毒基因组中的重叠基因是很普遍的,一般可分为完全重叠、头尾重叠和多级重叠三类。第82页/共158页5.1完全重叠基因基因组的一段DNA序列编码两种不同的蛋白,即一个基因的核苷酸序列完全包含在另一个基因的核苷酸序列之中。又可分为不同读码框架的完全重叠和相同读码框架的完全重叠。例如,ΦX174基因组的B基因完全包含在A基因中,但读码框架不同;A*基因仅仅是A基因的一部分,读码框架和终止密码相同。第83页/共158页不同读码框架的完全重叠和相同读码框架的完全重叠第84页/共158页5.2头尾重叠一个基因的起始密码子与另一个基因的终止密码子重叠1~2个核苷酸。例如,ΦX174基因组中D基因的终止密码子TAA与J基因的起始密码子ATG重叠了1个核苷酸。第85页/共158页5.3多级重叠在噬菌体中还存在三个基因重叠的现象。例如,G4噬菌体的单链DNA编码10个基因,其中编码K蛋白的K基因既与A基因重叠,又与B基因的终止密码子重叠1个核苷酸。第86页/共158页另外,在真核生物基因组还发现了另外一种类型的重叠基因,2个基因分别在互补的两条DNA链上,但转录的方向相反,且其中1个基因的间隔子可能正好是另一个基因的表达子。重叠基因是近年来在基因结构研究上的又一个有意义的发现。它修正了关于各个基因的多核苷酸链彼此分立、互不重叠的传统观念。目前已在ΦX174噬菌体、G4噬菌体以及SV40病毒和少数真核基因中发现了重叠基因现象。但是,它是否具有普遍意义,特别是在真核生物中是否广泛存在,这些都有待进一步研究。第87页/共158页第四章基因组基因组是指细胞中的全部遗传信息,包含了细胞发挥功能所需要的全部“程序”。DNA是遗传信息的载体,是遗传大分子,这些大分子通常组装成染色体。大部分细菌和病毒只含有一个染色体,而真核细胞含有多个染色体,每个染色体上通常都含有成千上万个独特的基因。一个细胞中所有不同染色体上全部DNA(包括全部基因和基因间的DNA)就是细胞的基因组。第88页/共158页在真核细胞中,99%以上的DNA存在于核内,称为核基因组,但有少量DNA存在于细胞器(如线粒体和叶绿体)中,将它们也视为基因组,称为细胞器基因组(如线粒体基因组、叶绿体基因组)。细菌和细胞器的基因组较小,通常是单个环状染色体,但也有报道存在一些线性的细胞器基因组。真核生物基因组则要大得多,分成多个线性染色体,如人类的核基因组分布在23对线性染色体上。病毒的基因组结构则变化较大。第89页/共158页基因组不是基因的随机组合,它们有功能性的高级结构,根据它们的理化性质和顺序组成可分为单拷贝序列和几种类型的重复序列(中度重复序列、高度重复序列和反向重复序列)。大多数基因是在单拷贝序列中发现的,但在中度重复序列中也有一些基因存在,其它重重复序列则不被转录。细菌和真核生物基因组以及高等真核生物和低等真核生物基因组之间在基因结构和基因在基因组中的组织方式存在显著不同。第90页/共158页细菌和低等真核生物的基因组绝大部分是可表达的不重复序列;基因小,一般没有内含子;基因间的距离也小。高等真核生物基因组大,主要是非编码的DNA,且有大量的重复序列;基因大小上变化较大,经常包含多个内含子(内含子一般比外显子大);基因间的距离也较大。第91页/共158页

1.原核生物基因组概况1.1细菌的染色体基因组细菌的染色体基因组有以下几个特点:①细菌染色体基因组常由一条环状DNA链组成。染色体经高度折叠、盘绕聚集在一起,形成致密的类核,类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链环状的DNA超螺旋。第92页/共158页染色体DNA链上与DNA复制、转录有关的信号区域优先与细胞膜结合,连接点的数量随细菌生长状况和不同生活周期而异。这种连接有助于细胞膜对染色体的固定,并在细胞分裂时将染色体均匀分配到子代细胞中。第93页/共158页②功能上相关的几个结构基因往往串联排列在一起,受它们上游共同的调控区(启动基因和操纵基因)的控制。转录时,形成一条多顺反子mRNA链,再分别指导合成各自的蛋白质。将几个结构基因和启动基因及操纵基因组成的转录功能单位称为操纵子。大肠杆菌染色体基因组中已发现260多个基因具有操纵子结构。③细菌基因组中的结构基因序列是连续不断的,没有内含子成分,因此转录后不需要剪切加工。第94页/共158页④细菌的DNA绝大部分是编码蛋白质的,只有一小部分是非编码区,其中也包含一些基因表达调控的DNA序列。这也是所有原核生物的共同特点。⑤细菌的结构基因不重叠,即DNA序列不编码两种蛋白质肽链。但也有前一个基因的终止密码子与后一个基因的起始密码子重叠的现象。⑥细菌染色体基因组结构基因多为单拷贝,但编码rRNA的基因通常是多拷贝的,这可能有利于核糖体的快速组装,以便于急需蛋白质的快速合成。第95页/共158页大肠杆菌染色体基因组是了解得比较清楚的基因组,它的双链环状染色体DNA经过三维折叠后相对集中在一个区域形成类核,共有4.6×106bp,约含有3500个基因,一个基因的长度一般为1500bp,已定位的基因有1400个。大肠杆菌染色体基因组中已鉴定的基因多是一些编码酶的基因,以及编码核糖体蛋白质的基因。已发现大肠杆菌中有260多个结构基因具有操纵子结构。大肠杆菌基因组中几乎所有的结构基因都是单拷贝基因,而且非编码序列很少。第96页/共158页1.2质粒细菌除了含有较大的染色体DNA外,许多细菌细胞质中还含有一个或多个小的环状DNA分子,这些染色体之外的遗传物质称为质粒。许多质粒只有几千个bp,但也有一些质粒达105bp以上。质粒有自己的复制和调控系统,可以自我复制它携带的遗传信息,通过复制产生子代质粒,在细胞分裂时进入子代细胞。质粒广泛存在于细菌细胞内,已知50多个属的细菌中都有质粒存在。在酵母和其他真菌中也发现有质粒。第97页/共158页质粒上带有很多基因,可以控制很多重要的生物学性状,如控制有性生殖的基因(F质粒);编码控制产生毒素的基因(致病性大肠杆菌定居和产生毒素是由不同的质粒编码的);细菌对抗生素、重金属和其他抑制物产生抗性的基因(R质粒),例如携带β-内酰胺酶的质粒可使宿主菌对β-内酰胺类抗生素(如青霉素和氨苄青霉素)产生耐受性。第98页/共158页质粒可以由一个细菌转移到另一个细菌,它可以在同种、同属的细菌内转移,也可以在不同种属的细菌间转移。质粒转移时携带的遗传性状也随之转移。例如质粒可以从抗生素耐受菌转入对抗生素敏感的同种或异种细菌,使后者变为耐药菌。某些质粒还能与染色体整合,在这种情况下其复制要受染色体的控制。第99页/共158页质粒并不是细菌生命活动所必需的,但质粒编码的性状大多数对细菌有利,起保护作用。所以有人认为质粒的作用是补充细菌基因的不足,使细菌获得有利其生存的特性。质粒是相当小的DNA分子,可以比较容易地从细菌和酵母细菌中完整地提取出来。质粒是研究DNA代谢的有用模型,它已成为分离和克隆基因的有用工具。将来自不同种属的基因插入到分离的质粒中,再把经过修饰的质粒重新导入到正常的宿主细胞,这样的质粒可以复制并表达,从而使宿主细胞产生由外源基因编码的蛋白质。第100页/共158页1.3病毒基因组病毒是不能单独繁殖的生物体,它只能在宿主细胞内进行基因组的复制。完整的病毒颗粒是由核酸和蛋白质组成的。核心是核酸,构成病毒的基因组,为病毒的增殖、遗传和变异提供遗传信息。核酸外面包有蛋白质外壳,以保护核酸不受核酸酶和其它破坏性因素的影响,并能帮助核酸侵入宿主细胞。噬菌体也是病毒,它是专门侵袭细菌、真菌等微生物的病毒。第101页/共158页病毒基因组的共同特点如下:①病毒基因可以由DNA组成,也可以由RNA组成。组成病毒基因组的DNA和RNA可以是双链的,也可以是单链的,可以是环状分子,也可以是线状分子。例如,乳头瘤病毒、乙型肝炎病毒的基因组是双链环状DNA;腺病毒、疱疹病毒的基因组是双链线状DNA;脊髓灰质炎病毒基因组是单链的RNA;呼肠孤病毒的基因组是双链RNA。一般说来,大多数DNA病毒的基因组是双链DNA分子,而大多数RNA病毒的基因组是单链RNA分子。第102页/共158页②病毒与细菌或真核生物相比,基因组很小,所含遗传信息也相应地少,因为它们主要依赖宿主细胞的许多功能来进行复制。RNA病毒常含有特别小的基因组,而DNA病毒基因组的大小差别很大,如乙型肝炎病毒只有3200bp,只能编码4种蛋白质,而痘病毒基因组有300kb,可以编码几百种蛋白质。第103页/共158页③病毒基因组有重叠基因,即一段DNA片段可以编码2~3种蛋白质分子(这种现象也见于线粒体和质粒DNA)。这种结构可使较小的基因组携带更多的遗传信息。重叠基因有完全重叠(一个基因包含在另一个基因之中)、部分重叠和只重叠一个碱基对三种情况。虽然有些基因完全重叠在一起,但由于它们的读码框架不同,因此翻译出蛋白质的氨基酸序列完全不同。第104页/共158页④噬菌体的基因是连续的,无内含子存在。但感染真核细胞的病毒基因是不连续的,有内含子存在。⑤病毒基因组的大部分序列是用来编码蛋白质的,只有一小部分不被翻译,不翻译的DNA序列包括基因之间的间隔区和基因表达的调控序列。第105页/共158页⑥病毒基因组DNA序列中功能上相关的蛋白质基因或rRNA基因常集中在基因组的一个或几个特定部位,形成一个功能单位或转录单元。如ФX174噬菌体有11个蛋白质基因,但只转录成3个mRNA。⑦除反转录病毒基因组有2个拷贝外,其他病毒基因组都是单倍体,在病毒颗粒中每个基因只有一个拷贝。第106页/共158页2.1真核生物核基因组2.1.1真核生物核基因组的一般特点①真核生物核基因组一般比较庞大,远远大于原核生物的基因组。例如人的单倍体基因组由3×109bp组成,约含有10万个基因。②真核生物核基因组DNA与蛋白质结合形成染色体,储存于细胞核内。体细胞基因组是双倍体,即有两份同源的基因组。

2.真核生物基因组第107页/共158页③真核生物核基因组中含有大量重复序列。这些重复序列的长短不等,从几个到上千个核苷酸,重复的次数也不一样,从几十次到几百万次。④绝大多数真核生物编码蛋白质的基因为断裂基因,即结构基因是不连续的,中间由不编码的插入序列隔断。编码序列称为外显子,插入序列称为内含子⑤真核生物核基因组中不编码的区域多于编码区域,基因组中只有一小部分是编码蛋白质的。如编码卵清蛋白的基因中,内含子比外显子长得多,内含子占基因总量的85%。不同生物所含内含子的数目、占基因总长度的比例和所处的位置均不相同。第108页/共158页

2.1.2真核生物核基因组中C值反常同一物种的基因组DNA含量总是恒定的。一个单倍体基因组中的全部DNA量称为该物种DNA的C值。C值是每种生物的一个特性,一般来说,随着生物的进化,生物的结构与功能越复杂,基因组DNA也应越多,其C值就越大。即C值应随着生物的复杂性的增加而增加。但在真核生物中,这种进化的复杂程度与DNA的C值的大小并不完全一致。第109页/共158页不同物种的C值差异很大,最小的支原体只有104bp,而最大的如两栖类或某些显花植物可达1011bp。酵母菌和真菌虽然都属于单细胞生物,但酵母已经进化到真核生物,它的DNA含量约为2.3×107bp,是细菌的5倍左右,真菌和高等植物同属真核生物。而高等植物的C值比真菌大得多,这是因为结构和功能越复杂,需要的基因越多,因此C值越大,这一点是不难理解的。但某些两栖类,它们的DNA含量高达1010~1011bp,比人类要高出几十倍,这显然是无法理解的。这种形态学复杂程度与C值大小不一致的现象称为C值反常(或C值矛盾或C值悖理)。

第110页/共158页同一类生物的形态结构复杂性差不多,按理说它们的C值应当比较接近,但是有些种类的生物如两栖类C值的变动范围很大,其中最小的DNA含量低于109bp,而最高者达到了1011bp,它们的C值相差数十倍乃至上百倍,C值相差如此之大的DNA究竟有哪些功能上的差异呢?第111页/共158页核基因组DNA的量远远大于编码蛋白质的量,人的单倍体基因组由3×109bp组成,如果按照平均每个基因10000bp(这实际上比已知的基因要长)估算,应该有300000个基因。但通过比较mRNA在一个细胞内的种类,估计表达的基因大约为10000个。这些基因大部分在其它细胞中也表达,如果再加上在不同细胞中表达的基因数,那么人类基因组应有30000~40000个基因,而DNA的量大约是这些基因的10倍。第112页/共158页虽然现在已经知道有些基因内的序列不编码蛋白质,如调控序列、内含子等,但基因组只有如此少量的DNA序列用于编码蛋白质,余下的那么多DNA又具有什么功能呢?虽然真核生物的表达调控系统比原核生物复杂得多,难道不被表达的DNA都是调控基因吗?根据目前的认识水平,对上述问题无法作出圆满地解释。第113页/共158页2.1.3DNA序列的类型2.1.3.1单拷贝序列2.1.3.2中度重复序列2.1.3.3高度重复序列2.1.4多基因家族2.1.4.1简单多基因家族2.1.4.2复杂多基因家族2.1.4.3发育调控的重复多基因家族第114页/共158页2.2细胞器基因组2.2.1细胞器基因组的一般特点①细胞器基因组是多拷贝的,一个细胞器中一般有几个或几十个相同的DNA分子,而每个细胞中又常含有许多线粒体或叶绿体,故细胞器中的DNA数量可能非常大,如啤酒酵母的线粒体DNA占细胞总DNA量的18%,人Hela细胞的线粒体DNA占1%。②真核生物的线粒体和叶绿体基因组中,除纤毛虫线粒体DNA为线状外,其余均为环状的DNA分子。第115页/共158页③绝大多数细胞器基因都是基因表达功能有关的(如tRNA、rRNA、RNA聚合酶的基因等),有些基因还编码细胞器功能蛋白(如与光合作用和氧化磷酸化有关的蛋白),不过细胞器中的大多数蛋白质还是由核基因编码、合成后运输进来的。④细胞器基因具有多顺反子信息,转录后具有特征性的复杂的RNA加工反应,包括切割、顺式剪接、反式剪接,RNA编辑和降解等,基因表达的调控类似于原核生物,而且转录后的调控占有重要的地位。第116页/共158页⑤细胞器基因的表达对抗生素敏感,但对核基因的抑制因子并不敏感,这个现象对于核基因和细胞器基因的分离研究很有用。⑥细胞器基因(主要指动物和酵母的线粒体基因)不符合遗传密码的通用性,经常使用歧化了的密码子。第117页/共158页2.2.2线粒体基因组线粒体基因组是极其多样化的,其大小和结构组成在不同分类群中表现出极大的不同。线粒体基因组主要编码具有基因表达功能的基因(如tRNA、rRNA、RNA聚合酶)和一些有关线粒体功能的多肽。很多线粒体蛋白质是在细胞质中合成后转运到线粒体内的。第118页/共158页酵母线粒体DNA长约80kb,是真菌中最长的。酵母线粒体基因组中共有2种rRNA、22种tRNA和大约8种mRNA,有大约25%的短序列组成的富含AT的不编码区域,有些基因(如21SrRNA、细胞色素b、细胞色素氧化酶亚基Ⅰ)中带有内含子。植物线粒体DNA的大小表现出令人难以置信的多样性,从100kb到2.5mb不等,较大的基因组中含有较高比例的重复序列。有些植物的线粒体中还存在一些重组产生的衍生物。通常将完整的基因组称为母环;而较小的衍生物叫做亚基环。母环的重复序列为重组位点。第119页/共158页哺乳动物的线粒体DNA长约16kb左右,基因安排十分紧凑,没有内含子,有些基因重叠,基因间的间隔很小,甚至没有终止密码子,只有单个控制复制和基因表达的非编码区。例如,人类线粒体DNA共有16569bp,含37个基因(13个蛋白质基因、2个rRNA基因和22个tRNA基因),基因间除DNA复制和转录的单个位点之外,间隔区只有87bp,只占DNA总长度的0.5%;在许多情况下,基因间没有间隔,前一个基因的最后一个核苷酸紧接后一个基因的第一个核苷酸;有重叠基因,大多数只重叠一个核苷酸,但个别基因间也有较大的重叠;环状DNA分子的两条链均编码基因,均可转录,各为一个转录单位。第120页/共158页2.2.3叶绿体基因组不同植物叶绿体DNA分子大小很不相同,一般高等植物叶绿体基因组在120kb~160kb之间。大多数植物叶绿体都有数万碱基对的两个反向重复序列,将DNA环状分子分隔成两个大小不同的单拷贝区。第121页/共158页叶绿体DNA一般编码4种rRNA、30种tRNA和几十种蛋白质基因。rRNA基因集中在重复序列中,按16S、23S、4.5S以及5SrRNA的顺序排列,并处在同一转录单位中,而且16S与23SrRNA基因间还有两个tRNA基因。有些植物的叶绿体中rRNA基因有2~3个拷贝。第122页/共158页tRNA基因主要分布在大单拷贝区,少数分布在重复区。叶绿体rRNA和少数tRNA基因中带有内含子。编码蛋白质的基因主要是RNA聚合酶基因、核糖体蛋白基因和光合系统的酶及蛋白基因,这些基因位于单拷贝区,大多数形成类似于原核生物操纵子的转录单位,转录产生大小不同的多顺反子mRNA,然后再从特定的加工位点加以剪切。由于很多叶绿体基因都带有内含子,所以转录后的加工也是一个很复杂的过程。第123页/共158页第124页/共158页第125页/共158页第126页/共158页第127页/共158页第128页/共158页第129页/共158页第130页/共158页第131页/共158页第132页/共158页第133页/共158页3.2.1.3DNA序列的类型真核生物核基因组中存在着许多重复序列,根据DNA序列出现的频率不同,可分为不同的类型。第134页/共158页3.2.1.3.1单拷贝序列单拷贝序列是指在基因组中只出现一次或少数几次的序列。真核生物的大多数基因在单倍体中都是单拷贝的。通常单拷贝序列在基因组中占40%~80%,例如在人类基因组中占60%~65%。大多数编码蛋白质和酶的结构基因都是单拷贝序列,所以结构基因的突变很容易造成遗传性状的改变或产生遗传性疾病。在单拷贝序列的两侧往往是散在分布的重复序列。

⇑⇑⇑第135页/共158页3.2.1.3.2中度重复序列中度重复序列在真核生物基因组中约占10~40%,平均长度是6×105bp,平均重复350次。Alu家族、KpnⅠ家族等属于该序列,有些编码基因如rRNA基因、tRNA基因、组蛋白基因待也属于谝序列。第136页/共158页①Alu家族

Alu家族是中度重复序列中研究最多的一种散在型重复序列。由于这些家族中都有限制性内切酶Alu酶切位点而得名。它约占人类基因组的3%~6%,在单倍体基因组重复30万~50万次。人类、小鼠、仓鼠等生物基因组中的Alu序列都已克隆并作了序列分析,发现它们有很高的同源性,同一种族内的同源性可达80%,不同种族间的同源性也有50%~60%,说明它们可能由同一祖先基因进化而来。第137页/共158页人类Alu序列长300bp,由2个130bp的重复序列组成,中间有31bp的间隔序列。它的5′端核苷酸序列比较保守,但3′端序列变化较大。在300bp的两侧端各有一段17~21bp的正向重复序列,类似于转位因子的顺序。Alu序列分散在人和哺乳动物基因组中,Alu作为一种短插入片段与长度约1000bp的单拷贝顺序间隔排列,散布在基因组的间隔序列和内含子中,平均每5kbDNA就有一个Alu序列。Alu序列可能在基因调控中起重要作用,如开启或关闭基因的转录、促进或终止基因的转录、参与复制的起始以及mRNA的加工等。但它的确切功能还有待进一步证实。第138页/共158页②KpnⅠ家族

KpnⅠ家族是中度重复序列中一种长分散片段,平均长度为3500~5000bp,它们与平均长度为1万至几万bp的单拷贝顺序间隔排列。这些序列中都有限制性内切酶KpnⅠ的酶切位点,因此而得名。用限制性内切酶KpnⅠ酶解人的DNA后,经琼脂糖凝胶电泳可分离得到1.2kb、1.5kb、1.8kb、1.9kb四个片段。KpnⅠ家族在基因组中的拷贝数为3000~4000个,估计占人类基因组的3%~6%,其功能还不清楚。⇑⇑⇑第139页/共158页3.2.1.3.3高度重复序列高度重复序列在基因组中的重复频率很高,重复次数可达106以上。高度重复序列一般不转录,因为这些极简单的核苷酸顺序上缺少转录所必需的启动子。第140页/共158页①卫星DNA

将基因组DNA切成数百个碱基对的小片段后,用氯化铯进行密度梯度离心时,真核生物大部分DNA形成主峰,有些高度重复的DNA由于碱基的组成(GC含量)的不同,出现小峰,小峰在主峰的旁边似卫星而得名。卫星DNA是不编码蛋白质或RNA的,它在染色体上的位置可用原位杂交方法进行鉴定,大部分高度重复的DNA在真核细胞染色体的两个重要结构——着丝粒和端粒处。第141页/共158页每个染色体只有一个着丝粒,它是蛋白质的附着点,这些蛋白质把染色体和有丝分裂纺锤体的微管连接起来,对细胞分裂时使染色体有序地分配到子代细胞中非常重要。在高等真核生物中,卫星DNA一般存在于着丝粒区,由一种或几种数以千计的短序列拷贝串联而成。典型的卫星序列为5~10bp。卫星DNA在着丝粒中的的确切功能还不清楚。人类染色体的着丝粒区有一类卫星DNA,它的最小重复单位是171bp,在着丝粒区串联高度重复排列。它既有染色体特异性,又具有染色体间的同源性,在人群中还具有高度的多态性第142页/共158页端粒是染色体的物理末端。人的端粒是由串联的TTAGGG重复序列组成。端粒对染色体起保护作用,防止染色体重排、断裂等。端粒的长度随细胞分裂的不断进行而缩短,它决定着细胞的寿命,故称这为有丝分裂的生物钟。卫星DNA的功能尚不明确,一般认为与染色体折叠压缩和染色体的配对分离有关,将卫星DNA制成探针可用于分析染色体结构和演化,亲子鉴定,遗传性疾病的诊断等。第143页/共158页在基因组的间隔序列和内含子等非编码区内,广泛存在着另一类1~6bp的短小重复单位,称为微卫星DNA(microsatelliteDNA),如GACA、GATA、TCC、CT、CA等。微卫星DNA又称简单重复序列,它在人类基因组中出现的数目和频率不同,在基因组中分布广泛而表现出多态性。因此这些分散排列的简单重复序列是进行限制性片段长度多态性(RFLP)分析方便而有效的遗传标记,可在基因连

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论