




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、引言基因组结构与功能
基因组是指细胞内携带遗传信息的DNA的总体。基因组中不同的区域具有不同的功能,有些是编码蛋白质的结构基因,有些是复制及转录的调控信号,有些区域的功能尚不清楚。
基因组结构是指不同功能区域在整个DNA分子中的分布情况。
不同的生物体,其基因组的大小和复杂程度各不相同,进化程度越高的生物体其基因组越复杂。本章主要介绍病毒、细菌及真核细胞染色体基因组结构和功能。另外,对质粒和线粒体DNA的结构和功能也分别作一介绍。不同生物体中DNA的大小生物种类千碱基对/
染色体长度
(cm)染色体数
(单倍体)形状病毒SV405.20.000171环状噬菌体φX1745.40.000181线状单链噬菌体λ460.00151线状细菌大肠杆菌40000.131环状酵母10000.03317
果蝇410001.44
人1250004.123
二、病毒基因组的结构和功能
病毒是最简单的原核生物,完整的病毒颗粒包括外壳蛋白和内部的基因组DNA或RNA,有些病毒的外壳蛋白外面有一层由宿主细胞构成的被膜(envelope),被膜含有病毒基因编码的糖蛋白。TMV烟草花叶病毒TYMV番茄黄化花叶病毒Phage噬菌体二、病毒基因组的结构和功能
病毒不能独立地复制,必需进入宿主细胞中借助细胞内的一些酶类和细胞器才能使病毒得以复制。外壳蛋白(或被膜)的功能是识别和侵袭特定的宿主细胞并保护病毒基因组不受核酸酶的破坏。1.病毒基因组的结构特点1)与细菌或真核细胞相比,病毒的基因组很小,且不同的病毒之间基因组大小相差甚大。
如:乙肝病毒DNA只有3kb大小,所含信息量也较小,只能编码4种蛋白质;痘病毒的基因组有300kb之大,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚至为核苷酸代谢的酶类编码,因此,痘病毒对宿主的依赖性较乙肝病毒小得多。2)病毒基因组可以由DNA或RNA组成,每种病毒颗粒中只含有一种核酸,DNA或RNA,两者一般不共存于同一病毒颗粒中。病毒基因组的DNA和RNA可以是单链,也可以是双链;可以是闭环分子,也可以是线性分子。如:乳头瘤病毒是一种闭环的双链DNA病毒,腺病毒的基因组则是线性的双链DNA,脊髓灰质炎病毒是一种单链的RNA病毒,呼肠孤病毒的基因组是双链的RNA分子。大多数DNA病毒的基因组是双链DNA分子,而大多数RNA病毒的基因组是单链RNA分子。3)多数RNA病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组RNA由不连续的几条核酸链组成。
如:流感病毒的基因组RNA分子是节段性的,由八条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息;呼肠孤病毒的基因组由双链的节段性的RNA分子构成,共有10个双链RNA片段,同样每段RNA分子都编码一种蛋白质。目前,还没有发现有节段性的DNA分子构成的病毒基因组。4)基因重叠即同一段DNA片段能够编码两种甚至三种蛋白质分子。
重叠基因是1977年Sanger在研究ΦX174噬菌体时发现的。ΦX174是一种单链DNA病毒,宿主为大肠杆菌。它感染大肠杆菌后共合成11个蛋白质分子,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。而该病毒DNA本身只有5375个核苷酸,最多能编码总分子量为20万的蛋白质分子。这种结构使较小的基因组能够携带较多的遗传信息。
线粒体和质粒DNA中也有重叠基因现象。
重叠基因有以下几种情况:(1)一个基因完全在另一个基因里面。如基因A和B是两个不同基因,而B包含在基因A内。同样,基因E在基因D内。
重叠基因有以下几种情况:(2)部分重叠。基因K和基因A及C的一部分重叠。(3)两个基因只有一个碱基重叠。如基因D的终止密码子的最后一个碱基是J基因起始密码子的第一个碱基(如TAATG)。
这些重叠基因尽管它们的DNA大部分相同,但是由于将mRNA翻译成蛋白质时的阅读框不一样,产生的蛋白质分子往往并不相同。
有些重叠基因阅读框相同,只是起始部位不同,如SV40DNA基因组中,编码三个外壳蛋白VP1、VP2、VP3基因之间有122个碱基的重叠,但密码子的阅读框不一样。而小t抗原完全在大T抗原基因里面,它们有共同的起始密码子。5)病毒基因组的大部分是用来编码蛋白质的,只有非常小的部分不被翻译。如:在ΦX174中不翻译的部份只占217/5375,G4DNA中占282/5577,都不到5%。不翻译的DNA顺序通常是基因表达的控制序列。如ΦX174的H基因和A基因之间的序列(3906-3973),共67个碱基,包括RNA聚合酶结合位,转录的终止信号及核糖体结合位点等基因表达的控制区。乳头瘤病毒是一类感染人和动物的病毒,基因组约8.0Kb,其中不翻译的部份约为1.0kb,该区同样也是其他基因表达的调控区。6)病毒基因组DNA中功能上相关的蛋白基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录为多顺反子mRNA(polycistroniemRNA),然后再加工成各种蛋白质的模板mRNA。如:腺病毒晚期基因编码的12种功能相关的外壳蛋白,转录时是在一个启动子的作用下生成多顺反子mRNA,然后再加工成各种mRNA,编码病毒的各种外壳蛋白;ΦX174基因组中的D-E-J-F-G-H基因也转录在同一mRNA中,然后再翻译成各种蛋白质,其中J、F、G及H都是编码外壳蛋白的,D蛋白与病毒的装配有关,E蛋白负责细菌的裂解,它们在功能上也是相关的。7)除了反转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。反转录病毒基因组有两个拷贝。8)噬菌体(细菌病毒)的基因是连续的;除了正链RNA病毒之外,真核细胞病毒的基因含有内含子。
有些真核病毒的内含子或其中的一部分,对某一个基因来说是内含子,而对另一个基因却是外显子。
如:SV40和多瘤病毒(polyomavirus)的早期基因就是这样。SV40的早期基因即大T和小t抗原的基因都是从5146开始反时针方向进行,大T抗原基因到2676位终止,而小t抗原到4624位即终止了,但是,从4900到4555之间一段346bp的片段是大T抗原基因的内含子,而该内含子中从4900-4624之间的DNA序列则是小t抗原的编码基因。同样,在多瘤病毒中,大T抗原基因中的内含子则是中T和t抗原的编码基因。
目前研究最清楚的大肠杆菌RNA噬菌体是MS2,R17,f2和Qβ。它们的基因组小,只有3600到4200个核苷酸,包含四个基因。
MS2.R17和f2具有几乎一样的基因组结构。2.RNA噬菌体的基因组结构和功能RNA噬菌体的基因组结构和功能在4个基因中有2个基因编码噬菌体的结构蛋白:A蛋白基因:长1178个核苷酸。A蛋白(称为成熟蛋白)的功能是使噬菌体能识别宿主,并使其RNA基因组能进入宿主菌,每个噬菌体一般只存在一个分子的A蛋白。另一个结构蛋白基因长399个核苷酸,编码外壳蛋白以构成病毒颗粒,每个噬菌体有180个分子。基因组的其他部分编码RNA复制酶和一个溶解蛋白,编码溶解蛋白的基因与外壳蛋白和复制酶的基因有部分重叠,但阅读框与外壳蛋白的阅读框不一样。
在MS2、R17、f2基因组内有许多二级结构,RNA分子内碱基的自我配对,可能对防止RNase降解有一定的作用。另外,在编码基因的5'和3'端各有一段非翻译序列,该序列对稳定RNA分子也有一定作用。
另一种RNA噬菌体Qβ的基因组略大,与上述RNA噬菌体的基因组有以下不同;[1]没有独立的溶解蛋白基因,但结构蛋白A2(或称成熟蛋白,MaturaitonProtein)即具有溶解蛋白的功能,[2]还编码另一种外壳蛋白A1。
细菌和病毒一样同属原核生物,因而细菌基因组的结构特点在许多方面与病毒的基因组特点相似,而在另一些方面又有其独特的结构和功能。本节首先介绍细菌染色体基因组的一般结构特点,然后再具体介绍大肠杆菌染色体基因组的结构和功能。
三、细菌基因组的结构和功能
(1)细菌的染色体基因组通常仅由一条环状双链DNA分子组成,细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。1.细菌染色体基因组结构的一般特点
类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。
染色体DNA通常与细胞膜相连,连接点的数量随细菌生长状况和不同的生活周期而异。在DNA链上与DNA复制、转录有关的信号区域与细胞膜优先结合,如大肠杆菌染色体DNA的复制起点(OriC)、复制终点(TerC)等。细胞膜在这里的作用可能是对染色体起固定作用,另外,在细胞分裂时将复制后的染色体均匀地分配到两个子代细菌中去。有关类核结构的详细情况目前尚不清楚。(2)具有操纵子结构,其中功能相关的结构基因串联在一起构成多顺反子,受同一个调节区的调节。数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控。(3)在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝,但编码rRNA的基因往往是多拷贝的,这可能有利于核糖体的快速组装,便于在急需蛋白质合成时,在短时间内有大量核糖体生成。(4)和病毒的基因组相似,不编码的DNA部分所占比例比真核细胞基因组少得多。(5)具有编码同工酶的同基因(isogene)。例如,在大肠杆菌基因组中有两个编码分支酸(chorismicacid)变位酶的基因,两个编码乙酰乳酸(acetolactate)合成酶的基因。(6)和病毒基因组不同的是,在细菌基因组中编码顺序一般不会重叠,即不会出现基因重叠现。(7)在DNA分子中具有各种功能的识别区域如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。这些区域往往具有特殊的顺序,并且含有反向重复顺序。(8)在基因或操纵子的终末往往具有特殊的终止顺序,它可使转录终止和RNA聚合酶从DNA链上脱落。例如大肠杆菌色氨酸操纵子后尾含有40bp的GC丰富区,其后紧跟AT丰富区,这就是转录终止子的结构。
终止子有强、弱之分,强终止子含有反向重复顺序,可形成茎环结构,其后面为polyT结构,这样的终止子无需终止蛋白参与即可以使转录终止。而弱终止子尽管也有反向重复序列,但无polyT结构,需要有终止蛋白参与才能使转录终止。
E.coli染色体基因组是研究最清楚的基因组。估计含有3500个基因,已被定位的900个基因中有260个已查明具有操纵子结构,定位于75个操纵子中。在已知的基因中8%的序列具有调控作用。2.大肠杆菌染色体基因组的结构和功能
E.coli染色体基因组中已知的基因多是编码一些酶类的基因,如氨基酸、嘌呤、嘧啶、脂肪酸和维生素合成代谢的一些酶类的基因,以及大多数碳、氮化合物分解代谢的酶类的基因。另外,核糖体的50多种蛋白质的基因也已经鉴定了。
除了有些具有相关功能的基因在一个操纵子内由一个启动子转录外,大多数基因的相对位置可以说是随机分布的。如:控制小分子合成和分解代谢的基因,大分子合成和组装的基因分布在大肠杆菌基因组的许多部位,而不是集中在一起。再如,有关糖酵解的酶类的基因分布在染色体基因组的各个部位。
E.coli和与其分类关系上相近的其他肠道菌如志贺氏杆菌属(Shigella)、沙门氏菌属(Salmonella)等具有相似的基因组结构。伤寒沙门氏杆菌(Salmonellatyphimurium)几乎与E.coli的基因组结构相同,虽然有10%的基因组序列和E.coli相比发生颠倒,但是其基因的功能仍正常。这更进一步说明染色体上的基因似乎没有固定的格局,相对位置的改变不会影响其功能。
在已知转录方向的50个操纵子中,27个操纵子按顺时针方向转录,23个操纵子按反时针方向转录,即DNA两条链作为模板指导mRNA合成的机率差不多相等。
在E.coli染色体基因组中,差不多所有的基因都是单拷贝基因,因为多拷贝基因在同一条染色体上很不稳定,极易通过同源重组的方式丢失重复的基因序列。
另外,由于E.coli细胞分裂快,20min内完成1次分裂,因此,携带多拷贝基因的E.coli并不比单拷贝基因的E.coli更为有利;相反,由于多拷贝基因的存在,使E.coli的整个基因组增大,复制时间延长,因而更为不利。
除非在某种环境下,需要有多拷贝基因用来编码大量的基因产物,例如,在有极少量乳糖或乳糖衍生物的培养基上,乳糖操纵子的多拷贝化可以使E.coli充分利用的乳糖。但是,一旦这种选择压力消失,如将E.coli移到有丰富的乳糖培养基上,多拷贝的乳糖操纵子便没有存在的必要,相反,由于需要较长的复制时间,这种重复的多拷贝基因会重新丢失。
E.coli染色体基因组中,大多数rRNA基因集中于基因组的复制起点oriC的位置附近。这种位置有利于rRNA基因在早期复制后马上作为模板进行rRNA的合成以便进行核糖体组装和蛋白质的合成。从这一点上看,E.coli基因组上的各个基因的位置与其功能的重要性可能有一定的联系。
线粒体是真核细胞内重要的细胞器,能量生成的场所,还参与脂肪酸的合成及某些蛋白质的合成。多年来的研究发现线粒体有其自己的一套遗传控制系统,同时也受到细胞染色体DNA的控制。下面阐述线粒体DNA的结构特点和功能,以及线粒体DNA遗传学上的特点。
四、线粒体DNA的结构和功能mtDNA与质粒DNA一样,也是双链的超螺旋环状分子(原生动物草履虫及四膜虫的mtDNA是双链线性分子)。1.线粒体DNA(mtDNA)的性质mtDNA的MW多在1×106-2×108之间,动物mtDNA约为10×106,植物的mtDNA约为70-200×106。mtDNA复制属于半保留复制,可以是θ型或滚环复制,或者D环复制,即二条DNA链不同时开始复制,而是一条在前,一条在后,因而在复制中生成D环。
线粒体基因组含有自己的基因,呼吸链中的某些蛋白质或酶的编码基因就在mtDNA上。线粒体还能独立合成一些蛋白质,因为线粒体有自己的rRNA,tRNA,核糖体等。2.线粒体基因组
已知线粒体的基因组至少含有如下基因:tRNA基因:在啤酒酵母mtDNA中有24个tRNA基因,粗链孢霉菌的mtDNA中有40个tRNA基因,而人类mtDNA中有22个tRNA基因。rRNA基因:在人类mtDNA中有一个拷贝的16S及12SrRNA基因。细胞色素氧化酶基因:细胞色素氧化酶有七个亚基,其中三个亚基mtDNA编码,四个亚基由细胞核DNA编码。ATP酶基因:ATP酶分子量为340KD,含有十个亚基,其中四个由mtDNA编码。细胞色素还原酶(b,c复合物)基因:此酶有七个亚基,其中一个由mtDNA编码。另外,还有一些抗药性基因也在mtDNA上。哺乳动物mtDNA的利用率较高(与酵母mtDNA相比较)mtDNA整个基因组上基因之间无间隔区(spacer),基因中亦无内含子,甚至有基因重叠现象。(与DNA复制起始有关的D环,D-loop除外)另外,人mtDNA只有1个启动子位于不编码的D环上,转录从此开始,顺时针合成一条多基因的RNA分子。这条前体RNA分子含有rRNA、tRNA和各种蛋白质的编码顺序。tRNA分散在rRNA和编码蛋白质的顺序之间。据认为,这些tRNA序列可作为核酸酶切割RNA前体的识别信息,使其在tRNA两端把RNA前体切开。这样,附近的tRNA、rRNA和mRNA即自然分开,经进一步加工成为成熟的rRNA、tRNA和mRNA分子。mRNA上的polyA尾是在其前体与tRNA分开时加上去的。mRNA上的密码和tRNA上的反密码是对应的。已知20种氨基酸有61种对应的密码子,按照摆动学说(wobblehypothesis),最少需要32种tRNA才能完全识别mRNA中的61个密码子。3.线粒体的密码系统但在线粒体中,tRNA的种类显然小于此数(如人的mt-tRNA只有22种),而且,已有实验证明,无细胞质tRNA进入线粒体参与其蛋白质的过程。这些事实表明在线粒体基因表达过程中的密码系统与通用的密码系统不一样。
哺乳动物mtDNA遗传密码与通用遗传密码的区别:1).UGA不是终止信号,而是Trp的密码。因此,线粒体tRNAtrp可以识别UGG和UGA。2).多肽内部的Met由AUG和AUA两个密码子编码;而起始Met由AUG,AUA,AUU和AUC四个密码子编码。3).AGA,AGG不是Arg的密码子,而是终止密码子,因而,在线粒体密码系统中的4个终止密码子(UAA,UAG,AGA,AGG)。在线粒体的tRNA的反密码子方面,也有其独特的地方。
由于密码子简并性(degeneracy),若密码子前两位碱基一样,则3'位的碱基无论是嘌呤或嘧啶,这样组成的密码子都编码同一样氨基酸。对于这样的密码子,mt-tRNA的反密码子5'摆动位上的核苷酸如果为U,则可以与上述密码子3'位的4种核苷酸配对,因而,一个tRNA可以识别4种密码子。但是,如果3'位由嘌呤碱基组成的密码子与由嘧啶碱基组成的密码子编码不同的氨基酸时,mt-tRNA反密码子上5'位的U经过修饰识别3'位由嘌呤碱基组成的密码子,而不再识别3'位由嘧啶碱基组成的密码子,这样,便可以防止错误翻译的发生。mt-tRNA在结构上与细胞质tRNA也有区别:如GTφCRA(R代表嘌呤)序列在大多数mt-tRNA中不存在。D环和TφC环中一些保守的核苷酸也发生了变化。最突出的是tRNASer的结构,该tRNA缺乏D臂。这些结构上的差异表明mt-tRNA三维结构以及与mt核糖体的作用方式与细胞质tRNA不一样。线粒体具有DNA,还有自己的蛋白质合成系统。并且与细胞质的不同,而与细菌的比较相似。4.线粒体DNA的双重遗传控制线粒体具有自己的DNA聚合酶和RNA聚合酶。mtRNA聚合酶只是一条简单的多肽链,而且对原核细胞转录抑制剂利福平敏感。线粒体核糖体上的蛋白质合成也受细菌蛋白质合成抑制剂如氯霉素,链霉素的抑制。以上情况说明线粒体的许多组份是自主的,不受细胞核的控制,而且在许多方面与原核生物相似。另一方面,线粒体又是受双重遗传控制的,如参与呼吸链的一些酶,其部分亚基为细胞核基因所编码,部分则是mtDNA编码的。根据线粒体的这些特点Margulis提出了线粒形成的内共生学说(endosymbio-nttheory)。在进化过程中原始的厌气细菌吞噬了原核生物(如细菌,蓝绿澡等)形成共生关系。寄主为共生者提供营养和保护,共生者为寄主提供能量生成系统。最终,共生者演化成细胞的组成成份──线粒体。五、真核细胞核染色体的结构1.染色体研究的历史背景
一个多世纪前,Mendel在历时八年完成的豌豆杂交试验基础上总结出的二个著名遗传学定律—分离定律和独立分配定律中,就已经提出了基因的概念。Mendel规律的基本设想是:每一植株的各种相对性状都来源两个相同的“遗传因子”(geneticfactor),它们有显性和隐性之分。这里的“遗传因子”就是基因的最早用语,其含义是指决定遗传性状的基本遗传单位。
遗传学上这一伟大的发现,由于当时没有任何支持它的物质证据,于1865年发表后,几乎没引起注意。直到35年后的1900年,另外三位植物学家(Correns,deVries和Tschermak)再次独立证明Mendel规律的正确性后,这一著名规律才被重新发现。
在19世纪的最后二十多年里,生物学家在细胞遗传学领域取得了重要进展,染色体的发现就是成果之一。染色体存在于细胞核中,经适当染色后可见的由细丝状颗粒物质所组成,一般在细胞分裂时才能看到。在不同物种的细胞中,它们的数目不一样,但总是以二条成对的同源(homologous)染色体的形式存在,且数目恒定。如人体细胞染色体总数为46条,分为23对(其中22对为常染色体,1对为性染色体)。
在分裂期间,染色体对的每一成员可自身复制成含2个拷贝的姐妹染色体(sisterchromatid)。
通过观察染色体在细胞分裂中的行为变化全过程发现:
体细胞增殖时,以有丝分裂(mitosis)的方式,使姐妹染色体一分为二进入子代细胞,保证了染色体数目的恒定;
生殖细胞则通过减数分裂(meiosis)使同源染色体分别进入新的子代细胞而产生。生殖细胞─配子(精子或卵子)只含有体细胞一半的染色体数,配子结合成合子后又恢复到体细胞的染色体数,这样,合子及其后代细胞的染色体数对中的成员,一个来自父本,一个来自母本。
这些观察结果认为染色体是遗传的物质基础的观点在19世纪末被广泛接受。
比较染色体在细胞分裂中的行为与Mendel规律可以发现,染色体与“遗传因子”极其相似:首先,二者均成对存在,且其中的每个成员分别来自父、母亲代;其次,产生配子时,配子只含“遗传因子”(等位基因)中的一个,或染色体对中的一条;另外,非等位基因及非同源染色体均可自由组合到配子中。1902-03年Sutton和Boveri提出了染色体遗传学(theoryofchromosomalinheritance),认为染色体是“遗传因子”的携带者。1905年,Johannsen首先使用“基因”代替“遗传因子”,并提出了基因型(gentoype)和表型(phenotype)的概念。1909年起,Morgan等以果蝇为材料研究生物遗传规律,观察到一种白眼突变体与性染色体的联系,1910年首先提出基因定位于染色体上的论点。此后二年中,又发现了多个伴性基因,并以此为据总结出了遗传学上著名的基因连锁(linkage)和交换(crossing-over)规律。他们还通过测定连锁的回交试验,证实了基因在染色体上呈线性排列。所谓连锁是指控制不同性状的基因位于同一条染色体上,相互紧密排列在一起。如果连锁是不完全的(即基因间排列不够紧密),连锁基因仍有可能自由分配,但它们在减数分裂阶段的同源染色体交换片段时,被分离的机会明显减少。Morgan的基因连锁和交换的测定方法还用来确定不同基因在染色体上的位置,由此而产生了遗传学上最早的基因定位线性遗传图。
在20世纪上叶,虽然已明确了基因与染色体的关系,并且1944年Avery明确了DNA是遗传物质,但人们对基因的认识也仅知道它是遗传的基本单位。对于基因是怎样通过控制表型来实现其功能的尚不清楚。1945年Beedle和Ephrussi最早提出基因作用原理,即“一个基因一种酶”的假说。这一假说建立在所发现的代谢途径中某种酶的缺失是由于某种基因突变所致的事实上。换言之,一种代谢酶的生成由其相应的一个基因所控制,酶所催化的生化反应就是基因功能的表现形式。后来,这一假说在许多蛋白质中得到了验证,并被修正为“一个基因一条多肽链”的学说。DNA双螺旋结构提出以后,基因结构及功能的研究进入了一个新的阶段。现代分子生物学技术不仅使染色体的基因定位及物理图谱制作变得轻而易举,而且能详尽的知道定位于染色体DNA上的基因核苷酸顺序。若将人的所有染色体(双倍体细胞)相连并充分伸展的话,其长度可达2米左右。如此巨大的DNA链要全部贮存在小小的细胞核染色体中,必然存在着适宜的包装形式。此外,染色体中还含有大量的蛋白质和有限的RNA,它们与DNA共同构成十分紧密的复杂结构。这种结构不仅能满足贮存DNA的数量要求,而且还应该有利于其功能的实现。那么,染色体DNA是如何包装的?它是否也存在着有规律的基本结构?它在基因功能表达中起何作用?直到1974年Kornberg发现核小体(nucleosomes)是所有真核生物染色体的基本结构单位后,这一领域的研究才进入一个新的水平。DNA:是染色体的主要化学成分,也是遗传信息的载体。2.染色体的化学组成
RNA:RNA含量很少,还不到DNA量的10%。蛋白质:蛋白质含量约为DNA的2倍,根据组成蛋白质的氨基酸特点分为组蛋白和非组蛋白两类。组蛋白(histones)是碱性蛋白质,其特点是富含二种碱性氨基酸(Lys和Arg),根据这两种氨基酸在蛋白质分子中的相对比例又将组蛋白分为五种小类型。所有真核生物染色体中均含有这五种组蛋白。染色体中的五种蛋白组蛋白类别碱性氨基酸%Lys,Arg酸性氨基酸%碱/酸氨基酸残基数分子量(dallton)H1极富Lys29155.421523000H2A
稍富Lys119151.412913960H2B稍富Lys166131.712513774H3
富Arg1013131.813515342H4富Arg1114102.510211282真核生物染色体中组蛋白的含量与DNA含量之比约为1:1。组蛋白中也含有较多的酸性氨基酸,但其含量均低于碱性氨基酸,碱/酸比在1.4-2.5之间。组蛋白的等电点在7.5-10.5之间,这些强极性氨基酸使蛋白质带上大量电荷,成为组蛋白与DNA结合及蛋白质之间的相互作用的主要化学力之一。五种组蛋白的氨基酸顺序均已确定。在各种物种,H3和H4的序列极少有差异,这种生物进行上的高度保守性预示着其功能的重要性。其它三种组蛋白在不同种属之间存在着较大的差异。组蛋白对染色体中DNA的包装有十分重要的作用。非组蛋白(non-histoneprotein,NHP)是指染色体中组蛋白以外的其它蛋白质,它是一大类种类繁杂的各种蛋白质的总称。估计总数在300-600之间,分子量范围为7000-80000D,等电点为3.9-9.2。对于其中许多单个成分的结构和功能,目前还了解甚少。已经知道,一些非组蛋白与基因表达及染色体高级结构的维持有关。已知的非组蛋白:参与基因复制、转录及核酸修饰的酶类(如各种DNA和RNA聚合酶等)。HMG蛋白质:一类高迁移率组(highmobilitygroup),此类蛋白质因在凝胶电泳上泳动速度快而得名。已经明确其中的一些蛋白质(如HMG14和HMG17)在转录活性区含量丰富,可以认为是参与转录调控的蛋白质。核基质蛋白:对于维持染色体的高级结构是必不可少的。(1)核小体的发现:通过电子显微镜观察破裂的间期细胞流出的染色质,可以看到染色质纤维呈非连续性颗粒状小珠,这些小珠状颗粒被称之为核小体。3.核小体的结构用小球菌核酸酶(micrococcalnuclease)处理提取的染色质,可以得到单个的核小体颗粒。在一定酶切条件下,颗粒中所包含的DNA长度总是稳定在200bp左右。DNA片段大小通过凝胶电泳很容易鉴定出来。以密度梯度离心法制备核小体单体,分析蛋白质组成得知:每1个单体含有H2A、H2B、H3和H4各二分子(构成八聚体),H1一分子。相邻多聚体之间的DNA长度等于核小体单体中的DNA长度(200bp左右),且多聚体分子量总是单体分子量的整倍数。(1)核小体的发现核小体是染色体的基本结构单位。核小体重复单位是在所有真核生物中具有普遍意义的染色体基本结构,不同生物(或同种生物的不同细胞)的核小体,其DNA片段长度的有所差别,一种细胞通常有特定的平均值,一般为180--200bp。每一核小体所含的DNA与组蛋白的量大致相等。核小体由核心颗粒(coreparticie)和连接区DNA(linkerDNA)二部分组成。(2)核小体的结构核心颗粒由146bp的DNA片段和H2A、H2B、H3和H4各二分子组成。用小球菌核酸酶处理核小体单体后,随着时间延长,其降解产物(DNA片段)会逐渐缩短,从200bp降至146bp变为很难进一步降解的稳定状态。连接区DNA为核心颗粒外"裸露"的DNA,长度为60bp左右。连接区DNA的长度在不同物种差异较大,其范围在10--140bp。H1位于连接区DNA与核心颗粒的毗邻区。H1总是随着核心颗粒的形成而消失,通常是在DNA被降解至160bp以后,提取物中H1丢失。DNA盘绕在组蛋白八聚体的周围,呈很有规律的螺旋状。虽然DNA双链分子位于核心颗粒的外围,但DNA与组蛋白八聚体的这种相互作用,对保护DNA链免受细胞核中核酸酶的消化十分重要。核小体的结构:染色质中的DNA双螺旋链,等距离缠绕组蛋白八聚体形成众多核心颗粒,各颗粒之间为带有H1组蛋白的连接区DNA。这种组成染色质的重复结构单位就是核小体。[1]核心颗粒外观呈椭圆形,轴比为0.5,颗粒直径11nm,高5.5nm。绕颗粒的DNA长度为50nm(146bp),连接区DNA长度为20nm(约60bp)。[2](H2A.H2B.H3.H4)2构成的八聚体位于颗粒中央,外绕1.75圈左走向的DNA链,每圈约85bpDNA,螺旋间距为2.8nm。组蛋白主要为α-螺旋,处于DNA双螺旋的大沟中。靠静电引力与DNA保持稳定结合。由于空间构象的关系,缠绕在蛋白八聚体上的DNA链并非所有部分都与组蛋白结合。[3]相邻核心颗粒由连接区DNA连接,其伸展长度约20nm,据认为天然状况下由于核小体是紧挨着的,此一空间距离可能并不存在。H1组蛋白结合在靠核心颗粒的连接区DNA上。
染色体的包装实际上是指细胞核DNA在双螺旋基础上的经多层次的进一步结构变化,需结构变化才能实现。这些结构变化总的看是更高层次的超螺旋形成。(3)染色体的包装─超螺旋结构核小体可视为染色体DNA的一级包装,即由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体结构。若以每碱基对沿螺旋中轴上升距离为0.34nm计,200bpDNA的伸展长度为68nm,形成核小体后仅为10nm(直径),其长度压缩了6-7倍。
螺线管纤维是二级包装结构模型。在高离子强度和H1存在下,10nm核小体纤维会盘绕形成外径为30nm的中空螺线管,每圈含6个核小体,即染色体DNA的二级包装。因此,螺线管的形成使DNA一级包装又压缩小6倍。故染色体的二级包装相当于将DNA长度压缩了近40倍。H1组蛋白在维持毗邻核小体的紧密度及核小体纤维折转形成螺线管中起了重要作用。DNA双链螺旋经三级包装环状螺线管的过程环状螺线管是在螺线管纤维基础上的更高一级包装。这种结构是30nm纤维缠绕在一个由某些非组蛋白构成的中心轴骨架上形成的。这显然使螺线管纤维得到了较大程度的压缩。经三级包装完成后,DNA链被压缩的程度仍远不足以形成能被细胞核容纳的染色体。具环形区的螺线管纤维需进一步以某种方式盘绕、折叠,最终完成细胞生长和繁殖的不同时期的染色体包装。从螺线管纤维环到包装形成染色体,应该是DNA压缩程度最高的阶段,估计在200-240倍。经各级包装后染色体DNA总共被压缩了数千倍,这样,才能使每个染色体中几厘米长(如人染色体的DNA分子平均长度为4cm)的DNA分子容纳在直径数微米(如人细胞核的直径为6-7μm)的细胞核中。
真核生物基因组一般比较庞大,如人的基因组由3×109bp组成,按1000个碱基编码一种蛋白质计,理论上可有300万个基因,但实际基因总数不会超过4万个。这说明在人细胞基因组中有许多DNA序列并不转录成mRNA。六、真核生物染色体基因组的结构和功能
DNA的复性动力学研究发现这些非编码区往往都是一些重复序列,这些重复序列或集中成簇,或分散在基因之间。在基因内部也有许多能转录但不翻译的内含子。因此,在人细胞的整个基因组当中只有很少一部份的DNA序列用以编码蛋白质。
真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的,即有两份同源的基因组。1.真核生物基因组特点
2)真核基因转录产物为单顺反子。1个结构基因转录和翻译生成1个mRNA分子和1条多肽链。3)存在重复序列,重复次数可达百万次以上。4)基因组中不编码的区域多于编码区域。5)大部分基因含有内含子,基因是不连续的。6)基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。高度重复顺序又按其结构特点分为三种。
2.
高度重复序列
复性速度极快,即使在极稀的DNA浓度下,也能很快复性,又称零时复性部分,约占人基因组的5%。(1)反向重复序列
反向重复(即两个互补拷贝)间可有一到几个核苷酸的间隔,也可以没有间隔。没有间隔的又称回文结构,这种结构约占所有反向重复的1/3。卫星DNA(satelliteDNA)是另一类高度重复序列,其重复单位一般由2-10bp组成,成串排列。由于碱基组成(富含AT)不同于其他部份,用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。(2)卫星DNA在人细胞中卫星DNA约占5-6%。按照它们的浮力密度不同,人的卫星DNA可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种。(2)卫星DNA而蟹的卫星DNA只有AT两个碱基的重复顺序组成。果蝇的卫星DNA顺序已经搞清楚,可分为三类,都是由7bp组成的高度重复顺序:这种重复顺序为灵长类所独有。用限制性内切酶HindⅢ消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。有人把这类称为α卫星DNA。而人的α卫星DNA更为复杂,含有多顺序家族。(3)较复杂的重复单位组成的重复顺序a.参与复制水平的调节。反向重复序列常存在于DNA复制起点区的附近,另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。b.参与基因表达的调控。重复顺序可以转录到hnRNA分子中,有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用。高度重复顺序的功能c.参与转位作用。几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。d.与进化有关。不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。在进化中某些特殊区段保守,而其他区域的碱基序列则累积着变化。e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹f.α卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。
中度重复序列大致指在真核基因组中重复数十至数万(<105)次的重复顺序。其复性速度快于单拷贝顺序,但慢于高度重复顺序。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。依据重复顺序的长度,中度重复顺序可分为两种类型。3.
中度重复顺序
短分散片段(shortinterspersedrepeatedsegments,SINES)这类重复顺序的平均长度约为300bp(<500bp),它们与平均长度约为1000bp的单拷贝顺序间隔排列。拷贝数可达10万左右。如Alu家族,Hinf家族等属于这种类型的中度重复序列。(1)短分散片段
长分散片段(Longinterspersedrepeatedsegments,LINES)这类重复顺序的长度大于1000bp,平均长度为3500-5000bp,它们与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列。也有的实验显示人基因组中所有LINES之间的平均距离为2.2kb,拷贝数一般在1万左右,如KpnⅠ家族等。中度重复顺序在基因组中所占比例在不同种属之间差异很大,一般约占10-40%,在人约为12%。这些顺序大多不编码蛋白质。(2)长分散片段这些非编码的中度重复顺序的功能可能类似于高度重复顺序。在结构基因之间,基因簇中,以及内含子内都可以见到这些短的和长的中度重复顺序。按本文的分类原则有些中度重复顺序则是编码蛋白质或rRNA的结构基因,如HLA基因,rRNA基因,tRNA基因,组蛋白基因,免疫球蛋白基因等。中度重复顺序一般具有种特异性;在适当的情况下,可以应用它们作为探针区分不同种哺乳动物细胞的DNA。下面介绍几种典型的中度重复顺序。(2)长分散片段Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%。Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)从而将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)。Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA内含子中都发现有Alu序列,平均每5kbDNA就有一个Alu顺序。已建立的基因组中无例外地含有Alu顺序。Alu家族:Alu顺序具有种的特异性,人的Alu顺序制备的探针只能用于检测人的基因组中的Alu序列。大多数人的DNA克隆中都含有Alu顺序,用人的Alu序列制备的探针与要筛选的克隆杂交,阳性者即为含有人DNA克隆,阴性者不含有人DNA。人类Alu顺序是由两个约130bp的正向重复构成的二聚体,而在第二个单体中有一个31bp的插入序列,该插入序列在Alu家族的不同成员之间核苷酸顺序相似但不相同。每个Alu顺序两侧为6-20bp的正向重复顺序,不同的Alu成员的侧翼重复顺序也各不相同。Alu序列的5'端比较保守,但富含A残基的3'端在不同的Alu成员中是有变化的。
相近的生物体中Alu家族在结构上存在相似性,灵长类基因组中的Alu顺序多为由两个130bp的正向重复组成的二聚体,而啮类动物则为由一个130bp左右的DNA片段组成的单体。
Alu序列在不同的哺乳动物之间存在一定的相似性,但其序列相差较大,不会产生交叉杂交。
Alu顺序在整个基因组中含量丰富,散布广泛的可能原因:①Alu顺序可由RNA聚合酶转录成RNA分子,再经反转录酶的作用形成cDNA,然后重新插入基因组所致。②Alu序列两侧存在着短的重复顺序,使得Alu顺序很象转座子,因此推测Alu顺序可能也是能够移动的。Alu家族的功能:①Alu顺序可能参与hnRNA的加工与成熟许多hnRNA中含有大量的Alu顺序,且Alu顺序含有与某些真核基因内含子剪接接头相似的序列。②Alu序列与遗传重组及染色体不稳定性有关Alu序列在人基因组中不寻常地大量存在。最近发现在人的细胞中存在自然发生的染色体外双链环状DAN,被称为人类质粒(humanplasmid),这些质粒又毫无例外地含有Alu顺序。还有研究表明,Alu顺序中的某些区段有形成Z-DNA的能力。③Alu顺序可能具有转录调节作用。KpnⅠ家族是中度重复顺序中仅次于Alu家族的第二大家族。用限制性内切酶KpnⅠ消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2,1.5,1.8和1.9kb,这就是所谓的KpnⅠ家族。KpnⅠ家族成员顺序比Alu家族更长(如人KpnⅠ顺序长6.4kb),而且更加不均一,呈散在分布,属于中度重复顺序的长分散片段型。尽管不同长度类型的KpnⅠ家族(称为亚类,subfamily)之间同源性比较小,不能互相杂交,但它们的3’端有广泛的同源性。KpnⅠ家族的拷贝数约为3000-4800个,占人体基因组的1%,与散在分布的Alu家族相似,KpnⅠ家族中至少有一部份也是通过KpnⅠ顺序的RNA转录产物的cDNA拷贝的重新插入到人基因组DNA中而产生的。KpnⅠ家族:Hinf家族以319bp长度的串联重复存在于人体基因组中。用限制性内切酶HinfⅠ消化人体DNA,可以分离到这一片段。Hinf家族在单位基因组内约有50
100个拷贝,分散在不同的区域。319bp单位可以再分成两个亚单位,分别为172bp和147bp,它们之间有70%的同源性。Hinf家族:
多聚dTdG家族的基本单位是dTdG,多个dTdG串联重复在一起,分散于基因组中。已经发现,这个家族的一个成员位于人类δ和β珠蛋白基因之间,含有17个dTdG组成的串联重复顺序。在人基因组中,dTdG交替顺序达106拷贝,平均长度为40bp。dTdG串联重复顺序可能是基因转变(geneconversion)或不等交换(unequalcrossing-over)的识别信号。另外,这些嘌呤和嘧啶的交替顺序有助于Z-DNA的形成,在基因调节中可能起着重要的作用。多聚dTdG家族:
原核生物如E.coli基因组中,rRNA基因一共是7套;真核生物中rRNA基因的重复次数更多。低等真核生物如酵母:5S,18S,28SrRNA在同一转录单位中;高等生物:5SrRNA是单独转录的,18S和28SrRNA基因构成一个转录单位。5S基因的重复次数高于18S和28S基因。和一般的中度重复顺序不同,rRNA基因各重复单位相同。rRNA基因常成簇存在,不分散于基因组中,称为rDNA区域,如染色体的核仁组织区(nucleolusorganizerregion)即为rDNA区。rRNA基因:
在哺乳动物和两栖动物中,18S和28SrRNA之间的间隔区经转录加工成为5.8SrRNA(在大肠杆菌中该区为tRNA序列)。rRNA前体的其它部份被降解成核苷酸。真核生物中每个转录单位约长7-8kb(哺乳动物为13kb),其中编码rRNA的部分占70-80%(哺乳动物50%左右)。一个rRNA基因簇含有许多转录单位,转录单位之间为21-100bp间隔区,类似卫星DNA的串联重复顺序。转录单位和间隔区构成一个rDNA重复单位。不同生物及同种生物的不同rDNA重复单位之间间隔区的长短相差甚大。rDNA的重复单位在许多动物的卵子形成过程中进行大量复制扩增,如爪蟾在扩增前有rDNA重复单位500个,在从卵母细胞前身发展到卵母细胞过程中,rDNA的重复单位可扩增400倍,每个细胞核的核仁数增加到几百个。扩增rDNA的过程是采用滚环式复制方式在核仁区进行的,扩增的DNA不纳入到染色体中,而是包含在核区。卵母细胞成熟后,大量的rDNA由于失去了存在的意义而逐渐降解。在卵子形成的过程中rDNA大量扩增的目的,就是为了产生大量的rRNA,组装成核糖体,用于合成大量的蛋白质,以满足受精后发育的需要。
大多数真核细胞5SrRNA基因在基因组中亦呈串联重复排列成基因簇。爪蟾5SrRNA基因在体细胞中约500拷贝,卵细胞中可重复2万多次。在爪蟾中发现有几种5SrRNA基因。最主要的一种与18S、28S基因相似,即5S基因与间隔区相间排列,组成一个重复单位。每个重复单位的5'端是含一段49bp长的GC丰富区;在卵细胞中还有一个次要的5SrRNA基因,与主要的5S基因在序列上有一定的差异,在结构上与主要的5S基因相似,但整个重复单位长只有350bp,而且间隔区与主要的5S基因完全不一样。人类的rRNA基因位于13,14,15,21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。5SrRNA基因似乎全部位于1号染色体上,每单倍体基因组约有1000个5SrRNA基因。
tRNA基因的精确重复次数比较难以估计。在非洲爪蟾中约有300个拷贝由tRNAmet,tRNAphe,tRNAtrp及其它tRNA基因组成的3.18kb的串联重复单位。而在人体单倍基因组中约有1000-2000个tRNA基因,为50-60种rRNA编码,每种平均重复20-30次。tRNA基因:
组蛋白基因在各种生物体内重复的次数不一样,但都在中度重复的范围内。通常每种组蛋白的基因在同一种生物中拷贝数是相同的。鸡的基因组中组蛋白基因有10个拷贝,在哺乳动物中为20拷贝,非洲爪蟾为40拷贝,而海胆的每种组蛋白的基因达300-600拷贝。组蛋白基因没有一定的排列方式,而在拷贝数高的基因组中(>100拷贝),大部份组蛋白基因串联重复形成基因簇。组蛋白基因:在果蝇和非洲爪蟾中,5种组蛋白也排成一个重复单位,也存在间隔区,而且组蛋白基因的转录方向不一样。多个重复单位也形成串联重复排列。哺乳动物:组蛋白基因一般不再形成重复单位,而呈散在分布或集成一小群。尽管组蛋白基因在基因组中的排列和分布在不同生物之间相差甚大,但是所有组蛋白基因都不含内含子,而且在序列上相应的组蛋白基因都很相似,从而编码的组蛋白在结构上和功能上也极为相似。基因组中存在大量重复序列用以编码组蛋白的重要意义:DNA复制时,组蛋白也要成倍增加,而且往往在DNA合成一小段后,组蛋白马上就要与其相结合,这要求在较短的时间内合成大量的组蛋白,因而需要有大量的组蛋白基因存在。单拷贝顺序在单倍体基因组中只出现一次或数次,因而复性速度很慢。单拷贝顺序在基因组中占50-80%,如人基因组中,大约有60-65%的顺序属于这一类。单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质。目前尚不清楚单拷贝基因的确切数字,但是在单拷贝顺序中只有一小部分用来编码各种蛋白质,其他部分的功能尚不清楚。单拷贝顺序的两侧往往为散在分布的重复顺序。4.
单拷贝顺序(低度重复顺序)
由于某些单拷贝顺序编码蛋白质,体现了生物的各种功能,因此对这些序列的研究对医学实践有特别重要的意义。但由于其拷贝数少,在DNA重组技术出现以前,要分离和分析其结构和顺序几乎是不可能的,现在人们通过基因重组技术可以获得大量欲研究的基因,并对许多结构基因进行了较为细致的研究。
多基因家族(multigenefamily)是指由某一祖先基因经过重复和变异所产生的一组基因。大致可分为两类:一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。5.
多基因家族与假基因假基因(pseudogene)是指在多基因家族中,某些并不产生有功能产物的基因。假基因与有功能的基因同源。可能是有功能的基因,由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。推测,假基因的来源之一,可能是细胞内mRNA反转录成cDNA,再整合到染色体DNA中去,再成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。在哺乳动物包括人体基因组中,存在着大量的非编码顺序,如高度重复顺序、内含子、间隔DNA等。这些顺序中,只有很小一部分具有重要的调节功能,绝大部分都没有什么特殊功用。在这些DNA序列中虽然积累了大量缺失,重复或其他突变,但对生物并没有什么影响,它们的功能似乎只是自身复制,所以人们称这类DNA为自私DNA或寄生DNA(parasiteDNA)。自私DNA也许有重要的功能,但目前我们还不了解。6.
自私DNA(selfishDNA)七、限制性片段长度多态性
不同生物体内DNA结构存在相当大的差异。同种生物不同个体之间,尽管其蛋白质结构和功能完全相同或仅存在细微的差异,但在DNA水平却存在着差异,尤其在不编码的区域以及没有重要调节功能的区域表现更为突出。
DNA上的大多数突变是中性突变,不影响生物体的表型,过去对这些突变不太重视,也无法用传统的遗传学方法来研究。随着分子生物学技术的不断发展,从DNA水平上直接分析生物体的突变成为可能。
假如DNA顺序中的某个碱基发生了突变,使突变所在部位的DNA序列产生(或缺失)某种限制性内切酶的位点。这样,利用该限制性内切酶消化此DNA时,便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中会出现不同长度的限制性片段类型,即限制性片段多态性(RestrictionFragmentLengthPolymorphism,RFLP)。RFLP分为两类型:一类是由于限制性内切酶位点上发生了单个碱基突变而使这一限制性位点发生丢失或获得而产生的多态性,故称之为点多态性(pointpolymorphism)。这类多态性实际上是双态的,即有(+)或无(-)。另一类是由于DNA
分子内部发生较大的顺序变化所致。这一类多态性又可以分成两类:
第一类是由于DNA
顺序上发生突变如缺失、重复、插入所致。第二类是所谓“高变区”。高变区(highlyvariableregion)是由多个串联重复顺序组成的,不同的个体,高变区内所串联重复的拷贝数相差悬殊,因而高变区的长度变化很大,从而使高变区两侧限制性内切酶识别位点的固定位置随高变区的大小而发生相对位移。所以这一类型的RFLP是由于高变区内串联重复顺序的拷贝数不同所产生的,其突出特征是限制性内切酶识别位点本身的碱基没有发生改变,改变的只是它在基因组中的相对位置。实际上,在DNA顺序中,存在着大量的单个碱基的替换,但用通常的技术只能检测出影响到限制性内切酶识别位点上的突变。人的卫星DNA或称随体DNA是由一些短的DNA片段(10bp左右)多次重复所构成的。重复片段的组成和拷贝数在不同的个体及基因组的不同位置上不一样。提取不同个体的基因组DNA后,用其切点能识别序列为4个碱基而又不切割该重复片段的限制性内切酶在重复片段的两侧切割基因组DNA,然后将样品进行凝胶电泳。不同长度的重复片段(主要是由于重复单位的拷贝数不同所致)就会分开,再与含有这些重复序列的特异性探针杂交,便形成有个体特异性的放射性自显影图,亦称为DNA指纹。
DNA指纹图谱取决于所用探针的核心序列(即重复序列中的重复单位)。目前所用的探针有两种:33.15,核心序列为AGAGGTGGGCAGGTGG;33.6,即AGGGCTGGAGG。这两种序列在人体基因组中不同的位置上分别重复不同的次数,而在不同个体的基因组中,对应位置上这两种核心序列的重复次数也不相同。这样用这两种探针之一与合适的酶切割的人体基因组DNA
片段杂交,在不同的个体将得到不同的DNA指纹,而且探针33.6的DNA指纹图也不相同。DNA
指纹具有细胞稳定性和种系稳定性,是按孟德尔规律遗传的,而且杂合性高。由于DNA指纹是按孟德尔规律遗传的,子代的DNA指纹图可以追溯到其父母DNA指纹图上,而在不是其父母的DNA指纹图上则很难找到与其一样的小随体DNA片段。在父亲的5条可分辨的小随体DNA片段中,有4条处于杂合状态,即这4条DNA片段有不同的个体长度。因此,因高变区核心序列重复次数不同引起的RLFP才是真正的多态性。在不同个体,这种RLFP即DNA
指纹可以说不存在相同的。即使使用一种探针产生的DNA指纹图无法鉴定这两个个体,如再用另一种探针便有可能将这两个个体区分开。DNA指纹技术已被应用于亲子鉴定和法医学上对罪犯的确认等领域。基因、基因组与基因组学第一章基因的结构第二章基因组的结构与功能第三章基因组学简介第一章基因的结构基因分类:1.编码基因:最终产物是蛋白质。编码基因是分子生物学研究的主要对象。2.非编码基因:最终产物是RNA。由于RNA长期被认为是结构单位,而非功能单位,非编码基因没有受到重视。自1982年发现RNA具有自我催化功能,非编码基因的研究受到重视。第一章基因的结构非编码基因功能:1.rRNA和tRNA参与蛋白质的合成。2.生物界起源于RNA
。3.RNA具有自我催化功能。4.参与生物发育及基因表达的调控。5.无所不能的RNA。第一章基因的结构RNA参与基因的转录调控、染色体复制、RNA处理及修饰、mRNA的翻译和稳定性、蛋白质的降解及转移等生物过程。
基因的结构即指DNA序列,也包括基因产物的结构。第一章基因的结构第一节、非编码RNA基因的结构一、非编码RNA的名称和种类ncRNA:Non-codingRNA,除mRNA以外的所有RNA。fRNA:FunctionalRNA,除mRNA、rRNA、tRNA
之外的所有RNA。miRNA*:MicroRNA,参与翻译的调控、mRNA
的特异性降解。siRNA:SmallinterferingRNA,参与RNA沉默过程,多数是mRNA的降解片断。第一章基因的结构第一节、非编码RNA基因的结构一、非编码RNA的名称和种类snRNA*:SmallnuclearRNA,包括拼接小体
RNA(spliceosomalRNA)。snmRNA:Smallnon-mRNA,即小非编码RNAsnoRNA*:SmallnucleolarRNA,参与rRNA和
tRNA的修饰。stRNA:SmalltemporalRNA,参与RNA沉默过程,多数是mRNA的降解片断。第一章基因的结构第一节、非编码RNA基因的结构二、核酶ribozyme的发现和结构1979,Cech通过电镜发现原生动物Tetrahymena
thermophila
的rRNA基因含有内含子。
1982,又发现rRNA前体能自我剪接。[Cell,31,147~157,(1982)]1983,通过重组技术证明RNA具有催化功能,提出ribozyme概念。[Nature,301,578~583,(1983)]ThomasR.Cech第一章基因的结构第一节、非编码RNA基因的结构二、核酶ribozyme的发现和结构1971,Altman发现大肠杆菌的RNaseP含有RNA。除去RNA后RNaseP失去活性。
1983,证明M1RNA是RNaseP的催化组分,在较高[Mg2+]下,能切割tRNA前体。[Cell,35,849~857,(1983)]SidneyAltman,Ph.D.PressRelease:The1989NobelPrizeinChemistry12October1989
TheRoyalSwedishAcademyofScienceshasdecidedtoawardthe1989NobelPrizeinchemistryjointlyto
ProfessorSidneyAltman,YaleUniversity,NewHaven,Connecticut,USA
ProfessorThomasCech,UniversityofColorado,Boulder,USA
fortheirdiscoveryofcatalyticpropertiesofRNA.Ⅰ类内含子:存在于rRNA和质体tRNA基因中。利用pG为辅助因子,通过碱基互补形成特定的高级结构。具有核酶性质的RNA主要有三类:1.内含子核酶Ⅱ类内含子:存在于线粒体和质体mRNA基因中。剪接点序列高度保守,5’端为GUGCG,3’端为YNAU,中间序列形成保守的二级结构。Ⅲ类内含子:存在于细胞核的mRNA基因中。需要snRNA。Ⅳ类内含子:存在于细胞核的tRNA基因中。需要核酸内切酶。Aschematicpictureoftheself-splittingofRNA-molecules.Previouslyitwasthoughtthatthisprocess,whichiscrucialforthetranscriptionofthegeneticmessage,requiredthecatalyticactivityofproteins(fromAnn.Rev.Biochem.198655:606).
TetrahymenaGroupIRibozymeX-rayCrystalStructureScience282,259-264(1998)最早发现的核酶,为I类内含子。
类病毒:是基因组只有几百个核苷酸的单链环状RNA。不编码任何蛋白质,却能在植物细胞内自主复制(滚环复制),再通过切割成单个的环状单链RNA。完成切割和连接任务的就是类病毒RNA本身。具有核酶性质的RNA主要有三类:2.类病毒、卫星病毒、卫星RNA核酶
病毒卫星RNA:一种依赖其它病毒在寄主细胞中的RNA,其基因组也有核酶的结构
拟病毒:结构类似类病毒的卫星RNA,其基因组也有核酶的结构。锤头型:含有50个碱基,其中14个核心碱基序列是绝对必需的。其二级结构含有3个双链螺旋结构和5个单链区。类病毒、卫星病毒、卫星RNA核酶的种类发夹型:含有50个碱基,其二级结构含有4个双链螺旋结构和2个单链的环组成。具有内切酶和连接酶活性,是自身复制所必需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 制定质量标准
- 跟骨骨折经皮复位与置钉知识2025
- 中国古代文学作品选辅导
- DeepSeek大模型在医学影像诊断智能识别中的应用方案
- 2025年四川省绵阳市安州八年级中考一模生物试题 (含答案)
- 2025年甘肃省武威市凉州区松树、永昌九年制学校中考三模语文试题(含答案)
- 2025年广东省初中毕业生学业考试英语模拟试题(文字版无答案)
- 后置埋件安装垂直度技术专题
- 2025合同能源管理EMC(EPC)融资及信用保障
- 2025年北京市二手车交易合同
- 2024版劳动合同法全文txt
- 辽宁省2024年高中历史1月学生学业水平考试试题含解析
- 2012年重庆物理高考题及答案解析
- DL∕T 5210.4-2018 电力建设施工质量验收规程 第4部分:热工仪表及控制装置
- 江苏自然资源厅事业单位笔试真题2024
- HG+20231-2014化学工业建设项目试车规范
- 江苏省徐州市2023-2024学年八年级下学期期末英语试卷(含答案解析)
- 安徽省阜阳市2023-2024学年七年级下学期期末数学试题
- 急性胰腺炎护理查房课件
- 2024年河南省洛阳市中考第三次模拟考试语文试卷
- 华盛顿英语介绍课件
评论
0/150
提交评论