第3章基因组组的结构与功能_第1页
第3章基因组组的结构与功能_第2页
第3章基因组组的结构与功能_第3页
第3章基因组组的结构与功能_第4页
第3章基因组组的结构与功能_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章基因组的结构与功能基因组的结构与功能The Central Dogma转转 录录翻翻 译译逆转录逆转录复复 制制 DNA通过基因表达,决定了蛋白质的结构、功能通过基因表达,决定了蛋白质的结构、功能 DNA通过复制,将基因信息代代相传通过复制,将基因信息代代相传 RNA参与参与DNA遗传信息的表达遗传信息的表达 RNA也可作为某些病毒遗传信息的载体也可作为某些病毒遗传信息的载体【基因基因】 基因是核酸分子中贮存遗传信息基因是核酸分子中贮存遗传信息的遗传单位,是指贮存有功能的蛋白的遗传单位,是指贮存有功能的蛋白质多肽链或质多肽链或RNA序列信息及表达这序列信息及表达这些信息所必需的全部

2、核苷酸序列。些信息所必需的全部核苷酸序列。基因和蛋白的关系? 55AGCCGACTATGTCGAAGCTTAGCCGACTATGTCGAAGCTTGCTTGACTATAAGACAGCTTGACTATAAGACA3333TCGGCTGATACAGCTTCGAATCGGCTGATACAGCTTCGAACGAACTGATATTCTGTCGAACTGATATTCTGT55 转录调控区转录调控区 贮存贮存RNARNA或蛋白质结构信息区或蛋白质结构信息区 转录终止区转录终止区 大部分生物中构成基因的遗传物质是大部分生物中构成基因的遗传物质是DNA,但有一部分生物(,但有一部分生物(RNA病毒)是病毒)是以

3、以RNA作为构成基因的遗传物质。作为构成基因的遗传物质。基因的基本结构:基因的基本结构: 【基因组基因组】细胞或生物体中,一套完整单倍体的遗细胞或生物体中,一套完整单倍体的遗传物质的总和(包括一种生物所需的全套传物质的总和(包括一种生物所需的全套基因及其间隔序列)称为基因组。基因及其间隔序列)称为基因组。人类基因组包括:人类基因组包括:22条染色体,条染色体,X、Y两条性染色体及胞浆线粒两条性染色体及胞浆线粒体上遗传物质。体上遗传物质。基因组的结构主要指不同的基因功能区基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况,基因域在核酸分子中的分布和排列情况,基因组的功能是贮存和表达

4、遗传信息。组的功能是贮存和表达遗传信息。基因组的结构和功能是密切相关的。基因组的结构和功能是密切相关的。第第 一一 节节病病 毒毒 基基 因因 组组一、病毒基因组核酸的主要类型一、病毒基因组核酸的主要类型双链双链RNARNA单链负股单链负股RNARNA 单链正股单链正股RNARNA分类分类DNADNARNARNA 双链双链DNADNA:HBVHBV 单链单链DNADNA:M13M13噬菌体噬菌体正股(+):序列与mRNA相同的链 负股(-):序列与mRNA互补的链(一)双链(一)双链DNA病毒病毒 (SV40 病毒)病毒) 基因组基因组DNA DNA 复制复制 基因组基因组 DNA 或通过逆转

5、录完成复制(少数,见三)。或通过逆转录完成复制(少数,见三)。(二)单链(二)单链DNA病毒病毒 (M13 噬菌体)噬菌体) 基因组基因组DNA DNA 复制复制 基因组基因组DNA (三)(三)DNARNA病毒病毒 (HBV) 基因组基因组DNA 转录转录 RNA 逆转录逆转录 基因组基因组DNA(四)双链(四)双链RNA病毒病毒 (呼肠孤病毒)(呼肠孤病毒) 基因组基因组RNA RNA 复制复制 基因组基因组RNA(五)单链()(五)单链()RNA病毒病毒 (脊髓灰白质炎病毒)(脊髓灰白质炎病毒) 基因组基因组RNA RNA 复制复制 基因组基因组RNA (六)单链()(六)单链()RNA

6、 病毒病毒 (疱疹性口炎病毒,(疱疹性口炎病毒,VSV) 基因组基因组RNA RNA 复制复制 基因组基因组RNA(七)(七)RNADNA病毒病毒 (逆转录病毒)(逆转录病毒) 基因组基因组RNA 逆转录逆转录 cDNA 转录转录 基因组基因组RNA二、病毒基因组的结构与功能的特点二、病毒基因组的结构与功能的特点(一)基因组核酸可以是任何一种类型的核酸,(一)基因组核酸可以是任何一种类型的核酸,但一种病毒的基因组只是一种核酸。但一种病毒的基因组只是一种核酸。(二)不同病毒基因组的核酸大小差别很大。(二)不同病毒基因组的核酸大小差别很大。(三)基因常常成簇排列,没有间隔序列或间(三)基因常常成簇

7、排列,没有间隔序列或间隔序列很小。隔序列很小。 (功能上相关的基因排列在一起功能上相关的基因排列在一起) (四)病毒的基因都是单拷贝,基因组多为单(四)病毒的基因都是单拷贝,基因组多为单倍体倍体(五)病毒基因组有重叠基因(五)病毒基因组有重叠基因(六)病毒基因组的编码序列平均约(六)病毒基因组的编码序列平均约 90 (但差异很大)(但差异很大)(七)病毒基因有连续的,有不连续的(七)病毒基因有连续的,有不连续的(八)病毒基因组含有不规则的结构基因(八)病毒基因组含有不规则的结构基因1、几个结构基因的编码区无间隔,因此有些结、几个结构基因的编码区无间隔,因此有些结 构基因没有翻译起始序列。构基因

8、没有翻译起始序列。2、gene mRNA,有的,有的mRNA 没有没有 5 端的帽端的帽 结构,有翻译增强子。结构,有翻译增强子。3、有的结构基因转录后产物本身没有翻译起始,需要、有的结构基因转录后产物本身没有翻译起始,需要在转录后进行加工、剪接,成为有翻译功能的在转录后进行加工、剪接,成为有翻译功能的mRNA 。三、典型病毒基因组举例三、典型病毒基因组举例 (一)(一)SV40病毒基因组病毒基因组 (双链(双链 DNA 病毒)病毒) 1、SV40病毒基因的结构特征病毒基因的结构特征 2、SV40病毒基因的表达和复制病毒基因的表达和复制(1)SV40 的基因表的基因表达达 启动子,增强子启动子

9、,增强子 (2)RNA的选择剪切的选择剪切形成不同的形成不同的mRNA,不,不连续基因,一个基因产连续基因,一个基因产生不同的蛋白质生不同的蛋白质初级转录物初级转录物(3)病毒基因组的复制)病毒基因组的复制 T抗原控制病毒的复制,启动晚期转录抗原控制病毒的复制,启动晚期转录 1、HBV基因组结构基因组结构(1)双链()双链()DNA病毒病毒(2)二条链长短不一)二条链长短不一(3)重叠基因)重叠基因(二)(二) HBV基因组基因组 (DNA-RNA 病毒)病毒)2、HBV基因组复制基因组复制(1)cccDNA(共价双链闭环状(共价双链闭环状DNA)的生成)的生成(2)转录生成()转录生成()R

10、NA(3)合成()链)合成()链DNA和()链和()链DNA(4)形成子代病毒)形成子代病毒(三)脊髓灰白质炎病毒基因组(三)脊髓灰白质炎病毒基因组 ( 单链单链() RNA 病毒病毒 ) 1. 基因组的特征基因组的特征( mRNA) 2. 基因组信息表达的特点基因组信息表达的特点 ( () RNA) RNA55-pUUNNNNN-pUUNNNNNNNNAAAAAAAn 3NNNAAAAAAAn 3VPg蛋白形成后,可以共价结合两个蛋白形成后,可以共价结合两个U,成为病毒成为病毒RNA复制的引物。复制的引物。 3. 基因组复制特点基因组复制特点UUp-UUp-(引导合成负链(引导合成负链RNA

11、)( () RNA) RNA3AANNNNNNN3AANNNNNNNNNNUUUUUUUp-NNNUUUUUUUp- 5 5 -pUU-pUU新合成的()新合成的()RNA的的poly(A) 尾不是另外尾不是另外加上去的,而是直接复制出来的。加上去的,而是直接复制出来的。(引导合成正链(引导合成正链RNA)( () RNA) RNA3AANNNNNNN3AANNNNNNNNNNUUUUUUUp-NNNUUUUUUUp- 5 5 -pUU-pUU(引导合成正链(引导合成正链RNA)合成的合成的()RNA实际上有三种用途:实际上有三种用途: 作为作为mRNA翻译病毒蛋白质翻译病毒蛋白质; 作为模板

12、复制()作为模板复制()RNA; 作为子代病毒的作为子代病毒的RNA, 加上蛋白质后包装成加上蛋白质后包装成 病毒颗粒。病毒颗粒。(四)逆转录病毒基因组(四)逆转录病毒基因组 (RNA-DNA 病毒)病毒) 1.基因组结构特征基因组结构特征 (1)帽子结构和多聚)帽子结构和多聚A尾尾 (2)编码区)编码区(3)非编码区(调控区)非编码区(调控区) 重复序列重复序列R区区 引物结合区引物结合区 U区区 DLS、和和C区区A A:编码区:编码区: :所有逆转录病毒均含有所有逆转录病毒均含有3 3个基本结构基因个基本结构基因gag: gag: 病毒衣壳蛋白病毒衣壳蛋白pol: pol: 肽链内切酶肽

13、链内切酶, ,一个逆转录酶一个逆转录酶, ,一个与前病毒整一个与前病毒整 合相关的酶合相关的酶env: env: 包膜蛋白包膜蛋白B B:非编码区:非编码区: : 与基因组复制和基因表达有关与基因组复制和基因表达有关A: RA: R区区: : 两端的重复序列两端的重复序列, ,与与cDNAcDNA合成有关合成有关B: B: 引物结合区引物结合区(primer binding site, PB)(primer binding site, PB)C: UC: U区区: U3 : U3 含强启动子含强启动子, ,起始转录起始转录RNA.RNA. U5 U5 与转录终止和加与转录终止和加polyApo

14、lyA有关有关D: DLS-D: DLS- -C-C区区: : DLS: DLS:两条病毒两条病毒(+)RNA(+)RNA链结合位点链结合位点 : : 包装信号包装信号:RNA:RNA装入病毒颗粒装入病毒颗粒 C: C: 调控区调控区. .2、前病毒基因的转录、前病毒基因的转录 (1) 病毒基因组的形成(转录)病毒基因组的形成(转录) U3有强启动子,有强启动子,5 端的端的U3是病毒是病毒RNA的的启动子,启动病毒启动子,启动病毒RNA的转录;的转录;3 端的端的U3可可作为下游基因的启动子。作为下游基因的启动子。R和和U5之间有加之间有加polyA信号的序列。信号的序列。 由由5 端的端的

15、U3 提供启动子,从提供启动子,从U3和和R区分区分界处开始转录。直到界处开始转录。直到RNA转录到转录到3端的端的R和和U5之间时,之间时,RNA在在R和和U5交界处断裂,在交界处断裂,在RNA的的3 端加端加polyA 。 RNA 5 端的端的PB区与来自宿主细胞的区与来自宿主细胞的tRNA结合,两个相同的(结合,两个相同的(+)RNA又以平行又以平行的二聚体结构在二聚体结合位点(的二聚体结构在二聚体结合位点(DLS)以)以氢键相连。最后,包装蛋白把病毒基因包装氢键相连。最后,包装蛋白把病毒基因包装起来,形成病毒颗粒。起来,形成病毒颗粒。(2)mRNA翻译翻译 gag 基因的转录与翻译基因

16、的转录与翻译 全长全长RNA能直接作为能直接作为gag基因的基因的mRNA,进行翻译。有进行翻译。有90的的mRNA只翻译出只翻译出gag 多蛋多蛋白质,经肽链加工裂解成为病毒的衣壳蛋白。白质,经肽链加工裂解成为病毒的衣壳蛋白。 pol基因的翻译基因的翻译RNA序列中有干扰序列中有干扰gag基因终止密码子的序列。约有基因终止密码子的序列。约有10的的mRNA在翻译过程中可以越过在翻译过程中可以越过gag基因的终止基因的终止密码子,一直翻译到密码子,一直翻译到pol基因的终止密码子,形成更基因的终止密码子,形成更大的多蛋白质,经翻译后加工裂解,形成病毒的衣大的多蛋白质,经翻译后加工裂解,形成病毒

17、的衣壳蛋白、逆转录酶和一种与前病毒整合有关的酶壳蛋白、逆转录酶和一种与前病毒整合有关的酶(integrase,整合酶)。,整合酶)。 env 基因的转录与翻译基因的转录与翻译 一部分全长一部分全长mRNA经过转录后剪接,使经过转录后剪接,使env基因基因的编码区与病毒的编码区与病毒RNA的的5 端帽结构连接在一起,从端帽结构连接在一起,从而形成而形成env基因的基因的mRNA。翻译出病毒包膜的糖蛋白。翻译出病毒包膜的糖蛋白。第第 二二 节节原原 核核 基基 因因 组组一、原核生物基因组结构与功能的特点一、原核生物基因组结构与功能的特点1、原核生物基因组通常由一条环状双链、原核生物基因组通常由一

18、条环状双链DNA分子组成。原核生物的基因组分子组成。原核生物的基因组DNA虽与蛋虽与蛋白结合,但不形成染色体结构,只是习惯上白结合,但不形成染色体结构,只是习惯上将之称为染色体。将之称为染色体。 染色体染色体DNA在细胞内形成一个致密区域在细胞内形成一个致密区域,即类核(,即类核(nucleoid)。类核无核膜将之与胞)。类核无核膜将之与胞浆分开。浆分开。 在染色体在染色体DNA中含有许多基因。中含有许多基因。 2基因组中只有基因组中只有1个复制起点。个复制起点。启动子(启动子(promoter), 操纵元件(操纵元件(operator)结构基因结构基因, 终止子(终止子(terminator

19、),3、原核基因的基本结构特点、原核基因的基本结构特点结构基因(结构基因(structure gene)4、操纵子结构、操纵子结构操纵子(操纵子(operon)是指数个功能上相关联的结)是指数个功能上相关联的结构基因串联在一起,构成信息区,连同其上游的构基因串联在一起,构成信息区,连同其上游的调控区(包括启动子和操纵区)以及下游的转录调控区(包括启动子和操纵区)以及下游的转录终止信号所构成的基因表达单位,所转录的终止信号所构成的基因表达单位,所转录的RNA为多顺反子。为多顺反子。多顺多顺反子反子单顺单顺反子反子真核生物真核生物原核生物原核生物非编码序列启动子是启动子是RNA聚合酶结合的区域,聚

20、合酶结合的区域,操纵区是特异阻遏蛋白结合区。操纵区是特异阻遏蛋白结合区。操纵子的转录通常受一个调节基因所表达的阻遏蛋操纵子的转录通常受一个调节基因所表达的阻遏蛋白的控制。白的控制。核糖体蛋白的操纵子核糖体蛋白的操纵子: : 大肠杆菌核糖体有大肠杆菌核糖体有5050余种蛋白,其基因是组余种蛋白,其基因是组合在数个操纵子中。如:合在数个操纵子中。如: S10S10L3L3L4L4L23L23L2L2L22L22S19S19S3S3L16L16L29L29S17S17operon : operon : L10L10L7L7L12L12operon : operon : S13S13S11S11S4S

21、4L17L17(, : RNA(, : RNA聚合酶的亚单位聚合酶的亚单位 ) )5、结构基因无重叠现象,基因组中的任何一、结构基因无重叠现象,基因组中的任何一段段DNA顺序不会用于编码两种蛋白质。顺序不会用于编码两种蛋白质。6、基因序列是连续的,无内含子。、基因序列是连续的,无内含子。7、编码区在基因组中所占的比例(约占、编码区在基因组中所占的比例(约占50)远远大于真核基因组,但又远远小于病毒基远远大于真核基因组,但又远远小于病毒基因组。非编码区主要是一些调控序列。因组。非编码区主要是一些调控序列。8、基因组中重复序列很少。编码蛋白质的结、基因组中重复序列很少。编码蛋白质的结构基因多为单拷

22、贝,但编码构基因多为单拷贝,但编码rRNA的基因的基因往往是多拷贝的。往往是多拷贝的。9、具有编码同工酶的基因(、具有编码同工酶的基因(isogene)。这是)。这是一类结构上不完全相同,而功能相同的基一类结构上不完全相同,而功能相同的基因。例如在大肠杆菌中含有因。例如在大肠杆菌中含有2个编码乙酸乳个编码乙酸乳酸合成酶同工酶的基因酸合成酶同工酶的基因, 和和2个编码分支酸个编码分支酸变位酶同工酶的基因。变位酶同工酶的基因。10、细菌基因组中存在着可移动的、细菌基因组中存在着可移动的DNA序列,序列,包括插入序列和转座子包括插入序列和转座子 沙沙门门菌菌鞭鞭毛毛素素基基因因的的调调节节 H2鞭毛

23、素鞭毛素 阻遏蛋白阻遏蛋白 Hin重组酶重组酶倒位片段倒位片段hinH2IH1 H1鞭毛素鞭毛素hinH2IDNA启动序列启动序列H1启动序列启动序列二、染色体外的遗传物质二、染色体外的遗传物质 质粒质粒 (一)质粒的定义(一)质粒的定义 质粒(质粒(plasmid)是细菌细胞内携带的)是细菌细胞内携带的染色体之外的环状染色体之外的环状DNA分子,是共价闭合分子,是共价闭合的环状的环状DNA分子(分子(covalant closed circular DNA,cccDNA),可以独立于细菌染色体),可以独立于细菌染色体而进行复制而进行复制1、质粒的大小、质粒的大小 小型质粒:小型质粒: 15

24、kb 小型质粒易于通过转化作用进入细菌,大型小型质粒易于通过转化作用进入细菌,大型质粒只能通过细菌的接合作用从一个细菌传递质粒只能通过细菌的接合作用从一个细菌传递到另一个细菌。到另一个细菌。(二)质粒的主要特性(二)质粒的主要特性2、质粒的复制、质粒的复制 质粒与染色体拷贝数之比质粒与染色体拷贝数之比10为低拷为低拷贝数质粒,贝数质粒,10为高拷贝数质粒。为高拷贝数质粒。 质粒的复制是自主调节的,不受染色质粒的复制是自主调节的,不受染色体复制调节因素的影响。体复制调节因素的影响。复制调控系统由质粒上的复制起点(复制调控系统由质粒上的复制起点(ori)、)、质粒的质粒的rep基因和基因和cop基

25、因构成。基因构成。低拷贝数质粒也称为严谨型质粒,自身产生的复低拷贝数质粒也称为严谨型质粒,自身产生的复制阻遏作用较强,分子量较大。制阻遏作用较强,分子量较大。高拷贝数质粒或称为松驰型质粒,分子量小。高拷贝数质粒或称为松驰型质粒,分子量小。3、质粒的不相容性。、质粒的不相容性。 利用相同复制系统的质粒不能共存于利用相同复制系统的质粒不能共存于同一个宿主细胞内,这种特性称为质粒的同一个宿主细胞内,这种特性称为质粒的不相容性。不相容性。 两个具有相同或密切相关复制起始位两个具有相同或密切相关复制起始位点和调控机制的质粒不能共存于同一个宿点和调控机制的质粒不能共存于同一个宿主细胞内。主细胞内。 两个带

26、有两个带有ColE1复制调控系统的质粒复制调控系统的质粒不能共存于同一个细胞内。不能共存于同一个细胞内。 pMB1和和ColE1是两个密切相关的复制是两个密切相关的复制调控系统,带有调控系统,带有pMB1和和ColE1复制调控系复制调控系统的质粒也是不相容的。统的质粒也是不相容的。 但但ColE1和和pMB1与带有与带有pSC101或或p15A复制调控系统的质粒则是完全相容复制调控系统的质粒则是完全相容的,可以共存于同一个细胞内。的,可以共存于同一个细胞内。4 4、质粒与宿主细胞的关系。、质粒与宿主细胞的关系。(1 1)质粒是作为附加的遗传物质存在于细)质粒是作为附加的遗传物质存在于细菌细胞内

27、,其复制和遗传均独立于宿菌细胞内,其复制和遗传均独立于宿主细胞染色体。主细胞染色体。(2 2)质粒的存在通常不是宿主细胞所必须)质粒的存在通常不是宿主细胞所必须的。的。(3 3)质粒的复制和转录均依赖于宿主细胞)质粒的复制和转录均依赖于宿主细胞的酶和蛋白质。的酶和蛋白质。(4 4)在特定的条件下,质粒编码的蛋白质)在特定的条件下,质粒编码的蛋白质(酶)可以赋予宿主细胞生存优势。(酶)可以赋予宿主细胞生存优势。5、质粒的功能、质粒的功能 质粒的功能主要通过质粒本身携带的基质粒的功能主要通过质粒本身携带的基因编码蛋白质而表现出来。携带质粒的宿主因编码蛋白质而表现出来。携带质粒的宿主细胞可表现出相应

28、的表型。细胞可表现出相应的表型。(1)性质粒)性质粒(2)抗生素抗性)抗生素抗性(3)产生毒素的质粒(如大肠杆菌素)产生毒素的质粒(如大肠杆菌素)(4)降解复杂的有机化合物作为能源)降解复杂的有机化合物作为能源(5)产生限制和修饰酶)产生限制和修饰酶6、质粒的转移性、质粒的转移性 在自然条件下,有些质粒可以通过在自然条件下,有些质粒可以通过细菌的接合作用在细菌细胞间传递。细菌的接合作用在细菌细胞间传递。 基因工程中常用的质粒载体缺乏转基因工程中常用的质粒载体缺乏转移所需的基因(移所需的基因(mob基因),不能通过基因),不能通过接合作用在细胞间传递,但可采用人工接合作用在细胞间传递,但可采用人

29、工方法转化到细菌细胞中。方法转化到细菌细胞中。三、转位因子三、转位因子 转位因子(转位因子(transposable element),即),即可移动的基因成分,是指能够在一个可移动的基因成分,是指能够在一个DNA分分子内部或两个子内部或两个DNA分子之间移动的分子之间移动的DNA片段。片段。在细菌中,则指可在质粒和染色体之间或在在细菌中,则指可在质粒和染色体之间或在质粒和质粒之间移动的质粒和质粒之间移动的DNA片段。转位也是片段。转位也是DNA重组的一种形式。重组的一种形式。(一)转位因子的种类(一)转位因子的种类 1、插入序列(、插入序列(insertion sequence, IS) (

30、1)IS由一个转位酶基因和两侧的反向由一个转位酶基因和两侧的反向重复序列组成。重复序列组成。(2 2)插入到新的位点后,两侧为顺向重复序列)插入到新的位点后,两侧为顺向重复序列(3 3)插入可以是正向,也可以是反向插入。)插入可以是正向,也可以是反向插入。(2 2)插入到新的位点后,两侧为顺向重复序列)插入到新的位点后,两侧为顺向重复序列(3 3)插入可以是正向,也可以是反向插入。)插入可以是正向,也可以是反向插入。2、转座子(、转座子(transposon, Tn) (1)结构基因的两侧含)结构基因的两侧含 2 个相同的插入个相同的插入序列(复合型转座子)。序列(复合型转座子)。(2)数个基

31、因与)数个基因与2个反向重复序列,不含个反向重复序列,不含IS。(图3-7)3、可转座的噬菌体(、可转座的噬菌体(transposable phage)(1)插入部位两侧有短的顺向重复序列)插入部位两侧有短的顺向重复序列(2)一个拷贝留在原位,新合成的拷贝插)一个拷贝留在原位,新合成的拷贝插入新的部位入新的部位(3)Mu噬菌体末端不含反向重复顺序噬菌体末端不含反向重复顺序(二)转位作用的机理(二)转位作用的机理1 1、复制型转位机理、复制型转位机理共联体生成和解离,靶序列切割与复制共联体生成和解离,靶序列切割与复制(1 1)转座酶将转座子序列双链的相反极)转座酶将转座子序列双链的相反极性端同时

32、切开单链切口。同时,在靶点性端同时切开单链切口。同时,在靶点序列两侧各一条单链上造成一切口。序列两侧各一条单链上造成一切口。(2)供体上转座因子的游离端与靶位点)供体上转座因子的游离端与靶位点DNA上错开切割的突出端分别连接。上错开切割的突出端分别连接。(3)在宿主)在宿主DNA聚合酶的作用下进行复制,聚合酶的作用下进行复制,新的转座成分通过半保留复制完成并伴有两新的转座成分通过半保留复制完成并伴有两个复制子的融合,即形成个复制子的融合,即形成“ 共整合体共整合体”。(4)此)此“ 共整合体共整合体”是以转座成分的正向是以转座成分的正向重复序列相连接的。重复序列相连接的。(5)tnpR基因编码

33、的解离酶作用于共整合基因编码的解离酶作用于共整合体中转座因子的内解离区,切割、重组。体中转座因子的内解离区,切割、重组。(5)tnpR基因编码的解离酶作用于共整合基因编码的解离酶作用于共整合体中转座因子的内解离区,使共整合体发体中转座因子的内解离区,使共整合体发生解离,产生各含有一个生解离,产生各含有一个Tn拷贝的供体拷贝的供体DNA分子和受体分子和受体DNA分子。分子。2、非复制型转位作用、非复制型转位作用 转位酶将供体转位酶将供体DNA的转座因子两侧各切的转座因子两侧各切断一条单链,将靶序列的断一条单链,将靶序列的 2 个游离末端连接个游离末端连接。 随后并没有复制过程,而是由转位酶将供随

34、后并没有复制过程,而是由转位酶将供体体DNA转座因子的另一端也切断,因此在供转座因子的另一端也切断,因此在供体体DNA上留下一个致死性缺口。上留下一个致死性缺口。 转座子的两条游离单链在靶位点退火接合转座子的两条游离单链在靶位点退火接合,DNA聚合酶填平缺口。聚合酶填平缺口。由转座子介导的转座由转座子介导的转座第第 三节三节 真真 核核 生生 物物 基基 因因 组组 一、真核生物基因组的结构一、真核生物基因组的结构与功能的特点与功能的特点(一)真核基因的基本结构(一)真核基因的基本结构1. 结构基因:内含子和外显子结构基因:内含子和外显子 真核生物的结构基因是不连续的,编码真核生物的结构基因是

35、不连续的,编码序列被非编码序列打断。序列被非编码序列打断。在编码序列之间的序列称为内含子(在编码序列之间的序列称为内含子(intron),),编码序列称为外显子(编码序列称为外显子(extron)。)。2. 顺式调控元件顺式调控元件(1)启动子:)启动子: 真核生物的启动子是由真核生物的启动子是由TATA盒、上游启盒、上游启动子元件和转录起始位点组成。动子元件和转录起始位点组成。 启动子(启动子(promoter) 启动子是启动子是RNA聚聚合酶特异性识别和结合的合酶特异性识别和结合的DNA序列。启动子序列。启动子有方向性,位于结构基因转录起始点的上游,有方向性,位于结构基因转录起始点的上游,

36、本身并不被转录。本身并不被转录。(2)上游启动子元件上游启动子元件上游启动子元件是上游启动子元件是TATA盒上游的一些特定盒上游的一些特定的的DNA序列,反式作用因子可与这些元件结序列,反式作用因子可与这些元件结合,通过调节合,通过调节TATA因子与因子与 TATA 盒的结合盒的结合、RNA 聚合酶与启动子的结合及转录起始聚合酶与启动子的结合及转录起始复合物的形成(转录起始因子与复合物的形成(转录起始因子与 RNA 聚合聚合酶结合)来调控基因的转录效率。酶结合)来调控基因的转录效率。(3)反应元件)反应元件 一些信息分子的受体被细胞外信息分子激活一些信息分子的受体被细胞外信息分子激活后,能与特

37、异的后,能与特异的DNA序列结合,调控基因的表序列结合,调控基因的表达。这种特异的达。这种特异的DNA序列实际上也是顺式元件,序列实际上也是顺式元件,由于能介导基因对细胞外的某种信号产生反应,由于能介导基因对细胞外的某种信号产生反应,被称为反应元件(被称为反应元件(response elements)。反应)。反应元件都具有较短的保守序列。这些元件通常位元件都具有较短的保守序列。这些元件通常位于启动子附近和增强子内。有不少是回文序列。于启动子附近和增强子内。有不少是回文序列。糖皮质激素反应元件:糖皮质激素反应元件: 5-AGAACAXXXTGTTCT- 3 3-TCTTGTXXXACAAGA-

38、 5 雌激素反应元件:雌激素反应元件: 5-AGGTCAXXXTGACCT-3 3-TCCAGTXXXACTGGA-5 甲状腺素反应元件:甲状腺素反应元件: 5-AGGTCATGACCT-3 3-TCCAGTACTGGA-5(4)增强子)增强子增强子(增强子(enhancer)是一段)是一段DNA序列,其中序列,其中含有多个能被反式作用因子识别与结合的顺式含有多个能被反式作用因子识别与结合的顺式作用元件。反式作用因子与这些元件结合后能作用元件。反式作用因子与这些元件结合后能够调控(通常为增强)邻近基因的转录。增强够调控(通常为增强)邻近基因的转录。增强子一般位于转录起始点上游子一般位于转录起始

39、点上游100300 bp处,处,但在基因之外或某些内含子中也有增强子序列。但在基因之外或某些内含子中也有增强子序列。(5)加尾信号)加尾信号在结构基因的最后一个外显子中有一个保在结构基因的最后一个外显子中有一个保守的守的AATAAA序列,此位点下游有一段序列,此位点下游有一段GT丰富区,或丰富区,或T丰富区;这两部分序列共同构丰富区;这两部分序列共同构成成poly(A) 加尾信号。加尾信号。(二(二) 基因家族基因家族 (gene family) 基因家族是指核苷酸序列或编码产物基因家族是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。的结构具有一定程度同源性的一组基因。 基因家族中

40、个基因之间的关系:基因家族中个基因之间的关系: (1)家族中各基因的核苷酸序列完全一样)家族中各基因的核苷酸序列完全一样 这些基因家族也被称为单纯多基因家族这些基因家族也被称为单纯多基因家族(如(如rRNA, tRNA基因家族)和复合多基因基因家族)和复合多基因家族(如组蛋白基因家族)。家族(如组蛋白基因家族)。(低等生物的(低等生物的 5.8S rRNA 基因基因 , 28S rRNA 基因基因 , 18S rRNA 基因)基因)(高等生物的(高等生物的 5.8S rRNA 基因基因 , 28S rRNA 基因基因 , 18S rRNA 基因)基因)(1)家族中各基因的核苷酸序列完全一样)家

41、族中各基因的核苷酸序列完全一样 这些基因家族也被称为单纯多基因家族这些基因家族也被称为单纯多基因家族(如(如rRNA, tRNA基因家族)和复合多基因基因家族)和复合多基因家族(如组蛋白基因家族)。家族(如组蛋白基因家族)。tRNA基因基因: 人类基因组约有人类基因组约有1300个个tRNA基因,基因,编码编码50多种多种tRNA。每一。每一tRNA约有约有10个到个到几百个基因拷贝。几百个基因拷贝。同种同种 tRNA 往往串联在往往串联在一起形成基因簇,但基因间有非转录间隔一起形成基因簇,但基因间有非转录间隔区分隔,常常比结构基因长近区分隔,常常比结构基因长近 10 倍。倍。(2)家族中各基

42、因的核苷酸序列高度同源。)家族中各基因的核苷酸序列高度同源。 珠蛋白和珠蛋白和珠蛋白基因家族:珠蛋白基因家族:2121GA 这些基因家族的各个成员在这些基因家族的各个成员在DNA分子上的排分子上的排列顺序按照发育的不同阶段的先后次序排列,因列顺序按照发育的不同阶段的先后次序排列,因而称为受发育控制的复合多基因家族。而称为受发育控制的复合多基因家族。人类生长激素基因家族:包括人生长激素人类生长激素基因家族:包括人生长激素(hGH)、人胎盘促乳素()、人胎盘促乳素(hCS)和催乳素)和催乳素(prolactin)。它们之间同源性很高。)。它们之间同源性很高。hGH 和和hCS 之间:之间:蛋白质氨

43、基酸序列有蛋白质氨基酸序列有 85 的同源性,的同源性,mRNA 序列上有序列上有92 的同源性。的同源性。(3)家族中各基因编码的蛋白质具有高度的)家族中各基因编码的蛋白质具有高度的 同源性,但基因的核苷酸序列可能不同。同源性,但基因的核苷酸序列可能不同。如如 src 基因家族基因家族: src,abl,fes,fgr,fps,fym,kck,lck,lyn,ros,tkl,yesNH2 COOH 蛋白激酶同源结构域(蛋白激酶同源结构域(250个氨基酸残基)个氨基酸残基)此家族中各基因的此家族中各基因的DNA序列没有明显的同源性。序列没有明显的同源性。 (4)家族中各基因编码的蛋白质中具有很

44、)家族中各基因编码的蛋白质中具有很小的保守基序(小的保守基序(conserved motif)。)。如如DEAD box基因家族。基因家族。DEAD box:Asp- Glu-Ala-Asp此家族中各基因的此家族中各基因的DNA序列没有明显的同源序列没有明显的同源性,但所有的表达产物都有解旋酶的功能,都性,但所有的表达产物都有解旋酶的功能,都具有同样的保守基序(具有同样的保守基序(DEAD盒),盒),DEAD是是酶活性的关键结构。酶活性的关键结构。(5)基因超家族)基因超家族 基因超家族(基因超家族(gene superfamily)是指一组)是指一组由多基因家族及单基因组成的更大的基因家族由

45、多基因家族及单基因组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们。它们的结构有程度不等的同源性,因此它们可能都起源于相同的祖先基因,但是它们的功可能都起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。但亲缘关系较远,故将其称为基因超家族。免疫球蛋白超基因家族:表达产物都具有免免疫球蛋白超基因家族:表达产物都具有免疫球蛋白样的结构域结构。疫球蛋白样的结构域结构。2 微球蛋白、微球蛋白、MHC 类抗原的类

46、抗原的链、链、 类类抗原的抗原的链和链和链,链,Thy1 , CD4 , CD8 等与免疫等与免疫有关的分子,以后又陆续发现了许多免疫系统有关的分子,以后又陆续发现了许多免疫系统内和与免疫无关的家族成员。内和与免疫无关的家族成员。 丝氨酸蛋白酶基因超家族:丝氨酸蛋白酶基因超家族: 丝氨酸蛋白酶家族的基因产物都有一个丝氨酸蛋白酶家族的基因产物都有一个特殊的功能区,具有酶的功能。功能区中丝特殊的功能区,具有酶的功能。功能区中丝氨酸是活性中心的关键氨基酸残基。氨酸是活性中心的关键氨基酸残基。 现有很多新成员加进去,如载脂蛋白(现有很多新成员加进去,如载脂蛋白(apolipoprotein),它们只是

47、转移胆固醇蛋白),它们只是转移胆固醇蛋白颗粒中的成分而不具备任何水解蛋白质的酶颗粒中的成分而不具备任何水解蛋白质的酶功能。功能。(三)假基因(三)假基因 假基因(假基因(pseudogenes)是多基因家族中的)是多基因家族中的成员,因碱基顺序发生某些突变而失去功能,成员,因碱基顺序发生某些突变而失去功能,不能表达或表达异常的无生物活性的多肽,这不能表达或表达异常的无生物活性的多肽,这些些DNA 顺序在相应基因名称之前加顺序在相应基因名称之前加表示。表示。-like globin gene family:2121 假基因假基因DNA中的突变可以影响基因表达的中的突变可以影响基因表达的任何一个环

48、节:任何一个环节:转录起始信号消失(顺式元件缺失或突变)转录起始信号消失(顺式元件缺失或突变)mRNA不能正常剪接(剪接位点缺失或突变)不能正常剪接(剪接位点缺失或突变)翻译提前终止(突变产生终止密码子)翻译提前终止(突变产生终止密码子)-like globin gene family:2121与与序列一样,只有序列一样,只有3个点突变。其中密码个点突变。其中密码子子6的的GAGTAG发生无义突变。发生无义突变。假基因普遍存在于真核生物中,在哺乳动物假基因普遍存在于真核生物中,在哺乳动物基因组中,约基因组中,约1/4基因为假基因。基因为假基因。(四)非编码序列(四)非编码序列 非编码序列在基因

49、组非编码序列在基因组 95。 编码序列小于编码序列小于DNA总量的总量的5。 真核生物基因组非常大,即使只有真核生物基因组非常大,即使只有5的的编码序列,其基因数量也可达到原核生物基编码序列,其基因数量也可达到原核生物基因组的基因数量的几十倍。因组的基因数量的几十倍。(五(五) 真核生物基因组中的转座子真核生物基因组中的转座子在真核基因组中,编码序列在染色体中的位置在真核基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重复序列往往是可移相对比较稳定,但一些中度重复序列往往是可移动的。动的。有些可移动成分的结构与原核基因组的转位因有些可移动成分的结构与原核基因组的转位因子相似,是通过子

50、相似,是通过DNA介导的。介导的。而另外一些中度重复序列的转移成分则与一般而另外一些中度重复序列的转移成分则与一般细菌中的转移成分不同,要先转录成细菌中的转移成分不同,要先转录成RNA,再逆,再逆转录生成转录生成cDNA,然后重新整合到基因组中,这,然后重新整合到基因组中,这种逆转录旁路的转移成分称为逆转录转座子(种逆转录旁路的转移成分称为逆转录转座子(retroposon)。)。(六)重复序列(六)重复序列 重复序列中,除了编码重复序列中,除了编码rRNA、tRNA、组蛋白及免疫球蛋白的结构基因外,大部分是组蛋白及免疫球蛋白的结构基因外,大部分是非编码序列。非编码序列。 它们的功能主要与基因

51、组的结构稳定性、它们的功能主要与基因组的结构稳定性、组织形式、以及基因表达的调控有关。组织形式、以及基因表达的调控有关。目前已经发现一些重复序列的特征与遗传病有目前已经发现一些重复序列的特征与遗传病有密切联系,因此可以通过测定某些特定重复序密切联系,因此可以通过测定某些特定重复序列的重复次数而协助遗传病的诊断。列的重复次数而协助遗传病的诊断。根据出现频率的不同可将根据出现频率的不同可将DNA序列分为三类:序列分为三类:1高度重复序列高度重复序列 在基因组中的重复次数在基因组中的重复次数 1052中度重复序列中度重复序列 在基因组中的重复次数为在基因组中的重复次数为1011053单拷贝序列单拷贝

52、序列 在整个基因组中仅出现一次或少数几次在整个基因组中仅出现一次或少数几次(七)端粒(七)端粒 以线性染色体形式存在的真核基因组以线性染色体形式存在的真核基因组DNA的末端都有一种特殊的结构,的末端都有一种特殊的结构,称为端粒(称为端粒(telomere)。)。 该结构是一段该结构是一段DNA序列和蛋白质形成的一序列和蛋白质形成的一种复合体,仅在真核细胞染色体末端存在。种复合体,仅在真核细胞染色体末端存在。 端粒的端粒的DNA序列相当保守,其序列相当保守,其DNA一般由一般由多个串联在一起的短寡核苷酸(多个串联在一起的短寡核苷酸(58 bp)序列)序列构成。构成。 G-rich链由端粒酶合成,

53、链由端粒酶合成,C-rich链通过正常链通过正常DNA合成过程中随从链的合成方式进行合成(需合成过程中随从链的合成方式进行合成(需RNA引物)。引物)。 碱基对成分因种属而异,重复次数在不碱基对成分因种属而异,重复次数在不同生物中变化较大,如小鼠的端粒同生物中变化较大,如小鼠的端粒DNA达达150 kb,人类的端粒,人类的端粒DNA约约515 kb。 端粒功能主要有保护线性端粒功能主要有保护线性DNA的完整复的完整复制、保护染色体末端及决定细胞的寿命等。制、保护染色体末端及决定细胞的寿命等。二、人类基因组中重复顺序二、人类基因组中重复顺序1 1、反向重复顺序、反向重复顺序5GGAAGGTGCG

54、AAGGAAGGTGCGAATTCGCACCTTCCTTCGCACCTTCC33CCTTCCACGCTTCCTTCCACGCTTAAGCGTGGAAGGAAGCGTGGAAGG55GGAAGGTGCGAAGGAAGGTGCGAAAAGCGTGGAAGGAAGCGTGGAAGG33CCTTCCACGCTTCCTTCCACGCTTTTCGCACCTTCCTTCGCACCTTCC5 5AAGCTTAAGCTT3 3TTCGAATTCGAA5 回文序列回文序列 2、串联重复顺序、串联重复顺序(1)编码区串联重复顺序)编码区串联重复顺序 如如 5S rRNA 基因,基因, 组蛋白基因等组蛋白基因等 (2

55、)非编码区串联重复顺序)非编码区串联重复顺序 非编码区串联重复顺序通常存在于非编码区串联重复顺序通常存在于 间隔间隔DNA和内含子内和内含子内 大卫星大卫星DNA,小卫星,小卫星DNA,微卫星,微卫星DNA1)大卫星)大卫星 DNA 总长度:总长度:100 kb 到几个到几个 Mb根据浮力密度分为:根据浮力密度分为: , , , 型及型及、卫星卫星DNA重复单位重复单位: and , 5 bp, (AT-rich),2548 bp, , 171 bp, , about 68 bp 卫星卫星DNA存在于异染色质区域,这存在于异染色质区域,这些区域缠绕紧密、无活性。些区域缠绕紧密、无活性。 异染色质主要存在于着丝粒,在有丝异染色质主要存在于着丝粒,在有丝分裂和减数分裂中形成着丝点、控制染分裂和减数分裂中形成着丝点、控制染色体的运动。色体的运动。 2)小卫星)小卫星 DNA variable number tandem repeat, VNTR 总长度:总长度:0.1 20 kb, 重复单位:重复单位:9 70 bp 端粒端粒DNA (TTAGGG)n 总长度:总长度:2 20 kb3)微卫星)微卫星 DNA 重复单位:重复单位:1 5 bp, 重复数目:重复数目:10 60, 总总 长长 度:度: 150 bp (AC)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论