现代分子生物学第三章_第1页
现代分子生物学第三章_第2页
现代分子生物学第三章_第3页
现代分子生物学第三章_第4页
现代分子生物学第三章_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Chapter 3 Genome and Gene 第一节第一节 基因基因 一、基因概念的发展一、基因概念的发展 (一)经典遗传学经典遗传学 1、1865, Mendel: 控制性状的因子控制性状的因子-遗传因子遗传因子 2、 1909, Johannsen 提出基因(提出基因(genegene)的概念,取)的概念,取 代遗传因子代遗传因子 3、 1910, 1916, Morgan: 将基因定位在染色体上将基因定位在染色体上 1、In 1941, Beadle and Tatum 一基因一酶学说一基因一酶学说 阐明了基因是通过对酶的控制来决定性状的阐明了基因是通过对酶的控制来决定性状的 一基

2、因一蛋白一基因一蛋白 一基因一多肽链一基因一多肽链 2、In 1944,Avery DNADNA是生物遗传的物质基础是生物遗传的物质基础 (二)分子遗传学对基因概念的新发展(二)分子遗传学对基因概念的新发展 3、In 1961, Jacob and Monod 乳糖操纵子模型乳糖操纵子模型 (1)结构基因(结构基因(structural gene) 指可编码非调控指可编码非调控RNA或蛋白质的一段或蛋白质的一段DNA序列序列 血红蛋白血红蛋白 编码核糖体编码核糖体RNA基因基因 (2)(2)调节基因调节基因( (regulatory gene) ) 指其表达产物参与调控其它基因表达的基因。指其

3、表达产物参与调控其它基因表达的基因。 lacZlacYlacA PlacIPlac Olac lacI mRNA 小 结 基因可控制生物的性状基因可控制生物的性状 基因位于染色体上基因位于染色体上 基因的物质基础是基因的物质基础是DNA(或(或RNA) 基因是通过指导合成蛋白质或基因是通过指导合成蛋白质或RNA来来 决定性状的决定性状的 基因有结构基因和调节基因之分基因有结构基因和调节基因之分 (三)基因概念的进一步发展(三)基因概念的进一步发展 1、重叠基因重叠基因( (Overlapping genes) 指在同一段指在同一段DNA序列上,由于阅读框架不同序列上,由于阅读框架不同 或终止早

4、晚不同,可同时编码两个以上多肽。或终止早晚不同,可同时编码两个以上多肽。 Sanger(1977)年发现了年发现了174单链单链 DNA病毒中有病毒中有6个基因是重叠的。个基因是重叠的。 Overlapping genes in phage X174 采莲人在绿杨津,采莲人在绿杨津, 在绿杨津一阙新;在绿杨津一阙新; 一阙新歌声漱玉,一阙新歌声漱玉, 歌声漱玉采莲人。歌声漱玉采莲人。 2、断裂基因(断裂基因(Split Genes) 指基因内部被一个或更多不编码顺序所隔裂指基因内部被一个或更多不编码顺序所隔裂 (1 1)内含子)内含子(intron): DNA序列中不出现在成熟序列中不出现在成

5、熟mRNA的片段;的片段; (2 2)外显子)外显子(extron): DNA序列中出现在成熟序列中出现在成熟mRNA中的片段。中的片段。 Discovery In 1977, Roberts and Sharp 3 3、跳跃基因:、跳跃基因:Jumping Genes (Transposons) 存在于染色体存在于染色体DNA上可自主转移座位的基本单上可自主转移座位的基本单 位,可位,可在同一染色体内或不同染色体之间移动在同一染色体内或不同染色体之间移动 Transposons in maize 40年代初,年代初,McClintock研究玉米花斑糊粉层研究玉米花斑糊粉层 和植株色素产生的遗

6、传基础时发现转座因子和植株色素产生的遗传基础时发现转座因子 4 4、管家基因、管家基因(组成组成型型基因基因) Housekeeping genes : 是是那那些些(理理论论上上)在在所所有细胞中有细胞中都都表达表达的基因,因的基因,因为为 其其功功能能对对任何任何细胞细胞型型都都是是必必要要的。的。 (维持细胞生存不可缺少)(维持细胞生存不可缺少) 5 5、奢侈基因(、奢侈基因(Luxury genes): 在在特殊的特殊的细胞类细胞类型型中大量中大量表达表达并并编码特殊编码特殊功功能能 产物的基因。产物的基因。 (与细胞分化有关,与组织特异性表达有关)(与细胞分化有关,与组织特异性表达有

7、关) 二、基因的定义 产生一条多肽链或功能性产生一条多肽链或功能性RNA所必须的全部核所必须的全部核 苷酸序列苷酸序列 1、RNA基因(基因(RNA genes) 编码功能性的编码功能性的RNA分子分子 RNA产物有很多参与基因表达的调控,如产物有很多参与基因表达的调控,如 MicroRNA 2、蛋白质编码基因(、蛋白质编码基因(protein-coding genes) (1)编码区)编码区(coding region) 指在翻译时对应于多肽的氨基酸序列的一段核指在翻译时对应于多肽的氨基酸序列的一段核 苷酸序列苷酸序列 (2)非编码区()非编码区(Untranslated regions ,

8、UTR) 能够转录但不被翻译的核苷酸序列能够转录但不被翻译的核苷酸序列 功能:功能:蛋白质合成的调控蛋白质合成的调控 5-UTR ;3-UTR ATG 5 TAA 3 3、顺反子:、顺反子: 等同于基因,是编码一条完整多肽链的一段等同于基因,是编码一条完整多肽链的一段 核苷酸序列。核苷酸序列。 多顺反子:多顺反子:原核生物中数个结构基因常串联在一原核生物中数个结构基因常串联在一 起,受同一调节区控制,转录生成的起,受同一调节区控制,转录生成的mRNA 可编码几种功能相关的蛋白质。可编码几种功能相关的蛋白质。 lacZlacYlacA PlacIPlac Olac lacI UAAAUGAUG

9、UAA. 5 3 单顺反子单顺反子:一个编码基因转录只生成一个:一个编码基因转录只生成一个 mRNA分子,经翻译生成一条多肽链。分子,经翻译生成一条多肽链。 UAAAAAA AUG 5 3 第二节第二节 遗传信息的传递遗传信息的传递 一、 中心法则(The central dogma) In 1958, Crick 1. DNA是自身复制的模板;是自身复制的模板; 2. DNA通过转录作用将遗传信息传递给中间物质通过转录作用将遗传信息传递给中间物质RNA; 3. RNA通过翻译作用将遗传信息表达成蛋白质。通过翻译作用将遗传信息表达成蛋白质。 中心法则揭示了遗传信息的传递方向,反映了中心法则揭示

10、了遗传信息的传递方向,反映了DNA、 RNA和蛋白质之间的相互关系。和蛋白质之间的相互关系。 DNA RNA Protein Transcription Translation replication 二、中心法则的挑战中心法则的挑战 1、 反转录(Reverse transcription) In 1970, Baltimore and Temin 发现逆转录酶逆转录酶 (reverse transcriptase) 2、RNA 复制 3、RNA 编辑(RNA editing) 是指转录后的是指转录后的RNA在编码区发生碱基的加入,在编码区发生碱基的加入, 丢失或转换等现象丢失或转换等现象

11、4、表观遗传(Epigenetic Inheritance) 是指在是指在DNA序列没有发生变化的情况下,基因序列没有发生变化的情况下,基因 表达的可遗传的改变表达的可遗传的改变 The calico phenotype shows effects of mosaicism of X- linked traits in female mammals an epigenetic phenomenon. (1)表观遗传修饰)表观遗传修饰(Epigenetic modification) DNA甲基化; 组蛋白修饰; microRNA (2)表观遗传学补充了“中心法则”忽略的两个 问题: a、哪些因

12、素决定了基因的正常转录和翻译 b、对基因组而言,不仅仅是序列包含遗传信息, 而且其修饰也可以记载遗传信息。 5、朊病毒朊病毒 (Prion) 疯牛病疯牛病, ,学名为牛海绵状脑病学名为牛海绵状脑病(BSE) 人和动物的可转移性神经退化疾病人和动物的可转移性神经退化疾病 In 1982, Prusiner, discovering prion PrPC PrPSc 三、修改后的中心法则 protein DNA RNA replication transcriptionReverse transcription RNA editingRNA replication translation 第三节第

13、三节 基因组(基因组(Genome) 一、概述:一、概述: 1、概念:、概念: 是指细胞或生物体单倍体染色体上的所有遗传物质的是指细胞或生物体单倍体染色体上的所有遗传物质的 总称(包括所有的遗传信息)总称(包括所有的遗传信息) (1)细菌和病毒基因组:是指染色体上所含的全部)细菌和病毒基因组:是指染色体上所含的全部DNA (2)二倍体及多倍体真核生物的基因组:)二倍体及多倍体真核生物的基因组: 一个物种单倍体所有染色体上的遗传物质的总称。一个物种单倍体所有染色体上的遗传物质的总称。 如人类基因组:包括如人类基因组:包括24条染色体条染色体 2、基因组大小(、基因组大小(Genome size)

14、 haploid genome C值值(C-value):): size of the haploid genome 一种生物单倍体基因组一种生物单倍体基因组DNA的总量的总量 讨论讨论:C值大小与生物遗传复杂性是否成正相关?值大小与生物遗传复杂性是否成正相关? C值在低等真核生物中与遗传复杂性有一定的正值在低等真核生物中与遗传复杂性有一定的正 相关,但在高等真核生物中却并非如此,它们的相关,但在高等真核生物中却并非如此,它们的 C值变化不定。值变化不定。 Insects4.7 107 1.2 107 Amphibians9.5 108 1.0 1011 Flowering plants 9.

15、5 107 1.2 1011 C值矛盾(值矛盾(C-value paradox) 生物基因组的大小同生物在进化生物基因组的大小同生物在进化 上所处地位的高低无关上所处地位的高低无关 3. 基因密度基因密度 是指每是指每Mb基因组基因组DNA上基因的平均数目。上基因的平均数目。 生物体的复杂度与基因密度存在大致负相关的生物体的复杂度与基因密度存在大致负相关的 关系。关系。Why? 二、真核生物基因组二、真核生物基因组 (一)非编码(一)非编码DNA 不编码蛋白质的不编码蛋白质的DNA序列序列 (没有确定功能)(没有确定功能) 如人类:如人类:30亿对核苷酸,预计亿对核苷酸,预计10万个基因,万个

16、基因, 实际为实际为22.5万蛋白编码基因(占整万蛋白编码基因(占整 个基因组的个基因组的2%) 内含子内含子 基因间隔序列(功能未知)基因间隔序列(功能未知) 1、内含子、内含子 物种物种基因平均基因平均 长度长度 平均内含子平均内含子 个数个数/基因基因 mRNA平均平均 长度长度 线虫线虫4kb343kb 果蝇果蝇11kb343kb 人类人类16kb672.5kb 内含子的普遍性内含子的普遍性 n不仅大多数蛋白质编码的基因有内含子不仅大多数蛋白质编码的基因有内含子, rRNA, tRNA基因也有内含子。基因也有内含子。 n大肠杆菌噬菌体大肠杆菌噬菌体T4胸腺嘧啶合成酶基因有胸腺嘧啶合成酶

17、基因有 内含子。内含子。 n某些低等真核生物的线粒体和叶绿体基因某些低等真核生物的线粒体和叶绿体基因 中有内含子。中有内含子。 内含子的相对性内含子的相对性 n内含子有时也编码蛋白内含子有时也编码蛋白 n并非真核生物所有的基因都有内含子并非真核生物所有的基因都有内含子 真核生物组蛋白基因真核生物组蛋白基因, 酵母的大多数基因无酵母的大多数基因无 内含子内含子 具有编码功能的内含子具有编码功能的内含子: 如可移动内含子如可移动内含子 编码编码3种蛋白质:种蛋白质: (1)内切核酸酶:能切割)内切核酸酶:能切割DNA上的靶序列并且上的靶序列并且 允许内含子插入允许内含子插入 (2)反转录酶:以自身

18、)反转录酶:以自身RNA为模板产生为模板产生DNA拷贝拷贝 (3)成熟酶:在将特定内含子从前体)成熟酶:在将特定内含子从前体mRNA中剪中剪 除时起作用除时起作用 内含子的移动类似转座机制内含子的移动类似转座机制 内含子的类型内含子的类型 (1)GU-AG 内含子:真核细胞核内含子:真核细胞核mRNA前体中前体中 (2)AU-AC 内含子:真核细胞核内含子:真核细胞核mRNA前体中前体中 (3)型内含子:主要在真核细胞型内含子:主要在真核细胞核核rRNA前体中前体中 自我剪接自我剪接 (4)型内含子:细胞器型内含子:细胞器RNA、某些原核生物、某些原核生物RNA 自我剪接自我剪接 内含子与进化

19、内含子与进化 (1)特点:外显子的保守程度远高于内含子,)特点:外显子的保守程度远高于内含子, 内含子的序列是多变的内含子的序列是多变的 (2)合理解释:)合理解释: 内含子序列最终不出现在内含子序列最终不出现在mRNA的序列的序列 中,即使发生改变也不会受到自然选择中,即使发生改变也不会受到自然选择 的压力的压力 (3)在进化上的意义)在进化上的意义 a、 有利于生物遗传的相对稳定有利于生物遗传的相对稳定 b、积累突变的内含子可能演化为新的基因、积累突变的内含子可能演化为新的基因 c、扩大了生物体的遗传信息储量、扩大了生物体的遗传信息储量 2、基因间隔序列(功能未知)、基因间隔序列(功能未知

20、) -主要由重复序列组成主要由重复序列组成 串联重复序列:如卫星串联重复序列:如卫星DNA 分散重复序列分散重复序列 :如:如Alu元件元件 (二)重复序列(二)重复序列DNA 单一序列单一序列 / 中度重复序列中度重复序列 / 高度重复序列高度重复序列 附附: 复性动力学复性动力学: 根据序列的拷贝数不同在基因组根据序列的拷贝数不同在基因组DNA复性过程复性过程 中的复性速率不同的原理,来识别不同种类的重中的复性速率不同的原理,来识别不同种类的重 复序列复序列DNA的一种技术。的一种技术。 思考思考: 复性速度与基因组重复序列拷贝数的有什复性速度与基因组重复序列拷贝数的有什 么关系么关系?

21、人类和人类和E.coli DNA的理想复性动力学曲线的理想复性动力学曲线 ( (一一) )单一序列(单一序列( unique sequence DNA) 基因组中只有一个或几个拷贝的基因组中只有一个或几个拷贝的DNA序列序列 (真核生物结构基因多属于单一序列)(真核生物结构基因多属于单一序列) (二二) 中度重复序列(中度重复序列(moderately repetitive DNA) 基因组中重复次数在基因组中重复次数在10 105之间的之间的DNA序列序列 如如rRNA、tRNA的基因,组蛋白基因的基因,组蛋白基因 1、串联重复序列(串联重复序列(Tandem repeat sequence

22、s) 基因簇:基因簇: 基因家族中一组相同或相关基因串联基因家族中一组相同或相关基因串联 排列在一起排列在一起 如:如: rDNA-基因簇重复多次基因簇重复多次 组蛋白基因(组蛋白基因(5 genes)-基因簇重复多次基因簇重复多次 2、散在重复序列(、散在重复序列(dispersed repetitive DNA) 分散分布在基因组中的中等重复序列分散分布在基因组中的中等重复序列 (1)短散在元件)短散在元件 SINE:Alu 元件(元件(300 bp) (2)长散在元件)长散在元件 LINE:L1 元件(元件(6500 bp) Alu 元件和元件和L1 元件占人类基因组的元件占人类基因组的

23、10% 功能:没有被证明有功能功能:没有被证明有功能 (三)高度重复序列(三)高度重复序列(highly repetitive DNA) 基因组中重复次数超过基因组中重复次数超过106 的的DNA序列序列 卫星卫星DNA(Satellite DNA) 1、概念:真核生物基因组中、概念:真核生物基因组中由许多短的基本重由许多短的基本重 复单位构成的连续重复的一种高度重复序列。复单位构成的连续重复的一种高度重复序列。 短短重复单位:重复单位:2bp至至2030bp 5 ATAAACTATAAACTATAAACT 3 3 TATTTGATATTTGATATTTGA 5 果蝇的卫星果蝇的卫星DNA重复

24、单位重复单位 n 密度梯度离心,卫星密度梯度离心,卫星DNA 与其他与其他DNA分开。形成两分开。形成两 个峰:较大的主峰和高度个峰:较大的主峰和高度 重复序列小峰重复序列小峰 Buoyant density Optical absorbance Mouse DNA / CsCl Main bandsatellite 2、特点:、特点:GC 含量低,因而具有较低的浮力密度含量低,因而具有较低的浮力密度 3、位置:卫星、位置:卫星DNA位于着丝粒部位位于着丝粒部位 是异染色质的组成成分是异染色质的组成成分 4、功能:没有被证明有功能、功能:没有被证明有功能 5、微卫星、微卫星DNA (micro

25、satellite DNA) 简短串联重复简短串联重复-STR 特点:特点: (1 1)重复单位长度在)重复单位长度在2 26bp6bp之间之间 (2 2)较为平均地沿染色体分布)较为平均地沿染色体分布 6、小卫星、小卫星DNA (minisatellite DNA) 可变串联重复可变串联重复-VNTR 特点:特点: (1)拷贝数具有高度可变性拷贝数具有高度可变性 (2 2)重复单位长度在)重复单位长度在151565bp65bp之间之间 (3 3)一般出现在染色体的末端)一般出现在染色体的末端 DNA fingerprinting GGGCAGGAXG CCCGTCCTXC Progeny P

26、arents 5 6 7 8 9 (三)基因家族(三)基因家族 一个祖先基因经重复或突变所产生的功能相关一个祖先基因经重复或突变所产生的功能相关 的同源基因的同源基因 假基因:基因家族中因突变而失去功能的基因假基因:基因家族中因突变而失去功能的基因 基因簇:基因家族中一组相同或相关基因串联排列基因簇:基因家族中一组相同或相关基因串联排列 在一起而形成在一起而形成 如如rRNA、tRNA和组蛋白的基因和组蛋白的基因; 孤独基因孤独基因 :基因家族中在独立位点上的单个基因:基因家族中在独立位点上的单个基因 典型的基因家族典型的基因家族 1tRNA基因基因 单倍体人基因组中单倍体人基因组中1300个

27、个tRNA基因基因,tRNA 基因簇基因簇 2rRNA基因基因 l00copy rRNA基因簇基因簇(重复单元重复单元: 28S、18S、5.8s- rRNA) 3组蛋白基因组蛋白基因 30-40copy 组蛋白基因簇组蛋白基因簇(重复单位:重复单位:H1,H2A,H2B, H3、H4) 特点:无特点:无intron,Poly(A)- RNA 4珠蛋白基因珠蛋白基因 (四)(四)DNA的多态性的多态性 DNA序列发生变化而导致的个体间核苷酸序列的序列发生变化而导致的个体间核苷酸序列的 差异差异 1、RFLP(限制性片段长度多态性)(限制性片段长度多态性) DNA序列上的微小变化,甚至序列上的微

28、小变化,甚至1个核苷酸的变化,也个核苷酸的变化,也 能引起限制性内切酶切点的丢失或产生,导致酶切片能引起限制性内切酶切点的丢失或产生,导致酶切片 段长度的变化段长度的变化 2、DNA重复序列多态性(重复序列多态性(RSP) 表现为重复序列拷贝数的变异表现为重复序列拷贝数的变异 (1)小卫星)小卫星DNA:(可变串联重复:(可变串联重复-VNTR) 重复单位长度在重复单位长度在15-65个核苷酸左右个核苷酸左右 (2)微卫星)微卫星DNA: 重复单位长度在重复单位长度在2-6个核苷酸之间,又称为简个核苷酸之间,又称为简 短串联重复(短串联重复(STR、STRP或或SSLP)。)。 3、单核苷酸的

29、多态性(、单核苷酸的多态性(SNP):): 分散于基因组中的单个碱基的差异,即包分散于基因组中的单个碱基的差异,即包 括单个碱基的缺失、插入和替换。括单个碱基的缺失、插入和替换。 三、原核生物的基因组三、原核生物的基因组 特点:特点: 1、功能相关的几个结构基因往往串联在、功能相关的几个结构基因往往串联在起,起, 受它们上游的共同调控区控制,形成操纵子受它们上游的共同调控区控制,形成操纵子 2、结构基因为多顺反子、结构基因为多顺反子 3、结构基因中没有内含子、结构基因中没有内含子 4、DNA大部分为编码序列大部分为编码序列 5、重复序列不多(单拷贝基因)、重复序列不多(单拷贝基因) 6、有重叠基因、有重叠基因 四、病毒基因组的特点四、病毒基因组的特点 1每种病毒只有一种核酸,每种病毒只有一种核酸,DNA或或RNA; 2病毒核酸大小差别很大;病毒核酸大小差别很大; 3除逆转录病毒外,病毒基因都是单拷贝的。除逆转录病毒外,病毒基因都是单拷贝的。 4大部分病毒核酸是由一条双链或单链分子大部分病毒核酸是由一条双链或单链分子 (RNA或或DNA) 5真核病毒基因有内含子,而噬菌体基因中真核病毒基因有内含子,而噬菌体基因中 无内含子无内含子 6有重叠基因有重叠基因 真核生物基因组真核生物基因组 大,线状大,线状 与组蛋白结合与组蛋白结合 线粒体线粒体 / 叶绿体叶绿体 单顺反子单顺反子 断

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论