ch2基因和基因组_第1页
ch2基因和基因组_第2页
ch2基因和基因组_第3页
ch2基因和基因组_第4页
ch2基因和基因组_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 基因和基因组基因和基因组第一节第一节 基因与基因组的概念基因与基因组的概念l基因的概念基因的概念l基因的命名基因的命名 l基因组与基因组与C值矛盾值矛盾 第二节第二节 病毒基因组病毒基因组第三节:细菌的基因组第三节:细菌的基因组第四节第四节 真核生物基因组及其组分真核生物基因组及其组分l真核生物基因组的特点真核生物基因组的特点l真核生物基因组组分真核生物基因组组分 l线粒体和叶绿体基因组线粒体和叶绿体基因组 1. 名词解释:基因、基因组、名词解释:基因、基因组、C值值、C值矛值矛盾、基因家族、基因簇、超基因家族盾、基因家族、基因簇、超基因家族2. 真核生物基因组有何特点真核生物基

2、因组有何特点?作业作业现代基因阶段对基因的定义是:现代基因阶段对基因的定义是: 基因是含有特定遗传信息的一段核苷酸序列,包含产生一条多肽基因是含有特定遗传信息的一段核苷酸序列,包含产生一条多肽链或功能链或功能RNA所必需的全部核苷酸序列所必需的全部核苷酸序列。 根据其是否具有转录和翻译功能可以把基因分为三类:根据其是否具有转录和翻译功能可以把基因分为三类: 第一类是编码多肽链的基因,它具有转录和翻译功能,包括编码第一类是编码多肽链的基因,它具有转录和翻译功能,包括编码 酶和结构蛋白的结构基因以及编码调节蛋白的调节基因;酶和结构蛋白的结构基因以及编码调节蛋白的调节基因; 第二类是只有转录功能而没

3、有翻译功能的基因,包括第二类是只有转录功能而没有翻译功能的基因,包括tRNA基因和基因和rRNA基因;基因; 第三类是不转录的基因,它对基因表达起调节控制作用,包括启第三类是不转录的基因,它对基因表达起调节控制作用,包括启动子和操纵基因。启动子和操纵基因有时被统称为控制基因。动子和操纵基因。启动子和操纵基因有时被统称为控制基因。基因主要位于染色体上,还有染色体外遗传物质基因主要位于染色体上,还有染色体外遗传物质基因主要主要是基因主要主要是DNA分子,还有分子,还有RNA分子分子 基因基因 基因结构研究的历史基因结构研究的历史n从遗传学史的角度看,基因概念大致分以下几个阶段:从遗传学史的角度看,

4、基因概念大致分以下几个阶段: 19世纪世纪60年代初,孟德尔对具有不同形态的豌豆作杂交年代初,孟德尔对具有不同形态的豌豆作杂交实验,在解释实验中每种性状的遗传行为时,用实验,在解释实验中每种性状的遗传行为时,用A代表红花,代表红花,a代表白花,说明生物的某种性状是由遗传因子负责传递的,代表白花,说明生物的某种性状是由遗传因子负责传递的,遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟德尔所说的德尔所说的“遗传因子是代表决定某个性状遗传的

5、抽象符遗传因子是代表决定某个性状遗传的抽象符号。号。 现在所说的现在所说的“基因是生物体传递遗传信息和表达遗传信息的根本物质单位基因是生物体传递遗传信息和表达遗传信息的根本物质单位,实际上就是孟德尔所说明的基因观。,实际上就是孟德尔所说明的基因观。 1926年,摩尔根的巨著年,摩尔根的巨著?基因论基因论?出版,从而建出版,从而建立了著名的基因学说。立了著名的基因学说。基因是染色体上的实体基因是染色体上的实体 基因象链珠基因象链珠(bead)一样,孤立地一样,孤立地呈线状地排列在染色体上呈线状地排列在染色体上基因是基因是功能功能突变突变 交换交换“三位一体的三位一体的 (Three in one

6、) 最小的最小的 不可分割的不可分割的根本的根本的遗传单位遗传单位 1957年,本泽尔年,本泽尔Seymour Benzer以以T4噬噬菌体为材料,在菌体为材料,在DNA分子水平上研究基因内部的精分子水平上研究基因内部的精细结构,提出了顺反子细结构,提出了顺反子cistron概念。概念。 对经典的基因概念的对经典的基因概念的 第一次重要修正与开展第一次重要修正与开展rII47 104 101 103 105 106 51 102 A gene B gene 顺反子假说顺反子假说Theory of cistron o one gene one enzymene gene one enzyme o

7、ne gene one peptide one gene one functionLac. OperonLac. OperonLactoseLactose操纵子理论操纵子理论I P O Z Y A zya基因概念的开展:基因概念的开展:n基因主要位于染色体上,也有染色体外基因基因主要位于染色体上,也有染色体外基因n基因的化学本质是基因的化学本质是DNA或或RNAn断裂基因:断裂基因:1977,Sharp等发现等发现n跳跃基因:跳跃基因:50年代,年代,Mc-Clintockn重叠基因:重叠基因:1978,桑格,桑格(F. Sanger发现发现n管家基因和奢侈基因管家基因和奢侈基因 基因的命名基

8、因的命名 l 大肠杆菌和其它细菌大肠杆菌和其它细菌l细菌的基因用三个小写英文斜体字母表示,后面加上细菌的基因用三个小写英文斜体字母表示,后面加上一个斜体大写字母表示其不同的基因座;全部用正体时一个斜体大写字母表示其不同的基因座;全部用正体时表示蛋白产物和表型,表型第一个字母大写,肩上的符表示蛋白产物和表型,表型第一个字母大写,肩上的符号表示野生型或突变型、抗性或敏感性,数字表示别离号表示野生型或突变型、抗性或敏感性,数字表示别离出的前后顺序。出的前后顺序。l 酵母酵母l三个字母说明基因功能,而后的数字表示不同基因座。三个字母说明基因功能,而后的数字表示不同基因座。 l 线虫线虫 l用三个小写字

9、母表示,如存在多个基因座,用连字符用三个小写字母表示,如存在多个基因座,用连字符后接数字表示。后接数字表示。 l 果蝇果蝇 l可以由可以由1-4个字母表示。个字母表示。 基基 因因 lacZ amp r蛋白质蛋白质 LacZ LacY LacA表表 型型 野生型野生型 Gal; 突变型突变型Gal基因型基因型 野生型野生型 gal; 突变型突变型 gal啤酒酵母啤酒酵母基因基因GAL4 ,CDC28; 蛋白质:蛋白质:GAL4, CDC28。非洲粟酒酵母非洲粟酒酵母基因基因 gal4, cdc2; 蛋白质:蛋白质:Gal4, Cdc2基因基因unc-86, ced-9; 蛋白蛋白UNC-86;

10、 CCED-9 基因基因white(w ), tailless ( tll ), hedgehog ( hh ); 而而蛋白为蛋白为White, Tailless, Hedgehog l对于质粒和其他染色体外成分,对于质粒和其他染色体外成分,l如果是自然产生的质粒,用三个正体字母表示,第一如果是自然产生的质粒,用三个正体字母表示,第一个字母大写,如:个字母大写,如:ColEI;但如果是重组质粒,那么;但如果是重组质粒,那么在两个大写字母之前加一个在两个大写字母之前加一个P,大写字母表示构建该质,大写字母表示构建该质粒的研究者或单位,如粒的研究者或单位,如pSC101SC代表代表Stanley

11、Cohen)。l植物植物l虽然没有惯用法适用于所有植物,但大多数用虽然没有惯用法适用于所有植物,但大多数用1-3个小个小写字母表示。写字母表示。l 脊椎动物脊椎动物 l一般以一般以1-4个小写字母和数字表示其基因功能。例如,个小写字母和数字表示其基因功能。例如,基因基因sey, myc, 蛋白蛋白 Sey, Mycl 人类人类 l方法如脊椎动物但需大写。例如基因方法如脊椎动物但需大写。例如基因 MYC、ENO1,蛋白蛋白MYC、ENO1。对于基因产物的命名以前没有统一。对于基因产物的命名以前没有统一的规定,现在根本上都统一用正体,或全部大写,或第的规定,现在根本上都统一用正体,或全部大写,或第

12、一个字母大写,如一个字母大写,如Gal或或GAL。基因组 要揭开生命的奥秘,就要揭开生命的奥秘,就需要从需要从整体水平整体水平研究基因研究基因的存在、基因的结构与功的存在、基因的结构与功能、基因之间的相互关系。能、基因之间的相互关系。 基因组基因组genome指生物体或细胞一套完整单倍体的指生物体或细胞一套完整单倍体的遗传物质总和。遗传物质总和。 基因组有两层含义:遗传物质和遗传信息。基因组有两层含义:遗传物质和遗传信息。 以以DNA长度和基因数目表示。长度和基因数目表示。 分为核基因组、核外基因组分为核基因组、核外基因组 原核生物包括:核基因组、质粒;原核生物包括:核基因组、质粒; 真核生物

13、包括:单倍核基因组、细胞器基因组、质粒;真核生物包括:单倍核基因组、细胞器基因组、质粒;物种物种 核基因组大小核基因组大小bp 基因数目基因数目 大肠杆菌大肠杆菌 6 4 000酿酒酵母酿酒酵母 7 6 000拟南芥拟南芥 8 25 000果蝇果蝇 8 10 000小鼠小鼠 9 80 000人类人类 9 65000-80000 C值:值:指生物单倍体指生物单倍体基因组的全部基因组的全部DNA的的含量,单位以含量,单位以pg或或Mb表示。表示。 C值矛盾值矛盾 C值和生物结构或组成的复杂性不一致的现象。值和生物结构或组成的复杂性不一致的现象。 主要表现为:主要表现为:C值不随生物的进化程值不随生

14、物的进化程度和复杂性而增加度和复杂性而增加亲缘关系密切的生物亲缘关系密切的生物C值相差很大值相差很大高等真核生物具有比高等真核生物具有比用于遗传高得多的用于遗传高得多的C值。值。病毒病毒不具细胞结构不具细胞结构,有遗有遗传、复制等生命特征传、复制等生命特征的微生物的微生物病毒基因组的结构特点病毒基因组的结构特点 与细菌相比,病毒基因组很小,大小相差较大。与细菌相比,病毒基因组很小,大小相差较大。病毒基因组由病毒基因组由DNA组成,也可以由组成,也可以由RNA组成,每种病毒组成,每种病毒颗粒中只含有一种核酸,核酸结构可以是单链或双链、环状颗粒中只含有一种核酸,核酸结构可以是单链或双链、环状或线状

15、。或线状。有重叠基因。有重叠基因。大局部是用来编码蛋白质的,基因间的间隔序列较短。大局部是用来编码蛋白质的,基因间的间隔序列较短。 功能上相关的基因集中成簇,在基因组的特定的部位功能上相关的基因集中成簇,在基因组的特定的部位,形形成一个功能单位或转录单元,转录产物为多顺反子,之后经成一个功能单位或转录单元,转录产物为多顺反子,之后经过简单加工。过简单加工。噬菌体的基因是连续的;而真核细胞病毒的基因是不连噬菌体的基因是连续的;而真核细胞病毒的基因是不连续的,具有内含子。续的,具有内含子。艾滋病毒的基因结构艾滋病毒的基因结构 vpr rev rev gag vif tat vpu tat nefL

16、TR pol env LTR 基因组:双链正链基因组:双链正链RNA,5端帽子结构:端帽子结构:7G5GmpNp3:polyA,长约,含长约,含gag、Pol、env、3个结构基因,及至少个结构基因,及至少6个调控基因个调控基因Tat Rev、Nef、Vif、VPU、Vpr基因组的基因组的5端和端和3端各含长末端序列。端各含长末端序列。HIV LTR含顺式调控序列,它们控制前病毒基因的表达。已证明在含顺式调控序列,它们控制前病毒基因的表达。已证明在LTR有启动子有启动子和增强子并含负调控区。和增强子并含负调控区。 细菌细菌 属于原核型细胞的一种单胞生物属于原核型细胞的一种单胞生物,形体微小形体

17、微小,结构简单。无成形细结构简单。无成形细胞核、也无核仁和核膜,胞核、也无核仁和核膜, 沙门氏干菌沙门氏干菌, 博德氏菌博德氏菌, 梭狀干菌梭狀干菌, 大肠干菌大肠干菌; 螺旋菌螺旋菌, 葡萄球菌葡萄球菌 细菌的染色体基因组通常仅由一条环状双链细菌的染色体基因组通常仅由一条环状双链DNA分子组成,染色分子组成,染色 体相对聚集在一起,形成一个较为致密的区域,称为类核。体相对聚集在一起,形成一个较为致密的区域,称为类核。只有一个复制起点,数个相关的结构基因串联在一起,受同一调只有一个复制起点,数个相关的结构基因串联在一起,受同一调控区调节,合成多顺反子控区调节,合成多顺反子mRNA。具有操纵子结

18、构。具有操纵子结构。编码蛋白质的基因都是单拷贝,但编码蛋白质的基因都是单拷贝,但rRNA基因是多拷贝。基因是多拷贝。和病毒的基因组相似,非编码的和病毒的基因组相似,非编码的DNA部份所占比例比真核细胞基部份所占比例比真核细胞基因组少得多。因组少得多。基因组基因组DNA中具有多种调控区如复制起始区、复制终止区、转录中具有多种调控区如复制起始区、复制终止区、转录启动区和终止区等,还有重复序列,比病毒基因组复杂。启动区和终止区等,还有重复序列,比病毒基因组复杂。具可移动的具可移动的 DNA序列序列细菌染色体基因组结构的一般特点细菌染色体基因组结构的一般特点 含有含有3500个基因,已被定位个基因,已

19、被定位的有的有900个左右。在这个左右。在这900个基个基因中,有因中,有260个基因已查明具有个基因已查明具有操纵子结构,定位于操纵子结构,定位于75个操纵个操纵子中。在的基因中子中。在的基因中8的序列具的序列具有调控作用。有调控作用。 大肠杆菌基因组大肠杆菌基因组 真核生物真核生物在细胞结构、功能在细胞结构、功能上远远比原核生物复杂,具有细胞上远远比原核生物复杂,具有细胞核结构,能进行有丝分裂,细胞质核结构,能进行有丝分裂,细胞质内存在线粒体或同时存在叶绿体等内存在线粒体或同时存在叶绿体等多种细胞器的生物。多种细胞器的生物。真核生物基因组的特点真核生物基因组的特点真真核核生生物物基基因因组

20、组组组分分 核内染色体核内染色体DNA 核外细胞器核外细胞器DNA 线粒体线粒体DNA叶绿体叶绿体DNA质粒质粒 核内染色体核内染色体DNA真核生物真核生物DNA序列类型序列类型 真核生物基因组是十分复杂的,不像原核生物多由真核生物基因组是十分复杂的,不像原核生物多由单一序列组成,而是由各种重复序列和单一序列组成。单一序列组成,而是由各种重复序列和单一序列组成。根据根据DNA序列出现频率的不同,可分为不同的类型。序列出现频率的不同,可分为不同的类型。l单拷贝序列单拷贝序列l低度重复序列低度重复序列l中度重复序列中度重复序列 l高度重复序列高度重复序列 根据重复序列有无编码功能根据重复序列有无编

21、码功能l基因家族基因家族l基因外重复基因外重复DNA序列序列根据重复形式根据重复形式l串联重复串联重复l散布重复散布重复 各种基因家族各种基因家族 卫星卫星DNA串联重复序列串联重复序列基因外序列:基因外序列: 长散在重复序列长散在重复序列(long interspersed repeated segments, LINES),长度长度1000bp(可达可达7Kb),拷贝数,拷贝数104-105,如人,如人LINE-1家族、家族、人人THE-1家族、人家族、人HERV/RTLV家族、转座子和逆转座子家族、转座子和逆转座子 短散在重复序列短散在重复序列(Short interspersed re

22、peated segments,SINES ) , 长度长度105如如Alu家族、家族、Kpn家族等家族等基因序列:基因序列: 散布的基因家族散布的基因家族散布重复序列散布重复序列 卫星卫星DNA SINE和和LINE基因外重复序列基因外重复序列单拷贝序列单拷贝序列 单拷贝顺序在单倍体基因组中只出现一次,因而单拷贝顺序在单倍体基因组中只出现一次,因而复性速度很慢。单拷贝顺序中储存了巨大的遗传信息,复性速度很慢。单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质。编码各种不同功能的蛋白质。低度重复序列低度重复序列 低度重复序列是指在基因组中含有低度重复序列是指在基因组中含有210个拷贝的

23、个拷贝的序列,如酵母序列,如酵母tRNA基因、人和小鼠的珠蛋白基因家族基因、人和小鼠的珠蛋白基因家族等。等。 中度重复序列中度重复序列 中度重复序列的特点:中度重复序列的特点: 长度长度3007000bp,数十到十万个拷贝,占总,数十到十万个拷贝,占总DNA的的10%40%,少数是编码序列,如,少数是编码序列,如rRNA基因家族,基因家族,tRNA基基因家族和组蛋白的基因家族,大局部是基因表达调控序列,因家族和组蛋白的基因家族,大局部是基因表达调控序列,如如 Alu家族、家族、KpnI家族,转座子元件家族,转座子元件 高度重复序列高度重复序列 以以串联重复串联重复的形式的形式成簇成簇存在大多数

24、高等真核生存在大多数高等真核生物基因组中特定区域,重复次数大多可达物基因组中特定区域,重复次数大多可达106以上以上 的的DNA序列,属于序列,属于基因外基因外的重复的重复DNA序列。序列。 人类基因组高等重复序列占人类基因组高等重复序列占20%左右,根据左右,根据重复单位的数目多少以及结构特点分为重复单位的数目多少以及结构特点分为3类:类:l卫星卫星DNA序列序列l小卫星小卫星DNA序列序列l微卫星微卫星DNA序列序列l隐蔽卫星隐蔽卫星DNA序列序列图图 小鼠小鼠DNA经经CsClMI度梯度离心显示度梯度离心显示出主带和卫星出主带和卫星DNA带带卫星卫星DNA序列序列重复单位重复单位5100

25、bp,长度,长度100kb数数Mb,可分为卫星,可分为卫星序列序列1、2、3、和和,主主 要分布在要分布在着丝粒区和异染色着丝粒区和异染色质区。质区。 小卫星小卫星DNA序列序列又称可变数目串联重复又称可变数目串联重复variable number tandem repeat,VNTR) ,重复单位,重复单位6-40bp,每个拷贝长度,每个拷贝长度6-100次,分为位于邻近染色体端粒的区域端次,分为位于邻近染色体端粒的区域端粒家族,以及分散在基因组的多个位置上高变家粒家族,以及分散在基因组的多个位置上高变家族,一般没有转录活性。族,一般没有转录活性。 小卫星小卫星DNA序列具有极强的个体特异性

26、,序列具有极强的个体特异性,因此可以用于因此可以用于DNA指纹图谱分析指纹图谱分析微卫星微卫星DNA序列序列 又称短串联重复又称短串联重复short tandem repeat,STR或简单重复或简单重复序列序列simple sequence repeats,SSR,重复单位,重复单位2-6bp,每个,每个拷贝长度拷贝长度20肌球蛋白肌球蛋白5-10维管蛋白维管蛋白3-15昆虫卵壳蛋白昆虫卵壳蛋白50珠蛋白珠蛋白达到达到5免疫球蛋白可免疫球蛋白可变区变区500卵清蛋白卵清蛋白3组蛋白组蛋白100-1000 假基因:一种类似于基因序列,其核苷酸序列同假基因:一种类似于基因序列,其核苷酸序列同其相

27、应的正常功能基因根本相同、但却不能合成功能其相应的正常功能基因根本相同、但却不能合成功能蛋白的失活基因。蛋白的失活基因。 缺乏与功能的调控区,使其不缺乏与功能的调控区,使其不能进行正常的转录能进行正常的转录 即使能转录,但由于突变或缺即使能转录,但由于突变或缺失等,引起失等,引起mRNA加工缺陷加工缺陷 使使mRNA翻译提前终止翻译提前终止 产生无功能的肽链产生无功能的肽链rRNArRNA基因基因l真核生物有真核生物有4 4种种rRNArRNA18S18S、28S28S、5S5S、5.8S )5.8S )l18S18S、28S28S和和5.8S rRNA5.8S rRNA基因在同一转录单位基因

28、在同一转录单位rDNArDNAl5S rRNA5S rRNA基因单独转录单位基因单独转录单位l在低等真核生物子囊酵母和担子菌中在低等真核生物子囊酵母和担子菌中5S rRNA5S rRNA编编码基因和码基因和rDNArDNA相邻,位于染色体的核仁组织区相邻,位于染色体的核仁组织区NOR)NOR)l动物、植物和大多数丝状子囊菌中动物、植物和大多数丝状子囊菌中5S rRNA5S rRNA编码基因编码基因不在不在NORNOR区,而是在染色体上,和区,而是在染色体上,和rDNArDNA位于不同区域位于不同区域l基因间间隔区基因间间隔区IntergenicIntergenic spacer (IGS) s

29、pacer (IGS)l内转录间隔区内转录间隔区Internal transcribed spacer (ITS) Internal transcribed spacer (ITS) rRNA转录单位转录单位l00copyrRNA基因簇(重复单元28S、18S、5.8s-rRNA)双链区域双链区域单倍体人基因组中单倍体人基因组中1300个个tRNA基因,基因,tRNA基因簇基因簇 H1 H4 H2B H3 H2A海 胆 (R) 6000bp海 胆 (S) 6540bp海 胆 (L) 7240bp H1 H3 H4 H2A H2B果 蝇 4800bp H1 H3 H2B H2A H4蝾 螈 9000bp 图 10-31 组 蛋 白 基 因 簇 的 重 复 单 位 图 例 : 基 因 ; 间 隔 区 ; 转 录 方 向 30-40copy定位:定位:7q32-q36组蛋白基因簇组蛋白基因簇(重复单位:重复单位:H1,H2A,H2B,H3、H4)由发育阶段控制的多基因家族由发育阶段控制的多基因家族 人类珠蛋白基因家族典型的人类珠蛋白基因家族典型的血红蛋白血红蛋白珠蛋白珠蛋白血红素血红素 2 2 2 2 不同的亚基由各自不同的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论