分子生物学课件2Ch2 Genomic DNA, Genes_第1页
分子生物学课件2Ch2 Genomic DNA, Genes_第2页
分子生物学课件2Ch2 Genomic DNA, Genes_第3页
分子生物学课件2Ch2 Genomic DNA, Genes_第4页
分子生物学课件2Ch2 Genomic DNA, Genes_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Ch2. Genomic DNA, Genes基因基因gene具有遗传功能的具有遗传功能的DNA片段。片段。基因组基因组genome细胞内所携带的全部遗细胞内所携带的全部遗传信息传信息DNA的总和;对多倍体生物指单倍体的总和;对多倍体生物指单倍体DNA的总和。的总和。 编码蛋白的结构基因编码蛋白的结构基因 基因组基因组DNA 复制转录的调控序列复制转录的调控序列 功能尚不清楚的区域功能尚不清楚的区域virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotid

2、e pairs (base-pairs)10410810510610710111010109The size of the humangenome is 3 X 109 bp;almost all of its complexityis in single-copy DNA.The human genome is thoughtto contain 30,000 to 40,000 genes.bony fishamphibians 病毒基因组病毒基因组核基因组核基因组 原核生物基因组原核生物基因组 真核生物基因组真核生物基因组 线粒体线粒体DNA核外遗传物质核外遗传物质 叶粒体叶粒体DNA

3、质粒质粒DNA非独立的基因组:非独立的基因组: 转位因子转位因子能在基因组能在基因组DNA中移动的中移动的DNA序列,不能独立存在,需插入核或核序列,不能独立存在,需插入核或核外外DNA中。中。2.12.1病毒基因组的结构病毒基因组的结构 外壳蛋白:识别、侵袭特定的宿主细外壳蛋白:识别、侵袭特定的宿主细 胞,并保护基因组不被胞,并保护基因组不被 核酸酶破坏;核酸酶破坏; DNADNA(RNARNA):编码结构蛋白和少量):编码结构蛋白和少量调调 调控蛋白。调控蛋白。 不能独立复制,必需进入宿主细胞,借不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。助细胞内一些酶类和细胞

4、器才能得以复制。病毒基因组的结构:病毒基因组的结构: 1.基因组较小,大小差异较大;基因组较小,大小差异较大; 乙肝病毒乙肝病毒DNA 3kb,编码,编码4种蛋白质种蛋白质 痘病毒痘病毒DNA 300kb,编码几百种蛋白,编码几百种蛋白 基因组越小,编码蛋白越少,对寄主依基因组越小,编码蛋白越少,对寄主依赖性越大。赖性越大。 2.化学组成多样;化学组成多样; DNA病毒、病毒、RNA病毒病毒 单链、双链单链、双链 线状、环状线状、环状单链环状单链环状DNA,基,基因组共因组共5386个核苷个核苷酸,共编码酸,共编码11个蛋个蛋白质,构成白质,构成3个转录个转录单元,编码序列共单元,编码序列共6

5、078个核苷酸。个核苷酸。其中非编码序列只其中非编码序列只有有217/5386,不足,不足5%。3.基因重叠现象基因重叠现象 定义:核苷酸序列彼此重叠的定义:核苷酸序列彼此重叠的2个基因为重个基因为重叠基因叠基因overlapping genes,或称嵌套基因,或称嵌套基因nested genes。 类型:类型: 一个基因的核苷酸序列完全包含在另一个一个基因的核苷酸序列完全包含在另一个 基因中;基因中; 两个基因的核苷酸序列部分重叠;两个基因的核苷酸序列部分重叠; 两个基因的核苷酸序列的末端密码子相互两个基因的核苷酸序列的末端密码子相互 重叠。重叠。 实质:两个基因虽共用一段核苷酸序列,实质:

6、两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白但其读码结构互不相同,编码不同的蛋白质。质。 意义:使意义:使DNA的利用率提高,是基因表的利用率提高,是基因表达调控的方式之一。达调控的方式之一。 目前,在少数原核生物(大肠杆菌、目前,在少数原核生物(大肠杆菌、病毒)中发现,在少数真核生物中也发现病毒)中发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。了类似的基因重叠现象(果蝇)。 4.大部分大部分DNA序列用于编码,只有很少序列序列用于编码,只有很少序列不编码(非编码序列较少);不编码(非编码序列较少); 5. 基因组中功能基因丛集成一个或几个特基因组中功能基因丛

7、集成一个或几个特定区域,构成多顺反子结构;定区域,构成多顺反子结构; 6. 除反转录病毒外,病毒基因组只有一个除反转录病毒外,病毒基因组只有一个拷贝;拷贝; 7.有的病毒基因组中具有宿主细胞基因组的有的病毒基因组中具有宿主细胞基因组的结构特点;结构特点; 2.2 原核生物基因组原核生物基因组 细菌基因组的结构特点:细菌基因组的结构特点: 1. 拟核(类核)结构;拟核(类核)结构; 2. 存在存在多顺反子结构多顺反子结构; 3. 除除RNA基因外,基本是单拷贝的;基因外,基本是单拷贝的; 利于核糖体的快速组装,短时间内合成利于核糖体的快速组装,短时间内合成 大量核糖体。大量核糖体。 4. 非编码

8、序列相对较少;非编码序列相对较少; 5. 存在不同的功能识别区存在不同的功能识别区 复制起始区、复制终止区等复制起始区、复制终止区等大肠杆菌的类核结构大肠杆菌的类核结构核中央由支架蛋核中央由支架蛋白和白和RNA组成,组成,环状双链环状双链DNA绕绕在支架蛋白的外在支架蛋白的外围,只有一个复围,只有一个复制起点,制起点,DNA与与细胞膜粘在一起细胞膜粘在一起DNA上有结合蛋上有结合蛋白。白。 大肠杆菌基因组结构:大肠杆菌基因组结构: 1. 基因组基因组DNA在在4000kb,估计有,估计有3500个基因,已个基因,已确定的基因有确定的基因有900个,已确定有个,已确定有260个基因具有操个基因具

9、有操纵子结构(纵子结构(75个操纵子中),每个基因平均长度个操纵子中),每个基因平均长度1000bp; 2. 已确定的基因中,多数是与代谢有关的酶、核已确定的基因中,多数是与代谢有关的酶、核糖体蛋白;糖体蛋白; 3. 大多数基因是随机分布的,两条单链作为模板大多数基因是随机分布的,两条单链作为模板的概率基本相等;的概率基本相等; 4. 多数基因都是单拷贝。多数基因都是单拷贝。2.3真核生物核基因组的特点真核生物核基因组的特点 1.基因组较大,基因组较大,l低等真核生物:低等真核生物:107-108 bp,较原核生物大较原核生物大10倍;倍;l高等真核生物:高等真核生物:5X108-1010 b

10、p,某些植物和两栖生物某些植物和两栖生物可达可达1011 bp;l哺乳类生物大于哺乳类生物大于2X109它们可编码它们可编码100万个基因。万个基因。2.真核生物核真核生物核DNA与蛋白质结合,形成核小体,与蛋白质结合,形成核小体,再缠绕成染色质(染色体);再缠绕成染色质(染色体);Nucleosome structureNucleosome core (left) 146 bp DNA; 1 3/4 turns of DNA DNA is negatively supercoiled two each: H2A, H2B, H3, H4 (histone octomer)Nucleosome

11、 (right) 200 bp DNA; 2 turns of DNA plus spacer also includes H1 histoneNucleofilament structure3. 基因组一般为双倍体(基因组一般为双倍体(diploid);4. 基因为单顺反子。一个基因单独转录,一个基基因为单顺反子。一个基因单独转录,一个基 因因 一条一条mRNA, 翻译成一条多肽链;翻译成一条多肽链;5. 存在大量重复序列,重复次数可高达百万倍;存在大量重复序列,重复次数可高达百万倍;6. 基因组中非编码序列多余编码序列,有大量的基因组中非编码序列多余编码序列,有大量的 冗余冗余DNA;7.

12、 大部分基因有内含子,因此基因不连续;大部分基因有内含子,因此基因不连续;8. 具有多个复制起点,而每个复制子的长度较小。具有多个复制起点,而每个复制子的长度较小。 真核生物基因组的特点:真核生物基因组的特点: 重复性、基因家族、不连续性。重复性、基因家族、不连续性。 Properties of the human genomeNuclear the haploid human genome has 3 X 109 bp of DNA single-copy DNA comprises 75% of the human genome the human genome contains 30,0

13、00 to 40,000 genes most genes are single-copy in the haploid genome genes are composed of from 1 to 75 exons genes vary in length from 2,300,000 bp Alu sequences are present throughout the genomeMitochondrial circular genome of 17,000 bp contains 40 genes 1. The genomic landscape shows marked variat

14、ion in the distribution of a number of features, including genes, transposable elements, GC content, CpG islands and recombination rate. This gives us important clues about function. For example, the developmentally important HOX gene clusters are the most repeat-poor regions of the human genome, pr

15、obably reflecting the very complex coordinate regulation of the genes in the clusters. 2.There appear to be about 30,00040,000 protein-coding genes in the human genome. only about twice as many as in worm or fly. However, the genes are more complex, with more alternative splicing generating a larger

16、 number of protein products.3.The full set of proteins (the proteome) encoded by the human genome is more complex than those of invertebrates. This is due in part to the presence of vertebrate-specific protein domains and motifs (an estimated 7% of the total), but more to the fact that vertebrates a

17、ppear to have arranged pre-existing components into a richer collection of domain architectures. 4. Hundreds of human genes appear likely to have resulted from horizontal transfer from bacteria at some point in the vertebrate lineage. Dozens of genes appear to have been derived from transposable ele

18、ments. 5.Although about half of the human genome derives from transposable elements, there has been a marked decline in the overall activity of such elements in the hominid lineage. DNA transposons appear to have become completely inactive and long-terminal repeat (LTR) retroposons may also have don

19、e so. 6.The pericentromeric and subtelomeric regions of chromosomes are fillled with large recent segmental duplications of sequence from elsewhere in the genome. Segmental duplication is much more frequent in humans than in yeast, fly or worm.7.Analysis of the organization of Alu elements explains

20、the longstanding mystery of their surprising genomic distribution, and suggests that there may be strong selection in favour of preferential retention of Alu elements in GC-rich regions and that these selfish elements may benefit their human hosts.8.The mutation rate is about twice as high in male a

21、s in female meiosis, showing that most mutation occurs in males. 9.Cytogenetic analysis of the sequenced clones confirms suggestions that large GC-poor regions are strongly correlated with dark G-bands in karyotypes. 10.Recombination rates tend to be much higher in distal regions (around 20 megabase

22、s (Mb) of chromosomes and on shorter chromosome arms in general, in a pattern that promotes the occurrence of at least one crossover per chromosome arm in each meiosis. 11.More than 1.4 million single nucleotide polymorphisms (SNPs) in the human genome have been identified. This collection should al

23、low the initiation of genome-wide linkage disequilibrium mapping of the genes in the human population. Type of DNA % of Genome Features Single-copy (unique)75% Includes most genes 1Repetitive Interspersed15% Interspersed throughout genome between and within genes; includes Alu sequences 2 and VNTRs

24、or mini (micro) satellites Satellite (tandem)10% Highly repeated, low complexity sequences usually located in centromeres and telomeres 2 Alu sequences are about 300 bp in length and are repeated about 300,000 times in the genome. They can be found adjacent to or within genes in introns or nontransl

25、ated regions.1 Some genes are repeated a few times to thousands-fold and thus would be in the repetitive DNA fraction501000I I I I I I I I Ifast 10%intermediate 15%slow (single-copy) 75%Classes of repetitive DNAInterspersed (dispersed) repeats (e.g., Alu sequences)TTAGGGTTAGGGTTAGGGTTAGGGTandem repe

26、ats (e.g., microsatellites)GCTGAGGGCTGAGGGCTGAGG基因组结构与进化的关系:基因组结构与进化的关系: 1.基因组的物质组成从多样基因组的物质组成从多样 单一;单一; DNA、RNA分工明确分工明确 单链、双链,线状、环状单链、双链,线状、环状 双链线状双链线状 2. 基因组由小基因组由小 大;大; 3. DNA的利用率越来越低;(多拷贝、非编码的利用率越来越低;(多拷贝、非编码 区、基因不连续)区、基因不连续) 4. 调控序列增多,调控方式更复杂。调控序列增多,调控方式更复杂。 重复性(重复序列)重复性(重复序列) DNA的复杂性的复杂性 Cot1/

27、2=1/ k 基因的重复次数基因的重复次数=实际长度实际长度 / DNA复杂度复杂度 据基因组重复次数高低:据基因组重复次数高低: 单拷贝序列单拷贝序列重复序列重复序列 轻度重复序列轻度重复序列 2 101 中度重复序列中度重复序列 10 103 高度重复序列高度重复序列 103 106 1. 单拷贝序列:单拷贝序列: 只有一个拷贝,只有一个拷贝,占基因组的占基因组的40-70%. 主要是功主要是功能基因。能基因。 2. 轻度重复轻度重复 基因组中有基因组中有2-10个拷贝个拷贝, 主要是组蛋主要是组蛋白和白和tRNA基因基因. 几个基因都有功能几个基因都有功能, 编码同一个蛋白质或编码同一个

28、蛋白质或tRNA;分两种分两种 几个拷贝中有的有功能几个拷贝中有的有功能,有的无功能(假基因)有的无功能(假基因) 假基因假基因结构与功能基因相同,但不表达。结构与功能基因相同,但不表达。 突变失活,启动子缺陷突变失活,启动子缺陷3.中度重复序列中度重复序列 拷贝数有几十至几千个拷贝数有几十至几千个,一般无一般无RNARNA转录产物转录产物(非编码序列)(非编码序列),一般认为与基因的表达调控有一般认为与基因的表达调控有关关(包括转录调控序列包括转录调控序列,复制控制序列复制控制序列,转录后转录后的加工等的加工等). 这类序列的平均长度是这类序列的平均长度是300bp左右左右. 长周期分散的重

29、复序列长周期分散的重复序列 5000bp分两种分两种 短周期分散的重复序列短周期分散的重复序列 100 300bp 4. 高度重复序列高度重复序列 重复次数重复次数 103 106 ,序列较短,大部分集,序列较短,大部分集中在异染色质中(中心粒和端粒的附近)真中在异染色质中(中心粒和端粒的附近)真核生物中含核生物中含1020%。特点:特点:A、T含量高,序列简单,不转录,含量高,序列简单,不转录, 其功能尚不清楚。其功能尚不清楚。 卫星卫星DNA(satellite DNA) 含有异常的碱基,在密度梯度离心中形成一种含有异常的碱基,在密度梯度离心中形成一种区别于其它区别于其它DNA的卫星条带。

30、的卫星条带。 通常由数千个较长的串联排列的相关序列构成。通常由数千个较长的串联排列的相关序列构成。重复单位常存在序列变异,反映卫星重复单位常存在序列变异,反映卫星DNA可能在可能在经过串联重复后发生突变、重复和缺失而得以进经过串联重复后发生突变、重复和缺失而得以进化。在真核生物之间,化。在真核生物之间, satellite DNA 总量在总量在2%5%,甚至在亲缘关系密切相关的两个物种,甚至在亲缘关系密切相关的两个物种之间,之间, satellite DNA也会有悬殊的差别。也会有悬殊的差别。 应用:应用:1. 生物进化生物进化 2. DNA指纹图谱(亲子鉴定)指纹图谱(亲子鉴定) 3.RFL

31、P分析分析 检测基因缺失、突变、检测基因缺失、突变、 扩增扩增 微卫星微卫星DNA minisatellite DNA 高度多态性高度多态性短串联重复短串联重复:2-8个碱基的重复个碱基的重复,有的短串联重有的短串联重复具有个体差异复具有个体差异,即所谓的即所谓的STR(Short Tandem Repeat) 基因家族基因家族 gene family 1.概念概念 基因组中来源相同、结构相似、功能相关的基因组中来源相同、结构相似、功能相关的一组基因成为基因家族(一组基因成为基因家族(gene family)。一些基)。一些基因彼此靠近,成串地排列在一起,这种基因排列因彼此靠近,成串地排列在一

32、起,这种基因排列结构叫基因簇(结构叫基因簇(gene cluster)。在基因家族结构在基因家族结构中经常会看到基因簇结构。中经常会看到基因簇结构。 基因簇基因簇多顺反子结构多顺反子结构 分类:分类:l 串联重复多基因家族串联重复多基因家族 组蛋白、组蛋白、tRNA rRNAl 分散重复多基因家族分散重复多基因家族 Alu 家族家族l 不同组织、细胞类型、发育时期表达的多基因不同组织、细胞类型、发育时期表达的多基因 家族家族 同工酶(珠蛋白)同工酶(珠蛋白)真核生物中重要的基因家族真核生物中重要的基因家族 1. Alu基因家族基因家族 分散重复序列分散重复序列在单倍体人基因组中有在单倍体人基因

33、组中有5X105个拷贝,约占个拷贝,约占人基因组的人基因组的3-6%。每个重复单元的长度为。每个重复单元的长度为300bp,含一个含一个Alu酶切位点,因而得名。酶切酶切位点,因而得名。酶切后生成后生成130bp和和170bp两个片段,每个两个片段,每个Alu片片段两侧有段两侧有6-20bp的同向重复序列,存在于间的同向重复序列,存在于间隔区(隔区(space)和内含子中。)和内含子中。 功能:可能与基因转录、调控、加工有关。功能:可能与基因转录、调控、加工有关。ALU007 ALU007 GGCCGGGCGC GGTGGCTCAC GCCTGTAATC GGCCGGGCGC GGTGGCTC

34、AC GCCTGTAATC CCAGCACTTT GGGAGGCCGA GGCGGGCGGA CCAGCACTTT GGGAGGCCGA GGCGGGCGGA TCACCTGAGG TCAGGAGTTC GAGACCAGCC TCACCTGAGG TCAGGAGTTC GAGACCAGCC TGGCCAACAT GGTGAAACCC CGTCTCTACT TGGCCAACAT GGTGAAACCC CGTCTCTACT AAAAATACAA A AATTAGCCG GGCGTGGTGG AAAAATACAA A AATTAGCCG GGCGTGGTGG CGCGCGCCTG TAATCCCCG

35、CGCGCCTG TAATCCCAGCAGC T TACTCGGGAG ACTCGGGAG G CTGAGGCAG G AGAATCGCT TGAACCCGGG G CTGAGGCAG G AGAATCGCT TGAACCCGGG AGGCGGAGGT TGCAGTGAGC CGAGATCGCG AGGCGGAGGT TGCAGTGAGC CGAGATCGCG CCACTGCACT CCAGCCTGGG CGACAGAGCG CCACTGCACT CCAGCCTGGG CGACAGAGCG AGACTCCGTC TCAAAAAAAA AGACTCCGTC TCAAAAAAAA LDL rece

36、ptor geneAlu repeats present within intronsAlu repeats in exons444555666AluAluAluAluX46Aluunequalcrossing overone product has a deleted exon 5(the other product is not shown) 2. rRNA基因家族基因家族 串联重复,有转录活性串联重复,有转录活性 大多数真核生物大多数真核生物rRNA基因家族基因家族 集中分布集中分布在一条或几条染色体上,以核仁区含量最高。在一条或几条染色体上,以核仁区含量最高。 通常编码区较为保守,内间

37、区具有种间特通常编码区较为保守,内间区具有种间特异性,常被用作物种种类鉴定及进化分析。异性,常被用作物种种类鉴定及进化分析。 rRNA基因家族(基因家族(gene cluster) 5S rRNA 基因家族基因家族 在所有染色体上都有,分布频率较高。在所有染色体上都有,分布频率较高。 一般由一般由120bp组成每个重复单元由组成每个重复单元由5sRNA基因和和转录区前的非转录区组成,重复基因和和转录区前的非转录区组成,重复串联形成基因簇。串联形成基因簇。 非洲爪蟾卵母细胞的非洲爪蟾卵母细胞的5sRNA基因:富含基因:富含A-T的序列,由不同的的序列,由不同的15bp序列重复而成,序列重复而成,

38、 (CAAAGTTTGAGTTTT)这段序列的串)这段序列的串连数不同,非转录的间隔区的长度会有所连数不同,非转录的间隔区的长度会有所改变。改变。 真核生物真核生物tRNA基因家族基因家族 l tRNA基因长约基因长约70-90bp, 基因全长约基因全长约140bp;l基因之间串联重复排列;基因之间串联重复排列;l多个不同的多个不同的tRNA基因组成一个串联重复,基因组成一个串联重复,每个基因的方向不同,并单独转录。每个基因的方向不同,并单独转录。组蛋白基因家族组蛋白基因家族l 与细胞与细胞DNA复制有关复制有关 中度重复序列(几十中度重复序列(几十几百几百 个重复),不含内含子,无需转录后加

39、工,个重复),不含内含子,无需转录后加工,mRNA产物无产物无3polyA 基因家族基因家族l 与与DNA复制无关的组蛋白复制无关的组蛋白 l 组织特异性表达的组蛋白组织特异性表达的组蛋白 单拷贝单拷贝 Nucleosome structureNucleosome core (left) 146 bp DNA; 1 3/4 turns of DNA DNA is negatively supercoiled two each: H2A, H2B, H3, H4 (histone octomer)Nucleosome (right) 200 bp DNA; 2 turns of DNA plus

40、 spacer also includes H1 histone 特点:特点: 组蛋白基因组蛋白基因缺乏内含子缺乏内含子; 组蛋白基因家族是重复序列中组蛋白基因家族是重复序列中唯一已知唯一已知具有蛋白质编码功能的基因具有蛋白质编码功能的基因。珠蛋白基因家族珠蛋白基因家族 血红蛋白分子是珠蛋白的四聚体血红蛋白分子是珠蛋白的四聚体 2 2, 型亚型亚基基因在基基因在16号染色体上,号染色体上, 型亚基基因在型亚基基因在11号染色号染色体上,珠蛋白基因以基因家族的形式排列体上,珠蛋白基因以基因家族的形式排列。5. 基因的不连续性基因的不连续性真核基因的重要特征真核基因的重要特征l 发现发现 1977

41、年研究病毒年研究病毒mRNA 时发现,时发现,随后在随后在 珠蛋白基因、卵清蛋白基因中证珠蛋白基因、卵清蛋白基因中证实了断裂基因的存在。实了断裂基因的存在。l 证据证据 1.R环结构环结构 2.限制性内切酶分析限制性内切酶分析(exon-intron-exon)n structure of various genes -globinHGPRT(HPRT)total = 1,660 bp; exons = 990 bphistonefactor VIIItotal = 400 bp; exon = 400 bptotal = 42,830 bp; exons = 1263 bptotal = 1

42、86,000 bp; exons = 9,000 bp鸡的卵清蛋白基因用鸡的卵清蛋白基因用EcoR和和Hind两种酶切,两种酶切,可得到可得到3或或4个片段,把该基因的个片段,把该基因的mRNA逆转录产逆转录产物物cDNA(双链)用以上两种酶切,发现(双链)用以上两种酶切,发现cDNA不不能被这两种酶切。能被这两种酶切。 mRNAcDNA酶切(不能被酶切)DNA酶切DNA中有的序列在中有的序列在mRNA中丢失中丢失, 且丢失部分不且丢失部分不影响基因功能影响基因功能, 酶切位点在内含子中酶切位点在内含子中。l 内含子的概念内含子的概念 外显子外显子extron:成熟的成熟的mRNA或蛋白质中或

43、蛋白质中存在的序列。(在存在的序列。(在DNA或或mRNA中都存在中都存在的序列)的序列) 内含子内含子intron:在在DNA上存在,而在上存在,而在mRNA(或或cDNA)中不存在的序列,初级中不存在的序列,初级转录产物加工成成熟转录产物加工成成熟mRNA时被切除的间时被切除的间隔序列。隔序列。53promoter regionexons (filled and unfilled boxed regions)introns (between exons)transcribed regiontranslated regionmRNA structure+1 Gene structure (一

44、个完整的具有转录功能的单元)(一个完整的具有转录功能的单元)(exon-intron-exon)n structure of various genes -globinHGPRT(HPRT)total = 1,660 bp; exons = 990 bphistonefactor VIIItotal = 400 bp; exon = 400 bptotal = 42,830 bp; exons = 1263 bptotal = 186,000 bp; exons = 9,000 bpl 基因内含子的特点:基因内含子的特点: 1.内含子是真核生物独有的,但并不是所内含子是真核生物独有的,但并不是

45、所有真核基因一定有内含子;(组蛋白基因有真核基因一定有内含子;(组蛋白基因家族)家族) 2.内含子的数量和长度对不同的基因不同,内含子的数量和长度对不同的基因不同,一般基因越长,内含子越多;一般基因越长,内含子越多; 3. 在同一基因家族中,编码序列在进化过在同一基因家族中,编码序列在进化过程中一直比较保守,而内含子变化迅速,程中一直比较保守,而内含子变化迅速,差异较大;差异较大;(内含子变异较外显子大)(内含子变异较外显子大) 4.内含子与外显子间的连接处有特殊的序列内含子与外显子间的连接处有特殊的序列(序列(序列GTAG)。)。 高度保守序列高度保守序列 不连续基因剪接成不连续基因剪接成m

46、RNA可能可能 遵照一种通用机制。遵照一种通用机制。 5. 一个基因的内含子可以是另一个基因的一个基因的内含子可以是另一个基因的外显子。外显子。 (阅读框和剪切方式不同)(阅读框和剪切方式不同)l 内含子可能的功能内含子可能的功能: 1.调控转录速度;调控转录速度; 通过与启动子、起始位点的精确碱基配对,阻通过与启动子、起始位点的精确碱基配对,阻止或增强止或增强RNA聚合酶的活性,从而调控转录。聚合酶的活性,从而调控转录。 2. 内含子具有各种内含子具有各种剪接信号剪接信号,使用不同的剪接方,使用不同的剪接方式形成不同的成熟式形成不同的成熟mRNA ; 2.4 核外遗传物质的结构及功能核外遗传

47、物质的结构及功能l 质粒质粒DNA Plasmid 质粒的结构与功能质粒的结构与功能 1. 存在于原核生物、真菌和少数植物细胞中,存在于原核生物、真菌和少数植物细胞中,是是一种核外遗传物质一种核外遗传物质,但不是细胞生存所必,但不是细胞生存所必需的;需的; 2. 有自己的复制起始序列,独立于核有自己的复制起始序列,独立于核DNA进行进行复制;(复制;(有独立的复制系统有独立的复制系统) 3. 质粒质粒DNA含有少量编码蛋白的基因,这些基含有少量编码蛋白的基因,这些基因对宿主细胞的生存影响不大,但能改变细因对宿主细胞的生存影响不大,但能改变细胞的某些性状,如抗性、降解有机物的酶等;胞的某些性状,

48、如抗性、降解有机物的酶等; 4. 质粒是分子生物学中最常见的克隆载体。质粒是分子生物学中最常见的克隆载体。 质粒质粒DNA的一般特性:的一般特性: 1.多数质粒是闭合环状、双链超螺旋结构多数质粒是闭合环状、双链超螺旋结构(covalently closed and circular DNA),简称),简称cccDNA,少数线状;,少数线状; 2. 质粒具有可转移性,如质粒具有可转移性,如F质粒;质粒; 3. 可整合性;(整合、重组可整合性;(整合、重组 DNA的交换)的交换) 4. 拷贝数;拷贝数; 严紧型(一个或几个)严紧型(一个或几个) 据细胞中质粒的多少据细胞中质粒的多少 松弛型(十松弛

49、型(十几十)几十)5. 质粒质粒DNA的不相容性的不相容性 incompatibility 在同一个宿主细胞中,不能同时存在两种在同一个宿主细胞中,不能同时存在两种同一同一 不相容群不相容群的质粒(同一类型、同一复制系统的的质粒(同一类型、同一复制系统的不同质粒不能同时存在于同一细胞中,但两种不同质粒不能同时存在于同一细胞中,但两种不同类型的质粒可存在于同一细胞中。)不同类型的质粒可存在于同一细胞中。)6. 质粒质粒DNA在分子生物学中的应用在分子生物学中的应用l基因克隆基因克隆lDNA扩增扩增 (松弛型质粒)(松弛型质粒)l测序、表达测序、表达 几种常见的质粒几种常见的质粒 1. 细菌质粒细

50、菌质粒 F质粒质粒 (又称(又称F-因子或性质粒因子或性质粒sex plasmid) 高频重组质粒,具可转移性和整合性,高频重组质粒,具可转移性和整合性, 拷贝数低;拷贝数低; R质粒质粒 抗性质粒,含抗药、分解有毒物质抗性质粒,含抗药、分解有毒物质 等的基因;等的基因; Col质粒(大肠杆菌素因子)质粒(大肠杆菌素因子) 含有编码控制含有编码控制大肠杆菌素大肠杆菌素合成的基因,合成的基因, (一种可以使不带(一种可以使不带Col质粒的细菌菌株致死的质粒的细菌菌株致死的蛋白)蛋白) Ti质粒质粒一种常用的基因工程载体一种常用的基因工程载体 土壤中有一种叫根癌农杆菌土壤中有一种叫根癌农杆菌( (

51、Agrobacterium Agrobacterium tumerfacienstumerfaciens) )的一种土壤微生物,它能感染的一种土壤微生物,它能感染9090个个科的双子叶植物的受伤组织。当这种土壤杆菌侵科的双子叶植物的受伤组织。当这种土壤杆菌侵入受伤组织后,受伤组织便不断增生成为冠瘿瘤入受伤组织后,受伤组织便不断增生成为冠瘿瘤(craw gall tumor)(craw gall tumor)。这种瘤的产生是由于根癌农。这种瘤的产生是由于根癌农杆菌细胞中存在的一种质粒引起的,这种质粒简杆菌细胞中存在的一种质粒引起的,这种质粒简称为称为TiTi(tumor inducingtumo

52、r inducing)质粒。植物受伤组织)质粒。植物受伤组织细胞所发生的一系列变化就是由于细胞所发生的一系列变化就是由于TiTi质粒中的一质粒中的一段称为段称为T-DNAT-DNA的片段插入植物细胞染色体后所引起的片段插入植物细胞染色体后所引起的。的。 Ti质粒是一种双链环状质粒是一种双链环状DNA分子,长度为分子,长度为160-250 kb,它有,它有6个功能区:个功能区:l致癌区,合成植物生长素和细胞分裂素;致癌区,合成植物生长素和细胞分裂素;l冠瘿碱合成区;冠瘿碱合成区;l冠瘿碱分解区;冠瘿碱分解区;lTi质粒接合转移区质粒接合转移区(tra);l毒性区(毒性区(Vir););lDNA复

53、制区(复制区(Rep)。)。 在致癌区和冠瘿碱合成区的两侧存在着一个在致癌区和冠瘿碱合成区的两侧存在着一个25 bp直接重复序列,由这三部分所构成的直接重复序列,由这三部分所构成的DNA区域叫做区域叫做T-DNA。T-DNA 2. 酵母质粒酵母质粒l 2u 质粒质粒 双链环状双链环状DNA,周长周长2um,6318bpl 3u 质粒质粒 环状环状DNA,周长周长3uml 线状杀伤质粒线状杀伤质粒 RNA质粒,线状,能分泌一种质粒,线状,能分泌一种 杀伤因子,对其他酵母有杀伤作用,杀伤因子,对其他酵母有杀伤作用, 以以 保护自身。保护自身。 3. 真菌质粒真菌质粒 有线状,也有环状,有的能整合到

54、线粒体中,有线状,也有环状,有的能整合到线粒体中,有的与菌丝的衰老有关。有的与菌丝的衰老有关。 4. 植物中的质粒植物中的质粒 类似于真菌,有线状,也有环状,有的能整类似于真菌,有线状,也有环状,有的能整合到线粒体中。合到线粒体中。l 线粒体线粒体DNA mitochondrion DNA(mtDNA) 线粒体线粒体DNA的结构特点的结构特点 1.化学结构化学结构 cccDNA covalently closed and circular DNA 少数线状(存在于原核生物:草少数线状(存在于原核生物:草 履虫、四膜虫等)履虫、四膜虫等) 2.大小大小 16 300kb 植物线粒体植物线粒体DN

55、A较大,动物较小;较大,动物较小; 3. 复制方式复制方式 半保留复制,半保留复制, 型、型、 D-环、滚环复制。环、滚环复制。 母性遗传母性遗传,常用于动物进化研究,常用于动物进化研究;母性遗传:母性遗传:由于父本线粒体由于父本线粒体DNA不进入子代不进入子代DNA中。中。 Y-染色体染色体 父性遗传父性遗传 常染色体常染色体 双性遗传双性遗传群体群体 家系家系 X-染色体、线粒体染色体、线粒体DNA 母性遗传母性遗传 4. 动物线粒体基因组中不存在内含子,甚至还有动物线粒体基因组中不存在内含子,甚至还有基因重叠现象。基因重叠现象。线线粒粒体体基基因因组组结结构构 线粒体线粒体DNA上的基因

56、上的基因 蛋白质合成需要的蛋白质合成需要的RNA基因基因(tRNA rRNA)分三类分三类 编码蛋白质的基因编码蛋白质的基因(与呼吸相关的酶基因)(与呼吸相关的酶基因) 抗性基因抗性基因 1.蛋白质合成需要的蛋白质合成需要的RNA基因基因 tRNA基因基因 啤酒酵母中啤酒酵母中mtDNA上有上有24个个tRNA基因基因 粗链孢酶中有粗链孢酶中有40个,人和爪蟾中有个,人和爪蟾中有22个个 rRNA基因基因 啤酒酵母中有啤酒酵母中有1S和和21S rRNA 人类细胞中有人类细胞中有12S和和16S rRNA 真核:真核:28S 18S 5.8S 5S 原核:原核:23S 16S 5S 2. 编码

57、蛋白质的基因编码蛋白质的基因(与呼吸相关的酶基因)(与呼吸相关的酶基因)l 细胞色素氧化酶基因细胞色素氧化酶基因 7个亚基中个亚基中3个由个由mtDNA编码编码 NAD FMN CoQ Cytb CC1.ca3 O2 细胞色素还原酶细胞色素还原酶 细胞色素氧化酶细胞色素氧化酶l 细胞色素还原酶基因细胞色素还原酶基因 7个亚基中个亚基中1个由个由mtDNA编码编码l ATP酶基因酶基因 10 个亚基中个亚基中4个由个由mtDNA编码编码 33. OSCP 3. 抗性基因抗性基因 主要在真菌中发现,如抗氯霉素、抗红霉主要在真菌中发现,如抗氯霉素、抗红霉素、抗寡酶素基因等,但不是每个素、抗寡酶素基因

58、等,但不是每个mtDNA上均上均有抗性基因。有抗性基因。 1.线粒体中可以合成蛋白;线粒体中可以合成蛋白; 小结:小结:2.线粒体中合成蛋白所需的基因有的可线粒体中合成蛋白所需的基因有的可 能来自核能来自核DNA; 3.mtDNA的结构类似原核生物;的结构类似原核生物; 4.质粒、原核质粒、原核DNA、mtDNA有结构的相有结构的相 似性。似性。l 线粒体密码子的特殊性:线粒体密码子的特殊性: 在在mtDNA中,大部分密码子与核中,大部分密码子与核DNA相同,相同,但少部分有所不同。但少部分有所不同。 密码子密码子 UGA AUA AGG/AGA 线粒体线粒体 终止终止 Ile Arg 核基因

59、核基因 Try Met 终止终止 l 线粒体遗传性状的双重控制线粒体遗传性状的双重控制 线粒体的性状由核基因和线粒体基因双重控制线粒体的性状由核基因和线粒体基因双重控制 线粒体的组分一方面由线粒编码,另一些组分由线粒体的组分一方面由线粒编码,另一些组分由核基因编码。核基因编码。l 叶绿体叶绿体DNA chloroplast DNA chlDNA叶绿体叶绿体DNA的结构特性的结构特性 1.cccDNA,少数线状,如伞藻;少数线状,如伞藻; 90%为超螺旋为超螺旋 离心后,离心后, chlDNA中中 10%为松驰型为松驰型DNA 2. 大小大小 140 160kb,低等衣藻低等衣藻200kb 一般

60、单子叶植物较双子叶植物一般单子叶植物较双子叶植物 大大, 一个叶绿体可能有一个叶绿体可能有10-50个相个相 同的同的DNA分子,而一个线粒体中分子,而一个线粒体中 只有一个分子只有一个分子 3. 有反向重复序列,功能不清楚,但在玉有反向重复序列,功能不清楚,但在玉米中的米中的20%的序列编码的序列编码rRNA基因;基因; 4.在些在些核苷酸序列核苷酸序列(RNA(RNA序列序列) ),在菠菜和豌,在菠菜和豌豆中发现豆中发现RnaseA和和RnaseT可将叶绿体可将叶绿体DNADNA切切开,推算有开,推算有18-24个碱基的核苷酸序列,生个碱基的核苷酸序列,生菜中有菜中有12 2个碱基的核苷酸

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论