基因及基因组结构_第1页
基因及基因组结构_第2页
基因及基因组结构_第3页
基因及基因组结构_第4页
基因及基因组结构_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因及基因组结构基因及基因组结构一、基因(gene)n(一)定义(一)定义n生物学定义:生物学定义: 具有遗传功能的具有遗传功能的DNA片段。片段。n分子生物学定义:分子生物学定义: DNA分子中含有特定遗传信息的核苷酸分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功序列,是遗传物质的最小功能单位。合成有功能的多肽链或能的多肽链或RNA所必需的全部核酸序列(通所必需的全部核酸序列(通常是常是DNA序列)。序列)。(二)基因的组成n一个基因应包含不仅是编码蛋白质肽链或一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控的核酸序列,还包括为保证转

2、录所必需的调控序列、序列、5非翻译序列、内含子以及非翻译序列、内含子以及3非翻译序非翻译序列等所有的核酸序列(蛋白质基因和列等所有的核酸序列(蛋白质基因和RNA基基因)。因)。(三)基因分类基因分类n第一类是编码蛋白质的基因,第一类是编码蛋白质的基因,它具有转录和翻它具有转录和翻译功能,译功能,包括编码酶和结构蛋白的结构基因以包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因及编码阻遏蛋白的调节基因n第二类是只有转录功能而没有翻译功能的基因第二类是只有转录功能而没有翻译功能的基因,包括包括tRNA基因和基因和rRNA基因基因n第三类是不转录的基因,第三类是不转录的基因,它对基因表达起调节

3、它对基因表达起调节控制作用,控制作用,包括启动基因和操纵基因包括启动基因和操纵基因二、基因组(genome)n(一)定义n生物学定义:生物学定义: 细胞内所携带的全部遗传信息细胞内所携带的全部遗传信息DNA的总和;对多倍体生物指单倍体的总和;对多倍体生物指单倍体DNA的的总和。总和。n分子生物学定义:分子生物学定义:n携带生物体全部遗传信息的核酸量。携带生物体全部遗传信息的核酸量。 n 编码蛋白的结构基因编码蛋白的结构基因n 基因组基因组DNA 复制转录的调控序列复制转录的调控序列n 功能尚不清楚的区域功能尚不清楚的区域n不同生物体中具有不同的基因组大小不同生物体中具有不同的基因组大小对人类而

4、言:对人类而言:22+X+Y+mtDNA22+X+Y+mtDNA。virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotide pairs (base-pairs)10410810510610710111010109The size of the humangenome is 3 X 109 bp;almost all of its complexityis in single-copy DNA.The human genome is thoughtto

5、contain 30,000 to 40,000 genes.bony fishamphibians(二)遗传物质组成n 病毒基因组病毒基因组n核基因组核基因组 原核生物基因组原核生物基因组n 真核生物基因组真核生物基因组n 线粒体线粒体DNAn核外遗传物质核外遗传物质 叶粒体叶粒体DNAn 质粒质粒DNAn非独立的基因组:非独立的基因组:n 转位因子转位因子-能在基因组能在基因组DNA中移动的中移动的DNA序序列,不能独立存在,需插入核或核外列,不能独立存在,需插入核或核外DNA中。中。(三)(三)基因组结构与进化的关系:基因组结构与进化的关系:n1.基因组的物质组成从多样基因组的物质组成从

6、多样 单一;单一;n DNA、RNA分工明确分工明确n 单链、双链,线状、环状单链、双链,线状、环状 双链线状双链线状n2. 基因组由小基因组由小 大;大;n3. DNA的利用率越来越低;(多拷贝、非编码的利用率越来越低;(多拷贝、非编码n 区、基因不连续)区、基因不连续)n4. 调控序列增多,调控方式更复杂。调控序列增多,调控方式更复杂。第一节第一节 病毒基因组的结构病毒基因组的结构(一)病毒的基本结构(一)病毒的基本结构n外壳蛋白外壳蛋白: 识别、侵袭特定的宿主细识别、侵袭特定的宿主细 胞,并保护基因组不被胞,并保护基因组不被 核酸酶破坏;核酸酶破坏;nDNADNA(RNARNA):):编

7、码结构蛋白和少量编码结构蛋白和少量 调控蛋白。调控蛋白。n不能独立复制,必需进入宿主细胞,借助不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。细胞内一些酶类和细胞器才能得以复制。(二)病毒基因组的结构特点:(二)病毒基因组的结构特点:n1.基因组较小,大小差异较大;基因组较小,大小差异较大;n CAV DNA 2.3kb,编码,编码3种蛋白质种蛋白质n 乙肝病毒乙肝病毒RNA 3kb,编码,编码4种蛋白质种蛋白质n 痘病毒痘病毒DNA 300kb,编码几百种蛋白,编码几百种蛋白 n基因组越小,编码蛋白越少,对寄主依赖基因组越小,编码蛋白越少,对寄主依赖性越大。性越大。2

8、.2.化学组成多样化学组成多样n DNA病毒、病毒、RNA病毒病毒n 单链、双链单链、双链n 线状、环状线状、环状n 分节段、不分节段分节段、不分节段单链环状单链环状DNA,基因,基因组共组共5386个核苷酸,构个核苷酸,构成成3个个转录单元,共编转录单元,共编码码11个个蛋白质,蛋白质,总分子总分子量为量为25万万左右,相当左右,相当于于6078个个核苷酸所容核苷酸所容纳的信息量。纳的信息量。其中非编码序列只有其中非编码序列只有217/5386,不足,不足5%。3.3.基因重叠现象普遍存在基因重叠现象普遍存在重叠基因重叠基因n 定义:定义:核苷酸序列彼此重叠的核苷酸序列彼此重叠的2个基因个基

9、因为重叠基因为重叠基因overlapping genes,或称,或称嵌套基因嵌套基因nested genes。n 类型:类型: 一个基因的核苷酸序列完全包含在另一个基因中;一个基因的核苷酸序列完全包含在另一个基因中; 两个基因的核苷酸序列部分重叠;两个基因的核苷酸序列部分重叠; 两个基因只有一个碱基重叠。两个基因只有一个碱基重叠。 一个基因终止密码子的最后一个碱基是另一个基因一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基。起始密码子的第一个碱基。 5GCTGGTGGAAAATGAGGAAATTCAAT3 DNA序列序列 Leu Val Glu Asn Glu Glu Ile

10、 Gln K蛋白蛋白 Ala Gly Gly Lys Ter A蛋白蛋白 FMetArg Lys Phe Asn C蛋白蛋白 噬菌体噬菌体G4一段一段DNA序列内序列内A、C、K基因三重重叠基因三重重叠基因基因读框相同读框相同,只是起始部位不同,只是起始部位不同重叠基因重叠基因n 实质:实质:两个基因虽共用一段核苷酸序列,但其两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白质。读码结构互不相同,编码不同的蛋白质。n 意义:意义:使使DNA的利用率提高,是基因表达调控的利用率提高,是基因表达调控的方式之一。的方式之一。n目前,在少数原核生物(大肠杆菌、病毒)中目前,在少数原核生

11、物(大肠杆菌、病毒)中发现,在少数真核生物中也发现了类似的基因发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。重叠现象(果蝇)。 4.4.结构简练结构简练n大部分可编码蛋白质大部分可编码蛋白质, ,只有非常小的一只有非常小的一部份不编码蛋白质部份不编码蛋白质( (通常是基因表达的通常是基因表达的控制序列)控制序列)(非编码序列较少);(非编码序列较少); X174 DNAX174 DNA中不翻译的部份只占中不翻译的部份只占 217/5375217/5375 G4 DNA G4 DNA中不翻译的部份占中不翻译的部份占282/5577282/5577 乳头瘤病毒基因组中不翻译的部份占乳头

12、瘤病毒基因组中不翻译的部份占1.0/8.0 Kb1.0/8.0 Kb5. 5. 基因组中功能基因丛集成一个或几个特定区域,基因组中功能基因丛集成一个或几个特定区域,形成一个功能单位或转录单元,即形成形成一个功能单位或转录单元,即形成多顺反子多顺反子结构(结构(polycistroniepolycistronie)。)。 多顺反子多顺反子mRNA:mRNA:可编码两条或两条以上蛋白质分可编码两条或两条以上蛋白质分子的子的mRNAmRNA的分子的分子。6. 6. 除反转录病毒外,病毒基因组只除反转录病毒外,病毒基因组只有一个拷贝;有一个拷贝;n7.有的病毒基因组中具有宿主细胞基因有的病毒基因组中具

13、有宿主细胞基因组的结构特点;组的结构特点;n比如:某些病毒基因组中的原癌基因与宿主比如:某些病毒基因组中的原癌基因与宿主细胞具有类似结构。细胞具有类似结构。第二节第二节 原核生物基因组结构原核生物基因组结构(一)细菌基因组的结构特点:(一)细菌基因组的结构特点:n1. 拟核(类核)结构;拟核(类核)结构;n2. 存在存在多顺反子结构;多顺反子结构;n3. 除除RNA基因外,基本是单拷贝的;基因外,基本是单拷贝的;n利于核糖体的快速组装,短时间内合成大量核糖体。利于核糖体的快速组装,短时间内合成大量核糖体。n4. 非编码序列相对较少;非编码序列相对较少;(相对于真核生物)(相对于真核生物)n5.

14、 基因多是连续的;基因多是连续的;n6. 存在不同的功能识别区存在不同的功能识别区n 复制起始区、复制终止区等复制起始区、复制终止区等大肠杆菌的类核结构大肠杆菌的类核结构核中央由支架蛋白核中央由支架蛋白和和RNA组成,环状组成,环状双链双链DNA绕在支架绕在支架蛋白的外围,只有蛋白的外围,只有一个复制起点,一个复制起点,DNA与细胞膜粘在与细胞膜粘在一起一起DNA上有结合上有结合蛋白。蛋白。 (二)大肠杆菌基因组结构:大肠杆菌基因组结构:n1. 基因组基因组DNA在在4000kb,估计有,估计有3500个基因,个基因,已确定的基因有已确定的基因有900个,已确定有个,已确定有260个基因具有个

15、基因具有操纵子结构(操纵子结构(75个操纵子中),每个基因平均长个操纵子中),每个基因平均长度度1000bp;n2. 已确定的基因中,多数是与代谢有关的酶、核已确定的基因中,多数是与代谢有关的酶、核糖体蛋白;糖体蛋白;n3. 大多数基因是随机分布的,两条单链作为模板大多数基因是随机分布的,两条单链作为模板的概率基本相等;的概率基本相等;n4. 多数基因都是单拷贝。多数基因都是单拷贝。第三节第三节 真核生物核基因组真核生物核基因组(一)真核生物核基因组特点(一)真核生物核基因组特点n1. 1.基因组较大;基因组较大;n低等真核生物:低等真核生物:107-108 bp,较原核生物大,较原核生物大1

16、0倍;倍;n高等真核生物:高等真核生物:5X108-1010 bp,某些植物,某些植物和两栖生物可达和两栖生物可达1011 bp;n哺乳类生物大于哺乳类生物大于2X109它们可编码它们可编码100万个万个基因。基因。Nucleosome structureNucleosome core (left) 146 bp DNA; 1 3/4 turns of DNA DNA is negatively supercoiled two each: H2A, H2B, H3, H4 (histone octomer)Nucleosome (right) 200 bp DNA; 2 turns of DN

17、A plus spacer also includes H1 histonen2.2.真核生物核真核生物核DNADNA与蛋白质结合,与蛋白质结合, 形成核小体,再缠绕成染色质(染色体);形成核小体,再缠绕成染色质(染色体);Nucleofilament structuren3. 基因组一般为双倍体(基因组一般为双倍体(diploid););n4. 基因为单顺反子。基因为单顺反子。 单顺反子:一个基因单独转录,一个基单顺反子:一个基因单独转录,一个基因一条因一条mRNAmRNA,翻译成一条多肽链;,翻译成一条多肽链;n5. 存在大量重复序列,存在大量重复序列,重复次数可高达重复次数可高达百万倍;

18、百万倍;n6. 基因组中非编码序列多于编码序列,基因组中非编码序列多于编码序列,有大量的冗余有大量的冗余DNA;n7. 大部分基因有内含子,因此基因不大部分基因有内含子,因此基因不连续;连续;n8. 具有多个复制起点,而每个复制子具有多个复制起点,而每个复制子的长度较小。的长度较小。n真核生物基因组的突出特点:真核生物基因组的突出特点:n 重复性、基因家族、不连续性。重复性、基因家族、不连续性。Properties of the human genomeNuclear the haploid human genome has 3 X 109 bp of DNA single-copy DNA

19、comprises 75% of the human genome the human genome contains 30,000 to 40,000 genes most genes are single-copy in the haploid genome genes are composed of from 1 to 75 exons genes vary in length from 2,300,000 bp Alu sequences are present throughout the genomeMitochondrial circular genome of 17,000 b

20、p contains 40 genes Type of DNA % of Genome Features Single-copy (unique)75% Includes most genes 1Repetitive Interspersed15% Interspersed throughout genome between and within genes; includes Alu sequences 2 and VNTRs or mini (micro) satellites Satellite (tandem)10% Highly repeated, low complexity se

21、quences usually located in centromeres and telomeres1 Some genes are repeated a few times to thousands-fold and thus would be in the repetitive DNA fraction。 2 Alu sequences are about 300 bp in length and are repeated about 300,000 times in the genome. They can be found adjacent to or within genes i

22、n introns or nontranslated regions.501000I I I I I I I I Ifast 10%intermediate 15%slow (single-copy) 75%Classes of repetitive DNAInterspersed (dispersed) repeats (e.g., Alu sequences)TTAGGGTTAGGGTTAGGGTTAGGGTandem repeats (e.g., microsatellites)GCTGAGGGCTGAGGGCTGAGG间隔重复序列串联重复序列 (二)重复性(重复序列)重复性(重复序列)

23、n复杂度复杂度(X)是指在基因组)是指在基因组DNA分子中无重复核分子中无重复核苷酸序列的最大长度。例如,(苷酸序列的最大长度。例如,(ATAT)n的复的复杂度为杂度为2,(,(ATGC)n的复杂度为的复杂度为4,噬菌体,噬菌体T4是由是由2105不重复核苷酸对的不重复核苷酸对的DNA分子组成,分子组成,其复杂度为其复杂度为2105。nC0t1/2值是复性反应进行到一半时,单链值是复性反应进行到一半时,单链DNA初始浓度和所需时间的乘积,初始浓度和所需时间的乘积,C0t1/2值越大表值越大表明复性反应越慢,重复序列少,所以明复性反应越慢,重复序列少,所以C0t与与DNA中非重复序列的核苷酸数量

24、成正比。中非重复序列的核苷酸数量成正比。n来自不同生物的来自不同生物的DNA,如果反应条件和,如果反应条件和DNA片段大小相同,则复杂度越大,复片段大小相同,则复杂度越大,复性速度就越慢,而性速度就越慢,而C0t12 值就越大。值就越大。也就是说,基因组的复杂度与其也就是说,基因组的复杂度与其C0t12值成正比,即:值成正比,即: x=C0t12 基因的重复次数基因的重复次数=实际长度实际长度 / DNA复杂度复杂度真核生物真核生物DNA复性的各项参数复性的各项参数序列种类序列种类 占基因组占基因组DNA的比例的比例 C0t12值值 复杂度复杂度(X) 重复频率重复频率(f) 高度重复高度重复

25、 25% 0.0013 340bp 500000 中度重复中度重复 30% 1.9 6.0105bp 350 单一序列单一序列 45% 630 3.0108bp 1 据基因组重复次数高低:据基因组重复次数高低:n单拷贝序列单拷贝序列n 轻度重复序列轻度重复序列 2 101n重复序列重复序列 中度重复序列中度重复序列 10 102n 高度重复序列高度重复序列 102 1061. 1. 单拷贝序列:单拷贝序列:n只有一个拷贝,只有一个拷贝,占基因组的占基因组的40-70%. 主要是功能基因。主要是功能基因。n单拷贝序列又称为非重复序列单拷贝序列又称为非重复序列,在一个,在一个基因组中只有一个拷贝,

26、基因组中只有一个拷贝,在在DNA复性曲复性曲线中,它是最慢速复性的部分线中,它是最慢速复性的部分。大多数。大多数结构基因都属于这一类型,但单拷贝序结构基因都属于这一类型,但单拷贝序列并不都执行遗传功能。列并不都执行遗传功能。n真核生物的单拷贝基因是分散分布于整条染色真核生物的单拷贝基因是分散分布于整条染色体或不同染色体之中的。一个蛋白质基因也常体或不同染色体之中的。一个蛋白质基因也常分成几段相隔排列。由几个肽段的基因组成一分成几段相隔排列。由几个肽段的基因组成一个蛋白质的全部基因,有些肽段的基因仅由内个蛋白质的全部基因,有些肽段的基因仅由内含子隔开,而另一些肽段的基因则分布于几条含子隔开,而另

27、一些肽段的基因则分布于几条染色体上。染色体上。例如,珠蛋白有例如,珠蛋白有2条条链和链和2条条链,链,在人类中,在人类中,链基因位于链基因位于16号染色体上,号染色体上,链链基因则位于基因则位于11号染色体上。在号染色体上。在链基因中,又链基因中,又由几个内含子隔开,串联在由几个内含子隔开,串联在11号染色体上。号染色体上。单拷贝基因的另一个特点是普遍存在着内含子。单拷贝基因的另一个特点是普遍存在着内含子。 2. 2. 轻度重复序列轻度重复序列n基因组中有基因组中有2-10个个拷贝,是慢速复性的一部分。拷贝,是慢速复性的一部分。 主要是组蛋白和主要是组蛋白和rRNA基因、基因、 tRNA基因等

28、。基因等。 n 几个基因都有功能几个基因都有功能, 编码同一个蛋白质或编码同一个蛋白质或tRNA;分两种分两种n 几个拷贝中有的有功能,有的无功能(假基因)几个拷贝中有的有功能,有的无功能(假基因) n假基因假基因结构与功能基因相同,但不表达。结构与功能基因相同,但不表达。n 原因:原因:突变失活,启动子缺陷。突变失活,启动子缺陷。3.3.中度重复序列中度重复序列 n中度重复序列对应于中速复性的部分,在基因中度重复序列对应于中速复性的部分,在基因组中有数十至数百万个拷贝,分散在整个基因组中有数十至数百万个拷贝,分散在整个基因组中。组中。一般无一般无RNARNA转录产物(非编码序列)转录产物(非

29、编码序列),一一般认为与基因的表达调控有关般认为与基因的表达调控有关(包括转录调控序包括转录调控序列列,复制控制序列复制控制序列,转录后的加工等转录后的加工等)。n在基因组中有数千种中度重复序列,其中有一在基因组中有数千种中度重复序列,其中有一些构成序列家族。各家族成员有的重复串联在些构成序列家族。各家族成员有的重复串联在一起,有的分散于非重复序列中相间排列。一起,有的分散于非重复序列中相间排列。 n这类序列的平均长度是这类序列的平均长度是300bp左右左右。n 长周期分散的重复序列长周期分散的重复序列 5000bpn分两种分两种 n 短周期分散的重复序列短周期分散的重复序列 100 300b

30、p,主要存在于人、爪蟾、海胆等生物中,例如,主要存在于人、爪蟾、海胆等生物中,例如,Alu家族等。家族等。 4. 4. 高度重复序列高度重复序列n高度重复序列对应于快速复性部分。在基因组中有高度重复序列对应于快速复性部分。在基因组中有几百到几百万个拷贝(重复次数几百到几百万个拷贝(重复次数 102 106 ),它们的长度差异很大,短的只有几个它们的长度差异很大,短的只有几个bp,长的有几,长的有几十个到几百个十个到几百个bp或更长。这些序列一般不分散,主或更长。这些序列一般不分散,主要集中在异染色质中,特别在端粒和中心粒的附近,要集中在异染色质中,特别在端粒和中心粒的附近,由短序列重复多次串联

31、成长长的一大簇,由短序列重复多次串联成长长的一大簇,n高度重复序列富含高度重复序列富含A、T碱基,因序列简单,碱基,因序列简单,缺乏转录必要的启动子而不具转录能力,其缺乏转录必要的启动子而不具转录能力,其功能至今尚不清楚。功能至今尚不清楚。n在多数真核生物的基因组在多数真核生物的基因组DNA中,都含中,都含有有20%以上的高度重复序列,其特征之以上的高度重复序列,其特征之一是两条链的不对称性,它们构成卫星一是两条链的不对称性,它们构成卫星DNA。 卫星卫星DNADNA(satellite DNAsatellite DNA)n卫星卫星DNA(satelliteDNA)是一类高度重是一类高度重复序

32、列,这类重复顺序的重复单位一般复序列,这类重复顺序的重复单位一般由由2-10bp组成,成串排列。由于这类序组成,成串排列。由于这类序列的碱基组成不同于其他部份列的碱基组成不同于其他部份(一般富(一般富含含A/T片断,浮密度较小),片断,浮密度较小),可用等密度可用等密度梯度离心法将其与主体梯度离心法将其与主体DNA分开,因而分开,因而称为卫星称为卫星DNA或随体或随体DNA。n卫星卫星DNA通常是串联重复序列,由各种不同通常是串联重复序列,由各种不同的重复序列家族组成。的重复序列家族组成。n重复单位常存在序列变异,反映卫星重复单位常存在序列变异,反映卫星DNA可可能在经过串联重复后发生突变、重

33、复和缺失能在经过串联重复后发生突变、重复和缺失而得以进化。而得以进化。n在真核生物之间,在真核生物之间, satellite DNA 总量在总量在2%5%,甚至在亲缘关系密切相关的两个,甚至在亲缘关系密切相关的两个物种之间,物种之间, satellite DNA也会有悬殊的差别。也会有悬殊的差别。分类n卫星卫星DNA按重复单元核苷酸的多少,可按重复单元核苷酸的多少,可分为两类:分为两类:n小卫星小卫星DNA(minisatellite DNA )DNA(minisatellite DNA ),由几百由几百个核苷酸对的单元重复组成。个核苷酸对的单元重复组成。n微卫星微卫星DNA(microsat

34、ellite DNA )DNA(microsatellite DNA ),由由2-20个左右的核苷酸对的单元重复组成。个左右的核苷酸对的单元重复组成。n(占主体)(占主体)应用:应用:n1. 生物进化生物进化n2. DNA指纹图谱(亲子鉴定)指纹图谱(亲子鉴定)n3. RFLP分析分析 检测基因缺失、突检测基因缺失、突变、扩增变、扩增 (三)基因家族基因家族 gene familygene familyn1.概念概念n在真核生物基因组中来源相同、结构相似、功在真核生物基因组中来源相同、结构相似、功能相关的一组成串排列在一起的基因,称能相关的一组成串排列在一起的基因,称为基为基因家族(因家族(g

35、ene family)。)。一些基因彼此靠近,一些基因彼此靠近,成串地排列在一起,这种基因排列结构叫基因成串地排列在一起,这种基因排列结构叫基因簇(簇(gene cluster)。在基因家族结构中经常在基因家族结构中经常会看到基因簇结构。会看到基因簇结构。n基因簇基因簇多顺反子结构多顺反子结构 2、分类:分类:n串联重复多基因家族串联重复多基因家族 组蛋白、组蛋白、tRNA、rRNAn分散重复多基因家族分散重复多基因家族 n Alu 家族家族n不同组织、细胞类型、发育时期表达的多基不同组织、细胞类型、发育时期表达的多基因家族因家族 n 同工酶(珠蛋白)同工酶(珠蛋白)3、真核生物中重要的基因家

36、族、真核生物中重要的基因家族n(1) Alu基因家族基因家族 分散重复序列分散重复序列n在单倍体人基因组中有在单倍体人基因组中有5X105个拷贝,约占人个拷贝,约占人基因组的基因组的3-6%。每个重复单元的长度为。每个重复单元的长度为300bp,含一个,含一个Alu酶切位点,因而得名。酶酶切位点,因而得名。酶切后生成切后生成130bp和和170bp两个片段,每个两个片段,每个Alu片段两侧有片段两侧有6-20bp的同向重复序列,存在于的同向重复序列,存在于间隔区(间隔区(space)和内含子中。)和内含子中。n功能:可能与基因转录、调控、加工有关。功能:可能与基因转录、调控、加工有关。LDL

37、receptor geneAlu repeats present within intronsAlu repeats in exons444555666AluAluAluAluX46Aluunequalcrossing overone product has a deleted exon 5(the other product is not shown)(2 2) rRNArRNA基因家族基因家族n串联重复,有转录活性。串联重复,有转录活性。n大多数真核生物大多数真核生物rRNA基因家族基因家族 集中分布在集中分布在一条或几条染色体上,以核仁区含量最高。一条或几条染色体上,以核仁区含量最高。n

38、通常编码区较为保守,内间区具有种间特异通常编码区较为保守,内间区具有种间特异性,常被用作物种种类鉴定及进化分析。性,常被用作物种种类鉴定及进化分析。 rRNA基因家族(基因家族(gene cluster) 5S rRNA 5S rRNA 基因家族基因家族n在所有染色体上都有,分布频率较高。在所有染色体上都有,分布频率较高。n一般由一般由120bp组成每个重复单元由组成每个重复单元由5sRNA基基因和和转录区前的非转录区组成,重复串联形因和和转录区前的非转录区组成,重复串联形成基因簇。成基因簇。n非洲爪蟾卵母细胞的非洲爪蟾卵母细胞的5sRNA基因:富含基因:富含A-T的序列,由不同的的序列,由不

39、同的15bp序列重复而成,序列重复而成,(CAAAGTTTGAGTTTT)这段序列的串连数)这段序列的串连数不同,非转录的间隔区的长度会有所改变。不同,非转录的间隔区的长度会有所改变。 不同生物不同生物rRNArRNA和和tRNAtRNA基因的拷贝数基因的拷贝数物种物种 18S和和28S基因基因 5S基因基因 tRNA基因基因 大肠杆菌大肠杆菌 7 7 60 酵酵 母母 140 140 250 果果 蝇蝇 150(),250() 165 850 非洲爪蟾非洲爪蟾 450 24000 1150 人人 类类 280 2000 1300 (3 3)tRNAtRNA基因家族基因家族 ntRNA基因平均

40、长度约基因平均长度约140bp,是一类小,是一类小分子的基因,在基因组中的拷贝数可达分子的基因,在基因组中的拷贝数可达10个至数百个。个至数百个。 n基因之间串联重复排列;基因之间串联重复排列;n多个不同的多个不同的tRNA基因组成一个串联重复,基因组成一个串联重复,各重复单元中各重复单元中tRNA基因可以不相同,并基因可以不相同,并单独转录。单独转录。(4)组蛋白基因家族)组蛋白基因家族n与细胞与细胞DNA复制有关复制有关 n中度重复序列(几十中度重复序列(几十几百个重复),不含几百个重复),不含内含子,无需转录后加工,内含子,无需转录后加工,mRNA产物无产物无3polyA 基因家族基因家

41、族n与与DNA复制无关的组蛋白复制无关的组蛋白 n组织特异性表达的组蛋白组织特异性表达的组蛋白单拷贝单拷贝在高等真核生物中,在高等真核生物中,含有含有3 3类组蛋白基因:类组蛋白基因:nH2a、H2b、H3、H4和和H1基因基因,这些基因,这些基因在细胞分裂的在细胞分裂的S期中表达,与期中表达,与DNA和染色体的和染色体的复制有关;复制有关;n与与DNA和染色体的复制无关的组蛋白基因和染色体的复制无关的组蛋白基因,主要存在于不分裂的、已完成分化的细胞或组主要存在于不分裂的、已完成分化的细胞或组织中;织中;n组织专一性的组蛋白基因组织专一性的组蛋白基因,例如,红细胞中,例如,红细胞中专一的专一的

42、H5组蛋白基因。后两种组蛋白基因是单组蛋白基因。后两种组蛋白基因是单拷贝的,拷贝的,mRNA有有3-poly A。组蛋白基因家族组蛋白基因家族是指第一类的组蛋白基因。是指第一类的组蛋白基因。 Nucleosome structureNucleosome core (left) 146 bp DNA; 1 3/4 turns of DNA DNA is negatively supercoiled two each: H2A, H2B, H3, H4 (histone octomer)Nucleosome (right) 200 bp DNA; 2 turns of DNA plus space

43、r also includes H1 histone 特点:特点:n一是组蛋白基因一是组蛋白基因缺乏内含子缺乏内含子;n二是组蛋白基因的二是组蛋白基因的mRNA没有没有3poly A尾巴尾巴 。n这两个特点使组蛋白基因能很快地转录,并这两个特点使组蛋白基因能很快地转录,并将产物运输到细胞质中。将产物运输到细胞质中。 n组蛋白基因家族是重复序列中组蛋白基因家族是重复序列中唯一已知唯一已知具有蛋白质编码功能的基因具有蛋白质编码功能的基因。(5)珠蛋白基因家族)珠蛋白基因家族n珠蛋白基因家族是最早发现和研究得最多的基因家族珠蛋白基因家族是最早发现和研究得最多的基因家族之一。动物中的血红蛋白分子是珠蛋

44、白的四聚体,由之一。动物中的血红蛋白分子是珠蛋白的四聚体,由2个个亚基和亚基和2个个亚基组成。亚基组成。 亚基基因在亚基基因在16号染色号染色体上,体上, 亚基基因在亚基基因在11号染色体上,珠蛋白基因以号染色体上,珠蛋白基因以基因家族的形式排列。基因家族的形式排列。(四)基因的不连续性(四)基因的不连续性真核基因的重要特征真核基因的重要特征n发现:发现:n1977年研究病毒年研究病毒mRNA 时发现,随时发现,随后在后在 珠蛋白基因、卵清蛋白基因珠蛋白基因、卵清蛋白基因中证实了断裂基因的存在。中证实了断裂基因的存在。n 证据:证据:n 1. R环结构环结构n 2. 限制性内切酶分析限制性内切

45、酶分析(exon-intron-exon)n structure of various genes -globinHGPRT(HPRT)total = 1,660 bp; exons = 990 bphistonefactor VIIItotal = 400 bp; exon = 400 bptotal = 42,830 bp; exons = 1263 bptotal = 186,000 bp; exons = 9,000 bp鸡的卵清蛋白基因用鸡的卵清蛋白基因用EcoR和和Hind两种酶切,两种酶切,可得到可得到3或或4个片段,把该基因的个片段,把该基因的mRNA逆转录产逆转录产物物cDN

46、A(双链)用以上两种酶切,发现(双链)用以上两种酶切,发现cDNA不不能被这两种酶切。能被这两种酶切。 mRNAcDNA酶切酶切(不能被酶切)DNADNA中有的序列在中有的序列在mRNA中丢失中丢失, 且丢失部分不且丢失部分不影响基因功能影响基因功能, 酶切位点在内含子中酶切位点在内含子中。酶切酶切 1、内含子的概念内含子的概念n外显子外显子extron:成熟的:成熟的mRNA或蛋白或蛋白质中存在的序列。(在质中存在的序列。(在DNA或或mRNA中都存在的序列)中都存在的序列)n内含子内含子intron:在:在DNA上存在,而在上存在,而在mRNA(或(或cDNA)中不存在的序列,)中不存在的

47、序列,初级转录产物加工成成熟初级转录产物加工成成熟mRNA时被时被切除的间隔序列。切除的间隔序列。53promoter regionexons (filled and unfilled boxed regions)introns (between exons)transcribed regiontranslated regionmRNA structure+1 Gene structure (一个完整的具有转录功能的单元)(一个完整的具有转录功能的单元)(exon-intron-exon)n structure of various genes -globinHGPRT(HPRT)total

48、= 1,660 bp; exons = 990 bphistonefactor VIIItotal = 400 bp; exon = 400 bptotal = 42,830 bp; exons = 1263 bptotal = 186,000 bp; exons = 9,000 bp2、基因内含子的特点:、基因内含子的特点:n1.内含子是真核生物独有的,但并不是所有内含子是真核生物独有的,但并不是所有真核基因一定有内含子;(组蛋白基因家族)真核基因一定有内含子;(组蛋白基因家族)n2.内含子的数量和长度对不同的基因不同,内含子的数量和长度对不同的基因不同,一般基因越长,内含子越多;一般基因越

49、长,内含子越多;n3. 在同一基因家族中,编码序列在进化过程在同一基因家族中,编码序列在进化过程中一直比较保守,而内含子变化迅速,差异中一直比较保守,而内含子变化迅速,差异较大;较大;n(内含子变异较外显子大)(内含子变异较外显子大) n4.内含子与外显子间的连接处有特殊的内含子与外显子间的连接处有特殊的序列(序列序列(序列GTAG)。)。n高度保守序列高度保守序列 不连续基因剪接成不连续基因剪接成mRNA可可能遵照一种通用机制。能遵照一种通用机制。n5. 一个基因的内含子可以是另一个基因一个基因的内含子可以是另一个基因的外显子。的外显子。 (阅读框和剪切方式不同)(阅读框和剪切方式不同) 3

50、、内含子可能的功能内含子可能的功能: :n1.调控转录速度;调控转录速度;n通过与启动子、起始位点的精确碱基配对,通过与启动子、起始位点的精确碱基配对,阻止或增强阻止或增强RNA聚合酶的活性,从而调控转聚合酶的活性,从而调控转录。录。n2. 内含子具有各种内含子具有各种剪接信号剪接信号,使用不同的剪,使用不同的剪接方式形成不同的成熟接方式形成不同的成熟mRNA ;第四节第四节核外遗传物质的结构及功能核外遗传物质的结构及功能一、质粒一、质粒DNADNA Plasmidn1. 存在于原核生物、真菌和少数植物细胞中,存在于原核生物、真菌和少数植物细胞中,是是一种核外遗传物质一种核外遗传物质,但不是细

51、胞生存所必需,但不是细胞生存所必需的;的;n 2. 有自己的复制起始序列,独立于核有自己的复制起始序列,独立于核DNA进进行复制;(行复制;(有独立的复制系统有独立的复制系统)n 3. 质粒质粒DNA含有少量编码蛋白的基因,这些含有少量编码蛋白的基因,这些基因对宿主细胞的生存影响不大,但能改变细基因对宿主细胞的生存影响不大,但能改变细胞的某些性状,如抗性、降解有机物的酶等;胞的某些性状,如抗性、降解有机物的酶等;n 4. 质粒是分子生物学中最常见的克隆载体。质粒是分子生物学中最常见的克隆载体。(二)几种常见的质粒(二)几种常见的质粒n1. 细菌质粒细菌质粒nF质粒质粒 (又称(又称F-因子或性

52、质粒因子或性质粒sex plasmid)n高频重组质粒,具可转移性和整合性,拷贝数低;高频重组质粒,具可转移性和整合性,拷贝数低;nR质粒质粒 抗性质粒,含抗药、分解有毒物质等的基抗性质粒,含抗药、分解有毒物质等的基因;因;nCol质粒质粒(大肠杆菌素因子)(大肠杆菌素因子)n含有编码控制含有编码控制大肠杆菌素大肠杆菌素合成的基因,合成的基因,n(一种可以使不带(一种可以使不带Col质粒的细菌菌株致死的蛋白)。质粒的细菌菌株致死的蛋白)。 TiTi质粒质粒一种常用的基因工程载体一种常用的基因工程载体n土壤中有一种叫根癌农杆菌土壤中有一种叫根癌农杆菌( (Agrobacterium Agroba

53、cterium tumerfacienstumerfaciens) )的一种土壤微生物,它能感染的一种土壤微生物,它能感染9090个科的双子叶植物的受伤组织。当这种土个科的双子叶植物的受伤组织。当这种土壤杆菌侵入受伤组织后,受伤组织便不断增壤杆菌侵入受伤组织后,受伤组织便不断增生成为冠瘿瘤生成为冠瘿瘤(craw gall tumor)(craw gall tumor)。这种瘤的。这种瘤的产生是由于根癌农杆菌细胞中存在的一种质产生是由于根癌农杆菌细胞中存在的一种质粒引起的,这种质粒简称为粒引起的,这种质粒简称为TiTi(tumor tumor inducinginducing)质粒。植物受伤组织

54、细胞所发生)质粒。植物受伤组织细胞所发生的一系列变化就是由于的一系列变化就是由于TiTi质粒中的一段称为质粒中的一段称为T-DNAT-DNA的片段插入植物细胞染色体后所引起的。的片段插入植物细胞染色体后所引起的。2. 2. 酵母质粒酵母质粒n2u 质粒质粒 双链环状双链环状DNA,周长,周长2um,6318bpn3u 质粒质粒 环状环状DNA,周长,周长3umn线状杀伤质粒线状杀伤质粒 RNA质粒,线状,能分泌质粒,线状,能分泌一种杀伤因子,对其他酵母有杀伤作用,一种杀伤因子,对其他酵母有杀伤作用,以保护自身。以保护自身。 n3. 真菌质粒真菌质粒n 有线状,也有环状,有的能整合到有线状,也有

55、环状,有的能整合到线粒体中,有的与菌丝的衰老有关。线粒体中,有的与菌丝的衰老有关。n4. 植物中的质粒植物中的质粒n 类似于真菌,有线状,也有环状,类似于真菌,有线状,也有环状,有的能整合到线粒体中。有的能整合到线粒体中。二、线粒体二、线粒体DNA DNA mitochondrion DNAmitochondrion DNA(mtDNAmtDNA)n(一)线粒体(一)线粒体DNA的结构特点的结构特点n1.化学结构化学结构 cccDNA n covalently closed and circular DNAn 少数线状(存在于原核生物:草履虫、四少数线状(存在于原核生物:草履虫、四膜虫等)膜虫

56、等)n2.大小大小 16 300kb n 植物线粒体植物线粒体DNA较大,动物较小;较大,动物较小;3. 3. 复制方式:复制方式:n半保留复制,半保留复制, 型、型、 D-环、滚环复制。环、滚环复制。母性遗传,母性遗传,常用于动物进化研究常用于动物进化研究;n母性遗传:母性遗传:由于父本线粒体由于父本线粒体DNA不进入不进入子代子代DNA中。中。nY-染色体染色体 父性遗传父性遗传n常染色体常染色体 双性遗传双性遗传群体家系群体家系nX-染色体、线粒体染色体、线粒体DNA 母性遗传母性遗传n4. 动物线粒体基因组中不存在内含子,甚至动物线粒体基因组中不存在内含子,甚至还有基因重叠现象。还有基

57、因重叠现象。(二)线粒体(二)线粒体DNADNA上的基因分三类上的基因分三类 n蛋白质合成需要的蛋白质合成需要的RNA基因基因(tRNA rRNA)n编码蛋白质的基因编码蛋白质的基因(与呼吸相关的酶基因)(与呼吸相关的酶基因)n抗性基因抗性基因1. 1.蛋白质合成需要的蛋白质合成需要的RNARNA基因基因ntRNA基因基因n啤酒酵母中啤酒酵母中mtDNA上有上有24个个tRNA基因基因n粗链孢酶中有粗链孢酶中有40个,人和爪蟾中有个,人和爪蟾中有22个个n rRNA基因基因n 啤酒酵母中有啤酒酵母中有1S和和21S rRNAn 人类细胞中有人类细胞中有12S和和16S rRNAn 真核:真核:

58、28S 18S 5.8S 5Sn 原核:原核:23S 16S 5S2. 2. 编码蛋白质的基因编码蛋白质的基因(与呼吸相关的酶基因)(与呼吸相关的酶基因)n细胞色素氧化酶基因细胞色素氧化酶基因 7个亚基中个亚基中3个由个由mtDNA编码编码n NAD FMN CoQ Cytb CC1.ca3 O2n 细胞色素还原酶细胞色素还原酶 细胞色素氧化酶细胞色素氧化酶n细胞色素还原酶基因细胞色素还原酶基因 7个亚基中个亚基中1个由个由mtDNA编码编码n ATP酶基因酶基因 10 个亚基中个亚基中4个由个由mtDNA编码编码n 33. OSCP 3. 3. 抗性基因抗性基因n主要在真菌中发现,如抗氯霉素

59、、主要在真菌中发现,如抗氯霉素、抗红霉素、抗寡酶素基因等,但不抗红霉素、抗寡酶素基因等,但不是每个是每个mtDNA上均有抗性基因。上均有抗性基因。 小结:小结:n1.线粒体中可以合成蛋白;线粒体中可以合成蛋白;n2.线粒体中合成蛋白所需的基因有的线粒体中合成蛋白所需的基因有的可能来自核可能来自核DNA;n3.mtDNA的结构类似原核生物;的结构类似原核生物;n4.质粒、原核质粒、原核DNA、mtDNA有结构的有结构的相似性。相似性。(三)线粒体密码子的特殊性:(三)线粒体密码子的特殊性:n在在mtDNA中,大部分密码子与核中,大部分密码子与核DNA相同,相同,但少部分有所不同。但少部分有所不同

60、。n 密码子密码子 UGA AUA AGG/AGA n 线粒体线粒体 终止终止 Ile Arg n 核基因核基因 Try Met 终止终止 n线粒体遗传性状的双重控制线粒体遗传性状的双重控制n 线粒体的性状由核基因和线粒体基因双线粒体的性状由核基因和线粒体基因双重控制;重控制;n 线粒体的组分一方面由线粒编码,另一线粒体的组分一方面由线粒编码,另一些组分由核基因编码。些组分由核基因编码。第五节第五节 转位因子转位因子 Transposable elementTransposable element一、定义:一、定义:n能够进行复制并将一个拷贝插入新位点的能够进行复制并将一个拷贝插入新位点的DN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论