基因的组织与结构2课件_第1页
基因的组织与结构2课件_第2页
基因的组织与结构2课件_第3页
基因的组织与结构2课件_第4页
基因的组织与结构2课件_第5页
已阅读5页,还剩188页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 基因的组织与结构1第一节 基因与基因多样性第二节 基因组的结构与功能第三节 染色体外遗传因子第二章 基因的组织与结构2第一节 基因与基因多样性3“Particulate factor”在孟德尔遗传学的定律中,孟德尔用于命名从亲代传递给子代而不发生改变的遗传物质;遗传因子位于染色体上萨顿假设,1903年W.S.Sutton;Gene由W. Johannsen于1909年首先使用,但当时对其物质本质尚一无所知;1、基因概念的演化 基因的染色体遗传学阶段4遗传粒子理论摩尔根基因论,基因是染色体上象念珠一样线形排列的遗传物质单位,是突变、重组和功能表达三位一体;基因与性状的相关性1940年,G

2、.Beadle和R.Tatum提出“一个基因一个酶”的假设,第一次明确地把基因和蛋白质直接相关联;5基因的分子生物学阶段 基因物质本质的认识转化、转导、转 染等实验证实了DNA是遗传物质,基因的化学本质是脱氧核糖核酸,基因是具有一定的遗传学功能的DNA片段;6DNA 双螺旋结构模型Watson&Crick从结构上论证了DNA作为遗传物质的可行性;基因调控模型的建立Jacob和Monod的操纵子学说,基因是在特定遗传系统调控下的表达其功能的遗传物质单位。7基因的反向生物学阶段Functional StudiesForward GeneticsMutant CharacterizationsGen

3、etics ScreensMolecular CharacterizationsReverse GeneticsIdentification of target geneGenerate mutantGenetic analysisBiological assessment表现型(phenotype)基因型(genetype)82、基因的概念 基因是指存在于细胞内有自体繁殖能力的遗传单位,这种单位在染色体上占有一定位置而作直线排列。 基因是具有特定的核苷酸顺序的核酸分子中一个片段,是携带有特定遗传信息的功能单位。 在大多数生物中基因的化学本质是DNA,但在某些病毒中可以是RNA。93、不连续基

4、因/断裂基因Structural gene codes for any RNA or protein product other than a regulator. 结构基因:RNA或蛋白质的编码基因,而非调节基因。 Exon is any segment of an interrupted gene that is represented in the mature RNA product. 外显子:基因中的编码区,即表达产生肽链的部分。Intron is a segment of DNA that is transcribed, but removed from within the tr

5、anscript by splicing together the sequences (exons) on either side of it. 内含子:基因中的非编码区,即基因内部不表达部分。 10Transcript is the RNA product produced by copying one strand of DNA. It may require processing to generate mature RNAs. 转录本:由模板DNA转录得到的RNA产物,需进一步加工后才能成为成熟的RNA。RNA splicing is the process of excising

6、the sequ-ences in RNA that correspond to introns, so that the sequences corresponding to exons are connected into a continuous mRNA. RNA剪接:除去内含子,连接外显子序列,以产生功能的mRNA、tRNA、rRNA的过程。11断裂基因的转录与表达Interrupted genes are expressed via a precursor RNA. Introns are removed when the exons are spliced together. T

7、he mRNA has only the sequences of the exons.121977年,法 Chambon鸡的输卵管分泌卵清蛋白、卵粘蛋白和伴清蛋白,而其红细胞(鸟类的红细胞上有核的)只合成血红蛋白,那么两种组织之间DNA有什么不同呢?1)基因不连续性的发现与证实13 鸡卵清蛋白cDNA探针和红细胞及输卵管DNA Southern杂交的结果14 Phillip A. Sharp Sharp Center for Cancer Research Massachusetts Institute of Technology, USA 1944 - Richard J.Roberts

8、New England Bio-labs Beverly, MA, USA 1943 - The Nobel Prize in Physiology or Medicine 1993“for their discovery of split genes”15R-loop 法16R-looping experiments reveal introns in adenovirus17用DNA-RNA杂交的方法验证鸡卵清蛋白基因中存在非编码的内含子区。a. 成熟mRNA与带有该基因的互补链DNA序列杂交示意图;b. 鸡卵清蛋白的基因结构示意图18DNA酶切分析若同一基因的基因组DNA和cDNA的限制

9、性图谱相同,则一般不含内含子;若基因组DNA的长度大于cDNA则很可能是不连续基因。19断裂基因现象广泛存在于真核生物中,甚至在少数原核生物中也存在;并非所有的真核生物基因都是断裂基因,如组蛋白基因和干扰素基因。202)内含子与外显子特点比较不同的断裂基因所含的内含子数目有很大差别,有些基因只有一个或若干个内含子,而有的基因内含子与外显子是高度嵌合的;内含子的长度常大于外显子;在同一基因家族内,断裂基因的组织结构、外显子序列及其长度通常比较保守,而内含子变化迅速,不论是序列还是长度差异性很大。21连续基因与断裂基因外显子数目的分布Most genes are uninterrupted in

10、yeast, but most genes are interrupted in flies and mammals. (Uninterrupted genes have only 1 exon, and are totaled in the leftmost column.) 22外显子与内含子的长度变化Introns are longer than exons. The size distribution extends from approximately the same size as the exons (200 bp) to 50-60 kb in extreme cases.

11、23哺乳动物二氢叶酸还原酶(DHFR)基因 人类、小鼠和中国仓鼠的DHFR都有6个外显子,外显子基本相同,各内含子的相对位置没有改变,但长度变化很大。24exon trapping(外显子捕捉技术)Exons isolation254)基因外显子与蛋白质结构域的关系外显子常相当于多肽折叠的结构域;外显子的边界非常精确地相当于结构域之间的联结处;外显子与结构域并非在任何情况下都一一对应。5)内含子与外显子的关系外显子与内含子联结处具有1-4bp的保守的共同序列(GT-AG规则),可能与剪接反应有关;一个基因的内含子可以是另一基因的外显子。266)内含子可能的功能具有转录调控作用:内含子通过与启动

12、子、起始位点的精确碱基配对来阻止或增强RNA聚合酶的作用;内含子具有各种剪接信号,不同细胞能选择不同的拼接点,将初始转录产物进行不同的加工,对外显子进行选择地拼接,形成不同的成熟mRNA;有的内含子有自己特定的蛋白编码序列。27断裂基因 Split Genes有些基因的初级转录本,可以按照不同的途径剪辑形成不同的RNA分子,编码不同的蛋白质 28肌钙蛋白基因内含子的交替剪接,产生和两种类型的蛋白29酵母cob基因的内含子2的剪接。内含子2前部840bp的开放阅读框参与编码RNA成熟酶, RNA成熟酶又反过来将内含子2剪接30毛细血管扩张失调症(AT儿童致命性疾病)。 Disease-causi

13、ng splicing mutations described in the literature primarily produce changes in splice sites and, to a lesser extent, variations in exon-regulatory sequences such as the enhancer elements1, 2, 3, 4, 5, 6. The gene ATM is mutated in individuals with ataxia-telangiectasia; we have indentified the aberr

14、ant inclusion of a cryptic exon of 65 bp in one affected individual with a deletion of four nucleotides (GTAA) in intron 20. The deletion is located 12 bp downstream and 53 bp upstream from the 5 and 3 ends of the cryptic exon, respectively. Through analysis of the splicing defect using a hybrid min

15、igene system, we identified a new intron-splicing processing element (ISPE) complementary to U1 snRNA, the RNA component of the U1 small nuclear ribonucleoprotein (snRNP). This element mediates accurate intron processing and interacts specifically with U1 snRNP particles. The 4-nt deletion completel

16、y abolished this interaction, causing activation of the cryptic exon. On the basis of this analysis, we describe a new type of U1 snRNP binding site in an intron that is essential for accurate intron removal. Deletion of this sequence is directly involved in the splicing processing defect. 31思考如何获得基

17、因的全长(包括基因的DNA结构和cDNA结构)324、基因家族(gene family)基因家族(gene family) :来自于一个共同的祖先基因,通过复制和变异形成的结构、功能相似的基因群体;家族成员其外显子具有相似性。基因簇(genen cluster):位于同一染色体上彼此相邻近的一组相同或相关基因称为基因簇。 基因家族中的成员常集串联排列构成基因簇;但也可以不集中在一起,也分布在不同的染色体上。33基因家族的类型: 1)简单的多基因家族; 2)复杂的多基因家族; 3)时空表达差异的复杂多基因家族。341)简单的多基因家族rRNA基因家族特点:转录单元结构相似,中度重复,在基因组内分

18、散成若干个基因簇。各重复单位含有单一的转录单元和非转录区;真核生物rRNA基因通过重复单元构成基因簇,18-5.8-28S为同一转录单元,重复单元包括转录序列和将转录序列分隔开的转录间隔区;rRNA重复单元分布在一条或几条染色体的核仁区。 真核生物rDNA重复单元结构35rRNA基因家族比较简单的基因家族中转录单元保守性很高;转录单元内基因间隔区序列变化大;非转录区在不同生物中,甚至在同种生物中变化也很大。几种真核生物rRNA基因 重复单元的排列方式转录单位14kbp36rDNA非转录间隔区结构长度固定区域与可变区域相间排列;可变区域由短重复序列组成,重复次数变化导致非转录间隔区序列长度差异;

19、最前端的固定区域其序列和长度与其它固定区域不同;后三个固定区域称做Bam Island;每个重复固定区域都含有启动子序列,这有利于rDNA在需要时高效表达。37rRNA基因簇转录过程电镜观察此图为蝾螈rRNA基因簇转录时的电镜观察。转录时RNA聚合酶大量聚集于rDNA转录单元,而在非转录间隔区数量很少。显示rRNA基因的重复单元结构。382)复杂的多基因家族组蛋白基因家族由多个基因构成一个单位重复数百次;每个基因单独地按一定方向转录;各重复单元含有多个不同的转录单元和非转录区;组蛋白基因家族中的5个基因串联构成一个单元,然后又以多拷贝组织成串联的重复基因簇,基因与基因之间是非转录的间隔区。一个

20、重复单元中5个间隔区短而且互不相同。几种动物组蛋白基因的拷贝数:海胆:300-1000;果蝇:100;鸡:10小鼠:10-20; 人:30-40; 酵母:139组蛋白基因家族比较三种海胆的组蛋白基因的组织结构完全一致,不仅基因数目、排列顺序相同,转录方向也一样;果蝇和蝾螈的5种组蛋白在排列顺序和转录方向上有所不同。403)时空特异性表达的复杂多基因家族 珠蛋白基因家族人血红蛋白是珠蛋白的四聚体,分别由家族(16号染色体)和家族(11号染色体)的基因编码。在个体发育过程中,血红蛋白的亚基组成不同,基因的表达具有时序性。基因排列方式与基因在发育阶段的表达顺序一致41425、假基因假基因(pseud

21、ogene):核苷酸序列同相应的正常功能基因基本相同,但不能合成功能蛋白质的失活基因。未加工的的假基因:是通过基因组DNA复制产生,与“亲本基因”结构相似,与“亲本基因” 串联重复。珠蛋白基因家族中的假基因就属于此类型。加工的假基因(processed pseudogene):不与“亲本基因”连锁,其结构与转录本类似,如没有启动子和内含子,3末端有延伸的腺嘌呤短序列,两侧有顺向重复序列的存在。因此很可能来自加工的RNA之DNA拷贝。43重复的假基因基因簇中的假基因1同功能的珠蛋白基因密切相关, 1与1的编码和间隔序列同源性达73%,因此可能由后者重复而来;假基因并非起初就失活,而是随着进化产生

22、许多突变慢慢失活的。 44加工的假基因(processed pseudogene)Pseudogenes could arise by reverse transcription of RNA to give duplex DNAs that become integrated into the genome.456、重叠基因(overlapping gene) 莲人在绿杨津 采 一 玉漱声歌新阙采莲人在绿杨津,在绿杨津一阙新,一阙新歌声漱玉,歌声漱玉采莲人。461976年Burrell B. G., Air G. M. 和Hutchison C. A.首先报告X174噬菌体含有重叠基因。19

23、77年Sanger证实了重叠基因对单链环状的噬菌体X174进行了测序,共5386 nt。X174含有的5386nt最多能编码1795个氨基酸,若每 个氨基酸的平均分子量为110Da,则总的蛋白质分子量 为197KD,但实际蛋白质总分子量却为262KD。 将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现 共编码了11个基因,存在基因重叠的现象。4748重叠基因:同一DNA序列有两种不同阅读框架,得到不同肽链,即两个基因共同使用同一DNA序列,却编码两种不同的蛋白质。基因重叠现象的发生是由于读码框架“偏移”所致。见于病毒、线粒体和质粒DNA 。49重叠基因的类型全重叠:一个基因完全在另一个基因序

24、列内,如基因B在基因A内,基因E在基因D内。部分重叠:K基因与C基因在一段序列内重叠。1-2个碱基的重叠:大多数发生在一个基因的终止密码子与下一个基因的起始密码子之间。如D基因终止密码子TAA与J基因起始密码子ATG间“A”的重叠。 5GAAGGAGUGAUGUAAUGUCUAAAGGU3 X174 mRNA的一段序列 5GAAGGAGUGAUGUAA 3 基因D mRNA 3端序列 Glu Gly Val Met Stop 5AUGUCUAAA3 基因J mRNA 5端序列 Met Ser Lys 5GAAGGAGUGA 3 基因E mRNA 3端序列 Lys Gly StopX174 mR

25、NA内基因D、J、E的部分重叠序列50517、转位因子(transposable elements)Transposon is a DNA sequence able to insert itself at a new location in the genome (without any sequence relationship with the target locus).Direct repeats are identical (or related) sequences present in two or more copies in the same orientation in

26、the same molecular of DNA.Inverted terminal repeats are the short related or identical sequences present in reverse orientation at the ends of some transposons.IS is an abbreviation for insertion sequenceTransposase is the enzyme activity involved in insertion of transposon at a new site.521)转位因子的发现

27、Barbara McClintock532)玉米中的转位因子 (I) Ds/Ac组C基因:位于第9染色体上,是合成紫糊粉层色素所必须的基因,如果它失去正常功能,糊粉层无色。Ds因子(dissociator):可以从一个座位跳到另一个座位,在基因组内转座;也可使染色体断裂,引起缺失或重组。但是它的移动必须在另一个基因Ac存在时才能进行,Ds是非自主因子。Ac因子(activator):与Ds有同源性,当Ac因子存在时,Ds因子才能转移,Ac是自主因子。 54玉米中的转位因子 Ac因子的分离及其分子结构蜡质基因同源部分序列互补,形成DNA双链,在电镜照片中可见为较粗的线;插入的Ac因子没有互补序列

28、,形成单链环,即Ac因子。进一步测定序列,分析分子结构。 55Ac/DS分子结构AC有两个基因,转位酶基因编码转位酶,另一个基因可能是编码定位酶;Ac因子和 Ds因子序列相似性很高, 区别在于Ds因子发生转位酶基因缺失;AC和DS两端有反向重复 ( inverted repeats),是转位酶的识别标志,因此均可发生转位。56A基因:合成糊粉层所必须的基因,正常表达时糊粉层呈紫色;正常的Spm因子:类似于Ac因子,它能起抑制子(suppressor)和诱变子(mutator)的双重作用。有缺陷的Spm因子:抑制功能不完全,糊粉层呈淡紫色,正常Spm可帮助其实现完全抑制;不能转位,但在正常的Sp

29、m因子存在时能够转位。转位有缺陷的Spm因子:无抑制功能,但在Spm因子帮助下能起抑制作用;转位功能缺陷,即便是在Spm因子存在时也不能转位。周期性的Spm因子:其抑制功能交替开关。(II)Spm因子组57A基因:合成糊粉层所必须的基因。有缺陷的Spm因子:抑制功能不完全,也不能转位,但在正常的Spm因子存在时能够转位。正常的Spm因子:类似于Ac因子,它能起抑制子(suppressor)和诱变子(mutator)的作用。前者指的是帮助“有缺陷的Spm因子”起到完全的抑制作用,后者是指提供转位酶使“缺陷的Spm因子”转位。淡紫色花瓣色58转位有缺陷的Spm因子:本身无抑制功能,但在Spm因子帮

30、助下能起抑制作用;转位功能缺陷,即便是在Spm因子存在时也不能转位。周期性的Spm因子:其抑制功能交替开关。593)细菌的转位因子 (I)插入序列(IS)IS是一类自主单位,除含自身转位作用的基因外不含其它基因;IS两端具有对称的反向重复序列;转位因子转位时,基因组上的靶序列发生倍生,使插入序列的两端各有一段同向重复序列。60插入序列 长度反向重复长度靶DNA的长度编码蛋白数目转座所需蛋白靶点选择IS1IS2 IS3IS4IS10RIS50RIS903768bp 1327 14281195132915311057 23bp41181622918 9511或124999 222433221111

31、11区域优先热点热点热点热点热点不详5 GGTGATGCTGCCAACTTACTGAT.ATCAATAAGTTGGACTCATTACC 3 CCACTACGACGGTTGAATGACTA722bp.TAGTTATTCAACCTGAGTAATGGIS 1分子末端反向重复序列细菌的插入序列(IS)61(II)转座子Transposon(Tn)转座子常带有多个基因,除转位相关的酶基因外,往往还带有抗性基因。转座子可分为两个亚类:I 型转座子两末端由IS构成;II型转座子末端由反向重复序列构成。62某些转座子的基因特征转座子长度遗传标记末端组件组件方向组件间关系组件功能Tn10Tn5Tn903Tn9T

32、n16819300bp 5700 310026382088TetRKanRKanRCanREntRIS10RIS10LIS50RIS50LIS903IS1IS1倒转倒转倒转同向倒转2.5%序列差异1bp差异相同相同相同完整功能功能减弱完整功能无功能两者都具功能两者都具功能两者都具功能 细菌转座子Tn 3结构图 634)转位因子的结构特点在转位因子的两端存在末端反向重复序列(TIR),它们在转位过程中至关重要;绝大多数转位因子含有开放读框(ORF),可能编码一种酶,其功能促进转位因子的转位;受体DNA上存在很短的一段靶序列,由于转位因子的插入,在转位因子的两侧形成正向重复序列,靶序列的长短对每类

33、转位因子都是特异的。645)转位机制 复制型转座(replicative transposition) :转位因子的一个拷贝插入到靶位点,而另一拷贝则仍然保留在给体原来的位置上,如Tn3。非复制型转座(conservative transposition) :在转位酶的作用下,转位因子从原来位点上删除下来,再转移插入到另一个位点,如Tn10;65复制型转座1、转位酶识别“靶序列”。2、Tn3转座子及受体“靶序列”的单链交错切割,形成单链末端。3、突出的单链连结起来,a和f连结起来,g和d连接起来,形成一个形的交叉结构。 4、通过半保留复制产生两个Tn3转座子及两个靶序列,5、在res处发生重组

34、,通过互换产生两个双链环状DNA分子,注意转入靶序列的转座子的两侧有两个同向重复,其实就是两个靶序列。 Tn3的重组转座66 供体上最终产生双链断裂 供体位点如不能被修复则有 致死效应非复制型转座67转座子转座的特征1 转座不依赖于靶序列的同源性;2 转座后靶序列重复;3 转座子的插入具有专一性;4 转座具有排他性-转座免疫;5 转座具有极性效应;6 活化邻近的沉默基因;7 区域性优先68转座作用的遗传学效应转座引起插入突变,导致结构基因失活;转座产生新的基因;转座产生的染色体畸变;转座引起生物进化。由于转座作用,使某些原来在染色体上相距甚远的基因组合到一起,构建成新的表达单元,产生新的基因和

35、蛋白质分子。696)逆转座子(retroposons)人类免疫系统缺陷病毒(HIV)反转录病毒:能够将基因组RNA反转录成DNA拷贝(原病毒),再将其插入到宿主细胞的染色体中的病毒。反转座子:基因结构与逆转录病毒的原病毒类似,指通过RNA为中介,反转录成DNA后进行转座的可动元件,其最大的特点是编码的多肽具有逆转录酶的活性。70反转录病毒的复制循环71反转座子的结构72反转座子的分类Mammalian genomes have three thpes of retroposonsViral SuperfamilyLINESNonviral SuperfamilyCommon typesTy(S

36、. cerevisiae)Copia(D. melanogaster)L1(huaman)B1,B2,1D,B4(mouse)SINES(mammals)Pseudogenes of pol III transcriptsTerminiLong terminal repeatsNo repeatsNo repeatsTarget repeats4-6bp7-21bp7-21bpEnzyme activitiesReverse transcriptase and/or intergraseReverse transcriptase and/or intergraseNone(or none co

37、ding for transposon products)7374第二节 基因组的结构与功能基因组:是指细胞或生物体的全套(单倍体)遗传物质的总和即基因组(genome)。Genome is the complete set of sequences in the genetic material of an organism. It includes the sequence of each chromosome plus any DNA in organelles.75代表性生物体基因组大小 76C值:一个单倍体基因组的DNA含量即该物种DNA的C值,某一特定物种其C值是恒定的;C值矛盾(

38、C value paradox):一般而言,随着进化,生物体的结构与功能趋于复杂,其C值增大。但某些生物其基因组的大小与基因组的复杂度缺乏相关性,即C值矛盾。77不同进化地位生物的C值DNA content of the haploid genome is related to the morphological complexity of lower eukaryotes, but varies extensively among the higher eukaryotes. The range of DNA values within a phylum is indicated by th

39、e shaded area. 78C值矛盾表现为:C值不随生物的进化程度和复杂性而增加;关系密切的生物C值相差很大;真核生物DNA的含量远大于编码蛋白质等物质所需的量。79一、病毒基因组1、病毒基因组的结构特点 1)基因组小,但相差较大。 乙肝病毒DNA只有3kb,编码4种蛋白质;痘病毒基因组有300kb,编码几百种蛋白质 ;2)基因组可以是DNA组成,也可以是RNA,但只含一种;病毒基因组DNA和RNA可以是单链,也可以是双链的,可以是闭环分子,也可以是线性分子。 如乳头瘤病毒是闭环双链DNA,腺病毒则是线性双链DNA,脊髓灰质炎病毒是单链RNA,而呼肠孤病毒的基因组是双链RNA分子;803

40、)多数RNA病毒基因组由连续的核糖核酸链组成,但也有些病毒的基因组RNA由不连续的几条核酸链组成。 流感病毒的基因组由八条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息;4)基因重叠:即同一段DNA片段能够编码两种甚至三种蛋白质分子。5)基因组大部分是用来编码蛋白质,只有非常小的一份不被翻译。 在X174中不翻译的部份只占217/5375,G4 DNA中占282/5577,都不到5;不翻译的DNA顺序通常是基因表达的控制序列。 816)功能相关的基因常丛集形成一个功能单位或转录单元,一起转录成多顺反子mRNA,然后再加工成各种蛋白质的模板mRNA 腺病毒晚期基因在一个启动子作用下生成

41、多顺反子mRNA,再加工成外壳蛋白mRNA,编码病毒的12种外壳蛋白。7)除反转录病毒外,所有病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。反转录病毒基因组有两个拷贝。8)噬菌体基因是连续的,真核细胞病毒的基因是不连续的,具有内含子。有些真核病毒的内含子或其中的一部分,对某一个基因来说是内含子,而对另一个基因却是外显子。 SV40的早期基因从4900到4555之间一段346bp的片段是大T抗原基因的内含子,而该内含子中从4900-4624之间的DNA序列则是小t抗原的编码基因。822、RNA噬菌体的基因组结构和功能 1)MS2基因组:4个基因A蛋白(成熟蛋白)基因:使噬菌体识别宿主,使

42、RNA基因组进入宿主菌;外壳蛋白基因:编码外壳蛋白以构成病毒颗粒;RNA复制酶基因;溶解蛋白基因:与外壳蛋白和复制酶基因部分重叠,但读框不同。2)Q基因组:没有独立的溶解蛋白基因,但结构蛋白A2(或称成熟蛋白)具有溶解蛋白的功能;另一种外壳蛋白A1编码基因。 833、乙肝病毒基因组的结构特点和功能 HBV是目前已知感染人类最小的双链DNA病毒,基因组结构高度紧凑。长约3.2kb 。部分双链环状结构,双链不等长,1/3为单链。长链5端与3端未共价连接,而是与一种蛋白质共价相连;重叠的基因序列比较多 ;调节序列位于基因内部 ;与HBV基因表达有关的信号序列有4种:启动子、增强子、polyA附加信号

43、、糖皮质激素应答元件(GRE); GRE有增强子的特征:起顺式作用、在转录的两个方向均有作用、在距其调节的基因不同距离处均可起作用。84补充资料:HBV的结构特征重叠基因序列较多:已确定的开放读框有4个,分别编码病毒核壳(C)和包膜(S)蛋白,病毒复制酶(聚合酶)及一种似乎与病毒基因表达有关的蛋白质X。在S基因前面的两个小ORFs与S基因ORF属于同一个读框,可以将ORFS通读下去,编码两种S蛋白相关的抗原,这两种抗原也存在于病毒颗粒的表面,这两个抗原分别称为前-S1(pre-S1)和前-S2(pre-S2)。同样,在ORFC前面也有一短的ORF,称为前-C(pre-C),编码一较大的C蛋白相

44、关抗原。所有这些ORF都在负链(长链)上,其中S基因完全重叠于聚合酶基因中,X基因与聚合酶基因、C基因重叠,C基因与聚合酶也有重叠。最近,Miller等人在HBV基因组中又发现两个ORF,即ORF-5和ORF-6,这两个ORFs与X基因重叠,其中ORF6不是由负链DNA编码,而是由正链DNA编码。这两个ORF的功能目前尚不清楚。调节序列位于基因内部,这也是HBV节约使用遗传物质的一种方式。与HBV基团组复制有关的序列有:短链顺向复制序列(DR1和DR2)和U5样序列(因与反转录病毒末端的U5序列类似面得名)。DR1和U5位于前-CORF中,是合成DNA长链的起始部位,DR2位于聚合酶基因与X基

45、因重叠处,是DNA短链合成的起始部位。与HBV基因表达有关的信号序列有4种:启动子、增强子、polyA附加信号、糖皮质激素敏感因子(GRE)。由于HBV基因组中的基因分别转录于3种HBV mRNA转录本上,因此,相应地在病毒基因组中每一转录本近5端也至少应有3种RNA聚合酶启动子,虽然这些启动子的基因序列尚不知,但这些启动子显然存在于编码蛋白质序列内。增强子(ENH)位于聚合酶基因中;polyA附加信号位于CORF中;而GRE位于SORF和聚合酶基因中。GRE是与激素受体结构的DNA片段,结合后能使某一已知基因转录水平增加。GRE有许多增强子的特征:起顺式作用的,在转录的两个方向均有作用,在距

46、其调节的基因不同距离处均可起作用。8586二、原核生物染色体基因组 1、细菌染色体基因组结构的一般特点1)无细胞核,染色体聚集形成较为致密的类核(nucleoid)类核中央部分是RNA和支架蛋白,外围是DNA双链超螺旋;染色体DNA与细胞膜多点相连,起固定作用,与DNA复制、转录有关的信号区域优先结合。连接点的数量随生长状况和生活周期而异;2)基因组较小,基因数目少,大多只含有一条环状染色体,只有一个复制起点;873)基因结构紧凑,大部分序列用来编码蛋白质,重复序列和不编码序列少;但编码顺序一般不会重叠,即不会出现基因重叠现象;4)具操纵子结构,即数个功能相关的结构基因串联在一起,受一个调节区

47、调节;数个操纵子还可以由一个共同调节基因(regulatory gene)即调节子(regulon)调控;5)结构基因大都是单拷贝,rRNA的基因rrn往往是多拷贝;6)DNA分子中具有各种功能的识别区域. 如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。这些区域往往有特殊的顺序。 7)在基因或操纵子的终末往往具有特殊的终止顺序,它可使转录终止和RNA聚合酶从DNA链上脱落。88iOperonRegulatoryGenepozyaDNAm-RNA -GalactosidasePermeaseTransacetylaseProtein半乳糖操纵子892、大肠杆菌染色体基因组The

48、odor von Escherich (1857-1911)Austrian doctor901)基因组:大肠杆菌K-12基因组全长 4,639,221 bp,含4283个结构基因或ORF;E. coli K12物理图谱9192projectdiseasestraingenome sizeplasmid(s)*statusupdatedE. coli K-12non-pathogen;reference strainMG16554.6 Mb(none)published (1997)June 10, 2004E. coli O157:H7(EHEC)haemorrhagic colitis,

49、haemolytic uremic syndromeEDL9335.4 Mb2published (2001)Feb 13, 2001uropathogenic E. coli(UPEC)cystitis, pylonephritisCFT0735.2 Mb(none)published (2002)Dec 5, 2002E. coli K1(NMEC)septicemia, neonatal meningitisRS2185.2 Mb1finishing (assembly in 3 contigs)July 19, 2005 Shigella flexneri 2adysentery245

50、7T4.6 Mb4published (2003)Apr 28, 2003Salmonella Typhityphoid feverTy24.8 Mb(none)published (2003)Mar 21, 2003Yersinia pestisplagueKIM4.6 Mb3published (2002)Aug 1, 2002932)染色体结构DNA为双链闭合环状,对数生长期类核有2-4个DNA分子;DNA小结构域与超螺旋:在结合蛋白作用下DNA压缩成脚手架(Scaffold)结构,可观察到50-100个长度50-100kb的超螺旋结构的DNA小结构域;DNA结合蛋白:脚手架结构中心是几

51、种蛋白质复合体,一方面固定小结构域的两端,另一方面与细胞膜结合,稳定染色体结构。大肠杆菌染色体的脚手架结构943)基因排列方式基因内部连续,一般不存在非编码序列;基因间排列紧密;功能密切相关的基因构成一个调控单位,转录产物是含多个蛋白编码序列的多顺反子mRNA。4)DNA两条链作为模板指导mRNA合成的机率差不多相等 ;5)基因拷贝数大肠杆菌蛋白质编码基因基本为单拷贝;少量基因为多拷贝,如核糖体rrn操纵子有7个拷贝。95三、真核生物染色体基因组1013 cells46 chromosomes 16569 nt8000 copies of the mitochondrial genomes3.

52、2X109 bp96远大于原核生物基因组,多复制起点,复制子较短;DNA与蛋白质结合形成染色体,一般为多条;基因转录产物为单顺反子,一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链;基因组中不编码的区域多于编码区域,如在人基因组中编码序列只占23%;存在重复序列,重复次数可达百万次以上;大部分基因含有内含子,基因是不连续的。1、真核生物基因组的结构特点972、真核生物基因组的重复序列重复序列类型单一拷贝(低度重复)顺序:在单倍体基因组中只出现一次或数次,复性速度很慢 ;中度重复顺序:重复次数十至数万次,复性速度快于单拷贝顺序但慢于高度重复顺序。 高度重复顺序:重复频率高,可达百万以上

53、,复性速度很快。所占比例随种属而异,约占10-60,在人基因组中约占20。重复序列:核苷酸排列顺序基本相同并多次重复的DNA序列。98不同生物的重复序列The proportions of different sequence components vary in eukaryotic genomes.991001011)高度重复序列 反向(倒位)重复序列 由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。变性后再复性,链内互补拷贝碱基配对,形成发夹或“+”字形结构。 两个互补拷贝间可有一到几个核苷酸的间隔,也可以没有间隔。没有间隔的又称回文(palimdrome)。 两个互补拷贝组成一个

54、倒位重复单位,约长300bp。两单位之间平均相隔1.6kb。倒位重复单位多数散布基因组中。 约占人基因组的5,在极低浓度下,也能很快复性,因此又称零时复性部分。书临汉字翰林书画上荷花和尚画102 卫星DNA卫星DNA (satellite DNA) 由重复单位串联排列组成的一类高度重复序列。由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开, 因而称为卫星DNA或随体DNA。隐蔽卫星DNA 若高度重复序列GC含量与总体的碱基组成相似,密度梯度离心后将观察不到卫星峰,这类高度重复序列就是隐蔽卫星DNA。小鼠DNA在CsCl密度梯度离心中分成主峰和卫星峰103 卫星DN

55、A往往集中于异染色质,如着丝粒和端粒Cytological hybridization shows that mouse satellite DNA is located at the centromeres.104卫星DNA的产生推测是由于DNA复制过程中突变的积累及DNA不均等交换引起的。果蝇( Drosophila virilis )卫星DNA有四类序列,合计占其基因组的40%。其中第一类卫星DNA可能为原始类型,先于物种的形成。 卫星序列的特征: 序列长度很长, 序列复杂性很低, 内部序列间一致性较高。105 较复杂的重复单位组成的重复顺序 (卫星DNA) 为哺乳动物所特有;多层次 大

56、的重复单位由若干小重复单位组成,小重复单位又由若干更小的重复单位串联而成;相似性 各层次亚单位之间彼此有很高的序列相似性;短基序 多层次、高度重复的序列是由一个或数个很短的祖先序列(如小鼠为9bps)演化而来。106小鼠卫星DNA解剖:1/2亚单位小鼠卫星DNA用限制性内切酶EcoR II酶切可出现一234bp主带,即其基本重复单位;234bp基本重复单位可一分为二,序列匹配排列可发现其高度一致性;有22个差异位点,分歧率为19%。234bp基本重复单位是在进化过程中由117bp重复单位复制加倍而成,差异位点是加倍后突变积累的结果。107小鼠卫星DNA解剖:1/4亚单位117bp亚单位可再一分

57、为二,图中前2个序列为第一个1/2亚单位,后2个序列为第二个1/2亚单位;4个序列的匹配排列显示在58个位点中有23个差异位点,分歧率为40%;前3个序列相似性较高,分歧率主要由第4个序列造成。108小鼠卫星DNA解剖:1/8亚单位每个亚单位由两个相关的亚基构成(和);与共同的保守序列比较, 序列中均有一C碱基插入,而序列均有一3核苷酸插入;根据各位点的碱基出现的频率可归纳出代表性序列。109小鼠卫星DNA代表性序列小鼠卫星DNA是由三个9bp的祖先序列演化而来;代表性序列 G A A A A A C G T G A A A A A T G A G A A A A A A C T 110小卫星

58、DNA序列(minisatellite DNA) 15bp-100bp串联重复序列组成,在人类中形成15kb的序列,一般没有转录活性。微卫星DNA序列(microsatellite DNA)重复单位仅有2-5bp,如(CA)n,(GT)n,(GAA)n等,也称为简单序列重复(simple sequence repeats, SSRs),分散存在于基因组中。DNA指纹、亲缘关系分析、遗传图谱构建数目可变的串联重复序列(variable number tandem repeat, VNTR) 短串联重复序列(short tandem repeat, STR)111Minisatellites ar

59、e useful for DNA finger同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹。112113Linkage Maps of Microsatellite DNA Markers for the Pacific Oyster Crassostrea gigas114高度重复顺序的功能 参与复制的调节:DNA复制起点区附近常存在反向序列。另外,许多反向重复序列还是一些蛋白质(包括酶)和DNA的结合位点。参与基因表达调控:DNA重复顺序能转录到核内不均一RNA分子中,可以形成发夹结构,稳定RNA分子。参与转座作用:转位因子末端大都包括反向重复顺

60、序。在转位作用中即能连接非同源基因,又可以被参与转位的特异酶所识别。与进化有关:不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性;与减数分裂时染色体配对有关:卫星DNA成簇分布于染色体着丝粒附近,同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。1152)中度重复序列短分散片段 (short interspersed repeated segments, SINES): 平均长度约300bp (500bp),与平均长度约1000bp的单拷贝顺序间隔排列。拷贝数达10万左右。如Alu家族, Hinf家族。长分散片段 (long intersperse

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论