分子遗传学基因组及基因组学ppt课件_第1页
分子遗传学基因组及基因组学ppt课件_第2页
分子遗传学基因组及基因组学ppt课件_第3页
分子遗传学基因组及基因组学ppt课件_第4页
分子遗传学基因组及基因组学ppt课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 基因和基因组基因和基因组2. 病毒基因组2.1 病毒基因组的构造多样性1双链DNA病毒基因组 2单链DNA病毒基因组 3正链RNA病毒基因组 4负链RNA病毒基因组 5双链RNA病毒基因组 6反转录病毒基因组 2.2 反转录病毒基因组的构造与功能2.3重叠基因与病毒基因组中特征序列的构造和功能 重叠基因重叠基因 黏性末端黏性末端末端丰余末端丰余 循环陈列循环陈列 回文序列回文序列 末端反向反复序列末端反向反复序列 分段基因组分段基因组 帽子和帽子和poly(A)构造构造 2.3 原核生物基因组2.3.1 大肠杆菌基因组 Escherichia coli 基因组大小为4.7106b

2、p双链环状DNA分子,拟核构造;具有支配子构造,K-12 MG1655有2584个支配子,其中推定的2192个支配子中,73仅有1个基因,16.6%有2个,4.6有3个,6有4个或更多个基因。在2405个知启动子的支配子中,68只需1个启动子,20有2个,12有3个或更多个启动子;6.数个支配子还可以由一个共同的调理基因regulatory gene即调理子regulon所调控;7.除了编码rRNA的rrn基因是多拷贝,普通情况下构造基因都是单拷贝;8.不编码的基因组DNA部份所占比例比真核细胞基因组少得多;9.在基因组中编码顺序普通不会重叠.功能分类基因数目所占百分数调理功能/能够调理45/

3、1331.05/3.10细胞构造/推定的膜蛋白182/134.24/0.30推定的构造蛋白420.98噬菌体、转座子、质粒872.03运输和结合蛋白/推定的运输蛋白281/1466.55/3.04能量代谢2435.67DNA复制、重组、修饰和修复1152.68转录、RNA合成、代谢和修饰551.28翻译、翻译后蛋白质修饰1824.24细胞作用包括顺应、维护1884.38辅助因子、辅基和载体的生物合成1032.04运输的伴侣蛋白90.21核苷酸的生物合成和代谢581.35氨基酸的生物合成和代谢1313.06脂肪酸和磷脂的代谢481.12碳化合物的分解代谢1303.06主要的中间代谢1884.38

4、推定的酶2515.85其他的知基因知的基因产物或表型260.61推定的、未分类的、未知的蛋白163238.06总计4288100.00*功能分类基因数目所占百分数调理功能/能够调理45/1331.05/3.10细胞构造1824.24推定的膜蛋白130.30推定的构造蛋白420.98噬菌体、转座子、质粒872.03运输和结合蛋白2816.55推定的运输蛋白1463.04能量代谢2435.67DNA复制、重组、修饰和修复1152.68转录、RNA合成、代谢和修饰551.28翻译、翻译后蛋白质修饰1824.24细胞作用包括顺应、维护1884.38辅助因子、辅基和载体的生物合成1032.04运输的伴侣

5、蛋白90.21核苷酸的生物合成和代谢581.35氨基酸的生物合成和代谢1313.06脂肪酸和磷脂的代谢481.12碳化合物的分解代谢1303.06主要的中间代谢1884.38推定的酶2515.85其他的知基因知的基因产物或表型260.61推定的、未分类的、未知的蛋白163238.06总计4288100.00*代码 基因产物类型数目百分比2e/pe酶 /推定的酶1094 /39033.3t/pt运输蛋白/推定的运输蛋白337/254 13.3r/pr调理蛋白/推定的调理蛋白241/164 9.1m/pm膜蛋白/推定的膜蛋白43/2105.7f/pf蛋白因子/推定的蛋白因子150/60 4.7sp

6、s构造蛋白成分/推定的构造蛋白成分89/37 2.8c/pc传送蛋白推定的传送蛋白/77/42 2.7nRNA 156 3.5lp脂蛋白46 1.0cp细胞作用56 1.3l引导肽11 0.3su共同的假基因74 1.6i起始位点 (oriC)1 0.1h共同的噬菌体/插入序列(包括15个假基因)304 6.8d部分信息146 3.3o未知功能471 10.6总计44531100.0接合接合 是经过细菌是经过细菌细胞直接的接触,细胞直接的接触,遗传信息从给体单遗传信息从给体单向转移到受体从而向转移到受体从而实现遗传重组的过实现遗传重组的过程。接合能传送大程。接合能传送大段的段的DNA,在细,在

7、细菌的遗传重组中是菌的遗传重组中是效率最高的。效率最高的。转化转化 也称遗传转化也称遗传转化genetic transformation是指同源或异源的游离是指同源或异源的游离DNA分子质粒和染色体分子质粒和染色体DNA被自然或人工感受态细胞摄取,被自然或人工感受态细胞摄取,并得到表达的基因转移过程并得到表达的基因转移过程转导转导 是经过噬菌体感染将是经过噬菌体感染将DNA或或RNA转入宿主细菌细转入宿主细菌细胞并产生新性状的过程。胞并产生新性状的过程。普遍性转导普遍性转导generalized transduction 普遍性转导是经过噬菌体将给体菌的任何一种遗传普遍性转导是经过噬菌体将给体

8、菌的任何一种遗传标志转入受体菌的过程。标志转入受体菌的过程。噬菌体细菌时,细菌染色体断裂成许多小片段。在噬菌噬菌体细菌时,细菌染色体断裂成许多小片段。在噬菌体体DNA装入外壳蛋白组成新的噬菌体时,大约在装入外壳蛋白组成新的噬菌体时,大约在105107次装配中有一次装配错误。误将宿主细胞残留次装配中有一次装配错误。误将宿主细胞残留的的DNA片段装入噬菌体的外壳蛋白中,成为一个转导性片段装入噬菌体的外壳蛋白中,成为一个转导性的噬菌体。该转导性噬菌体吸附到受体细菌上,并注入的噬菌体。该转导性噬菌体吸附到受体细菌上,并注入其内含物,经过同源重组构成转导子。其内含物,经过同源重组构成转导子。局限性转导s

9、pecialized transduction噬菌体只是转导供体菌某些基因的转导过程。 噬菌体只能转导 E.coliK12 染色体 DNA 上的半乳糖基因 (gal) 和生物素基因 (bio) 。这是由于该噬菌体仅能整合在供体菌染色体 DNA 的特定位置半乳糖基因 与生物素基因上。在解离过程中偶尔发生错误 就会构成携带gal或bio基因的缺陷 噬菌体,在感染受体菌后就能高效转移这两种基因。断裂基因split gene即不延续基因interrupted gene 一个基因被不编码蛋白质的DNA片段分割成不延续的几部分,叫做断裂基因(interrupte gene)。 Gilbert将在前体RNA

10、拼接产生mRNA过程中丧失的片段称为内含子(intron),而将拼接后表达的片段称为外显子(exon)。研讨真核生物mRNA的内含子后发现,其两侧边境均有一对保守顺序,即5-端为GU,3-端为AG,这类称为GU-AG的内含子均以一样方式剪切。在不同的真核生物中,内含子的一致顺序有不少变化。动物中典型的剪接位置一致顺序组成为: 5-AGGUAAGU-YNYURAY-Y10-20-YAG-3 其中Y为U或C,N为任何核苷酸,箭头所指为外显子与内含子的交界。 5端剪接位点称供体位点donor site,5site,left splicing site, 3端剪接位点称受体位点acceptor sit

11、e,3site,right splicing site。内含子中还有另一段识别剪接边境必不可少的序列称为分枝点(branch site),位于3-端剪接位的上游,具有特征性序列组成: -YNCURAY-, 紧接在分枝点的下游有一段多嘧啶序列,也是参与剪接事件蛋白接合的位置。类 型分 布内含子性质和剪接机制转酯内含子 内含子中的剪接识别位点GUAG内含子真核细胞核前体mRNA构造变化,自在羟基的起始供体由内部分支点腺嘌呤提供,剪接体进展剪接,构成套索构造 AUAC内含子真核细胞核前体mRNA型内含子真核细胞核前体mRNA,细胞器RNA,少数细菌RNA二级构造保守,鸟核苷酸辅助因子是自在羟基供体,

12、自我剪接,无套索构造构成型内含子细胞器RNA,某些原核RNA二级构造保守,内部腺嘌呤是自在羟基供体,构成套索构造中间体,本身催化剪接型内含子细胞器RNA与型内含子类似,但较小100200bp,包含数量有限的构造域孪生内含子细胞器RNA多嵌合自我剪接内含子,常为型或型和型混合,经常以特定的顺序剪接非转酯内含子 剪接识别涉及外显子构造细胞核tRNA内含子真核生物细胞核前体tRNA剪接机制类似于tRNA的成熟涉及剪切后的衔接;没有中间体构成内含子以线性片段切除;需求机制核酸酶进展加工。2.4 真核生物基因组2.4.1真核生物基因组大小与C值悖理和N值悖理 基因组是指一个细胞或病毒所包含的全部基因。

13、通常在真核生物中指一个物种的单倍体染色体组所含有的一整套基因。生物体的单倍体基因组所含DNA的总量称为C值单位为:DNA pg或bp或Kb或Mb/某个单倍体基因组。 基因组的大小大致上与进化的复杂性有关。 生物基因组的大小同生物在进化上所处位置的高低及复杂性之间无严厉的对应关系,这种景象通常称为C值悖理(C-value paradox)。 物种的基因数目与生物进化程度或生物复杂性的不对应性,这被称之为Nnumber of genes值悖理(N value paradox)或Gnumber of genes值悖理。物 种基因组Mb基因数生殖道支原体Mycoplasma genitalium0.5

14、8470Rickettsia prowazekii1.11 834Haemophilus influenzae1.831,743Methanococcus jannaschi1.661,738B.subtilis4.24,100大肠杆菌E.coli4.64,288酿酒酵母Saccharomyces cerevisiae13.56,034裂殖酵母Schizosaccharomyces pombe12.54,929拟南芥Arabidopsis thaliana11925,498水稻 Oryza sativa46640,000黑腹果蝇Drosophila melanogaster16513,601秀

15、丽线虫Caenorhabditis elegans9718,424人Homo sapiens3,30020,000-25,000杨树(Populus trichocarpa)48510 Mb45,555蜜蜂(Apis mellifera)2621 Mb.10,000 真核生物真核生物DNADNA的复性动力学的复性动力学单链单链DNADNA所占百分数所占百分数C/Co C/Co 是是DNADNA浓度浓度CoCo同反响时间同反响时间t t乘积的乘积的函数,通常用函数,通常用CotCot来表示来表示当复性反响完成一半时当复性反响完成一半时(C/Co(C/Co1/2 , t=1/2 ),1/2 , t

16、=1/2 ),这时的这时的CotCot值定义为值定义为Cot1/2Cot1/2 CoT1/2值的特性 当条件一定时, CoT1/2值的大小与DNA的分子量及复杂性有关。 DNA分子的复杂性是指最长的没有反复序列的核苷酸对的数目。CoT1/2值越大,表示复性速度越慢,DNA的分子量越大,在不存在反复序列的情况下,值与基因组的大小成正比,在有反复顺序的复性中,在同一个复性曲线上的各动力学组分的并不因基因组的大小而增减,而是与DNA序列的反复频率成反比。复性动力学提供真核基因组序列信息原核生物基因组DNA多为单一序列,真核生物基因组DNA有反复序列。原核生物基因组的曲线通常只需一个拐点,曲线是单一的

17、S形曲线;而真核生物基因组DNA曲线通常有几个拐点,真核生物基因组的曲线是多S形曲线,由假设干个普通23个S形加合成的曲线。单一序列单一序列(unique sequence)又称又称“单拷贝序列单拷贝序列single-copy sequence,“非反复序列非反复序列nonrepetitive sequence。在基因组中只含有一个拷贝的序列叫单。在基因组中只含有一个拷贝的序列叫单一序列。一序列。轻度反复序列轻度反复序列(slightly repetitive sequence) 普通在一个普通在一个基因组内有基因组内有210份拷贝,但有时份拷贝,但有时23份拷贝的份拷贝的DNA序列序列也被视

18、作非反复序列。也被视作非反复序列。中度反复序列中度反复序列moderately repetitive sequence 普普通指通指10份到几百份拷贝的份到几百份拷贝的DNA序列。序列。高度反复序列高度反复序列(highly repetitive sequence ) 反复次数极反复次数极高,高,一个基因组中有几百份甚至几百万份拷贝的高度反复序列。一个基因组中有几百份甚至几百万份拷贝的高度反复序列。反复序列家族反复序列家族 基因组内一些高度类似的反复序列构成反复序列家族基因组内一些高度类似的反复序列构成反复序列家族(repetitive sequence family),这些反复序列包括基因和

19、基因外的序列。,这些反复序列包括基因和基因外的序列。真核生物基因组中来源一样、构造类似、功能相关的一组基因称为一个真核生物基因组中来源一样、构造类似、功能相关的一组基因称为一个基因家族基因家族(gene family)。串联反复序列家族串联反复序列家族串联反复序列是指不同数目的核苷酸简单序列的反复拷贝串联在一串联反复序列是指不同数目的核苷酸简单序列的反复拷贝串联在一同的高度反复序列,普通反复单元为同的高度反复序列,普通反复单元为2200bp,主要为卫星主要为卫星DNA (satellite DNA),按反复单位可将卫星,按反复单位可将卫星DNA分为两类:分为两类:小卫星小卫星DNA(minis

20、atellite DNA)普通由长普通由长550个核苷酸的反复单元组个核苷酸的反复单元组成。根据其在染色体上所处的位置和反复单元的长度,有两种方式的小成。根据其在染色体上所处的位置和反复单元的长度,有两种方式的小卫星卫星DNA,一种是端粒,一种是端粒DNA,另一种位于亚端粒区,称为可变数目串联,另一种位于亚端粒区,称为可变数目串联反复反复varible number tandem repeat,VNTR,是由短反复单元是由短反复单元640bp串联反复串联反复6100次以上而成的次以上而成的DNA序列。序列。微卫星微卫星DNA (microsatellite DNA)。也称为短串联反复。也称为短

21、串联反复short tandem repeat,STR是由是由26个核苷酸组成的反复单元串联反复个核苷酸组成的反复单元串联反复1060次次而成的简单反复序列,如和等,三核苷酸和四核苷酸反复相对较少。而成的简单反复序列,如和等,三核苷酸和四核苷酸反复相对较少。散在反复序列家族散在反复序列家族是分布于基因组内散在的反复序列,普通为中等反复序列。根据其是分布于基因组内散在的反复序列,普通为中等反复序列。根据其反复序列的长短,可分为短散在反复序列反复序列的长短,可分为短散在反复序列short interspersed repeated sequence又称为短散在核元件又称为短散在核元件short i

22、nterspersed nuclear elements, SINEs和长散在反复序列和长散在反复序列(long interspersed repeated sequence)又称为长散在核元件又称为长散在核元件long interspersed nuclear elements, LINEs。 SINE长约长约500bp,拷贝数在,拷贝数在10万以万以上,例如人的上,例如人的Alu序列。序列。 LINEs长约长约67kb,在哺乳动物基因组中有在哺乳动物基因组中有2万万5万个拷贝,它们组成万个拷贝,它们组成L1家族,主要含有反转录转座子。家族,主要含有反转录转座子。2.4.4基因家族 由同一个

23、祖先基因经过反复与变异、进化而构成构造与功能类似的一组基因组成一个基因家族(gene family)。基因家族中的各个成员可以聚集成簇也可以分散在不同染色体上。根据构造和功能以及在发育过程中的表达情况,基因家族可以分为:简单的多基因家族simple multigene families, 复杂的多基因家族complex multigene families发 育 控 制 的 复 杂 多 基 因 家 族(developmentaly controlled complex multigene families)简单的多基因家族简单的多基因家族 由构造一样的一个或数个基因以串联方式反复陈由构造一样的

24、一个或数个基因以串联方式反复陈列的方式存在于染色体上。真核生物核糖体列的方式存在于染色体上。真核生物核糖体rRNArRNA基因簇是典型的简单的多基因家族基因簇是典型的简单的多基因家族, ,有有18S18S、5.8S5.8S、28S28S和和5S 5S 等等4 4种种rRNArRNA基因,前基因,前3 3种主体种主体rRNA,rRNA,与后一种与后一种5S rRNA5S rRNA基因分开位于不同的染色体或一样染色体的基因分开位于不同的染色体或一样染色体的不同位置。主体不同位置。主体rRNArRNA基因按基因按18S-5.8S-28S18S-5.8S-28S顺序包含在顺序包含在约约7800bp78

25、00bp185000bp185000bp的一个的一个rDNArDNA反复单元中,其前体反复单元中,其前体为为45S rRNA45S rRNA,此前体经加工构成成熟的,此前体经加工构成成熟的rRNArRNA。反复次。反复次数在数在50501000010000左右。左右。5S rRNA5S rRNA基因家族中各个基因家族中各个5S 5S rRNArRNA基因之间为基因之间为2 26 6倍长的间隔序列所隔开,例假设倍长的间隔序列所隔开,例假设蝇的蝇的5S rRNA5S rRNA基因有基因有165165个拷贝,反复单元为个拷贝,反复单元为375bp,375bp,其其中编码区长度恒定为中编码区长度恒定为

26、120bp120bp,间隔区为,间隔区为2502505bp5bp。复杂的多基因家族复杂的多基因家族 各个成员并不都一样,数个功能相关的基因串联成簇各个成员并不都一样,数个功能相关的基因串联成簇由间隔序列分开,分别转录出各自的由间隔序列分开,分别转录出各自的mRNA。组蛋白基因。组蛋白基因属于这一类型。属于这一类型。 在海胆和果蝇中,编码在海胆和果蝇中,编码H1、H2A、H2B、H3和和H4这这5种组蛋白的基因彼此靠拢,串联在一同,构成一个反复单种组蛋白的基因彼此靠拢,串联在一同,构成一个反复单元元.每个反复单元长约每个反复单元长约6000bp左右,在海胆中反复左右,在海胆中反复300600次,

27、在果蝇中反复次,在果蝇中反复100次左右。每个反复单元中的组蛋次左右。每个反复单元中的组蛋白基因,被转录间隔区序列隔开,它们可以以一样的方向白基因,被转录间隔区序列隔开,它们可以以一样的方向转录如海胆组蛋白基因,也可以按不同反向转录假设蝇组转录如海胆组蛋白基因,也可以按不同反向转录假设蝇组蛋白基因,但共同特点之一是这些组蛋白基因内都无内含蛋白基因,但共同特点之一是这些组蛋白基因内都无内含子。哺乳动物组蛋白基因的陈列没有任何规律的极性或反子。哺乳动物组蛋白基因的陈列没有任何规律的极性或反复一致性,但它们都是一类中度反复序列,是反复序列中复一致性,但它们都是一类中度反复序列,是反复序列中独一在正常

28、情况下可以翻译出蛋白质的基因。独一在正常情况下可以翻译出蛋白质的基因。发育控制的复杂多基因家族发育控制的复杂多基因家族 功能相关的基因分别串联成簇,在生物个功能相关的基因分别串联成簇,在生物个体发育过程中按一定的顺序表达或封锁体发育过程中按一定的顺序表达或封锁,这些基这些基因家族成员随着发育阶段的变化而先后出现因家族成员随着发育阶段的变化而先后出现. 例如人类血红蛋白就属于这类基因家族所例如人类血红蛋白就属于这类基因家族所编码,该基因家族中的不同成员在胚胎不同时编码,该基因家族中的不同成员在胚胎不同时期、儿童和成人组织中表达。基因家族中的一期、儿童和成人组织中表达。基因家族中的一些成员聚集在些

29、成员聚集在DNA的一的一 个区域内,而另一些个区域内,而另一些成员分散在不同的染色体上。人类成员分散在不同的染色体上。人类-珠蛋白基珠蛋白基因和因和-珠蛋白基因分别位于第珠蛋白基因分别位于第16号染色体和第号染色体和第11号染色体上,每个基因家族都包括有功能的号染色体上,每个基因家族都包括有功能的基因和假基因。有功能的基因分别在不同的发基因和假基因。有功能的基因分别在不同的发育时期表达育时期表达.染色体染色体第第1111号染色体上的基因号染色体上的基因第第1616号染号染色体上的色体上的基因基因发育时期发育时期胚胎期胚胎期 胎儿期胎儿期G G AA成人期成人期 胚胎期胚胎期Hb GowerHb

30、 Gower2222Hb Hb PortlandPortland2 G22 G22 A22 A2HbA2 HbA2 HbAHbA22 22 2222胎儿期胎儿期 2 2和和成人期成人期 1 1Hb GowerHb Gower2222HbFHbF2 G22 G22 2 A2A2假基因假基因 核苷酸序列与相应正常功能基因根本一样,但没有编码蛋核苷酸序列与相应正常功能基因根本一样,但没有编码蛋白质才干的基因或不产生有功能产物的基因称为假基因白质才干的基因或不产生有功能产物的基因称为假基因PseudogenePseudogene。假基因经常用希腊字母假基因经常用希腊字母来表示,如血红蛋白基因家族中来表

31、示,如血红蛋白基因家族中的的类珠蛋白基因簇的类珠蛋白基因簇的、11、22和和类珠蛋白类珠蛋白基因簇的基因簇的等。等。产生假基因的缘由很多,如编码顺序出现终止密码子突变,产生假基因的缘由很多,如编码顺序出现终止密码子突变,或者插入和缺失某些核苷酸使或者插入和缺失某些核苷酸使mRNAmRNA移码,呵斥翻译中途停移码,呵斥翻译中途停顿或异常延伸,合成无活性的蛋白质等。顿或异常延伸,合成无活性的蛋白质等。根据来源和构造的不同,假基因普通分为两类:根据来源和构造的不同,假基因普通分为两类:未加工的假基因未加工的假基因(nonprocess pseudogenes)(nonprocess pseudoge

32、nes)和加工的假基和加工的假基因因(processed pseudogenes)(processed pseudogenes)。 未加工的假基因是经过基因组DNA反复产生的,经常位于有功能的一样基因拷贝的附近,保管着祖先基因的组成特点。它们与有功能的同源基因有类似的构造,原来能够是有功能的基因,但由于缺失、倒位或突变等缘由使该基因失去活性成为无功能基因。 加工的假基因也称为反转录假基因(retropseudogenes),是由RNA反转录为cDNA后再随机整合到基因组中而产生的。因此,它们在基因组中经常是分散的。加工假基因是由反转录因子编码的反转录酶和整合酶的外来活性而产生的,只在真核生物中

33、被发现。加工的假基因构造对应于来源基因的转录单位,但缺乏内含子和侧翼顺序。由于缺乏侧翼顺序,加工假基因普通不表达。超基因与超基因家族超基因与超基因家族 超基因超基因supergenesupergene是指真核生物基因组中严密连锁是指真核生物基因组中严密连锁的假设干个基因座,它们作用于同一性状或一系列相关性状。的假设干个基因座,它们作用于同一性状或一系列相关性状。例如,以上所述的人类基因组的血红蛋白基因簇就是一个超例如,以上所述的人类基因组的血红蛋白基因簇就是一个超基因。一类是类基因。一类是类珠蛋白基因簇,包括珠蛋白基因簇,包括、及及基因,基因,位于位于1616号染色体;另一类是类号染色体;另一

34、类是类珠蛋白基因簇,包括珠蛋白基因簇,包括,AA和和GG,和和,位于,位于1111号染色体。但是在个体发号染色体。但是在个体发育的不同时期,这些基因簇的不同基因进展表达,各种血红育的不同时期,这些基因簇的不同基因进展表达,各种血红蛋白的合成彼此非常协调,以保证人体正常生长发育过程中蛋白的合成彼此非常协调,以保证人体正常生长发育过程中对血红蛋白的需求。对血红蛋白的需求。超基因家族supergene family是DNA序列类似,但功能不一定相关的假设干个单拷贝基因或假设干组基因家族的总称。例如:免疫球蛋白超基因家族,ras超基因家族等。它们是一个共同的祖先基因经过各种各样的变异,产生了构造大致一

35、样但功能却不尽类似的一大批基因。这一大批基因分属于不同的基因家族,但可以总称为一个基因超家族.真核生物染色体的构造与功能真核生物染色体的构造与功能常染色质和异染色质常染色质和异染色质构造异染色质和兼性异染色质构造异染色质和兼性异染色质种类相对分子量氨基酸数目保守性染色质中比例染色质中位置H121 000215不保守0.5接头H2A14 500129较保守1中心H2B13 800125较保守1中心H315 300最保守1中心H411 300102最保守1中心复制原点复制原点 是染色体上开场所成新的是染色体上开场所成新的DNA的的那个部分,约那个部分,约100多多bp长,又称为自主复制长,又称为自

36、主复制序列序列(autonomously replicating sequence,ARS)端粒端粒 是由独特的是由独特的DNA序列及相关蛋白质组成序列及相关蛋白质组成的线性真核染色体的末端构造,它具有防止的线性真核染色体的末端构造,它具有防止末端基因降解、染色体末端间的粘连和稳定末端基因降解、染色体末端间的粘连和稳定染色体末端及其准确复制等功能。染色体末端及其准确复制等功能。着丝粒着丝粒 是细胞分裂中期两条染色单体相互是细胞分裂中期两条染色单体相互结合的部位,该处为染色体的缩窄处,故又结合的部位,该处为染色体的缩窄处,故又称为主缢痕。着丝粒染色质既含有组蛋白和称为主缢痕。着丝粒染色质既含有组

37、蛋白和其他的蛋白质,也含有其他的蛋白质,也含有DNA,而其,而其DNA的序的序列是很特殊的,可以促进与纺锤体的相互作列是很特殊的,可以促进与纺锤体的相互作用。用。异染色体构成中的因子异染色体构成中的因子 异染色质构成的分异染色质构成的分子机制很复杂,在多种因子的作用下有多子机制很复杂,在多种因子的作用下有多种途径。促使异染色质构成的因子有:组种途径。促使异染色质构成的因子有:组蛋白、修饰组蛋白的酶翻译后修饰、蛋白、修饰组蛋白的酶翻译后修饰、组蛋白结合因子、组蛋白结合因子、DNA甲基化、反复甲基化、反复DNA序列、序列特异的序列、序列特异的DNA结合蛋白以及非编结合蛋白以及非编码的码的RNAs等

38、。等。异染色体构造域的构成异染色体构造域的构成 异染色质的构成与其所在异染色质的构成与其所在位置的位置的DNA序列亲密相关。序列亲密相关。普通来说,异染色质构成普通来说,异染色质构成的主要靶区是象转座子和的主要靶区是象转座子和卫星卫星DNA这样的反复序列。这样的反复序列。异染色质与基因沉默异染色质与基因沉默染色质重塑染色质重塑chromatin remodeling、转座子、转座子、DNA甲基化及其甲基化及其RNA干扰干扰RNAi等都与基因沉默有关。但是,这些呵斥基因沉默的等都与基因沉默有关。但是,这些呵斥基因沉默的方式也都与染色质的异染色质有直接或间接的关系。方式也都与染色质的异染色质有直接

39、或间接的关系。甲基化的序列通常被DNA结合蛋白如 MeCP2所识别,这些DNA结合蛋白可以募集组蛋白脱乙酰酶和组蛋白甲基化酶,而这两种酶可以修饰临近的染色质。因此,DNA的甲基化可以标志随后异染色质所构成的位置。常染色质基因表达的分子根底常染色质基因表达的分子根底真核生物的基因表达实践上涉及到各种程度上的调真核生物的基因表达实践上涉及到各种程度上的调控问题,包括控问题,包括DNADNA程度的调控,转录前程度的调控,程度的调控,转录前程度的调控,转录程度的调控,转录后程度的调控,翻译程度的转录程度的调控,转录后程度的调控,翻译程度的调控和翻译后程度的调控等多种途径见以后各调控和翻译后程度的调控等

40、多种途径见以后各章。但归根究竟都与染色质的构造和功能有关。章。但归根究竟都与染色质的构造和功能有关。中心组蛋白对转录的作用中心组蛋白对转录的作用 组蛋白组蛋白H2AH2A、H2BH2B、H3H3和和H4H4是中心组蛋白,只需当是中心组蛋白,只需当DNADNA存在时它们才干组存在时它们才干组装成一种有序的构造。核小体在细胞中有两个重要装成一种有序的构造。核小体在细胞中有两个重要功能:紧缩功能:紧缩DNA DNA 以顺应细胞核大小和限制以顺应细胞核大小和限制DNADNA的易的易接近性。细胞广泛利用后一种功能来调控许多不同接近性。细胞广泛利用后一种功能来调控许多不同DNADNA的行为,包括基因表达。

41、的行为,包括基因表达。核小体与基因表达核小体与基因表达 核小体是染色质的根本构核小体是染色质的根本构造单位。但是,体内外实验均证明造单位。但是,体内外实验均证明, 核小体是核小体是基因转录的通用抑制子。细胞内基因组包裹在基因转录的通用抑制子。细胞内基因组包裹在核小体内,假设启动子区在核小体中,那么转核小体内,假设启动子区在核小体中,那么转录通常会被遏止。录通常会被遏止。(占先模型pre-emptive model) 染色质转录的占先模型以为组蛋白和转录因子竞争DNA,决议的要素是谁先占据调控位点。如在启动子部位已构成了核小体,那么转录因子和RNA聚合酶是不能与启动子DNA结合的;如转录因子和R

42、NA聚合酶在启动子上构成稳定的转录起始复合体,那么组蛋白那么将被排除在外。动态模型动态模型(dynamic model) 与占先模型不同,与占先模型不同,动态模型以为染色质构造的改动是经过转录因子动态模型以为染色质构造的改动是经过转录因子取代组蛋白,涉及蛋白质蛋白质、蛋白质取代组蛋白,涉及蛋白质蛋白质、蛋白质DNA之间的相互作用和接触,必需有之间的相互作用和接触,必需有ATP参与,参与,需求能量的大量输入。在需求能量的大量输入。在ATP水解释放的能量驱水解释放的能量驱动下,各种转录因子将核小体从所需的动下,各种转录因子将核小体从所需的DNA序序列中置换出来,组蛋白从染色质中解聚并释放。列中置换

43、出来,组蛋白从染色质中解聚并释放。实验发现有些转录因子在结合实验发现有些转录因子在结合DNA和和/或建立可或建立可以使核小体定位在结合位点周围的边境时可以干以使核小体定位在结合位点周围的边境时可以干扰核小体的构成。扰核小体的构成。核小体定位与核小体定位密码核小体定位与核小体定位密码 核小体是染色体的最根本构造核小体是染色体的最根本构造单位,因此核小体在单位,因此核小体在DNA上上的准确定位对细胞正常功能的的准确定位对细胞正常功能的发扬起重要作用。由于核小体发扬起重要作用。由于核小体与与DNA的动态相互作用,大的动态相互作用,大多数核小体的位置是不固定的。多数核小体的位置是不固定的。但是在有些情

44、况下,某些核小但是在有些情况下,某些核小体被限定在基因组的固定位置体被限定在基因组的固定位置上,或者说上,或者说DNA序列仅以一序列仅以一种特定的构型组装成核小体,种特定的构型组装成核小体,那么那么DNA上的每个位点将不上的每个位点将不断位于核小体上的特定位置,断位于核小体上的特定位置,我们称这种组装类型为核小体我们称这种组装类型为核小体定位定位Nucleosome positioning1.假设两个DNA结合蛋白与DNA结合位点的间隔小于DNA组装成一个核小体所需的最小长度约150bp,那么这两个蛋白质之间的DNA不与核小体结合;2.一些DNA结合蛋白具有与核小体结合的才干,与临近的核小体严

45、密作用,导致核小体立刻优先地在与这些蛋白质相邻的位置组装.核小体定位的另一种方式涉及特定的DNA序列,这些序列对核小体有高度的亲和性。由于DNA在与核小体结合的过程中会猛烈弯曲,所以具有内在弯曲倾向的DNA序列可以定位核小体。A:T 碱基对有向DNA双螺旋小沟弯曲的内在趋势,G:C 碱基对那么有相反的趋势。因此,富含A:T 的DNA有利于组装核小体,其小沟面对组蛋白八聚体核小体的构成及其在染色质上的准确定位有以下两方面的作用: 提供一个支架构造(scaffold), 使转录因子之间的信息传送更有效; 染色质构造的不均一性,即其某些区域不构成核小体, 从而保证了转录因子易于接近染色质模板。基因组

46、编码一种内在的核小体定位密码nucleosome positioning code。这种“定位密码由序列上出现的每10个碱基的周期信号组成图238。这种信号的规那么反复协助DNA片段猛烈的弯曲成核小体所需的球状。染色质的复制和转录染色质的复制和转录“复制体经过核小体的挪动模型复制体经过核小体的挪动模型Model of the movement of replisomes past nucleosomes 提出,当复制体经过复制叉时,核小体分成两个提出,当复制体经过复制叉时,核小体分成两个半核小体,经过复制叉在复制叉后这各个半核小半核小体,经过复制叉在复制叉后这各个半核小体再彼此重新组装成一个个完好的核小体体再彼此重新组装成一个个完好的核小体.用密度用密度转化实验来检验核小体复制模型时,核小体在两转化实验来检验核小体复制模型时,核小体在两个子代个子代DNA分子中都被发现既包含老组蛋白复分子中都被发现既包含老组蛋白复制前的复合体,也包括新的复制后的复合制前的复合体,也包括新的复制后的复合体。这样在蛋白质程度看,核小体的复制组装似体。这样在蛋白质程度看,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论