第17章-遗传物质的功能单位chaya_第1页
第17章-遗传物质的功能单位chaya_第2页
第17章-遗传物质的功能单位chaya_第3页
第17章-遗传物质的功能单位chaya_第4页
第17章-遗传物质的功能单位chaya_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五篇遗传与进化第17章——遗传物质的功能单位制作:吕梦春2015年11月25日遗传学概述遗传学是一门涉及生命起源和生物进化的理论科学,同时也是一门密切联系生产实际的基础科学。遗传学研究生物遗传和变异的科学;是研究生物体遗传信息和表达规律的科学;是研究和了解遗传物质本质的科学。 绪论

狭义定义

遗传:子代和亲代、子代和子代个体之间的相似性。变异:子代和亲代、子代和子代个体之间的差异。广义定义

遗传:同种个体之间的相似性。变异:同种个体之间的差异。遗传与变异的关系?2023/2/54/23 遗传学研究的任务a、遗传物质的结构:b、遗传物质的传递:c、遗传物质的表达:2023/2/55/23遗传学:

是研究一切生物遗传和变异的科学。阐明生物遗传和变异的现象及其表现的规律;自我复制;能储存遗传信息;能表达遗传信息;可由突变产生变异。理论上,遗传物质必须具备四个条件:第一节、遗传物质是核酸第一节、遗传物质是核酸间接证据四个1)含量:DNA含量相对恒定。2)代谢:不受生物体的营养条件、年龄等因素的影响;3)突变:一些物理和化学因素可以引起生物体遗传特性的改变。4)分布:DNA是所有生物染色体所共有:噬菌体、病毒、植物、人类等。2023/2/57/23直接证据1)格里费斯肺炎双球菌的转化实验2)艾弗里体外转化实验3)赫尔斯和蔡森的噬菌体侵染与繁殖实验

(32P35S)结论:DNA是绝大多数生物的遗传物质。2023/2/58/23RNA病毒:TMV,SARS,HIV,大多数流感病毒(如禽流感病毒、H5N1等)1956年A.Gierer和G.Schraman发现:烟草花叶病毒(TMV),其遗传物质是RNA。1957年美国的HeinzFraenkel-Conrat和B.Singre用重建实验证实了这一结论。结论:在不含DNA的某些病毒(TMV)中,RNA就是遗传物质。第一节遗传物质是核酸一、遗传物质是DNA的直接证据1928年,Griffith

肺炎双球菌体内转化实验

二.Hershey-Chase的噬菌体实验第二节基因概念的发展一、孟德尔的遗传因子——现代遗传学之父二、萨顿和博伟里建立“遗传因

子位于染色体上”的假说三、约翰逊(Johannsen)称遗传因子为基因(gene),此外,还创立了基因型和表型的概念。基因是遗传物质的结构和重组的单位,一个基因是不能被分割的最小单位;基因是控制性状的功能单位,能产生相应的表型,基因是突变的单位,他可以通过突变形成另一个等位基因;基因位于染色体上,呈线性排列。四、摩尔根创立的“三位一体”的基因假说(P752页)四、摩尔根创立的“三位一体”的基因假说

基因是决定性状的最小单位、突变的最小单位和重组的最小单位。这种“功能、交换、突变”三位一体的基因假说就是经典遗传学的基因概念。此外他们还得出了连锁互换定律(详见18.1),该定律与分离定律、自由组合定律共称遗传学三大基本定律。五、比德尔(Beadler)与其同事系统地研究了生化合成与基因的关系,提出了“一个基因一个酶”的理论,证明基因通过它所控制的酶决定着生物代谢中的生化反应步骤,进而决定着遗传性状。六、艾弗里(Avery)等人的细菌转化试验有力地证明了遗传物质为DNA,而不是蛋白质,基因位于DNA上。七、本泽尔证实了基因是一个功能单位,而不是结构上的最小单位,提出了顺反子学说:①顺反子:一段DNA序列(病毒中为一段RNA序列),能够编码一种多肽的所需要的最短的DNA片段,是遗传的功能单位,即:一个顺反子就是一个基因,②突变子:指基因中发生突变后能产生表型效应的遗传物质的最小单位,它可以是一个或多个核苷酸。③重组子:顺反子中能通过交换重组改变表型的最小单位,它在结构上不能通过交换而分开。一个基因不是一个突变单位,也不是一个重组单位,仅是一个功能单位,基因内部的一个或者若干个脱氧核苷酸对才是重组单位或突变单位。即:一个顺反子包含多个的突变子和重组子。九、超基因、假基因和拟基因的发现1.超基因:也称基因簇,作用于一种性状或一系列相关性状的几个紧密连锁在同一条染色体上的一组基因。超基因中不同基因之间没有调控的关系。分为简单多基因家族和复杂多基因家族。2.假基因:具有与功能基因相似的序列,但由于有许多突变而失去了功能,是没有功能的基因。3.拟基因:不包含有用的生物信息的基因。八、雅各布(Jacob)和莫诺建立基因表达调控的操纵子(operon)模型超基因如人类组织相容性抗原复合体HLA,称为人类白细胞抗原(humanleucocyteantigen,HLA)。HLA复合体位于第6号染色体短臂上大约4000kb范围内,由一群密切连锁的基因组成。HLA复合体是迄今已知的人体最复杂的基因体系。从着丝点一侧起依次为Ⅱ类基因、Ⅲ类基因和Ⅰ类基因区域所在。1961年开始,美国生化学家尼伦伯格(Nirenberg)和马太破译了第一个遗传密码。三联体密码的破译、中心法则的建立以及蛋白质和核酸的人工合成,基因内部精细结构的揭示,基因活动的调节和控制原理的发现,突变分子基础的阐明等,使遗传学的发展走在了生物科学的前列。十、现代基因的概念及特点1.概念:是DNA分子(RNA病毒是RNA)上具有遗传效应的片段和功能单位。2.特点:见“754-755”(1)基因呈双螺旋结构并随DNA的复制而复制(2)基因间一般不重叠(3)真核基因的主要载体是染色体(4)极少数基因是可移动的——

转座子(5)基因是一个功能单位,但不是结构单位(6)割裂基因和连续基因是否含内含子?(7)基因转录的mRNA具有相同的起始密码和终止密码一、原核细胞的基因结构非编码区非编码区编码区编码区上游编码区下游启动子终止子非编码区不能转录为信使RNA,不能编码蛋白质;但有调控遗传信息表达的核苷酸序列,最重要的位于编码区上游的RNA聚合酶结合位点.第三节基因的结构一、原核细胞的基因结构非编码区非编码区编码区编码区上游编码区下游与RNA聚合酶结合位点启动子终止子RNA聚合酶能够识别调控序列中的结合位点,并与其结合。转录开始后,RNA聚合酶沿DNA分子移动,并与DNA分子的一条链为模板合成RNA。转录完毕后,RNA链释放出来,紧接着RNA聚合酶也从DNA模板链上脱落下来。接一、原核细胞的基因结构非编码区非编码区编码区编码区上游编码区下游启动子终止子编码区能够转录为相应的信使RNA,进而指导蛋白质的合成,也就是说能够编码蛋白质二、真核细胞的基因结构编码区非编码区非编码区与RNA聚酶结合位点内含子外显子能够编码蛋白质的序列叫做外显子不能够编码蛋白质的序列叫做内含子,内含子能转录为信使RNA

启动子终止子编码区上游编码区上游内含子外显子不同的基因外显子和内含子的数目是不同的如:人的血红蛋白中,有一种蛋白质叫做β-珠蛋白,它的基因有1700个碱基对,其中有3个外显子和2个内含子,能够编码146个氨基酸人的一种凝血因子的基因,在它的186000个碱基对中,有26个外显子和25个内含子,能够编码2552个氨基酸5’3’增强子CAAT框TATA框转录起始点外显子1外显子2外显子3内含子1内含子2AATAAA转录终止点真核细胞基因结构示意图启动子:主要包括两个序列(1)在5’端转录起始点上游约20~30个核苷酸处有TATA框,它是一个短的核苷酸序列,是启动子中的一个顺序,它是RNA聚合酶的重要接触点,能使酶准确识别转录的起始点并开始转录。当TATA框中的碱基顺序有所改变时,mRNA的转录就会从不正常的位置开始。5’3’增强子CAAT框TATA框转录起始点外显子1外显子2外显子3内含子1内含子2AATAAA转录终止点真核细胞基因结构示意图启动子:主要包括两个序列(2)在5’端转录起始点上游约70~80个核苷酸的地方,有CAAT框,是启动子中另一个短的核苷酸序列,是RNA聚合酶的另一个结合点,它的作用还不肯定,一般认为它控制着转录的起始频率,而不影响转录的起始点。当框中的碱基顺序改变后,mRNA的形成量会明显减少。5’3’增强子CAAT框TATA框转录起始点外显子1外显子2外显子3内含子1内含子2AATAAA转录终止点真核细胞基因结构示意图增强子:在5’端转录起始点上游约100个核苷酸以远处的位置,能使转录活性增强上百倍。终止子:在3’端终止密码的下游有一个核苷酸顺序为AATAAA,AATAAA顺序和下游的反向重复顺序合称为终止子,是转录终止的信号。终止子的特殊碱基排列顺序能够阻碍RNA聚合酶的移动,并使其从DNA模板链上脱离下来。原核基因组的特点:1、基因组小2、利用率高,表现:1)全是编码基因,极少数不转录;2)基因不重叠3)连续(结构基因中没有内含子,)3、操纵子结构原核生物基因组真核生物基因组真核生物基因组的特点:

1.基因组分布在多个染色体上。

2.基因组远远大于原核生物的基因组,具有多复制起点。

3.转录后前体RNA必须经过剪接过程才能形成成熟的mRNA4.大部分基因含有内含子,因此,基因是不连续的(断裂基因)。

5.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。

6.单一序列为主,存在大量重复序列。三、真核生物基因组与原核生物基因组的主要区别:(1)真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体)。细菌染色体基因组通常由一条环状双链DNA分子组成,染色体形成拟核,无核膜与胞浆分开。(2)基因组远远大于原核生物的基因组,具有多个复制起点,而每个复制子的长度较小。(3)真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条肽链。

原核生物基因转录产物为多顺反子,功能上相关的几个基因往往在一起组成操纵子结构。E.Coli中乳糖操纵子结构模型

lacZlacY

lacA调节基因启动子操纵基因结构基因RNA聚合酶转录半乳糖苷酶透过酶转乙酰酶原核生物的基因簇中,结构基因受一个启动子调控。这全部基因要么一起表达,要么不表达,而且转录生成单一的mRNA分子,然后再分别翻译成几个不同的多肽分子。(4)真核基因组大部分基因含有内含子,因此,基因是不连续的,称为断裂基因,需要进行转录后加工;原核基因组没有内含子结构,不需进行转录后剪接加工。(5)真核基因组中不编码的区域多于编码区域。原核基因组大部分为编码序列,不编码区域仅占一小部分。(6)真核生物基因组存在重复序列,重复次数可达百万次以上基因组远远大于原核生物的基因组。(7)真核生物基因组存在多基因家族、超基因家族和假基因。三、真核生物基因组与原核生物基因组的主要区别:第四节基因的表达调控2023/2/539/23基因表达(geneexpression)--基因转录及翻译的过程。rRNA、tRNA的合成属于基因表达。中心法则(thecentraldogma):I顺式作用与反式作用顺式作用:顺式作用元件与靶基因位于同一条染色体上的DNA序列发挥调控作用的方式。反式作用:基因编码产物,RNA或protein调控另一簇基因的表达的方式。顺式作用元件:与基因连锁的具有调控作用的DNA序列。如启动子,终止子。反式作用因子:某些基因编码的产物如蛋白质或RNA,能调控另一个基因的表达。如RNA聚合酶基因表达的方式2023/2/540/23II正调控和负调控正调控:激活基因表达的过程,基因表达的活化物(activators)结合在受控基因上时,激活基因表达,不结合时就不表达的形式。真核生物常见负调控:抑制基因表达的过程,阻遏蛋白(repressorprotein)结合在受控基因上时不表达,不结合时就表达的形式。原核生物常见

正调控与负调控模式的比较

2023/2/542/23

2、诱导和阻遏表达

诱导(induction)--可诱导基因在特定环境信号刺激下表达增强的过程。乳糖→利用乳糖的三种酶表达

阻遏(repression)--可阻遏基因表达产物水平降低的过程色氨酸—色氨酸合成酶系2023/2/543/23基因表达调控的水平染色体和DNA水平上;转录水平上(最主要的方式);转录后水平(RNA加工、成熟水平上)——真核生物;翻译水平上;蛋白质加工水平上;2023/2/544/23无论是真核细胞还是原核细胞都有一套准确地调节基因表达和蛋白质合成的机制,使得细胞在需要的时间和地点产生相应的特异性的蛋白质成为可能。

某一个体系在需要时被打开,不需要时被关闭。这种开关的活性是通过调节转录来实现的。基因表达调控主要发生在转录水平上的调控和翻译水平上的调控。基因的选择性表达是细胞特异性的基础原核基因的表达特点:1、较真核生物简单。转录和翻译相偶联;基因组小;染色体简单2、营养状况和环境因素起着重要作用。3、转录水平上常以操纵子模式进行负调控。2023/2/546/23真核基因的表达特点:1.与原核生物相比要复杂得多(转录与翻译发生在不同的场所;基因数目多;含大量不编码序列;染色体中包括大量的组蛋白和非组蛋白)2.染色质的结构、发育阶段、激素水平起重要作用,营养和环境为次要因素。3.调控可以发生在多个不同水平上。多为正调控2023/2/547/23组蛋白(histones):是真核生物染色体的基本结构蛋白,是一类小分子碱性蛋白质,含带正电的精氨酸和赖氨酸等碱性氨基酸特别多。与DNA链中带负电的磷酸基团结合。六种类型:H1、H2A、H2B、H3、H4及古细菌组蛋白非组蛋白是高等动植物的核蛋白质中,除组蛋白之外的其他蛋白质的总称。非组蛋白主要是指与特异DNA序列相结合的蛋白质,2023/2/548/23组蛋白和非组蛋白真核基因的表达特点:1.与原核生物相比要复杂得多(转录与翻译发生在不同的场所;基因数目多;含大量不编码序列;染色体中包括大量的组蛋白和非组蛋白)2.染色质的结构、发育阶段、激素水平起重要作用,营养和环境为次要因素。3.调控可以发生在多个不同水平上。多为正调控2023/2/549/23PS1S2S3启动子OPromoter调控序列结构基因

操纵子(operon)

结合RNA聚合酶表达功能蛋白?操纵子(operon):原核生物的基因表达调控的功能单位操纵基因Operator2023/2/550/23原核生物的基因表达调控乳糖操纵子模型操纵子(operon):

调节基因(I)(产生调节蛋白)、启动子(P)、操纵基因(O)、结构基因(Z、Y、A)、终止子2023/2/551/23(调节基因)①结构基因群2023/2/552/23

操纵子中被调控的编码蛋白质的基因可称为结构基因(structuralgene,SG)。一个操纵子中含有2个以上的结构基因,多的可达十几个。乳糖操纵子含有Z、Y和A3个结构基因。分别编码β-半乳糖苷酶、β-半乳糖苷酶透性酶、β-半乳糖苷转乙酰酶②启动子2023/2/553/23

启动子(promoter,

P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。操纵子至少有一个启动子,一般在第一个结构基因5'侧上游,控制整个结构基因群的转录。

③操纵区2023/2/554/23

操纵区——operator(操作基因)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。④调控基因——i

2023/2/555/23

调控基因(regulatorygene)是编码能与操纵基因结合的调控蛋白的基因。调控蛋白有:激活蛋白(activatingprotein):与操纵区结合后能增强或起动其调控的基因转录,所介导的调控方式为正调控

阻遏蛋白(repressiveprotein):与操纵区结合后能减弱或阻止其调控的基因转录,其介导的调控方式为负调控

⑤终止子

2023/2/556/23

终止子(terminator,T)是给予RNA聚合酶转录终止信号的DNA序列。在一个操纵子中至少在结构基因群最后一个基因的后面有一个终止子。

以上5种元件是每一个操纵子必定含有的。其中启动子、操纵区位于紧邻结构基因群的上游,终止子在结构基因群之后。2023/2/557/23调节基因操纵子Lac阻遏物β-半乳糖苷酶β-半乳糖苷透性酶β-半乳糖苷乙酰基转移酶E.Coli诱导型Lac操纵子结构模型基因长度结构基因调节基因启动子操纵基因是一类编码蛋白质或RNA的基因,有lacZlacY,lacA三个基因彼此紧密连锁,按Z、Y、A顺序排列。调节基因编码的调节物通过与DNA上的特定位点结合来控制转录,是调控的关键。作用是标志转录起始的位点,RNA聚合酶在这一位点与DNA接触,并开始进行转录。是调节基因所编码的阻遏蛋白的结合部位,决定了RNA聚合酶是否能够与DNA序列上的启动子接触。原核生物的基因表达调控mRNA阻遏蛋白IDNAZYAOPpol没有乳糖存在时①阻遏蛋白的负调控阻遏基因乳糖操纵子的调控机制mRNA阻遏蛋白有乳糖存在时IDNAZYAOPpol启动转录mRNA乳糖别乳糖β-半乳糖苷酶②、乳糖存在时的诱导调控发现:葡萄糖关闭乳糖操纵子的表达(葡萄糖效应或降解物抑制效应)cAMP:环腺苷酸,浓度受葡萄糖代谢的调节;当葡萄糖可供分解利用时,cAMPCRP:cAMP受体蛋白,又称分解代谢物激活蛋白CAP,CAP可增强RNA聚合酶的转录活性,使转录提高50倍。(2)乳糖操纵子的CAP正调控生化里cAMP普遍称为环腺苷酸,在细胞信号传导中是重要的第二信使(包括:环磷腺苷(cAMP),环磷鸟苷(cGMP),肌醇磷脂,钙离子,廿碳烯酸类,一氧化氮等。).(2)乳糖操纵子的CAP正调控

代谢调节基因表达CRP(环腺苷酸受体蛋白)或

CAP(降解物基因活化蛋白)cAMP-CAP

被激活:CRP(环腺苷酸受体蛋白)或

CAP(降解物基因活化蛋白)

促进代谢操纵子进行转录引发物质进行代谢2023/2/563/23cAMPcAMP-CAP结合到代谢操纵子的一定部位葡萄糖分解代谢的降解物腺苷酸环化酶活性抑制磷酸二酯酶

活化

降低cAMP浓度降低cAMP浓度降解物阻遏机制:

由于乳糖操纵子的启动子是弱启动子,单纯因乳糖的存在发生去阻遏使lac操纵子转录开放,还不能使细菌很好利用乳糖,必需同时有CAP来加强转录活性,细菌才能合成足够的酶来利用乳糖。lac操纵子的强诱导既需要有乳糖的存在又需要没有葡萄糖可供利用。通过这机制,细菌是优先利用环境中的葡萄糖,只有无葡萄糖而又有乳糖时,细菌才去充分利用乳糖。2023/2/564/23结构基因:trpE,trpD,trpC,trpB,trpA,分别编码色氨酸合成过程中的五个酶。调控区:启动子Promoter、操纵基因operator、前导序列(Leadersequenceofaprotein)和衰减子(attenuator)trp操纵子的结构(1)色氨酸操纵子:2023/2/565/23色氨酸(Tryptophan),β-吲哚基丙氨酸,为白色或微黄色结晶或结晶性粉末;无臭,味微苦。水中微溶,在乙醇中极微溶解,在氯仿中不溶,在甲酸中易溶,在氢氧化钠试液或稀盐酸中溶解。色氨酸是植物体内生长素生物合成重要的前体物质,其结构与IAA相似,在高等植物中普遍存在。色氨酸操纵子的阻遏调控

2023/2/567/23真核生物基因表达与调控①转录前的调控——组蛋白转位模型:DNA的一个特定位置上的一种特异性的非组蛋白磷酸化以后,磷酸基带负电荷,于是非组蛋白与带负电荷的DNA相斥,并与带正电荷的组蛋白强烈地结合在一起。组蛋白和非组蛋白复合体从DNA上脱离开来,使这部分DNA裸露出来,不再受组蛋白的抑制而开始转录真核生物基因表达与调控②转录水平的调控RNA聚合酶I催化rRNA的转录,RNA聚合酶Ⅱ催化mRNA的转录,RNA聚合酶Ⅲ催化tRNA和5sRNA的转录。③转录后的调控对初产生的RNA加工剪接,去掉内含子和非编码区顺序,把几个外显子连接起来,成为成熟的mRNA。④翻译水平的调控,mRNA的戴帽与核糖体小亚基识别并与之结合,是开始翻译的条件。⑤翻译后的调控翻译的最初产物是一个大的蛋白质分子。有时,必须经酶切成更小的分子才能有生物活性。如胰岛素原→胰岛素。真核生物基因表达与调控点突变2023/2/571/23无义突变置换突变移码突变:DNA碱基中一对或少数几对邻近的核苷酸的增加或减少错义突变中性突变同义突变非功能性突变不改变功能的突变第五节

基因突变转换:嘌呤被另一个嘌呤取代或嘧啶被另一个嘧啶取代;颠换:嘌呤被嘧啶取代或嘧啶被嘌呤取代点突变:一般是在染色体上一个位点内遗传物质的化学变化,即碱基对的变化引起的突变。数目改变种类改变缺失突变插入突变重组突变2023/2/573/23大片段突变基因的自由组合(发生在减数第一次分裂后期)、基因的交叉与互换(发生在减数第一次分裂前期,四分体时期,同源染色体的非姐妹染色单体间发生交换)基因工程和细菌转化(如肺炎双球菌由R型转化为S型).

前两种是狭义的基因重组,后两种是广义的基因重组.突变的诱发因素⑴自发突变:由DNA复制,DNA损伤修复等导致的基因突变⑵诱发突变:由于环境因素引起的突变,引起突变的因子称为诱变剂:①物理性:紫外线和电离辐射——X射线,γ射线,中子流等,2023/2/574/23突变的诱变剂②化学性:改变DNA结构的化学试剂:亚硝酸盐,烷化剂等;碱基类似物:5—尿嘧啶(BU)是T类似物。结合到DNA分子上的化合物:丫啶类造成移码突变;③生物性:某些病毒的DNA或RNA逆转录成的cDNA的整个或片段整合到寄主的DNA中,可引起寄主基因突变。2023/2/575/23基因突变的特性:

随机性(任何时期,任意部位)多向性(相对地,指一定范围内的)稀有性(自然状态下突变频率低)可逆性(正向突变和回复突变)多有害性平行性2023/2/578/23201103青岛农业大学

1、基因:DNA分子上具有特定遗传效应的一段特定的核苷酸序列。遗传效应:有蛋白质产物或RNA产物或对其它基因起调节效应的功能。

2、基因组:一个单倍体染色体组中所包含的全部遗传物质。有核基因组和质基因组之分。图4-1

基因组大小

种类Mb大肠杆菌4.64啤酒酵母12.1线虫100果蝇140蝗虫5000小鼠3300豌豆4800玉米5000小麦17000人3000

2023/2/580/23Bp——basepair,1Mb=1000Kb1Kb=1000bpC值1、在每一种生物中其单倍体基因组的DNA总量是特异的,被称为C值2、每个物种C值相对恒定,不同物种C值差异极大。相对比较简单的单细胞真核生物象啤酒酵母,其基因组就有1.75×10^7bp大约是细菌基因组的3-4倍。最简单的多细胞生物隐杆线虫其基因组有8×10^7bp,大约是酵母的4倍。看来生物的复杂性和其DNA含量之间有较好的相关C值悖论高等生物具有比低等生物更复杂的生命活动,所以,理论上应该是它们的C值也应该更高。但是事实上高等生物的C值不一定高于比它低等的生物。这种生物学现象称为C值悖论。2023/2/582/23分类最小基因组支原体0.58X106细菌2.8X106酵母3.0X107霉菌5.5X107蠕虫1.1X108昆虫0.5X109鸟类0.2X1010两栖类0.1X1010哺乳类2.8X1010

2023/2/583/23

进化地位高,结构复杂的生物的同类生物最小基因组比较,符合进化程度越高,生物基因组越大的规律。

201103青岛农业大学201103青岛农业大学二、人类基因组结构

人类基因组结构庞大、复杂:基因组DNA总长度为30亿个bp,3-4万个基因分布在24条染色体上,非编码区远远多于编码区,占90%以上,结构基因占3%,以单拷贝形式存在。

1、DNA序列中的组成结构

可分为3种类型:

(1)单一序列(非重复序列、单拷贝序列)

占60-65%,在编码DNA中绝大多数为结构基因201103青岛农业大学(2)中度重复序列:占20-30%,拷贝数为104-105,

包括组蛋白基因、免疫球蛋白基因及RNA基因,绝大多数中度重复序列为不编码序列,成为间隔区,如人类Alu序列家族。

(3)高度重复序列:又称为卫星DNA

通常是小于10bp的短小序列组成基本单元,重复达105以上,占基因组的10%,不能转录,组成异染色质。

201103青岛农业大学2、结构基因

(1)概念:为蛋白质编码的基因叫-。其DNA序列大多数是不连续的,编码序列之中往往还插入有非编码序列。

(2)结构:

内含子:非编码的序列叫—。

外显子:编码序列的片段叫—。

一个结构基因常常是由多个内含子和多个外显子相间排列组成的。图4-2,n个内含子嵌合排列在n+1外显子之间,故有内外之分。

201103青岛农业大学

201103青岛农业大学(3)功能:内含子的长度比外显子的大好几倍,一起转录成RNA以后,必须经过剪接加工过程,将内含子部分切除,使外显子连接起来,才能形成成熟的mRNA,成为翻译蛋白质的模板。内含子,含而不显的片段对基因的表达有重要的调控作用。图4-3。

3、多基因家族和基因簇:

(1)多基因家族:真核生物的基因组中有许多来源相同、结构相似、功能相关的基因,这样的一组基因称为基因家族

201103青岛农业大学(2)基因簇或超基因:同一基因家族中,一些结构和功能更为相似的基因彼此靠近成串地排列在一起,形成一个基因簇。如人类类α珠蛋白基因族、类β珠蛋白基因族。

在人类基因组中,有中等重复序列构成的大的基因群,包含有几百个功能相关的基因,紧密成簇状排列,称为超基因。如人类组织相容性抗原复合体HLA,及免疫球蛋白的重链和轻链基因。

HGP的研究内容总体目标:15年内投入30亿美元,完成人类24条染色体的30亿个核苷酸序列分析主要内容:

1.基因组制图(遗传图谱、物理图谱、序列图谱、基因图谱)

2.基因的定位与分析

3.基因组研究技术的建立、改进

4.

模式生物基因组的图谱绘制及测序

5.相关课题的研究二十世纪的三大计划ManhatonApolloHGP201103青岛农业大学

(1)遗传图(geneticmap)或称为遗传连锁图:是根据基因或者遗传标记之间的交换(重组)值来确定基因在染色体上的相对距离、位置的图谱。其距离单位是厘摩(centimorgan,cM),以此纪念现代遗传学奠基人摩尔根,1cM相当于1%的交换值,大约相当于1000kb。

(2)物理图(physicalmap):是应用物理或化学技术直接确定基因或遗传标记在染色体上或DNA上的具体位置。其距离是以具体的物理长度为单位的(核苷酸对的数目、染色体显带的标号)。物理图以一个"物理标记"作为路标,以Mb、Kb、bP作为图距的基因组图。

201103青岛农业大学201103青岛农业大学1995年,第一张以称为序列标签位点STS为物理标记的物理图谱问世,它包括了94%的基因组和1500多个标记位点,平均间距为200Kb(这就是所谓的分辨率)。这样,物理图就把人类庞大基因组分成具有界标的1500个小区域。人类基因组物理图的问世是基因组计划中的一个重要里程碑,被遗传学家誉为20世纪的"生命(生物学)周期表"。第三张图是序列图,指遗传物质上核苷酸序列物理图的简称。可以说它是人类基因组在分子水平上最高层次、最为详尽的物理图。测定总长为1米、由30亿对核昔酸组成的基因组全部DNA序列,是基因组计划中最为明确、最为艰巨的定时、定量、定质的硬任务。第四张图是转录图。是以基因的外显子序列为标记,精确地表明这些标记在基因组或染色体位置的物理图物理图包括序列图和转录图在人体某一特定的组织中仅有10%的基因被表达。也就是说,只有不足1万个基因被表达。如果将这些mRNA通过一种反转录的过程构建成CDNA文库,然后再测定这些DNA的序列,最终绘制成一张可表达基因图--转录图。201103青岛农业大学遗传图制作它是以在某个遗传位点上具有多个等位基因的遗传标记作为"路标",以遗传学上的距离即两个遗传位点之间进行交换、重组的百分率cM作为"图距",反映基因遗传效应的基因组图。201103青岛农业大学DNA多态性DNA的多态性指正常人群中,DNA分子或基因的某些位点可以发生中性改变,使DNA的一级结构各不相同,但并不影响基因的表达,形成多态;DNA的多态性可以看作是在分子水平上的个体区别的遗传标志。201103青岛农业大学第一代的DNA标记——RFLPrestrictfragmentlengthpolymorphism(限制性片段长度多态性)分析。这些RFLP片断可被某些限制性内切酶特异识别并切割。DNA序列的改变甚至是一个碱基的改变,将会改变限制性内切酶酶切片段的长度变化,并可通过一种称为凝胶电泳的方法来方便地显示这种长度的"多态性"。201103青岛农业大学第二代遗传标记——STR在检测RFLP的过程中,人们发现有一种类型是由于DNA重复序列造成的。这些DNA重复序列在人类基因组中有很多拷贝,它们可以头对头或头对尾地串联成一簇,分布于基因组的各个位点。在某一位点上,数目可变的串联重复多态性(VNTR)也可以提供不同的长度片断。201103青岛农业大学第二代遗传标记——STR=SSR有的VNTR重复单位长度为6-12个碱基,称为小卫星minisatellite;有的VNTR重复单位为2-7个碱基,称为微卫星或简短串联重复(STR——icrosatellite,)。STR具有高度多态性,同一遗传位点数目变化很大,在群体中也可形成多达几十种的等位基因,这是其他遗传标记所不能比拟的;201103青岛农业大学第三代DNA遗传标记——SNPSNP是从分子水平上对单个核苷酸的差异进行检测,SNP标记可帮助区分两个个体遗传物质的差异。人类基因组大约每1250bpSNP出现一次,已有2000多个标记定位于人类染色体,对人类基因组学研究具有重要意义。SNP是人类基因组DNA序列变异的主要形式,是决定人类疾病的重要遗传基础。201103青岛农业大学荧光原位杂交fluorescenceinsituhybridazation,主要用于基因变异和染色体定位研究。FISH进行基因定位:将DNA探针用同位素或荧光染料标记,按照碱基互补配对原则,与固定在玻片上的中期染色体杂交后,在荧光显微镜下呈现不同颜色的荧光。FISH是一项十分灵敏的技术,可以检测出非整倍体,基因扩增,微小的染色体重排或易位等染色体变异201103青岛农业大学Sequence

Tagged

SiteSTS序列位置标签:一段短的DNA序列(200-500个碱基对),这种序列在染色体上只出现一次,其位置和碱基顺序都是已知的。在PCR反应中可以检测处STS来,STS适宜于作为人类基因组的一种地标,据此可以判定DNA的方向和特定序列的相对位置。ETS是cDNA上的STS。——物理图谱(序列图、转录图)201103青岛农业大学SNPsinglenucleotidepolymorphism单核苷酸多态性,是指在基因组内特定核苷酸位置上存在两种不同碱基,其中最少一种在群体中的频率不小于1%。SNP是人类基因组DNA序列变异的主要形式,是决定人类疾病的重要遗传基础。201103青岛农业大学PCR扩增技术是一种体外DNA扩增技术,是在模板DNA、引物和4种脱氧核苷酸存在的条件下,依赖于DNA聚合酶的酶促合反应,将待扩增的DNA片段与其两侧互补的寡核苷酸链引物经“高温变性——低温退火——引物延伸”三步反应的多次循环,使DNA片段在数量上呈指数增加,从而在短时间内获得我们所需的大量的特定基因片段。201103青岛农业大学凝胶电泳技术DNA和RNA多核苷酸链可叫做多聚阴离子。因此,当核酸分子被放置在电场中时,它们就会向正电极的方向迁移。由于糖-磷酸骨架结构上的重复性质,相同数量的双链DNA几乎具有等量的净电荷,因而它们能以同样的速度向正电极方向迁移。在一定的电场强度下,DNA分子的这种迁移速度,亦即电泳的迁移率,取决于核酸分子本身的大小和构型,分子量较小的DNA分子比分子量较大的DNA分子迁移要快些。这就是应用凝胶电泳技术分离DNA片段的基本原理。201103青岛农业大学SDS凝胶电泳201103青岛农业大学201103青岛农业大学(六)HGP的结果1、全部人类基因组约有2.91Gbp,约有39000多个基因;平均的基因大小有27kb;其中G+C含量偏低,仅占38%,而2号染色体中G+C的含量最多;到目前仍有9%的碱基对序列未被确定;美国和英国科学家2006年5月18日在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序。在人体全部22对常染色体中,1号染色体包含基因数量最多,达3141个,是平均水平的两倍,共有超过2.23亿个碱基对,破译难度也最大。一个由150名英国和美国科学家组成的团队历时10年,才完成了1号染色体的测序工作。而13号染色体含基因量最少;

201103青岛农业大学2、目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶占10.28%,核酸酶占7.5%,信号传导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%,选择性调节分子占3.2%,等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义

3、基因数量少得惊人:一些研究人员曾经预测人类约有14万个基因,但Celera公司将人类基因总数定在2.6383万到3.9114万个之间,不超过40,000,只是线虫或果蝇基因数量的两倍,人有而鼠没有的基因只有300个。

201103青岛农业大学4、人类单核苷酸多态性的比例约为1/1250bp,不同人群仅有140万个核苷酸差异,人与人之间99.99%的基因密码是相同的。并且发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别;

5、人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”—不包含或含有极少基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中,只有1%-1.5%DNA能编码蛋白,在人类基因组中98%以上序列都是所谓的“无用DNA”,分布着300多万个长片断重复序列。201103青岛农业大学6、男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以,可能男性在人类的遗传中起着更重要的作用;

7、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的,说明是在人类进化晚期才插入我们基因组的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换;

201103青岛农业大学8、发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。随着进一步分析,我们不仅可以确定遗传病、肿瘤、心血管病、糖尿病等危害人类生命健康最严重疾病的致病基因,寻找出个体化的防治药物和方法,同时对进一步了解人类的进化产生重大的作用;9、人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构.也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性。有人推测一个基因平均可以编码2-10种蛋白质,以适应人类复杂的功能。模式生物人类基因组计划还包括对下列五种模式生物的研究:大肠杆菌、酵母、线虫、果蝇和小鼠2023/2/5116/23谢谢12年遗传进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论