版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章基因和基因组1ppt课件.基因?2ppt课件.
顺反子通过顺反试验确定,如两个位点可以互补,则不属于一个顺反子;如两个位点不可以互补,则属于同一个顺反子。上图为突变发生在相同基因无互补,下图为突变发生在不同基因,图中蓝条表示基因,红点表示突变位点。3ppt课件.中心法则修改后的中心法则4ppt课件.1961年Jacob和Monod提出操纵子学说,和结构基因、调节基因、操纵基因等概念。
结构基因(Structuregene)是指为蛋白质或RNA编码的基因,结构基因的突变可导致蛋白质或RNA一级结构的改变。结构基因的5'-端非编码区(5'-untranslatedregion,5'-UTR)包括RNA聚合酶的识别和结合位点,被称作启动子(Promoter),结构基因的3'-非编码区(3'-UTR)包括促使转录终止的终止子(terminator)序列,和真核生物的加尾信号等。
调节基因(regulatorgene)的功能是产生调控蛋白质,调控结构基因的表达。
操纵基因(operatorgene)的功能是与调控蛋白质结合,控制结构基因的表达。调节基因和操纵基因的突变会影响一个或多个基因的表达活性。5ppt课件.基因的基本结构5’、、、AGCCGACTATGTCGAAGCTT、、、、、、GCTTGACTATAAGACA、、、3’3‘、、、TCGGCTGATACAGCTTCTAA、、、、、、CGAACTGATATTCTGT、、、5‘转录调控区贮存RNA或蛋白质结构信息区转录终止区6ppt课件.3.1基因(gene)的概念狭义:基因是核酸中贮存遗传信息的遗传单位,是编码多肽链或RNA所必需的全部核苷酸序列,以及为保证转录所必需的调控序列,和编码区上游5’-端和下游3’-端的非编码序列。广义:DNA或RNA分子中有特定遗传功能的一段序列。从生化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单位或1个突变单位。
7ppt课件.3.2基因的类型3.2.1基因家族和基因簇
基因家族(genefamily)是真核生物基因组中来源相同、结构相似、功能相关的一组基因。基因家族各成员序列上具有相关性,但相似的程度以及组织方式不同。基因家族可能由某一共同祖先基因(ancestralgene)经重复(duplication)和突变产生。8ppt课件.按照基因家族的成员在染色体上的分布,可以将基因家族分成两类。
串联重复基因(tandemlyrepeatedgenes),成簇的基因家族(clusteredgenefamily),或基因簇(genecluster),是基因家族的各成员紧密成簇排列而成的串联重复单位,定位于染色体的特殊区域。在染色体上的分布相对集中。
分散的基因家族(interspersedgenefamily),其家族成员在DNA上无明显的物理联系,甚至分散在多条染色体上,各成员在序列上有明显的差别。9ppt课件.按照家族中各成员的序列相似程度分为:简单得多基因家族:序列高度同源,同一转录单元重复排列成基因簇如rRNA基因复杂的多基因家族:几个功能相关基因,串联重复排列,不同转录单元,如组蛋白基因家族受发育调控的多基因家族:复杂多基因家族,在染色体上排列顺序与其发育过程中的表达顺序相关。10ppt课件.基因超家族(genesuperfamily)
基因超家族是指一组由多基因家族及单基因家族组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。11ppt课件.3.2.1.1简单的多基因家族
家族中各基因的全序列或至少编码序列具有高度的同源性,如rRNA基因家族。真核生物的rRNA基因串联重复排列在一段很长的DNA区域内。重复单位内rRNA基因转录区的序列几近相同,而非转录的间隔序列则有所不同。在低等真核生物如酵母的rRNA基因家族中,28S,18S,5.8S和5SrRNA基因构成一个转录单元,而高等真核生物的5SrRNA基因则单独作为一个基因家族排列在其它部位。每个转录单元重复排列成基因簇,基因之间由可转录的间隔区(TS)分开,各转录单元之间由不可转录的间隔区(NTS)分开(图3-1)。
12ppt课件.3.2.1.2复杂的多基因家族
复杂的多基因家族由几个相关基因构成独立的转录单元,家族间由间隔序列分开。例如,组蛋白基因的5个成员(H1,H2A,H2B,H3,H4)就属于这一类型。人类组蛋白基因分布在第7号染色体,拷贝数为30~40个。13ppt课件.3.2.1.3受发育调控的复杂多基因家族:人类珠蛋白基因家族基因排列的次序与它们在个体发育阶段基因表达的先后次序一致。在α家族中,ξ(Xi)基因在胚胎早期(前8周)表达,胎儿期(8周后)关闭,α2和α1在胎儿(8周后)和成人期都表达。在β家族中,ε基因排在最前面,在胚胎早期(8周内)表达,之后关闭。Gγ和Aγ基因在胎儿期表达,出生前表达量逐渐衰减,而出生后并不完全关闭,仍然少量表达。δ基因在胚胎期和成年期都有少量表达。β基因在胚胎期开始表达,表达量逐渐增加,是成人阶段表达的主要基因(表3-1)。14ppt课件.16号染色体11号染色体15ppt课件.3.2.1.4超基因家族
超家族基因(genesuperfamily)是指一组由多个基因家族组成的更大的基因家族。在高等真核细胞内,有些基因簇内含有数百个功能相关的基因,它们是由基因扩增后结构上的轻微变化而形成的,在结构上有着不同程序的同源性。这些基因或保持了原始基因的基本功能,或进化产生了某些新功能。目前已发现了很多的超基因家族,典型的例子有免疫球蛋白超基因家族、核受体超基因家族、细胞因子超基因家族等。
免疫球蛋白(immunoglobin,Ig)超基因家族包括β2微球蛋白、MHCI类α链、II类α和β链、T细胞受体(TCR)的α链和β链、CD4和CD8等与免疫有关的大分子。还有许多与免疫反应无关的蛋白质分子,如IgE受体α亚基,神经黏附分子L-1,白细胞介素IL-1和IL-6的受体等。16ppt课件.Superfamilyisasetofgenesallrelatedbypresumeddescentfromacommonancestor,butnowshowingconsiderablevariation.
Immunoglobulintypeandfunctionisdeterminedbytheheavychain.JisajoiningproteininIgMandIgA;allotherIgtypesexistastetramers.17ppt课件.3.2.2假基因(pseudogene)
假基因:在多基因家族中,某些与正常功能基因在核苷酸序列上相似,但不能转录或转录后生成无功能基因产物的DNA序列,被称为假基因。
假基因常用符号ψ表示,如ψα1
表示与α1
相似的假基因.
假基因与有功能的基因同源,原来也可以是有功能的基因,由于发生缺失(deletion)、例位(inversion)或点突变(pointmutaion)等,成为无功能的基因,即形成了假基因,哺乳动物基因组中的1/4基因为假基因,可能为进化的痕迹。(假基因的产生,基因重排?反转录产生?假基因有无可能变为有功能基因)18ppt课件.
传统的基因概念把基因看作彼此独立的、非重叠的实体。但是,随着DNA测序技术的发展,在一些噬菌体和动物病毒中发现,不同基因的核苷酸序列有时是可以共用的。也就是说,它们的核苷酸序列是彼此重叠的。这种具有独立性但部分序列彼此重叠的基因称重叠基因(overlappinggenes)或嵌套基因(nestedgenes)。
近年来的研究发现,重叠基因在真核生物中是广泛存在的。值得注意的是,高等真核生物中既存在大量的非编码序列,又普遍存在重叠基因,其生物学意义目前所知甚少,有待于进一步深入研究。3.2.3重叠基因19ppt课件.3.2.4移动基因
移动基因(movablegenes)又称转座因子(transposableelements)。由于它可以从染色体的一个位置转移到另一个位置,甚至在不同染色体之间转移,因此也称跳跃基因(jumpinggenes)。关于移动基因的详细介绍见第6章。20ppt课件.3.2.5断裂基因3.2.5.1断裂基因的概念过去人们一直认为,基因是连续不断地排列在一起一段DNA序列。但是对真核生物编码基因的研究发现,在编码序列中间插有非编码的DNA间隔区,这些间隔区称为内含子(intron);而编码区则称为外显子(exon)。含有内含子的基因称为不连续基因或断裂基因(splitgenes)。21ppt课件.mRNA的前体是核内不均一RNA,实验证据P47(如何发现的,杂交、限制性酶切图谱)不连续基因是普遍现象(原核极为少见,古细菌和噬菌体中发现了断裂基因)断裂基因共性:外显子排列顺序与产物相同,在不同组织中其内含子成分相同,内含子突变不影响蛋白产物22ppt课件.
断裂基因是Roberts和Sharp于1997年在研究腺病毒六邻体外壳蛋白质的mRNA时首先发现的,病毒DNA与它的mRNA进行分子杂交时,在电镜下观察到未与mRNA配对的DNA形成多个突环,称R环。R环的形成说明腺病毒外壳蛋白质的基因具有mRNA中不存在的序列,这些序列就是内含子。
图3-5中的(a)为电子显微镜照片,(b)为对电子显微镜照片进行解释的示意图,(c)为腺病毒六邻体外壳蛋白质基因结构的示意图。后来发现,鸡卵清蛋白质的基因与其mRNA杂交也会出现与其内含子数对应的7个R环。23ppt课件.
研究断裂基因的另一个方法是比较基因组DNA和cDNA的限制性核酸内切酶图谱。cDNA是由成熟的mRNA通过逆转录生成的,因而不含内含子。若用相同的限制性核酸内切酶水解基因组DNA和cDNA,在同样的条件下进行凝胶电泳,如果内含子中有限制性核酸内切酶的水解位点,基因组DNA的电泳图谱中就会有相应的条带,而cDNA电泳图谱中的相应条带则会缺失。研究发现,断裂基因在表达时首先转录成初级转录产物,即前体mRNA,然后经过后加工,除去内含子序列的转录物,成为成熟的mRNA分子。这种删除内含子、连接外显子的过程,称为RNA拼接或剪接。24ppt课件.ComparisonoftherestrictionmapsofcDNAandgenomicDNAformouseβ-globinshowsthatthegenehastwointronsthatarenotpresentinthecDNA.TheexonscanbealignedexactlybetweencDNAandgene.
通过比较cDNA与基因组DNA的限制性核酸内切酶图谱,也可以分析内含子的数量。25ppt课件.
Theovalbumingene,shownhere,hasintronsAtoGandexons1to7andL(Lencodesasignalpeptidesequencethattargetstheproteinforexportfromthecell).Aboutthree-quartersoftheRNAisremovedduringprocessing.PolIIextendstheprimarytranscriptwellbeyondthecleavageandpolyadenylationsite(“extraRNA”)beforeterminatingtranscription.TerminationsignalsforPolIIhavenotyetbeendefined.OverviewoftheprocessingofaeukaryoticmRNA26ppt课件.3.2.5.2断裂基因的分子进化
在真核生物的进化过程中,断裂基因的比例在逐渐增加。低等真核生物酿酒酵母中的大多数基因是连续的。在高等真核生物中,开始出现长基因,蝇类和哺乳动物基因很少小于2kb,大多数长度在5~100kb,含有几个到几十个内含子。但当基因的长度大到一定程度后,DNA的复杂性与生物的复杂性之间开始失去对应关系。例如,虽然属于同一个门,家蝇细胞的DNA总量却是果蝇的6倍。在较高等的真核生物中,基因大小主要取决于内含子的长度,与外显子的大小和数目关系不大。动物细胞的内含子一般为80~100kb,平均1127bp,有保守的分支点序列及多聚嘧啶区段。植物细胞的内含子较短,一般为80~2000bp,平均183bp。27ppt课件.
DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外显子组成,相对应mRNA长度为2000bp,但是它的DNA序列却十分长,这是由于它的内含子非常长的缘故,在三种哺乳动物中,外显子基本保持一样,内含子的相对位置也不改变,但长度变化却非常大,这就导致了基因长度范围为25~31kp。MammaliangenesforDHFRhavethesamerelativeorganizationofrathershortexonsandverylongintrons,butvaryextensivelyinthelengthsofcorrespondingintrons.28ppt课件.
在基因的进化中,可能发生外显子的复制,结果在结构基因内出现了重复序列。在鸡的胶原蛋白质基因中,一个54bp的外显子多次重复,某些外显子累积突变,失去编码功能,就可能转化为内含子。
外显子作一种功能模块,可以组装到不同的基因内。因此,在基因进化中,经常发生着外显子在不同基因之间的复制、迁移和吸纳。例如,在多种脱氢酶的基因内,均有几乎相同的与辅酶结合或脱氢酶催化区域功能有关的外显子结构。另一个典型的例子是人类低密度脂蛋白质(lowdensitylipoprotein,LDL)受体与其他蛋白质之间的关系。LDL受体基因由18个外显子构成,中间的几个外显子也出现在生长因子前体的基因内,其N端的几个外显子也为血蛋白质互补因子C9编码。29ppt课件.TheLDLreceptorgeneconsistsof18exons,someofwhicharerelatedtoEGFprecursorandsometotheC9bloodcomplementgene.Trianglesmarkthepositionsofintrons.OnlysomeoftheintronsintheregionrelatedtoEGFprecursorareidenticalinpositiontothoseintheEGFgene.LDL(低密度脂蛋白)受体基因的中心部分的一系列外显子和EGF(表皮生长因子)前体基因同源,在其N端的外显子序列和血蛋白补充因子C9的基因同源,这说明LDL基因中一系列不同功能的组份组合而具备了新的功能,而这些组份也存在于别的蛋白中。30ppt课件.
产生新基因的另一种方式是某些内含子插入到外显子内,使外显子变得更小,或将内含子切除,使外显子变得更大。例如,珠蛋白超家族包括血红蛋白(hematoglobin)、肌红蛋白(myoglobin)和豆血红蛋白(leghemoglobin),以及其它血红素结合蛋白。血红蛋白分子是由2个α-珠蛋白和2个β-珠蛋白分子构成的四聚体。肌红蛋白为单体,结构类似于珠蛋白。豆血红蛋白类似于肌红蛋白,可能是珠蛋白相关基因的共同祖先。肌红蛋白和珠蛋白基因内第2外显子负责与血红素结合,而豆血红蛋白不同于珠蛋白和肌红蛋白,它的基因有3个内含子,其中第2内含子把血红素结合域的外显子又分隔成2个外显子。可能的进化途径是,豆血红蛋白丢失内含子,使珠蛋白或肌红蛋白的两个外显子融合成了一个。31ppt课件.Theratinsulingenewithoneintronevolvedbylosinganintronfromanancestorwithtwointerruptions.
哺乳动物(除了啮齿类)和鸟类编码胰岛素的基因是由同一基因演化分离而来的。鸡的胰岛素基因有2个内含子,大鼠的其中一个基因与之有相同的结构。这个共同性说明胰岛素最初有2个内含子,而大鼠的另一个基因只含有1个内含子,说明它在演化过程中首先进行复制,然后从一个拷贝中精确地移去了一个内含子。32ppt课件.
原始的鱼类只有一种珠蛋白链,硬骨鱼和两栖类有连锁的α基因和β基因,说明在大约5亿年前,硬骨鱼进化期间,珠蛋白祖先基因倍增,并变异形成了α基因和β基因。哺乳类和鸟类是在约3.5亿年前同两栖类分开的,α基因和β基因的分开应在此之前,也许发生在2.7亿年前(图3-7)。随后,突变引起的趋异进化形成了α基因簇和β基因簇的各个成员。β和δ珠蛋白基因间置换位点的差别是3.7%,单位进化时间,即产生1%差异所需的百万年数为10.4,估算趋异的时间为10.4×3.7百万年,大约在4000万年前。γ和ε基因间置换位点的趋异度为9.6%,估算趋异的时间大约在1亿年前(图3-8)。33ppt课件.Actin(肌动蛋白)genesvarywidelyintheirorganization.Thesitesofintronsareindicatedinpurple;thenumberidentifiesthecodoninterruptedbytheintron.34ppt课件.
根据内含子的保守序列组分、二级结构以及剪接机制可将其分为4种类型。I型内含子主要出现在细菌、真菌线粒体和低等真核生物的rRNA基因中,估计出现于35亿年前,主要特点是具有自我剪接能力。II型内含子的特点是转录初始产物自我剪接时,能形成套索结构(lariat),可能与I型内含子同时或稍后出现。III型内含子存在于大多数真核生物编码蛋白质的基因中,其RNA产物在剪接时需要有酶和蛋白质的参与,应在真核生物出现之后,即7亿~10亿年出现。IV型内含子出现在tRNA中,剪接时,由内切酶切除内含子,连接酶连接外显子,应在真细菌和真核生物分化之前,即大约17亿年前出现。35ppt课件.内含子比外显子变化快
用重复基因的内含子片段和外显子片段分别作探针,进行分子杂交实验发现,重复基因之间的外显子序列着很大的同源性,但内含子序列几乎没有同源性。说明在进化过程中,相关基因的内含子比外显子变化快得多。虽然突变以相同的频率发生在外显子和内含子上,但发生在外显子上的突变将使基因编码的产物丧失功能,导致生物体无法通过自然选择,这种突变就被淘汰了。而内含子由于没有编码功能,可以自然的累积各种突变,导致它产生了较大的变化。36ppt课件.
外显子的差异主要由于碱基替代造成的,在被翻译的序列内,若突变会引起AA序列的改变,则相应的生物可能在进化中被淘汰。许多保留下来的变化并未影响密码子的含义,因为这些发生变化的碱基常是密码子的第三个碱基,或在非翻译序列(如5'-端和3'-端序列)中。而在内含子中,序列变化多是由于碱基插入或缺失或替换造成的。内含子演化的速度比外显子快得多,不同物种相同基因相比较,有时发现外显子是同源的,而内含子却有很大差异。在内含子、外显子中突变速率是相同的,但外显子通过自然选择不易保留突变,而内含子由于不编码AA,可以自由地发生突变,通过不断积累最终导致巨大差别,这种差异也说明了内含子不具备序列特异性这个特征。37ppt课件.3.2.5.3断裂基因的生物学意义
(1)增加基因表达产物的多样性-RNA选择性剪接
(2)促进重组
(3)增加基因组的复杂性
(4)有些内含子含有可读框(ORF)(5)有些内含子含有部分剪接信号
(6)有些内含子对基因表达有影响38ppt课件.3.3基因组3.3.1基因组的概念
基因组(genome)指的是细胞或生物体全套染色体中所有的DNA,包括所有的基因和基因之间的间隔序列。
原核生物基因组就是其细胞内构成染色体的DNA分子,
真核生物的核基因组是指单倍体细胞核内整套染色体所含有的DNA分子。核基因组+细胞器基因组(动物细胞线粒体基因组偶或植物细胞的叶绿体基因组。39ppt课件.物种基因组大小(bp)基因数目平均外显子数平均基因长度(kb)平均mRNA长度(kb)大肠杆菌4.2×1064288010.95酵母1.3×107610011.41.4果蝇1.4×10813600411.32.7哺乳动物3.3×109约30000716.62.2表3-2不同生物的基因数目和大小表3.2总结了一些生物体的平均基因大小,可以看出从低等到高等真核生物的mRNA的平均大小略有增加,而平均外显子数目则明显增加。可见,真核生物基因的大小在很大程度上取决于内含子的数目和长度。40ppt课件.
真核生物单倍基因组所包含的全部DNA量是相对恒定的,称该物种的C值(C-value)。随着生物的进化,生物体的结构和功能越复杂,其C值就越大。41ppt课件.
另一方面,生物体复杂性和C值之间的关系也有令人不解的现象。一些物种C值的变化范围很窄,如鸟类、爬行类和哺乳动物各门内C值的变化范围只有约2倍。但大多数昆虫、两栖动物和植物的C值可以相差数十倍乃至上百倍。突出的例子是肺鱼和百合属植物,具有比人类大得多的C值,两栖动物C值小的在109bp以下,大的则高达1011bp,而哺乳动物的C值均为109bp数量级。真核生物的C值与生物体复杂性之间对应关系的的反常现象称C值悖理(Cvalueparadox)。42ppt课件.43ppt课件.3.3.2病毒的基因组病毒的基本结构是由外壳蛋白质包裹着里面的遗传物质核酸。病毒进入活的易感宿主细胞后,以其基因组核酸为模板,借助于宿主细胞本身提供的原料,消耗宿主细胞的能量,以自我复制的方法进行繁殖。根据病毒基因组的核酸类型,将病毒分为DNA病毒和RNA病毒。根据宿主的不同,病毒又可分为动物病毒、植物病毒和噬菌体。不同类型的病毒,有不同的复制方式。
病毒是分子生物学研究中的重要模式物种。44ppt课件.3.3.2.1病毒基因组的一般特点病毒核酸的大小仅为细菌基因组的0.1%~10%,病毒基因组具有以下结构特点:
(1)基因组很小,只能编码少数的蛋白质。有基因重叠,即同一个DNA序列可以编码2种或2种以上的蛋白质。
(2)病毒基因组可以由DNA或RNA组成,但一种病毒不会既含有DNA,又含有RNA。核酸的结构可以是单链或双链、闭合环状或线状分子。
(3)基因之间的间隔序列(spacersequence)非常短,非编码区只占基因组的很小部分。
(4)功能上相关的基因一般集中成簇,转录产物一般多为顺反子mRNA,之后加工成各个蛋白质的mRNA。
(5)噬菌体的基因是连续的,但大多数真核细胞的病毒都含有不连续基因。除正链RNA病毒外,真核细胞病毒的基因一般先转录成mRNA的前体,再经剪接才能成为成熟的mRNA。所以,真核细胞病毒基因的特性更像真核生物基因。45ppt课件.3.3.2.2病毒的核酸病毒的DNA多数为双链结构(dsDNA),如腺病毒。也有单链DNA(ssDNA),如微小病毒科的病毒。病毒的RNA多数为单链线状结构,少数呈双链结构。不少RNA病毒含有多个RNA片段,例如呼肠孤病毒(reovirus)有10个双链RNA片段,轮状病毒有11个双链RNA片段,流感病毒有8个单链RNA片段。如果病毒的单链RNA可直接作为mRNA,则称为正链RNA。若病毒以其RNA链的互补序列作为mRNA,则称为负链RNA。负链RNA病毒感染宿主细胞后,需要合成与其基因组RNA互补的RNA,这一过程由依赖于RNA的RNA聚合酶(RNA-dependentRNApolymerase)催化,但此酶在宿主细胞内不存在,而是由病毒颗粒携带的。因此,只有用完整的负链RNA病毒颗粒感染宿主细胞,才能复制病毒。46ppt课件.positive
strand
virusnegativestrandvirus47ppt课件.λ噬菌体48ppt课件.3.3.2.3λ噬菌体的基因组
λ噬菌体的基因组大小为4.85×104bp,包括46个基因,分为头部基因、尾部基因、调控(免疫)区、复制控制区和晚期基因调控区等区域(图3-9)。λ噬菌体依赖宿主细胞的RNA聚合酶合成3组RNA产物,有两种不同的结果,即裂解生长和溶原性反应。用外源DNA替代λ噬菌体基因组内与溶原化有关的基因区段(如整合基因int、切离基因xis和附着位点att等),可构建重组DNA分子,在基因工程和基因文库构建方面有广泛的应用。49ppt课件.3.3.2.4ΦX174噬菌体基因组
ΦX174噬菌体基因组是单链环状DNA,含5386个核苷酸。共11个基因,构成3个转录单元,从3个转录启动子Pa、Pb和Pd分别开始转录基因A、B和D。在基因A和H之间有一强终止信号,所有转录均可在此位置终止。在基因J和F之间有一个弱终止信号,部分转录在此位置被终止,一部分mRNA继续转录到基因H结束。基因D-(E)-J-F-G-H都转录在同一条mRNA分子上(见图3-4)。
ΦX174噬菌体11个基因的蛋白质产物都已被分离,蛋白质编码的总长度超过了DNA编码容量。将蛋白质的一级结构与DNA全部序列进行比较,发现ΦX174噬菌体基因组内存在部分基因重叠。50ppt课件.3.3.2.5SV40病毒基因组
SV40病毒(simianvacuolatingvirus40,SV40)
最初是在猴肾细胞中分离出来的,能引起人的培养细胞转化,在仓鼠和人体内可致肿瘤。SV40基因组只有5个基因,要完全依靠哺乳动物细胞内的系统进行它的DNA复制和基因表达。因此,常用SV40病毒作为模式生物,研究真核生物的基因表达,和病毒致癌的机制。SV40病毒的启动子和增强子被广泛用于真核生物基因表达载体的构建。
SV40病毒的外壳是二十面对称体的球状颗粒,中心包含有全长5243bp的双链环状DNA。DNA与组蛋白相连,形成24个核小体,称为微小染色体,是真核细胞染色质的最小模型。51ppt课件.T抗原和t抗原基因以逆时针方向转录,发生在DNA复制之前,称为早期基因及早期转录。Vp1、Vp2和Vp3基因以顺时针方向转录,发生在DNA复制之后,称为晚期基因和晚期转录。在早期和晚期基因之间是SV40基因组的调控区,约400bp,这个区域内的早期和晚期基因调控序列及DNA复制起位点等大部分序列都被重叠使用。
此外,早期的T抗原和t抗原为基因重叠,t基因完全在T基因之内,并通用共同的起始密码子。这种基因的重叠结构与基因表达调控有关,能保证两个连续的基因在转录和翻译水平上偶联协调,进行有效的翻译。52ppt课件.SV40载体基因组只有5243bp,序列已确定,基因组为共价闭合环DNA(cccDNA),酶切图谱及各种功能的基因定位均已详细了解。病毒DNA较易制备,但是,用SV40重组病毒转染细胞时,随着病毒的繁殖,细胞会裂解,这对基因工程中的应用是很不理想的。SV40DNA分子小,插入的DNA不能大于2500bp。SV40DNA的早期功能区插入外源DNA,存在致癌的隐患,为此,人们对病毒载体进行了改造,同时插入tk,dhfr,neo,cat等标记基因,构成了适用于不同目的的表达载体。pSV载体就是以SV40为基础构建的一群载体的总称。53ppt课件.蛋白质合成时间功能T抗原早期启动DNA复制t抗原早期未知VP1晚期主要的病毒外壳蛋白VP2晚期次要的病毒外壳蛋白VP3晚期次要的病毒外壳蛋白54ppt课件.3.3.2.6腺病毒基因组
腺病毒(adenovirus,Ad)是一种无外壳的双链DNA病毒,基因组长约36kb,衣壳(capsid)呈规则的20面体结构,直径约80-110nm。
以病毒DNA开始复制为分界线,按转录时间的先后,将腺病毒基因大致区分为早期(E1~4)和晚期转录单位(L1~5)。各种腺病毒基因又可以进一步地分为更小的转录单位,如E1区可以进一步分为E1A和E1B,每个转录单位都至少有一个独特的启动子。病毒的两条链均有编码功能。
55ppt课件.
腺病毒易于培养纯化,其基因组为线性双链DNA,可插入较大的外源DNA片段,最大的可达约7kb,且可在宿主细胞内大量扩增,宿主细胞范围广泛,可用于基因工程和基因治疗。不足之处是Ad在细胞内复制时可大量释出壳体蛋白质,容易引起宿主细胞介导的免疫反应,使转导的细胞遭到免疫攻击而被破坏。56ppt课件.
逆转录病毒属于正链RNA病毒,其主要的结构基因有种群特异性抗原(groupspecificantigen,gag),聚合酶(polymerase,pol)和被膜蛋白质(envelope,env),两端有长末端重复序列(longterminalrepeat,LTR),5'-端有帽子结构,3'-端有polyA。3.3.2.7逆转录病毒基因组57ppt课件.
人类免疫缺陷病毒(HIV)颗粒是至今发现的最复杂的逆转录病毒。HIV的基本形态与其它逆转录病毒相似,有核心部分,衣壳和包膜等3种主要结构。核心部分含两个单股正链RNA基因组,两个单体在5'-端由氢键相连。每个RNA基因组长9.2kb,基因排列顺序为5'-LTR-gag-pol-env-3'-LTR,除上述3个结构基因外,还有tat,rev,nef,vif,vpr和vpu6个调节基因,编码6种调控蛋白质,这在逆转录病毒中较少见。HIV的基因编码区域有许多重叠,除基因tat和rev两侧含有内含子外,大多数基因无内含子,最大限度地利用了有限的RNA序列(图3-11)。58ppt课件.59ppt课件.HIV的结构及其与宿主细胞的附着60ppt课件.3.3.3原核生物的基因组原核生物的细胞内没有明显的细胞核形态,其遗传物质均为DNA,与蛋白质结合形成类核(nucleoid),基因组大小在106bp以上。在双链DNA的两条链上都有基因的编码序列。除类核构成的主基因组外,原核生物还有许多独立的DNA小分子,称作质粒。61ppt课件.3.3.3原核生物基因组Prokaryoticgenome以细菌为代表讲述,有称bacteriagenome。细菌对医学分子生物学有重要贡献,是基因工程研究的主要材料之一。因为:1.构造相对简单,基因结构也不复杂,取材便利,易于培养,可选择突变株进行研究,实验结果容易重复。2.与人类有共同的分子生物学规律,如:(1)遗传物质都是DNA;(2)主要的功能分子都是蛋白质;(3)基因密码是通用的,等等。3.尤其是E.coli,是分子克隆是“明星“,基因工程主要原因的工程菌,因为基因工程的主要工作是克隆克核基因在原核系统中表达。62ppt课件.3.3.3.1、原核生物基因组结构与功能的特点1.基因组通常仅由一条环状双链DNA分子组成。其DNA是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称为染色体。细菌染色体DNA在胞内形成一个致密区域,即类核(nucleoid),类核无核膜将之与胞浆分开。2.基因组中只有1个复制起点。3.具有操纵子结构。操纵子(operon)是指数个功能相关的结构基因串联在一起,构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的转录终止信号构成的基因表达单位。(见第六章)4.
结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质。5.基因序列是连续的,无内含子结构。63ppt课件.6.非编码DNA所占比例很少,基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。7.细菌基因组中存在可移动的DNA序列,包括插入序列和转座子。8.原核基因的基本结构特点:启动子(promoter)、操纵基因(operator)、调控序列、结构基因(structuregene)、终止子(terminator)。(见第六章)64ppt课件.DNAfromalysedE.colicell.Inthiselectronmicrographseveralsmall,circularplasmidDNAsareindicatedbywhitearrows.Theblackspotsandwhitespecksareartifactsofthepreparation.65ppt课件.E.coli细胞内的DNA形成大量的双链环状结构,每个环平均40kb,形成超螺旋结构,底部固定在蛋白质上,形成独立的结构域。整个基因组DNA约有100个左右这种小的结构域。由于每个小结构域相对独立,不同小结构域内的启动子对基因表达的调控有不同的敏感性。66ppt课件.3.3.3.3细菌的自主遗传物质-质粒1.质粒是细菌染色体外的可以自主复制的DNA分子,大多数为环状超螺旋双链DNA,称为共价闭合环状DNA。
2.质粒是双链的DNA分子,大小在1—200kb之间,和病毒不同,它们没有衣壳蛋白(裸DNA)67ppt课件.3.质粒与宿主细胞的关系(1)质粒对宿主的生存不是必需的,只是“友好”的“借居”宿主细胞中,宿主离开质粒照样的生存下去。(2)质粒离开宿主就无法生存,只有依赖宿主细胞的(酶和蛋白质)帮助,才能完成自身的复制(扩增)、转录。(3)质粒经常为宿主执行一些适当的遗传功能,作为对宿主细胞的补偿(“交房租”)。(4)质粒赋于宿主各种有利的表型(质粒编码蛋白质或酶),使宿主获得生存优势,与我们基因工程实验紧密相关的,如抗生素抗性基因:Ampr
酶,水解β-内酰胺环,解除氨关毒性,使细菌抗氨关。Tetr
膜蛋白,可阻止四环素进入细胞,使细菌抗四环素。68ppt课件.4.质粒发现和研究意义
1)理论意义质粒能够复制、传递和表达遗传信息,从分子遗传学观点来看是一种有机体,是比病毒更原始的生命形式,是生命起源研究的起一块体重要基石。
2)实践意义是基因工程的重要载体(vector),能把外源基因(目的基因)送到宿主细胞中去克隆扩增或克隆表达(见第八章)。
①质粒是可以改造的,可以剪切、剪接的,基因工程的重要任务之一就是严格改造质粒的同时,控制质粒不传递,若一个致癌质粒可以传递就会传到外都是。
69ppt课件.②作为基因工程载体的3个特点:
A.都能独立自主的复制;
B.都能便利的加以检测(抗生素抗性);
C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯化(提质粒)。质粒符合上述3个条件。基因工程中主要使用人工构建的质粒。70ppt课件.3.4真核生物的基因组3.4.1真核生物基因组的特点
(1)基因组大低等真核生物的基因组为107~108bp,比原核细胞大10倍以上。而高等真核生物可以达到5×108~1010bp。
(2)有染色体结构细胞核DNA与组蛋白质及多种非组蛋白质稳定地结合,形成多条呈线状的染色体,每条染色体DNA有多个复制起点(ori)。
(3)重复序列和可移动序列多真核细胞基因组DNA有大量重复序列,这些重复序列的单位长度从几个至几千个碱基对不等,重复次数从几次到几百万次不等。与原核生物相比,真核生物基因组中的可移动DNA序列比例较高。
(4)多数基因为断裂基因真核生物的绝大多数结构基因都含有内含子,属于断裂基因。
(5)基因表达的调控复杂转录和翻译在时间和空间上被分隔,基因表达的各个阶段均有特定的调控机制。功能上密切相关的基因通常分散存在于染色体的不同位置,甚至不同的染色体上。基因表达的调控更复杂,有数目众多的调控因子,对功能上密切相关而又分离很远的基因表达进行调控。71ppt课件.3.4.2真核生物基因组的重复序列3.4.2.1DNA序列的复性动力学与序列重复频度根据DNA的复性动力学方程,C0t1/2与DNA序列复杂度有关,序列越复杂,C0t1/2值越高,复性反应速度越慢。在一定长度的DNA中特定序列的拷贝数越少,C0t1/2值越高。基因组DNA复性反应的C0t1/2值能反映出基因组不同序列的长度之和,即DNA序列的复杂度(用碱基对的数目表示)。
用已知复杂度的标准DNA的C0t1/2做标准,通过比例关系可以计算任何DNA的复杂度。一般以E.coli的C0t1/2为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024高考化学二轮复习专题九化学实验学案
- 2024高考地理一轮复习专练100地理区域图的判读含解析新人教版
- 小学2024-2025学年度第二学期教学工作计划
- 冬季施工暖棚搭设方案
- 人教版九年级化学上册自制第六单元课题4实验活动2-二氧化碳实验室制取与性质(34张)
- 2019-2020学年高中数学第2章解析几何初步2-3空间直角坐标系课件北师大版必修2
- 接待礼仪-素材-培训讲学
- 教育学原理04-近现代高等教育发展、教师
- 2024年泰州职业技术学院高职单招数学历年参考题库含答案解析
- 2024年阳江市卫校附属医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 小动物疾病-第一章 小动物疾病概述
- 电动车转让协议书电子版
- 蔬菜大棚温度控制系统设计毕业设计论文
- 骨科临床路径全集(范本模板)
- 破产申请异议书
- 金蝶云星辰初级考试题库
- 常见老年慢性病防治与护理课件整理
- 履约情况证明(共6篇)
- 云南省迪庆藏族自治州各县区乡镇行政村村庄村名居民村民委员会明细
- 设备机房出入登记表
- 六年级语文-文言文阅读训练题50篇-含答案
评论
0/150
提交评论