基因与基因组的结构与功能_第1页
基因与基因组的结构与功能_第2页
基因与基因组的结构与功能_第3页
基因与基因组的结构与功能_第4页
基因与基因组的结构与功能_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因与基因组的结构与功能第1页,共159页,2023年,2月20日,星期一顺反子一个基因一条多肽链4.2基因的命名基因的命名:基因名称Leu,-Z(基因座)质粒重组质粒前面要加P,等等P76第2页,共159页,2023年,2月20日,星期一表型和基因型某一机体可以观察到的特征称为表型(phenotype),与表型相应的基因组成称为基因型(genotype)。如细菌能否合成亮氨酸记为Leu+和Leu-,相应的基因型为Leu+和Leu-。

等位基因

(1)二倍体细胞有2套基因,一套来自父本,另一套来自母本,每个细胞的全部基因均由2套基因组成,每一对基因称做等位基因。

(2)由于突变作用引起DNA结构变异,所以某一基因可具有若干种不同的形式,这种同一基因不同的形式互称等信基因(allele)。第3页,共159页,2023年,2月20日,星期一基因的基本结构5’、、、AGCCGACTATGTCGAAGCTT、、、、、、GCTTGACTATAAGACA、、、3’3‘、、、TCGGCTGATACAGCTTCTAA、、、、、、CGAACTGATATTCTGT、、、5‘转录调控区贮存RNA或蛋白质结构信息区转录终止区第4页,共159页,2023年,2月20日,星期一4.3基因组(gencme)细胞或生物中,一套完整单倍体遗传特质的总和(包括一种生物所需的全套基因及间隔序列)称为基因组(P27)。基因组的结构主要指不同的基因功能区域在核酸分列中的分布和排布情况,基因组的功能是贮存和表达遗传信息。人类基因组包含多染色体和XY两条性染色体上的全部遗传物质(核基因组)以及胞线粒体上的遗传物质(线粒体基因组)。(X免疫基因,男XY,女XX)。*1个配对(精子或卵子),1个单倍体细胞或1个病毒所包含的全套基因,称为基因组。第5页,共159页,2023年,2月20日,星期一4.3.2基因及基因组的大小与C值矛盾C值:真核生物单倍体基因组所包含的全部DNA总量称为该物种的C值。C值愈大愈高等?关系密切的生物C值差异巨大?大量的DNA为非编码序列。第6页,共159页,2023年,2月20日,星期一4.4病毒及其基因组4.4.1病毒基因组特点简单,信息总量少,只含一种核酸,有基因重叠,间隔序列很短,功能相关基因成簇,为一个转录单元;噬菌体基因是连续的,但也有许多病毒基因是不连续的。完整的病毒颗粒具有蛋白质外壳,以保护病毒核酸不受核酸酶的破坏,并能识别和侵袭特定的宿主。类病毒例外,它是一类植物病毒,为很小的单链闭环RNA(250-400碱基)。第7页,共159页,2023年,2月20日,星期一病毒核酸与所有的原、真核生物的核酸组比较,最为突出的特点是每种病毒颗粒只含1种核酸,或DNA或RNA,两者不共存于1种病毒颗粒中,据此,病毒可以分成两组,即DNA病毒和RNA病毒。病毒核酸分子量大小:RNA病毒小106-107D,DNA病毒大;107-108D基因数:3-几百个第8页,共159页,2023年,2月20日,星期一一切烈性病毒(virulentvirus)都具备参下几个时相的生活周期:(1)吸附;(2)核酸进入细胞;(3)转录、翻译和复制;(4)病毒颗粒成熟;(5)释放病毒颗粒。典型的生活周期为6-48小时,噬菌体为20-60分钟。病毒对细胞功能的干予,最典型的是噬菌体(phage),当其入菌后,立即接管了细菌的各种主要功能,细菌自身的DNA复制RNA转录,蛋白质合成,能量代谢等都停顿下来转变成合成病毒的机器。有些动物病毒也有类似的情况,但非普通规律。相对而言,动物病毒和宿主细胞可以共存一段时间至病毒生活周期的后期才造成宿主细胞的严重损害,这些损害有如下3个类型:(1)抑制宿主RNA和DNA的合成。(2)核糖体合成受损。(3)蛋白质合成受抑制是普遍现象。

与人类疾病有关的病毒属于动物病毒,它包括8个DNA病毒科和12个RNA病毒科,这些病毒基因组结构和功能已基本清楚第9页,共159页,2023年,2月20日,星期一(二)病毒有(十)链RNA和(一)链RNA之分。

(十)RNA病毒(一)RNA概念极性和mRNA极性相同,与mRNA极性相反或与(十)RNA碱基顺序也相同。互补的RNA。作用1.作为模板(与mRNA一样)必须依赖翻译出病毒多肽或蛋白质。RNA的RNA2.作为模板,合成(一)RNA,pol合成(十)可以以(一)RNA为模板RNA(mRNA)合成子代病毒RNA。才能翻译出3.作为模板合成cDNA.病毒(即以mRNA为模板反转录合成DNA)。蛋白质。RNA的序列基本相同,只是编码链上的T在相应转录本上为U,由于转录本RNA编码基因表达的蛋白质产物,DNA的这条链也由此命名为编码链。编码链又称为有义链;模板链又称为反义链。与RNA互补的链是负链第10页,共159页,2023年,2月20日,星期一二.病毒基因组结构功能特点(P28)(一)病毒核酸可以是ssDNA、dsDNA或RNA分子,分子结构有发夹、环状、线型、节段型。以SSDNA,dsRNA最为突出。(二)基因重叠即同一段基因可以编码2种或以上的基因产物这种现象在其它生物细胞仅见于线粒体和质体DNA.所以是病毒核酸较为独特结构能使小小病毒携带较多的遗传信息,原因是病毒基因阅读框可以错位(SV40)。第11页,共159页,2023年,2月20日,星期一(三)连续的和不连续的基因

病毒基因结构特征往往与其宿主细胞基因结构相似。原核病毒(如噬菌体)基因是连续的,没有内含子;真核病毒(如多瘤病毒)基因是不连续的,有内含子。有意思的是,有些真核病毒的内含子或其中的一部分对某一基因来说是内含子,对另一基因却是外显子。如SV40和多瘤病毒的早期区域就是这样的。除了(+)RNA病毒外,真核病毒基因都是先转成mRNA前体,再经过剪接等步骤能成为成熟的mRNA.第12页,共159页,2023年,2月20日,星期一(四)节段性基因大部分病毒核酸都是由一条双链或单链构成,少数病毒核酸由数个片段构成。这类病毒一般度RNA病毒。如flu-v由6-7个片段构成,各段在天然状态下不连接,而且可以转录成6-7个片段相应的mRNA。单独的片段没有感染性,感染要一起感染才发挥作用。(五)除了retro-v外,所有的病毒基因都是单倍体基因。即每个基因在某个病毒颗粒中只出现一次,即只有1套基因。(六)编码区>非编码区(95%/5%)。病毒核酸大多数顺序都用来编码蛋白质。第13页,共159页,2023年,2月20日,星期一(七)基因常常成簇排列,没有间隔序列或间隔序列很小。功能相关蛋白质基因在基因组的1个或几个特定部位,丛集成簇被转录成多顺反子,然后加工成各种蛋白质的mRNA模板。如腺病毒晚期基因。(八)不规则的结构基因1.几个结构基因的编码区不规则,因此有些结构基因无翻译起始序列。2.有的mRNA(=gene)没有5’帽子,但有翻译增强子。(九)DNA或RNA1种病毒基因组只是1种核酸。第14页,共159页,2023年,2月20日,星期一4.4.2病毒的核酸正链(直接作为mRNA模板,反之为负链。第15页,共159页,2023年,2月20日,星期一4.4.3典型病毒基因组4.4.3噬菌体基因组也可进入裂解循环。噬菌体基因组为长度约为50kb的双链DNA分子,噬菌体是感染大肠杆菌的溶源性噬菌体,在感染宿主后可进入溶源状态,实际大小为48502bp第16页,共159页,2023年,2月20日,星期一病毒组装组分基因病毒感染相关基因病毒复制相关基因第17页,共159页,2023年,2月20日,星期一第18页,共159页,2023年,2月20日,星期一ΦΧ174噬菌体基因组单链环状,5386个核苷酸对,11个基因,3个转录单元,有重叠基因,基因间间隔区很小第19页,共159页,2023年,2月20日,星期一5866bp63JFGHAA*CD811036BKE第20页,共159页,2023年,2月20日,星期一第21页,共159页,2023年,2月20日,星期一SV40病毒基因组SV40(simiansarcomavirus40猴肉瘤病毒)属乳多空病毒类,是最小的DNA病毒之一。它可长期潜伏于猴肾细胞,对新生仓鼠有致癌性,体外试验还可使多种属细胞恶性转化。第22页,共159页,2023年,2月20日,星期一1、基因组结构特点

(1)双链环状DNA分子、MW3×103KD,长52436p,与4种组蛋白(H2A、H2B、H3及H4)综合,与真核染色质区别在于不含H1。

(2)基因组由早期基因、调控区和晚期基因构成。①早期基因含有2个重叠基因,编码T和t(T=tumor)抗原②晚期基因含3个重叠基因,编码VP1(主),VP2和VP3(次)3种衣壳蛋白③调控区位早、晚期基因之间,长约4006p包括复制起点,启动子和增强子,可调节基因组的复制及早、晚期基因的转录。第23页,共159页,2023年,2月20日,星期一2、SV40病毒基因的表达

(1)启动子位于调控区复制起点上游,其中含有RNAPOLII识别位点位于-21-26bp之间的TATA盒可启动RNA转录起始准确位置,一般不相差10个核苷酸。

(2)增强子在106-250位是2个串联的含有72bp的完全重复顺序,即为增强子,能增强SV40及异源基因的表达。(3)早期基因转录的mRNA前体选择剪接形成不同的mRNA(TmRNA、t-mRNA)第24页,共159页,2023年,2月20日,星期一3、病毒基因组的复制及基因表达调控

T抗原控制病毒的复制,启动晚期基因转录。(1)早期基因T及t的表达受T抗原的反馈阻遇,表现一种自我调节作用。(2)晚期基因表达需要T抗原及SV40DNA本身的复制。一般过程是,感染早期合成T、t抗原→T-方面抑制早期mRNA进一步合成;另一方激活多种与DNA复制有关的酶,引发病毒的复制→进而推动晚期RNA的合成,产生Vp蛋白(12h)→V-DNA+VP123→病毒颗粒。第25页,共159页,2023年,2月20日,星期一腺病毒腺病毒是一种无外壳的双链DNA病毒,基因组长约36kb,衣壳(capsid)呈规则的20面体结构,直径约80-110nm。以病毒DNA开始复制为分界线,按转录时间的先后,将腺病毒基因大致区分为早期(E1~4)和晚期转录单位(L1~5)。各种腺病毒基因又可以进一步地分为更小的转录单位,如E1区可以进一步分为E1A和E1B,每个转录单位都至少有一个独特的启动子。病毒的两条链均有编码功能。第26页,共159页,2023年,2月20日,星期一腺病毒基因组的两端各有一段100bp的反向末端重复序列(ITR),是复制的起始位点。在左端ITR的3′侧有一段长约300bp的包装信号(ψ)介导腺病毒基因组包装入病毒衣壳。对腺病毒而言,只有包括两端的ITR和包装信号(ψ)的约0.5kb的序列是顺式作用元件,也就是说必须由腺病毒载体自身携带,而其他的30余种蛋白都可以通过辅助病毒(或细胞)反式补足。

第27页,共159页,2023年,2月20日,星期一病毒基因组进入细胞核,就将进行一系列的复杂而有序的逐级放大的剪切和转录过程。腺病毒基因组进入细胞核后,细胞转录因子首先与E1A区上游的增强子结合,表达E1A蛋白,该蛋白的作用是调节细胞代谢,使病毒DNA更易于在细胞中复制。E1A蛋白还可以激活其他早期基因(E1B、E2A、E2B、E3和E4)的启动子,其中E2B驱动另外三个与病毒复制有关的早期基因转录单位末端蛋白前体(pTP,precursorterminalprotein)、单链DNA结合蛋白(ssDBP,single-strandedDNAbindingproteins)以及DNA聚合酶(DNApol,DNApolymerase)的表达,这三个基因的表达产物紧密地结合成一个复合物,与至少三种细胞蛋白相互作用,启动病毒基因组的复制。第28页,共159页,2023年,2月20日,星期一3逆转录病毒1.逆转录病毒一般分类

逆转录病毒可以说就是RNA肿瘤病毒。第一个被发现的RNA肿瘤病毒是劳氏肉瘤病毒(RousSarcomavivus,RSV,1911)。至今为止所发现的retro-v都能使动物致癌,如下。(1)肉瘤病毒(2)白血病病毒(leuremiavirus)(3)乳腺瘤病毒(mammazytumorvirus)和淋巴瘤病毒,如鸟类髓细胞瘤病毒(avianmyelocytoma,AMV)(4)人类嗜T细胞逆转录病毒(humanT-lymphotropicretro-v,HTLV)HTLV-III现称人类免疫缺陷综合症病毒(humanimmunodeficiencyvirus,HIV)或AIDS病毒。第29页,共159页,2023年,2月20日,星期一2.逆转录病毒基结构特征(1)是RNA的复合体①2条(+)RNA单体正向平行,携带所有的遗传信息,而且完全相同,为什么要求2条相同正链,意义不太清楚(怕基因丢失或损伤?)。②2条tRNA较小,是宿主tRNA(RSV是tRNAtrp),+RNA对于复制位置是至关重要。(2)5’端有m7Gppp帽,3’端有Poly(A)尾。第30页,共159页,2023年,2月20日,星期一(3)编码区(反式功能区)从5’→3’

非编码区(顺序功能区,调控区)5’,3’都有①gag(groupantigen)编码衣壳蛋①R区逆转录合成cDNA必须区域②Pov(Polyrmerase)逆转录酶②PB区引物结合区③env(envelop)包膜蛋白③U区U3含启动子,U5与转录终止加尾有关*④ONC(oncogene)癌基因④ψ(包装信号),DLS(氢链结合位点)如RSV是SRCC为调控区*有的retro-V有ONC。第31页,共159页,2023年,2月20日,星期一3.逆转录病毒生活周期

(1)吸附可能所有的动物病毒受体都是表面糖蛋白(MLV的受体是左旋氨基酸转运蛋白,受体与基因治疗)。

(2)入胞逆转录,转录,翻译。

①逆转录——前病毒基因组(cDNA)的形成RNA+逆转录酶→宿主胞浆→逆转录→(RNA为模板,+RNA为引物)→cDNA(见第四章)→进入核→随机整合宿主染色体→形成前病毒。cDNA形成新的重复(U3-R-U5)称LTR(longterminalrepeat长末端重复顺序)。cDNA含有RNA全部信息且较RNA长。

第32页,共159页,2023年,2月20日,星期一逆转录酶除了逆转活性外,还至少还有3种活性:即RNaseH活性,内切核酸酶活性(特异地切断基因组3’端RNA,作为“+”链DNA的引物)和以“-”链DNA为模板合成“+”链DNA的活性。第33页,共159页,2023年,2月20日,星期一②转录——病毒基因组的形成U3区启动子启动前病毒基因组转录出从5’区至3’R区的RNA。③翻译gag、env、polGag(编码衣壳蛋白)——全长RNA能直接作为gag基因mRNA,进行翻译。但有90%的mRNA只译出gag多蛋白质,经肽链加工裂解为衣壳蛋白。pol——RNA序列有干扰gag终止码的序列,使约10%mRNA在翻译过程中,直至pol的终止码,经翻译后加工裂解,形成衣壳蛋白,逆转录酶和整合酶(integrase)。env——一部分全长mRNA经过转录后的剪接,使env编码区与病毒RNA5’端帽子连接在一起→envmRNA→包膜糖蛋白。第34页,共159页,2023年,2月20日,星期一(3)病毒颗粒成熟←包装←ψ(基因治疗)RNA5’端PB-区与宿主tRNA以氢链相连形成复合体→包装→病毒颗粒。(4)释放子病毒→感染其它细胞。第35页,共159页,2023年,2月20日,星期一4.逆转录病毒引起白血病的3种机理.(以此说明RNA肿瘤病毒的致癌作用与基因组类型.)

(1)急性逆转录病毒(2)慢性逆转录病毒(3)HTlV(人类嗜T细胞逆转录病毒)①含onc*①不含onc①含tat的HTLV②可在数周内使培养②不能转化,但V感染②含使培养细胞转化,机理和1、2细胞发生转化.整体动物潜伏数月致癌.不同。③onc插到宿主DNA中③前V整合到proto-onc③反式调控作用,tot插入→去产生致癌mRNA癌基前,病毒LTR启动子增强转录mRNA→tat蛋白作用于因产物转化细胞致癌.子启动增强c-onc表达,TGF-β1等→使细胞增殖永生改变细胞生长特性.化。第36页,共159页,2023年,2月20日,星期一人类免疫缺陷病毒基因组(HIV)获得性免疫缺陷综合征(AIDS)1981年在美国首先发现,其病原是一种破坏人免疫系统的retro-V.1986年命名为HIV。HIV特异性侵犯并损耗T细胞造成机体免疫缺陷,最后并发各种严重感染和恶性肿瘤,成为艾滋病(谈“艾”色变)。因该病无特效治疗,病死率几乎为100%。1.HIV感染的流行病学(节选)(1)我国流行特征:①发现较早,流行仍属低下,但呈明显上升趋势。②分布地区广,表现形式多。③年龄范围广,以青壮年为主,男女比为11.5/1。④感染途径多,但通过性传播日显重要。⑤感染者的发现比重明显从外籍人员转向国内居民。第37页,共159页,2023年,2月20日,星期一(2)HIV感染的危险因素增加①性传播疾病发生率有增无减.②流行人口增加,估计全国流动人口达12000万,年龄20-29,正处于性活跃期。③性观念,性行为改变.④吸毒、贩毒剧增,吸毒者往往有性乱,女性则卖淫。⑤医源性传播控制工作及宣传防治工作薄弱。专家认为中国大陆HIV疫情持续上升,如超过一定数量,将出现暴发流行。HIV为分为HIV-1和HIV-2两个型。HIV-1是感染的主要毒株,一旦感染,终身带毒,进展快,预后差。HIV-2感染的潜伏期长,致病性低。中国存在HIV-1A、B、B‘、C、E五个亚型。第38页,共159页,2023年,2月20日,星期一2.HIV的生物学特性(见分子病毒学)3.HIV基因组结构和功能(1)HIV基因组为SS(+)RNA,HIV-19.3kb,HIV-29.7kb,5’端有帽,3’端poly(A)尾含3个结构基因,至少6个调节基因。(2)LTR(长末端重复顺序)与结构基因。①LTR含启动子、增强子、负调节元件及哺乳动物组胺转录因子结合位点等。②gag编码病毒核心结构蛋白③pol编码逆转录酶、整合酶、蛋白酶。④env编码包膜蛋白第39页,共159页,2023年,2月20日,星期一(3)HIV调节基因①tat反式激活转录基因②rev病毒蛋白表达调节因子③vif病毒侵染性因子④nef负调节子⑤vpr病毒蛋白R⑥vpu病毒蛋白U⑦vpx病毒蛋白X仅存于HIV-2中.第40页,共159页,2023年,2月20日,星期一4.5细菌基因组Prokaryoticgenome以细菌为代表讲述,有称bacteriagenome。细菌对医学分子生物学有重要贡献,是基因工程研究的主要材料之一。因为:1.构造相对简单,基因结构也不复杂,取材便利,易于培养,可选择突变株进行研究,实验结果容易重复。(如选择DDDPI缺乏的Ecoli突变株,Ecoli仍可合成DNA,说明酸I对EcoliDNA合成不起作用。)2.与人类有共同的要子生物学规律可,如:(1)遗传物质都是DNA;(2)主要的功能分子都是蛋白质;(3)基因密码是通用的,等等。3.尤其是E.coli,是分子克隆是“明星“,基因工程主要原因的工程菌,因为基因工程的主要工作是克隆克核基因在原核系统中表达。第41页,共159页,2023年,2月20日,星期一一、原核生物基因组结构与功能的特点1.基因组通常仅由一条环状双链DNA分子组成。其DNA是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称为染色体。细菌染色体DNA在胞内形成一个致密区域,即类核(nucleoid),类核无核膜将之与胞浆分开。2.基因组中只有1个复制起点。3.具有操纵子结构。操纵子(operon)是指数个功能相关的结构基因串联在一起,构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的转录终止信号构成的基因表达单位。(见第六章)4.结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质。5.基因序列是连续的,无内含子结构。第42页,共159页,2023年,2月20日,星期一6.编码区和非编码区(主要是调控序列)在基因组中约各占50%。(5%,95%)7.基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。(15AA/秒,2AA/秒)8.具有编码同功酶的基因(isogene)这是一类结构不完全相同,而功能相同的基因。如E.coli含有2个编码乙酸乳酸合成酶的基因和2个编码分支酸变位酶同工酶的基因。9.细菌基因组中存在可移动的DNA序列,包括插入序列和转座子。10.原核基因的基本结构特点:启动子(promoter)、操纵基因(operator)、调控序列、结构基因(structuregene)、终止子(terminator)。(见第六章)第43页,共159页,2023年,2月20日,星期一二、染色体外的遗传物质———质粒(一)概念

1.质粒(plasmid)是独立于许多细菌及某些真核细胞染色体外共价闭合环状的DNA分子(covalantclosedcircnlar,cccDNA),能独立复制的最小遗传单位。(P35-6)

2.质粒是双链的DNA分子,大小在1—200kb之间,和病毒不同,它们没有衣壳蛋白(裸DNA)。第44页,共159页,2023年,2月20日,星期一

从生化学来说,除酵母的杀伤质粒(killerplasmid)是RNA外,其余质粒是染色体外的cDNA分子。

从遗传学来说,质粒是与宿主染色体有别的复制子(真核细胞分裂过程中,DNA纤维分成许多复制单位,该单位称为复制子)。在细胞分裂时能恒定传递给交代细胞的独立遗传因子或能在胞内寄生和复制的复制子。第45页,共159页,2023年,2月20日,星期一3.质粒与宿主细胞的关系(1)质粒对宿主的生存不是必需的,只是“友好”的“借居”宿主细胞中,既不杀伤细胞,对宿主的代谢活动也无影响,宿主离开质粒照样的生存下去。(2)质粒离开宿主就无法生存,只有依赖宿主细胞的(酶和蛋白质)帮助,才能完成自身的复制(扩增)、转录。(3)质粒经常为宿主执行一些适当的遗传功能,作为对宿主细胞的补偿(“交房租”)。(4)质粒赋于宿主各种有利的表型(质粒编码蛋白质或酶),使宿主获得生存优势,与我们基因工程实验紧密相关的,如抗生素抗性基因:Ampr酶,水解β-内酰胺环,解除氨关毒性,使细菌抗氨关。Tetr膜蛋白,可阻止四环素进入细胞,使细菌抗四环素。第46页,共159页,2023年,2月20日,星期一4.质粒发现和研究意义

1)理论意义质粒能够复制、传递和表达遗传信息,从分子遗传学观点来看是一种有机体,是比病毒更原始的生命形式,是生命起源研究的起一块体重要基石。

2)实践意义是基因工程的重要载体(vector),能把外源基因(目的基因)送到宿主细胞中去克隆扩增或克隆表达(见第八章)。

①质粒是可以改造的,可以剪切、剪接的,基因工程的重要任务之一就是严格改造质粒的同时,控制质粒不传递,若一个致癌质粒可以传递就会传到外都是。

第47页,共159页,2023年,2月20日,星期一②作为基因工程载体的3个特点:A.都能独立自主的复制;B.都能便利的加以检测(抗生素抗性);C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯化(提质粒)。质粒符合上述3个条件。基因工程中主要使用人工构建的质粒。第48页,共159页,2023年,2月20日,星期一(二)质粒的分类

1.按质粒的复制机理,分为2类:1)严谨控制型(stringentcontrdtype)

2)松弛控制型(relaxedcontroltype)(1)拷贝数少,一般<10个,分子量大;(1)拷贝数多,10-200个,分子量小;(2)复制受限,受细菌宿主DNA复制系(2)复制不受细菌DNA复制系统限制,统的控制;仅需DDDPI,当宿主蛋白质合成受抑制(3)特点是这类质粒可以自传递;时(如培养中加入氯要素时),其拷贝(4)严谨控制机理(低拷贝原因),认数可猛增至1000-3000之多,该性质对为是该质粒可以产生阻逼蛋白,反馈基因工程技术十分有利。抑制自身DNA合成。3)分子量小,不具备自传递能力;4)基因工程使用松弛型(高拷贝数)质粒,以获得列多的基因产物。*拷贝数(copynumber)—细胞所含的按每—基因组计算的某种质粒或基因的数目。第49页,共159页,2023年,2月20日,星期一2.按分子量大小,分为2类1)小型质粒,<15kb

2)大型质粒>15kb小型质粒,无接合和自传递能力,在按多属接合型或自传递型,大型质粒只合质粒协助也能转移,也可心通过转化能通过细菌的接合作用人一个细菌作用进入受体细胞,这类质粒种类较多,传到另一个细菌。(如F质粒)。几乎每种细菌都可以含有2种以上,基因工程一般用小型质粒。第50页,共159页,2023年,2月20日,星期一3.按质粒转移方式,分为3类1)接合型质粒(conjugaativeplasmid)带有效接触基因质粒,只能使细菌接合,本身不被传递.2)可移动质粒(mobiliableplasmid)可以被传递,但不能使细菌接合型与可移动性共存时,能传递可移动质粒。3)自传递质粒(selftranmissibleplasmid)兼具1)2)两种功能因而可以自传递,如F质粒。

*转化作用(transformation)—这是涉及细菌摄入外源DNA而实现基因转移一种机制。(见第八章)第51页,共159页,2023年,2月20日,星期一(三)质粒的功能质粒的功能主要通过质粒本身携带的基因偏码蛋白质表现出来。携带质粒的宿主细胞可表现出相应表型。1.性质粒即雄性细菌F质粒,它本身转到F-宿主细胞时,使后者变成F+,改变宿主细菌性别。2.抗生素抗性抗药性(R)质粒使细菌产生抗生素抗性,这种抗药性抗性基因也可以转移到缺乏这种抗药基因的细菌体内,使之产生抗药性。3.产生毒素的质粒如col质粒能产生大肠杆菌素因子(colicin),杀死不合该毒素的亲缘细菌。4.降解复杂的有机化合物作为能源质粒。5.产生限制和修饰酶。(见第八章)第52页,共159页,2023年,2月20日,星期一(四)质粒的基本特性

1.自主复制

质粒的复制是自主调节的,不受染色体复制调节因素的影响。复制调控系统由质粒上的复制起点(ori),质粒的rep基因和cop基因组成。Rep蛋白启动质粒的复制,cop基因本身或其表达产物可抑制复制作用,从而控制质的拷贝数。

2.质粒的不相容性

利用相同复制系统的质粒不能共存于同一个细胞内。

PMB和COLEI是两个密切相关的复制调控系统,带有PMB和COLEI复制调控系统的质粒是不相容的。但它们与带有PSC101或P15A复制调控系统是完全相容的,可以共存于一个细胞内。不相容性使质粒能够很容易被克隆。

3.质粒的转移性在自然条件下,在些质粒可以通过细菌接合作用在细菌细胞向传递。基因工程中常用的质粒载体缺乏转移所需的基因(mob基因),不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌细胞中。第53页,共159页,2023年,2月20日,星期一(四)细菌有限制—修饰系统细菌的限制—修饰系统是分别由特定的基因编码的限制酶和修饰酶组成的二元系统。1.防御外源性DNA入侵。2.构成细菌种属和菌株之间交叉繁殖屏障,但又允许外源DNA有某些遗漏,利于物种进化。3.基因工程重要的工具酶。(350/400)甲基化酶1.保护自身DNA不受限制酶切割(限制)。2.影响DNA分子构象,利于基因表达调控。限制酶和甲基化酶辩证关系。第54页,共159页,2023年,2月20日,星期一4.6真核生物基因组

4.6.1真核生物基因组的结构特点1.分子量大,比原核细胞大10倍以上。P892多条,线状。多复制起点3、DNA与蛋白质结合,可以形成染色质结构4、分为胞质区和核区,转录和翻译在实践和空间分隔。5、重复序列6、多为单拷贝基因7、有跳跃基因8、有内含子第55页,共159页,2023年,2月20日,星期一4.6真核生物基因组

4.6.1真核生物基因组的结构特点(一)真核基因的基本结构1.结构基因、内含和外显子、断裂基因。(1)结构基因(structuralgene)指能转录成为mRNA、rRNA或tRNA的DNA顺序。(2)内含子和外显子真核生物的结构基因是不连续的,编码序列被非编码序列打断,在编码序列之间的序列称为内含子(intron),编码序列称为外显子(extron)。(3)断裂基因(splitgene)在真核类结构基因组中,编码顺序被许多称为内含子的非编码区分割成几段称之。第56页,共159页,2023年,2月20日,星期一断裂基因mRNA的前体是核内不均一RNA,实验证据P90,不连续基因是普遍现象(原核极为少见,古细菌和噬菌体中发现了断裂基因)断裂基因共性:外显子排列顺序与产物相同,在不同组织中其内含子成分相同,内含子突变不影响蛋白产物,第57页,共159页,2023年,2月20日,星期一内含子外显子的相互关系概念P92n,n+1,内含子,外显子内含子两端有高度保守的序列,P92内含子分类第58页,共159页,2023年,2月20日,星期一3.内含子的分类根据基因的类型和剪接的方式,通常把内含子分为4类I:主要存在于线粒体、叶绿体及某些低等真核生物的rRNA基因;II

:是常见的形成套索结构后剪接,大多数mRNA基因有此类内含子;IV:是tRNA基因及其初级转录产物中的内含子,剪接过程需酶及ATP。第59页,共159页,2023年,2月20日,星期一G外显子-内含子边界外显子和内含子的边界有一些明显的特征,如:内含子的5‘端或称供体位(donorsite)常见的顺序为5’-AG↓GTTAAGT-3’;3’端又称受体位(acceptorsite),多为5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);第60页,共159页,2023年,2月20日,星期一II型基因(由RNA聚合酶II催化的)内含子5′端与外显子3′端均具有GT序列,内含子3′端与外显子5′端均具有AC序列,这种内含子称为主型内含子。同一基因在不同组织中其内含子外显子数目长度位置会有变化。第61页,共159页,2023年,2月20日,星期一内含子功能?促进重组促进重组,利于两条DNA分子间的连接,增加基因组复杂性内含子里也有可能含有可读框;内含子外显子是相对的;含剪接信号产生核仁小RNA对基因表达产生影响第62页,共159页,2023年,2月20日,星期一蛋白质结构域与外显子内含子关系一个外显子一般对应于一条多肽链折叠而成的结构域。边界序列可以精确地对应蛋白质折叠的铰链区。第63页,共159页,2023年,2月20日,星期一不连续基因的分子进化结构基因来源于以外显子作为模板构成的嵌合体。基因进化中,外显子可以发生复制不同基因间,外显子可以重复出现。第64页,共159页,2023年,2月20日,星期一3真核生物基因组的序列异质性也就是序列的不均一性。可以通过复性动力学反应基因组序列复杂性。第65页,共159页,2023年,2月20日,星期一DNA复性与Cot分析K复性速度常数第66页,共159页,2023年,2月20日,星期一Cot1/2=1/kXDNA序列复杂度,量纲为核苷酸对的长度第67页,共159页,2023年,2月20日,星期一DNA的复杂度通过与已知复杂度的标准DNA相比较而确定。复杂度以DNA的相对长度描述DNACot1/2/E.coli的DNACot1/2=DNA复杂度/4.2*106bp(P98)根据复性快慢将同一物种的总DNA分为几个部分,也可以计算DNA的长度,和化学测定法结合测定序列的重复频率。第68页,共159页,2023年,2月20日,星期一据出现的频率不同可将DNA序列分为3类:1.高度重复序列在基因组中的重复次数>1052.中度重复序列在基因组中的重复次数为101-1053、低度重复序列在基因组中的重复次数为2-10拷贝4.单拷贝序列在整个基因组中出现1次或少数几次P101真核生物基因组的序列类型第69页,共159页,2023年,2月20日,星期一散在重复顺序是人类基因组中非串联非反向的重复顺序,包括少数活跃的转位因子,根据重复序列的长度可将该家族分为2个主要类型,短散在核元件和长散在核元件。1.SINEs(shatinterspersednuclearelements)2.LINES(longinterspersednuclearelements)

代表Alu家族(逆转录转座子)

KpnI家族(1)序列中含Alu限制酶位点(1)序列中含KpnⅠ限制酶位点(2)基因组中重复数3-5×105(2)全长6-7kb(3)Alu顺序之间间隔:3-5kb(3)KnpⅠ消化后可见4条带(4)相对集中在染色体R带(4)集中分布在染色体G或Q带

逆转来转座子RNA介导转座,合成cDNA→基因组编码组蛋白、5SRNA,TRNA的基因也是中度重复序列第70页,共159页,2023年,2月20日,星期一真核基因组中的转座子

在真核基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重复序列往往是可移动的。通常为RNA编码。在些可移动成分的结构与原核基因组的转位因子相似,是通过DNA介导的。

而另外一些中度重复序列的转移成分,要先转录成RNA,再逆转录生成cDNA,然后重新整合到基因组中,这种逆转录旁路的转移成分称为逆转录座子(retroposon),是RNA介导的。第71页,共159页,2023年,2月20日,星期一卫星DNA简单重复序列,异染色质区,梯度离心时,主DNA峰之外的小峰,小卫星DNA微卫星DNA第72页,共159页,2023年,2月20日,星期一转位因子

转位因子(transposableelement)即可移动的基因成分(可移动基因,movablegenemob),是指能够在一个DNA分子内部或两上DNA分子之间移动的DNA片段。在细菌中指在质粒和染色体之间或在质粒和质粒之间移动的DNA片段(文献上有时形象地称其为是跳跃基因,jumpinggene)。转位也是DNA重组的一种形式。

第73页,共159页,2023年,2月20日,星期一移动基因最早由美国冷泉港实验室(coldspringHarborLaboratory)的女科学家B.MClintock于上个世纪40年代晚期在玉米中首次发现的。60年代,为J.A.Shapirc研究大肠杆菌高效突变实验证实。1983年荣获诺贝尔生物学医学奖。第74页,共159页,2023年,2月20日,星期一(一)转位因子的种类及特征细菌的转位因子包插入序列,转座子及可转座的噬菌体。1.插入序列(insertionsequence,IS)IS的形体图TSTranspcsasegeneTSIRIRTStargetsite靶位点Transposasegene转位酶基因IRinvertedrepeated反向(倒转重复顺序)第75页,共159页,2023年,2月20日,星期一(1)IS是一类较小的转位因子,长度约700-2000bp,按发现顺序IS1、IS2…命名,只携带转移的必需基因,不含有其它偏码蛋白质结构基因,本身没有表型效应。(2)IS两侧为反向(倒转)重复顺序(16-41bp),中间为转位酶基因,在插入新的位点侧有3~116p顺向重复顺序(directwrepeatedsequencedk),DR是靶位点序列复制的产物。(3)IS到处活动,可以插入到E.coli染色体的各个位置上,也可以插入到质粒和某些噬菌体基因组上,甚至同一基因不同位点上。这种插入作用可以双向进行,可以是正向,也可以是反向插入IS这种移动方式称为转位作用(transposition)。(4)在一个世代的107细菌中有1次插入。*TR(反向倒转重复序列):GGAAGGT、、、ACCTTCCCTTCCA、、、TGGAAGG*DR(正同向重复序列):TACGTTACGT第76页,共159页,2023年,2月20日,星期一2.转座子(transposon,Tn)(1)Tn是一类较大的可移动成分,除mobgene外,尚含有其它基因,如抗药基因等。Tn是在研究抗药基因中发现的,由此知道抗药基因可在质粒之间,质粒与染色体之间或质粒与可转座的噬菌体之间来回移动,Tn的转位原理和Is基本相同,转位频率为10-3~10-6/拷贝。(2)根据结构特征的不同,Tn可以分为2个亚类:

① 复合型Tn:转座酶由IS编码,IS可以是反向(或正向)重复构型。② TnA:数个结构基因(mob、mdr等)十IR组成。

StructuralgenesIRIRStructuralgeneIS1IS1第77页,共159页,2023年,2月20日,星期一3.可转座的噬菌体(transposablephage)(1)包括Mu和D108两种噬菌体,是一类温和噬菌体*。(2)感染细菌后,可以整合到细菌染色体中,插入位点是随机的(而入phage插入位点是专一的),可以插到结构基因内部,引起突变,Mu即Mutator(突变子)因此得名。(3)插入部位的2侧有短的DR,插入时,一个拷贝留在原位,新合成的拷贝插入新的部位。(4)和IS,Tn相比,Mu末端不含IR,这是可转座成分的一个例外。第78页,共159页,2023年,2月20日,星期一*噬菌体(phage)—是侵袭细菌的病毒,主要由蛋白质和核酸组成。噬菌的生活周期分为①溶菌周期和②溶原周期。溶原性噬菌体(温和噬菌体)→宿主菌→将自身DNA整合到细菌染色体中→和细菌染色体一起复制→随细菌增殖传到细菌子代中去,不产生子代Phage.第79页,共159页,2023年,2月20日,星期一(二)转位作用的机理1.复制性转位机理共联体生成和解离,靶序列的切割与复制。2.非复制型转位作用转位将供体DNA转座因子两侧各切断一条单链并与靶序列的两个游离末端连接,随后并没有复制过程,而是由转座酶将供体DNA转座因子的另一端也切断,因此在供体DNA留下一个致死性缺口。转座子的两条游离单链在靶位点退火接合,DNA聚合酶项平缺口。第80页,共159页,2023年,2月20日,星期一(三)转位的遗传效应1.基因重排可能产生1个新的蛋白分子等,基因重排是进化的动力。2.基因突变插入到基因内部,可引起插入失活。3.插入位点引入新的基因如引进抗药基因。第81页,共159页,2023年,2月20日,星期一真核生物的基因家族和基因簇基因家族(genefamily)基因家族是指核苷酸序列或编码产物具有一定程度同源性的一组基因.(来源同,结构相似、功能相关)基因家族中各个基因之间的关系:1.家族中各基因的核苷酸序列相同这些基因族也被称为单纯多基因家庭(如rRNA,tRNA家族)和复合多基因家族(如组蛋白基因家族).2.家族中各基因核苷酸序列高度同源3.家族中各基因编码的蛋白质有高度的同源性,但基因的核苷酸序列可能不同。4.家族各基因编码的蛋白质中具有很小的保守基序(conservedmotif)。5.基因超家族(genesuperfamily)基因超家族是指一组由多基因家族及单基因家族组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。第82页,共159页,2023年,2月20日,星期一基因簇:指基因家族中各成员紧密成簇排列成大段的串联重复单位,定位于染色体的特殊区域,为同一个祖先的基因扩增产物。第83页,共159页,2023年,2月20日,星期一按照基因结构和转录方向可以分为简单的多基因家族、复杂的多基因家族。第84页,共159页,2023年,2月20日,星期一简单的多基因家族如rRNA基因家族5SrRNA家族tRNA家族和tRNA基因:人类基因约有1300个tRNA基因,编码50多种tRNA。每种tRNA可有10-几百个基因拷贝。同种tRNA往往串联在一起形成基因簇,但基因间有非转录间隔区分隔,常常比结构基因长近10倍。第85页,共159页,2023年,2月20日,星期一复杂的的多基因家族由几个多基因家族组成,如组蛋白基因家族5个成员,受发育调控的复杂多基因家族:这些基因家族的各个成员在DNA分子上的排列顺序按照发育的不同阶段先后次序排列,故也称“发育控制复合多基因家族”。如α-珠蛋白和β-珠蛋白基因家族第86页,共159页,2023年,2月20日,星期一基因超家族(genesuperfamily)基因超家族是指一组由多基因家族及单基因家族组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。如:免疫球蛋白超基因家族表达产物都有免疫球蛋白样的结构域结构。有2个微球蛋白、MHCI类抗原的α链,Ⅱ类抗原的α链和β链,Thy1、CD4、CD8等与免疫有关的分子。在后又陆续发现了许多免疫系统内以及与免疫无关的家族成员。第87页,共159页,2023年,2月20日,星期一假基因(pseudogene)

1.假基因在多基因家族中某些与正常功能基因在核苷酸序列上相似,但不能转录或转录后生成无功能基因产物的DNA序列,被称为假基因。DNA序列,被称为假基因。2.假基因常用符号ψ表示,如ψα1表示与α1相似的假基因.3.假基因与有功能的基因同源,原来也可以是有功能的基因,由于发生缺失(deletion)、例位(inversion)或点突变(pointmutaion)等,成为无功能的基因,即形成了假基因,哺乳动物基因组中的1/4基因为假基因,可能为进化的痕迹。

第88页,共159页,2023年,2月20日,星期一4.6.3线粒体基因与基因组的结构一个线粒体有多个DNA分子闭合双链环状分子大小差异大.动物<植物不与组蛋白结合,自主复制转录,缺乏修复机制编码了呼吸链中的蛋白质亚基突变率高,与衰老相关,生物密码的通用性及个例:P111第89页,共159页,2023年,2月20日,星期一4.6.3叶绿体基因与基因组的结构编码了呼吸链中的蛋白质亚基类囊体膜蛋白组分以及与氧化还原反应相关的酶类基因组较大,闭合双链环状分子不与组蛋白结合,含有数万碱基对的两个反向重复序列,大拷贝区,小拷贝区,P112第90页,共159页,2023年,2月20日,星期一人类基因组简介第91页,共159页,2023年,2月20日,星期一人类基因组的组成(3×109bp)第92页,共159页,2023年,2月20日,星期一一、什么是HGP?

人类基因组计划(HumanGenomeProject,HGP)是由美国科学家于1985年率先提出,由六个国家的科学家共同参加的旨在阐明人类基因组30亿个缄基对的序列,发现所有人类基因,破译人类全部遗传信息,使人类在分子水平上真正全面认识自我的科学计划。

第93页,共159页,2023年,2月20日,星期一人类基因组计划

基因科学发展的必然要求是偏重单个基因的研究,还是转到从整体水平上研究基因组?人类认识自身的必然要求例如:人类的进化?疾病产生的机制?人的生老病死?第94页,共159页,2023年,2月20日,星期一HGP提出过程中的几个事件:

1985年,加州大学校长Sinsheimer首次提出了测定人类基因组全序列的动议

1986年,诺贝尔奖获得者DulbeccoR在《科学》杂志上热情宣传开展人类基因组计划的意义1986年,美国能源部(DOE),正式提出实施测定人类基因组全序列的计划

第95页,共159页,2023年,2月20日,星期一1986年6月,HGP在美国冷泉港实验室召开的分子生物学会议上引起了激烈辩论1988年2月,国家科学研究委员会(NRC)的15位专家撰写完成“人类基因组的作图与测序(mappingandsequencingthehumangenome)”的报告美国国会正式批准美国的“人类基因组计划”于1990年10月1日正式启动

第96页,共159页,2023年,2月20日,星期一2.谁参与了HGP国际人类基因组测序协作组(公共计划组)由6个国家、20个研究中心的2000多位科学工作者组成。国家承担的测序任务美国54%英国33%日本7%法国2.8%德国2.2%中国1%第97页,共159页,2023年,2月20日,星期一中国参与HGP研究的情况

HGP参加国:美国、英国、德国、日本、法国、中国。中国是唯一的发展中国家。中国开展基因组研究的情况:

1987年,开展模式生物水稻基因组计划研究(“863”项目),2002年4月完成;1993年,中华民族基因中若干位点基因结构研究(国家自然科学基金委);1996年,人类重大疾病相关基因的定位、克隆、结构与功能研究(国家自然科学基金委);

第98页,共159页,2023年,2月20日,星期一中国HGP研究机构:以强伯勤为主任的中国人类基因组北方中心(北京协和医科大学);以陈竺为主任的中国人类基因组南方中心(上海瑞金医院);1999年7月,以杨焕明为主任的中科院遗传所人类基因组研究中心(北京)在国际人类基因组组织注册。承担任务:申请承担其中1%的测序任务,即第3号染色体上的3000万个碱基对;2000年,成立以杨焕明为主任的杭州华大基因研究中心(杭州)。

第99页,共159页,2023年,2月20日,星期一研究进展:2000年3月底,中国科学家完成了第3号染色体上的3千万个碱基对的测序和初步安装工作,并计划2003年完成全部组装及分析工作。第100页,共159页,2023年,2月20日,星期一中国的水稻基因组计划:完成时间:2002年4月。碱基数目:基因组总基因序列达4.6亿bp。基因总数:46022—55615个之间。完成单位:由来自北京、杭州华大基因研究中心暨中科院基因组信息学中心、中科院遗传与发育生物学研究所等12个单位完成。

第101页,共159页,2023年,2月20日,星期一人类基因组计划研究进展

2000年6月,人类基因组工作草图绘制成功。2001年2月,人类基因组精细图谱绘制完成,并进行了初步解读。

至2001年,包括小鼠、果蝇、线虫、拟南芥、酵母、大肠杆菌、枯草杆菌等在内的模式生物基因组测序完成,发现并克隆到许多基因。

第102页,共159页,2023年,2月20日,星期一科学家公布人类基因组细节研究成果

一、基因数量少得惊人。一些研究人员曾经预测人类约有14万个基因,但塞莱拉公司将人类基因总数定在2.6383万—3.9114万个之间。最终确定出的基因数在这个范围内,比如3万个左右,那么,人类只比果蝇多大约1.3万个基因。塞莱拉公司的科学家测出的序列准确地覆盖了基因组的95%,并已经确定了所有基因的2/3,平均测序精度为99.96%。二、人类基因组中存在“热点”和大片“荒漠”。人类基因组序列中所谓的“荒漠”就是包含极少或根本不包含基因的部分,基因组上大约1/4的区域是长长的、没有基因的片段。基因密度在第17、第19和第22号染色体上最高,在X染色体、第4、第18号和Y染色体上相对贫瘠。三、35.3%的基因组包含重复的序列。这意味着所有这些重复序列,即原来被认为的“垃圾DNA”应该被进一步研究。事实上,第19号染色体57%是重复的。除了重复片段,科学家还鉴定了210万个人与人之间不同的基因序列,这些序列被称为“单核苷酸多态性”,它们通常是无害的。四、地球上人与人之间99.99%的基因密码是相同的。研究发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一。第103页,共159页,2023年,2月20日,星期一研究目标从基因组整体水平上解码生命现象,认识生命起源、个体差异的起因、疾病产生的机制,衰老等的原因。第104页,共159页,2023年,2月20日,星期一人类基因组研究的内容1、描绘遗传图谱2、制作物理图谱3、完成序列图谱

4、基因鉴定5、建立基因信息系统,储存处理及开发相应软件第105页,共159页,2023年,2月20日,星期一遗传图谱转录图谱0.7cM或kb

序列图谱物理图谱100kbSTSmap四张图:物理图转录图遗传图序列图

连锁作图序列作图遗传标记连锁单位厘摩cM第106页,共159页,2023年,2月20日,星期一遗传图遗传图又称连锁图,是通过计算连锁的遗传标记之间的重组频率来确定他们之间的相对距离,测定单位用CM表示,这对疾病基因的定位是至关重要的。在摩尔根研究的交叉互换中,他应用果蝇的许多不同性状通过反复的杂交,从各性状的重组率即可确定基因间的距离。遗传学距离简单的说就是在减数分裂过程中同源染色体间发生交换的可能,重组率与染色体上两个座位间距离呈正相关。但实际细胞遗传学中的交换与经典遗传学中的重组是两个不同的概念。如果父源与母源染色体在某两座位上的等位基因完全相同,这时就不可能检出任何重组的遗传效应。因此,只有具有多态性的座位才有可能检测到重组的发生,才有作为遗传标记的价值。因此,人类基因组遗传图的建立需要:1、遗传标记多,2、多态性,3、某座位上等位基因呈共显性。第107页,共159页,2023年,2月20日,星期一遗传标志最早的遗传标志是经典的性状遗传标记,如ABO血型、性别、HLA标志等,但这些蛋白多态性少、等位基因数目有限、分布不够均匀、检测技术复杂第一代遗传标记:RFLP,DNA顺序的改变遍于整个基因组(尤其基因组),平均每200bp就有一个,这种改变可通过限制性内切酶切点的有无,导致酶切片段长度多态。1983年,Huntington舞蹈症定位就是应用此技术。但此法限制酶种类有限、还需同位素标记探针,复杂烦琐。第二代遗传标记:VNTR或STR,不但具多态性高频率,还可PCR扩增而自动化第三代遗传标记:SNP,数量多,覆盖密度高,还与基因功能密切相关。第108页,共159页,2023年,2月20日,星期一遗传图与基因定位遗传图对疾病基因的定位至关重要:一个基因位点至少有两个等位基因,一个正常,一个异常,只有通过异常才发现正常,如红绿色盲基因的发现,才定位此基因。如我们想知道某种病的基因定位就可分析此位点与某一遗传标记的交换情况,就可在这遗传标记附近找这基因。进一步找基因就需要物理图了(进一步找遗传标记旁的物理标记,再沿着找相邻片段群)

第109页,共159页,2023年,2月20日,星期一17cM11cMXg(血型基因)ich(普通鱼鳞病)OA(眼白化症)遗传图谱举例:重组频率用于X染色体上基因的连锁和定位第110页,共159页,2023年,2月20日,星期一物理图物理图用于确定各遗传标记之间的物理距离,用kb或Mb表示。1CM相当1Mb物理图有两种1、以一段已知核苷酸序列的DNA片段即序列标记部位STS(sequencetaggedsite)为路标,以Mb或kb做图距的基因组图。STS的要求:在基因组有明确的位置,且是一段已知的序列因此,可用一段已知的DNA序列做探针,就可找到某一位置的路标。至1996年10月已建立22000个STS,分辨率达199kb2、建立以DNA克隆片段相互重叠的邻接克隆群(contig),即由225个YAC连续克隆重叠群组成的覆盖人类基因组75%的物理图。如将含有一个STS路标的DNA片段一个个接起来称为相邻片段群,或相邻克隆群。(相邻克隆群的建立为大片段测序创造了条件)第111页,共159页,2023年,2月20日,星期一转录图转录图又称表达图。它是以部分5端或3端cDNA序列即EST为路标,根据转录顺序的位置和距离所绘制的图。人体每一特定组织,只有10%的基因是表达的,只要分离某一发育阶段、某一组织的mRNA,进而合成相应的cDNA,然后克隆、测序,这些cDNA序列标记即表达的标签序列EST。转录图有特定的意义:①首先由于DNA转录是有组织和时间特异的,它来源于已知的某一生育阶段的某一组织,它可使我们了解某一基因在不同时间、不同组织、不同水平的表达,也可以了解某一特定时间不同组织、不同基因的表达②为HGP提供表达序列③为基因功能研究提供信息④为基因鉴定提供侯选基因⑤编码序列具潜在商业价值第112页,共159页,2023年,2月20日,星期一序列图序列图即分子水平的物理图,测定长度约1米的31亿个核苷酸的顺序。策略:从上而下:①建立人基因组DNA的酵母人工染色体(YAC)重叠群②利用DNA标志或DNA指纹图谱建立有序排列的连续克隆系,常用的标志有STS和EST③将这些克隆系列分别定位于染色体的不同区域,构成全基因组物理图谱④再对这些克隆进行亚克隆,作为测序模板⑤再进行序列分析,寻找开放阅读框全基因组鸟枪法:不需构建YAC的重叠群,而是直接对人类基因组的大小不同的随机克隆进行直接测序,然后运用计算机分析,将各测序片段进行排列。

第113页,共159页,2023年,2月20日,星期一遗传标记的种类路标?已知的基因,多态性标记(限制性内切酶位点,RFLP,可变数目串联重复(VNTR)SIR,,STR,SNP,STS虚列标签位点第114页,共159页,2023年,2月20日,星期一人工染色体:YAC人工染色体载体是利用酿酒酵母Saccharomycescerevisiae)的染色体的复制元件构建的载体,其工作环境也是在酿酒酵母中。酿酒酵母的形态为扁圆形和卵形,生长的代时为90分钟;含16条染色体,其大小为225-1900kb,总计有14×106bp;具真核mRNA的加工活性。

第115页,共159页,2023年,2月20日,星期一YAC载体的复制元件是其核心组成成分,其在酵母中复制的必需元件包括复制起点序列即自主复制序列autonomouslyreplicatingsequence,ARS)、用于有丝分裂和减数分裂功能的着丝粒(centromere,CEN)和两个端粒(TEL)。

YAC载体为能够满足自主复制、染色体在子代细胞间的分离及保持染色体稳定的需要,必须含有以下元件:

·端粒重复序列(telomericrepeat,TEL):定位于染色体末端一段序列,用于保护线状的DNA不被胞内的核酸酶降解,以形成稳定的结构。

·着丝粒(centromere,CEN):有丝分裂过程中纺锤丝的结合位点,使染色体在分裂过程中能正确分配到子细胞中。在YAC中起到保证一个细胞内只有一个人工染色体的作用。如pYAC4使用的是酵母第四条染色体的着丝粒。

·自主复制序列(autonomouslyreplicationsequences,ARS)一段特殊的序列,含有酵母菌中DNA进行双向复制所必须的信号。

第116页,共159页,2023年,2月20日,星期一YAC载体的选择标记主要采用营养缺陷型基因,如色氨酸、亮氨酸和组氨酸合成缺陷型基因trp1、leu2和his3、尿嘧啶合成缺陷型基因ura3等,以及赭石突变抑制基因sup4。第117页,共159页,2023年,2月20日,星期一“逐个克隆法”:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)人类基因组计划:大规模测序基本策略“全基因组鸟枪法”:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)第118页,共159页,2023年,2月20日,星期一1、逐个克隆法(clonybyclony):将YAC、BAC克隆逐一序列分析,然后排列组装。2、鸟枪法(shotgunapproach):随机挑取克隆测序,然后通过计算机排序并连接,Celera公司首创。大规模测序的基本策略第119页,共159页,2023年,2月20日,星期一二、基本策略1、对基因组进行标记和划界将每条染色体划分为长臂、短臂、带、亚带和亚亚带,这为定位基因和特定序列提供了染色体标志。一般以500kb标以一个特异的DNA标记,作为特定基因或序列的界标。2、切割和排序标记好后,再对基因组DNA用一定内切酶切割成片段并进行克隆,并用已知的标记将这些克隆有序排列。3、建立遗传图谱、物理图谱和基因图谱(转录图谱)4、进行全序列测定5、确定每一个基因结构、特性和功能第120页,共159页,2023年,2月20日,星期一基因是否应该被申请专利?人类基因现在也被授予了专利。如肥胖基因,该基因的克隆曾被一家生物制药公司以3000万美元收购;但该公司并未自己生产减肥药物,而是在第二年以7000万美元的高价转手获利,年利率高达250%。可见,与基因有关的买卖将会在今后大量涌现。第121页,共159页,2023年,2月20日,星期一1997年11月11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论