第九章 目的基因的克隆.doc_第1页
第九章 目的基因的克隆.doc_第2页
第九章 目的基因的克隆.doc_第3页
第九章 目的基因的克隆.doc_第4页
第九章 目的基因的克隆.doc_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九讲 目的基因的克隆吴 乃 虎中国科学院遗传与发育生物学研究所2005年8月目 录一、基因克隆的一般概念1 基因克隆定义2 “克隆”的不同含义3 基因克隆的过程4 DNA片段的产生与分离5 基因文库二、基因克隆与分离的实验策略1 物理策略2 生物策略3 克隆样品的选择4 基因文库库容测算三、cDNA基因克隆1 概述2 cDNA文库的构建3 低丰度mRNA之cDNA克隆4 稀少mRNA的cDNA克隆5 全长cDNA的合成6 cDNA克隆的优越性四、基因组DNA克隆1 cDNA克隆的局限性2 基因组DNA克隆的优越性3 构建基因组文库的载体类型五、基因定位定隆1 基因定位克隆概述2 RFLP分子标记3 RFLP作图原理与步骤4 染色体步移5 大尺度物理图谱的构建目的基因的克隆一、基因克隆的概念1基因克隆的定义基因克隆亦叫做DNA克隆(DNA cloning),它是指将外源基因或DNA片段插入到克隆载体的分子上,构成重组的DNA群体,并转化到寄主细胞进行复制和繁殖,以便从大分子DNA或DNA片段混合物中分离纯化目的基因或特定DNA片段的实验操作,叫做基因克隆。严格地说,基因克隆应叫做DNA克隆,因为被克隆的是基因组的全部(理论上)的DNA片段,而并不是所有的DNA片段都编码有基因。*要注意基因克隆与基因分离两者在概念上的差别!完成了基因克隆并不等于完成了基因的分离!尽管两者之间存在密切的相互关系。因此在日常交谈中或是一般文字叙述中,甚至于某些正式有关文件中,常把“基因克隆”与“基因分离”等同使用,不作区分,是不妥当的。*有时我们所说的基因克隆,即所谓的“分子克隆”(Molecular cloning),实质上包含着目的基因的分离与鉴定两个主要的内容,基因克隆的全过程包括如下四个步骤:a.DNA材料的选择与片段化;b.外源DNA片段与载体分子的连接;c.重组体分子的体外转化;d.转化子克隆的选择或筛选。2克隆的不同含义:(动词、名词与形容词)(1)“克隆”的三种含义*1.“克隆”一词作名词时,是指从一个共同的祖先经无性繁殖下来的一群遗传上同一的DNA分子、细胞或个体所组成的特定的生命群体;*2.“克隆”一词作动词时,则是指从同一祖先经无性繁殖产生这类遗传分子上同一的DNA分子、细胞群体或个体群体的过程;*3.“克隆”一词除了用作名词和动词之外,还可用作形容词使用,例如“克隆羊”(cloned sheep)中的“克隆”便是形容词,这是中文的一个有别于英文的地方。(2)名词“克隆”的三个内容在作名词使用时,“克隆”涉及如下三个方面的内容:a.在胚胎学、免疫学以及细胞生物学等学科中,“克隆”一词是指是同一祖细胞分裂而来的一群遗传上同一的细胞群体;b.具有相同基因型的同一物种的两个或多个个体亦可用克隆表示,因此从同一个受精卵分裂而来的单卵双生子(monozygotic twins)便属于同一克隆;c.在分子生物学中,带有一段插入DNA序列的独特的寄主/载体单位(例如细胞寄主中的重组质粒载体)亦叫做克隆。3基因克隆的过程a.DNA分子的体外切割克隆用的DNA材料的片段化,它要求在其分子的准确部位切割DNA分子的实验方法,识别序列特异的核酸内切限制酶的发现为DNA分子的体外切割提供了有力的工具。(A method for cutting DNA at precise locations)b.DNA分子的体外连接共价连接克隆DNA片段与载体分子的方法(A method for joining two DNA fragment covalently) DNA连接酶的发现使这个问题得到了圆满的解决。c.克隆载体的选择选择能够自我复制的小分子量的载体DNA分子。(Selection of a small molecular of DNA capable of self-replication)待克隆的外源基因或DNA片段,可以被连接到质粒或病毒载体的DNA分子上(克隆载体)。这些重组合的DNA分子是由两个或数个不同来源的DNA片段共价连接而成,称为重组体分子(recombinant DNAs)。d.重组DNA的转化将重组DNA分子从试管中转移到能使其进行DNA复制的寄主细胞的方法。(A method for moving recombinant DNA from test tube into a host cell that can provide the enzymatic machinery for DNA replication)e.转化子的筛选与鉴定筛选或鉴定含有重组体DNA分子的寄主细胞的方法。(Method to select of identify those host cells that contain recombinant DNA)图6-2 真核基因克隆的基本步骤4DNA片段的产生与分离我们知道所谓DNA文库(DNA library)是指,来自特定生物有机体基因组的全部DNA片段之每一条片段,都与克隆载本单独形成重组分子,此种包含有该特定生物有机体之全部DNA片段的重组克隆分子的集合体,称做DNA文库。简言之,是生物有机体的基因组DNA片段化之后形成的成千上万的DNA片段都被同一克隆载体所克隆。因此生物有机体的全部遗传信息通过基因文库(DNA文库)中的各种克隆得到了保存与体现,犹如书库保藏着人类的全部知识一样。由此可见,基因克隆与分离的头一步就必须对基因组DNA进行片段化。(1)核酸内切限制酶的切割法真核基因组DNA经核酸内切限制酶消化之后不进行凝胶电泳分部分离而直接与克隆载体重组,这种克隆方法,在早期研究中使用过,特称为“鸟枪法(shotgun approach)”。缺点:形成的重组体分子,实际上是一群带有不同大小的插入片段的重组载体的混合群体。造成目的基因筛选困难、工作量大、费时、费力、费钱。有些目的基因的核苷序列中可能会存在一个甚至数个限制酶识别位点。因此,克隆的目的基因有可能被切成若干片段。产生的有些片段可能太大,有些片段又可能太小,因此有些基因无法被克隆,形成不完全的基因库。(2)机械切割法构建DNA文库最好使用随机片段化的方法制备DNA的克隆片段。机械切割法和限制酶局部消化法处理基因组DNA,都可以产生出随机片段化的DNA克隆片段群体;机械切割的标准状况是:1500转/分搅拌器中高速搅拌,30分钟便可将DNA分子切成平均长度8kb的分子群体。(3)限制酶局部消化用来产生DNA克隆片段的限制酶,必须考虑到它对DNA序列应该具有最佳的识别位点分布规律。例如选用l噬菌体载体构建基因文库,就不能够承载大小25Kb的EcoRI片段,在这种情况下最好选用识别序列为4bp的Sau3A、Hae以及AluI等限制酶。(4)DNA片段的大小分部*蔗糖密度梯度离心除去不适于克隆的过大或过小的DNA片段;*琼脂糖凝胶电泳此法可以在很窄的范围内获得高纯度的某种DNA片段,或是大小同源的DNA片段。此法的缺点是,琼脂糖的污染有时会抑制尔后的酶催反应。5基因文库(1)基因文库和DNA文库*基因文库亦叫基因银行(Gene bank),系指在一种载体分子中随机地克隆着某种生物、组织、器官或细胞类型的所有的DNA片段而构成的克隆集合体。在理想的情况下,它应包含有该生物种全部的遗传信息。在过去也称基因文库为鸟枪收集。*DNA文库(DNA library),基因文库是在基因工程诞生的早期就已被使用,已经习惯且通俗易懂。但近年来一般称基因文库为DNA文库,这是一种更加符合实际更加科学的名称。因为基因文库从本质上讲是由来自染色体基因组的全部DNA片段组成的。(2)基因组文库和cDNA文库*基因组文库(Genomic library),系指生物体基因组DNA经过核酸内切限制酶作部分消化切割之后,克隆在适当的载体分子上,然后将这重组的混合物转化给例如大肠杆菌这样的寄主菌株,于是便构成了包含该生物体整个基因组全部遗传信息的基因组文库。*cDNA文库(cDNA library),将纯化的某种生物的特定发育阶段或组织之mRNA,经反转录酶作用合成双链的DNA群体,同适当的载体分子重组之后转化给寄主菌株,如此便构成了特定的cDNA文库。这种文库与基因组文库不同,它只包括特定的发育阶段特定组织或器官中表达的基因,而不是全部的基因。二、基因克隆与分离的实验策略1物理策略(physical strategy)基因的克隆与分离从大的方面看,可以区分为物理策略和生物策略两大类。所谓物理策略是,首先构建基因组的物理图谱,如限制图和测序图,然后再据此确定基因的位置、全序列结构、表达蛋白质及其生物功能。基因组DNA是一种线性结构,使用物理策略分离目的基因,是按照染色体、YAC克隆(或BAC克隆)、Cosmid克隆、亚克隆这种由大到小的过程,逐渐克隆、分离和测序,最后完成目的基因及其基因组的全测序。2生物策略(biological strategy)从具有某种表型(生物功能)的个体或细胞的基因组中,分离出与表型相关的基因片段,再以此为分子探针,筛选出基因的全序列和表达序列。以这种方式克隆分离目的基因的策略,称为生物学策略。3克隆样品的选择(1)蛋白质大分子最早的功能基因克隆,是从分离纯化与特异表型相关的蛋白质开始的,然后根据蛋白质的氨基酸顺序反推出相应的核苷酸顺序,并以此为依据合成分子探针,从基因库中筛选出目的基因。*1.优点:一般真核细胞中蛋白质种类的复杂度都比较低,仅有104种左右,故可比较容易地通过电泳分析得到间断的可分辨的图谱。因此,对于一些大量表达的功能蛋白质之编码基因的分离,还是比较容易的。*2.缺点:在任何类型的细胞中,都仅有少数基因表达成相应的蛋白质,而且其表达活性和种类还随着发育阶段的不同及环境因素的变化而变化,所以在不同的发育阶段和不同的环境条件下,不同类型的细胞中蛋白质的种类都是不完全的,也不尽然相同。况且还有许多基因的蛋白质产物是未知的,或者其纯化量不足以进行氨基酸序列分析及相应抗体的制备。因而要从蛋白质水平来分离目的基因,显然也是有困难的。(2)mRNA大分子*高等真核生物一般具有105种左右不同的基因,但在一定的发育阶段的单个细胞或个体中,都仅有15%左右的基因得以表达,产生出大约15000种不同的mRNA。可见mRNA的复杂度与蛋白质的复杂度比较接近。*正是由于这种基因的差别表达,才决定了高等植物的发育分化、细胞周期、对环境压力的反应,以及衰老与死亡等所有的生命过程。*植物的正常代谢过程或者病理变化,以及光温的育性效应,不管其是由单基因控制的,还是由多基因控制的,本质上都是由于基因表达的改变造成的。因此,比较不同的细胞或不同基因型的基因表达的差别,为我们了解植物的发育分化的分子本质,以及克隆分离与此相关的基因打开了方便之门。*从mRNA出发克隆分离目的基因的技术程序:a. 差别杂交技术(differential hybridization)b. 扣除文库技术(subtracted library)c. mRNA差别显示(mRNA differential display)d. 代表性差别分析法(representational difference analysis,简称RDA;中文又译作cDNA差式分析法)(3)DNA大分子真核生物基因组DNA的复杂度是蛋白质和mRNA的100倍左右,而且含有大量的重复序列。因此无论是采用电泳分离技术还是通过杂交方法,都是难以直接分离到目的基因(或其片段)的。但基因组DNA具有完整性(包括protein和mRNA分子所不具有的非编码区序列)、恒定性(在单克隆细胞群体中,基因组DNA序列的种类和数量都是恒定的)、可直接进行克隆、序列分析及杂交识别,因此是分离基因的主要样品(出发材料)。以DNA为出发材料分离目的基因的优点:a. 可以分离到完整的基因结构序列,包括表达子和间隔子以及启动区序列等;b. 数量恒定,不会受到生物体发育状态、发育阶段以及不同器官组织的影响;c. 不必经过反转录或是氨基酸测序合成引物等程序,便可直接进行基因克隆;d. 可直接进行核苷酸序列分析;e. 可直接进行核酸杂交鉴定;4基因文库库容测算(1)理论克隆数与实际克隆数由某种生物材料构建的完全的基因组DNA之基因文库,所应具有的理论克隆数和实际克隆数是有相当差别的。*1.理论克隆数:是用给体生物(例如细胞、真菌及动物或植物)的基因组DNA总量(分子量大小),除去克隆片段的平均大小所得的数值。理论克隆数受两个因素的影响,其一是给体生物基因组分子量的大小;其二是克隆片段的平均分子量,亦即是所用的克隆载体可能承接的外源片段的克隆能力。*2.实际克隆数:由于DNA片段是随机克隆的,因此理论克隆数只是基因组文库所需的最小数值。从统计学上讲,这意味着从一个只含有最低重组体DNA克隆数的基因库中,筛选一种特定的单拷贝基因只有50%的几率。而当被筛选的基因库是含有两倍的最低重组体DNA克隆时,那么获得某一特定基因的几率则可达75%。因此,为了达到以一种合理的几率筛选出单拷贝目的基因,一个完全的基因文库就必须含有3-10倍于最低重组体DNA克隆数。这个实际克隆数是由Clarke-Carbon公式计算。表9-1 不同生物的完全基因组DNA之基因文库应具有的理论克隆数和实际克隆数克隆片段之平均分子量大小(bp)基因组大小(bp)2106(细菌)2107(细菌)3109(细菌)理论克隆数实际克隆数理论克隆数实际克隆数理论克隆数实际克隆数5103400183140001841860000027631101010320091920009208300000138155020103100458100046031500006907744010350278500230075000345386(2)Clarke-Carbon公式:这是在1975年由L. Clarke和J. Carbon提出的一种计算一个完全基因文库所需要的实际克隆数的公式。上表所例的实际克隆数就是按照这个公式计算的。N=ln(1-p)ln(1-f)N=一个完全基因文库所应包含的重组DNA的转化子克隆数(实际克隆数);P=重组体群体中出现目的基因序列的几率(一般期望为99%);f=为限制片段的平均大小与基因组总量之比值;以人b-珠蛋白基因(分子量约为1.5Kb)为例,其N值应是:N=ln(1-0.99)=9.2106ln1-(1.5103/3109)*这个数字表明,如果使用的载体不具有选择记号,那么就需要分离并鉴定9106个独立的菌落或克隆。*换句话说,我们必需拥有非常大量的重组体的DNA群体,才有可能汇集整个人基因组的全部DNA序列。要分离鉴定如此大量的克隆(9百万个克隆),再考虑到连接作用及转化两者的效率,那么要在一次实验中产生如此大量的重组体的可能性,无疑是微乎其微的。克服的办法是选用克隆能力大的载体建库:a. 应用克隆能力为15kb(即插入片段平均分子量为15kb)的l载体,那么一个完全的基因文库所需的重组体数量便可下降到9105;b. 如选用克隆能力为40kb的柯斯载体,这个数字还可以进一步下降到3.5105;三、cDNA基因文库下图示的是以质粒为载体构建cDNA文库的基本的步骤:图9-1 以质粒为载体构建cDNA文库具有poly(A)的mRNA在oligo(dT)引物和反转录酶的作用下,可合成出双链cDNA,随后将它与质粒载体构成重组体分子,并转化给大肠杆菌寄主细胞进行扩增,应用这种方法能够分离和扩增我们所期望研究的基因或DNA片段。1cDNA基因克隆概述真核生物基因组DNA十分庞大,以人的为例高达3109bp,而且含有大量的重复序列。因此无论是用电泳分离技术,还是通过杂交的方法,都是难以直接分离到目的基因片段。这是以真核染色体基因组DNA为出发材料直接克隆目的基因的困难所在。cDNA基因克隆可以部分解决上述的困难,这是因为它的复杂度仅及基因DNA的1%左右。cDNA基因克隆的基本过程是通过一系列的酶催反应,使总poly(A)mRNA双链cDNA与适当载体分子重组转化给寄主菌株细胞。如此便构成了cDNA基因文库,此种技术已成为当今研究真核生物分子生物学及基因工程的基本手段之一。2cDNA文库的构建第一步:分离细胞的总RNA,并根据其3-端具有poly(A)尾巴的特征,应用oligo(dT)法,从中纯化出主要含mRNA的分部第二步:合成第一链cDNA,即以mRNA分子为模板加上适当的引物,引导反转录酶合成第一链cDNA。常用的有oligo(dT)引物法,和随机引物法。应用oligo(dT)纤维素柱纯化poly(A) mRNA分子的流程示意图图9-3 用纤维素柱纯化poly(A) mRNA的流程示意图第三步:将mRNA-DNA杂交分子转变为双链DNA分子,其具体的办法有:a. 自我引导合成法,系用碱处理使mRNA模板水解,并在第一链cDNA末端形成发夹结构作为第二链合成的引物;b.RNaseH降解法该酶可识别mRNA-DNA杂交分子,并将其中的mRNA模板消化成许多短片段第四步:将双链DNA同适当载体分子重组,并导入寄主细胞增殖,于是便构成了cDNA文库。体外重组的方法有:a. 用末端转移酶给双链cDNA分子作同聚物加尾;b. 加adapter或linker;RNaseH酶降解法:图9-4 合成双链cDNA的RNaseH酶降解取代法具poly(A)的mRNA同oligo(dT)短序列保温时,两者便会杂交形成带oligo(dT)引物的模板结构,并在反转录酶的作用下合成出mRNA-DNA杂交分子。加入RNaseH酶切割mRNA使之产生出许多缺口,随后大肠杆菌DNA聚合酶I便以这些缺口为起点合成DNA。结果大部分的mRNA链都被新合成的DNA链取代,经DNA连接酶封闭缺口形成双链cDNA。以l为载体之cDNA库构建法:图9-5 以l噬菌体作载体构建cDNA文库的流程图3低丰度mRNA的cDNA克隆(1)mRNA丰度在许多组织和培养的细胞中,各种mRNA的含量都是极不相同的。有些类型mRNA含量十分丰富,每个细胞可拥有数千拷贝;有些类型mRNA则相当稀少,每个细胞仅有少数几个拷贝。所谓mRNA丰度,系指一个细胞 中某种特定mRNA分子拷贝数的多寡,即通常所说的丰富程度。据此可将mRNA分成高丰度、中丰度和低丰度三种不同的类型。表9-2 一种典型的真核细胞mRNA群体的丰度等级及其复杂性丰度等级相应丰度等级的mRNA群体占总mRNA的百分数在相应丰度等级中所含的不同种类mRNA序列数目(个)每个细胞所含的相应丰度mRNA序列的拷贝数(个)高丰度22303500中丰度491090230低丰度291067014(2)高丰度mRNA的cDNA克隆有些基因的mRNA含量相当丰富,例如:胰脏组织中的胰岛素基因的mRNA;血红蛋白细胞中珠蛋白基因的mRNA;鸡输卵管中卵清蛋白基因的mRNA。从这些组织或细胞中分离出来的总mRNA,不需进一步纯化,就可直接用来合成双链DNA,并构建基因文库,分离上述这些目的基因。因此说,分离高丰度的mRNA的目的基因之cDNA克隆,实际上并不存在什么困难。例如应用digo(dT)纤维素层析法,就可以从富含poly(A)mRNA制剂中纯化出珠蛋白mRNA。(3)低丰度mRNA的cDNA克隆对于低丰度的mRNA的cDNA克隆,通常是构建cDNA基因文库。组成一个合理的、完全的cDNA基因文库所必须的重组体克隆的数目,可以根据Clarke-Carbon公式计算。在典型的情况下,对大多数的低丰度mRNA,建立105个克隆就已足够了。大体上讲来,在一定的发育阶段,哺乳动物的细胞含有10000到30000种不同的mRNA序列。例如人成纤维细胞大约有12000种不同的mRNA序列。从表9-2可以看到,低丰度的mRNA每个细胞仅有14个拷贝左右,其总量约占总mRNA的30%,其中约有11000个左右不同种类的mRNA。因此,为获得一个能够代表全部低丰度mRNA的序列的cDNA基因文库,所必须的最低克隆数(理论值)应是11000/0.30=37000。但考虑到在实验取样的差异;以及有些序列容易克隆,有些序列不易克隆等因素,因此就必须增加克隆数目。以人成纤维细胞为例,为使其中某些特异的低丰度mRNA之cDNA克隆达到99%的期望率,按Clarke-Carbon公式计算需要170000个克隆。这个数字是目前实验技术所能达到的。因为无论是用同聚物加尾法,还是双衔接物法,每微克的双链cDNA都可以产生出11056105个的菌落。4稀少mRNA的cDNA克隆一些含量极低的稀少mRNA的cDNA克隆,是无法应用菌落原位杂交技术检测的。根据一些作者的计算,使用体外标记的mRNA或cDNA作探针,可以检测出仅占总mRNA 0.05%0.1%低丰度的mRNA的cDNA克隆。然而在实际操作中,要检测出含量不到总mRNA 0.5%的低丰度mRNA之cDNA克隆,仍有极大的困难。下面介绍一些解决稀少mRNA的cDNA克隆的方法。(1)分部分离法应用按分子量大小分部分离技术富集克隆的mRNA,其常用的方法有:a. 蔗糖梯度离心法;b. 变性凝胶电泳法。(2)寡聚脱氧核苷酸纯化法用化学合成的寡聚脱氧核苷酸纯化特定的mRNA。在已知某种待分离mRNA转译的蛋白质的局部或全部氨基酸序列的情况下,就可以据之合成该mRNA之寡核苷酸互补链。这些人工化学合成的寡核苷酸序列,如果长度足够(1440个核苷酸)经体外标记之后,便可直接作为探针,从cDNA文库中筛选出含有目的基因序列的克隆。(3)差别杂交筛选法应用差别杂交法筛选特异mRNA之cDNA克隆,亦是有效分离特异mRNA的cDNA克隆的方法之一。如果在两种mRNA制剂中,有多种mRNA序列是两者共有的,但也有少数我们感兴趣的mRNA序列仅为其中某一种mRNA制剂所特有。在这种情况下,便可以使用“差别杂交”技术,从热休克或是用药物、激素处理前后的细胞中分别提取mRNA制剂中,鉴定出特异的mRNA之cDNA克隆。5全长cDNA的合成为了克服自我引导法合成双链cDNA的缺点,目前已发展出若干种不使用S1核酸酶(切割发夹结构)的全长双链cDNA的合成技术。(1)oligo(dG)引导合成法此法的核心技术是,在第一链cDNA尚未与mRNA模板分离之前,先在其3-末端加上一段oligo(dC)序列,然后通过碱性蔗糖梯度离心处理,使mRNA模板分子发生水解,回收全长cDNA。继之以互补的oligo(dG)序列作引物引导第二链cDNA合成,形成全长的双链cDNA。具体过程如下:以mRNA为模板合成第一链cDNA在mRNA模板未解离前,在其3端加上一段oligo(dC)序列碱性蔗糖梯度水解(alkaline sucrose gradient)mRNA模板回收全长第一链cDNA(其3-端具有一段poly(dC)以互补的olig(dG)序列作引物合成第二链cDNA同聚物加尾或加衔接物,并与载体连接图9-6 寡聚脱氧胸苷酸oligo(dG)引导法合成全长双链cDNA在末端转移酶的作用下,于第一链cDNA分子的3-末端加上一段oligo(dC)序列,于是便可以由oligo(dG)引导第二链cDNA合成。形成的无发夹环结构的全长双链cDNA分子,经过同聚物加尾或是连接上衔接物之后,直接克隆到载体分子上。(2)载体引导合成法载体引导的cDNA合成(vector-primed cDNA synthesis)具体步骤如下:利用适当的核酸内切限制酶,使载体分子线性化;在线性化的载体分子的3-端加上一段oligo(dT)尾巴;通过mRNA之poly(A)与线性化质粒oligo(dT)间的互补作用,mRNA便可退火连接到线性质粒载体分子上;以oligo(dT)为引物合成第一链cDNA分子,形成cDNA-质粒DNA重组体分子在其cDNA末端加上一段oligo(dG)尾巴,再作碱性蔗糖梯度离心,水解mRNA模板由于在碱性环境条件下,质粒DNA双链解离,因此原先与质粒DNA连接的两条cDNA-1和cDNA-2也就彼此分开加入超量变性的oligo(dC)加尾的质粒DNA分子,与具oligo(dG)尾巴的cDNA分子连接形成双链质粒DNA-cDNA重组体分子具游离3-OH羟基的oligo(dC)尾巴作引物,合成第二链cDNA,产生出双链的重组的质粒分子转化大肠杆菌细胞,获得具不同插入取向的cDNA克隆图9-7 载体引导法合成全长双链cDNA(3)置换合成法这是一种十分有效的全长cDNA合成法,它分三步进行:第一步:质粒引物的制备即具有一段oligo(dT)尾巴的质粒载体分子;第二步:具有oligo(dG)尾巴的接头DNA的制备;第三步:构建质粒-cDNA重组体分子。质粒引物通过其oligo(dT)与mRNA分子上的poly(A)配对,mRNA分子便可连接到质粒分子上,作为模板合成第一链cDNA;此后在此cDNA链的自由端加上一段oligo(dC)尾巴,以便与具有oligo(dG)的接头分子退火连接;转化到大肠杆菌寄主细胞,经DNA连接酶的封闭作用,形成质粒DNA-cDNA重组体分子。6cDNA克隆的优越性第一, 特别适用于RNA病毒的基因克隆cDNA克隆以mRNA为出发材料,因此对于其增殖不经过DNA中间体的RNA病毒特别适用。例如流感病毒、呼肠孤病毒等。图9-8 置换法合成全长cDNA(a)质粒引物的制备;(b)具有oligo(dG)尾巴的接头DNA的制备;(c)质粒cDNA重组体的构建第二,cDNA基因文库筛选比较简单,工作量小。典型的真核生物在特定的发育阶段仅具有1000030000个不同种的mRNA分子;而标准的真核基因组DNA则可以形成100,000个到1,000,000个适于克隆的DNA片段;两者相差10100倍!第三, 现假阳性的几率比较低。由于每一个cDNA克隆都含有一种mRNA序列,因此阳性杂交信号一般都可认为是有意义的,其阳性克隆将会含有目的基因序列。第四, 具有特殊的用途。克隆在原核生物如E.coli中表达的真核基因,应用cDNA克隆技术分离;另一个特殊用途是基因的核苷酸序列结构测定;cDNA克隆的第三个特殊用途是,关于在发育过程中时间调节基因(temporally regulated genes)的表达特征的分析;组织特异基因的表达特性的分析,亦要用cDNA克隆。四、基因组DNA克隆1CDNA克隆的局限性*1.cDNA克隆只能反映着mRNA的分子结构,而没有包括基因组DNA的间隔序列;*2.cDNA基因文库中,克隆的分布状态反映着mRNA的分布状态,相应于低丰度mRNA的cDNA克隆难以分离;*3.不能够克隆基因组DNA中非转录区段的序列,因此无法满足研究基因编码区外侧的调控序列的结构与功能的要求;*4.cDNA基因文库所函盖的基因类型与数量直接受不同的组织和不同发育阶段的制约,也就是说由不同组织或不同发育阶段构建的cDNA文库是互不相同的。2基因组DNA克隆的优越性*1.基因种类的全面性在一个完全的基因组文库中,生物有机体的每一个基因都会有一个克隆。*2.基因结构的完整性所克隆的基因可包括表达子、间隔子、启动区以及终止区等全部的基因结构部分;*3.克隆基因的恒定性所函盖的克隆基因的数量及种类不受组织及发育阶段的影响。*4.基因的功能性适用于研究基因的表达与调控。3构建基因组文库的载体类型(1)应用l噬菌体载体构建基因组文库*1.过程(步骤):制备出发材料之基因组DNA限制酶消化产生适于克隆的DNA片段克隆片段与l噬菌体载体重组转化到大肠杆菌寄主细胞含有目的基因克隆的筛选*2.库容大小计算:以人基因组为例,其分子量大小为3109bp,经EcoRI酶切消化产生的DNA限制片段平均大小为4kb左右。因此至少得筛选7105以上的独立的重组体,才有可能分离到一个含有目的基因序列的克隆。但实际构建的基因组文库之库容大小应比这大310倍,所以实际库容应达106以上才有效(见Clarte-Carbon公式)。*3.可能产生的问题:平均酶切DNA片段为4kb之EcoRI限制片段,如此基因组DNA中的目的基因序列有可能被EcoRI切割一次甚至多次;这样就不可能以单一片段形式获得一个完整的基因序列。目的基因有可能被包容在克隆载体无法承载的大分子量的DNA片段之中。也就是说如此构建的是不完全的基因组文库,目的基因可能被遗漏掉。*4.解决办法:通过基因组DNA随机片段化,使之形成大小20kb的克隆片段,这些问题便可得到较为满意的解决:a. 通过机械切割法,使基因组DNA发生随机断裂;b. 采用两种限制酶混合消化基因组DNA;把酶切作用控制在局部消化的程度,可得到平均大小为1030kb的DNA片段,然后再经过蔗糖梯度离心或制备凝胶电泳,从中分离出20kb左右的DNA片段群体。c. Hae-AluI双酶消化法这是两种识别序列毫不相干的、形成平末端的核酸内切限制酶。经其对真核基因组DNA作局部酶切消化后,电泳分部收集20kb左右的随机的DNA片段群体。但由于这两种酶切割的结果是形成平末端,因此需加上适当的接头,例如EcoRI接头等等。为了防止克隆DNA片段中可能存在的EcoRI位点被切割,需对DNA作甲基化处理。Hae识别序列:5GGCC3AluI识别序列:5AGCT3图9-9 通过衔接物连接法在l噬菌体载体上构建基因组文库(a)加入Hae-AluI对真核基因组DNA作局部双酶切割后,按大小分部分离收集20kb左右的片段;(b)用EcoRI甲基化酶处理破坏EcoRI位点后,再与EcoRI衔接物连接;(c)加入EcoRI核酸内切限制酶消化产生粘性末端;(d)同样用EcoRI核酸内切限制酶消化Charon4A载体DNA;(e)按大小分部,除去中间区段;(f)插入片段与载体分子退火,并加DNA连接酶连接;(g)体外包装;(h)感染大肠杆菌寄主细胞,构成基因组文库。(2)应用柯斯质粒载体构建基因组文库l噬菌体载体克隆能力有限,真正有效的范围仅为15kb左右,而柯斯质粒载体可克隆长约45kb的外源DNA片段(Gene),而且还可以在体外被有效地包装。因此柯斯质粒载体十分适合于构建真核基因组文库。*1.建库过程:应用Sau3A酶局部消化真核基因组DNA收集MW=3545kb的DNA片段群体同业已用Sau3A同尾酶(如BglII)作了线性化处理的柯斯质粒载体DNA连接体外包装后感染大肠杆菌寄主细胞,进行复制扩增,形成基因组文库。*2.缺点:a.用菌落杂交法筛选柯斯质粒载体之基因组文库,其敏感性要远远低于l噬菌体载体基因文库的噬菌斑杂交法。(噬菌斑杂交的敏感性高于菌落杂交);图9-10 应用Sau3A限制酶和l噬菌体载体构建真核基因组文库(a)载体DNA片段的制备;(b)真核基因组DNA片段的制备;(c)体外重组构建多连体分子;(d)体外包装;(e)感染大肠杆菌细胞;B=BamHI末端;S=Sau3A末端。b.柯斯质粒载体的基因组文库不像l噬菌体载体基因文库易于保藏。l噬菌体之基因文库几乎可无限期保藏,而柯斯质粒载体则不行;c.一般说来,由噬菌斑杂交产生的本底,总要比由菌落杂交形成的本底低得多。五、基因定位克隆1基因定位克隆概述基因定位克隆(map-based cloning),是用于分离其编码产物尚不知道的目的基因的一种有效的方法。从理论上讲,任何一种可鉴定出有一个突变的基因,都可以通过基因定位克隆予以分离。(1)基因定位克隆程序:将目的基因(即目的基因的突变)定位到染色体上在目的基因的两侧确定一对紧密连锁的RFLP或RAPD分子标记利用最紧密连锁的一对两侧分子标记作探针,通过染色体步移技术,将位于这两个分子标记之间的含目的基因的特定基因组片段克隆并分离出来;根据其同突变体发生遗传互补的能力,从此克隆中鉴定出目的基因。(2)成功应用基因定位克隆分离目的基因的必要条件:a. 以酵母人工染色体YAC(yeast artificial chromosome)为载体构建含有大片段DNA的YAC库;b. 要有可用的同目的基因紧密连锁的DNA探针,理想的情况是两者之间的遗传图距在数百kb之间。2RFLP分子标记用于染色体步移(chromosome walking)的分子标记通常是RFLP。所谓RFLP(Restriction fragment length polymorphism),即DNA限制片段长度多态性,它是指应用特定的核酸内切限制酶切割有关的DNA分子,所产生出来的DNA片段在长度上的简单变化。从不同生态型(ecotype)或不同的地理隔离群(geographical isolate)植株分离的总DNA中,同源的DNA分子之间通常会表现出序列的趋异性(divergence),形成RFLP。也就是说它们中间已经发生了碱基对的取代、缺失、插入或重排等变化,其中有些变化导致了限制酶切割位点的更动。图9-11 同一物种不同生态型之间DNA的趋异性产生的RFLP由于AT-GC碱基取代的结果,使生态型A之基因A序列失去了中间的一个EcoRI限制位点。(a)在生态型A的个体DNA中,两个EcoRI限制片段都含有基因A的序列;(b)在生态型B的个体DNA中,基因A的全部序列都集中在一个大分子量的EcoRI限制片段中。放射自显影照片中呈现的是与放射性标记的基因A同源的DNA限制片段。在这类变化当中,有不少都是属于“沉默突变”(silent mutations),但由于它们是发生在基因间隔区、间隔子以及表达子序列中的密码子3碱基处(即“简拼”或“摇摆”部位),所以不会影响到表型特征的变化。然而这些“沉默突变”偶尔也会移走或增加某些限制酶的切割位点,从而产生出RFLP。毫无疑问来自同一物种的不同地理隔离群、不同的生态型或是不同的近交系的DNA,往往也具有RFLP。通过琼脂糖凝胶电泳分离DNA片段,经EB染色后置UV下观察,这些RFLP更转变为肉眼可见的电泳谱带模式。因为这些RFLP是由于DNA分子中特定变化(突变)引起的,因此它们也能够像其它遗传标记一样进行定位,成为一种十分有用的分子标记。3RFLP的作图原理与步骤在实际的RFLP作图中,通常总要涉及许多种不同的生态型,并使用众多的核酸内切限制酶及大量的杂交探针,而且还需要通过计算机进行结果分析。因此是一项相当艰巨而烦琐的工作。(1)简单例子:a.两个不同的拟南芥生态型:Columbia生态型Niederzenz生态型b.两个杂交探针:基因A基因Bc.一种限制酶:EcoRI图9-12 拟南芥菜RFLP作用技术示意图全部基因组DNA均用EcoRI切割;(a) Columbia生态型;(b) Niederzenz生态型;C=Columbia生态型;N=Niederzenz生态型;H=杂交生态型。(2)作图步骤:从这两个不同生态型的拟南芥菜提取的两份总DNA各自经EcoRI酶切后,分别作琼脂糖凝胶电泳和Southern转移分别同放射性标记探针A和B杂交两种生态形DNA同两种探针杂交结果均呈现多态性现象。这说明:在这两个生态型的不同大小DNA限制片段上,都存在着A基因和B基因序列。4染色体步移(1)染色体步移实验过程在染色体步移的起点克隆中,具有一个与待分离的目的基因尽可能靠近的已鉴定的分子标记(在本例中是RFLP)构建起点RFLP标记克隆的限制图,并把其中最靠近目的基因的限制片段(B-H)亚克隆出来。将此B-H片段经放射性标记后用作分子杂交探针,从基因组文库中筛选与起点克隆具有重叠序列的新克隆特称一步克隆。重复上述各步:构建一步克隆的限制图亚克隆其中最靠近目的基因的H-E片段将此H-E片段用放射性标记后用作分子杂交探针筛选基因组文库从中得到与一步克隆具有重复序列的新克隆 特称二步克隆重复上述步骤,周而复始直至获得目的基因。(2)应用染色体步移法克隆目的基因的条件从原理上讲,应用染色体步移法克隆目的基因是比较简单的过程,但它需要两个已知的条件:第一, 需要知道起始克隆与目的基因的距离;第二, 起始克隆在连锁图上的取向,否则就需按双向同时进行染色体步移。图9-13 应用染色体步移法克隆目的基因(a)构建起始克隆的限制图;(b)亚克隆B-H限制片段;(c)用放射性标记B-H片段作探针筛选一步克隆;(d)构建一步克隆的限制图;(e)亚克隆H-E片段;(f)放射性标记H-E片段作探针筛选二步克隆。如此反复重复多次,直至获得目的克隆。图中B、E、H分别代表核酸内切限制酶BamHI、EcoRI和Hind。(3)影响因素影响染色体步移顺利进行的主要有如下两个因素:第一, DNA重复序列的存在它会扰乱步移的顺序性,使之“步入歧途”。例如在同一条染色体或另外染色体的其它位点拷贝重复序列。第二, 无法克隆序列的存在因为这样的序列插入到使用的克隆载体上时,会发生致死效应。5大尺度物理图谱的构建(1)问题的提出(a)不同的材料其1cM的图距相当于不同的kb,例如:人类1cM1000kb拟南芥1cM290kb番茄1cM750kb小麦1cM3500kb(b)克隆的DNA片段也不是越大越好。这是因为大多数高等植物基因组DNA中,都存在着相当大量的散在的重复序列,所以克隆的DNA越长,出现重复序列的可能性也就越高,易使染色体步测出现困难;(c)克隆的DNA片段太短也不好,因为这样会影响探针标记强度,影响检测的灵敏性;*现在有关农作物RFLP研究中,普遍选用400-2000kb的DNA片段构建随机的基因组文库。显而易见,常规的克隆技术是无法承接如此大分子量的DNA片段的。(2)解决问题的方法对超大型DNA序列的作图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论