外定向自我剪接机制的结果分析和验证一种DNA片断体外定向自我剪接机制的结果分析和验证_第1页
外定向自我剪接机制的结果分析和验证一种DNA片断体外定向自我剪接机制的结果分析和验证_第2页
外定向自我剪接机制的结果分析和验证一种DNA片断体外定向自我剪接机制的结果分析和验证_第3页
外定向自我剪接机制的结果分析和验证一种DNA片断体外定向自我剪接机制的结果分析和验证_第4页
外定向自我剪接机制的结果分析和验证一种DNA片断体外定向自我剪接机制的结果分析和验证_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一部分文献综述1.1限制性内切酶的发现与分类限制性核酸内切酶是识别生物体中特定DNA碱基序列并在该区域切割双链DNA序列的核酸内切酶[1-3]。目前发现的大多数限制性核酸内切酶都来源于细菌。它们在细菌中的生物学功能主要是通过切割入侵的外源DNA序列,防止异源DNA无法有效转录(例如噬菌体),从而使外源DNA序列(生命体)失去生命力,但不会破坏细菌本身DNA的原始遗传信息,形成细菌体内一种天然的免疫防御机制。1.1.1限制性内切酶的发现Arber[4](1962)在研究大肠杆菌时,提出细胞内限制和修饰作用的模型假说:一是可以识别DNA碱基序列的限制酶,另一个则是可以识别与相应的限制酶相同的碱基序列的修饰酶,Yuan和Meselson(1968)证实了这一假设。Arber等(1968)首次从大肠杆菌B株细胞中发现了第一个限制性核酸内切酶。Smith等(1970)发现流感嗜血杆菌(H-aemo-philusinfluenzaed)可以在不降解自身DNA情况下降解侵入细菌体内的噬菌体DNA;通过纯化DNA水解酶,确定了其高度特异性识别序列和切割位点,并将其命名为HindⅡ,这是第一个被发现的Ⅱ型限制性内切酶。后续研究发现,HindⅡ酶切后的DNA片段可以重组,这种限制性内切酶逐渐成为研究基因组成、表达及功能的重要工具。限制性内切酶广泛存在于原核生物中。通过对原核生物基因组进行测序和分析,发现许多可编码限制性内切酶的基因,因而发现更多种类的限制性内切酶。在1980年代初期,通过克隆技术将限制性核酸内切酶基因进行异位表达,避免其原始细胞中其他核酸内切酶的污染,并提高了限制性内切酶的纯度和产量,其纯化过程也不断优化。1.1.2限制性内切酶的分类根据切割位点识别序列之间的距离差异、激活因子的差异以及它们是否同时具有甲基化酶活性,可将限制性内切酶分为Ⅰ、Ⅱ、Ⅲ三大类(图1A、B)[5]。基于限制性内切酶的切割特征可分为两种类型:非特异性切割位点和特异性识别的核苷酸序列(仅特定序列可被切割)。可以特异性识别的切割位点应具有回文序列,即在切割位点,沿一条链的正向读取的碱基序列与另一条链的反向读取的序列相同。又根据限制性内切酶在特定切割部位的不同切割方法,可分为位错切割和平面切割。位错切割是指切割两条DNA链的不同部分,中间被几个核苷酸隔开,切割末端形成类似回文结构的单链末端,该末端与具有互补碱基的靶基因片段相连,因此称为粘性末端,如BamHI等。平面切割指切割两条链特定序列的相同部分,切割后形成具有非粘性末端的平口,且切割部位位于回文序列的中间以形成平整末端,如SamI。图1三种限制性内切酶的特性及切割双链DNA示意图(A)三种限制性内切酶的特性;(B)三种限制性内切酶切割双链DNA示意图。Fig.1Characteristicsofthreekindsofrestrictionendonucleasesandschematicdemonstrationofdigestingdouble-strandDNAbythem(A)Characteristicsofthreerestrictionendonucleases;(B)Schematicdemonstrationof3kindsofrestrictionendonucleasesdigestingdouble-strandDNA.1.2限制性内切酶的应用由于限制性内切酶对DNA分子有特定的切割能力,因而自发现Ⅱ型限制性内切酶以来,成为人们在分子水平上切割目的DNA片断和分析遗传信息的重要工具。1.2.1限制性内切酶在染色体DNA分析中的应用用限制酶将DNA切割成一系列片段,通过琼脂糖凝胶电泳将上诉一系列片段分离开,通过迁移速度或在电子显微镜下观察各种片断的大小。这些片段在整个基因组中的顺序主要由几种不同的限制性酶决定,这些酶部分水解DNA,然后通过电泳分析产物。DNA中每个脱氧核苷酸的顺序分析也可用相同的方式进行。1.2.2限制性内切酶在基因工程中的应用限制性内切酶可特异性地识别双链DNA中的特定碱基序列,并通过切割双链DNA中每条链上的磷酸二酯键来断裂DNA。在实际应用中,可根据需要切割DNA。但是,在自然情况下,生物体内限制酶通常不切割自身DNA分子,仅切割外源DNA。目前已经从原核生物中分离出多种限制性内切酶,且已商业化并广泛用于基因工程中,已成为重要的切割工具,是基础克隆中最重要的工具酶之一,是重组技术和基因诊断中的一类重要酶。其应用范围包括构建DNA基因物理图谱、DNA碱基序列分析、基因定位和分离、相关的DNA分子比较等。限制性内切酶的广泛使用使得基因工程技术得到飞速发展。1.3基因编辑技术基因编辑技术主要利用一种人工设计和修饰的核酸酶,在基因组水平上对靶基因进行定向切割,以实现基因敲入、敲除和定向置换的最终效果[6-8]。其作用机理是修饰的序列特异性核酸酶可以锚定到基因组的靶序列位点,从而切割靶DNA序列产生双链断裂(Double-strandbreak,DSB),并进一步诱导非同源末端连接(Non-homologousendjoining,NHEJ),这就导致基因组中碱基的插入和缺失。除了NHEJ修复外,如果在基因编辑过程中同时引入外源性目标基因的同源序列,以及同源重组(Homologousrecombination,HR)启动导入序列与目标序列之间的修复,可以实现目标基因的突变修复或产生定点插入和替换、基因叠加突变[9,7-8]。基因编辑技术发展过程中先后出现三代系统,即锌指蛋白核酸酶(Zincfingernucleases,ZFNs)[10-11]、类转录激活因子效应物核酸酶(Transcriptionactivator-likeeffectornucleases,TALENs)[12-13]和规律成簇的间隔短回文重复(Clusteredregulatoryinterspacedshortpalindromicrepeat,CRISPR)[14-15]。ZFN和TALEN都是人工融合蛋白,包含一个融合到限制性内切酶FokI的非特异性核酸酶功能域的DNA结合域。ZFN和TALEN已经成功地应用于许多生物,包括植物[16-17]。2013年以来,基因编辑主要利用CRISPR/Cas9及其改良技术手段,最近又出现CRISPR/Cas变体Cas12a(Cpf1)。CRISPR/Cas9系统基于RNA引导的Cas9核酸酶,可靶向基因组中大部分靶位点。它高效、精确地定向编辑基因组,即双链DNA分子特异性切割,导致双链DNA断裂,然后激活同源重组的修复机制或易错的非同源末端修复机制以实现基因编辑[18]。与Cas9一样,Cpf1也是由RNA引导的核酸酶,但其识别的PAM是T富集区。另外,Cpf1可能会在PAM的远端导致交错的双链断裂,从而产生粘性缺口。该蛋白的发现丰富了CRISPR系统并扩大了其在基因编辑中的应用。1.3.1锌指核酸酶技术(ZFNs)ZFNs是一种人工重组的核酸内切酶,由锌指蛋白DNA结合酶和非特异性核酸内切酶FokI构成[19-21],它是21世纪初开发的第一代基因编辑技术[22]。ZFNs的第一个成分是锌指蛋白,在真核细胞中很常见,参与转录调控和蛋白质相互作用[23]。ZFNs的第二个组成部分是FokInuclease。FokI是在黄杆菌中发现的一种限制性酶,由DNA识别和切割结构域组成[24]。FokI仅在形成二聚体时才能切割DNA[25],因此ZFNs进行基因编辑需要结合至DNA顶部和底部链的两个单体才能诱导DSB。Wright等(2005)取得重要突破,他们率先使用ZFN进行植物细胞基因编辑,证明ZFN可以用于植物基因打靶;通过利用烟草原生质体中有缺陷的选择标记基因的恢复,他们证明与随机整合相比,基因打靶频率最多可提高10-1[26]。同时,Lloyd等人(2005)证明了ZFNs可以通过NHEJ来突变拟南芥基因组中人工引入的限制性位点[27]。2009年,Wright等和陶氏化学公司独立证明,DSB诱导的HR可以利用ZFNs修饰烟草和玉米的内源基因[28-29]。在玉米中,ZFN介导玉米IPK1基因的基因打靶是以重组IPK1的表达产生抗除草剂表型的方式获得。结果表明基因打靶的频率非常高,在大多数实验中均达到10%以上[29]。1.3.2转录激活因子核酸酶基因编辑技术(TALEN)TALEN系统中关键因子是转录激活因子样效应蛋白(TALEs),是在革兰氏阴性植物病原体(如Xanthomonas)中发现的一类新型的DNA结合蛋白[30-31]。Bonas等发现细菌病原体Xanthomonas将TALEs传递到给宿主[32]。且该蛋白质带有与各种植物启动子结合的DNA结合域[13,33-34]。DNA结合域由一系列不同数量的重复单元组成,每个重复单元由33-35个高度保守的氨基酸残基组成,仅第12、13位的氨基酸具有不同的重复序列,且单体存在差异,该位点称为重复可变双氨基酸残基(Repeatvariablediresidues,RVD),它们负责DNA特异性识别。由于每个RVD识别不同的DNA碱基,例如,NI识别A、HD识别C、NG识别T和NN识别G,因此,RVD的差异也就决定了TALE对DNA识别的特异性[12,35-36]。TALEN系统由包含核定位信号的N末端结构域,识别特定DNA序列的中央结构域和具有FokI核酸内切酶功能的C末端结构域组成。与ZFN相似,TALEN通过TALE元件与DNA序列特异性结合,FokI切割形成DSB,特定序列的转化由NHEJ或HR完成。研究表明,TALENs在植物基因工程中具有很好的潜在用途[37-38]。Li等通过TALEN介导将突变基因导入水稻OsSWEET14基因的启动子已证明基于病原体的转录因子的结合基序被破坏,这导致水稻抗病性的增强[39]。Wright等利用TALENs在多达30%的转化烟草原生质体中引入ALS基因的靶向突变[26]。同时,Wright等[26]还利用供体模板在烟草中进行了TALEN介导的基因打靶实验,该供体模板在ALS和YFP标记基因之间产生了基因融合。这使得利用流式细胞术测定YFP荧光定量的基因打靶效率成为可能。且基因打靶的频率高达14%。最近,TALENs也已被用于短孢子虫[40]和大麦[41]中进行定向编辑。1.3.3规律成簇的间隔短回文重复/效应蛋白(CRISPR系统)CRISPR技术最早于1987年在大肠杆菌K12iap基因侧翼序列中被发现[42],2002年被命名为串联间隔短回文重复序列(clusteredregularlyinterspacedshortpalindromicrepeats,CRISPR)[43]。Cas9蛋白与单向导RNA(Single-guideRNA,sgRNA)结合不仅具有识别功能,而且还具有切割功能。由于Cas9独特的RNA-DNA识别机制,靶向特定位点变得简单,尤其是在同时编辑多个靶标时,CRISPR-Cas9基因编辑技术与ZFNs和TALENs前两代技术相比,操作步骤大大简化,编辑效率显著提高[44]。此外,在CRISPR-Cas9基础上还开发出多种基因编辑技术,将切割活性缺失型的Cas9与其他效应蛋白结合在一起进行基因定位、激活、抑制甚至定点诱变[45-48]。ZetscheB等(2015)发现CRISPR家族Type2V成员Cpf1不仅具有良好的DNA靶向切割活性[49],而且还具有与CRISPR-Cas9显着不同的编辑特性[49-55]。Cpf1识别的PAM(protospacer-adjacentmotif)序列富含T,与Cas9识别的NGGPAM互补,大大扩展了第三代基因编辑技术的应用范围。就突变类型而言,与倾向于形成单个碱基插入缺失(Indel)的CRISPR-Cas9系统不同,CRISPR-Cpf1编辑系统倾向于产生几个碱基甚至大片段的缺失。以上两种CRISPR编辑系统已迅速应用于多个物种。1.4CRISPR/Cas9系统1.4.1CRISPR/Cas9的发现及分类CRISPR/Cas是细菌和古细菌进化出的一种适应性免疫系统,用于失活入侵的外来病毒和DNA中的基因功能。CRISPR/Cas主要由CRISPR序列元件和Cas基因家族蛋白组成。其中,CRISPR是“簇规则间隔短回文序列”的缩写形式,由29bp的重复序列和32-33bp的非重复序列组成,其结构稳定,由短而高度保守的前导序列,重复序列和间隔子组成[56];而Cas则代表的是CRISPRRNA(crRNA)结合蛋白,具有切割DNA序列的能力[43]。CRISPR/Cas系统包含I-VI等6种类型[57]。I型系统的特征蛋白Cas3含有用于降解靶标的DNase和解旋酶结构域,III型CRISPR/Cas系统的特征蛋白Cas10则具有RNase的活性[58]。II型CRISPR/Cas系统包含Cas1、Cas2、Cas9和第4个成员Csn2或Cas4。其中,Cas9是II型CRISPR/Cas系统的标志性基因,其编码的蛋白质除了在crRNA生物合成中起作用,同时在切割外源DNA方面也起着至关重要的作用。CRISPR/Cas9系统由crRNA,反式激活crRNA(tracrRNA)和Cas9蛋白等3部分组成[59]。1.4.2CRISPR/Cas9的机制CRISPR/Cas9由于其简单性、多功能性和专一性,已成为研究基因功能和改善农作物的重要生物技术工具[60]。Cas9具有RuvC和His-Asn-His(HNH)两个DNA切割结构域,其断裂的双链DNA(double-strandedDNA,dsDNA)位点主要位于PAM序列上游3bp处[61]。HNH结构域切割crRNA的互补链,而RuvC样结构域切割dsDNA的相反链[62]。因此,CRISPR/Cas9使用易错的NHEJ或HR机制在体内修复DNA。NHEJ通常会导致DNA在切割位置随机插入缺失,而HR通过在预测的DSB位点添加具有序列同源性的供体DNA模板来实现供体序列(donorfragment)插入或基因替换[61]。Cas9与crRNA和tracrRNA建立核糖核蛋白(ribonucleoprotein,RNP)复合物来有效地切割DNA。crRNA在匹配和识别靶标DNA中起至关重要的作用。它包含一个序列,该序列通过与靶DNA的碱基配对将Cas9RNP引导至特定基因座,形成一个R环。R环的形成激活了HNH和RuvC样核酸内切酶结构域,分别用于切割DNA的靶链和非靶链,形成DSB[63]。tRNA与募集到复合物中的crRNA和Cas9蛋白结合[64]。gRNA是由tRNA和crRNA组成的嵌合分子,由一个18-20-nt间隔序列与PAM附近的靶DNA互补而形成。PAM是一个3-nt(NGG)序列,位于sgRNA目标位点的下游,在和Cas9结合介导的DNA切割中起着至关重要的作用[65]。因此,CRISPR/Cas9基因编辑分三步进行:(1)核定位Cas9蛋白的表达;(2)生成含有20-nt与靶基因互补的gRNA;(3)需要NGGPAM位点识别,且该位点必须位于靶位点3’末端附近。在sgRNA的指导下,sgRNA和Cas9在基因组中搜索靶标,并在PAM位点上游约3bp处产生平末端DSB[66]。1.4.3CRISPR/Cas9的应用CRISPR/Cas9具有不同的识别位点,可同时编辑多个位点而无需二聚化。Cas9蛋白有与FokI酶相似的功能,具有高基因编辑效率,低细胞毒性以及对靶位点精确编辑,靶位点外不会发生基因突变,还具有易操作和稳定遗传优势[67]。CRISPR/Cas9技术已广泛用于编辑多种植物功能基因,包括拟南芥[68]、水稻[69]、玉米[70]、大豆[71]、高粱[72]、棉花(陆地棉)[73-74]、番茄[75]和马铃薯[76]等。在拟南芥原生质体中,基于NHEJ的靶向编辑效率高达5.6%,而在烟草细胞中高达38.5%[77]。2015年,CRISPR/Cas9介导的大豆基因组编辑首次取得成功[78];李东昊等(2017)使用CRISPR系统同时编辑水稻系统中8个功能基因,证明CRISPR系统可以同时靶向并敲除多个基因,实现多基因同时编辑[79]。Li等使用CRISPR/Cas9编辑棉花GhMYB25-likeA和GhMYB25-likeD基因,两个基因靶点的编辑效率分别是14.2%至21.4%[80]。1.5CRISPR/Cas12a(Cpf1)1.5.1CRISPR/Cpf1的发现及结构CRISPR/Cas12a(Cpf1)属于II类CRISPR系统,由RNA引导。该系统主要由弗朗西斯氏菌属(Francisella)的FnCpf1,氨基酸球菌属(Acidaminococcus)的AsCpf1和毛螺菌科(Lachnospiraceae)的LbCpf1组成,3者均具有DNA核酸内切酶活性。其中FnCpf1与CRISPR/Cas9类似,但表现出一些独特的特征[49]。Cpf1由单个crRNA引导,并利用富含T的PAM序列切割靶标dsDNA[49]。Cas9切割DNA产生平末端,Cpf1在PAM的远端位置生成末端交错的DSB,这可能具有一定的优势,尤其是在进行基因功能敲入时,可能会提高基于NHEJ机制的敲入效率[81]。1.5.2CRISPR/Cpf1作用原理Cas9利用HNH和RuvC核酸内切酶结构域分别切割目标和非目标DNA链[82]。而Cpf1由一个RuvC核酸内切酶结构域和一个可切割DNA的Nuc结构域组成[83],并以Nuc域替换了Cas9切割的DNA链的HNH核酶域[84-85,83]。另有报道,Cpf1可作为一种将前体crRNA剪切为成熟crRNA的RNase[86],并已被用于处理植物中基因编辑的crRNA阵列[87],这些特征提高了Cpf1切割位点的插入效率[88]。由crRNA引导的Cpf1与特定PAM附近的DNA靶序列结合,催化DNADSB,激活细胞内NHEJ或HR修复机制,并实现诸如基因敲除、插入和替换的编辑效果[84,89-91,83,92-93]。与Cas9在PAM位点附近引入双链断裂并产生平末端不同[82],Cpf1切割PAM位点远端的DNA并产生5-nt粘性末端[49]。这一特性使Cpf1成为有效的体外DNA拼接的工具,并基于Cpf1消化和T4DNA连接酶介导连接建立DNA拼接标准,即C-Brick[94]。值得注意的是,C-Brick标准既能识别长DNA序列,又能在部分之间产生短疤痕,具有广泛的应用潜力。为进一步探索Cpf1识别和剪切RNA和DNA的机制,研究者从相关结构对其进行了分析,并比较了其与Cas9的异同。Dong等[95]分析了LbCpf1-crRNA二元复合物的晶体结构,表明该复合物为双叶结构,具有三角形外观,且复合物中央带有带正电的通道。与以扩展构象结合Cas9的sgRNA不同,crRNA是高度失真的构象,一旦被Cpf1蛋白中间的寡聚核苷酸结合域(oligonucleotidebindingdomain,OBD)识别,就会导致Cpf1的松散构象形成紧凑的三角结构。此时,位于蛋白质中心的带正电荷的通道可以接受crRNA和靶序列形成的异源双链体,从而促进下一步反应的进行。据推测,OBD的环状螺旋(looped-outhelicaldomain,LHD)结构域与识别双链DNA底物的PAM序列有关。Stella等[84]确定了三链R环(“R”茎环)结构,对明确FnCpf1准确识别靶DNA序列等相关分子机制具有重要的意义。1.5.3CRISPR/Cpf1的编辑特点与Cas9的机制和结构特征不同,Cpf1不仅在基因编辑中具有更好的切割活性和更高的特异性,而且在多基因编辑中也具有更显著的优势。1.5.3.1用于切割目标DNA的CRISPR/Cpf1位点与Cas9使用RuvC和HNH结构域进行平末端切割不同,Cpf1则用RuvC和Nuc结构域将靶DNA的第23位互补链和第18位非互补链作为靶标,以产生交错的切割粘性末端[95]。除了切割靶DNA的互补链外,Lei等[96]还增加了Cpf1的切割特性。不仅靶标DNA的互补链的23位被切割,而且非互补链的第18位也被切割,并且在非互补链的14至18位形成多个切割位点。此外,还发现Cpf1的切割位点受crRNA间隔子序列长度的影响。当间隔序列的长度大于或等于20时,Cpf1倾向于切割非互补链的第18位;当间隔子序列长度小于20时,Cpf1倾向于切割非互补链的14位。此特性有助于插入新的DNA序列,并使Cpf1更有效地激活HR[93]。同时,Cpf1能在较短间隔子长度的crRNA介导下特异性切割靶DNA的第14与22位,形成8-nt长黏性末端的特征,结合具有高精度连接特性的TaqDNA连接酶,将其开发为体外无缝编辑大型DNA片段的新工具。15.3.2CRISPR/Cpf1对PAM选择范围Cas9蛋白倾向于含G的PAM序列,而5'-NGG-3'PAM在选择CRISPR-Cas靶序列中的作用非常有限。相反,16种Cpf1家族蛋白都显示出对富含胸腺嘧啶的PAM的选择偏好性[49,97-98]。TuM等[91]发现,FnCpf1对PAM序列的识别可以延长到5'-KYTV-3'。因此,Cpf1的应用开发使基因编辑的选择范围扩大,尤其是它编辑富含嘧啶的PAM的靶位点更具优势。1.5.3.3CRISPR-Cpf1的特异性Cpf1不仅具有更好的切割活性,同时也具有更高的特异性。体外实验中,Kleinstiver等[99]使用GUIDE-seq分析来比较AsCpf1、LbCpf1与SpCas9的脱靶条件。大多数脱靶位点中,Cpf1插入缺失的频率小于0.1%。与SpCas9相比,Cpf1几乎没有脱靶的现象,对基因编辑特别是基因治疗来说更重要[90,99,100]。1.5.3.4CRISPR/Cpf1对多基因的编辑Cpf1丰富了CRISPR家族,Cpf1又以其独特的编辑功能成为Cas9技术的重要补充。基因组功能研究、遗传育种和其他过程中需要多基因突变体,因此使用CRISPR技术对多基因进行编辑非常重要。尽管已经报道Cas9可用于多基因编辑,例如核糖核酸酶和Cas9共表达策略以及转运RNA(tRNA)和导向RNA策略的组合[101-103],但这些策略在设计、成本或经济上仍然不方便,限制了Cas9在多基因编辑中的应用。Cpf1则在很大程度上弥补了Cas9在多基因编辑中的缺点。而且与Cas9相比,Cpf1在多基因编辑中具有以下优点:(1)Cas9切割DNA需要两个小RNA分子,而Cpf1只需一个RNA分子;(2)Cas9切割可形成平末端,而Cpf1形成粘性末端,粘性末端比平末端更易于操作;(3)Cpf1切割距离识别位点较远,选择范围较宽;(4)Cpf1可以识别连续2或3胸腺嘧啶(T)的PAM序列,从而扩展基因编辑范围;(5)Cpf1除了能对DNA切割外,同时也能对RNA切割,有利于构建多基因编辑载体[104,55]。由于Cpf1仅依靠crRNA即可完成基因组编辑且可独立介导pre-crRNA的加工而无需其他分子的干预,RNA的加工能力又独立于DNA剪切功能[49]。利用Cpf1的这一独特功能,Zetsche等[55]设计一个CRISPR阵列,对HEK-293T细胞中的DNMT1、EMX1、VEGFA和GRIN2b等4个基因同时编辑,并对小鼠大脑中的DRD1、MECP2和NLGN33等3个基因同时编辑成功。1.5.4CRISPR/Cpf1的应用CRISPR/Cas9已广泛应用于遗传育种、基因治疗等领域,而Cpf1系统具有多个编辑特点,因而有望成为与Cas9特性互补的一种新基因编辑工具。Kim等[105]使用AsCpf1和LbCpf1以RNP的形式编辑大豆FAD2基因和烟草AOC基因。Cpf1产生更多的基因功能缺陷类型,且显示出更精确的靶向特异性,也就是说,在每个可能的脱靶位点都没有发现脱靶现象;同时还利用LbCpf1/AsCpf1在烟草叶片原生质体对烟草茉莉酸酯合成酶基因ALLENOXIDECYCLASE(AOC)编辑成功。Yin等使用CRISPR/Cpf1系统研究控制水稻叶片气孔密度的OsEPFL9基因,以OsEPFL9第一个外显子作为基因编辑的靶标位点,结果表明,基因编辑阳性水稻植株的远端表面的气孔密度降低8倍以上[106]。Wang等在3个水稻基因中选择6个位点,比较FnCpf1和LbCpf1的活性,发现Cpf1均可实现有效突变,且FnCpf1的活性低于LbCpf1[107];同时,Wang等还设计由4个crRNA单元组成的crRNA矩阵序列,分别编辑OsRLK和OsBEL基因,每个位点的敲除效率在40%-75%之间。Hu等也利用Cpf1多基因编辑系统成功地编辑多个水稻基因[108]。Cpf1系统在水稻实现简单有效的多基因编辑,扩展了CRISPR系统在植物中的应用,并为水稻基因组编辑提供了新的工具。1.6研究的目的与意义限制性内切酶通过特异性地识别双链DNA中的特定碱基序列,而且只能识别一个特定位点;同时,限制性内切酶只能剪切DNA,而不能同时对剪切后的DNA片断重新连接。尽管基因编辑技术不断发展,但仍存在一些不足。首先,目前应用最广泛的CRISPR/Cas9技术一般情况下只能执行基因功能敲除,不能有效地使用同源重组和其他方法来取代基因片段和“敲入”基因功能。最后,尽管CRISPR/Cpf1的PAM与大多数CRISPR/Cas9不同之处在于它在5'端富含T序列,但对PAM序列相对固定的要求也限制了Cpf1在实际应用中对靶标的选择。而我们在前期实验中发现一种未曾报道过的DNA剪接新机制,即DNA片段在PCR扩增过程中,可以将两个相同的正向重复序列剪切后重新拼接在一起,形成新的较短的序列。本研究旨在统计分析这种新的剪接机制的结果,并作进一步的验证。这种DNA自我剪接的机制将有可能应用于基因编辑技术体系,在受体生物特定DNA中和供体DNA同时进行定向剪接,实现对基因功能的“敲入”,从而有可能实现DNA片断定向替换的基因编辑目的,为未来基因编辑技术提供新的思路和方向。1.7研究内容本实验选取不同大小的DNA分子片段,这些片断均包含一段特定的发夹结构。我们发现,这些DNA片断在体外PCR扩增过程会发生自我剪切(cleavage)和拼接(splice)。回收剪接后的产物,进行二代高通量测序,对测序结果数据库(cleandata)中进行分析:首先在原始的DNA序列里查找到各种正向短重复序列的位置,设想两两序列之间进行剪切再拼接,于是得到拼接后的序列,然后用这些预期拼接后的序列在cleandata中进行比对与读数的查找(blast),记录其剪接序列的读数,对部分有读数的剪接序列做进一步的验证分析。第二部分试验材料与方法2.1试验材料与试剂2.1.1植物材料水稻品种日本晴叶片。2.1.2质粒包括NJZL(2.3kb)、F7869(1.0kb)、F2-28(2.1kb)等3个质粒,均为带有特定发夹结构(大约500bp)DNA的T-载体质粒。2.1.3试验试剂PCR扩增MIX(南京诺唯赞)、胶回收试剂盒(天根)、琼脂糖、TAE电泳缓冲液、LB培养基、胰蛋白胨、酵母提取物、氯化钠、琼脂、氨苄青霉素、T-载体连接试剂盒(生工)、Trans1-T1感受态细胞(全式金)、CTAB、质粒提取试剂盒(Megan)。2.1.4主要试验试剂的配制LB液体培养基(400ml):胰蛋白胨(4g)、酵母提取物(2g)、氯化钠(4g);固体培养基再加入琼脂(6g)。将以上成分混匀后,加入400ml的超存水,灭菌20min。氨苄青霉素:5g Ampicillin置50ml塑料离心管中,加入40mlddH2O,充分混合溶解之后定容至50ml, 0.22μm滤膜过滤除菌,小份分装(1ml/管)后,置于20℃保存。2%CTAB:CTAB(20g/L)、NaCl(81.82g/L)、0.5mol/LEDTA(pH=8.0,40mL/L)、1mol/LTris-HCl(pH=8.0,100mL/L),用去离子水定容至1000mL。2.1.5试验仪器表1实验仪器信息Tab.1InformationofExperimentalInstrument仪器名称来源HH-6数显三用恒温水箱科析仪器HC-2518高速离心机中科中佳D1008E高速离心机SCILOGEX移液枪GILSON培清JS-780全自动凝胶成像分析仪培清超纯水机Kertone超低温冰箱Thermo超净工作台苏净安泰DYY-6C型电泳仪北京六一PCR扩增反应离心管BIOGI54DWS立式压力蒸气灭菌锅ZEALWAYT-100PCR扩增仪BIO金属浴COYOTEWD-9403X蓝光观察仪北京六一智能恒温培养振荡器(HNY-2102C)天津欧诺电子天平(LQ-A1002)上海科平2.2试验方法2.2.1水稻叶片DNA的提取(CTAB)(1)取适量水稻叶片,12000rpm离心1min;(2)加700µl的CTAB在65℃水浴锅加热45min,后加700µl氯仿,12000rpm离心15min,吸上清;(3)2倍体积100%乙醇,-20℃冷冻30min,12000rpm离心15min,弃上清;(4)700µl的70%乙醇洗涤2次(每次12000rpm离心15min,且均弃上清);(5)空离2min,吸出液体,65℃水浴锅凉5min,加100µl纯水溶解5min,振荡摇匀,12000rpm离心30s,收集DNA。2.2.2构建目的基因载体由金斯瑞生物科技有限公司合成并构建分别含有3个不同长度DNA片段的质粒载体。每个DNA片段除了含有特定的发夹序列(500bp)外,且不同长度的DNA片段也含有不同的组成结构。2.2.3PCR扩增体系(1)PCR扩增采用25µl的PCR反应体系:DNA模板1µl、5ʹprimer1µl、3ʹprimer1µl、VazymeGreenMix酶12.5µl和ddH2O9.5µl。PCR的反应条件设置为:94℃预变性5min,94℃变性30s,退火温度55-58℃退火30s,72℃延伸30s-150s,设置28-32个循环(温度、时间和循环数主要根据引物的长度大小和酶的扩增效率来确定),72℃终延伸5min,12℃保存。(2)琼脂糖凝胶电泳检测PCR产物制胶体系:琼脂糖2g、缓冲液100ml,配置好后晃动锥形瓶混匀,放置在微波炉中加热至全部溶解,取出待不烫手后加入核酸染料5µl,插入梳子等待凝固。琼脂糖凝胶完全凝固后放入电泳池中,在胶孔第一个位置加入DNAladderMaker,其他位置按照顺序每个孔5µl的PCR扩增产物,120V、100mA,跑样50min,电泳结束后在紫外成像仪下进行观察,通过DNAladderMaker大小鉴定是否为需要的DNA条带,然后切出目的条带割胶回收。2.2.4PCR产物割胶纯化回收根据电泳结果割胶回收目的条带,操作步骤如下:(1)割胶目的条带,称重加等体积PN溶液,50℃水浴(注意:如果直接纯化,则按1:3比例加入PN溶液);(2)500µl的BL溶液于CA2吸附柱中,12000rpm离心1min弃废液;(3)将步骤(1)所得溶液室温放置2min后加入CA2吸附柱中静置2min后12000rpm离心1min弃废液;(4)加600µl的PW漂洗液室温静置5min,12000rpm离心1min弃废液,此步骤重复2次;(5)12000rpm空离2min,之后室温静置15min;(6)将吸附柱放在一个新的且干净离心管中,加40µlddH2O,静置2min,离心2min,得到回收产物,置于-20℃保存。2.2.5PCR回收产物T-载体连接回收产物连接T-载体体系:2×RapidLigationBuffer5µl、PGEM-TEasyVector1µl、PCRProduct3µl和T4DNALigase1µl,之后4℃连接过夜。2.2.6转化回收产物4℃连接过夜后,转化Trans-T1感受态细胞,具体转化步骤如下:(1)从-80℃冰箱取出适量Trans-T1感受态细胞于冰上解冻;(2)解冻后取5µl连接产物于50µl感受态细胞,轻混匀,冰浴30min;(3)冰浴后,42℃水浴锅中热击30s,在冰浴2min;(4)加500µl的LB(不含Amp)液体培养,37℃、200rpm摇床中振荡培养1h;(5)吸80µl细胞悬液均匀涂在(含Amp)LB固体培养基上;37℃培养平板过夜。2.2.7阳性克隆鉴定(1)在含Amp抗性的LB固体平板上挑取单克隆菌落,将其接种于含500µlAmp抗性的LB液体培养基中,在37℃、200rpm摇床中振荡培养5h左右;(2)取1µl菌液,用相对应的引物配对进行菌落PCR的鉴定。(3)PCR扩增结束后进行凝胶电泳检测,将获得的阳性克隆单株测序。2.2.8质粒提取(1)目的菌种接种培养过夜摇菌培养,1000rpm离心1min弃培养基;(2)250µlBufferP1,高速重悬细菌;(3)250µlBufferP2,颠倒混匀8-10次;(4)350µlBufferNP3,颠倒8-10次彻底中和,13000rpm离心1min;(5)上清液放入收集管中,13000rpm离心1min;(6)弃废液,加500µlBufferPW1,13000rpm离心1min;(7)弃废液,加600µlBufferPW2,13000rpm离心1min,重复操作该步骤;(8)弃废液,13000rpm离心2min;(9)80µlElutionBuffer,静置1min,13000rpm离心1min洗脱DNA,质粒-20℃保存。2.2.9高通量测序把1F2R、NJZL、F7869和F2-28的PCR扩增产物分别进行高通量测序。其中1F2R和NJZL的高通量测序由武汉博越致和生物科技有限公司完成,而F7869和F2-28的高通量测序由杭州联川生物技术有限公司完成。高通量测序前处理:包括片断打断处理和不打断处理。加上通用接头,均连接到通用测序载体上,进行高通量测序。测序数据整理:对通过高通量测序得到大约6000000条测定的序列(rawdata),剔除通用载体序列后得到cleandata数据库。2.2.10正向重复序列(directrepeats)整理打开DNAStar中Editseq软件,分别在DNA片断1F2R(1.49kb)、NJZL(2.3kb)、F7869(1.0kb)、F2-28(2.1kb)原始序列中找到所有正向重复序列及其位置,用于分析那些预期的正向重复序列两两之间的剪切和拼接。2.2.11剪切和拼接结果的查找根据原始DNA序列里正向重复序列的数量和位置,设想两两之间剪切且拼接可形成一个新的较短的序列。将剪切拼接形成的序列在cleandate中进行读数的查找(blast),分别统计四个DNA片段正向重复序列两两之间剪切拼接后形成新的较短的序列的读数(reads)。2.2.12验证有读数的剪接序列对部分读数的剪接序列,在PrimerPremier5软件中设计验证所需的特异引物,并合成设计的引物(生工生物有限公司)。用设计合成的特异引物进行PCR的扩增,凝胶电泳检测后回收目的条带,将回收产物连接T-载体并转化大肠杆菌、挑取单克隆,同时对挑取的单克隆菌株进行菌液PCR的鉴定,将鉴定出的阳性单克隆菌株测序。2.2.13高通量测序中重组序列的验证特异引物进行PCR扩增,凝胶电泳检测后,将目的条带割胶回收,回收产物进行T-载体连接、转化大肠杆菌、挑取单克隆,并对挑取的单克隆菌株进行菌液PCR的鉴定,鉴定出的阳性菌株测序。第三部分结果与分析3.11F2RDNA片断PCR过程中剪接结果的统计分析3.1.1DNA片断序列结构1F2RDNA片断全长约1.49kb(图2B),其中包含1段长约500bp特定的发夹结构,即可以产生反向互补的回文结构(图2A)。3.1.21F2RDNA片断高通量测序引物序列:1F:5’AGTTGCTGAGGTTCGTTTGG3’2R:5’TGGAGGTTCTTGAGGCAGTT3’以水稻基因组DNA为模板,特异引物1F和2R配对进行PCR扩增。电泳结果可以看出,有最亮的1.49kb条带。同时,该条带下面还有2个亮度清晰的条带,分别是大小为1.226kb和0.264kb的条带(图2C)。我们将1.49kb条带下面的1.226kb条带回收,连接到T载体并转化大肠杆菌,挑单克隆,用通用引物M13F和M13R对T载体质粒测序。将测序结果在DNAStarMegalign软件和Chromas峰形图软件中与原始序列进行仔细的比对和分析,我们发现该1.226kb片断是由于1.49kb片断在两对正向重复序列之间分别进行剪切后再拼接形成的:一种是在1.49kb原始序列内3个GCAGC位点中第1个和第3个之间进行剪切再拼接(图2D);二是在1.49kb原始序列内3个TGTAGCC位点中第1个和第2个之间进行剪切再拼接(图2E)。这两种剪切方式中均会有一段0.264kb的中间片断被切除下来(图2D(c);2E(c))。这种特殊的DNA片断体外剪切和拼接机制以前未曾报道过。同时,我们还观察到,除了1.49kb、1.226kb和0.264kb这3条亮的PCR产物条带外,电泳图还有其他相对比较弥散的条带。这些结果促使我们作进一步的设想:在体外PCR扩增过程中,1.49kb片断中其他任意2个正向重复序列之间是否也会发生类似的剪切和拼接呢?也就是说,这种DNA片断体外剪切后拼接的机制是否具有普遍性呢?为了验证这个猜想,我们将1.49kb于DNA片断作模板扩增的所有PCR产物混合回收,进行高通量测序,对这个特殊的剪切和拼接机制进行更深入的分析与验证。图2PCR扩增1F2R(1.49kb)DNA片段时在2对正向重复序列(GCAGC或TGTAGCC)位点处进行自我剪切和拼接(A)500bp发夹结构示意图;(B)1F2R(1.49kb)DNA片断序列结构;(C)PCR扩增1F2R(1.49kb)DNA片段的凝胶电泳以及可能由1F2R(1.49kb)DNA片段PCR扩增过程中的自我剪切、拼接或缺失产生的较小DNA片段;(D)(a)由1F2R(1.49kb)DNA片段PCR扩增过程中自我剪切和拼接产生的1F2R(1.49kb)(WT)和CSF1(1.226kb)DNA片段在Megalignment中的部分对比结果;剪切和拼接位点在1对正向重复的GCAGC上(第1和第3个位点,浅蓝色下划线);(b)1.226kbDNA片段的部分色谱图;(c)PCR扩增1F2R(1.49kb)DNA片段的自我剪切和拼接机制的示意图,自我剪切和拼接后仅有的正向重复序列GCAGC用浅蓝色表示;(E)(a)1F2R(1.49kb)(WT)和CSF1(1.226kb)DNA片段在Megalignment中的部分对比结果;后者是由前者中1对正向重复序列TGTAGCC(第1和第2个位点,蓝色下划线)之间的自我剪切和拼接产生的;(b)1.226kbDNA片段的部分色谱图;(c)PCR扩增1F2R(1.49kb)DNA片段的自我剪切和拼接机制的示意图,自我剪切和拼接后保留的正向重复序列TGTAGCC用蓝色表示。在(D)和(E)中,相同颜色的下划线表示相同的碱基序列。Fig.2Self-cleavage-and-spliceatpairofdirectrepeats,GCAGCorTGTAGCC,inthe1F2R(1.49kb)DNAfragmentduringPCRamplification(A)Schematicdemonstrationofthe500bphairpin;(B)Structureof1F2R(1.49kb)DNAfragmentsequence;(C)AgarosegelelectrophoresisofPCR-amplified1F2R(1.49kb)DNAfragmentalongwithsmallerDNAfragmentsprobablyresultingfromself-cleavage-and-spliceordeletionduringPCRamplificationof1F2R(1.49kb)DNAfragment;(D)(a)PartialmegalignmentoftheDNAfragmentsof1F2R(1.49kb)(WT)andCSF1(1.226kb)resultingfromself-cleavage-and-spliceof1F2R(1.49kb)DNAfragmentduringPCRamplification.Thecleavage-and-splicesiteisatthepairofdirectrepeatGCAGC(thefirstandthirdcopies,lightblue-underlined);(b)Partialchromatogramof1.226kbDNAfragment;(c)Schematicdemonstrationoftheself-cleavage-and-splicemechanismof1F2R(1.49kb)DNAfragmentduringPCRamplification.TheonlydirectrepeatGCAGCremainingafterself-cleavage-and-splicewascoloredinlightblue;(E)(a)PartialmegalignmentoftheDNAfragmentsof1F2R(1.49kb)(WT)andthearound1.226kb(CSF2);thelaterresultedfromtheself-cleavage-and-spliceatpairofdirect-repeatTGTAGCC(thefirstandsecondcopies,blue-underlined),intheformer;(b)Partialchromatogramofthearound1.226kbDNAfragmentsasshowninB;(c)Schematicdemonstrationoftheself-cleavage-and-splicemechanismof1F2R(1.49kb)DNAfragmentduringPCRamplification.TheonlydirectrepeatTGTAGCCremainingafterself-cleavage-and-splicewascoloredinblue.In(C)and(D),thesame-coloredunderlinesannotatingbasesequencesrepresentedidenticalsequences.3.1.3正向重复序列(directrepeats)位点的整理在对高通量测序结果的序列库(readdatabase)进行查找和比对之前,首先我们对1F2R(1.49kb)原始序列中所有的正向重复序列列出清单。表2列出1F2R(1.49kb)片断中部分正向重复序列的位置,其余的正向重复序列位置统计附表A。可以发现,在1F2R(1.49kb)序列中,有较多的正向重复序列,碱基数呈现出5-20bp不等。表21F2R(1.49kb)片断中部分正向重复序列位置Tab.2Partiallistofdirectrepeatsin1F2R(1.49kb)DNAfragment碱基数(bp)正向重复序列位置1位置2位置3位置4位置5位置6位置75GTAGG119412546GTTTTA2494244364607077AAAACTA1942262592903834148ATCTGTAG4845776406697007669ATTGGCTAT86087210AAATCTGTAG57563866776411ACAAAACTACA19222425728838112ATCTGTAGTTTT48457764066970013TGTAGTTTTGTGA48751955158061164367214CTGTAGTTTTGTGA48655057964267115TGTAGTTTTGTGATA58061167217TCACAAAACTACAGGTA19025518TTTATCACAAAACTACAG21825137519AATCTGTAGTTTTGTGATA48357666820TTAAATCTGTAGTTTTGTGA5736363.1.4两个正向重复序列之间的剪接结果统计获得高通量测序结果后,我们先设想1F2R(1.49kb)体外PCR扩增过程中,如果两个相同的正向重复序列剪切后重新拼接后形成新的较短序列,保留一个重复序列。然后我们利用这个假设产生的新序列在数据库里进行比对,查找数据库里面是否存在这样对应的序列读数。结果发现,对于大部分正向重复序列来说,数据库中确实存在两个正向重复序列之间剪切后再拼接形成的新的较短序列读数。通过在高通量测序数据库中查找这些设想可能通过以上所描述的剪切拼接机制产生的剪接序列,我们发现,这些剪接序列存在与否的情况是:读数(read)为0,表明可能相应的两个重复序列之间没有发生剪接事件(event);二是剪接序列有一定数量的读数(reads),表明相应的两个重复序列之间发生剪接事件。我们对部分有读数的序列做进一步的验证分析。表3列出1F2R(1.49kb)片断中部分正向重复序列剪接的结果,剪接序列中所有的红色和黑色标记均指代不同的碱基序列,其中红色标记均为正向重复序列的本身,而两边的黑色标记是各自的正向重复序列两边的序列。其余1F2R(1.49kb)片断正向重复序列两两位点之间剪接结果的统计附表B。表31F2R(1.49kb)片断中部分正向重复序列剪接结果的统计Tab.3Resultstatisticsofcleavage-and-spliceof1F2R(1.49kb)DNAfragmentbetweensomepairofofdirectrepeats正向重复序所在位置及个数剪接位点剪接序列读数(reads)NJZL-1R1NJZL-1R2NJZL-2R1NJZL-2R2AGTGTCT3个(240-365-397)1-2GATTTAGTGTCTTCATT3032011-3GATTTAGTGTCTCCATT158342-3CATTTAGTGTCTCCATT333501ATTTAGTGT3个(236-329-361)1-2TACAGATTTAGTGTATTCG37001-3TACAGATTTAGTGTCTTCA3428012-3TATAGATTTAGTGTCTTCA13400AGAGA3个(742-744-1208)1-2AAGGAAGAGAAGAGC00001-3AAGGAAGAGAAATTA00002-3GGAAGAGAGAAATTA0000TTTATCACAAAACTACAG3个(218-251-375)1-2TACAATTTATCACAAAACTACAGGTACT43001-3TACAATTTATCACAAAACTACAGATTCA3027102-3TTCGTTTTATCACAAAACTACAGATTCA11604注:红色标注序列为剪接后保留的一个重复序列本身,红色标注序列两端分别为剪接处两个正向重复序列中前一个重复序列的前端序列和后一个重复序列的后端序列。3.1.51F2R内正向重复序列GTAGG之间剪接验证的结果(1)设计引物的序列:ctcgatctcgtaggggaagtagaaggaagtagaagaggaaaggatgttgagatgaacattgggataagggtggtgaggcttagatcggaggcggtgatggagcttcgaccatgtggcgacactattgaaaagtattggacaagggtgtttgcgttggcgtggccatggaggtccagacaacggatgcttcacatcttggtgtggttgcgagtggcggcgatggacagggcaggcacaactgcctcaagaacctcca(2)引物序列:GTAGGF1:5ʹCTCGATCTCGTAGGGGAAGTAGAA3ʹGTAGGR1:5ʹGGAGGTTCTTGAGGCAGT3ʹGTAGGR2:5ʹTGTGAAGCATCCGTTGTC3ʹ注:GTAGGF1为正向重复序列两两之间剪切拼接的序列前期的位点统计结果表明,原始序列里只有两个GTAGG位点,分别是1194和1254。以水稻基因组DNA为模板扩增1F2R(1.49kb)片断的回收产物为模板,引物1F和2R配对PCR扩增产物作为验证GTAGG剪接序列的模板。引物GTAGGF1和GTAGGR1(目的条带大小254bp)、GTAGGF1和GTAGGR2(目的条带大小192bp)分别配对来验证这2个位点之间否真的存在剪切拼接的情况。凝胶电泳结果中,我们可以看到这两种引物搭配都有扩增条带(图3A),且都与预期的目的条带大小接近,这进一步说明该重复序列之间有可能存在有和GCAGC(1-3位点)和TGTAGCC(1-2位点)相似的剪接情况。为了进一步验证这个相似的剪接情况,我们把GTAGGF1+GTAGGR1搭配所扩增出来的条带割胶回收连接T-载体并转化大肠杆菌、挑选20个单克隆。对挑取的单克隆用GTAGGF1+GTAGGR1引物进行菌液PCR鉴定,可以看到20个单克隆菌株中有16个菌珠DNA模板扩增出预期大小的DNA条带(图3B)。挑取4个单克隆菌液PCR产物测序。将测序结果在DNAStarMegAlign软件中与原始序列进行比对分析,发现所测序的4个PCR产物中有3个是在预期位置,即1194-1254之间剪接形成的(图3C)。表明GTAGG的2个位点之间存在剪接机制。由于我们并不能确定这个新的剪接机制是否具有普遍性,且1或2个正向重复序列的剪接结果也不能说明这个新的剪接机制就一定具有普遍性,于是我们又继续对1F2R(1.49kb)DNA片断里的其他正向重复序列进行了分析与验证。图3正向重复序列GTAGG之间剪接验证(A)以1F2R(1.49kb)回收产物为模板并以引物1F+2R配对进行PCR扩增的产物为DNA模板,引物GTAGGF1+GTAGGR1、GTAGGF1+GTAGGR2分别配对进行PCR扩增的凝胶电泳结果;1-10:引物GTAGGF1+GTAGGR1配对;14-23:引物GTAGGF1+GTAGGR2配对;11和24:阴性对照;(B)以引物GTAGGF1+GTAGGR1配对PCR扩增的回收产物连接T-载体转化大肠杆菌挑取单克隆菌落为DNA模板,引物GTAGGF1+GTAGR1对单克隆进行菌液PCR扩增的凝胶电泳结果;1-20:引物GTAGGF1+GTAGGR1配对,21:阴性对照;(C)(B)中PCR产物测序结果。M:DNAladderMarker。Fig.3Verificationofself-cleavage-and-splicebetweenpairofdirectrepeatGTAGG(A)AgrosegelelectrophoresisofPCRproductamplifiedbyusingprimersetofGTAGGF1+GTAGGR1andGTAGGF1+GTAGGR2,andrecovered1F2R(1.49kb)productastemplatewithprimersetof1F+2RPCRproductamplifiedasDNAtemplate;1-10:primersetofGTAGGF1+GTAGGR;14-23:primersetofGTAGGF1+GTAGGR2;11and24:negativecontrol;(B)AgrosegelelectrophoresisofPCRproductamplifiedbyusingprimersetofGTAGGF1+GTAGGR1,andmonoclonesofE.colitransformedwithT-vectorharbouringPCRproductofF1R1asDNAtemplate;1-20:primersetofGTAGGF1+GTAGGR1;21:negativecontrol;(C)SequencingresultsofPCRproductasmentionedin(B).M:DNAladderMarker.3.1.61F2R内正向重复序列TGTGG之间剪接验证的结果(1)设计引物的序列:ttggcccgtgtggcgacacgacactattgaaaagtattggacaagggtgtttgcgttggcgtggccatggaggtccagacaacggatgcttcacatcttggtgtggttgcgagtggcggcgatggacagggcaggcacaactgcctcaagaacctcca(2)引物序列:TGTGGF1:5ʹTTGGCCCGTGTGGCGACA3ʹTGTGGR1:5ʹTGGAGGTTCTTGAGGCAGT3ʹTGTGGR2:5ʹTGTGCCTGCCCTGTCCAT3ʹ注:TGTGGF1为正向重复序列两两之间剪切拼接的序列前期的位点统计结果表明,在原始序列中有3个TGTGG位点,分别是25、1346和1434。本结果验证25-1346之间的剪接方式(位置)。以1F2R(1.49kb)片断为模板,引物1F和2R配对进行PCR扩增的产物作为验证TGTGG剪接序列的DNA模板。然后用引物TGTGGF1和TGTGGR1(目的条带大小157bp)、TGTGGF1和TGTGGR2(目的条带大小138bp)分别配对,进行PCR扩增。凝胶电泳结果表明,虽然两种引物搭配都有条带,但TGTGGF1与TGTGGR1引物搭配扩增的条带更接近预期的目的条带大小位置(图4A)。为了验证TGTGG的25和1346两个位点之间剪接拼接形成的新的较短的序列是否存在,因此我们把引物TGTGGF1+TGTGGR1搭配所扩增出来的条带割胶回收,连接T-载体转化大肠杆菌,挑选20个单克隆。用这些单克隆菌液作DNA模板,引物TGTGGF1与TGTGGR1配对进行菌液PCR鉴定,其中13个菌株DNA模板扩增预期大小的PCR产物(图4B)。随机挑取4个单克隆菌液PCR产物测序。测序结果表明,所测序的4个PCR产物中有2个是在预期位置,即25-1346之间剪接形成的(图4C)。说明在25和1346这两个位点之间正向重复序列TGTGG具有剪接机制的存在。这进一步说明剪接机制在1.49kbDNA片断里可能具有普遍性,为了更进一步的证明剪接机制在1.49kbDNA片断里具有普遍性,针对1.49kbDNA片断里的其他正向重复序列两两位点之间剪接形成的序列我们做了进一步验证。图4正向重复序列TGTGG之间剪接验证(A)以1F2R(1.49kb)片断为模板并以引物1F+2R配对进行PCR扩增的产物为DNA模板,引物TGTGGF1+TGTGGR1、TGTGGF1+TGTGGR2分别配对进行PCR扩增的凝胶电泳结果;1-7:引物TGTGGF1+TGTGGR1配对;11-16:引物TGTGGF1+TGTGGR2配对;8和21:阴性对照;(B)引物TGTGGF1+TGTGGR1配对PCR扩增的回收产物连接T-载体,转化大肠杆菌挑单克隆菌液为DNA模板,引物TGTGGF1+TGTGGR1进行菌液PCR扩增的凝胶电泳结果;1-20:引物TGTGGF1+TGTGGR1配对,21:阴性对照;(C)(B)中PCR产物测序结果。M:DNAladderMarker。Fig.4Verificationofself-cleavage-and-splicebetweenpairofdirectrepeatTGTGG(A)AgarosegelelectrophoresisofPCRproductamplifiedusingprimersetofTGTGGF1+TGTGGR1andTGTGGF1+TGTGGR2,and1F2R(1.49kb)

fragmentastemplatewithprimersetof1F+2RPCRproductamplifiedasDNAtemplate;1-7:primersetofTGTGGF1+TGTGGR1;11-16:primersetofTGTGGF1+TGTGGR2;8and21:negativecontrol;(B)AgarosegelelectrophoresisofPCRproductamplifiedbyusingprimersetofTGTGGF1+TGTGGR1,andmonoclonesofE.colitransformedwithT-vectorharbouringPCRproductofF1R1asDNAtemplate;1-20:primersetofTGTGGF1+TGTGGR1;21:negativecontrol;(C)SequencingresultsofPCRproductasshownin(B).M:DNAladderMarker.3.1.71F2R内正向重复序列GCAGC之间剪接验证的结果(1)设计引物序列:agagagaagagcagcacagaacagactccaagacctaacgtgtgtgtgattggtgggaccaggtattaatagtatagtaagcaactattgtatgaattggctattatattggctatagatgatttggagcttactattatagctagccaatctaatagtttattcatacaatagttacttataaacatatactacaccattaatatatggtcccgcctctcgtacacatataacgttttggagtctgtgctgcagctggctacaaatttgtagcctgctttgcttctctctcctcttttttctcttccacatgtgcttatagctgacttgtagcctgctattgtacctgctctaaacgagattcaataaaatgttactattaaataatgggcacttattaaatctttacgtagacctctactcgatctcgtaggagaaataaaagagaaattatattgtgaatctttgctgagacttttactcgatcttgtaggggaagtagaagaggaaaggatgttgagatgaacattgggataagggtggtgaggcttagatcggaggcggtgatggagcttcgaccatgtggcgacactattgaaaagtattggacaagggtgtttgcgttggcgtggccatggaggtccagacaacggatgcttcacatcttggtgtggttgcgagtggcggcgatggacagggcaggcacaactgcctcaagaacctcca(2)引物序列为:GCAGCF1:5ʹAGAGAGAAGAGCAGCACAGA3ʹGCAGCR1:5ʹGCACAGACTCCAAAACGT3ʹGCAGCR2:5ʹATTTGTAGCCAGCTGCAG3ʹ注:GCAGCF1为正向重复序列两两之间剪切拼接的序列前期正向重复序列位点整理结果表明原始序列里有3个GCAGC位点,即752、780和1016处,本结果验证752-780之间的剪接方式(位置)。以1F2R(1.49kb)片断为模板,引物1F和2R配对进行PCR扩增的产物作为验证GCAGC剪接序列的模板。然后用引物GCAGCF1和GCAGCR1(目的条带大小249bp)、GCAGCF1和GCAGCR2(目的条带大小266bp)分别配对,进行PCR扩增。凝胶电泳表明,两种引物搭配都有条带,但引物GCAGCF1+GCAGCR1配对扩增的条带更符合预期的目的条带(图5A)。虽然通过PCR扩增有所需的目的条带,但是这不能说明在752和780这两个位点之间就存在与752和1016这两个位点之间相似的剪接机制,所以我们把GCAGCF1+GCAGCR1引物配对扩增的条带割胶回收进行T-载体连接、转化大肠杆菌,挑选20个单克隆。在以挑取的单克隆菌液为DNA模板,GCAGCF1+GCAGCR1引物配对进行菌液PCR鉴定,有12个菌株作DNA模板扩增有预期大小的PCR产物条带(图5B)。随机取4个单克隆菌液PCR产物测序。将测序结果与原始序列比对分析后发现,测序的4个PCR产物均是以预期剪接方式(位置)形成的,即752-780之间(图5C)。测序结果同样表明在752和780这两个位点之间具有剪接机制的存在图5正向重复序列GCAGC之间剪接验证(A)以1F2R(1.49kb)片断为模板并以引物1F+2R配对进行PCR扩增的产物为DNA模板,引物GCAGCF1+GCAGCR1、GCAGCF1+GCAGCR2分别配对PCR扩增的凝胶电泳结果;1-9:GCAGCF1+GCAGCR1配对;13-21:GCAGCF1+GCAGCR2配对;10和22:阴性对照;(B)引物GCAGCF1+GCAGCR1配对PCR扩增的回收产物进行T-载体连接转化大肠杆菌,挑取的单克隆的菌液DNA为模板,引物GCAGCF1+GCAGCR1配对对菌液PCR扩增凝胶电泳结果;1-20:GCAGCF1+GCAGCR1;21:阴性对照;(C)(B)中PCR产物测序结果。M:DNAladderMarker。Fig.5Verificationofself-cleavage-and-splicebetweenpairofdirectrepeatGCAGC(A)AgarosegelelectrophoresisofPCRproductamplifiedbyusingprimersetsofGCAGCF1+GCAGCR1andGCAGCF1+GCAGCR2,and1F2R(1.49kb)

fragmentastemplatewithprimersetof1F+2RPCRproductamplifiedasDNAtemplate;1-9:primersetofGCAGCF1+GCAGCR1;13-21:primers

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论