分子育种教案_第1页
分子育种教案_第2页
分子育种教案_第3页
分子育种教案_第4页
分子育种教案_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE植物分子育种教案沈法富PAGEi目录第一编植物分子标记辅助育种(20学时)第一章遗传标记概述(3学时)第一节遗传标记的发展第二节遗传标记的种类形态标记细胞学标记蛋白质标记DNA标记第二章DNA标记技术(3学时)第一节DNA杂交的分子标记RFLP技术VNTR技术第二节PCR技术的分子标记随机引物的PCR标记特异引物的PCR标记第三节限制性酶切和PCR的分子标记AFLP标记CAPS标记第四节单核苷酸多态性的DNA标记第三章分子图谱的构建(4学时)第一节作图群体的建立第二节图谱构建的理论基础第三节DNA标记分离数据的数学处理第四节DNA标记图谱的完善第五节比较作图第四章质量性状的分子标记(3学时)第一节近等基因系分析法第二节分离体分组混合分析法第五章数量性状的分子标记(3学时)第一节数量性状基因的初级定位第二节数量性状基因的精细定位第六章分子标记辅助选择技术(4学时)第一节质量性状的标记辅助选择技术第二节数量性状的标记辅助选择技术第三节标记辅助选择技术的应用研究第四节分子标记辅助选择的发展策略第一编转基因植物育种(20学时)转基因育种的基础(4学时)目的基因的克隆与表达载体的构建植物遗传转化技术转基因植物的筛选与鉴定转基因植物的遗传规律转基因植物与优质育种(3学时)改变植物贮藏蛋白的品质调节碳水化合物的合成改善植物油脂的品质改良棉花纤维品质转基因抗病育种(3学时)植物抗病基因的克隆抗植物病毒基因工程抗真菌植物基因工程转基因抗虫育种(3学时)Bt毒蛋白基因其他抗虫基因植物转基因抗虫研究的进展转基因抗非生物逆境育种(4学时)植物耐盐基因工程耐旱基因工程抗除草剂基因工程抗寒冷基因工程第六章转基因作物的安全性及其对策(3学时)转基因作物的潜在风险转基因作物作为食品的安全性问题PAGEPAGE22第一章遗传标记概述遗传标记是指可以明确反映遗传多态性的生物特征。在经典遗传学中,遗传多态性是指等位基因的变异。在现代遗传学中,遗传多态性是指基因组中任何座位上的相对差异。遗传标记可以帮助人们更好地研究生物的遗传与变异规律。在遗传学研究中遗传标记主要应用于连锁分析、基因定位、遗传作图及基因转移等。在作物育种中通常将与育种目标性状紧密连锁的遗传标记用来对目标性状进行追踪选择。在现代分子育种研究中,遗传标记的应用已成为基因定位和辅助选择的主要手段。纵观遗传学的发展历史,每一种新型遗传标记的发现,都大大推进了遗传学的发展。第一节遗传标记的发展19世纪后半叶,孟德尔(G.J.Mendel)以豌豆为材料,利用七对外部形态特征差异明显、易于识别的相对性状,对杂种后代的不同个体依性状表现进行归类分析,提出了“遗传因子”假说,并发现了生物遗传的分离规律和独立分配规律,即著名的孟德尔定律。1910年,摩尔根(T.H.Morgan)在哥伦比亚大学的实验室发现一种奇特的果蝇,它的眼色不是野生型的红色而是白色,摩尔根用白眼雄蝇与野生型杂交,发现在F1代中白眼为隐性性状,在F2代中红眼与白眼的遗传符合孟德尔分离规律。但是在按雌雄性别分别记数时发现了异常现象,雌蝇全部为红眼,雄蝇中一半为红眼一半为白眼。由此发现决定眼色的基因与决定性别的基因是连锁遗传的,从而产生了著名的摩尔根遗传学说。果蝇白眼遗传标记的发现成为近代遗传学研究的一个里程碑。1913年,A.H.Sturtevant通过连锁遗传分析成功地在果蝇的X染色体上定位了5个基因,从此确定了遗传学的染色体理论和遗传作图的基本原理。1910年以后,摩尔根将孟德尔“遗传因子”的行为与染色体的行为结合起来进行研究,证实了“遗传因子”是染色体上占有一定位置的实体,由此导致了细胞遗传学的诞生。通过对不同物种染色体形态、数目和结构的研究,发现各种非整倍体、染色体结构变异以及各种异形染色体等都有其特定的细胞学特征,可以作为一种遗传标记来测定基因所在的染色体及其相对位置,或通过染色体代换等遗传操作进行基因定位。这种能明确显示遗传多态性的细胞学特征,通称为细胞学标记。1941年,美国遗传学家G.W.Beadle和生化学家E.L.Tatum通过研究红色面包霉的生化突变型,对一系列营养缺陷型进行遗传分析,提出了“一个基因一个酶”的假说,创立了生化遗传学。50年代许多科学家发现同一种酶可具有多种不同的形式。同时由于淀粉凝胶电泳技术的发展和组织化学染色剂的使用,使这种酶的多种形式成为肉眼可辩的带型——酶谱。1959年,C.L.Markert和F.Moller根据对几种动物乳糖脱氢酶的多种形式的研究,提出了用同工酶(isozyme)一词来描述具有同一底物专一性的不同分子形式的酶,并证实了同工酶具有组织、发育及物种的特异性。通过同工酶的电泳谱带可以清楚地识别同工酶的基因型,因此可以作为一种遗传标记加以利用,并且可以将编码酶的基因通过遗传分析定位在染色体上。同工酶标记是建立在生化遗传学基础上的,所以又称为生化标记或蛋白质标记。蛋白质标记是一种分子标记,但仍是以基因表达的结果(表现型)为基础的,是对基因的间接反映。1953年,J.D.Watson和F.H.C.Crick提出了DNA分子结构的双螺旋模型,圆满地解释了DNA就是基因的有机化学实体,宣布了分子遗传学时代的到来。现代基因概念的发展使直接利用DNA分子中核苷酸序列的变异作为遗传标记成为可能。1980年,人类遗传学家D.R.L.Botstein等首先提出了DNA限制性片段长度多态性(RFLP)可以作为遗传标记的思想,开创了直接应用DNA多态性发展遗传标记的新阶段。RFLP标记的诞生大大加速了各种生物遗传图谱的建立和发展,同时也提高了基因定位的精度和速度。1985年,DNA多聚酶链式反应(PCR)技术的诞生,使直接体外扩增DNA以检测其多态性成为可能。1990年,J.G.K.Williams等和J.Welsh等两个研究小组应用PCR技术同时发展了一种新的RAPD分子标记。随后,基于PCR技术的新型分子标记不断涌现,使得DNA标记走向商业化、实用化。由形态标记向分子标记逐步发展的过程,体现了人类对于基因由现象到本质的认识发展过程。在这一过程中,传统的形态标记和细胞学标记始终是遗传标记发展的基础,而蛋白质标记和DNA标记则是遗传学、生物化学和分子生物学的发展导致遗传标记发展的必然结果。随着科学技术的不断进步,新型的分子标记还将不断涌现,新近发展的基于DNA测序和DNA芯片技术的SNP标记已为DNA标记技术的发展展示了美好的前景。第二节遗传标记的种类一、形态标记形态标记是指那些能够明确显示遗传多态性的外观性状,如株高、穗形、粒色或芒毛等的相对差异。典型的形态标记用肉眼即可识别和观察。广义的形态标记还包括那些借助简单测试即可识别的某些性状如生理特性、生殖特性、抗病虫性等。由自发突变或物理化学诱变均可获得具有特定形态特征的遗传标记材料。例如在组织培养及诱变育种过程中经常出现的大量变异材料,其中不乏在形态特征或生理特性上具有特殊表型的个体,经过选择,就可获得稳定遗传的形态标记材料。形态标记材料多数仅带有一个标记基因,但有的则带有多个标记基因。后者用于基因连锁分析时,可同时分析几个标记性状。形态标记材料在遗传研究和作物育种上都有重要的应用价值,因此对形态标记材料的收集、保存和利用历来受到各国研究者的重视。在水稻中,目前已有的形态标记材料,大多是经过精心选育获得的。国际水稻所和日本系统地收集了大量的形态标记材料,并作为重要的种质资源加以保存。在水稻中已有多达300多个形态标记材料。在番茄中已发现的形态标记也有300多种,其中苗期无花色素标记与抗烟草花叶病毒病的Tm-2基因连锁,叶状腺的大小与抗桃霉病基因连锁。在大豆中也积累了大量的形态标记材料,其中部分标记基因已定位在相应的连锁群上(表1.1)。形态标记基因的染色体定位最初是通过经典的二点、三点测验进行的。通过判断不同性状间的遗传是否符合独立分配规律,来确定控制这些性状的基因是否连锁。采用这种方法把相互连锁在一起的基因定为一个连锁群,并与染色体相对应,以性状间重组率作为这些基因在染色体上的相对距离,并确定其毗邻关系。1910年,摩尔根领导的实验室根据对果蝇六个形态性状的分析,发现了连锁遗传现象,并根据研究性状与形态标记的连锁关系,构建了生物中第一张遗传连锁图,开创了利用已知染色体相对位置的标记基因定位未知基因的先例。1928年,赵莲芳根据8个水稻品种的杂交资料,研究了茎、叶和颖花等器官的颜色、护颖长度、谷粒外形等12种性状的遗传,由其中9个基因的相互关系,确定了水稻的三个连锁群。借助于这种方法在一些栽培物种中确定了许多质量性状基因的连锁关系及其在染色体上的相对位置,并绘制出较为完整的遗传连锁图谱。以形态标记为基础的连锁群的建立为生理、生化性状的遗传研究奠定了基础。由于形态标记数量少、可鉴别标记基因有限,因而难以建立饱和的遗传图谱。另外,许多形态标记还受环境、生育期等因素的影响,使形态标记在植物育种中的应用受到一些限制。

表1.1 大豆部分形态标记性状及标记基因(ShoemakerandOlson1993)标记性状标记基因(括号内数字表示所在连锁群)色素花色W1,w1(8)茸毛色T,t(1)荚色L1,l1(5);L2,l2种皮G,g(3)种脐R,r-m(2);I,i-i,I-k,i(7)双色K1;K2;K3子叶色D1(3);D2;Cyt-G,Y3叶小叶数目L-f1,l-f2叶形ln(4);Lo,lo;l-w1,l-w2;l-b1,l-b2;落叶性A叶绿素缺失V1;y3;y4;…y20茸毛类型Pa1,pa1;Pa2,pa2;P1,p1(2);P2,p2(4);Pb,pb(14);Pc,pc;Pd1,pd2;Ps,ps茎扁化茎f(11)节间长度S,s短叶柄Lps,lps矮杆df2(6);df3;df4;df5(1)花花序长短Se,se开花和成熟E1,e1(1);E2,e2;E3,e3;E4,e4;E5,e5无限结荚习性Dt1,dt1(5);Dt2,dt2种子种皮健全度De,de种皮泥膜B1;B2;B3根根部荧光fr1(12);fr2;fr4;Fr3根瘤菌反应rj1(11);Rj2;Rj3;Rj4雄性不育染色体联会突变st2;st3;st4;st5(8)花药开裂不良Ft花丝伸长不良fs1;fs2雄性不育突变体P2(4);ms1(8);ms2;ms3;ms4;ms5;ms6(8)抗病性大豆灰斑病Rcs1;Rcs2大豆霜霉病Rpm白粉病Rmd大豆疫根腐病Rps(10)大豆锈病Rpp1;Rpp2;Rpp3细菌性斑点病Rpg1细菌性斑疹病Rxp大豆花叶病毒病Rsv1(13);Rsv2大豆孢囊线虫病rhg1;rhg2;rhg3;Rhg4;二、细胞学标记细胞学标记是指能明确显示遗传多态性的细胞学特征。染色体的结构特征和数量特征是常见的细胞学标记,它们分别反映了染色体结构上和数量上的遗传多态性。染色体结构特征包括染色体的核型和带型。核型特征是指染色体的长度、着丝粒位置和随体有无等,由此可以反映染色体的缺失、重复、倒位和易位等遗传变异;带型特征是指染色体经特殊染色显带后,带的颜色深浅、宽窄和位置顺序等,由此可以反映染色体上常染色质和异染色质的分布差异。染色体数量特征是指细胞中染色体数目的多少,染色体数量上的遗传多态性包括整倍性和非整倍性的变异,前者如多倍体,后者如缺体、单体、三体、端着丝点染色体等非整倍体。用具有染色体数目和结构变异的材料与染色体正常的材料进行杂交,其后代常导致特定染色体上的基因在减数分裂过程中的分离和重组发生偏离,由此可以测定基因所在的染色体及其相对位置。因此,染色体结构和数目的特征可以作为一种遗传标记。在玉米中利用B-A易位系,水稻中利用易位系,小麦中利用端着丝点染色体,大麦中利用端着丝点三体,棉花中利用易位和单体等非整倍体,番茄中利用各种三体,烟草中利用单体,已成功地将许多质量性状基因定位于染色体上,并建立了相应的连锁群。染色体结构和数量变异常具有相应的形态学特征,在多倍体植物中广泛用于基因定位研究。在小麦中,利用每条染色体的模式图、C-分带的带型、缺失断点的位置及分子标记在缺失间隔区的定位,构建了整个小麦基因组的物理图谱。由于染色体结构和数量变异常具有相应的形态特征,因此,培育这样的细胞学标记材料,可以在杂种后代中直接对相应的形态标记进行选择,不必进行染色体鉴定就可确定其细胞学特征,从而提高细胞学标记的利用效率。表1.2给出了二倍体籼稻品种IR36的12条染色体的初级三体的形态特征。根据这些形态特征,在一般情况下可将这些初级三体与IR36区别开来。表1.2 水稻IR36初级三体的形态特征(Khushetal.1984)染色体三体名称特征1三体1(草状)生长缓慢,高度不育,籽粒较细长且稍呈三角形,叶窄,与草相似2三体2(矮生)小穗短,护颖较长,自交高度不育,叶片短且基部附近常扭曲3三体4(不育)植株最矮,叶片短厚呈革质,中脉凸出,穗伸出不完全,自交完全不育4三体12(高秆)植株最高,叶片下垂,叶舌长,育性正常5三体5(叶片扭曲)叶片短且扭曲,有密生茸毛,穗短,小穗着生紧密,结实率高6三体3(有芒)籽粒有芒,叶片厚而半卷,叶舌长,自交高度不育7三体7(窄叶)叶片窄而半卷,穗稍疏松,不完全伸出,部分可育8三体8(卷叶)叶片窄卷,叶舌短,籽粒短而粗,部分可育9三体9(粗壮)叶片厚而浓绿,茎秆短,小穗最大,百粒重最高10三体10(短粒)叶舌有毛,叶片直立,育性正常11三体11(拟正常)形态与二倍体姊妹系无法区别,育性正常,需作细胞学鉴定12三体6(丛生)外型呈丛生草状,穗部顶端小穗退化,育性高细胞学标记克服了形态标记易受环境影响的缺点,但这种标记材料的产生需要花费大量的人力物力进行培养选择。有些物种对染色体结构和数目的变异的耐受性较差,难以获得相应的标记材料。某些物种虽然已有细胞学标记材料,但这些标记常常伴有对生物有害的表型效应,或有时观察和鉴定比较困难,从而限制了细胞学标记的应用。三、蛋白质标记许多生物大分子或生物化合物都具有作为遗传标记的潜力。酚类化合物、黄酮类化合物、花色素苷及糖苷类分子曾被用作为分子标记(Mckee1973)。但由于分离和检测这些分子的技术和手段通常比较复杂,而且费时费钱,使之很难适合于大群体的常规检测,因此这类生化物质作为遗传标记是不理想的。与此相反,许多蛋白质分子分析简单快捷,是有用且可靠的遗传标记。用作遗传标记的蛋白质通常可分为酶蛋白质和非酶蛋白质二种。在非酶蛋白质中,用得较多的是种子贮藏蛋白,这些蛋白质可以通过一维或二维聚丙烯酰胺凝胶电泳技术进行分析,根据电泳显示的蛋白质谱带或点,确定其分子结构和组成的差异。种子贮藏蛋白在小麦、大麦、玉米、水稻等作物上的研究工作比较深入,如小麦种子贮藏蛋白中醇溶蛋白和谷蛋白约占蛋白质总量的90%,对其遗传分析表明,它们是极为重要的生化遗传指标,并已被广泛地应用于小麦的遗传学研究。酶蛋白质通常利用非变性淀粉凝胶或聚丙烯酰胺凝胶电泳及特异性染色来检测,根据电泳谱带的不同来显示酶蛋白在遗传上的多态性。蛋白质的多态性,可能是由于基因编码的氨基酸序列的差异引起的,也可能是由于蛋白质后加工的不同引起的,如糖基化能导致蛋白质分子量的变化。酶作为遗传标记是在Markert和Moller(1959)提出了同工酶的概念后迅速发展起来的。同工酶是指具有相同催化功能而结构及理化性质又不同的一类酶,其结构的差异来源于基因类型的差异,因此并不一定是同一基因的产物。每一个酶的不同电泳酶谱表现型可能是由于不同的基因座引起的,也可能是同一基因座上的不同的等位基因引起的。为了易于区别,又将后一类同工酶称为等位酶(Allozymes)。由于等位基因的差异,等位酶在氨基酸组成上或多或少也有差异。同工酶不但已被用来标记某些重要的质量性状,如番茄的线虫病抗性,而且还用于标记复杂的数量性状,如种子大小、产量等。编码同工酶的基因可以通过遗传分析定位于染色体或连锁群上。在一些重要农作物中,如水稻、大豆等,已定位了许多同工酶基因(表1.3,)。蛋白质是基因表达的产物,与形态性状、细胞学特征相比,数量上更丰富,受环境影响更小,能更好地反映遗传多态性,因此蛋白质标记是一种较好的遗传标记,已被广泛应用于物种起源和进化研究、种质鉴定、分类和抗病性筛选等领域。但蛋白质标记仍然存在诸多不足,如每一种同工酶标记都需特殊的显色方法和技术;某些酶的活性具有发育和组织特异性;局限于反映基因组编码区的表达信息等。最关键的不足是其标记的数量还比较有限。虽然至今已经发展了57种酶系统(VallegosandChase1991),大约可以鉴定100个左右的基因座位,但在某个特定的作物群体中,仅有10~20种同工酶,大约30~40个等位基因可表现出多态性。这样的数目还不能满足标记辅助育种的需要。

表1.3 水稻同工酶标记同工酶基因染色体酸性磷酸酶Acp-112Acp-212Acp-37乙醇脱氢酶Adh-111氨基肽酶Amp-12Amp-28Amp-36Amp-48β-淀粉酶β-Amy-17过氧化氢酶Cat-16内肽酶Enp-16酯酶Est-26Est-39Est-51Est-77Est-97谷氨酸脱氢酶Gdh-13天门冬氨酸氨基转移酶Got-11Got-26异柠檬酸脱氢酶Icd-11苹果酸脱氢酶Mal-11过氧化物酶Pox-15Pox-212Pox-56M-Pox-15磷酸葡萄糖异构酶Pgi-13Pgi-26磷酸葡萄糖脱氢酶Pgd-111Pgd-26四、DNA标记DNA分子标记是DNA水平上遗传多态性的直接反映。DNA水平的遗传多态性表现为核苷酸序列的任何差异,哪怕是单个核苷酸的变异。因此,DNA标记在数量上几乎是无限的。与以往的遗传标记相比,DNA标记还有许多特殊的优点,如无表型效应、不受环境限制和影响等。目前,DNA标记已广泛地应用于种质资源研究、遗传图谱构建、目的基因定位和分子标记辅助选择等各个方面。理想的DNA标记应具备以下特点:(1)遗传多态性高;(2)共显性遗传,信息完整;(3)在基因组中大量存在且分布均匀;(4)选择中性;(5)稳定性、重现性好;(6)信息量大,分析效率高;(7)检测手段简单快捷,易于实现自动化;(8)开发成本和使用成本低。目前已发展出十几种DNA标记技术,它们各具特色,并为不同的研究目标提供了丰富的技术手段。但还没有一种DNA标记能完全具备上述理想特性。依据对DNA多态性的检测手段,DNA标记可分为四大类:第一类为基于DNA-DNA杂交的DNA标记。该标记技术是利用限制性内切酶酶解及凝胶电泳分离不同生物体的DNA分子,然后用经标记的特异DNA探针与之进行杂交,通过放射自显影或非同位素显色技术来揭示DNA的多态性。其中最具代表性的是发现最早和应用广泛的RFLP标记。第二类为基于PCR的DNA标记。PCR技术问世不久,便以其简便、快速和高效等特点迅速成为分子生物学研究的有力工具,尤其是在DNA标记技术的发展上更是起到了巨大作用。根据所用引物的特点,这类DNA标记可分为随机引物PCR标记和特异引物PCR标记。随机引物PCR标记包括RAPD标记、ISSR标记等,其中RAPD标记使用较为广泛。随机引物PCR所扩增的DNA区段是事先未知的,具有随机性和任意性,因此随机引物PCR标记技术可用于对任何未知基因组的研究。特异引物PCR标记包括SSR标记、STS标记等,其中SSR标记已广泛地应用于遗传图谱构建、基因定位等领域。特异引物PCR所扩增的DNA区段是事先已知的明确的,具有特异性。因此特异引物PCR标记技术依赖于对各个物种基因组信息的了解。第三类为基于PCR与限制性酶切技术结合的DNA标记。这类DNA标记可分为二种类型,一种是通过对限制性酶切片段的选择性扩增来显示限制性片段长度的多态性,如AFLP标记。另一种是通过对PCR扩增片段的限制性酶切来揭示被扩增区段的多态性,如CAPS标记。第四类为基于单核苷酸多态性的DNA标记。如:SNP标记。它是由DNA序列中因单个碱基的变异而引起的遗传多态性。目前SNP标记一般通过DNA芯片技术进行分析。以上四大类DNA标记,都是基于基因组DNA水平上的多态性和相应的检测技术发展而来的,这些标记技术都各有特点。表1.5和图1.1分别描述了一些主要的DNA标记的特点和遗传多态性的分子基础。任何DNA变异能否成为遗传标记都有赖于DNA多态性检测技术的发展,DNA的变异是客观的,而技术的进步则是人为的。随着现代分子生物学技术的迅速发展,随时可能诞生新的标记技术。DNA标记的拓展和广泛应用,最终必然会促进作物遗传与育种研究的深入发展。RFLPVNTRRAPDISSRSSRAFLP基因组分布低拷贝编码序列整个基因组整个基因组整个基因组整个基因组整个基因组遗传特点多态性共显性中等共显性较高多数显性较高显性/共显性较高共显性高显性/共显性较高检测基因座位数1-310-1001-101-10多数为120-200探针/引物类型gDNA或cDNA特异性低拷贝探针DNA短片段9-10bp随机引物16-18bp特异引物14-16bp特异引物16-20bp特异引物DNA质量要求高高低低中等高DNA用量2-10μg5-10μg10-25ng25-50ng25-50ng2-5μg技术难度高中等低低低中等同位素使用情况通常用通常用不用不用可不用通常用可靠性高高低/中等高高高耗时多多少少少中成本高高较低较低中等较高第二章DNA标记技术生命的遗传信息存储于DNA序列之中,高等生物每一个细胞的全部DNA构成了该生物体的基因组。基因组DNA序列的变异是物种遗传多样性的基础。尽管在生命信息的传递过程中DNA能够精确地自我复制,但是许多因素也能引起DNA序列的变化,造成个体之间的遗传差异。单个碱基的替换、DNA片段的插入、缺失、易位和倒位等都能引起DNA序列的变异。利用现代分子生物学技术揭示DNA序列的变异(遗传多态性),就可以建立DNA水平上的遗传标记。从1980年人类遗传学家J.G.K.Botstein等首次提出DNA限制性片段长度多态性作为遗传标记的思想及1985年PCR技术的诞生至今,已经发展了十多种基于DNA多态性的分子标记技术,这些DNA标记技术综合起来可分为以DNA杂交为基础的和以PCR为基础的以及PCR技术和限制性酶切技术相结合的几种类型。显然,检测DNA水平上的遗传变异最精确的方法是直接测定DNA序列,通过对测定的DNA序列进行分析比较,即可揭示生物体间在单个核苷酸水平上的遗传多态性。基于这一原理,最近发展了SNP标记,即单核苷酸多态性标记。尽管在植物分子标记研究中还未见这一技术的应用报道,但其应用前景是十分美好的。因此,本章在最后一节对这一新技术作了简要阐述。第一节基于DNA-DNA杂交的DNA标记基于DNA-DNA杂交的DNA标记主要包括RFLP标记和VNTR标记。这类标记是利用限制性内切酶酶解不同生物体的DNA分子后,用同位素或非同位素标记的随机基因组克隆、cDNA克隆、微卫星或小卫星序列等作为探针进行DNA间杂交,通过放射自显影或非同位素显色技术来揭示DNA的多态性。VNTR多态性是由重复序列数目的差异性产生的,而RFLP多态性主要是由于DNA序列中单碱基的替换、DNA片段的插入、缺失、易位和倒位等引起的。RFLP标记是发现最早、应用广泛、具有代表性的DNA标记技术。一、RFLP标记技术RFLP即限制性片段长度多态性。这种多态性是由于限制性内切酶酶切位点或位点间DNA区段发生突变引起的。限制性内切酶是一种能识别DNA上特定碱基组成的序列并在这些序列位点上切断DNA分子的酶。这些特定碱基组成的DNA序列叫做相应内切酶的识别位点或限制性位点,长度一般在4至8个碱基对之间。如PstⅠ的限制性位点是(其中箭头表示被切开的位置):5’CTGCA↓G3’3’G↑ACGTC5’通常DNA上存在大量的限制性内切酶酶切位点。因此,限制性内切酶能将很长的DNA分子酶解成许多长短不一的小片段,片段的数目和长度反映了DNA分子上限制性酶切位点的分布。特定的DNA/限制性内切酶组合所产生的片段是特异的,它能作为某一DNA(或含有该DNA的生物)的特有“指纹”,这种“指纹”在DNA分子水平上直接反映了生物的遗传多态性。图2.1给出了产生RFLP的原理示意图。如果某一个限制性位点发生了突变,这个限制性内切酶将不再识别这个位点,不再进行酶切反应,产生片段的大小将由最邻近的限制性酶切位点决定。由于植物基因组很大,某种限制性内切酶的酶切位点很多,经酶解后会产生大量大小不一的限制性片段,这些片段经电泳分离形成的电泳谱带是连续分布的,很难辨别出某一限制性片段大小的变化,必须利用单拷贝的基因组DNA克隆或cDNA克隆作为探针,通过Southern杂交技术才能够检测到。可见,要进行RFLP分析首先要分离单拷贝的基因组DNA克隆或cDNA克隆,才能进行多态性分析。一些作物如玉米、水稻、番茄等已有覆盖整个基因组的克隆,很容易从有关单位或商家索取或购买到。但大多数作物还没有覆盖整个基因组的克隆,仍需要研制特异探针。由于具有大量的酶和探针组合可供选配,因此任何一种作物都具有大量的RFLP标记数量。RFLP标记具有共显性、信息完整、重复性和稳定性好等优点。但RFLP技术的实验操作过程较复杂,需要对探针进行同位素标记,即使应用非放射性的Southern杂交技术,仍然是个耗时费力的过程。图2.1 RFLP标记多态性的分子基础二、VNTR标记技术许多生物体的DNA存在含有大量的串联重复序列的高变异区。通常将以15~75个核苷酸为基本单元的串联重复序列称为小卫星(Minisatellites),以2~6个核苷酸为基本单元的简单串联重复序列称为微卫星(Microsatellites)或简单序列重复(SSR)。小卫星和微卫星也常常称作重复数可变串联重复(VNTR)标记。VNTR标记产生的多态性是由同一座位上的串联单元数量的不同而产生的。图2.2为VNTR变异的原理示意图。利用VNTR标记可进行分子定位和作图的研究工作。图2.2 VNTR变异的原理示意图.A、B、C分别表示不同基因型为了使VNTR成为有用的DNA标记,需发展一种能够快速鉴定VNTR座位的技术。理想的途径之一是利用PCR进行扩增,所得PCR产物通过电泳即可比较其长度变异。但是许多小卫星序列太长,无法通过PCR扩增获得满意的结果。因此,仍需利用DNASouthern杂交和放射性标记探针来检测。而微卫星序列常常比较短,利用PCR扩增可以获得满意的检测效果。鉴于上述原因,本书中将微卫星标记归类于基于PCR技术的DNA标记。本节中的VNTR标记主要是指小卫星标记。利用小卫星中的重复单元作为杂交探针是获得VNTR信息的最快捷的途径。在动物基因组中存在大量的小卫星标记,目前人类小卫星序列和噬菌体M13蛋白III基因序列已成为研究小卫星的常用探针。这些探针与植物基因组有较高的同源性,因此可以用于植物基因组的小卫星研究。利用DNASouthern杂交技术可以产生许多多态性条带。这些丰富的DNA带谱用于DNA指纹研究是非常有用的,但由于带谱复杂,现有技术分析起来比较困难,不太适合作图研究。第二节基于PCR技术的DNA标记PCR技术是一种利用酶促反应对特定DNA片段进行体外扩增的技术,该技术只需非常少量(通常在纳克级范围内)的DNA样品,在短时间内以样品DNA为模板合成上亿个拷贝。经过电泳分离、染色或放射自显影,即可显示出所扩增的特定DNA区段。PCR技术以短核苷酸序列作为引物,并使用一种耐高温的DNA聚合酶(Taq酶)。典型的PCR技术通常进行25~50个循环,每个循环包括三个步骤。第一步为DNA变性,通常将温度升至94℃,使模板DNA变成单链;第二步为DNA复性,依据引物序列的长度及其与样品DNA中目标序列的同源性程度等因素,将温度控制在25~65℃,使引物与模板上的同源序列结合;第三步为DNA合成,所用温度应选择最适合DNA聚合酶活性的温度,通常为72℃。经过这样一个循环,目标DNA片段即被复制一次。随着循环数的增加,DNA扩增产物呈指数增加。PCR技术具有快捷、简易、灵敏等优点,已被广泛地应用于分子克隆、遗传病的基因诊断、法医学、系统分类学、遗传学和育种学等方面,在DNA标记技术的发展上起到了巨大的作用。根据所用引物的类型不同,基于PCR的DNA标记可分为随机引物的PCR标记和特异引物的PCR标记。一、随机引物的PCR标记随机引物PCR标记的特点是,其所用引物的核苷酸序列是随机的,其扩增的DNA区段是事先未知的。应用这种标记技术可在基因组中寻找未知的多态性座位作为新的DNA标记。随机引物PCR扩增的DNA区段产生多态性的分子基础是模板DNA扩增区段上引物结合位点的碱基序列发生了突变。因此,不同来源的基因组在该区段(座位)上将表现为扩增产物有无的差异或扩增片段大小的差异(图2.3)。其中第一种情况较为常见,因此随机引物PCR标记通常是显性的,但有时也会表现为共显性,即扩增片段大小的差异。目前,常用的随机引物PCR标记主要有可分为RAPD、AP-PCR、DAF、ISSR等。(一)RAPD标记RAPD标记所用的引物长度通常为9~10个碱基,大约只有常规的PCR引物长度的一半。使用这么短的PCR引物是为了提高揭示DNA多态性的能力。由于引物较短,所以在PCR中必须使用较低的退火(DNA复性)温度,以保证引物能与模板DNA结合。RAPD引物已经商品化,可以向有关供应商直接购买,不需要自己合成。商品化的RAPD引物基本能覆盖整个基因组,检测的多态性远远高于RFLP。RAPD标记的优点是,对DNA需要量极少,对DNA质量图2.3 随机引物PCR产物多态性的分子基础.类型1为显性标记,是最常见的多态性,类型2、3、4为共显性标记,但较少见

要求不高,操作简单易行,不需要接触放射性物质,一套引物可用于不同生物的基因组分析,可检测整个基因组。在RAPD标记分析中,通常每次PCR反应只使用一种引物。在这种情况下,只有两端同时具有某种PCR引物结合位点的DNA区段才能被扩增出来。如果将2种引物组合使用,则还可扩增出两端分别具有其中一种引物的结合位点的DNA区段,产生新的带型,找到更多的DNA分子标记。在实验材料多态性程度较低时,可考虑用这种将不同引物组合使用的方法。RAPD标记的不足之处是,一般表现为显性遗传,不能区分显性纯合和杂合基因型,因而提供的信息量不完整。另外,由于使用了较短的引物,RAPD标记的PCR易受实验条件的影响,结果的重复性较差。不过,只要扩增到的RAPD片段不是重复序列,则可将其从凝胶上回收并克隆,转化为RFLP和SCAR标记,以进一步验证RAPD分析的结果。(二)DAF标记DAF标记原理上与RAPD标记相似,但它所使用的引物比RAPD标记的更短,一般为5~8个核苷酸,因而与模板DNA随机结合的位点更多,扩增得到的DNA条带也更多,检测多态性的能力更强。在多态性程度比较低的作物如小麦上,DAF技术是一种很有用的寻找DNA分子标记的手段。但由于DAF使用了更短的引物,因而其PCR稳定性比RAPD更低。(三)AP-PCR标记AP-PCR标记原理上也与RAPD相似,但所使用的引物较长,通常为18~24个碱基。因此,其PCR反应条件与常规一样,稳定性要比RAPD好,但揭示多态性的能力要比RAPD低。(四)ISSR标记简单序列重复间区(ISSR)DNA标记技术是由Zietkiewicz等(1994)提出的,该技术检测的是两个SSR之间的一段短DNA序列上的多态性。利用真核生物基因组中广泛存在的SSR序列,设计出各种能与SSR序列结合的PCR引物,对两个相距较近、方向相反的SSR序列之间的DNA区段进行扩增。一般在引物的5’或3’端接上2~4个嘌呤或嘧啶碱基,以对具有相同重复形式的许多SSR座位进行筛选,使得最终扩增出的ISSR片段不致太多。ISSR技术所用的PCR引物长度在20个核苷酸左右,因此可以采用与常规PCR相同的反应条件,稳定性比RAPD好。ISSR标记呈孟德尔式遗传,具显性或共显性特点。在动植物基因组中存在大量的双核苷酸重复序列,因此,大多数ISSR标记所用PCR引物是基于双核苷酸重复序列的。近年来,ISSR标记技术已应用于植物遗传分析的各个方面,如品种鉴定、遗传关系及遗传多样性分析、基因定位、植物基因组作图研究等。Kojima等(1998)的研究表明,(AC)n双核苷酸重复序列非常适合小麦的染色体作图,并成功地定位了一系列ISSR标记。Tsumura等(1996)研究发现,基于(AG)n和(CT)n序列的ISSR标记在柏树和松树中是最有用的。方宣钧博士实验室利用商业化的ISSR引物进行大豆孢囊线虫病抗性基因的遗传分析和基因定位,获得了与大豆孢囊线虫病抗性基因紧密连锁的ISSR标记,并定位在大豆的G连锁群上。二、特异引物的PCR标记特异引物PCR标记所用的引物是针对已知序列的DNA区段而设计的,具有特定核苷酸序列,引物长度通常为18~24核苷酸,故可在常规PCR的复性温度下进行扩增,对基因组DNA的特定序列区域进行多态性分析。根据引物序列的来源,主要可分为SSR标记、SCAR标记、STS标记及RGA标记等。(一)SSR标记SSR的基本重复单元是由几个核苷酸组成的,重复次数一般为10~50。同一类微卫星DNA可分布在基因组的不同位置上。由于基本单元重复次数的不同,而形成SSR座位的多态性(图2.4)。每个SSR座位两侧一般是相对保守的单拷贝序列,因此可根据两侧序列设计一对特异引物来扩增SSR序列。经聚丙烯酰胺凝胶电泳,比较扩增带的迁移距离,就可知不同个体在某个SSR座位上的多态性。可以看出,检测SSR标记的关键在于必须设计出一对特异的PCR引物,为此,必须事先了解SSR座位两侧的核苷酸序列,寻找其中的特异保守区。图2.5是开发SSR引物序列的示意图。其过程是,首先建立DNA文库,筛选鉴定微卫星DNA克隆,然后测定这些克隆的侧翼序列。也可通过Genbank、EMBL和DDBJ等DNA序列数据库搜索SSR序列,省去构建基因文库、杂交、测序等繁琐的工作。但后者获得的SSR信息量往往不如基因组文库的多。最后,根据SSR两侧序列在同一物种内高度保守的特性设计引物。可见,开发新的SSR引物是一项费时耗财的工作。图2.5 SSR座位及引物序列开发示意图SSR标记的多态性主要依赖于基本单元重复次数的变异,而这种变异在生物群体中是大量存在的。因此,SSR标记的最大优点是具有大量的等位差异,多态性十分丰富。但是,SSR标记必须依赖测序设计引物,开发成本高。不过,目前许多物种已有现成的、商品化的SSR引物,对一般实验室而言,只需利用现成的SSR引物进行PCR扩增,即可分析DNA的多态性。因此,一旦开发出某种生物全套的SSR引物,就获得了最富遗传变异信息的DNA标记。目前SSR标记已广泛应用于遗传作图和种质鉴定等。SSR标记由于具有操作简便和稳定可靠等优点,似有逐渐取代RFLP标记之趋势。(二)SCAR标记SCAR标记通常是由RAPD标记转化而来的。为了提高所找到的某一RAPD标记在应用上的稳定性,可将该RAPD标记片段从凝胶上回收并进行克隆和测序,根据其碱基序列设计一对特异引物(18~24碱基左右)。也可只对该RAPD标记片段的末端进行测序,根据其末端序列,在原来RAPD所用的10碱基引物上增加相邻的14个左右碱基,成为与原RAPD片段末端互补的特异引物。以此特异引物对基因组DNA再进行PCR扩增,便可扩增出与克隆片段同样大小的特异带。这种经过转化的特异DNA分子标记称为SCAR标记。SCAR标记一般表现为扩增片段的有无,为一种显性标记;但有时也表现为长度的多态性,为共显性的标记。若待检DNA间的差异表现为扩增片段的有无,可直接在PCR反应管中加入溴化乙锭,通过在紫外灯下观察有无荧光来判断有无扩增产物,从而检测DNA间的差异,这样可省去电泳的步骤,使检测变得方便、快捷、可靠,可以快速检测大量个体。相对于RAPD标记,SCAR标记由于所用引物较长及引物序列与模板DNA完全互补,因此,可在严谨条件下进行扩增,结果稳定性好、可重复性强。随着研究工作的发展,会有越来越多重要作物农艺性状的SCAR标记被开发出来,它们将在分子标记辅助育种方面发挥巨大作用。(三)STS标记STS标记是根据单拷贝的DNA片段两端的序列,设计一对特异引物,扩增基因组DNA而产生的一段长度为几百bp的特异序列。STS标记采用常规PCR所用的引物长度,因此PCR分析结果稳定可靠。RFLP标记经两端测序,可转化为STS标记。STS在基因组中往往只出现一次,从而能够界定基因组的特异位点(Olsonetal.1989)。用STS进行物理作图,可通过PCR或杂交途径来完成。STS标记可作为比较遗传图谱和物理图谱的共同位标,这在基因组作图上具有非常重要的作用。(四)RGA标记迄今为止,已克隆了二十多种抗病基因,这些来自不同植物的不同抗病基因都具有一些共同的保守序列,如富含亮氨酸重复(leucine-richrepeat,LRR)、核苷酸结合位点(nucleotide-bindingsite,NBS)、丝氨酸/苏氨酸激酶(serine-threoninekinase,STK)等保守区域,即不同抗病基因具有一定的同源性。依据基因保守序列设计特异引物来扩增基因组DNA可获得抗病基因类似物(RGA)片段。RGA既可以作为一种基于特异引物PCR的DNA标记,其本身又是潜在的(侯选的)抗病基因。许多研究结果显示,抗病基因在染色体上有成簇排列的倾向。因此,这种RGA扩增技术是寻找抗病基因DNA标记的一种有效手段。Leister等(1996)等根据拟南芥的抗病基因Rps2和烟草的抗病基因N的高度保守的LRR序列设计引物,对马铃薯基因组DNA进行PCR扩增,获得了与已知抗病基因同源、与抗线虫病基因Gro1和抗晚疫病基因R7完全连锁的DNA片段。Kanazin等(1996)根据来自亚麻的L6、烟草的N和拟南芥的Rps2等抗病基因的保守区域设计引物,扩增大豆DNA,至少得到9类RGA,其中一些被定位于大豆的已知抗病基因座位附近。Yu等(1996)根据烟草的N基因和拟南芥的Rps2基因共同具有的高度保守的NBS序列,合成了简并引物,从大豆中扩增和克隆到了多个NBS序列。其中部分已定位于已知的大豆抗病毒病基因(Rpv1和Rpv2)、抗根腐病基因(Rps1、Rps2和Rps3)和抗白粉病基因(rmd)的邻近区域。第三节基于限制性酶切和PCR的DNA标记以限制性酶切和PCR技术为基础、将两种技术有机结合的DNA标记主要有两种,一种是先将样品DNA用限制性内切酶进行酶切,再对其酶切片段有选择地进行扩增,然后检测其多态性,这种标记称为AFLP标记;另一种是先对样品DNA进行专化性扩增,再用限制性内切酶对扩增产物进行酶切检测其多态性,称为CAPS标记。一、AFLP标记AFLP是由Zabeau等(1993)发明的一项DNA指纹技术。其基本原理是,通过对基因组DNA酶切片段的选择性扩增来检测DNA酶切片段长度的多态性。图2.6为AFLP标记技术的原理示意图。首先用两种能产生粘性末端的限制性内切酶将基因组DNA切割成分子量大小不等的限制性片段,然后将这些片段和与其末端互补的已知序列的接头(adapter)连接,所形成带接头的特异片段用作随后的PCR反应的模板。所用的PCR引物5’端与接头和酶切位点序列互补,3’端在酶切位点后增加1~3个选择性碱基,使得只有一定比例的限制性片段被选择性地扩增,从而保证PCR反应产物可经变性聚丙烯酰胺凝胶电泳来分辨。AFLP揭示的DNA多态性是酶切位点和其后的选择性碱基的变异。AFLP扩增片段的谱带数取决于采用的内切酶及引物3’端选择碱基的种类、数目和所研究基因组的复杂性。由于AFLP是限制性酶切与PCR结合的一种技术,因此具有RFLP技术的可靠性和PCR技术的高效性,可以在一个反应内检测大量限制性片段,一次可获得50~100条谱带的信息。因此,为不同来源和不同复杂程度基因组的分析提供了一个有力的工具。近年来,AFLP已大量应用于种质资源研究,遗传图谱构建及基因定位(Doninietal.1997;Keimetal.1997;Powelletal.1996)。AFLP技术的主要不足是,需要使用同位素或非同位素标记引物,相对比较费时耗财。图2.6 AFLP标记技术的原理示意图二、CAPS标记CAPS标记(KoniecznyandAusubel1993)是特异引物PCR与限制性酶切相结合而产生的一种DNA标记,它实际上是一些特异引物PCR标记(如SCAR和STS)的一种延伸。当SCAR或STS的特异扩增产物的电泳谱带不表现多态性时,一种补救办法就是用限制性内切酶对扩增产物进行酶切,然后再通过琼脂糖或聚丙烯酰胺凝胶电泳检测其多态性。用这种方法检测到的DNA多态性就称为CAPS标记。它揭示的是特异PCR产物DNA序列内限制性酶切位点变异的信息,也表现为限制性片段长度的多态性。CAPS标记在实际研究中经常用到。例如,Williamson等(1994)找到了一个与抗线虫病基因Mi连锁的显性RAPD标记REX-1。经克隆测序设计出20碱基特异引物,转化为SCAR标记。但在所有抗感品系都会扩增出一条同样大小的带,无多态性表现。后用限制性内切酶TaqⅠ酶切后,抗感品系间表现了多态性,并能区分纯合、杂合品系,成为与Mi连锁的共显性标记。Caranta等(1999)获得了辣椒中与抗马铃薯Y病毒病和辣椒斑驳病毒病的抗病基因Pvy4紧密连锁的AFLP标记,将8个标记中最靠近的1个共显性AFLP标记转化成了共显性的CAPS标记。第四节基于单个核苷酸多态性的DNA标记研究DNA水平上的多态性的方法很多,其中最彻底最精确的方法就是直接测定某特定区域的核苷酸序列并将其与相关基因组中对应区域的核苷酸序列进行比较,由此可以检测出单个核苷酸的差异。这种具有单核苷酸差异引起的遗传多态性特征的DNA区域,可以作为一种DNA标记,即新近发展起来的单核苷酸多态性(SNP)标记。SNP在大多数基因组中存在较高的频率,在人类基因组中平均每1.3kb就有一个SNP存在。这种类型的DNA多态性仅有两个等位基因的差异,所以SNP的最大的杂合度为50%。尽管单一的SNP所提供的信息量远小于现在常用的遗传标记,但是SNP数量丰富,可以进行自动化检测,因此,SNP具有广泛的应用前景。鉴定SNP标记的主要途径有二条:(1)在DNA测序过程中,利用碱基的峰高和面积的变化来监测单个核苷酸的改变引起的DNA多态性;(2)通过对已有DNA序列进行分析比较来鉴定SNP标记。不过最直接的方法还是通过设计特异的PCR引物扩增某个特定区域的DNA片段,通过测序和遗传特征的比较,来鉴定该DNA片段是否可以作为SNP标记。大规模的SNP鉴定则要借助于DNA芯片技术。DNA芯片技术主要是分子生物学和微细加工技术相结合的产物,这项技术实现了DNA分析的高通量、微型化和自动化。一块很小的DNA芯片可固定几万、甚至几十万个不同的DNA探针,通过完全自动化的设备对其进行分析,可以快速、灵敏和平行地对大量(乃至全基因组)的基因进行同步检测。利用芯片技术进行SNP标记的筛选鉴定已有成功的例子。Wang(1998)利用DNA芯片技术对人类基因组的2.3MbDNA进行检测,鉴别出3241个侯选的SNP,并将其中的2227个SNP定位到了遗传图谱中。这一结果在核苷酸水平上为人类遗传多样性提供了重要数据,为大规模鉴定人类SNP提供了可行的方法。利用SNP标记已发现与人类一些重要疾病(哮喘病、糖尿病、精神分裂症、癌症、镰刀贫血症、血友病等)相连锁的标记座位(RischandMerikangas1996;Collinsetal.1997)。尽管SNP标记已成为人类遗传研究的有力工具,但迄今尚无关于SNP标记在植物遗传与育种中应用的研究报导。专门通过大规模测序去寻找植物基因组中SNP标记的成本太高,但DNA芯片技术对基因组已经测序的植物以及利用基因库中的大量DNA序列信息进行SNP鉴定是非常有意义的。随着拟南芥、水稻等重要植物的全基因组测序的完成,SNP标记必将成为植物遗传与育种研究中的理想的遗传标记。第三章分子图谱的构建检测出的每个分子标记反映的都是相应染色体座位上的遗传多态性状态。为了有效地分析利用分子标记所提供的遗传信息,人们希望知道不同分子标记在染色体上的相对位置或排列情况,也就是要构建分子标记的遗传连锁图谱。利用DNA标记构建遗传连锁图谱在原理上与传统遗传图谱的构建是一样的。其基本步骤包括:选择适合作图的DNA标记;根据遗传材料之间的DNA多态性,选择用于建立作图群体的亲本组合;建立具有大量DNA标记处于分离状态的分离群体或衍生系;测定作图群体中不同个体或株系的标记基因型;对标记基因型数据进行连锁分析,构建标记连锁图。至今为止,已构建了许多植物的高密度分子标记连锁图。本章侧重介绍利用DNA标记构建分子遗传连锁图谱的原理与方法。第一节作图群体的建立要构建DNA标记连锁图谱,必须建立作图群体。建立作图群体需要考虑的重要因素包括亲本的选配、分离群体类型的选择及群体大小的确定等。一、亲本的选配亲本的选择直接影响到构建连锁图谱的难易程度及所建图谱的适用范围。一般应从四个方面对亲本进行选择,首先要考虑亲本间的DNA多态性。亲本之间的DNA多态性与其亲缘关系有着密切关系,这种亲缘关系可用地理的、形态的或同工酶多态性作为选择标准。一般而言,异交作物的多态性高,自交作物的多态性低。例如,玉米的多态性极好,一般自交系间配制的群体就可成为理想的RFLP作图群体;番茄的多态性较差,因而只能选用不同种间的后代构建作图群体;水稻的多态性居中,美国康乃尔大学S.D.Tanksley实验室1988年发表的RFLP连锁图谱是以籼稻和爪哇稻之间的杂交组合为基础构建的(McCouchetal.1988)。在作物育种实践中,育种家常将野生种的优良性状转育到栽培种中,这种亲源关系较远的杂交转育,DNA多态性非常丰富。第二,选择亲本时应尽量选用纯度高的材料,并进一步通过自交进行纯化。第三,要考虑杂交后代的可育性。亲本间的差异过大,杂种染色体之间的配对和重组会受到抑制,导致连锁座位间的重组率偏低,并导致严重的偏分离现象,降低所建图谱的可信度和适用范围;严重的还会降低杂种后代的结实率,甚至导致不育,影响分离群体的构建。由于各种原因,仅用一对亲本的分离群体建立的遗传图谱往往不能完全满足基因组研究和各种育种目标的要求,应选用几个不同的亲本组合,分别进行连锁作图,以达到相互弥补的目的。第四,选配亲本时还应对亲本及其F1杂种进行细胞学鉴定。若双亲间存在相互易位,或多倍体材料(如小麦)存在单体或部分染色体缺失等问题,那末其后代就不宜用来构建连锁图谱。二、分离群体类型的选择根据其遗传稳定性可将分离群体分成两大类:一类称为暂时性分离群体,如F2、F3、F4、BC、三交群体等,这类群体中分离单位是个体,一经自交或近交其遗传组成就会发生变化,无法永久使用。另一类称为永久性分离群体,如RI、DH群体等,这类群体中分离单位是株系,不同株系之间存在基因型的差异,而株系内个体间的基因型是相同且纯合的,是自交不分离的。这类群体可通过自交或近交繁殖后代,而不会改变群体的遗传组成,可以永久使用。构建DNA连锁图谱可以选用不同类型的分离群体,它们各有其优缺点,因此应结合具体情况选用。(一)F2代群体F2群体是常用的作图群体,迄今大多数植物的DNA标记连锁图谱都是用F2群体构建的。不论是自花授粉植物,还是异花授粉植物,建立F2群体都是容易的,这是使用F2群体进行遗传作图的最大优点。但F2群体的一个不足之处是存在杂合基因型。对于显性标记,将无法识别显性纯合基因型和杂合基因型。由于这种基因型信息简并现象的存在,会降低作图的精度。而为了提高精度,减小误差,则必须使用较大的群体,从而会增加DNA标记分析的费用。F2群体的另一个缺点是不易长期保存,有性繁殖一代后,群体的遗传结构就会发生变化。为了延长F2群体的使用时间,一种方法是对其进行无性繁殖,如进行组织培养扩繁。但这种方法不是所有的植物都适用,且耗资费工。另一种方法是使用F2单株的衍生系(F3株系或F4家系)。将衍生系内多个单株混合提取DNA,则能代表原F2单株的DNA组成。为了保证这种代表性的真实可靠,衍生系中选取的单株必须是随机的,且数量要足够多。这种方法对于那些繁殖系数较大的自花授粉植物(如水稻、小麦等)特别适用。(二)BC1群体BC1(回交一代)也是一种常用的作图群体。BC1群体中每一分离的基因座只有两种基因型,它直接反映了F1代配子的分离比例,因而BC1群体的作图效率最高,这是它优于F2群体的地方。BC1群体还有一个用途,就是可以用来检验雌、雄配子在基因间的重组率上是否存在差异。其方法是比较正、反回交群体中基因的重组率是否不同。例如正回交群体为(A×B)×A,反回交群体为A×(A×B),则前者反映的是雌配子中的重组率,后者反映的是雄配子中的重组率。虽然BC1群体是一种很好的作图群体,但它也与F2群体一样,存在不能长期保存的问题。可以用F2中使用的类似方法来延长BC1群体的使用时间。另外,对于一些人工杂交比较困难的植物,BC1群体也不太合适,因为一是难以建立较大的BC1群体,二是容易出现假杂种,造成作图的误差。顺便一提,对于一些自交不亲和的材料,可以使用三交群体,即(A×B)×C。由于存在自交不亲和性,这样的三交群体中不存在假杂种现象。(三)RI群体RI(重组自交系)群体是杂种后代经过多代自交而产生的一种作图群体,通常从F2代开始,采用单粒传的方法来建立。由于自交的作用是使基因型纯合化,因此,RI群体中每个株系都是纯合的,因而RI群体是一种可以长期使用的永久性分离群体。理论上,建立一个无限大的RI群体,必须自交无穷多代才能达到完全纯合;建立一个有限大小的RI群体则只需自交有限代。然而,即使是建立一个通常使用的包含100~200个株系的RI群体,要达到完全纯合,所需的自交代数也是相当多的。据吴为人等(1997)从理论上推算,对一个拥有10条染色体的植物种,要建立完全纯合的RI作图群体,至少需要自交15代。可见,建立RI群体是非常费时的。在实际研究中,人们往往无法花费那么多时间来建立一个真正的RI群体,所以常常使用自交6~7代的“准”RI群体。从理论上推算,自交6代后,单个基因座的杂合率只有大约3%,已基本接近纯合。然而,由于构建连锁图谱时涉及到大量的DNA标记座位,因而虽然多数标记座位已达到或接近完全纯合,但仍有一些标记座位存在较高的杂合率,有的高达20%以上(李维明等2000)。尽管如此,实践证明,利用这样的“准”RI群体来构建分子标记连锁图谱仍是可行的。在RI群体中,每一分离座位上只存在两种基因型,且比例为1:1。从这点看,RI群体的遗传结构与BC1相似,也反映了F1配子的分离比例。但值得注意的是,当分析RI群体中两个标记座位之间的连锁关系时,算得的重组率比例并不等于F1配子中的重组率,这是因为在建立RI群体的过程中,两标记座位间每一代都会发生重组,所以RI群体中得到的重组率比例是多代重组频率的积累。不过,从理论上可以推算出,RI群体中的重组比例(R)与F1配子中的重组率(r)之间的关系为:R=2r/(1+2r)。因此,用RI群体仍然可以估计重组率,亦即RI群体仍然可以用于遗传作图。RI群体的优点是可以长期使用,可以进行重复试验。因此它除了可用于构建分子标记连锁图外,特别适合于数量性状基因座(QTL)的定位研究。但是,考虑到构建RI群体要花费很长时间,如果仅是为了构建分子标记连锁图的话,选用RI群体是不明智的。另外,异花授粉植物由于存在自交衰退和不结实现象,建立RI群体也比较困难。(四)DH群体高等植物的单倍体(Haploid)是含有配子染色体数的个体。单倍体经过染色体加倍形成的二倍体称为加倍单倍体或双单倍体(DH)。DH群体产生的途径很多,亦因物种不同而异,最常见的方法是通过花药培养,即取F1植株的花药进行离体培养,诱导产生单倍体植株,然后对染色体进行加倍产生DH植株。DH植株是纯合的,自交后即产生纯系,因此DH群体可以稳定繁殖,长期使用,是一种永久性群体。DH群体的遗传结构直接反映了F1配子中基因的分离和重组,因此DH群体与BC1群体一样,作图效率是最高的。另外,由于DH群体跟RI群体一样,可以反复使用,重复试验,因此也特别适合于QTL定位的研究。DH群体直接从F1花粉经培养产生,因而建立DH群体所需时间不多。但是,产生DH植株有赖于花培技术。有些植物的花药培养非常困难,就无法通过花培来建立DH群体。另外,植物的花培能力跟基因型关系较大,因而花培过程会对不同基因型的花粉产生选择效应,从而破坏DH群体的遗传结构,造成较严重的偏分离现象,这会影响遗传作图的准确性。因此,如果是以构建分子标记连锁图为主要目的的话,DH群体不是一种理想的作图群体。三、群体大小的确定遗传图谱的分辨率和精度,很大程度上取决于群体大小。群体越大,则作图精度越高。但群体太大,不仅增大实验工作量,而且增加费用。因此确定合适的群体大小是十分必要的。合适群体大小的确定与作图的内容有关。大量的作图实践表明,构建DNA标记连锁图谱所需的群体远比构建形态性状特别是数量性状的遗传图谱要小,大部分已发表的分子标记连锁图谱所用的分离群体一般都不足100个单株或家系。而如果用这样大小的群体去定位那些控制农艺性状尤其是数量性状的基因,就会产生很大的试验误差。从作图效率考虑,作图群体所需样本容量的大小取决于以下两个方面:一是从随机分离结果可以辨别的最大图距,二是两个标记间可以检测到重组的最小图距。因此,作图群体的大小可根据研究的目标来确定。作图群体越大,则可以分辨的最小图距就越小,而可以确定的最大图距也越大。如果建图的目的是用于基因组的序列分析或基因分离等工作,则需用较大的群体,以保证所建连锁图谱的精确性。在实际工作中,构建分子标记骨架连锁图可基于大群体中的一个随机小群体(如150个单株或家系),当需要精细地研究某个连锁区域时,再有针对性地在骨架连锁图的基础上扩大群体。这种大小群体相结合的方法,既可达到研究的目的,又可减轻工作量。作图群体大小还取决于所用群体的类型。如常用的F2和BC1两种群体,前者所需的群体就必须大些。这是因为,F2群体中存在更多种类的基因型,而为了保证每种基因型都有可能出现,就必须有较大的群体。一般而言,F2群体的大小必须比BC1群体大约大一倍,才能达到与BC1相当的作图精度。所以说,BC1的作图效率比F2高得多。在分子标记连锁图的构建中,DH群体的作图效率在统计上与BC1相当,而RI群体则稍差些。总的说来,在分子标记连锁图的构建方面,为了达到彼此相当的作图精度,所需的群体大小的顺序为F2>RI>BC1和DH。第二节DNA标记分离数据的数学处理一、分离数据的收集与数字化从分离群体中收集分子标记的分离数据,获得不同个体的DNA多态性信息,是进行遗传连锁分析的第一步。通常各种DNA标记基因型的表现形式是电泳带型,将电泳带型数字化是DNA标记分离数据进行数学处理的关键。下面以RFLP为例来说明将DNA标记带型数字化的方法。假设某个RFLP座位在两个亲本(P1,P2)中各显示一条带,由于RFLP是共显性的,则F1个体中将表现出两条带,而F2群体中不同个体的带型有三种,即P1型、P2型和F1(杂合体)型。可以根据习惯或研究人员的喜好,任意选择一组数字或符号,来记录F2个体的带型。例如,将P1带型记为1,P2带型记为3,F1带型记为2。如果带型模糊不清或由于其它原因使数据缺失,则可记为0。假设全部试验共有120个F2单株,检测了100个RFLP标记,这样可得到一个由100(行)×120(列)的、由简单数字组成的RFLP数据矩阵。进行DNA标记带型数字化的基本原则是,必须区分所有可能的类型和情况,并赋与相应的数字或符号。比如在上例中,总共有4种类型,即P1型、F1型、P2型和缺失数据,故可用4个数字1、2、3和0分别表示之。如果存在显性标记,则F2中还会出现两种情况。一种是P1对P2显性,于是P1型和F1型无法区分,这时应将P1型和F1型作为一种类型,记为4。另一种情况正好相反,P2对P1显性,无法区分P2型和F1型,故应将它们合为一种类型,记为5。对于BC1、DH和RI群体,每个分离的基因座都只有两种基因型,不论是共显性标记还是显性标记,两种基因型都可以识别,加上缺失数据的情况,总共只有3种类型。因而用3个数字就可以将标记全部带型数字化。在分析质量性状基因与遗传标记之间的连锁关系时,也必须将有关的表型数字化,其方法与标记带型的数字化相似。例如,假设在DH群体中,有一个主基因控制株高,那么就可以将株系按植株的高度分为高秆和矮秆两大类,然后根据亲本的表现分别给高秆和矮秆株系赋值,如1和2。将质量性状经过这样的数字化处理,就可以与DNA标记数据放在一起进行连锁分析。DNA标记数据的收集和处理应注意以下问题:(1)应避免利用没有把握的数据。由于分子多态性分析涉及许多实验步骤,很难避免出现错误,经常会遇到所得试验结果(如X-光片)不清楚等问题。如果硬性地利用这样没有把握的数据,不仅会严重影响该标记自身的定位,而且还会影响到其它标记的定位。因此,应删除没有把握的数据,宁可将其作为缺失数据处理,或重做试验。(2)应注意亲本基因型,对亲本基因型的赋值(如P1型为1,P2型为2),在所有的标记座位上必须统一,千万别混淆。如果已知某两个座位是连锁的,而所得结果表明二者是独立分配的,这就有可能是把亲本类型弄错引起的。(3)当两亲本出现多条带的差异时,应通过共分离分析鉴别这些带是属于同一座位还是分别属于不同座位。如属于不同座位,应逐带记录分离数据。二、遗传图距与物理距离对应关系的估计不同生物的1cM图距所对应的实际物理距离(碱基对数量)存在很大差异。一般而言,生物越低等或越简单,1cM图距平均对应的碱基对数量就越少(表3.1)。表3.1中给出的各种生物中遗传图距与物理距离之间的对应关系只是一个大约的平均值,实际上它变化很大。在一条染色体上,由于不同区域上发生交换的频率存在差异,因而遗传图距与物理距离之间的对应关系可以有很大的变化。例如,在着丝粒附近,染色体交换受到抑制,因而所估计的遗传图距小于平均对应的物理距离。在同一种生物中,两个特定基因座之间的遗传图距会因遗传背景的不同而改变,甚至有时由同一对亲本所产生的遗传背景相同的不同群体间也存在很大差异。表3.1 不同生物中单位图距所相当的平均物理距离物种基因组大小(kb)遗传图距(cM)kb/cM嗜菌体T41.6×1028000.2大肠杆菌4.2×1031,7502.4酵母2.0×1044,2004.8真菌2.7×1041,00027.0线虫8.0×104320250.0果蝇1.4×105280500.0水稻4.5×1051,500300.0小鼠3.0×1061,7001,800.0人类3.3×1063,3001,000.0玉米2.5×1062,5001,000.0三、构建DNA标记图谱的计算机软件遗传图谱的构建需要对大量标记之间的连锁关系进行统计分析。随着标记数目的增加,计算工作量常常呈指数形式增加,这是手工无法完成的。因此,必须借助计算机进行分析和处理。许多学者为构建遗传图谱设计了专用程序包,通过Internet网址/soft/list.html可以获得各种专用程序的相关信息,如软件的名称及简要介绍,源程序编码语言、支持的操作系统、执行程序的名称、参考文献以及获取软件的网址等。应用于植物遗传连锁分析和遗传图谱构建的常用软件有LINKAGE、MAPMAKER/EXP等。LINKAGE软件可通过ftp:///software/linkage获得,该软件是利用最大似然法估计两座位或多座位间的重组率和LOD值;MAPMAKER/EXP可通过ftp:///distri-bution/software/mapmaker3获得,该软件可以应用于各种类型的实验群体进行遗传作图,是目前应用最为广泛的作图软件之一。第三节DNA标记连锁图谱的完善一、DNA标记连锁群的染色体定位把分子标记所建立的连锁群与经典遗传图谱联系起来,并将其归属到相应的染色体上,是构建了一个比较饱和的分子图谱之后十分重要的工作。通常根据分子标记与已知染色体位置的形态标记的连锁关系来确定分子标记连锁群属于哪条染色体。还可以利用非整倍体或染色体结构变异材料,如水稻中利用三体、玉米中利用A/B易位系、小麦中利用缺体/四体染色体代换系等,将分子标记连锁群归属到相应的染色体上。以水稻为例,目前已获得全套12条染色体的初级三体(2n+1)。在水稻某种三体中,由于三体染色体有一式3份,其DNA含量为其它11条染色体的1.5倍。在DNA定量相当准确的条件下,用已知能检测某一连锁群的探针分别与12种三体的总DNA杂交。根据剂量效应,杂交强弱与同源序列的含量成正比,杂交后对应三体的DNA滤膜放射自显影显带强度将明显高于其它11种,由此可以判定该标记所对应的序列就在该三体染色体上。随着技术的进步,原位分子杂交的灵敏度已可以揭示单拷贝序列的杂交位点,因此采用原位分子杂交可以容易地将连锁群的分子标记定位到染色体上。要得到一个完整的遗传图谱,必须知道染色体上的标记与着丝粒之间的距离。一个完整的染色体具有以下几个主要部分:着丝粒、缢痕、随体及端粒,这些基本结构在生物染色体的运动与复制等方面起着重要的作用,其结构也是遗传图谱制作中不可忽视的重要部分。由于着丝粒并不是一个基因,不能从表型测知,因此采用常规的两点、三点乃至多点分析方法是无法确定标记与着丝粒之间的关系的。在经典遗传图谱的构建中,一般采用近端着丝粒染色体来对基因与着丝之间的距离进行定位。近端着丝粒染色体是正常染色体在着丝粒附近断裂形成的异常染色体。目前已获得小麦全部42条染色体的近端着丝粒染色体。利用染色体易位材料也可以判断着丝粒在染色体上的位置。一般易位点和着丝粒所在部分的交换被抑制,因而推算位于着丝粒两旁的易位点与标记基因间的重组率时一般都偏小。利用这个现象可以推算连锁图上着丝粒的位置。在细胞学上,利用已知易位点的易位系统进行基因分析也可知道着丝粒的位置。早在1945年,在玉米中就利用易位分析的结果推测了全部染色体的着丝粒位置。染色体上的端粒是指染色体的自然末端。在遗传图谱的构建中,端粒位置的确定就意味着为染色体的全长设定界标。传统的凝胶电泳方法由于分辨能力有限,大多数情况下无法将具有多态性的端粒片段区分开来。一般要借助具有高分辨率的脉冲场凝胶电泳(PFGE)才能将有差异的端粒片段分离开来。利用PFGE与切割位点稀少的限制性酶相结合,Wu和Tanksley(1993)研究了水稻端粒结构的特征,采用来自拟南芥的端粒探针,将三个水稻的端粒DNA电泳条带分别定位在第8、9、11染色体上,并证实了多态性的端粒片段不仅在遗传上而且在物理上与遗传图谱上最远端的RFLP标记相连锁。目前,在日本水稻基因组研究计划所构建的包含2275个标记的水稻分子连锁图中,除第9染色体之外,其余11条染色体的着丝粒(区)都已定位(Harushimaetal.1998)。另外,该图中的第5染色体短臂、第11染色体两臂以及第12染色体短臂的端粒也已定位。二、饱和DNA标记连锁图的制作遗传图谱饱和度是指单位长度染色体上已定位的标记数或标记在染色体上的密度。一个基本的染色体连锁框架图大概要求在染色体上的标记平均间隔不大于20cM。如果构建连锁图谱的目的是为了进行主基因的定位,其平均间隔要求在10~20cM或更小。用于QTL定位的连锁图,其标记的平均间隔要求在10cM以下。如果构建的连锁图谱是为了进行基因克隆,则要求目标区域标记的平均间隔在1cM以下。不同生物基因组大小有极大差异,因此满足上述要求所需的标记数是不同的。以人类和水稻为例,它们的基因组全长分别为3.3×106kb和4.5×105kb,如果构建一个平均图距为0.5cM的分子图谱,则所要定位的标记数就要分别达到6600和3000个。几种生物不同图谱饱和度下所需定位的标记数如表3.2所示。表3.2遗传图谱达到特定饱和度所需的标记数生物人类水稻玉米拟南芥番茄基因组大小(kb)(cM)kb/cM3.3×106330010004.5×10515003002.5×106250010007.0×1045001407.1×1051500473图谱饱和度20cM10cM5cM1cM0.5cM16533066033006600751503001

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论