版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Good is good, but better carries it.精益求精,善益求善。QTL定位中常见的12个问题-数量性状基因定位研究中若干常见问题的分析与解答李慧慧张鲁燕王建康*中国农业科学院作物科学研究所/国家农作物基因资源与基因改良重大科学工程/CIMMYT中国办事处,北京100081摘要:QTL作图是基因精细定位、克隆以及有效开展分子育种的基础,在利用QTL作图开展数量性状基因定位研究的过程中经常会碰到一些问题,与统计方法有关的一些问题包括:LOD的统计学意义是什么?检测QTL的可信度和LOD临界值的关系是什么?如何评价不同的QTL作图方法?提高QTL检测效率的途径有哪些?与遗
2、传参数估计有关的一些问题包括:QTL的贡献率是如何计算出来的?如何确定QTL有利等位基因的来源?选择基因型分析的有效性如何?复合性状是否适宜于QTL作图?与作图群体及遗传图谱有关的一些问题包括:QTL作图群体中表型数据是否要求服从正态分布?加密标记是否可以显著提高QTL检测功效?缺失分子标记对QTL作图有什么影响?奇异分离标记对QTL作图有什么影响?笔者试图结合我们多年的研究工作对这些具有共性的12个常见问题做出分析和解答,供科研工作者参考。关键词:数量性状;QTL作图;完备区间作图;似然比检验;功效分析AnalyticalAnswerstoFrequentlyAskedQuestionsin
3、QuantitativeTraitLocusMappingLIHui-Hui,ZHANGLu-Yan,andWANGJian-Kang*InstituteofCropSciences/NationalKeyFacilityforCropGeneResourcesandGeneticImprovement/CIMMYTChinaOffice,ChineseAcademyofAgriculturalSciences,Beijing100081,China本研究由国家自然科学基金项目(30771351)资助。第一作者联系方式:TelE-mail:lihuihui*通讯作者
4、(Correspondenceauthor):王建康,TelE-mail:wangjk;jkwangAbstract:QTLmappingisanimportantstepingenefinemapping,map-basedcloning,andtheefficientuseofgeneinformationinmolecularbreeding.QuestionsarefrequentlymetandaskedintheapplicationofQTLmappinginpracticalgeneticpopulations.Questionsrelatedtos
5、tatisticalmethodofQTLmappingare:whatdoesLODscoremean?WhatistherelationshipbetweenthereliabilityofdetectedQTLandtheLODthreshold?HowtoevaluatedifferentQTLmappingmethods?HowtoimprovetheQTLdetectionpower?Questionsrelatedtogeneticparameterestimationare:howtocalculatethephenotypicvarianceexplainedbyeachde
6、tectedQTL?HowtodeterminethesourceoffavorableallelesatdetectedQTL?Howefficientistheselectivegenotyping?CancompositetraitsbeusedinQTLmapping?Questionsrelatedtolinkagemapandmappingpopulationsare:Doesthephenotypeofatraitofinteresthavetofollowanormaldistribution?Doestheincreaseinmarkerdensitygreatlyimpro
7、veQTLmappingpower?WhateffectswillmissingmarkershaveinQTLmapping?WhateffectswillsegregationdistortionhaveinQTLmapping?Ourobjectiveinthispaperistoprovidetheanalyticalanswersto12frequentlyaskedquestions,basedonourstudiesinpastseveralyears.Keywords:Quantitativetrait;QTLmapping;Inclusivecompositeinterval
8、mapping;Likelihoodratiotest;Poweranalysis经典数量遗传学建立在多基因假说基础之上,把控制数量性状的基因作为一个整体,重点研究各种遗传效应与遗传方差的分解和估计,不区分个别基因在表型效应上的差异1-3。分子标记连锁图谱的大量出现,使得我们可以像研究质量性状基因一样研究数量性状基因,也可以把单个数量性状基因(quantitativetraitgeneorlocus,简称QTL)定位在染色体上,并估计其遗传效应,这一过程称为QTL作图或定位4。QTL作图是基因精细定位和克隆的基础,目前已成为数量性状遗传研究的常用方法。QTL定位结果可以帮助育种家获得目标性状的
9、遗传信息,借助与QTL连锁的分子标记在育种群体中跟踪和选择有利等位基因,提高选择的准确性和预见性。但是,在利用QTL作图开展遗传研究的过程中也经常碰到一些问题,这些问题大致可分为有关作图统计方法、有关遗传参数估计、以及有关作图群体及连锁图谱等三大类。笔者试图结合我们近些年的研究工作对具有共性的12个问题做出分析和解答,供广大科研工作者在利用QTL作图开展遗传研究时参考。与作图统计方法有关的四个问题是:LOD的统计学意义是什么?检测QTL的可信度和LOD临界值的关系是什么?如何评价不同的QTL作图方法?提高QTL检测效率的途径有哪些?与遗传参数估计有关的四个问题是:QTL的贡献率是如何计算出来的
10、?如何确定QTL有利等位基因的来源?选择基因型分析的有效性如何?复合性状是否适宜于QTL作图?与作图群体及遗传图谱有关的四个问题是:QTL作图群体中表型数据是否要求服从正态分布?加密标记是否可以显著提高QTL检测功效?缺失分子标记对QTL作图有什么影响?奇异分离标记对QTL作图有什么影响?1QTL作图中的统计学问题1.1LOD的统计学意义是什么?区间作图(Intervalmapping,简称IM)5、复合区间作图(Compositeintervalmapping,简称CIM)6和完备区间作图(Inclusivecompositeintervalmapping,简称ICIM)4,7-9均利用极大
11、似然估计原理,通过一维扫描在全基因组上逐点检测QTL的存在。检验的零假设(H0)是扫描位点上不存在QTL,备择假设(HA)是扫描位点上存在一个QTL,似然比统计量(LRT)用来衡量扫描位点上存在QTL的可能性大小。似然比统计量的一般定义是,其中ln是自然对数函数,L0是H0下似然函数的极大值,LA是HA下似然函数的极大值。似然比统计量大多数情况下有很好的统计学性质,即渐近服从分布,分布的自由度为两种假设下独立变量个数之差,因此容易确定给定显著性水平下检验统计量的临界值。一些研究表明QTL作图时的似然比统计量可能不服从单一分布,但却可以用2个不同自由度的混合分布来近似6,10,因此也可以确定给定
12、显著性水平下检验统计量的临界值。Lander和Botstein在提出IM的同时也提出利用人类遗传研究中常用的LOD(Likelihoodofodd)值作为检验QTL是否存在的标准5。LOD值定义为极大似然函数比的常用对数,即,。因此,若LA是L0的10倍,则LOD=1;如果LA是L0的100倍,则LOD=2;如果LA是L0的1000倍,则LOD=3。根据LOD值和LRT值的定义,不难得到它们之间有如下关系:或。1.2检测QTL的可信度和LOD临界值之间的关系是什么?与其他假设检验一样,QTL作图中的检验也可产生四种结果(图1)。当一个位点上没有QTL,通过测验却错误地判断有QTL存在,称这种现
13、象为假阳性;当一个位点上有QTL,通过测验判断有QTL存在,称这种现象为真阳性;当一个位点上有QTL,通过测验却错误地判断没有QTL存在,称这种现象为假阴性;当一个位点上没有QTL,通过测验判断没有QTL存在,称这种现象为真阴性。假阳性和假阴性是统计测验中的两类错误,犯第一类错误(或假阳性)的概率()等于H0为真时被拒绝的概率,即,=P拒绝H0|H0为真=P假阳性/P假阳性+P真阴性。犯第二类错误(或假阴性)的概率()等于H0为假时未被拒绝的概率,即,=P未拒绝H0|H0为假=P假阴性/P假阴性+P真阳性。对于特定的检验方法而言,在一定的试验精确度下,降低则会提高,降低则会提高,同时降低和的途
14、径是提高试验精确度和增加样本量。犯第一类错误的概率一般在检验前设定,对一定的检验方法,给定后也是确定的。但是除t-测验外,大多数统计假设检验给定下的难以用代数解析式表示出来。表1前5列给出LOD值1.05.0时对应的LRT值以及三种自由度下一次检验中犯第一类错误概率,犯第一类错误概率有时也叫做显著性概率;后4列给出显著性概率0.10.0001时对应的LOD临界值。以自由度2为例,LOD=1.30对应的显著性概率为0.05,如果只做一次假设检验,采用这样的LOD临界值就能保证假阳性的概率不超过0.05,即鉴定出的QTL是假阳性的概率低于0.05,或者说鉴定出的QTL为真的概率超过0.95。基于区
15、间测验的QTL作图,一般在基因组内所有染色体上按一定步长逐点检验QTL的存在,而这些检验又不是完全独立的,因此也很难确定一次检验的显著性水平所对应的全局。例如,如果每次检验均采用临界值LOD=3,当自由度为2时每个扫描位置对应的近似为0.001,QTL作图需要知道的是全基因组检验后的。由于QTL作图的复杂性,如涉及到多次非独立假设检验,不同物种有不同大小的基因组,不同作图群体有不同的标记数,零假设下似然比检验统计量服从什么样的渐近分布尚无定论,因此难以准确确定LOD临界值对应的一次检验和全局,但一些非参数统计方法已用于给定全局后LOD临界值的确定11-12。一般认为采用23的LOD临界值可以把
16、全局控制在0.05以内,在显性QTL和互作QTL作图中,似然比统计量有较大的自由度,还可适当考虑采用较高的临界值,如34。但通过理论或模拟,进一步明确QTL作图中似然比检验统计量的渐近分布还是必要的,笔者推测渐近分布可能与染色体条数、每条染色体长度、标记密度和QTL遗传效应类型等因素有关。与所有假设检验一样,采用较高的LOD临界值会更好地控制假QTL的发生,同时遗传效应较小的真QTL却不易被检测出来。如何平衡两类错误的概率,这不仅仅是统计学问题,还要考虑到具体的研究目标。如果QTL作图只是初步确定基因在染色体上的位置,然后根据作图结果构建其他次级群体对检测到的QTL进行精细定位、甚至图位克隆,
17、然后开展转基因工作,这类研究几乎不容许假QTL的发生。此时要适当提高检验QTL时的LOD临界值,保证后续研究中QTL的可靠性。另一方面,如果研究目标是把QTL作图结果用于标记辅助选择聚合育种,这时只有尽可能多地检测出控制育种目标性状的QTL,才能保证对所有控制育种性状的基因进行选择,因此有必要适当降低检验QTL时的LOD临界值,使得遗传效应较小的QTL也有机会被检测出来。此时即使有一些假QTL的存在,也不至于造成很大的损失。图1QTL定位中假设检验的两类错误。阴影部分表示检验统计量LOD值的分布,LOD0表示临界值Fig.1TwotypesoferrorinhypothesistestinQT
18、Lmapping.TheshadowarearepresentsthedistributionoftheteststatisticLODscore,andLOD0isthethresholdvalue表13种自由度下不同LOD值对应的犯第一类错误概率()和不同下对应的LOD临界值Table1ThecorrespondingprobabilitiesoftypeIerrortoLODandthecorrespondingLODthresholdtothesignificanceprobabilitiesunderthreedegreesoffreedomLODLRTLODdf=1df=2df=3
19、df=1df=2df=31.004.610.0317860.0997590.2026860.10.591.001.362.009.210.0024070.0100020.0266250.050.831.301.703.0013.820.0002010.0009980.0031610.011.442.002.464.0018.420.0000180.0001000.0003600.0012.353.003.535.0023.030.0000020.0000100.0000400.00013.294.004.581.3如何评价不同的QTL作图方法?图2给出一个模拟的加倍单倍体(DH)群体中ICIM
20、、CIM和IM三种方法的LOD值和估计遗传效应的曲线图。遗传模型中包含7个QTL,第1染色体上1个,第2和4染色体上分别有2个相引相连锁QTL,第3染色体上有2个互斥相连锁QTL,所有QTL遗传效应的绝对值为1,效应的方向如图2箭头所示。从图中我们可以很直观地看到不同QTL作图方法找到的QTL不尽相同,IM无法准确定位连锁QTL,CIM无法准确定位互斥连锁的QTL。统计检验的功效定义为,即发现真QTL的概率,常用来比较不同统计方法的有效性。QTL作图包含着复杂的统计假设检验,难以从理论上推导出不同QTL作图方法的统计功效。一般采用模拟方法比较不同方法QTL检测功效和假阳性的大小,功效高同时又具
21、有较低假阳性在统计上就是较好的方法。我们用独立遗传模型说明功效的计算(表2),假定基因组包含10条染色体,每条长度160cM且均匀分布17个标记,8个QTL(IQ1IQ8)分别位于前8条染色体,另外2条为空白染色体。为简单起见,我们用IQ2、IQ5、IQ6和IQ7说明功效的计算,4个QTL分别解释2%、5%、10%和20%的表型变异(即PVE)。假定表型方差为1.0,这样加性遗传效应等于PVE的平方根(表2)。模拟4个DH群体,群体大小均为200,每个群体中ICIM和IM检测到的所有超过LOD临界值2.5的QTL列于表3,用于统计每个QTL检测功效以及假阳性。以第一个模拟群体为例,ICIM检测
22、到5个QTL,其中3个分别位于第5、6和7条染色体的51.10、60.00和70.00cM处,分别落在了IQ5、IQ6和IQ7的10cM置信区间内(表3),因此当置信区间为10cM时把IQ5、IQ6和IQ7的统计功效加1;第2条染色体上检测到一个QTL,与IQ2的距离为6.90cM,不在IQ2的10cM置信区间内,第7条染色体上40cM处检测到一个QTL,既不在IQ7的10cM置信区间内也不在其20cM置信区间内,因此判定为假阳性。同理,IM发现4个QTL,其中两个分别位于第6和7染色体的60.00cM和70.00cM处,分别落在IQ6和IQ7的10cM置信区间内,这2个QTL对应的功效加1,
23、另外2个不在这4个QTL的10cM置信区间内,因此判定为假阳性。按照上述算法,对于4次模拟来说,在LOD临界值2.5下当置信区间为10cM时(表3),ICIM检测IQ2、IQ5、IQ6和IQ7的功效分别为2、1、3和2,即IQ2在4次模拟中被检测到2次,IQ5被检测到1次,IQ6被检测到3次,IQ7被检测到2次;IM检测4个独立QTL的功效分别为1、0、3和2。ICIM检测到的16个QTL中有8个假阳性,IM检测到的13个QTL中有7个假阳性。当置信区间为20cM时(表3),ICIM检测IQ2、IQ5、IQ6和IQ7的功效分别为3、2、4和4,IM的检测功效分别为1、1、3和4;ICIM检测到
24、的16个QTL中有3个假阳性,IM检测到的13个QTL中有4个假阳性。因此通过100甚至1000次的模拟,就能得到准确的检测功效和假阳性率,从而判断不同QTL作图方法的有效性。图2200个加倍单倍体家系群体中区间作图、复合区间作图和完备区间作图的比较Fig.2Comparisonofintervalmapping,compositeintervalmappingandinclusivecompositeintervalmappinginasimulatedpopulationwith200doubledhaploidlines.假定一个基因组包含6条染色体,每条长度为120cM,等距离分布13
25、个标记,第1条染色体上35cM处存在1个QTL,第2、3、4条染色体上都在35和68cM处存在2个QTL,图中箭头表示QTL的近似位置,朝上箭头表示QTL的加性效应为正,朝下箭头表示QTL的加性效应为负,效应的绝对值均为1。Agenomewith6chromosomeswasassumed,eachof120cMandevenlydistributedwith13markers.OneQTLwaslocatedat35cMonchromosome1,andtwoQTLwerelocatedat35and68cMonchromosomes2,3,and4.Arrowspointedtotheap
26、proximateQTLpositions.UpwardarrowsindicatedtheQTLhavepositiveeffects,whiledownwardarrowsindicatedtheQTLhavenegativeeffects.Theabsolutegeneticeffectis1forallQTL.表28个独立遗传QTL在基因组中的位置、加性遗传效应、解释表型变异的百分数以及10cM和20cM置信区间Table2EightindependentQTLandtheirchromosomalpositions,additiveeffectsandexplainedphenoty
27、picvariation(%),alongwiththe10cMand20cMconfidenceintervals(CI)QTL染色体Chromosome位置Position(cM)加性效应Additive贡献率PVE(%)置信区间Confidenceinterval(CI)CI=10cMCI=20cMIQ11250.10001(20cM,30cM)(15cM,35cM)IQ22320.14142(27cM,37cM)(22cM,42cM)IQ33390.17323(34cM,44cM)(29cM,49cM)IQ44460.20004(41cM,51cM)(36cM,56cM)IQ55530
28、.22365(48cM,58cM)(43cM,63cM)IQ66600.316210(55cM,65cM)(50cM,70cM)IQ77670.447220(62cM,72cM)(57cM,77cM)IQ88740.547730(69cM,79cM)(64cM,84cM)表3利用4个模拟DH群体计算完备区间作图和区间作图两种方法的检测功效和假阳性,QTL置信区间长度分别是10cM或20cMTable3CalculationofpowerandfalseQTLinfoursimulatedDHpopulationsforICIMandIM.Theconfidenceintervalofeachp
29、redefinedQTLis10or20cM.Pop完备区间作图Inclusivecompositeintervalmapping区间作图Intervalmapping染色体Chromosome位置Position加性效应AdditiveLODPVE(%)CI=10cMCI=20cM染色体Chromosome位置Position加性效应AdditiveLODPVE(%)CI=10cMCI=20cM1225.100.192.563.48FalseQTLIQ2547.100.262.716.74FalseQTLIQ5551.100.296.058.14IQ5IQ566.700.252.516.15
30、FalseQTLFalseQTL660.000.306.728.86IQ6IQ6660.000.303.998.77IQ6IQ6740.000.202.943.71FalseQTLFalseQTL770.000.5213.3926.53IQ7IQ7770.000.4211.8716.64IQ7IQ72230.500.275.357.78IQ2IQ2230.000.304.389.59IQ2IQ2545.000.275.257.94FalseQTLIQ5660.000.283.818.39IQ6IQ6659.100.264.947.50IQ6IQ6763.900.438.9019.44IQ7IQ
31、7759.400.389.8415.61FalseQTLIQ73230.000.212.503.96IQ2IQ2656.200.313.668.81IQ6IQ6655.400.294.477.81IQ6IQ6772.600.489.5521.01FalseQTLIQ7770.000.284.427.14IQ7IQ7786.300.478.9419.93FalseQTLFalseQTL790.000.253.395.41FalseQTLFalseQTL7108.000.385.7713.04FalseQTLFalseQTL4669.300.222.654.99FalseQTLIQ6760.000
32、.314.579.99FalseQTLIQ7760.000.335.8711.34FalseQTLIQ71038.70-0.263.047.18FalseQTLFalseQTL1038.90-0.232.925.70FalseQTLFalseQTL1.4提高QTL检测功效的途径有哪些?统计上提高假设检验功效的途径主要是增加样本量和减小试验误差,对QTL作图来说就是增大作图群体、减小表型测定时的误差(即提高性状的遗传力)。以ICIM为例,增大群体对提高QTL检测功效是明显的(图3)。对大小为100、200和400的群体来说,把PVE=4%的QTL定位到10cM置信区间内的概率分别为29%、67%
33、和91%;而把PVE=10%的QTL定位到10cM置信区间内的概率分别为79%、97%和100%。减小表型误差则间接提高单个QTL的贡献率13,如果通过降低表型误差把QTL对表型的贡献率由4%提高到5%,对大小为100、200、400的群体来说,检测功效则分别由29%、67%和91%提高到44%、77%和94%。因此,QTL作图研究中作图群体在资源允许的条件下要尽可能地大,同时表型鉴定时要尽量减小随机误差。当然对受环境影响大并具有较大基因型和环境互作的性状,还要在多地点/多年份进行表型鉴定。降低表型变异也可间接提高PVE,从而提高QTL的检测功效。遗传研究中近等基因系和染色体片断置换系14-1
34、5都是通过这种途径提高遗传分析的可靠性。举例来说,假定某群体中3个独立遗传QTL的遗传方差分别为0.1、0.2和0.3,误差方差为0.4,因此3个QTL分别解释10%、20%和30%的表型变异,在这3个QTL的近等基因系中假定QTL的遗传效应和误差方差保持不变,那么3个QTL近等基因系群体的表型方差分别为0.5、0.6和0.7,3个QTL解释的表型变异则增加到20%、33%和43%,因此在这3个近等基因系群体中进行QTL定位研究将更加有效。图3QTL的检测功效与群体大小的关系Fig.3RelationshipbetweenQTLdetectionpowerandmappingpopulatio
35、nsize2QTL作图中的遗传学问题2.1QTL的贡献率是如何计算出来的?一个QTL所解释表型变异(PVE,又称为QTL的贡献率)的计算公式是:,其中VG是QTL的遗传方差,VP是表型方差。在一个无奇异分离的群体中,QTL的遗传方差只依赖于QTL的遗传效应,效应大的QTL同时也具有较高的PVE;如果存在奇异分离,QTL的遗传方差除依赖于QTL的遗传效应外,还依赖于基因型频率,这时效应大的QTL,其PVE不一定就高。以F2群体为例,假定QTL三种基因型QQ、Qq和qq的频率为f2、f1和f0,QTL的加显性效应为a和d,1例如,一个QTL的加显性效应均为,即完全显性,当f2=0.25、f1=0.
36、5和f0=0.25即不存在奇异分离时,VG=0.75;当f2=0.4、f1=0.5和f0=0.1时,VG=0.36;当f2=0.5、f1=0.5和f0=0.0时,VG=0,这时QTL无法被检测出来。大多数作图软件中,QTL的遗传方差都是根据三种QTL基因型的观测频率计算得出,因此QTL作图研究中,出现遗传效应大而PVE偏低的情形也是正常的。QTL间的互斥连锁甚至可能造成单个QTL的PVE或两个QTL的PVE之和超过100%的情形。假定亲本的基因型为Q1Q1Q2Q2和q1q1q2q2,a1和a2分别为2个连锁QTL的加性效应,2个位点间的重组率为r。在双亲衍生的DH群体中,4种基因型频率和基因型
37、值如表4。RIL群体中,只需将r用代替。2个QTL的遗传方差分别为和,总遗传方差为:因此,只有在r=0.5的情况下,才有。当2个QTL间存在连锁并且a1和a2的效应方向相反时(即处于互斥连锁状态),造成2个QTL的PVE之和甚至单个QTL的PVE大于100%的情况。例如,不考虑随机环境误差和其他遗传变异,当a1=1.0,a2=-1.0,r=0.1,时,表型方差,故两个QTL理论PVE均为125%。在这样的遗传模型下,ICIM仍然可以较准确地定位到两个紧密连锁的QTL,效应的估计也是近似无偏的(图4)。因此当QTL间存在连锁时,2个QTL所解释的遗传方差不等于它们遗传方差之和,即方差不具有可加性
38、,因此由方差计算出的PVE之间也不具可加性。表4两个连锁QTL在DH群体中4种基因型的频率和基因型值,a1代表Q1q1的加性遗传效应,a2代表Q2q2的加性遗传效应Table4FrequenciesandgenotypicvaluesoffourgenotypesattwolinkedQTLinaDHmappingpopulation,wherea1istheadditiveeffectofQ1q1,anda2istheadditiveeffectofQ2q2.基因型Genotype频率Frequency基因型值GenotypicvalueQ1Q1Q2Q2a1+a2Q1Q1q2q2a1a2q1
39、q1Q2Q2a1+a2q1q1q2q2a1a2图4一个模拟的包含200个加倍单倍体家系作图群体。Fig.4QTLmappinginasimulatedpopulationof200doubledhaploidlines.一条长度为120cM的染色体上有一对重组率为0.1的互斥连锁QTL,遗传效应分布为1.0和1.0,随机误差方差假定为0.4,标记间的距离为2cM。TwoQTLarelinkedintherepulsionphaseononechromosomeof120cM.GeneticeffectsofthetwoQTLare1.0and1.0,respectively.Varianceo
40、frandomerroris0.2,anddistancebetweenmarkersis2cM.2.2如何判断QTL有利等位基因的来源?确定每个QTL上有利等位基因的来源是把作图结果应用于分子育种的前提15。假设一个QTL上有两个等位基因Q或q,分别代表两个亲本中的等位基因,这样就有3种可能的基因型:QQ、Qq和qq。我们用表示P1(QQ)的平均表现,表示P2(qq)的平均表现,表示F1(Qq)的平均表现,并且qq代表较小的亲本基因型,QQ表示较大的亲本基因型。m表示中亲值,即两个亲本的平均值,记为。亲本离中亲值的距离为a,或者说,即a为大值亲本(QQ)与小值亲本(qq)之差的一半,是正值。
41、F1离中亲值m的离差为d,其值可正可负(图5)。亲本与中亲值之差a称为加性效应,F1与中亲值之差d称为显性效应,这就是经典数量遗传中的加显性遗传模型3。Q对q并不一定具有显性,只表示取较大值或有较大的效应,所以可以是无显性,可以是部分显性,也可以是完全显性或超显性3。QTL作图中常用2、1和0分别表示3种标记或QTL的基因型,以亲本Harrington和TR306衍生的大麦DH群体4,8,16为例。亲本Harrington和TR306的平均粒重分别为38.7mg和45.0mg,QTL作图时分别用2表示Harrington的标记型、0表示TR306的标记型。因此如果加性效应为正,说明Harrin
42、gton携带的等位基因起到增加粒重的作用,TR306携带的等位基因则起到降低粒重的作用;如果某个QTL加性效应为负值,说明Harrington携带的等位基因起到降低粒重的作用,TR306携带的等位基因则起到增加粒重的作用。从表5的结果来看,9个被检测到的控制粒重的QTL中有6个具有负的加性效应,说明这6个QTL上提高粒重的等位基因来源于粒重较高的亲本TR306,但亲本Harrington在qKWT2-1、qKWT2-3和qKWT3-2这3个QTL上携带着提高粒重的等位基因,这些基因解释了群体中的超亲分离现象。育种中高粒重一般来说是理想性状,因此在利用粒重QTL作图结果开展单标记或区间标记辅助选
43、择时,对qKWT2-1、qKWT2-3和qKWT3-2应该选择亲本Harrington的标记类型,其他QTL应该选择亲本TR306的标记类型,这样才能选择到所有增加粒重的等位基因。图5一个位点的数量性状加显性遗传模型Fig.5Theone-locusadditiveanddominancegeneticmodelofquantitativetraits表5大麦DH群体中检测到的粒重QTLTable5QTLofkernelweightidentifiedinthebarleyDHpopulation.QTLICIM(PIN=0.01,POUT=0.02)Selectivegenotyping选择
44、基因型分析位置Position(cM)左侧连标记Leftflankingmarker(cM)右侧连标记Rightflankingmarker(cM)加性效应AdditiveLODPVE(%)LODqKWT2-18374.3083.400.394.163.040.53qKWT2-2139130.90142.10-0.465.284.232.44qKWT2-3201195.40201.700.455.604.204.36qKWT3-100.000.00-0.353.352.410.02qKWT3-22217.2025.200.578.006.502.97qKWT4125124.80140.10-0
45、.312.731.953.55qKWT553.807.00-1.3832.1938.2719.82qKWT7-143.407.60-0.567.816.383.55qKWT7-29592.6097.70-0.9418.8617.519.41LODscoreofselectivegenotypingisatthenearestmarkerofthecorrespondingQTLidentifiedbyICIM.Inselectivegenotyping,theselectedproportionwas25%foreachtail.LODscorefromselectivegenotypingi
46、sinboldwhenitishigherthanLODthreshold2.5.2.3选择基因型分析的有效性如何?QTL定位和基因精细定位时通常利用全群体分析方法,但是全群体分析需要测定群体中所有个体的表现型和基因型,要检测到微效的QTL需要大量的样本才能达到相应的功效,花费较高。相比较,选择基因型分析(selectivegenotyping)一般利用分离群体的双尾或单尾极端表型个体,分析标记与QTL的连锁关系,检验标记基因型在两极端类型内的分离比例是否偏离孟德尔规律,是一种花费较低的方法,常常被用于检测控制质量性状的主效QTL17-20。在对数量性状遗传分析时,选择基因型分析的QTL检测效
47、率如何呢?通过模拟分析大量遗传模型下多种因素对选择基因型作图结果的影响,并利用真实群体比较选择基因型分析与全群体作图结果的差异20,我们得到以下结论(表5,图6)。选择基因型分析的检测功效一般都高于IM的检测功效,但是低于ICIM的检测功效。增大群体能迅速提高选择基因型分析的检测功效,在不同群体大小下,选择比例介于0.150.35时检测功效较高。而对于连锁QTL,增大标记密度有助于检测连锁QTL。选择基因型分析对加性QTL的检测功效不受它们之间互作效应的影响。换句话说,两个互作的加性QTL检测功效与这两个QTL只有加性没有上位效应时的检测功效相当。选择基因型分析无法检测到只存在上位性而没有加性
48、效应的QTL。利用真实群体(包括RIL,DH,BC,F2群体)比较选择基因型分析与全群体ICIM的结果,发现对于只存在加性效应的群体,两种方法的作图结果一致性较好,而对于F2群体,选择基因型分析只能检测到加性QTL,并且双向选择的作图效果远远优于单向选择的。图6大麦DH群体完备区间作图和选择基因型分析作图结果Fig.6MappingresultsforabarleyDHpopulationunderinclusivecompositeintervalmappingandselectivegenotyping2.4复合性状是否适宜于QTL作图?植物育种中,有不少性状可以看作是由两个或两个以上性状
49、的代数运算得到的,如玉米雌雄开花间期等于雌穗开花期减去雄穗开花期,水稻籽粒的长宽比等于粒长除以粒宽。为了便于叙述,我们把通过单独测量得到性状值的性状称为构成性状,由若干构成性状经过代数运算得到的性状称为复合性状。不少研究者利用构成性状和复合性状同时进行作图,有时会发现一些复合性状独有的QTL,但对复合性状QTL作图的理论根据和有效性缺乏了解。其实复合性状的使用使得遗传模型变得更为复杂,为说明这一点,假定分别有2个独立遗传QTL控制2个构成性状(表6),加性遗传效应均为1,性状I和II的群体平均数分别为25和20。可以证明4个QTL在和性状上的遗传效应均为1、在差性状上的遗传效应分别为1、1、1
50、和1,在积和商性状上的遗传效应不仅与QTL在构成性状中的效应有关,而且还依赖于群体平均数(表6)。进一步还能证明除加性效应外,4个QTL在积和商性状上还存在互作效应(表6),因此复合性状的遗传效应也比构成性状更为复杂21。模拟研究也表明,对于独立的QTL而言,复合性状的遗传力与构成性状基本一致,而对于连锁的QTL,积和商性状的遗传力有所下降(表7)。对于不同的遗传模型,与构成性状相比,复合性状的检测功效始终会有不同程度的降低,而且错误发现率会升高;选择较大的作图群体,复合性状检测功效下降的程度会减小,同时错误发现率也会略有减小,但错误发现率仍然高于构成性状(表7)。QTL间连锁的存在,不利于复
51、合性状作图,检测功效会大大降低,QTL的效应和位置的估计不准确;当连锁距离大于或等于35cM时,复合性状效应和位置的估计基本无偏,但检测功效仍然低于构成性状。构成性状间的正相关会极大地降低差与商性状的检测功效,而构成性状间的负相关会极大地降低和与积性状的检测功效,但不管是正相关或是负相关,构成性状的QTL检测功效都高于复合性状的检测功效。复合性状独有QTL的遗传机制尚不明确,模拟试验显示检测到的复合性状独有QTL可能是由构成性状中的微效QTL引起的。与构成性状相比,复合性状受较多QTL控制、QTL具有更复杂的遗传效应和连锁关系、QTL作图功效比构成性状下的功效明显下降,因此使用复合性状作图的意
52、义不大。复合性状在遗传和育种中的使用应充分考虑二者有着不同的研究目标,遗传研究在于尽可能多地了解控制目标性状基因的遗传规律,构成性状受较少QTL控制、具有较简单的遗传模型,因此易于研究单个QTL的遗传;育种的目的是要同时选择尽可能多的有利基因和基因组合。与多性状选择指数3类似,复合性状的选择可以同时选择影响多个性状的有利等位基因,适度提高育种效率。因此,QTL作图研究中应谨慎使用复合性状,但这并不是排除育种中使用复合性状进行选择。表6构成性状和复合性状的理论遗传效应,假定各有2个QTL控制2个构成性状Table6ThetheoreticalQTLeffectsoftwoindividualtr
53、aitsandfourcompositetraits,assumingeachindividualtraitiscontrolledbytwoQTL.QTL染色体Chromosome位置Position(cM)加性效应Additive性状ITraitI性状IITraitII和性状Addition差性状Subtraction积性状Multiplication商性状DivisionQ11181.01.01.0200.0503Q22281.01.01.0200.0503Q33531.01.0-1.025-0.0631Q44631.01.0-1.025-0.0631群体均值Populationmean
54、25204555001.2563表7利用构成性状和复合性状的QTL检测功效Table7QTLdetectionpowerofindividualandcompositetraits参数ParameterQTL性状ITraitI性状IITraitII和性状Addition差性状Subtraction积性状Multiplication商性状Division功效Power(%)Q195.1069.6069.3055.2050.50Q294.8069.8070.4054.1050.90Q392.5067.2065.3076.9075.20Q494.5068.4065.4077.8075.20错误发现率
55、Falsediscoveryrate(%)21.6322.9827.4228.0528.0729.68位置估计Estimatedposition(cM)Q118.5418.5518.6218.3618.45Q228.4628.4928.3828.4428.52Q352.6552.6852.6152.7552.65Q462.8562.8362.6362.8862.58加性效应估计EstimatedadditiveeffectQ11.001.101.1123.320.06Q21.011.091.1123.420.06Q31.001.11-1.1126.46-0.07Q41.001.10-1.122
56、6.61-0.073QTL作图有关作图群体及遗传图谱的问题3.1QTL作图群体中的表型数据是否要求服从正态分布?一些QTL应用研究论文中,误以为表型数据的正态分布是QTL作图的前提。其实大部分作图方法只是要求表型数据的随机误差项服从正态分布,数量性状只有在多基因假说下才真正符合正态分布,表型数据的非正态并不影响QTL作图。一般地,个体的表型是群体平均数、遗传型值G和随机误差效应之和,即统计模型3。加显性模型下包含q个QTL的遗传模型为,其中wj和vj是第j个QTL基因型的指示变量4,9,因此G一般服从多项分布,而则要求服从正态分布,并且是大多数统计方法建模的前提。在多基因假说下,G服从正态分布
57、,因此P也服从正态分布。当QTL的个数较少、并存在少数遗传效应较大的QTL时,P将不服从正态分布。举例说明,假定长度为160cM的染色体25cM处有一QTL解释80%的表型变异,遗传效应为1.0,群体平均数为10。图7为一个模拟作图群体中性状的次数分布,作图群体包含200个DH家系,表型数据明显不服从正态分布。ICIM一维扫描结果(图7)表明LOD在27cM处达到峰值88.44,对应位置的遗传效应估计值为0.9989,解释81.12%的表型变异。图7一个表型非正态的模拟作图群体及其QTL作图结果。染色体25cM处有一QTL解释80%的表型变异,遗传效应为1.0,作图群体包含200个加倍单倍体家
58、系Fig.7QTLmappinginasimulatedpopulationwith200doubledhaploidlinesthatdonotfollowanormaldistribution.OneQTLissimulatedat25cMonthechromosome,explaining80%ofthephenotypicvariation3.2加密标记是否可以显著提高QTL检测功效?问题1.2中列出了统计学上提高假设检验功效的2个主要途径,即提高样本量和降低表型误差。从实际应用角度来看,在一个已建成的群体一般难以再增加个体数,人们有时候关心是否可以通过加密标记来更准确地定位QTL。在
59、图3模拟实验的基础上,我们又模拟了两种标记密度(MD),即5和20cM(图8)。MD为5、10和20cM时需要总的标记数分别为330、170和90,当标记数由密度为10cM时的170减少到密度为20cM时的90个时,对于PVE小于10%的QTL,即使群体大小为600,10cM置信区间检测功效也有明显的下降;对于PVE大于10%的QTL,随着群体的增大,检测功效接近于100%,但对于较小的群体,检测功效也有明显的下降。当标记数由密度为10cM时的170增加到密度为5cM时的330时,只有PVE=1%的QTL的检测功效才有明显的变化,其它QTL检测功效的增加不明显。对于一般有100200个体的作图
60、群体,QTL连锁作图中每隔10cM左右有一个分子标记可能就足够了13。与IM和ICIM相比,ICIM可以更好地检测连锁QTL(图2)。当然连锁程度对检测功效有较大影响,如果2个QTL分布在同一个标记区间内,可能所有的方法都难以检测到。ICIM要求连锁QTL间至少有一个空白区间7,即分隔QTL,因此更密的标记更有可能把连锁QTL变成分隔QTL,也更容易被检测出来。假定在长度为160cM的一条染色体上22cM和42cM处分布2个等效相引相QTL,分别解释31%的表型变异,图9给出群体大小为100、300和500时100个群体的ICIM平均LOD曲线图。当MD为20cM时,2个QTL位于2个相邻的标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年智能制造成套装备项目投资申请报告代可行性研究报告
- 2023年体外诊断试剂资金申请报告
- 银行内部控制审计程序制度
- 银行档案管理制度
- 采购档案管理与保密制度
- 市级讲课比赛课件新时代的劳动者
- 梁良良教授课件:创新思维与创新方法
- 大学物资设备采购合同(进口设备)
- 房屋转让居间合同(30篇)
- 了解法律制度自觉遵守宪法
- 2024年资格考试-WSET二级认证考试近5年真题附答案
- 12J201平屋面建筑构造图集(完整版)
- 22-深化设计方案
- 2024山东高速路桥集团股份限公司校园招聘430人高频难、易错点500题模拟试题附带答案详解
- 人教版历史2024年第二学期期末考试七年级历史试卷(含答案)
- 宠物店转让接手协议书模板
- 苏教版数学小学四年级上学期试卷与参考答案(2024-2025学年)
- 20以内的加法口算练习题4000题 284
- 2021-2022学年北京市东城区部编版六年级上册期末考试语文试卷(含答案解析)
- 河口水闸工程项目施工组织设计及进度计划
- 食品安全与质量检测技能大赛考试题库400题(含答案)
评论
0/150
提交评论