版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数量性状基因定位研究中若干常见问题的分析与解答 李慧慧 张鲁燕 王建康*中国农业科学院作物科学研究所/国家农作物基因资源与基因改良重大科学工程/cimmyt中国办事处,北京100081摘 要:qtl作图是基因精细定位、克隆以及有效开展分子育种的基础,在利用qtl作图开展数量性状基因定位研究的过程中经常会碰到一些问题,与统计方法有关的一些问题包括:lod的统计学意义是什么?检测qtl的可信度和lod临界值的关系是什么?如何评价不同的qtl作图方法?提高qtl检测效率的途径有哪些?与遗传参数估计有关的一些问题包括:qtl的贡献率是如何计算出来的?如何确定qtl有利等位基因的来源?选择基因型分析的有
2、效性如何?复合性状是否适宜于qtl作图?与作图群体及遗传图谱有关的一些问题包括:qtl作图群体中表型数据是否要求服从正态分布?加密标记是否可以显著提高qtl检测功效?缺失分子标记对qtl作图有什么影响?奇异分离标记对qtl作图有什么影响?笔者试图结合我们多年的研究工作对这些具有共性的12个常见问题做出分析和解答,供科研工作者参考。关键词:数量性状;qtl作图;完备区间作图;似然比检验;功效分析analytical answers to frequently asked questions in quantitative trait locus mapping li hui-hui, zhang
3、 lu-yan, and wang jian-kang*institute of crop sciences / national key facility for crop gene resources and genetic improvement / cimmyt china office, chinese academy of agricultural sciences, beijing 100081, china本研究由国家自然科学基金项目(30771351)资助。 第一作者联系方式:tel: e-mail: lihuihui * 通讯作者 (corres
4、pondence author): 王建康,tel: e-mail: wangjk; abstract: qtl mapping is an important step in gene fine mapping, map-based cloning, and the efficient use of gene information in molecular breeding. questions are frequently met and asked in the application of qtl mapping in pr
5、actical genetic populations. questions related to statistical method of qtl mapping are: what does lod score mean? what is the relationship between the reliability of detected qtl and the lod threshold? how to evaluate different qtl mapping methods? how to improve the qtl detection power? questions
6、related to genetic parameter estimation are: how to calculate the phenotypic variance explained by each detected qtl? how to determine the source of favorable alleles at detected qtl? how efficient is the selective genotyping? can composite traits be used in qtl mapping? questions related to linkage
7、 map and mapping populations are: does the phenotype of a trait of interest have to follow a normal distribution? does the increase in marker density greatly improve qtl mapping power? what effects will missing markers have in qtl mapping? what effects will segregation distortion have in qtl mapping
8、? our objective in this paper is to provide the analytical answers to 12 frequently asked questions, based on our studies in past several years.keywords: quantitative trait; qtl mapping; inclusive composite interval mapping; likelihood ratio test; power analysis 经典数量遗传学建立在多基因假说基础之上,把控制数量性状的基因作为一个整体,
9、重点研究各种遗传效应与遗传方差的分解和估计,不区分个别基因在表型效应上的差异1-3。分子标记连锁图谱的大量出现,使得我们可以像研究质量性状基因一样研究数量性状基因,也可以把单个数量性状基因(quantitative trait gene or locus,简称qtl)定位在染色体上,并估计其遗传效应,这一过程称为qtl作图或定位4。qtl作图是基因精细定位和克隆的基础,目前已成为数量性状遗传研究的常用方法。qtl定位结果可以帮助育种家获得目标性状的遗传信息,借助与qtl连锁的分子标记在育种群体中跟踪和选择有利等位基因,提高选择的准确性和预见性。但是,在利用qtl作图开展遗传研究的过程中也经常碰
10、到一些问题,这些问题大致可分为有关作图统计方法、有关遗传参数估计、以及有关作图群体及连锁图谱等三大类。笔者试图结合我们近些年的研究工作对具有共性的12个问题做出分析和解答,供广大科研工作者在利用qtl作图开展遗传研究时参考。与作图统计方法有关的四个问题是:lod的统计学意义是什么?检测qtl的可信度和lod临界值的关系是什么?如何评价不同的qtl作图方法?提高qtl检测效率的途径有哪些?与遗传参数估计有关的四个问题是:qtl的贡献率是如何计算出来的?如何确定qtl有利等位基因的来源?选择基因型分析的有效性如何?复合性状是否适宜于qtl作图?与作图群体及遗传图谱有关的四个问题是:qtl作图群体中
11、表型数据是否要求服从正态分布?加密标记是否可以显著提高qtl检测功效?缺失分子标记对qtl作图有什么影响?奇异分离标记对qtl作图有什么影响?1 qtl作图中的统计学问题1.1 lod的统计学意义是什么?区间作图(interval mapping,简称im)5、复合区间作图(composite interval mapping,简称cim)6和完备区间作图(inclusive composite interval mapping,简称icim)4,7-9均利用极大似然估计原理,通过一维扫描在全基因组上逐点检测qtl的存在。检验的零假设(h0)是扫描位点上不存在qtl,备择假设(ha)是扫描位点
12、上存在一个qtl,似然比统计量(lrt)用来衡量扫描位点上存在qtl的可能性大小。似然比统计量的一般定义是,其中ln是自然对数函数,l0是h0下似然函数的极大值,la是ha下似然函数的极大值。似然比统计量大多数情况下有很好的统计学性质,即渐近服从分布,分布的自由度为两种假设下独立变量个数之差,因此容易确定给定显著性水平下检验统计量的临界值。一些研究表明qtl作图时的似然比统计量可能不服从单一分布,但却可以用2个不同自由度的混合分布来近似6,10,因此也可以确定给定显著性水平下检验统计量的临界值。lander和botstein在提出im的同时也提出利用人类遗传研究中常用的lod (likelih
13、ood of odd)值作为检验qtl是否存在的标准5。lod值定义为极大似然函数比的常用对数,即,。因此,若la是l0的10倍,则lod=1;如果la是l0的100倍,则lod=2;如果la是l0的1000倍,则lod=3。根据lod值和lrt值的定义,不难得到它们之间有如下关系: 或 。1.2 检测qtl的可信度和lod临界值之间的关系是什么?与其他假设检验一样,qtl作图中的检验也可产生四种结果(图1)。当一个位点上没有qtl,通过测验却错误地判断有qtl存在,称这种现象为假阳性;当一个位点上有qtl,通过测验判断有qtl存在,称这种现象为真阳性;当一个位点上有qtl,通过测验却错误地判
14、断没有qtl存在,称这种现象为假阴性;当一个位点上没有qtl,通过测验判断没有qtl存在,称这种现象为真阴性。假阳性和假阴性是统计测验中的两类错误,犯第一类错误(或假阳性)的概率()等于h0为真时被拒绝的概率,即,=p拒绝h0|h0为真=p假阳性/p假阳性+p真阴性。犯第二类错误(或假阴性)的概率()等于h0为假时未被拒绝的概率,即,=p未拒绝h0|h0为假=p假阴性/p假阴性+p真阳性。对于特定的检验方法而言,在一定的试验精确度下,降低则会提高,降低则会提高,同时降低和的途径是提高试验精确度和增加样本量。犯第一类错误的概率一般在检验前设定,对一定的检验方法,给定后也是确定的。但是除t-测验外
15、,大多数统计假设检验给定下的难以用代数解析式表示出来。表1前5列给出lod值1.05.0时对应的lrt值以及三种自由度下一次检验中犯第一类错误概率,犯第一类错误概率有时也叫做显著性概率;后4列给出显著性概率0.10.0001时对应的lod临界值。以自由度2为例,lod=1.30对应的显著性概率为0.05,如果只做一次假设检验,采用这样的lod临界值就能保证假阳性的概率不超过0.05,即鉴定出的qtl是假阳性的概率低于0.05,或者说鉴定出的qtl为真的概率超过0.95。基于区间测验的qtl作图,一般在基因组内所有染色体上按一定步长逐点检验qtl的存在,而这些检验又不是完全独立的,因此也很难确定
16、一次检验的显著性水平所对应的全局。例如,如果每次检验均采用临界值lod=3,当自由度为2时每个扫描位置对应的近似为0.001,qtl作图需要知道的是全基因组检验后的。由于qtl作图的复杂性,如涉及到多次非独立假设检验,不同物种有不同大小的基因组,不同作图群体有不同的标记数,零假设下似然比检验统计量服从什么样的渐近分布尚无定论,因此难以准确确定lod临界值对应的一次检验和全局,但一些非参数统计方法已用于给定全局后lod临界值的确定11-12。一般认为采用23的lod临界值可以把全局控制在0.05以内,在显性qtl和互作qtl作图中,似然比统计量有较大的自由度,还可适当考虑采用较高的临界值,如34
17、。但通过理论或模拟,进一步明确qtl作图中似然比检验统计量的渐近分布还是必要的,笔者推测渐近分布可能与染色体条数、每条染色体长度、标记密度和qtl遗传效应类型等因素有关。与所有假设检验一样,采用较高的lod临界值会更好地控制假qtl的发生,同时遗传效应较小的真qtl却不易被检测出来。如何平衡两类错误的概率,这不仅仅是统计学问题,还要考虑到具体的研究目标。如果qtl作图只是初步确定基因在染色体上的位置,然后根据作图结果构建其他次级群体对检测到的qtl进行精细定位、甚至图位克隆,然后开展转基因工作,这类研究几乎不容许假qtl的发生。此时要适当提高检验qtl时的lod临界值,保证后续研究中qtl的可
18、靠性。另一方面,如果研究目标是把qtl作图结果用于标记辅助选择聚合育种,这时只有尽可能多地检测出控制育种目标性状的qtl,才能保证对所有控制育种性状的基因进行选择,因此有必要适当降低检验qtl时的lod临界值,使得遗传效应较小的qtl也有机会被检测出来。此时即使有一些假qtl的存在,也不至于造成很大的损失。图1 qtl定位中假设检验的两类错误。阴影部分表示检验统计量lod值的分布,lod0表示临界值fig. 1 two types of error in hypothesis test in qtl mapping. the shadow area represents the distrib
19、ution of the test statistic lod score, and lod0 is the threshold value 表1 3种自由度下不同lod值对应的犯第一类错误概率()和不同下对应的lod临界值table 1 the corresponding probabilities of type i error to lod and the corresponding lod threshold to the significance probabilities under three degrees of freedom lodlrtloddf = 1df = 2df
20、= 3df = 1df = 2df = 31.004.610.0317860.0997590.2026860.10.59 1.00 1.36 2.009.210.0024070.0100020.0266250.050.83 1.30 1.70 3.0013.820.0002010.0009980.0031610.011.44 2.00 2.46 4.0018.420.0000180.0001000.0003600.0012.35 3.00 3.53 5.0023.030.0000020.0000100.0000400.00013.29 4.00 4.58 1.3 如何评价不同的qtl作图方法?
21、图2给出一个模拟的加倍单倍体(dh)群体中icim、cim和im三种方法的lod值和估计遗传效应的曲线图。遗传模型中包含7个qtl,第1染色体上1个,第2和4染色体上分别有2个相引相连锁qtl,第3染色体上有2个互斥相连锁qtl,所有qtl遗传效应的绝对值为1,效应的方向如图2箭头所示。从图中我们可以很直观地看到不同qtl作图方法找到的qtl不尽相同,im无法准确定位连锁qtl,cim无法准确定位互斥连锁的qtl。统计检验的功效定义为,即发现真qtl的概率,常用来比较不同统计方法的有效性。qtl作图包含着复杂的统计假设检验,难以从理论上推导出不同qtl作图方法的统计功效。一般采用模拟方法比较不
22、同方法qtl检测功效和假阳性的大小,功效高同时又具有较低假阳性在统计上就是较好的方法。我们用独立遗传模型说明功效的计算(表2),假定基因组包含10条染色体,每条长度160 cm且均匀分布17个标记,8个qtl(iq1iq8)分别位于前8条染色体,另外2条为空白染色体。为简单起见,我们用iq2、iq5、iq6和iq7说明功效的计算,4个qtl分别解释2%、5%、10%和20%的表型变异(即pve)。假定表型方差为1.0,这样加性遗传效应等于pve的平方根(表2)。模拟4个dh群体,群体大小均为200,每个群体中icim和im检测到的所有超过lod临界值2.5的qtl列于表3,用于统计每个qtl检
23、测功效以及假阳性。以第一个模拟群体为例,icim检测到5个qtl,其中3个分别位于第5、6和7条染色体的51.10、60.00和70.00 cm处,分别落在了iq5、iq6和iq7的10 cm置信区间内(表3),因此当置信区间为10 cm时把iq5、iq6和iq7的统计功效加1;第2条染色体上检测到一个qtl,与iq2的距离为6.90 cm,不在iq2的10 cm置信区间内,第7条染色体上40 cm处检测到一个qtl,既不在iq7的10 cm置信区间内也不在其20 cm置信区间内,因此判定为假阳性。同理,im发现4个qtl,其中两个分别位于第6和7染色体的60.00 cm和70.00 cm处,
24、分别落在iq6和iq7的10 cm置信区间内,这2个qtl对应的功效加1,另外2个不在这4个qtl的10 cm置信区间内,因此判定为假阳性。按照上述算法,对于4次模拟来说,在lod临界值2.5下当置信区间为10 cm时(表3),icim检测iq2、iq5、iq6和iq7的功效分别为2、1、3和2,即iq2在4次模拟中被检测到2次,iq5被检测到1次,iq6被检测到3次,iq7被检测到2次;im检测4个独立qtl的功效分别为1、0、3和2。icim检测到的16个qtl中有8个假阳性,im检测到的13个qtl中有7个假阳性。当置信区间为20 cm时(表3),icim检测iq2、iq5、iq6和iq
25、7的功效分别为3、2、4和4,im的检测功效分别为1、1、3和4;icim检测到的16个qtl中有3个假阳性,im检测到的13个qtl中有4个假阳性。因此通过100甚至1000次的模拟,就能得到准确的检测功效和假阳性率,从而判断不同qtl作图方法的有效性。图2 200个加倍单倍体家系群体中区间作图、复合区间作图和完备区间作图的比较fig. 2 comparison of interval mapping, composite interval mapping and inclusive composite interval mapping in a simulated population w
26、ith 200 doubled haploid lines. 假定一个基因组包含6条染色体,每条长度为120 cm,等距离分布13个标记,第1条染色体上35cm处存在1个qtl,第2、3、4条染色体上都在35和68cm处存在2个qtl,图中箭头表示qtl的近似位置,朝上箭头表示qtl的加性效应为正,朝下箭头表示qtl的加性效应为负,效应的绝对值均为1。a genome with 6 chromosomes was assumed, each of 120 cm and evenly distributed with 13 markers. one qtl was located at 35 c
27、m on chromosome 1, and two qtl were located at 35 and 68 cm on chromosomes 2, 3, and 4. arrows pointed to the approximate qtl positions. upward arrows indicated the qtl have positive effects, while downward arrows indicated the qtl have negative effects. the absolute genetic effect is 1 for all qtl.
28、 表2 8个独立遗传qtl在基因组中的位置、加性遗传效应、解释表型变异的百分数以及10 cm和20 cm置信区间 table 2 eight independent qtl and their chromosomal positions, additive effects and explained phenotypic variation (%), along with the 10 cm and 20 cm confidence intervals (ci) qtl染色体chromosome位置position (cm)加性效应additive贡献率pve (%)置信区间 confiden
29、ce interval (ci) ci=10 cmci=20 cmiq11250.10001(20 cm, 30 cm)(15 cm, 35 cm)iq22320.14142(27 cm, 37 cm)(22 cm, 42 cm)iq33390.17323(34 cm, 44 cm)(29 cm, 49 cm)iq44460.20004(41 cm, 51 cm)(36 cm, 56 cm)iq55530.22365(48 cm, 58 cm)(43 cm, 63 cm)iq66600.316210(55 cm, 65 cm)(50 cm, 70 cm)iq77670.447220(62 cm
30、, 72 cm)(57 cm, 77 cm)iq88740.547730(69 cm, 79 cm)(64 cm, 84 cm)8表3 利用4个模拟dh群体计算完备区间作图和区间作图两种方法的检测功效和假阳性,qtl置信区间长度分别是10 cm或20 cmtable 3 calculation of power and false qtl in four simulated dh populations for icim and im. the confidence interval of each predefined qtl is 10 or 20 cm. pop完备区间作图 inclus
31、ive composite interval mapping区间作图 interval mapping染色体chromosome位置position加性效应additivelodpve (%)ci=10 cmci=20 cm染色体chromosome位置position加性效应additivelodpve (%)ci=10 cmci=20 cm1225.10 0.19 2.56 3.48 false qtliq2547.10 0.26 2.71 6.74 false qtliq5551.10 0.29 6.05 8.14 iq5iq566.70 0.25 2.51 6.15 false qtl
32、false qtl660.00 0.30 6.72 8.86 iq6iq6660.00 0.30 3.99 8.77 iq6iq6740.00 0.20 2.94 3.71 false qtlfalse qtl770.00 0.52 13.39 26.53 iq7iq7770.00 0.42 11.87 16.64 iq7iq72230.50 0.27 5.35 7.78 iq2iq2230.00 0.30 4.38 9.59 iq2iq2545.00 0.27 5.25 7.94 false qtliq5660.00 0.28 3.81 8.39 iq6iq6659.10 0.26 4.94
33、 7.50 iq6iq6763.90 0.43 8.90 19.44 iq7iq7759.40 0.38 9.84 15.61 false qtliq73230.00 0.21 2.50 3.96 iq2iq2656.20 0.31 3.66 8.81 iq6iq6655.40 0.29 4.47 7.81 iq6iq6772.60 0.48 9.55 21.01 false qtliq7770.00 0.28 4.42 7.14 iq7iq7786.30 0.47 8.94 19.93 false qtlfalse qtl790.00 0.25 3.39 5.41 false qtlfals
34、e qtl7108.00 0.38 5.77 13.04 false qtlfalse qtl4669.30 0.22 2.65 4.99 false qtliq6760.00 0.31 4.57 9.99 false qtliq7760.00 0.33 5.87 11.34 false qtliq71038.70 -0.26 3.04 7.18 false qtlfalse qtl1038.90 -0.23 2.92 5.70 false qtlfalse qtl271.4 提高qtl检测功效的途径有哪些?统计上提高假设检验功效的途径主要是增加样本量和减小试验误差,对qtl作图来说就是增大作
35、图群体、减小表型测定时的误差(即提高性状的遗传力)。以icim为例,增大群体对提高qtl检测功效是明显的(图3)。对大小为100、200和400的群体来说,把pve=4%的qtl定位到10 cm置信区间内的概率分别为29%、67%和91%;而把pve=10%的qtl定位到10 cm置信区间内的概率分别为79%、97%和100%。减小表型误差则间接提高单个qtl的贡献率13,如果通过降低表型误差把qtl对表型的贡献率由4%提高到5%,对大小为100、200、400的群体来说,检测功效则分别由29%、67%和91%提高到44%、77%和94%。因此,qtl作图研究中作图群体在资源允许的条件下要尽可
36、能地大,同时表型鉴定时要尽量减小随机误差。当然对受环境影响大并具有较大基因型和环境互作的性状,还要在多地点/多年份进行表型鉴定。降低表型变异也可间接提高pve,从而提高qtl的检测功效。遗传研究中近等基因系和染色体片断置换系14-15都是通过这种途径提高遗传分析的可靠性。举例来说,假定某群体中3个独立遗传qtl的遗传方差分别为0.1、0.2和0.3,误差方差为0.4,因此3个qtl分别解释10%、20%和30%的表型变异,在这3个qtl的近等基因系中假定qtl的遗传效应和误差方差保持不变,那么3个qtl近等基因系群体的表型方差分别为0.5、0.6和0.7,3个qtl解释的表型变异则增加到20%
37、、33%和43%,因此在这3个近等基因系群体中进行qtl定位研究将更加有效。图3 qtl的检测功效与群体大小的关系fig. 3 relationship between qtl detection power and mapping population size2 qtl作图中的遗传学问题2.1 qtl的贡献率是如何计算出来的?一个qtl所解释表型变异(pve,又称为qtl的贡献率)的计算公式是:,其中vg是qtl的遗传方差,vp是表型方差。在一个无奇异分离的群体中,qtl的遗传方差只依赖于qtl的遗传效应,效应大的qtl同时也具有较高的pve;如果存在奇异分离,qtl的遗传方差除依赖于qt
38、l的遗传效应外,还依赖于基因型频率,这时效应大的qtl,其pve不一定就高。以f2群体为例,假定qtl三种基因型qq、qq和qq的频率为f2、f1和f0,qtl的加显性效应为a和d,1 例如,一个qtl的加显性效应均为,即完全显性,当f2=0.25、f1=0.5和f0=0.25即不存在奇异分离时,vg=0.75;当f2=0.4、f1=0.5和f0=0.1时,vg=0.36;当f2=0.5、f1=0.5和f0=0.0时,vg=0,这时qtl无法被检测出来。大多数作图软件中,qtl的遗传方差都是根据三种qtl基因型的观测频率计算得出,因此qtl作图研究中,出现遗传效应大而pve偏低的情形也是正常的
39、。qtl间的互斥连锁甚至可能造成单个qtl的pve或两个qtl的pve之和超过100%的情形。假定亲本的基因型为q1q1q2q2和q1q1q2q2,a1和a2分别为2个连锁qtl的加性效应,2个位点间的重组率为r。在双亲衍生的dh群体中,4种基因型频率和基因型值如表4。ril群体中,只需将r用代替。2个qtl的遗传方差分别为和,总遗传方差为:因此,只有在r=0.5的情况下,才有。当2个qtl间存在连锁并且a1和a2的效应方向相反时(即处于互斥连锁状态),造成2个qtl的pve之和甚至单个qtl的pve大于100%的情况。例如,不考虑随机环境误差和其他遗传变异,当a1=1.0,a2=-1.0,r
40、=0.1,时,表型方差,故两个qtl理论pve均为125%。在这样的遗传模型下,icim仍然可以较准确地定位到两个紧密连锁的qtl,效应的估计也是近似无偏的(图4)。因此当qtl间存在连锁时,2个qtl所解释的遗传方差不等于它们遗传方差之和,即方差不具有可加性,因此由方差计算出的pve之间也不具可加性。表4 两个连锁qtl在dh群体中4种基因型的频率和基因型值,a1代表q1-q1的加性遗传效应,a2代表q2-q2的加性遗传效应table 4 frequencies and genotypic values of four genotypes at two linked qtl in a dh
41、mapping population, where a1 is the additive effect of q1-q1, and a2 is the additive effect of q2-q2. 基因型genotype频率frequency 基因型值genotypic valueq1q1q2q2a1 + a2 q1q1q2q2a1 - a2q1q1q2q2- a1 + a2 q1q1q2q2- a1 - a2 图4 一个模拟的包含200个加倍单倍体家系作图群体。fig. 4 qtl mapping in a simulated population of 200 doubled hap
42、loid lines. 一条长度为120 cm的染色体上有一对重组率为0.1的互斥连锁qtl,遗传效应分布为1.0和-1.0,随机误差方差假定为0.4,标记间的距离为2 cm。two qtl are linked in the repulsion phase on one chromosome of 120 cm. genetic effects of the two qtl are 1.0 and -1.0, respectively. variance of random error is 0.2, and distance between markers is 2 cm. 2.2 如何判
43、断qtl有利等位基因的来源?确定每个qtl上有利等位基因的来源是把作图结果应用于分子育种的前提15。假设一个qtl上有两个等位基因q或q,分别代表两个亲本中的等位基因,这样就有3种可能的基因型:qq、qq和qq。我们用表示p1(qq)的平均表现,表示p2(qq)的平均表现,表示f1(qq)的平均表现,并且qq代表较小的亲本基因型,qq表示较大的亲本基因型。m表示中亲值,即两个亲本的平均值,记为。亲本离中亲值的距离为a,或者说,即a为大值亲本(qq)与小值亲本(qq)之差的一半,是正值。f1离中亲值m的离差为d,其值可正可负(图5)。亲本与中亲值之差a称为加性效应,f1与中亲值之差d称为显性效应
44、,这就是经典数量遗传中的加显性遗传模型3。q对q并不一定具有显性,只表示取较大值或有较大的效应,所以可以是无显性,可以是部分显性,也可以是完全显性或超显性3。qtl作图中常用2、1和0分别表示3种标记或qtl的基因型,以亲本harrington和tr306衍生的大麦dh群体4,8,16为例。亲本harrington和tr306的平均粒重分别为38.7 mg和45.0 mg,qtl作图时分别用2表示harrington的标记型、0表示tr306的标记型。因此如果加性效应为正,说明harrington携带的等位基因起到增加粒重的作用,tr306携带的等位基因则起到降低粒重的作用;如果某个qtl加性
45、效应为负值,说明harrington携带的等位基因起到降低粒重的作用,tr306携带的等位基因则起到增加粒重的作用。从表5的结果来看,9个被检测到的控制粒重的qtl中有6个具有负的加性效应,说明这6个qtl上提高粒重的等位基因来源于粒重较高的亲本tr306,但亲本harrington在qkwt2-1、qkwt2-3和qkwt3-2这3个qtl上携带着提高粒重的等位基因,这些基因解释了群体中的超亲分离现象。育种中高粒重一般来说是理想性状,因此在利用粒重qtl作图结果开展单标记或区间标记辅助选择时,对qkwt2-1、qkwt2-3和qkwt3-2应该选择亲本harrington的标记类型,其他qt
46、l应该选择亲本tr306的标记类型,这样才能选择到所有增加粒重的等位基因。图5 一个位点的数量性状加显性遗传模型fig. 5 the one-locus additive and dominance genetic model of quantitative traits表5 大麦dh群体中检测到的粒重qtltable 5 qtl of kernel weight identified in the barley dh population. qtlicim (pin=0.01, pout=0.02)selective genotyping选择基因型分析位置position (cm) 左侧连标
47、记left flanking marker (cm)右侧连标记right flanking marker (cm) 加性效应additivelodpve (%)lodqkwt2-183 74.30 83.40 0.39 4.16 3.04 0.53 qkwt2-2139 130.90 142.10 -0.46 5.28 4.23 2.44 qkwt2-3201 195.40 201.70 0.45 5.60 4.20 4.36 qkwt3-10 0.00 0.00 -0.35 3.35 2.41 0.02 qkwt3-222 17.20 25.20 0.57 8.00 6.50 2.97 qk
48、wt4125 124.80 140.10 -0.31 2.73 1.95 3.55 qkwt55 3.80 7.00 -1.38 32.19 38.27 19.82 qkwt7-14 3.40 7.60 -0.56 7.81 6.38 3.55 qkwt7-295 92.60 97.70 -0.94 18.86 17.51 9.41 lod score of selective genotyping is at the nearest marker of the corresponding qtl identified by icim. in selective genotyping, the
49、 selected proportion was 25% for each tail. lod score from selective genotyping is in bold when it is higher than lod threshold 2.5. 2.3 选择基因型分析的有效性如何?qtl定位和基因精细定位时通常利用全群体分析方法,但是全群体分析需要测定群体中所有个体的表现型和基因型,要检测到微效的qtl需要大量的样本才能达到相应的功效,花费较高。相比较,选择基因型分析(selective genotyping)一般利用分离群体的双尾或单尾极端表型个体,分析标记与qtl的连锁
50、关系,检验标记基因型在两极端类型内的分离比例是否偏离孟德尔规律,是一种花费较低的方法,常常被用于检测控制质量性状的主效qtl17-20。在对数量性状遗传分析时,选择基因型分析的qtl检测效率如何呢?通过模拟分析大量遗传模型下多种因素对选择基因型作图结果的影响,并利用真实群体比较选择基因型分析与全群体作图结果的差异20,我们得到以下结论(表5,图6)。选择基因型分析的检测功效一般都高于im的检测功效,但是低于icim的检测功效。增大群体能迅速提高选择基因型分析的检测功效,在不同群体大小下,选择比例介于0.150.35时检测功效较高。而对于连锁qtl,增大标记密度有助于检测连锁qtl。选择基因型分
51、析对加性qtl的检测功效不受它们之间互作效应的影响。换句话说,两个互作的加性qtl检测功效与这两个qtl只有加性没有上位效应时的检测功效相当。选择基因型分析无法检测到只存在上位性而没有加性效应的qtl。利用真实群体(包括ril,dh,bc,f2群体)比较选择基因型分析与全群体icim的结果,发现对于只存在加性效应的群体,两种方法的作图结果一致性较好,而对于f2群体,选择基因型分析只能检测到加性qtl,并且双向选择的作图效果远远优于单向选择的。图6 大麦dh群体完备区间作图和选择基因型分析作图结果fig. 6 mapping results for a barley dh population
52、under inclusive composite interval mapping and selective genotyping2.4 复合性状是否适宜于qtl作图?植物育种中,有不少性状可以看作是由两个或两个以上性状的代数运算得到的,如玉米雌雄开花间期等于雌穗开花期减去雄穗开花期,水稻籽粒的长宽比等于粒长除以粒宽。为了便于叙述,我们把通过单独测量得到性状值的性状称为构成性状,由若干构成性状经过代数运算得到的性状称为复合性状。不少研究者利用构成性状和复合性状同时进行作图,有时会发现一些复合性状独有的qtl,但对复合性状qtl作图的理论根据和有效性缺乏了解。其实复合性状的使用使得遗传模型变
53、得更为复杂,为说明这一点,假定分别有2个独立遗传qtl控制2个构成性状(表6),加性遗传效应均为1,性状i和ii的群体平均数分别为25和20。可以证明4个qtl在和性状上的遗传效应均为1、在差性状上的遗传效应分别为1、1、-1和-1,在积和商性状上的遗传效应不仅与qtl在构成性状中的效应有关,而且还依赖于群体平均数(表6)。进一步还能证明除加性效应外,4个qtl在积和商性状上还存在互作效应(表6),因此复合性状的遗传效应也比构成性状更为复杂 21。模拟研究也表明,对于独立的qtl而言,复合性状的遗传力与构成性状基本一致,而对于连锁的qtl,积和商性状的遗传力有所下降(表7)。对于不同的遗传模型
54、,与构成性状相比,复合性状的检测功效始终会有不同程度的降低,而且错误发现率会升高;选择较大的作图群体,复合性状检测功效下降的程度会减小,同时错误发现率也会略有减小,但错误发现率仍然高于构成性状(表7)。qtl间连锁的存在,不利于复合性状作图,检测功效会大大降低,qtl的效应和位置的估计不准确;当连锁距离大于或等于35 cm时,复合性状效应和位置的估计基本无偏,但检测功效仍然低于构成性状。构成性状间的正相关会极大地降低差与商性状的检测功效,而构成性状间的负相关会极大地降低和与积性状的检测功效,但不管是正相关或是负相关,构成性状的qtl检测功效都高于复合性状的检测功效。复合性状独有qtl的遗传机制尚不明确,模拟试验显示检测到的复合性状独有qtl可能是由构成性状中的微效qtl引起的。与构成性状相比,复合性状受较多qtl控制、qtl具有更复杂的遗传效应和连锁关系、qtl作图功效比构成性状下的功效明显下降,因此使用复合性状作图的意义不大。复合性状在遗传和育种中的使用应充分考虑二者有着不同的研究目标,遗传研究在于尽可能多地了解控制目标性状基因的遗传规律
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 互联网公司实习生协议
- 欧式酒店罗马柱施工合同
- 照明工程人工费施工合同
- 会计实习生聘用合同
- 企业社会责任绩效
- 糖尿病的健康管理方案设计
- 工程项目合同质量管理情况记录
- 电子产品测试顾问协议
- 工程施工转让合同协议
- 2022年大学工程力学专业大学物理下册期中考试试题B卷-附解析
- C++语言基础知识
- 全国人工智能应用技术技能大赛理论考试题库大全-上(单选题汇总)
- 机关档案管理工作培训课件
- 工程施工阶段全过程造价控制与管理工作方案 精品
- 移动室内信号覆盖系统介绍演示文稿
- DB15T 389-2021内蒙古自治区造林技术规程
- 一年级上册数学课件 《认识11~20各数》(第1课时) 苏教版 (共19张PPT)
- 标准采购清单
- 阿基米德原理说课市公开课金奖市赛课一等奖课件
- 医疗质量安全核心制度要点解读课件
- 屋脊检验批质量验收记录表
评论
0/150
提交评论