世代平均数的遗传分析加性显性模型的基因效应估计_第1页
世代平均数的遗传分析加性显性模型的基因效应估计_第2页
世代平均数的遗传分析加性显性模型的基因效应估计_第3页
世代平均数的遗传分析加性显性模型的基因效应估计_第4页
世代平均数的遗传分析加性显性模型的基因效应估计_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

世代平均数的遗传分析I•加性一显性模型的基因效应估计莫惠栋AGeneticAnalysisofGenerationMeansI.EstimationofGenicEffectsforAdditive-DominanceModel一、概述控制一个数量性状的多基因系统,其个别基因的效应,一般都不可能用孟德尔的归类法进行分析。因为这些基因的个别效应太小而又极易受环境的影响,难以划分不同基因型舰的界限。但是,一切数量性状,都有着一个特定的多基因系统(遗传作用)加环境修饰而形成的频率分布,这是在任何数量遗传实验中都可以观察到的。而频率分布,我们知道,其特征是可以用以诸如平均数、方差、协方差等统计数描述的。因此,计算这些统计数,并理解其遗传学意义(这是至关重要的),同样可对多基因控制的性状作出遗传分析。只是应注意到:(1)这类分析通常都是将多基因系统作为一个整体来处理,因而其结果是该系统中全部基因成员的一种总的或平均的性质,个别基因的作用一般不是很清楚;(2)这类分析多是依赖于“黑箱”理论的一种最佳估计,如果一系统中的各别基因皆能在细胞学上定位,并在生物化学上明了其作用方式,分析当然可以更为深入。数量性状的遗传分析,在遗传理论和育种实践上,都有重要意义,而且又是一个相当庞大的论题。我们将从自花授粉植物世代平均数的遗传分析入手,联系我国育种实际,逐步展开讨论。二、世代平均数的加性-显性模型设某性状仅由一对等位基因A-a控制,其中A对a为增效(A表示增效,a表示减小),且纯合体AA和aa的平均值(中亲值)为m。则AA和aa的基因型值可分别记为AA=m+d和aa=m-d,而杂合体Aa的基因型值可记为Aa=m+h。这里,d=(AA-~a^2,是纯合情况下以等位基因A替代a的平均效应,称加性效应;h是杂合体Aa的基因型值对m的离差(其加性期望的离差),即h=Aa-m,表示了等位基因A和a的交互作用,称显性效应。为简化表达,可以m为原点记各基因型值,即AA-d,Aa-h和aa--d。这样显然可得:(1)若h=0或h;d=0(即AA=m+d,Aa=m,aa=m—d),不存在显性。(2)若0<h<d或0<(hfd)<1(即m<Aa<(m+d)),为正向部分显性。若0>h>—d或0>(hd)>—1(即(m—d)<Aa<m),为负向部分显性。若Ih\=d或Ih:d1=1(Aa=(m+d)或(m—d)),为完全显性。(A对a为显性,A对a为隐性)若Ih\>d或Ih/d\>1(即Aa>(m+d)或<(m—d)),为超显性。一般称上述(1)为加性模型,即等位基因A对a只有加性效应;(2)~(5)为加性-显性模型,即等位基因A对a除纯合时的加性效应外,在杂合时尚有显性效应。以上推断皆是就基因型而言,未考虑随机误差。有了上述概念,就可方便地导出自花授粉植物纯系杂交后,各世代平均数的遗传分量。例如:亲本AA(P)和aa(P)杂交,F代皆为Aa,故F基因型值为F=m+h;F121112代为+A+A1+-Aa,故?年基因型平均数为4242F=+(m+d)++(m+h)++(m—d)=m++h;F代为3AA++Aa+3aa,故242423848F=3(m+d)++(m+h)+3(m—d)=m++h;FxP的B代为+AA++Aa,故3 8 4 8 4 1 1 1 2 2B=i(m+6)+i(m+h=m+-d+;hFxP的B代为+aa++Aa,故1222212222B=i(m一d-+(m+h二m—;十…•等。其有关结果列于表1“一对等位基22222因”栏下。将上述模式推广于有k对独立等位基因的多基因系统时,情况要复杂些。例如,在有A—a、B—b两对独立基因,且A对a、B对b为增效时,各种基因型的遗传分量就要写成:AABB=m+d+d,aabb=m—d—d,AaBb=m+h+h, 等(这里121212d和d和d分别为A和B的加性效应,h和121h分别为Aa、Bb德显性效应)。由于2微效多基因的各别基因效应在实际上不能辨别,故将多基因系统看成一个整体时,就可用参数[d]=工d和i[h]=Sh(i=1,2, ,k)来表示有关基ii因的总的加性效应和显性效应。这样,大值纯系亲本(P)平均数的遗传分量可记为1P=m+d+d+ +d=m+[d],小112k表1自花授粉植物世代平均数的遗传分量(加性一显性模型)世代'一对等位基因k对等位基因mdhm[d][h]p1101101P1-101-102F1011011F10-10-222B1丁111112222B1—111—1122222F10110丁344F1010488FxP11111丁212222FxP1—111—11222222FxF10110丁2122B自交11-11-124242/狗自交1—1丁1—1丁值纯系亲本(P)可记为P=m-d-d--dtm,-d可记为2212k1F=m+h+h++hLi,"h•等。其有关结果列于表1“k对等位基因”栏1 1 2 k下。注意,这里的和[h]仍是对两纯系亲本中亲值m的离差。但在推断显性的性质(无显性、部分显性、完全显性或超显性)时,应注意[d]和[h]与d和h是由区别的。应当分清两种情况:(1)如果控制某一性状的有关基因在两纯系亲本中的分布是联合态的(并且各d近i似相等的情况下,所有都是增效或减效),即在P和P上是分别集中了所有增效和减效等12位基因(如P1为AABBCC,P2为aabbcc),则势能比(potenceratio)[h]

td!gid]尸1][h]

td!gid]212反映了显性在所有位点上的平均性质。(尽管不能反映各个位点的显性性质,但可反映所有位点的平均性质)⑵如果有关基因在两纯系亲本中的分布是分散态的,即p和Pp分别集中了部分增效和减效等位基因(如P为AABBcc,P为aabbCC;或P为AABBcc,P为aaBBcc1212等),则1^1[d]一般与每一位点上的显性性质不相干。因为在此情况下,[d]不是一个所基因系统的所有增效基因的加性效应之和,[h]也可能不是所有杂合基因的显性效应之和。例如,设某性状受3对等位基因控制,且d—d—d—3,h=h—h—2,即每一位1 2 3 1 2 3点都属于正向部分显性。当P为AABBcc,P为aabbCC时,F为AaBbCc,得121[d]—3+3-3—3,h]—2+2+2—6h/[dl—63—。氮一fhl/Td]—2表明F代出现了超亲的杂种优势,但各位点上的基因都没有超亲效应。同样,若出现了超亲的杂种优势也不能肯定是由超显性造成的。在数量遗传和植物育种实验中,控制数量性状的基因在两亲中的分布,通常都是不同程度的分散态,极少为联合态。而且,即使某一性状可能达到联合态,其余性状一般仍是不同程度的分散态。所以,[hl[d]通常是不能用来推断显性性质。三、加性-显性模型的遗传分析1、实验设计在加性一显性模型下,要估计纯合体平均数m、加性效应[d]和显性效

应[h〕3个遗传参数,因而至少要有在遗传分量中包含有m、[d]和匕]的3个世代平均数(如P、P和F)。但这样所得的估计数误差大,且因期望平均数皆等于观察平均数,121没有剩余的自由度可供测验模型的适合性。为了更精确地估计和发现在加性-显性模型中未予考虑而实际上可能存在的上位性效应,一般宜有P、P、F、F、B和B6个世121212代平均数。这些平均数需经三个生长季节的工作才可以获得,即:第一个生长季节,以PxP(或PxP)获得F;第二个生长季节,以PxF、PxF和F自交,分别获得1221111211B、B和F,并保留(或复制)部分F种子;第三个生长季节,将P、P、F、F、12211212B和B植于可比较的环境中(环境设计一般用完全随机或随机区组),得到6个平均数12计其误差方差。若希望有更广泛的信息,则可再添加F自交(F)、B自交、B自交和2 3 1 2FxP、FxP、FxF等世代,但这样就要到第四个生长季节才能进行比较。2122212、统计分析这一分析包含三项内容:(1)由观察结果,应用最小平方和法求的遗传分量m、[d]和丘]的估计值m、〃和h的:设有k个世代平均数Y(i=1,2,k)及其误差方差V参加分析,我们可以一」L」 i i定义A为平均数遗传分量系数的结构矩阵(kx3.阶)、b为未知元的三维列向量,Y为k个观察平均数的k维列向量,V为k个平均数误差方差的对角阵,既有:XXX1112XXX21XXX1112XXX2122XXX23k1 k2k313/,V=diag(V,-, V)=1 2 k(V1V2Vk丿在计算时各家系均应以其平均数的精确系数f(V的倒数)为加在计算时各家系均应以其平均数的精确系数f(V的倒数)为加iiii权值,以使误差较大的平均数具有较小的权,误差较大的平均数具有较大的权。因而需要再引入:f=v-1=diag(V,,-L)=diag(f,打1 2 k这样k个观察平均数的方程组即可写成:(fA)b=(fY)根据最小平方和原理,在(1)的两侧同时左乘以A的转置矩阵AT,即得正规方程组:At(fA)b二At(fY)At(fA)b二At(fY)2)或简写为:Jb二k(2‘)(2‘)中的:'工fX2工fXX(乙fXX13J=At(fA)=1X2fX2

工fXX2工fXX)E1 3fXX2 3乙fX2丿3 7,K=At(fY)=YY12fXfX3)因此,列出各家系得f、X1、X、2和Y,通过简单的乘、加运算。即可得(2)。砸次计算中,由于X(m的系数)在任一家系皆为1,故有:1fXX=工fX,工fXY=工fY13 3 1工fX2=工fX=工f,fXX=工fX,工fXY=工fY13 3 111122可注意应用。由(2)即可解得各遗传分量估计值:b二J-1K(4)(4)中的J-1=(c),为J的逆阵。ij3x3(2)测验观察结果是否符合加性一显性模型:得到b后,可进而算出根据加性一显性模型的各家系平均数期望值列向量Y(k维):Ab=Y(5)由于统计数X2系正态标准离差的平方和,因而即可得出:x2=(Y-Y)tf(Y-Y)=丫f(Y-Y)2(6)此X2值的自由度为(k-3),当其<X2 时,表示性状遗传是符合加性一显性模型0.05,(k-3)的;如果>x2 ,则表明该性状遗传不符合加性一显性模型,需考虑用加性一显性一0.05,(k-3)上位性模型,方法见下期。这里需要注意到,以上计算实际上只是以各世代的m、[d]和丘]的系数(表1所列)为X、X和X变数,以世代平均数为Y变数的较为简单的三元线性回归分析。Y123变数的总变异平方和工fy2被分解为回归于加性一显性模型的平方和u和离回归平方和Q两部分,其值为:=工fY2-=工fY2-E(fY)2fEfU=bEfxy(EQ=Ef(Y-彳)2、所以在大样本时,fxy=EfXY-(EJX)(EfY);Efi i=Efy2-U7)(7)中的Q即(6)的X2值。(3)测验各遗传分量m、「d]和「h]与0的差异显著性,即测验H:m=0,H:[d]=0和H:\h\=0。根据多元分析理论,各遗传分量估计值b的标准误为:TOC\o"1-5"\h\z0 0 iS= '~^\o"CurrentDocument"b iiei8)(8)中c..为J-1中的主对角线之素,£为离回归标准误:£=x/Q;'(k-3)iJ e e(9)10)可测验上述各H0被接受或否定。如有接受H0的分量,应予剔除(方法见下期),以使保留的基因效应都是显著不同于0的(模型适合性测验的X2值及其自由度亦要根据保留的基因效应重新计算)。这里可注意,(9)根号内的分子Q为X2值,而分母则为该X2值的自由度数V(在此》=k-3)。根据统计理论,当在同一正态总体抽样时,X2的数学期望为其自由度数V,即E(X2)=V或E(X2/V)=1。因而,K.Mather等曾建议*当观察结果符合模型时,遗传分量估计值的标准误可简为:遗传分量估计值的标准误可简为:11)这就是假定£=1。作者检查过几百组6家系资料,认为以之作为遗传分量与0的差异显e著性的近似测验,是可行的。对实际资料进行上述分析还需注意一个前提,即模型的建立是以表2桂花黄(P)X阿抱罗(P2)有关家系的出穗期观察结果*家系平均数方差样本容量 平均数方差P和P在被研究性状上的基因组成12Ys2ns2n有着真实的差异为基础的。因此,P125.73.69870.04241在选用两亲时,就应使用其在被研P28.26.80590.11525F20.05.48130.421541F17.6114.55791.45000B26/921.443.85182.436111B19.2138.47187.69278*江苏农学院数量遗传研究室1983年实验

究性状上的差异尽可能大(即基因分布尽可能接近联合态);在统计分析时,则应首先证实两亲本的平均数间是有显著差异的。一般的说,两亲平均数的差数,应大于其差数标准误的两倍;如果不是这样,就不适于作遗传分析。因为环境误差已大到不能识别亲本差异,丧失了估计基因效应的基础。四、实例粳稻桂花黄(P1)X阿抱罗(P2)有关6个家系的出穗期(以7月31日为0)资料列于表2。该结果的两亲差异为:t=(25.7—8.2),0.04241+0.11525=44.07,为极显著,故可进一步作基因效应的遗传分析。为:根据加性-显性模型,这里的有关矩阵和向量+2—+2b1b=212著,故可进一步作基因效应的遗传分析。为:根据加性-显性模型,这里的有关矩阵和向量+2—+2b1b=212十22丿(23.57724b3=h」丿'25.7、8.220.017.621.4J9.2‘fXXXY23.5772411025.78.676471—108.22.3722610120.00.6896610117.60.41049112121.4220.129991—119.2表3求表2资料的正规方程组8.676472.372260.689660.410490.12999丿?便于求得正规方程组,可将上述结果列成表3式样。由表3得到:fX2丄fX=Ef=35.85611,2fX2=32.38883,2fX2=2.679795X==15.01402,2fXX=2fX=2.98733,X=0.0701252 2 3 3 2 3Y=2fY=747.945632,Y=537.932353,2fXY=59.1543551 2 3因而既有表2资料的正规方程组为:表4求表2资料正规方程组系数矩阵J的逆阵J—135.8561115.041022.9873310015.0410232.388830.0701250102.987330.0701252.67979500135.856110.419482760.083314390.027889250015.0410226.07938142-0.04536183-0.016084840.0383444702.98733-1.183008432.37724400-0.043051070.019081690.420655180.03904253-0.01803772-0.04305107J-1-0.039210050.019081690.01803772-0.019081690.420655180.04305107

(35.8561115.014022.98733'(7 八、b=m1 八(747.945632'15.0140232.388830.070125b=[2]c=537.932353、2.987330.0701252.679795丿2〔b=[h]\、59.154355丿3J(二AtfA)b K(==AtfY)在表4解得J的逆阵J-1。故根据(4)和(11),得到各遗传分量估计值及其标准误为:r i 八、b=m1(0.03904253—0.01803772—0.04305107丫747.945632](16.9520土0.1976]b=[d]o=—0.018037720.039210050.01908169537.932353=8.7299土0.19802Ib=[h]),—0.043051070.019081690.42065518?k59.154355丿k2.9484土0.6486丿3b J-i K说明这里的遗传分量m、「d~\和「hI都是显著的。为测验表2资料结果是否符合加性-显性模型,算得各家系平均数的期望值为:1Y2Y3Y4YI1Y2Y3Y4YIY6(111-100+2—+201十2+2‘1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论