生统中文版chapt9第九章混合线性模型统计分析_第1页
生统中文版chapt9第九章混合线性模型统计分析_第2页
生统中文版chapt9第九章混合线性模型统计分析_第3页
生统中文版chapt9第九章混合线性模型统计分析_第4页
生统中文版chapt9第九章混合线性模型统计分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1为什么要1为什么要采用混合线性模型分析方法( 多元回归模型:yXbe~N(Xb自变量是固定效应,无法分析随机效应自变自变量非相互独立,回归系数是偏回归系可把总变异分解为不同的变异分不能有效地分析非平衡的数可以估算随机效应的方差,但不能估算随机效应参数分析的统计功效不第九章混合线性模型的统计分2不能被方2不能被方差分析方法分析的遗传模yijkAiAjDijMiPj具有非整数的效应系yijkAiAj1Dii1Djj1Dij 因素之间的效应相互关yijk=Ai+Aj+1Dii+1Djj+1 +Ci+Ami+Amj+Dmij为什么要采用混合线性模型分析方法 混合线性模型yXbuUueu~N(Xb,V=2URUT+ UUT+2 r同时包括固定效应和若干组随机效应的自变随机效应因素内或因素间都可存在相关3混合线性3混合线性模型(mixedlineary=Xb+随机效应向量e具有多元正态分e~MVN(0,相依变量也是正态随机向y~MVN(Xb,其中V是对称正定矩阵回归模型、方差分析模型(固定模型)的阵表达y=Xb+具有独立多元正态分布e~MVN(0,2I)e因而相依变量也是独立正态随机向量y~MVN(Xb,e4)+(r+)=)+(+(r(v)(r+)()(++=)4)+(r+)=)+(+(r(v)(r+)()(++=))(r=+(r=)(r(=)(===(v相依变量的期望值和方差可以推导如E E E uUuEeu Eer bXT eu er s2U s2u r应在内共有(r+1) 项随机效应.这时随机效应向量e可以分解为(r+1) yXbU1e1U2e2LUrerXbuUueuXb其Uu是第u项随机因素eu的系数矩eu~MVN(0,uer+1~MVN(0, r所有随机因素都相互独e, eu,eT r5§9.2混合线性模型随机效应ryXbUueu5§9.2混合线性模型随机效应ryXbUueu混合模型的方差分析表(Henderson方法变异原因自由度平方和期望平方和 2tr(UTAU)+2tr(Au1 u1 b,e1 2tr(UTA2Uu)+21tr(A2u2 MMMMb,e1,L,er12tr(UTAU)+2tr(A 残差效应2相依变量是正态随机向y~MVN(Xb,V=u2UUT+ r混合线性模型的统计分析估计各项方差分量2u预测各项随机效应(3)估计固定效应6r限制性最6r限制性最大似然法(REML法估计方差分量的REML方程组是[tr(UTQUUTQU)][ˆ2][yTQUUT 其 QV1V1X(XTV1X)XT Vu方差分量的REML估计可由下式迭代获得[tr(UT UUT U UUT 其 ˆ[h]ˆ1ˆ1X(XTˆ1X)XTˆ rˆ[ U 是2的第h次迭代估 最大似然法(ML法估计方差分量的ML方程组是(UTV1UUTV1U)][sˆ2][yTQUUT 其 QV1V1X(XTV1X)XTr Vu方差分量的ML估计可由下式迭代获得[tr(UTˆ1UUTˆ1U ][yT UUT 其 ˆ[h]ˆ1ˆ1X(XTˆ1X)XTˆ rˆ[h U 是2的第h次迭代估 7)(7)(值[u],只要这些先验值不依赖于试验数据,MINQUE估计量仍是无偏的.选择任意的先验值 ],可以求得方差分量/协方差的估计ˆ2或 u/最小范数二次无偏估计程组而得(u,v=1,2,…,r+1), UTQUUTQ ][sˆ2][yTQUUTQy 其 QV1V1X(XTV1X)XT rVu[u]是人为选择的先验值随机变量y1y2的协方差分量MINQUE估算法(Zhu,[tr(UTQUUTQU)][ ][yTQUUTQy u/ 8)(方差估算的蒙特卡罗模拟结果比Bio-Model(F1(i×j)=yijkAiAjDijMiPj用五种方法估计6个亲本双列杂交(方法3)平衡数据的遗传方差分的8)(方差估算的蒙特卡罗模拟结果比Bio-Model(F1(i×j)=yijkAiAjDijMiPj用五种方法估计6个亲本双列杂交(方法3)平衡数据的遗传方差分的偏差(Bias=ˆ22)和均方误差(MSE=(Bias)2Var(ˆ2)) 比VA=VD=VM=VP=估计Ve=30,Bias=1.33,MSE=MINQUE(1)法设所有的先验值为1(u1,u1(u,v=1,2,…,r+1), UT UUT ][sˆ2][yT UUT y 其 Q(1)V1V1X(XTV1X)XT uMINQUE(1)协方差估计量[tr(UT UUT U)][ ][yT UUT y u/ (1)MINQUE(0)法设残差先验值r+1=0,其它先验值为Q(0)IX(XTX)XTV(1)I9随机效应的无偏预测方BLUP 2UT QV1V1X(XTV1X)XTLUPMethods(Zhu&Weir,1994,TAG,9随机效应的无偏预测方BLUP 2UT QV1V1X(XTV1X)XTLUPMethods(Zhu&Weir,1994,TAG, AUPMethods(Zhu1993,生物数学学报V8;Zhu&Weir,1996,TAG,V92) UUT 用四种方法估计1个亲本双列杂交方法3非平衡数据传方差分量的偏差BiasSE的比较VA=VD=VM=VP=估计方法Ve=30,Bias=0.20~0.32,MSE=351.93~加性效应预测值比 110 9Ai(i i加性效应预测值比 110 9Ai(i i 效应BLUP预测AUP预测BLUP---------------效应预测的蒙特卡洛模拟比yijninjtijmipjy1UnenUtetUmemUpep三倍体胚乳模型的遗传三倍体胚乳模型的遗传效应胚乳核基因遗传效 细胞质效 植株核基因遗传效GOA GC GMAm2AiAjDii 2Ami vv种子性状的遗传模种子性状的广义遗传模型(朱军1996:遗传学报yEGOGCGMGOEGCEGMEBEADCAmDmAEDECEAmEDmEBy(表型值(均值E(环境A(直接加性D(直接显性C(细胞质Am(母体加性Dm(母体显性AE(互作DE(互作CE(互作AmE(互作+DmE(互作)+e(机误)分析需要3个世(P、F1、+F2或BC1、成对性状成对性状协方差分量的分Cov(y,yT V V V V A/A D/D C/C Am/Am Dm/DmAE/AEV6DE/DEV7CE/CEV8AmE/AmEDmE/DmEV10A/AmV11D/DmV12AE/AmEDE/DmEV14e/E, u/u 、whereVUUT(u1,2,L,10), (UUTUUT (UUTUUT), (UUTUUT (UUTUUT), 种子模型的混合线性模y1XEbEUAeAUDeDUCeCUAmeAmUAEeAEUDEeDEUCEeCEUAmEeAmEUDmEeDmE方差分量的分Var(y)=2V2V2V2V2A D C, Am Dm2V2V、2V V DE CE DmE V V, V V2A.Am D.Dm AE.AmE DE.DmE e、uwhereVUUT(u1,2,L,10), (UUTUUT 1 4V(UUTUUT),V(UUTUUT 2 5 6 9V(UUTUUT),V 7 10 计各项方差和协方差分量(Zhu和Weir,1994).方差和协方差分量的无偏估算方(Zhu&Weir,1994,TAG,方差分量的MINQUE(0/1)估计 V V)][ˆ][yT V (0 (0 (0 (0协方差分量的MINQUE估计 V V ][yT V y(0 (0 u/ (0 (0 where V1X(XTV1X)XT(0 (0 (0 (0 (0 UUT(0 Table2.VarianceofkernelnutrienttraitsforV&**随机效应的无偏预测值方BLUP (2UT UTTable2.VarianceofkernelnutrienttraitsforV&**随机效应的无偏预测值方BLUP (2UT UT QV1V1X(XTV1X)XTVuVuLUPMethods(Zhu&Weir,1994,V89) (0AUPMethods(Zhu1993,生物数学学报V8;Zhu&Weir,1996,TAG,V92) (0 V (0 (0Table2.CorrelationbetweenseedqualityandcottonOil Oil Yield/PlantBolls/PlantBollLint%Yield/Plant –0.003 –0.001 0.004 0.806+ 0.211** 0.587+ 0.154** 0.357* 0.093** –0.024 –0.008 0.060 0.018 1.054+ 0.280** 0.517* 0.134**Table2.CorrelationbetweenseedqualityandcottonOil Oil Yield/PlantBolls/PlantBollLint%Yield/Plant –0.003 –0.001 0.004 0.806+ 0.211** 0.587+ 0.154** 0.357* 0.093** –0.024 –0.008 0.060 0.018 1.054+ 0.280** 0.517* 0.134** 0.388 0.103* 0.030 Table4.CorrelationofkernelnutrienttraitsforOil%Oil%Pro%OilIDOilID--*r-*-*-r--*--*r---如果已知如果已知所有的方差分量,即已知相依变量的方差与协leastsquaresestimation)估计模型中的固定效应参数b,ˆ=(XTV1X)1XT 由于估计值ˆ向量是一个常量矩阵AXTV1X)1XT与正态随机向量y的乘积,因ˆ也是正态随机向量ˆ~MVNp(b,(X §9.3线性模型固定效应的估对于混合线性模ryXb+Uueu+erur~MVN(Xb,V=2UUT+2 ru的可估计线性函数(cTb)进行统计检验.可估计函数cTb的方差为Var(cTˆ)cT(XTV1X)当常数矩阵X不是满秩时ˆ=(XTV-1X)XTV- 向量 的多元正态分布ˆ~MVNp((XVX)XV (XTV-1X)XTV-1X(XTV-1X)在实际应在实际应用时,可以采用最小二乘估计法获得回归参数b的ˆ=(XTX)1XT 最小二乘估计获得ˆ的是正态随机向量ˆ~MVNp(b,(XX)XVX(XX 设置原假 H0:cTb及相应的备择假设H:cTbm1当统计量|cT(bˆb)/cT(XTV1X)c|>t(/2;df)(dfn 时 拒绝原假设,接受备择假设区域试验区域试验资料的分析及其应区域试验的统计模y=G+Y+L+YL+GY+GL+GYL+B+多年份、多试点的区试分yhijk=Gh+Yi+Lj+YLij+GYhi++GYLhij+Bk(ij)+h1,L,g;i1,Ly;j1,L,l;k1,L,可以对参数的线性函数cTb)进行统计检验.对于原假设H0cTbm及相应的备择假设H1cTbm当统计量|cT(bˆb)/cT[(XTX)-1XTVX(XTX)- 方差分析表(品种固定的混合模型 自由度df 均方MS 期望均方EMS 2b2lb2yb2ylbG g 2g方差分析表(品种固定的混合模型 自由度df 均方MS 期望均方EMS 2b2lb2yb2ylbG g 2g b2gb2lb2glb B(YL 2g b2gb2yb2gyb 2g b2gb 2b2lb 2b2yb G×Y×L(g1)(y1)(l1) 2b yl(b- MSB(YL)2g yl e 2b lb2yb2ylb错误的品种效应F测验 F GY g e正确的品种效应F测验 2b lb2yb2ylbFMSCebGYLlbGY g F MSGYMSGL df2(MSGYMSGLdfg (MSGY)2(MSGL)2( 二年二点三区组的区域试验资YearYearLocationLocationTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTLocationLocationTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTTRTDataInputDataInputGenYearLocBlockPROCClassGenYearMODELYield=GenYearLocYear*LocGen*YearGen*Loc;RandomYearLocYear*LocGen*YearGen*Loc/test;PROCClassGenYearLoc;RandomYearLocYear*LocGen*YearGen*Loc/SOLUTION;LsMeansGen/ADJUST=Tukey;PROCVARCOMPClassGenYearMODELYield=GenYearLocYear*LocGen*YearGen*Loc/fixed=1;水稻区域试验资料分析实主效应5个品种(固定2个年份(随机4个试点(随机3个区组(随机处理5×2×4试验小区40×3SASProcVarComp方差估算结Cov000SASProcVarComp方差估算结Cov0000SAS分析结FixedModel MixedModel FValueP-value FValueP-value Gen*Year*Loc SAS错误的t测验(采用MSE作为机误ErrorDegreesof ErrorMean TukeyGroupingMeanNGen B B 混合模型分析软件的结(QGAStation–RegionalTrial-TestMeanofVariety: MeanofVariety1 MeanofVariety2 MeanofVariety3 MeanofVariety4 MeanofVariety5 ( V ( V (混合模型分析软件的结(QGAStation–RegionalTrial-TestMeanofVariety: MeanofVariety1 MeanofVariety2 MeanofVariety3 MeanofVariety4 MeanofVariety5 ( V ( V ( V ( V ( V SASProcMixed固定效应估124Tukey-13-4-Tukey-14-4-Tukey-15-4-Tukey-23-4-Tukey-24-4-Tukey-25-4-Tukey-34-4-Tukey-35-4-Tukey-45-4-Tukey-各品种在各品种在不同试点二年的表品年 试点1 试点2 试点3 种份G1Y1-3.53659_ Y22.482002_ G2Y18.943473_**-3.15412_* Y2-5.63565_**8.403421_**- -G3Y1-8.23571_** Y2 - -G4Y15.133046_+-8.23733_**-4.40762_+ Y23.510965_ 14.44401_**0.212019_ G5Y1-8.07701_**19.96793_**-3.38656_ Y2 -16.5314_**8.991573_**混合模型分析软件的结(QGAStation–RegionalTrial-TestRVar S. P-(1): 8.013632.55e- (2): 8.985762.55e- (3): 7.18e-012(4): (5): (6):Var(GYL) 8.235898.62e-009(8): 3.26e-008GenYearLocBlockY1Y2yG有锁无锁数量性状基因定位的分析方F值,LRLOD曲 [L1原假设H0:无 10备择假设H1:有 性状平均 分别表示QQ,Qq和qq的频M_=12, _m=10标记?基因1未标记标记基因2未标记分子标表现型个性状性状性状11110020012232200004000000500002261121170000118111有锁无锁数量性状基因定位的分析方F值,LRLOD曲 [L1原假设H0:无 10备择假设H1:有 性状平均 分别表示QQ,Qq和qq的频M_=12, _m=10标记?基因1未标记标记基因2未标记分子标表现型个性状性状性状1111002001223220000400000050000226112117000011811100922122111222211111001100222QTL定位模QTL定位模型的矩阵模yXQbQIM~N V 原假H0无QTLs备择假设H1有QTLs似然比(LikelihoodRatio,LR)检验统计量LOD检验统计(ˆ(ˆQTL效应ˆ (XT )1XT yG区间作图法(IntervalMapping)(Lander和遗传假设 遗传变异只受一对基因控GGQb*Xjyjb0b*X* 区间作图法优点能推断相邻分子标记(Mi-和 之间QTL的位置及遗传效区间作图法缺点:其它QTL的存在会干扰的定QTL定位模QTL定位模型的矩阵模yXQbQCIMXMbMCIM~N XMb V 原假H0NoQTLs择假设H1HavingQTL效应ˆ XT XT XTy CIM( M)1 XT XT XTy 估计值与CIM估计值的关 (XTX)1XT yG复合区间作图法(CompositeIntervalMapping)(Zeng,遗传假定:数量性状受多基因控制GGQGb

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论