生物统计与试验设计-中文课件chapt_第1页
生物统计与试验设计-中文课件chapt_第2页
生物统计与试验设计-中文课件chapt_第3页
生物统计与试验设计-中文课件chapt_第4页
生物统计与试验设计-中文课件chapt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第它多元回归及非线性回 多项式回归模型量为高阶(higherorder)的回归模型.多项式回归模型可以含有一个或多个自变量,也可以包括二阶或更高的阶.YYi=b0Xi0+b1Xi1+b2Xi2+多多元回归SAS析Yib0b1Xib2X2 R2=InputPowerProcModelPower=X1X2/All;X1=X2=Home*具有一具有一个自变量的二阶 order)多项式回归模Yi=b0+b1Xi+b2Xi2+其是回归截距b1是自变量线性效应 effect)的回归系b2是自变量二次型效应(quadraticeffect)ieiX是一阶自变量,X2是二阶自变量ei~N(0,2SizeDataDatainputPowerHome@@;X1=Home;X2=Home*Home;ModelPower=X1X2/All;1182149318041954;ProcModelCrossproductsX'XX'YX'XInverse,ParameterEstimates,and-6.36E--------RootRootR-DepAdjR- Sumof FValue 831069.5415534.8 15332.55C Tfor1--11-- DepResidualStd152.435923422.95865636.7685734.599889ixio o例例题4.1.2数据具有具有一个自变量的三阶 order)多项式回归模Yi=b0+b1Xi+b2Xi2+b3Xi3+具有二个自变量的二阶多项式回归模型是Yi=b0+b1Xi1+b2Xi2+b3Xi1+b4Xi2+b5Xi1Xi2+22以例题 皮棉产量(Y)与其三个产量构成因素单铃数 单铃重(W)和衣分(L)的回归分析为例衣i铃(铃单铃重(克衣产(公斤BiWiLi1--2-3---456--7-89--------------DataDatainputbwly@@;modely=bwbbwwbw/noint; 58.38 57.02 79.66 50.55 35.16 64.72 ; 48.04 proc用用通过原点的二阶多项式回归模型分析例题4.1中皮棉产量(Y)与单株铃数(B)和单铃重(W)的线性关系,Yi=bBBi+bWWi+bBBBBi+bWWWWi+bBWBWi+其中BBBB,WWWW,BW多元决定系数值为R2=SSR/SSTO=调整多元决定系数值是多元线性回归R2=1MSE/MSTO=aYi=bBBi+bWWi+bLLi+多元决定系数值为R2SSRSSTO调整多元决定系数值是R2=1MSE/MSTO=a皮皮棉产量通过原点的二阶多项式回归参数的分析结果分析结果表明单株铃数的二阶自变量(BB)和单铃重的二阶自变量(WW)的回归参数未达到5%显著水变参数估计标准误t*PBW0在在多项式回归模型的分析中,一般采用自变量X的离均差作Yi=b0+b1(XiX)+b2(XiX)2+b0+b1xi+bx+22i其中x是自变量的离均差一个自变量的三阶多项式回归模型:Yi=b0+b1(XiX)+b2(XiX)2+b3(XiX)3+b+bx+bx+bx+23 1 2 3 皮皮棉产量通过原点的二阶多项式回归方差分析表多元决定系数值为R2=SSRSSTO调整多元决定系数值是R21MSE/MSTOa每个自变量的回归参数分析结果列于表二个变量的二阶多项式回归模型:二个变量的二阶多项式回归模型:Yi=b0+b1(Xi1X1)+b2(Xi2X2+b3(Xi1X1)2+b4(Xi2X2)2+b5(Xi1X1)(Xi2X2)+b+bx+bx+bx+bx+bxx+22 1 2i 3 4i 5i1i 如果例题4.1中皮棉产量(Y)与单株铃数(B)和单铃重(W)的线性关系用模型分析,二阶多项式回归方差分析结果列于表变异原因FP5皮皮棉产量通过原点的二阶多项式回归参数的分析结果在本实例中,采用离均差二阶多项式模型(4.60)的分析结果与二阶多项式模型(4.57)的分析结果非常接近.变参数估计标准t*PB0W0指示变量回归模回归模型中的自变量数量变量tative质量变量(qualitative指示变量(indicatorvariables):质量变量经数量指示变量有时又称为哑变量 07V1:Yˆ3.900.384X,r11V2:Yˆ3.300.24X,r211V3:Yˆ0.288X,r211RR2图 三个品种成铃数与初花后天数的回归模型0 当相当相依变量Y决定于一个数量变量和一个质量变量 质量变量如果有c个类别(c1个自变量)时,Yi与自变量的关系可由以下回归模型表示 i=1,2,…,n其cYi=b0+b1Xi1+bjXij+jb0是回归截距截b1bj的回归系数ei是独立 ei~N(0,2指示变量回归模型)基于一个假设:不同类别的回归模型具有相同的回归斜率.例题例题某棉花试验观察了三个棉花品种不同时期的平均单株成铃数(相依变量Y数量变量(X1)是棉花初花期(7月1日)以后的天数(35天至65天),质量变量是品种.由于有三个类(c1,2,3可取二个指示自变量X3品种1:Xi2=1,Xi3品种2:Xi2=0,Xi3=1;品种3:Xi2=0,Xi3三个品种的线性回三个品种的线性回归具有共同的斜率及不同的截距.相依变量的期望值E(Y)因品种而异对于品种E(Y b0b1X1b2(1)b3 b0 对于品种E(Y)=b+bX+b(0)+b (b0+b3)+3对于品种E(Y)=b0+b1X1+b2(0)+b3b0+b1++++=相依变量相依变量与自变量的关系可由以下回归模型表示i=1,2,L,)Yi=b0+b1Xi1+b2Xi2+b3Xi3+描述了三个品种平均单株成铃与初花后天数的线性关datainputdx1x2y@@;350035013510400040014010450045014510500050015010550055015510600060016010650065016510;procmodely=dx1x2;

的编排和读入表 棉花成铃数具有相同斜率的回归模型方差分析变异原自由平方均FP回3残总多元决定系数值为R2表表 棉花成铃数回归参数的统计分析结参参数估计标准P截初花后天数(X1指示变量(X2--指示变量(X3-可可以采用以下回归公式由初花后天数预测不同品种的单株成铃数,品种 1品种)+ˆ 1品种ˆ+ˆ 3.290.30 1按照指示变量回归模型分析的三个棉花品种单株成铃数与初花后天数的线性关系示于图图图 三个品种成铃数与初花后天数的回归模如如果对于各类别的相依变量Y与自变量的回归函数有不同的截距和斜率,Yi与自变量的关系可以由以下回示i=1,2,…,Yi=b0+b1Xi1+bjXij+b(c1j)Xi1Xij+cc 其b0是回归截截斜b1是数量自变量的回归系数bj和b(c1j)是指示自变量的回归系数ei是独立 量,具有独立正态分布ei~N(0,2图图 三个品种成铃数与初花后天数的回归模型现现以例题5.1的棉花试验资料为例,具体的指示变量回归分析方法.相依变与自变量的关系可由以下回归模型表示(i=1,2,L,21Yi=b0+b1Xi1+b2Xi2+b3Xi3+b4Xi1Xi2+b5Xi1Xi3+datadatainputdx1x2ymodely=dx1x2x3x4;品种品种1,E(Y)=b0b1X1+b21)+b30)+b4X1(1)+b5(b0+b2)+(b1b4)品种2,E(Yb0+b1X1+b2(0)+b3(1)+b4X1(0)+b5(b0+b3)+(b1b5)E(Y)=b0+b1X1+b2(0)+b3(0)+b4X1(0)+b5X1b0+b1这三个品种的线性回归具有不同的截距和斜率品种的编排和读入350035013510400040014010450045014510500050015010550055015510600060016010650065016510;proc表表 棉花成铃数具有不同斜率的回归模型方差分析表 棉花成铃数回归参数的统计分析结变异原因自由度平方和均FP回5残总变参数估计标准t*P截初花后天数(X10指示变量(X2--指示变量(X3--指示变量(X1X2指示变量(X1X3--多元决定系数值为多元决定系数值为R2=SSR/SSTO=544.72/561.15=由于指示变量X1的t*值最小,删除该变量后再按以下模型分析(i=1,2,L, Yi=b0+b1Xi1+b2Xi2+b3Xi3+b4Xi1Xi2+品品种 E(Y)=b0+b1X1+b2(1)+b3(0)+b4(b0+b2)+(b1b4)品种2,E(Yb0+b1X1+b2(0)+b3(1)+b4X1(b0+b3)+b1品种3,E(Y)=b0+b1X1+b2(0)+b3(0)+b4X1b0+b1表表 棉花成铃数指示变量回归模型方差分析表多元决定系数值为R2=SSR/SSTO=543.99/561.15=表 棉花成铃数回归参数的统计分析结变异原自由平方均FP回4残总变参数估计标准t*P截初花后天数(X1指示变量(X2--指示变量(X3--指示变量(X1X2可以采用以下回归公式由初花后天数预测不同可以采用以下回归公式由初花后天数预测不同品种的单株成铃数,对于品种 3.900.39 1对于品种 ˆ 1对于品种Yˆˆ+ˆ 5.270.271RR2 三个品种成铃数与初花后天数的回归模(X1)是时0,其后为Yi=b0+b1+b2Xi2+b3Xi1Xi2+如果相依变量如果相依变量Y与自变量X的线性关系在X的不同范围内可能表现不同,可以采用分段回归模型(piecewiseregressionmodel)分析.31421324354617283941241234123全模Y=b0b1X1b2X2b3X1X2对于前8个季度的福特E(Y)=b0b1X1b2(0)b3b0b1X126.00对于8个季度以后的福特RootAdjR-E(Y)=b0b1X1b2(1)b3X114.60简单线性回归t---Yˆ=18.17r2E(Y)=-12345678910111213141516171819202122不不同时段连续变异的分段回归模型分析0 例例题某棉花试验观察了一个棉花品种不同时期的平均单株开花 后),单株开花数与初花后天数在这二个阶段可能具有不同的相依变量Y平均单株开花数数量变量X1=初花期(7月1日)以后的天数指示自变量i20如果初花后天数指示自变量Xi21如果初花后天数由于天数为由于天数为0时开花数也为0,因此可以采用经过原点的回归模型表示相依变量Yi与自变量的关系,Yi=b1Xi1+b2(Xi130)Xi2+指示变量回归模型(5.8)实际上描述了二个阶段平均单株开花数与初花后天数的不同线性关系.对于前30天(立秋前)的棉花,E(Yb1X1b2X1b1对于后35天(立秋后)的棉花,E(Yb1X1b2X130b2(b1b2)表 棉花单株开花数回归参数统计分析结变参数估计值标准误t*P初花后天数(X1指示变量((X1-30)X表 棉花成铃数指示变量回归模型方差分析变异原因自由度平方和均FP回2残总多元决定系数值为R2=SSR/SSTO=12278.72/12530.417=将近98%以上的开花数变异是由这二个自变量所决定的图图一个品种单株开花数与初花后天数的回归模型 线性回归模型(linearregression回归参数 内蕴线性和非线性回归Y1ii2iYib0b1XiR2=R2=自变量为一阶自变量为一阶(first-order)的Yi=b0+b1Xi1+b2Xi2+…+bpXip+自变量为二阶(second-order)的线性模型Yi=b0+b1Xi1+b2Xi2+b3X2b4X2b5Xi1Xi2+i相依变量和自变量经过变量转换而成为logYib0 Xi1b2exp(Xi2)内内蕴线性回归模型(intrinsicallylinearregressionmodel):一些模型的回归参数虽然Y[exp(X i两边分别取对数,该模型可以转换成线性回归模型log(Yi)=log(0)+1Xi+log(ei设Yi=log(Yib0=log(0),b1=e'i=log(ei以上模型可以改写成Yi=b0+b1Xi1+(ergono:性参数的模型.比如以下模型Yi1exp(2Xi)性回归模型.常用的非线性模型常用的非线性模型 模型(S形生长模型Y 2 +i1是上限,3是生长率 常常用的非线性模型 模型(S形生长模型 1+2e3+1是上限,2是接近上限时的影响,3是生长率曲线回归的不妥表达式曲线回归的不妥表达式yaebx非线非线性回归参数的估计非线性回归模型的通式表示Yi~N(f(Xi θ) i=1,2,…,非线性回归模型矩阵表示简 yf(θ)对所有的函数[fi(θ)]中回归参数向量的参数求偏导,可得到f(θ)的Jacobian矩f1(θ)f1(θ)pZ()=fθ fiM1LMfi(θ)pfn1fn(θ)Mp采用采用Gauss-Newton迭代法获得的回归参数估计是最小二乘估计的近似值.估计似地表示, θ[ZT(θ)Z(θ)]1ZT(θ)[yf当试验样本足够大时ˆ具有渐近多元正态分布 MVNp(θ,2[ZT(ˆ(ˆ例题例题棉花单株在不同时期的成铃数(Y)与初花后天数(X)存在非线性的关系.假设这一非线性关系可用生长模型(Gompertz模型)表示Yi1exp[2exp(3Xi)]Y2 i某一棉花品种七月五日至九月三日每隔五天的某一棉花品种七月五日至九月三日每隔五天的单株成铃数观察值为yT0.752.04.04.7510.1312.2613.1413.5214.15初花后天数 SASSAS程序DataCotton;50.75102.015204.75255.2530357.75404512.26505513.526065;数值计算方法迭代初始值PROCNLINMETHOD=GAUSS;PARMSA=20.0B=1.0C=0.0;模MODELBoll=A*EXP(-B*EXP(-C*Day));采用采用Gauss-Newton法估计非线性回归参数,初始值120.0得到了收敛的参数估计。只迭代了8次,便PROCPROCNLIN:METHOD=METHOD=GAUSS|MARQUARDT|WTON|GRADIENT|DUDMETHODOption用于指定数值计算的方GAUSS,MARQUARDT和NEWTON迭代次数残差平方和0299.195285120.0000002.0515950.03365463.133251220.4320372.9466030.0360069.5817

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论