田间统计实验:第四节 回归与相关分析_第1页
田间统计实验:第四节 回归与相关分析_第2页
田间统计实验:第四节 回归与相关分析_第3页
田间统计实验:第四节 回归与相关分析_第4页
田间统计实验:第四节 回归与相关分析_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节回归与相关分析

一、利用SAS进行回归和相关分析二、利用Excel的分析工具库进行回归和相关分析直线回归分析直线回归分析(LinearRegression)是基于最小二乘法(LeastSquareMethod)原理产生的最优无偏估计。它是研究一个自变量(Independent)与一个因变量(Dependent)之间是否存在某种线性关系的统计学方法。直线回归分析又叫简单回归分析(SimpleRegression)。回归分析基本公式直线回归方程的显著性检验回归方程显著性检验的方差分析表回归系数和回归截距的显著性检验95%回归系数的置信区间为:95%回归截距的置信区间为:回归与相关分析的SAS过程用于线性相关和回归分析的过程有:回归分析(REG)、相关分析(CORR)和广义线性模型(GLM),其中CORR过程仅用相关分析。用于非线性回归直接拟合的过程为NLIN。REG过程(数据步同前):PROCREG;MODELY=X;RUN;回归分析[例9.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。x累积温y盛发期35.534.131.740.336.840.231.739.244.212169273139-1

表9.1累积温和一代三化螟盛发期的关系(一)一元相关和回归分析以教材P160例9.1为例(回归方程的取得和测验)。DATAtb91; INPUTxy@@;CARDS;35.51234.11631.7940.3236.8740.2331.71339.2944.2-1

;PROCREG;MODELy=x;PLOTy*x;RUN;用REG过程,MODEL语句设定线性数学模型。PLOT语句作用是以变量y作为纵坐标、变量x作横坐标作x-y散点图。回归系数b回归截距at测验实得t值两尾概率值,<α则否定H0,反之则接受HA。SaSbt值F测验实得F值右尾概率值,<α则否定H0,反之则接受HA。datapest;inputXY@@;cards;35.51234.11631.7940.3236.8740.2331.71339.2944.2-1;procsortout=sorted;byX;run;procregdata=sorted;modelY=X/rclm;idX;run;datapest;inputXY@@;cards;35.51234.11631.7940.3236.8740.2331.71339.2944.2-1symbolvalue=stari=r1width=2;procgplot;plotY*XY*X/overlay;run;SYMBOL语句是规定作图功能的选项,value=star是表示以星号代表散点,i=r1表示画回归直线,width=2是回归线要宽一些(缺省时=1)DATAPEST;INPUTXY@@;CARDS;35.51234.11631.7940.3236.8740.2331.71339.2944.2-1;SYMBOL1CI=BLACDI=RLCLM95WIDTH=1;SYMBOL2CI=BLACDI=RLCLI95WIDTH=2;PROCGPLOT;PLOTY*XY*X/OVERLAY;RUN;计算回归估计值和因变量预报值的0.95置信区间以教材P166例9.6为例(区间估计)。DATAtb95;INPUTxy@@;CARDS;701616.3671610.9551440.0521400.7511423.3521471.3511421.8601547.1641533.0;PROCREG;MODELy=x/CLMCLI;RUN;多元回归和逐步回归分析多元回归和逐步回归分析时,仍用REG过程,只在MODEL语句中增加自变量和选项如:MODELY=X1-X5/SELECTION=**SELECTION指定逐步回归时筛选变量的方法常用有:前进法FORWARDSLE=0.5

后退法BACKWARDSLS=0.1

逐步法STEPWISESLE=SLS=0.15前进法(逐步法)变量进入模型的α水准SLE=后退法(逐步法)剔除变量的α水准SLS=PROCCORR;VARXY;RUN;加选项SPEARMAN计算等级相关系数NOSIMPLE不输出一般性统计描述的结果WEIGHT语句可以指定变量为频数相关系数的计算相关系数的计算利用CORR过程:[例9.1]optionslinesize=76;datapest;inputXY@@;cards;35.51234.11631.7940.3236.8740.2331.71339.2944.2-1;proccorr;varXY;run;相关系数rt测验实际概率二、利用Excel的分析工具库进行回归和相关分析

INTERCEPT(known_y's,known_x's)计算两组数据的回归截距SLOPE(known_y's,known_x's)计算两组数据的斜率LINEST(known_y's,known_x's,const,stats)计算两组数据回归截距和回归系数CORREL(array1,array2)计算两组数据的相关系数COVAR(array1,array2)计算两组数据的协方差EXCEL电子表格提供的部分粘帖函数[例9.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。x累积温y盛发期35.534.131.740.336.840.231.739.244.212169273139-1

表9.1累积温和一代三化螟盛发期的关系回归系数b回归截距aLINEST()函数相关系数与协方差的计算简单相关系数的基本公式

CORREL()函数协方差的计算

协方差的基本公式

总体协方差

样本协方差

粘帖函数(COVAR函数):总体协方差协方差分析工具法:样本协方差分析

练习1、完成教材第九章9.5、9.6习题。(pp190-191)。2、完成以下补充习题。某地29名13岁男童身高、体重、肺活量资料如下,身高体重肺活量身高体重肺活量135.132.01.75153.032.01.75139.930.41.75147.640.52.00163.646.22.75157.543.32.25146.533.52.50155.144.72.75156.237.12.75160.537.52.00156.435.52.00143.031.51.75167.841.52.75149.933.92.25149.731.01.50160.840.42.75145.033.02.50159.038.52

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论