用R软件做线性回归分析问题_第1页
用R软件做线性回归分析问题_第2页
用R软件做线性回归分析问题_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一元线性回归分析问题考察温度对产量的影响,测得下列 10组数据:温度X(C )250556065产量Y(kg )13.215.116.417.117.918.719.621.222.524.3一、要求(1) 试画出这10对观测值的散点图。(2) 求丫和X的相关系数,并判断X、丫是否存在线性相关性。(3) 用最小二乘法求出丫对x的线性回归方程。2(4) 求出回归的标准误差 与回归拟合系数R .(5) 对回归方程做显著性检验。(6) 画出回归残差图并做相应分析。(7) 若温度为62 C,则产量为多少,并给出置信水平为 95%的预测区间。三、目的和意义学会使用R软件来做回归分析问题。四、实验步骤

2、1. 绘制x与y的散点图,初步确定回归方程,输入下列程序:> Xv-matrix(c(20,13.2,25,15.1,30,16.4,35,17.1,40,17.9,45,18.7,50,19.6,55,21.2,60,22.5,65,24.3), ncol=2,byrow=T,dim names=list(1:10,c("x","y") > > plot(forbes$x,forbes$y)图表1205060forbesSx从窗口中可以观察到,x与y大致成线性关系,假设其为;2. 做回归分析,输入下列程序:> lm.sol<

3、;-lm(yx,data=forbes)> summary(lm.sol)得到Call:lm(formula = y x, data = forbes)Residuals:Min 1Q Media n3Q Max-0.67273 -0.33333 -0.07273 0.34545 0.68182Coefficie nts:Estimate Std. Error t value Pr(>|t|)(In tercept) 9.121210.47708 19.12 5.8e-08 *0.223030.01063 20.97 2.8e-08 *Signif. codes: 0* '

4、0.001 '0.01*'.05 .'.1'Residual sta ndard error: 0.483 on 8 degrees of freedomMultiple R-squared: 0.9821, Adjusted R-squared: 0.9799F-statistic: 439.8 on 1 and 8 DF, p-value: 2.805e-08有以上计算结果得:p0 = 942121, pi = 022303 F sd(i0) = 0.47708. sdj i = 04063(对应两个系数的P-值均小于5.8 *1是非常显著的,关于方程的检验

5、,残差的标准差厅=0力83,相关系数的平方於=0.9821,关于F 分布的P-值为2.805,也是非常显著的。该模型能够通过t检验和f检验,因此回归方程为y = 9J2121 + 0.2233x我们将得到直线方程放在散点图上,得到图表2:图表26DfnrbcsSs下面分析残差,输入> abli ne(lm.sol)> y.res<-residuals(lm.sol);plot(y.res)得到残差图图表3图表3246810OIndpx由上图知大部分点的绝对值都在0.6以内,第7个点有点反常,可能存在一 点问题,现在做一些简单的处理:text(7,y.res7,labels=7

6、,adj=1.2)>> lm7<-lm (yx,data=forbes7)> summary(lm7)得到Call:lm(formula = y x, data = forbes7)Residuals:-0.5417 -0.3000 -0.1292 0.3750 0.5458Coefficie nts:Estimate Std. Error t value Pr(>|t|)(In tercept) 9.079167 0.434154 20.91 1.44e-07 *x 0.225833 0.009811 23.02 7.40e-08 *Signif. codes:

7、 0 * ' 0.001 * ' 0.01 *' 0.05. ' 0.1 '1Residual sta ndard error: 0.4387 on 7 degrees of freedomMultiple R-squared: 0.987, Adjusted R-squared: 0.9851F-statistic: 529.9 on 1 and 7 DF, p-value: 7.403e-08可以对比发现,回归系数没有发生什么变化,R系数有所提高,但是p值增大很多,说明样本点7不能去掉。所以回归方程还是y = 9.12121 + 3. 预测若温度为62 C,给出置信水平为95%的预测区间,输入以下代码> n ew<-data.frame(x=62)> lm.pred<-predict(lm.sol, new,i n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论