版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于黑樱桃树的回归分析问题在R的基本数据包dataset中,trees是由Girth, Height, Volume这三个变量的31个观测组成的数据框,分别代表31棵被砍伐的黑樱桃树的离地面4英尺6处的直径、高度、体积。下面是R统计软件给出的信息:1. names(trees)1 Girth Height Volume2. summary(trees) Girth Height Volume Min. : 8.30 Min. :63 Min. :10.20 1st Qu.:11.05 1st Qu.:72 1st Qu.:19.40 Median :12.90 Median :76 Media
2、n :24.20 Mean :13.25 Mean :76 Mean :30.17 3rd Qu.:15.25 3rd Qu.:80 3rd Qu.:37.30 3. boxplot(trees) 4. cor(trees) Girth Height VolumeGirth 1.0000000 0.5192801 0.9671194Height 0.5192801 1.0000000 0.5982497Volume 0.9671194 0.5982497 1.0000000(1) summary(m1|t|) (Intercept) 62.0313 4.3833 14.152 1.49e-14
3、 *Girth 1.0544 0.3222 3.272 0.00276 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 5.538 on 29 degrees of freedomMultiple R-squared: 0.2697, Adjusted R-squared: 0.2445 F-statistic: 10.71 on 1 and 29 DF, p-value: 0.0027585.(2) summary(m2|t|) (Intercept) -36.9435 3.3651 -10
4、.98 7.62e-12 *Girth 5.0659 0.2474 20.48 2e-16 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 4.252 on 29 degrees of freedomMultiple R-squared: 0.9353, Adjusted R-squared: 0.9331 F-statistic: 419.4 on 1 and 29 DF, p-value: summary(m3|t|) (Intercept) -87.1236 29.2731 -2.976
5、0.005835 * Height 1.5433 0.3839 4.021 0.000378 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 13.4 on 29 degrees of freedomMultiple R-squared: 0.3579, Adjusted R-squared: 0.3358 F-statistic: 16.16 on 1 and 29 DF, p-value: 0.0003784 由回归分析的结果可得:虽然 VolumeHeight, HeightGirth之间
6、有显著性关系,但是相关系数都不大,因此没有进一步分析的必要。而VolumeGirth 相关系数r20.9所以可以继续作为研究对象进行深入的分析。6.对于VolumeGirth:由5中可得,y=a1+a2*x,则a1的估计值为-36.9435,a2的估计值为5.0659,得到回归方程为y=-36.9435+5.0659*x(y:Volume,x:Girth)plot(VolumeGirth,trees)abline(lm(VolumeGirth,trees) anova(m2)Analysis of Variance TableResponse: Volume Df Sum Sq Mean Sq
7、 F value Pr(F) Girth 1 7581.8 7581.8 419.36 r=residuals(m2)plot(r) plot(cooks.distance(m2)由残差图分析可得:第31个点有可能为强影响点,用程序将第31个点的残差标出: x=matrix(c(8.3,10.3,8.6,10.3,8.8,10.2,10.5,16.4,10.7,18.8,10.8,19.7,11,15.6,11,18.2,11.1,22.6,11.2,19.9,11.3,24.2,11.4,21,11.4,21.4,11.7,21.3,12,19.1,12.9,22.2,12.9,33.8,1
8、3.3,27.4,13.7,25.7,13.8,24.9,14,34.5,14.2,31.7,14.5,36.3,16,38.3,16.3,42.6,17.3,55.4,17.5,55.7,17.9,58.3,18,51.5,18,51,20.6,77),nrow=31,ncol=2,byrow=T,dimnames=list(1:31,c(Girth,Volume) output=data.frame(x) m22=lm(VolumeGirth,output) summary(m22) r=residuals(m22) plot(r) text(31,r31,labels=31)用简单的程序
9、将第31个点去掉: i=1:31 output2=data.frame(xi!=31,) m222=lm(VolumeGirth,output2) summary(m222)Call:lm(formula = Volume Girth, data = output2)Residuals: Min 1Q Median 3Q Max -7.5036 -2.3834 -0.0489 2.3951 6.3726 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) -33.3104 3.2784 -10.16 6.76e-11 *G
10、irth 4.7619 0.2464 19.33 2e-16 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 3.813 on 28 degrees of freedomMultiple R-squared: 0.9303, Adjusted R-squared: 0.9278 F-statistic: 373.6 on 1 and 28 DF, p-value: new=data.frame(Girth=22.0) lm.pred=predict(m2,new,interval=predict
11、ion,level=0.95) lm.pred fit lwr upr1 74.50538 64.62254 84.38822 lm.pred=predict(m2,new,interval=confidence,level=0.95) lm.pred fit lwr upr1 74.50538 69.81016 79.20069.添加变量: fm1=lm(VolumeGirth+Height,data=trees) summary(fm1)Call:lm(formula = Volume Girth + Height, data = trees)Residuals: Min 1Q Media
12、n 3Q Max -6.4065 -2.6493 -0.2876 2.2003 8.4847 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) -57.9877 8.6382 -6.713 2.75e-07 *Girth 4.7082 0.2643 17.816 2e-16 *Height 0.3393 0.1302 2.607 0.0145 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 3.882 on 28 deg
13、rees of freedomMultiple R-squared: 0.948, Adjusted R-squared: 0.9442 F-statistic: 255 on 2 and 28 DF, p-value: anova(fm1)Analysis of Variance TableResponse: Volume Df Sum Sq Mean Sq F value Pr(F) Girth 1 7581.8 7581.8 503.1503 hist(resid(fm1),freq=F,main=残差的直方图) fm1.new=update(fm1,.+Girth:Height) su
14、mmary(fm1.new)Call:lm(formula = Volume Girth + Height + Girth:Height, data = trees)Residuals: Min 1Q Median 3Q Max -6.5821 -1.0673 0.3026 1.5641 4.6649 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 69.39632 23.83575 2.911 0.00713 * Girth -5.85585 1.92134 -3.048 0.00511 * Height -1.29
15、708 0.30984 -4.186 0.00027 *Girth:Height 0.13465 0.02438 5.524 7.48e-06 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 2.709 on 27 degrees of freedomMultiple R-squared: 0.9756, Adjusted R-squared: 0.9728 F-statistic: 359.3 on 3 and 27 DF, p-value: 2.2e-16 由新的fm1可以看出:Girth 与 Height 均对Volume有影响,且相关系数比仅用Girth 对Volume进行回归更大,所以y=b0+b1*x1+b2*x2,b0的估计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《政治学与行政学专业导论》课程教学大纲
- 2024年代理租赁企业合同范本
- 2024年出版物独家版权合同范本
- 坦克课件教学课件
- 中国融资租赁发展展望指数(CFLEI)2024年三季度报告
- 华为订单管理
- 医疗器械设备经验
- s版假如课件教学课件
- 2024至2030年中国覆膜型材行业投资前景及策略咨询研究报告
- 2024年轻型方轨项目成效分析报告
- 自然资源调查监测技能竞赛理论考试题库大全-下(判断题)
- 完整版维修电工高级三级培训计划
- 劳务结算单模板
- EXCEL小游戏-青蛙跳
- 2017医疗器械培训试题
- 第八讲 地形图应用(二)
- 普铁避雷器检修作业指导书
- 工资流水证明2页
- 三年级美术上册《天然的纹理》教案
- 沸腾传热PPT课件
- 急性肾衰竭与crrt治
评论
0/150
提交评论