SPSS实验6-回归分析_第1页
SPSS实验6-回归分析_第2页
SPSS实验6-回归分析_第3页
SPSS实验6-回归分析_第4页
SPSS实验6-回归分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS作业6 :回归分析 (一)回归分析 多元线性回归模型的基本操作: (1 )选择菜单 An alyze Regressi on Lin ear ; (2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源 加工转换效率)到对应框中; (3)在 Method框中,选择 Enter方法; 在 Statistics 框中,选择 Estimates 、 Model fit 、 Covariancematrix 、 Collinearity diagnostics选项; 在 Plots 框中,选择 ZRESE到 Y框,Z

2、PRED到 X框,再选择 Histogram 和 Normal plot ; (4)选择菜单 Analyze Non Test 1-Sanple K-S; 选择菜单 Analyze Correlate Brivariate; 结果如下: Regressi on 能源消费需求的多元线性回归分析结果(强制进入策略)(一) Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate 1 .990a .980 .973 8480.38783 a. Predictors: (Constant),能源加工转换效

3、率/%,交通运输邮电业增加值/亿元,工业增加值/亿元,人均电 力消费/千瓦时,建筑业增加值/亿元,国内生产总值/亿元 b. Dependent Variable:能源消费标准煤总量/万吨 分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。该方程有 6个解释变量,调整的判定系数为0.973 ,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。 能源消费需求的多元线性回归分析结果(强制进入策略)(二) ANOVA Model Sum of Squares df Me

4、an Square F Sig. 1 Regression 5.766E10 6 9.611E9 133.636 .000a Residual 1.151E9 16 7.192E7 Total 5.882E10 22 a. Predictors: (Constant),能源加工转换效率/%,交通运输邮电业增加值/亿元,工业增加值/亿元,人均电力 消费/千瓦时,建筑业增加值/亿元,国内生产总值/亿元 b. Dependent Variable:能源消费标准煤总量/万吨 分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及

5、均方分别为1.151E9和7.192E7, F检验统计量的观测值为133.636,对应的概率p值近似为0。如果显著性水平 a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为 各回归系数不同时为 0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。 能源消费需求的多元线性回归分析结果(强制进入策略) Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error Beta Tolerance

6、VIF 1(Constant) 168326.234 108640.972 1.549 .141 国内生产总值/亿元 -.142 .764 -.191 -.186 .855 .001 854.967 工业增加值/亿元 .503 .249 .293 2.024 .060 .058 17.109 建筑业增加值/亿元 8.294 10.431 .619 .795 .438 .002 495.962 交通运输邮电业增加值/亿元 -.203 .111 -.075 -1.829 .086 .731 1.368 人均电力消费/千瓦时 233.912 388.519 .338 .602 .556 .004 2

7、57.777 能源加工转换效率/% -1373.376 1588.868 -.051 -.864 .400 .353 2.833 a. Dependent Variable: 能源消费标准煤总量/万吨 分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解 释变量的容忍度和方差膨胀因子。 由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归 系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍

8、度和方差膨胀因子来看,该方程的解释变量的多 重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变 量。 (四) 能源消费需求的多元线性回归分析结果(强制进入策略) Collinearity Diagnostics Dimensi Modelon Eigenvalue Condition Index Variance Proportions (Constant) 国内生产总值/亿元 工业增加值/亿元 建筑业增加值/亿元 交通运输邮电业增 加值/亿元 人均电力消费/千瓦 时 能源加工转换效率 /% 1 1 2 3 4

9、5 6 7 5.714 .709 .551 .023 .001 .000 .000 1.000 2.838 3.219 15.624 62.420 135.055 211.339 .00 .00 .00 .00 .00 .00 .99 .00 .00 .00 .00 .00 .99 .00 .00 .00 .01 .81 .10 .07 .02 .00 .00 .00 .00 .22 .62 .15 .01 .66 .16 .00 .14 .00 .02 .00 .00 .00 .01 .47 .43 .10 .0C .0C .00 .00 .01 .00 .99 a. Dependent V

10、ariable:能源消费标准煤总量/万吨 分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1 )。依据该表可以进行多重共线性 检测。 从方差比来看,第 6个特征根既能解释国内生产总值方差的99%也可以解释建筑业增加值方差的62%同时还可以解释人均电力消费方差的43%因此 有理由认为这些变量间存在多重共线性。 从条件指数来看,第 4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。 多元线性回归模型的其他操作: (1 )选择菜单 An alyze Regressi on Lin ear ; (2) 选择被解释变量(能源消费标准煤

11、总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源 加工转换效率)到对应框中; (3) 在 Method框中,选择 Backward方法; 在 Statistics 框中,选择 Estimates、Model fit 、R-squared change、Durbin-Watson 选项; 在 Plots 框中,选择 ZRESED1U Y框,ZPRED到 X框,再选择 Histogram 和 Normal plot ; 在 Save 框中,选择 Predicted Values 中的 Standardized , Residuals 中的 Stan

12、dardized 选项;结果如下: 能源消费需求的多元线性回归分析结果(向后筛选策略)(一) Model Summary f Model R R Square Adjusted R Square Std. Error of the Estimate Change Statistics Durbin-Watson R Square Change F Change df1 df2 Sig. F Change 1 .990 a .980 .973 8480.38783 .980 133.636 6 16 .000 2 .990 b .980 .975 8236.10826 .000 .035 1 1

13、6 .855 3 .990 c .980 .975 8105.20563 .000 .432 1 17 .520 4 .989d .978 .975 8241.72504 -.002 1.645 1 18 .216 5 .987 e .975 .972 8620.83495 -.003 2.882 1 19 .106 .741 a. Predictors: (Constant),能源加工转换效率/%,交通运输邮电业增加值/亿元,工业增加值/亿元,人均电力消费/千瓦时,建筑业增加值/亿元,国内生产总值/亿元 b. Predictors: (Constant),能源加工转换效率/%,交通运输邮电业

14、增加值/亿元,工业增加值/亿元,人均电力消费/千瓦时,建筑业增加值/亿元 c. Predictors: (Constant), 能源加工转换效率/%,交通运输邮电业增加值/亿元,工业增加值/亿元,建筑业增加值/亿元 d. Predictors: (Constant), 交通运输邮电业增加值/亿元,工业增加值/亿元,建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元,建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨 分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。从方程建立的过程来看,随着

15、解释变量的不断减少,方程的拟合优 度下降了。依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。如果显著性水平a为0.05,可以看到这 些被剔除变量的偏 F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的 线性解释没有显著贡献,不应保留在方程中。最终保留在方程中的变量是工业增加值、建筑业增加值。方程的DW检验值为0.741,残差存在一定程度的 正自相关。 能源消费需求的多元线性回归分析结果(向后筛选策略)(二) ANOVA f Model Sum of Squares df Mean Squa

16、re F Sig. 1 Regression 5.766E10 6 9.611E9 133.636 .000a Residual 1.151E9 16 7.192E7 Total 5.882E10 22 2 Regression 5.766E10 5 1.153E10 170.010 .000b Residual 1.153E9 17 6.783E7 Total 5.882E10 22 3 Regression 5.763E10 4 1.441E10 219.321 .000 ( Residual 1.182E9 18 6.569E7 Total 5.882E10 22 4 Regressio

17、n 5.752E10 3 1.917E10 282.290 .000d Residual 1.291E9 19 6.793E7 Total 5.882E10 22 5 Regression 5.733E10 2 2.866E10 385.694 .000e Residual 1.486E9 20 7.432E7 Total 5.882E10 22 交通运输邮电业增加值 /亿元,工业增加值/亿元,人均电力消费 /千 能源加工转换效率/%, 国内生产总值/亿元 a. Predictors: (Constant), 瓦时,建筑业增加值/亿元, 12 b. Predictors: (Constant)

18、, 瓦时,建筑业增加值/亿元 能源加工转换效率/%, 交通运输邮电业增加值 /亿元,工业增加值/亿元,人均电力消费 c. Predictors: (Constant), 元 能源加工转换效率/%, 交通运输邮电业增加值 /亿元,工业增加值/亿元,建筑业增加值 d. Predictors: (Constant), 交通运输邮电业增加值 /亿元,工业增加值/亿元,建筑业增加值/亿元 e. Predictors: (Constant), 工业增加值/亿元,建筑业增加值/亿元 f. Dependent Variable: 能源消费标准煤总量/万吨 因此被解释变量与解释变量的 分析:表中的第五个模型是最

19、终的方程。如果显著性水平 a为0.05,由于回归方程显著性检验的概率p值小于显著性水平, 线性关系显著,建立线性模型是恰当的。 能源消费需求的多元线性回归分析结果(向后筛选策略) Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 168326.234 108640.972 1.549 .141 国内生产总值/亿元 -.142 .764 -.191 -.186 .855 工业增加值/亿元 .503 .249 .293 2.

20、024 .060 建筑业增加值/亿元 8.294 10.431 .619 .795 .438 交通运输邮电业增加值 /亿元 -.203 .111 -.075 -1.829 .086 人均电力消费/千瓦时 233.912 388.519 .338 .602 .556 能源加工转换效率/% -1373.376 1588.868 -.051 -.864 .400 2 (Constant) 168324.108 105511.543 1.595 .129 工业增加值/亿元 .489 .230 .285 2.123 .049 建筑业增加值/亿元 6.768 6.275 .505 1.079 .296 交

21、通运输邮电业增加值 /亿元 -.204 .108 -.075 -1.894 .075 人均电力消费/千瓦时 185.993 282.858 .269 .658 .520 能源加工转换效率/% -1359.393 1541.379 -.050 -.882 .390 3 (Constant) 199581.167 92699.722 2.153 .045 工业增加值/亿元 .456 .221 .265 2.061 .054 建筑业增加值/亿元 10.708 1.836 .799 5.831 .000 交通运输邮电业增加值 /亿元 -.175 .096 -.064 -1.811 .087 能源加工转

22、换效率/% -1774.819 1383.608 -.066 -1.283 .216 4 (Constant) 80721.633 2754.362 29.307 .000 工业增加值/亿元 .473 .225 .275 2.105 .049 建筑业增加值/亿元 9.902 1.755 .739 5.644 .000 交通运输邮电业增加值 /亿元 -.166 .098 -.061 -1.698 .106 5 (Constant) 80452.139 2876.271 27.971 .000 工业增加值/亿元 .464 .235 .270 1.977 .002 建筑业增加值/亿元 .696 .4

23、31 .324 1.615 .000 a. Dependent Variable: 能源消费标准煤总量/万吨 分析:表中展示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。如果显著性水平 不显著的解释变量,因此这些方程都不可用。第五个模型是最终的方程,其回归系数显著性检验的概率 增加值与被解释变量间的线性关系显著,它们保留在模型中是合理的。最终的回归方程是,能源消费需求 加值,意味着当工业增加值每增加一个单位或建筑业增加值每增加一个单位,能源消费需求分别平均增加 a为0.05,则前四个模型中由于都存在回归系数 p值小于显著性水平,因此工业增加值、建筑业 =80452.139+0

24、.464 工业增加值+0.696建筑业增 0.464个单位或 0.696个单位。 能源消费需求的多元线性回归分析结果(向后筛选策略)(四) Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance 2 国内生产总值 /亿元 -.191 a -.186 .855 -.047 .001 3 国内生产总值 /亿元 .217 b .288 .777 .070 .002 人均电力消费 /千瓦时 .269 b .658 .520 .157 .007 4 国内生产总值 /亿元 .479c .668 .513 .156

25、 .002 人均电力消费 /千瓦时 .417c 1.124 .276 .256 .008 能源加工转换效率/% -.066 c -1.283 .216 -.289 .425 5 国内生产总值 /亿元 .055 d .077 .940 .018 .003 人均电力消费 /千瓦时 .111 d .304 .764 .070 .010 能源加工转换效率/% -.059 d -1.096 .287 -.244 .427 交通运输邮电业增加值/亿元 -.061 d -1.698 .106 -.363 .891 交通运输邮电业增加值/亿元,工业增加值/亿元,人 e Excluded Variables a

26、. Predictors in the Model: (Constant),能源加工转换效率 /%, 均电力消费/千瓦时,建筑业增加值/亿元 b. Predictors in the Model: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元,工业增加值/亿元,建 筑业增加值/亿元 c. Predictors in the Model: (Constant), 交通运输邮电业增加值 /亿元,工业增加值/亿元,建筑业增加值/亿元 d. Predictors in the Model: (Constant), 工业增加值/亿元,建筑业增加值/亿元 e. Depende

27、nt Variable: 能源消费标准煤总量/万吨 分析: 上表展示了变量剔除方程的过程。各数据项的含义依次是:在剔除其他变量的情况下,如果该变量保留在模型中其标准化回归系数、 t 检验值和概 率 p 值。在模型 3 中,剔除国内生产总值的情况下,如果保留人均电力消费,那么它的标准化回归系数为0.269 ,但回归系数的检验不显著(概率p 值为 0.520)。剔除人均电力消费的情况下,如果保留国内生产总值,那么它的标准化回归系数为0.217,但回归系数的检验不显著(概率p 值为 0.777)。 Charts Normed pp not ofRegre 眯dn Stand 卑 dNed Rewid

28、ll 竺 Dependent Va limb 一 e 二诸sfjn wfr亲sxisJj Expected Cum Prob 口 oopi Q? ?4i Q.7 0.7 e-0 orj04OE e- 二 & Cum pQb 餵気羔wswrbw回孚希mws 分析:上图中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果(见下表)表明标准化残差与标准正态分布不存在显著差异, 可以认为残差满足了线性模型的前提要求。 标准化残差的非参数检验结果 One-Sample Kolmogorov-Smirnov Test Standardized Residual N 23 Normal Pa

29、rameters a Mean .0000000 Std. Deviation .95346259 Most Extreme Differences Absolute .162 Positive .108 Negative -.162 Kolmogorov-Smirnov Z .776 Asymp. Sig. (2-tailed) .584 a. Test distribution is Normal. 分析:在上面残差累计概率图种,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。而 计算残差与预测值的Spearman等级相关系数为0.02

30、7 (见下表Spearman等级相关分析结果),且检验不显著,因此认为异方差现象并不明显。 能源消费需求多元线性回归分析的残差图 20 Scatterplot Dependent Variable:傩潮消Wf标准煤惡吐切吨 Q- W5P 一处0匚 o-sswhewm Regression SUndardized Predicted Vlue 标准化残差与标准化预测值的Spearman等级相关分析结果 Correlations Standardized Predicted Value Standardized Residual Spearmans rho Standardized Predict

31、ed Correlation Coefficient 1.000 -.027 Value Sig. (2-tailed) .904 N 23 23 Standardized Residual Correlation Coefficient -.027 1.000 Sig. (2-tailed) .904 N 23 23 原始数据:能源消费数据分析 年份X1 能源消费 标准煤总 量X2/万 吨 国内生产 总值X3/亿 元 工业增加 值X4/亿元 建筑业增 加值X5/ 亿元 交通运输 邮电业增 加值X6/ 亿元 人均电力 消费X7/ 千瓦时 能源加工 转换效率 X8/% 1985 76682 9016 3448.7 417.9 406.9 21.3 68.29 1986 80850 10275.2 3967 525.7 475.6 23.2 68.32 1987 86632 12058.6 4585.8 665.8 544.9 26.4 67.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论