spss多元线性回归实例要点_第1页
spss多元线性回归实例要点_第2页
spss多元线性回归实例要点_第3页
spss多元线性回归实例要点_第4页
spss多元线性回归实例要点_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS19 0 实战之多元线性回归分析 2011 12 09 12 19 11 转 载 标签 文化 分类 软件介绍 线性回归数据 全国各地区能源消耗量与产量全国各地区能源消耗量与产量 来源 可点击协会博客数据 挖掘栏 国泰安数据服务中心的经济研究数据库 1 11 1 数据预处理数据预处理 数据预处理包括的内容非常广泛 包括数据清理和描述性数据汇总 数据集成 和变换 数据归约 数据离散化等 本次实习主要涉及的数据预处理只包括数 据清理和描述性数据汇总 一般意义的数据预处理包括缺失值填写和噪声数据 的处理 于此我们只对数据做缺失值填充 但是依然将其统称数据清理 1 1 11 1 1 数据导入与定义数据导入与定义 单击 打开数据文档 将 xls 格式的全国各地区能源消耗量与产量的数据导 入 SPSS 中 如图 1 1 所示 图 1 1 导入数据 导入过程中 各个字段的值都被转化为字符串型 String 我们需要手动将 相应的字段转回数值型 单击菜单栏的 将所选的变量改为数值型 如图 1 2 所示 图 1 2 定义变量数据类型 1 1 21 1 2 数据清理数据清理 数据清理包括缺失值的填写和还需要使用 SPSS 分析工具来检查各个变量的数据 完整性 单击 将检查所输入的数据的缺失值个数以及百分比等 如图 1 3 所示 图图 1 31 3 缺失值分析缺失值分析 能源数据缺失值分析结果如表 1 1 所示 单变量统计 缺失极值数目 a N均值标准差计数百分比 低高 能源消 费总量 309638 506175 924 0 001 煤炭消 费量 309728 997472 259 0 002 焦炭消 费量 30874 61 1053 008 0 002 原油消 费量 281177 511282 744 26 701 汽油消 费量 30230 05 170 2700 001 煤油消 费量 2845 4066 18926 704 柴油消 费量 30392 34 300 9790 002 燃料油 消费量 30141 00 313 4670 003 天然气 消费量 3019 5622 0440 002 电力消 费量 30949 64 711 6640 003 原煤产 量 269125 9712180 689413 302 焦炭产 量 291026 491727 735 13 302 原油产 量 181026 481231 724 1240 000 燃料油 产量 2590 72134 150516 703 汽油产 量 26215 18 210 090413 302 煤油产 量 2048 4462 1301033 300 柴油产 量 26448 29 420 675413 301 天然气 产量 2029 2849 3911033 303 电力产 量 30954 74 675 2300 000 表 2 1 能源消耗量与产量数据缺失值分析 表 1 1 能源消耗量与产量 数据缺失值分析 SPSS 提供了填充缺失值的工具 点击菜单栏 即可以使用软件 提供的几种填充缺失值工具 包括序列均值 临近点中值 临近点中位数等 结合本次实习数据的具体情况 我们不使用 SPSS 软件提供的替换缺失值工具 主要是手动将缺失值用零值来代替 1 1 31 1 3 描述性数据汇总描述性数据汇总 描述性数据汇总技术用来获得数据的典型性质 我们关心数据的中心趋势和离 中趋势 根据这些统计值 可以初步得到数据的噪声和离群点 中心趋势的量 度值包括 均值 mean 中位数 median 众数 mode 等 离中趋势量 度包括四分位数 quartiles 方差 variance 等 SPSS 提供了详尽的数据描述工具 单击菜单栏的 将 弹出如图 2 4 所示的对话框 我们将所有变量都选取到 然后在选项中勾选上 所希望描述的数据特征 包括均值 标准差 方差 最大最小值等 由于本次 数据的单位不尽相同 我们需要将数据标准化 同时勾选上 将标准化得分另 存为变量 图 1 4 描述性数据汇总 得到如表 1 2 所示的描述性数据汇总 N 极小 值极大值 均值标准差方差 能源消 费总量 30911 261649638 506175 924 412 煤炭消 费量 30332 290019728 997472 259 378 焦炭消 费量 30195461 874 61 1053 008 853 原油消 费量 3005555 1099 011273 265 562 汽油消 费量 3018771230 05 170 27028991 746 煤油消 费量 30026242 3764 8964211 520 柴油消 费量 30271368 392 34 300 97990588 441 燃料油 消费量 3001574 141 00 313 46798261 261 天然气 消费量 30110619 5622 044485 947 电力消 费量 30983004 949 64 711 664 953 原煤产 量 300581427909 1711741 3881 379E8 焦炭产 量 3009202 992 28 1707 998 193 原油产 量 2904341 637 12 1085 379 432 燃料油 产量 30049775 60126 79116075 971 汽油产 量 3001032 186 49 208 77143585 122 煤油产 量 30021932 3055 3943068 535 柴油产 量 3001911 388 52 420 216 285 天然气 产量 30016419 5242 3711795 341 电力产 量 30972536 954 74 675 230 003 有效的 N 列 表状态 29 表 1 2 描述性数据汇总 标准化后得到的数据值 以下的回归分析将使用标准化数据以下的回归分析将使用标准化数据 如图 1 5 所示 图 1 5 数据标准化 我们还可以通过描述性分析中的 来得到各个变量的众数 均值等 还可以 根据这些量绘制直方图 我们选取个别变量 能源消费总量 的直方图 可以 看到我们因变量基本符合正态分布 如图 1 6 所示 图 1 6 能源消费总量 1 21 2 回归分析回归分析 我们本次实验主要考察地区能源消费总额 因变量 与煤炭消费量 焦炭消费 量 原油消费量 原煤产量 焦炭产量 原油产量之间的关系 以下的回归分 析所涉及只包括以上几个变量 并使用标准化之后的数据 1 2 11 2 1 参数设置参数设置 1 单击菜单栏 将弹出如图 1 7 所示的对话框 将通过选择因变量和自变量来构建线性回归模型 因变量 标准化能源消费总 额 自变量 标准化煤炭消费量 标准化焦炭消费量 标准化原油消费量 标 准化原煤产量 标准化焦炭产量 标准化原油产量 自变量方法选择 进入 个案标签使用地名 不使用权重最小二乘法回归分析 即 WLS 权重为空 图 1 7 选择线性回归变量还需要设置统计量的参数 我们选择回归系数中的 和其他项中的 选中估计可输出回归系数 B 及其标准误 t 值和 p 值 还有标准化的回归系数 beta 选中模型拟合度复选框 模型拟合过程中进入 退出的变量的列表 以及一些有关拟合优度的检验 R R2和调整的 R2 标准误 及方差分析表 如图 1 8 所示 图 1 8 设置回归分析统计量 3 在设置绘制选项的时候 我们选择绘制标准化残差图 其中的正态概率图是 rankit 图 同时还需要画出残差图 Y 轴选择 ZRESID X 轴选择 ZPRED 如 图 1 9 所示 图图 1 91 9 设置绘制设置绘制 左上框中各项的意义分别为 DEPENDNT 因变量 ZPRED 标准化预测值 ZRESID 标准化残差 DRESID 删除残差 ADJPRED 调节预测值 SRESID 学生化残差 SDRESID 学生化删除残差 4 许多时候我们需要将回归分析的结果存储起来 然后用得到的残差 预测值 等做进一步的分析 保存 按钮就是用来存储中间结果的 可以存储的有 预测值系列 残差系列 距离 Distances 系列 预测值可信区间系列 波动 统计量系列 本次实验暂时不保存任何项 5 设置回归分析的一些选项 有 步进方法标准单选钮组 设置纳入和排除标 准 可按 P 值或 F 值来设置 在等式中包含常量复选框 用于决定是否在模型 中包括常数项 默认选中 如图 1 10 所示 图 1 10 设置选项 1 2 21 2 2 结果输出与分析结果输出与分析 在以上选项设置完毕之后点击确定 SPSS 将输出一系列的回归分析结果 我们 来逐一贴出和分析 并根据它得到最后的回归方程以及验证回归模型 1 表 1 3 所示 是回归分析过程中输入 移去模型记录 具体方法为 enter 进入 输入 移去的变量输入 移去的变量 模型输入的变量 移去 的变 量方法 1Zscore 原油产量 Zscore 原煤产量 Zscore 焦炭消 费量 Zscore 原 油消费量 Zscore 煤炭消费 量 Zscore 焦炭 产量 输入 表 1 3 输入的变量 2 表 1 4 所示是模型汇总 R 称为多元相关系数 R 方 R2 代表着模型的拟 合度 2 我们可以看到该模型是拟合优度良好 模型汇总模型汇总 模型汇总模型汇总 模型 RR 方 调整 R 方 标准 估计的 误差 Sig 1 962 925 905 000 表 1 4 模型汇总 3 表 1 5 所示是离散分析 F 的值较大 代表着该回归模型是显著 也称为 失拟性检验 模型平方和 df均方F 回归 25 66064 277 45 397 残差 2 072 22 094 1 总计 27 73228 表 1 5 离散分析 4 表 1 6 所示的是回归方程的系数 根据这些系数我们能够得到完整的多元回 归方程 观测以下的回归值 都是具有统计学意义的 因而 得到的多元线性 回归方程 Y 0 008 1 061x1 0 087 x2 0 157 x3 0 365 x4 0 105 x5 0 017x6 x1为煤炭消费量 x2为焦炭消费量 x3为原油消费量 x4为原煤产量 x5为 原炭产量 x6为原油产量 Y 是能源消费总量 结论 能量消费总量由主要与煤炭消费总量所影响 成正相关 与原煤产量成 一定的反比 系数系数 非标准化系数 标准系 数 模型B 标准 误差betatSig 常量 008 057 149 883 Zscore 煤炭 消费量 1 061 1261 071 8 432 000 1 Zscore 焦炭 消费量 087 101 088 856 401 Zscore 原油 消费量 157 085 1591 848 078 Zscore 原煤 产量 365 155 372 2 360 028 Zscore 焦炭 产量 105 150 107 697 493 Zscore 原油 产量 017 070 017 247 807 表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论