spss多元回归分析案例讲解_第1页
spss多元回归分析案例讲解_第2页
spss多元回归分析案例讲解_第3页
spss多元回归分析案例讲解_第4页
spss多元回归分析案例讲解_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS多元线性回归 模型建立 基于 逐步回归法 多元线性回归模型 回归:区别相关。因变量对解释变量的依赖关系,意 义在于通过已知后者的值去预测前者的均值。 线性:用于研究一种特殊的关系,即用直线或多维直 线描述其依赖关系。 多元:解释变量大于等于两个。 建立一个模型: Y = 0 + 1 X 1 + 2 X 2 + . + i X i 确定一些标准,判断进入的变量,和得出对应的系数 。 简要回顾一些计量经济学知识 v T检验, F检验。都是对于系数为 0假设检验。 v T检验针对的假设是某一个系数为 0。分布。 v F检验针对的假设是所有的回归系数均为 0.总显著性 检验。分布。 v Sig.值 significance即 eviews中的 p值。小于设置的 显著性水平如 0.05,则拒绝原假设,统计量显著。 v R2、 调整 R2 指标揭示拟合程度。随着进入模型的变 量个数增加, R2 不断增大,同时代价是残差自由 度的减少,意味着估计和预测可靠性低 。 举例说明 本例给出的是某企业职员调查的数据。共有样 本量 474.所给变量共有 6个:当前工资、初始 工资、工作种类、过去经验、受雇时间、受 教育程度。 准备建立一个以当前工资为因变量,其他变量 为自变量的回归方程。 判断哪些变量进入方程,并且给出对应系数。 1、选变量 v 要建立一个模型首先要选择变量,解释变量 和因变量之间要有一定的关系。 v 方法:散点图直接判断相关性和偏相关性系 数。 v 所要判断的变量:初始工资、工作种类、过 去经验、受雇时间、受教育程度 散点图检验线性关系 v 散点图可以很直观地判断是否存在线性关系 。 v 操作: Graphs-Legacy Dialogs-Scatter/Dot- Simple Scatter 结论:当前工资 和初始工资存在 线性关系。 偏相关系数检验线性关系 v 各因素之间有相互作用,仅仅看每个自变量 分别和因变量之间觉得相关系数不能反映出 各个变量之间的真实情况。 v 检验偏相关系数,控制其他的变量对两个变 量相关关系的影响。 v 由偏相关系数和对应 T值可以判断,这些变量 和因变量的有关,可以建立一个以它们为自 变量的回归模型。 偏相关系数检验线性关系 v 操作: Analyze-Correlate-Partial Correlation v 选择分析变量:当前工资、受教育程度 v 选择控制变量:其他变量 v 结论: T值的显著性水平为 0,拒绝当前工资和受教 育程度不相关的假设。偏相关系数为 0.161.变量和 因变量是相关的。 v 其他分析变量操作同,初步判断得出变量均可进入 模型。 2、选数据 v 我们建立回归模型是在若干假定前提之下的 , 即对数据是有要求的。因变量数据的要求。 v ( 1)是否满足 “残差的方差齐性 ”要求 v 方法:散点图 v 操作在后面做回归模型建立时一同分析。 PP 图检验正态性 v ( 2)因变量数据是否满足正态性要求 v 方法: PP 图。所有点聚集在直线上,则说 明该变量的数据分布是服从于所要检测的分 布的 PP 图检验正态性 v 操作: Analyze-Descriptive Statistics- vP-Pplots v 检验变量:当前工资 v 检验分布:正态分布 Normal v 结论:满足正态性假设要求 3、进行回归 v 介绍回归方法: vEnter:强行进入法。所有变量直接全部进入 模型。只有一个模型。 v 向前回归:根据自变量对因变量的贡献率, 首先选择一个贡献率最大的自变量进入,一 次只加入一个进入模型。然后,再选择另一 个最好的加入模型,直至选择所有符合标准 者全部进入回归。 v 向后回归:将自变量一次纳入回归,然后根 据标准删除一个最不显著者,再做一次回归 判断其余变量的取舍,直至保留者都达到要 求。 逐步回归 Stepwise:是向前回归法和向后回 归法的结合。 v 首先按自变量对因变量的贡献率进行排序, 按照从大到小的顺序选择进入模型的变量。 每将一个变量加入模型,就要对模型中的每 个变量进行检验,剔除不显著的变量,然后 再对留在模型中的变量进行检验。直到没有 变量可以纳入,也没有变量可以剔除为止。 进行回归操作 v 进行回归操作: Analyze-Regression-Linear 选择自变量和因变量 v 选择回归方法: Stepwise 设置操作 Statistics: 系统默认选项: 1、 Estimates(输出回归系数 ,标准化回归系数,回归系数为 0的假设 T值 等) 2、 Model fit(要引入模型的和 要从模型中剔除的变量, 每一步模型 R2 调 整 R2 、 ANOVA方差分析表。 设置操作 vPlots制图,检查方差齐性, vY:ZRESID(标准化残差) v X:ZPRED(标准化预测值) v 残差的方差齐性 v 分析依据:如果 v 它的大部分都落 v 在 ( - 3, 3) 范围之 v 内 , 就可以认为 v 它满足这个条件。 逐步回归中不在方程中变量 一、判断模型中各个要进入变量的系数显著性: 1、注释中是模型已有的变量,表中是排除在回归方 程外变量。 2、举例分析第一步: 方程中已有的(第一个进入)变量是初始工资,还 有 4个未进入模型。在这个方程的基础上,如果 4个 变量中每一个单独进入这个方程,会形成一个新的 二元解释变量方程,这个二元方程的统计量结果如 表。通过判断 Partial Correlation绝对值来确定哪个 是贡献率最大的,从而这个变量先进入模型。 3、第 3 列是针对每一个变量前面的系数为零的假设的 t 检验值 , 第四列给出了这个检验结果。从中可以看 出 ,sig.值均 0.05,不影响。其他的系数的显著性水平为 0. 000, 它们都 0. 05, 故属于小概率事件 , 即拒 绝回归系数为零的假设 , 即每个回归方程都有 意义。 y=-15038.574+1.365X1 +5859.585X2- 19.553X3+154.698X4+539.642X5 注释: X1 初始工资、 X2工作种类、 X3过去经验、 X4受 雇时间、 X5受教育程度 注意: B( 偏回归系数 ) , 有一个缺点就是单位数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论