多元线性回归实例分析_第1页
多元线性回归实例分析_第2页
多元线性回归实例分析_第3页
多元线性回归实例分析_第4页
多元线性回归实例分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS-回归多元线性回归模型案例解析!(一) 多元线性回归,主要就是研究一个因变量与多个自变量之间得相关关系,跟一元回归原理 差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程 为丫二弘+陀“ 亳无疑问,多元线性回归方程应该 为:丫 = 0o + / Vi + 02 七 + + Xp 十 上图中得xlz x2,xp分别代表自变戢冷 截止,代表有P个自变量,如果有N组样本,那么 这个多元线性回归,将会组成一个矩阵,如下图所示: 记n组样本分别是(兀“力张丿)(=12/),令 1xnm兀 y = 1*21兀22 X2P . B = A E 宀丿 J % s 石丿 I v = x

2、 B 十 那么,多元线性回归方程矩阵形式为:F 1 英中: 代表随机误差,英中随机误差分为:可解释得误差与不可解释得误差,随机 误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须就是服成正太分别得随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有得随机误差变量方差都相等 4:独立性假设,即指:所有得随机误差变量都相互独立,可以用协方差解释。 今天跟大家一起讨论一下,SPSS- 多元线性回归得具体操作过程,下而以教程教程数据为 例,分析汽车特征与汽车销售量之间得关系。通过分析汽车特征跟汽车销售虽得关系,建立拟 合多

3、元线性回归模型。数据如下图所示: sales resale type price engine s horsepow wheelbas width length curt 16.919 16.360 0 21.500 1.8 140 101.2 67.3 172.4 39.384 19.875 0 28.400 3.2 225 108.1 70.3 192.9 14.114 18.225 0 3.2 225 106.9 70.6 192.0 8.588 29725 0 42.000 3.5 210 114.6 71.4 196.6 20.397 22.255 0 23.990 1.8 150

4、102.6 68.2 17F- to-enter 的穀 率 =. 100)。 2 Wheelbase 步进(准则:F- to-enter 的朝 率 = 100)。 a.因变量:Log-transformEd sales 选择变量(E)“框内,我并没有输入数拯,如果您需要对某个.、自变呈进行条件筛选,可以将那 个自变量,移入选择变量框内,有一个前提就就是:该变量从未在另一个目标列表中出现!, 再点击、规则设定相应得筛选条件即可,如下图所示: 点击.统汁量弹出如下所示得框,如下所示: 在回归系数下而勾选估计,在右侧勾选模型拟合度 与共线性诊断 两个选项,再勾选 个案诊断再点击离群值一般默认值为、3

5、:(设圧异常值得依据,只有当残差超过3倍标准 差得观测才会被当做异常值)点击继续。 提示: 共线性检验,如果有两个或两个以上得自变量之间存在线性相关关系,就会产生多重共线性 现象。这时候,用最小二乘法估汁得模型参数就会不稳左,回归系数得估计值很容易引起误导 或者导致错误得结论。所以,需要勾选共线性诊断来做判断 通过容许度可以计算共线性得存在与否?容许度TOL=1-RI平方或方差膨胀因子 (VIF): VIF=1/1-RI平方,其中RI平方就是用英她自变量预测第I个变量得复相关系数,显 然,VIF为TOL得倒数,TOL得值越小,VIF得值越大,自变量XI与其她自变量之间存在共线性 得可能性越大。

6、 提供三种处理方法: 1:从有共线性问题得变量里删除不重要得变量 2:增加样本疑或重新抽取样本。 3:采用其她方法拟合模型,如领回归法,逐步回归法,主成分分析法。 再点击绘制选项,如下所示: 线性回归二 A*.- J b/V 散点X的1 i -(y)|丨下一张画 产生所有部分图(E DEPENDNT *ZPRED 辽RESID PRESID *ADJPRED *SRESID SDRESID 荷准化残差图 直方图(旦) .正态槪率图(R) 取消 上图中: DEPENDENT因变虽:)ZPRED(标准化预测值)ZRESID(标准化残差)DRESID(剔除残 差)ADJPRED(修正后预测值)SRS

7、ID(学生化残差)SDRESID(学生化剔除残差) 一般我们大部分以自变量作为X轴,用残差作为Y轴,但就是,也不要忽略特殊情况,这 里我们以、ZPRED(标准化预测值)作为”x“轴,分别用、SDRESID(血生化剔除残差)与 、ZRESID(标准化残差)作为Y轴,分别作为两组绘图变量。 再点击保存按钮,进入如下界而: 如上图所示:勾选距离下面得cook距离选项(cook距离,主要就是指:把一个个案从计算 回归系数得样本中剔除时所引起得残差大小,cook距离越大,表明该个案对回归系数得影响 也越大) 在预测区间勾选均值与单值点击继续按钮,再点击确世按钮,得到如下所示得分析 结果:(此分析结果,采

8、用得就是逐步法得到得结果) 摸型汇总。 槟型 R R方 调整R方 标准估计的误 差 1 552* .304 .300 1.1 1 5534 2 .655b .430 .422 1.01 3572 乳预测变量:(常量L Price in thousands- b预测麦量:tes). Price in thousands. Wheelbase c.因变量:Log-transformed sales Anovac 模型 平方和 df 均方 F Sig. 1回归 残差 总计 81.720 186.662 263.383 1 150 151 81720 1.244 65.670 .000a 2回归 残差

9、 总计 115.311 153.072 268.383 2 149 151 57.656 1.027 56.122 .000b a.预测变星:(常屋)i Price i门 thousands。 b预测麦量:fes). Price in thousands. Wheelbase * c.因变星 Log-transformed sales 己排陈的娈量c 模型 Beta In t Sig. 偏相关 共线性统计虽 容差 VIF 最小容差 1 Vehicle type .251a 3.854 QOO .301 .998 1.002 .998 Engine size .342a 4.128 .000 .

10、320 1.636 .611 Horsepower ,257a 2.062 .041 .167 .293 3.417 .293 Wheelbase .356a 5.718 .000 .424 .988 1.012 .988 车宽 .244a 3.517 .001 .277 .892 1.121 .892 车氏 .308a 4.790 .000 .365 1.025 .976 车净重 .346a 4.600 .000 .353 了 22 1.385 722 Fuel capacity .266a 3.68? .000 .289 .820 1.219 .820 耗油虽:迈升 -.198a -2.5

11、84 .0伯 -.207 1.319 .758 2 Vehicle type .129b 1.928 .056 .157 .835 1.197 .827 Engine size .145b 1.576 117 .128 .445 2.246 .445 Horsepower ,028b .229 山9 药6 3.910 .256 车宽 -.025b -.275 .784 -.023 .4了0 2.126 .470 车长 .027b .237 .020 .290 3.448 .290 车净重 .105b 1.028 .306 .094 .365 2.741 .365 Fuel capacity .

12、002b .024 .981 .002 .443 2.259 .443 耗油量:迈倂 .01 4 b .164 .870 .014 .5旳 1.790 .559 a. 模型中的预测变昱(常虽h Price in thousands。 b. 穫型g的赖別娈垦 few, Price in thousands. Wheelbase。 c. 医1 变昼 Log-transformed sales 系踌 模型 非标准化系数 标准系数 t Sig. 共线性统计星 B 标i笆谋差 试用版 容差 VIF 1(箒動 Price in thousands 4.684 -.051 .194 .006 -.552 2

13、4.090 -8.104 .000 1.000 1.000 2(當屋) Price in thousands Wheelbase -1.822 -.055 .061 1.151 .006 .011 -.590 .356 -1.583 -9.487 5.718 .116 .000 .000 .988 .988 1.012 1.012 包 因变屋:Log-transformed sales 共线性诊断 模型 维数 特征値 条件索引 方差比例 (常勒 Price in thousands Wheelbase 1 1 1.885 1.000 .06 .06 2 .115 4.051 .94 .94 2

14、 1 2.947 1.000 .00 .02 .00 2 .150 4.351 .01 .97 .01 3 .003 33.412 .99 .00 .99 a. Log-transformed sales 绥差统计量岂 极小値 极大値 均値 标准僞差 N 预测値 -.24540 5.64204 3.29052 .868512 155 标准预测値 -4.045 2.693 .002 .994 155 预测値的标准误差 .082 .354 .130 .057 155 调整的预测値 -.44042 5.67214 3.28907 .874840 155 殘差 -4.971113 2.327782 0

15、05131 .998146 155 掠准残差 -4.905 2.297 .005 .985 155 Student化残差 -4.950 2.307 .006 .994 155 己刪除的残羞 -5.063155 2.348876 .006580 1.017413 155 Slud e nt E已删除的殘差 -5.397 2.341 .002 1.016 155 Mahal 距离 .001 17,416 1.964 3.423 155 Co ok的距?S .000 .151 .006 .0仃 155 居中杠杆値 .000 .115 .013 血 155 图表 直方图 因娈量:Log-transfo

16、rmed sales 垸I迫 .= 0.985 散点图 因变量:transformed sales -2 82.6 O 74.97 O 71.02 Q 69.725 O 85.5 31 9317-518 13.108 扪 3 20 390、300) 2:从Anova”表中,可以瞧岀模型2中得回归平方与为115,311/残差平方与为153.072, 由于总平方与=回归平方与+残差平方与,由于残差平方与(即指随即误差,不可解释得误差) 由于、回归平方与跟残差平方与“几乎接近,所有,此线性回归模型只解释了总平方与得一 半, 3:根据后而得下统计量得概率值为0、00,由于0、000、1)所以常数项不具

17、备显箸性,所以,我们再瞧后面得 标准系数:在标准系数一列中,可以瞧到常数项没有数值,已经被剔除 所以:标准化得回归方程为:销售量=-0、59*价格+0、356*轴距 2:再瞧最后一列共线性统汁量,其中价格与轴距炳个容差与vif都一样,而且VIF都为1、 012,且都小于5,所以两个自变量之间没有出现共线性,容忍度与 膨胀因子就是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性得可能性也越大 共线性诊断 模型 维数 特征値 条件索引 方差比例 (常勒 Price in thousands Wheelbase 1 1 1.885 1.000 .06 .06 2 .115 4.051 .94 .9

18、4 2 1 2.947 1.000 .00 .02 .00 2 .150 4.351 .01 .97 .01 3 .003 33.412 .99 .00 .99 a. Log-transformed sales 绥差统计量岂 极小値 极大値 均値 标准僞差 N 预测値 -.24540 5.64204 3.29052 .868512 155 标准预测値 -4.045 2.693 .002 .994 155 预测値的标准误差 .082 .354 .130 .057 155 调整的预测値 -.44042 5.67214 3.28907 .874840 155 殘差 -4.971113 2.32778

19、2 005131 .998146 155 掠准残差 -4.905 2.297 .005 .985 155 Student化残差 -4.950 2.307 .006 .994 155 己刪除的残羞 -5.063155 2.348876 .006580 1.017413 155 Slud e nt E已删除的殘差 -5.397 2.341 .002 1.016 155 Mahal 距离 .001 17,416 1.964 3.423 155 Co ok的距?S .000 .151 .006 .0仃 155 居中杠杆値 .000 .115 .013 血 155 m-ft ca Ie 从共线性诊断表中可以瞧出: 1:共线性诊断采用得就是特征值得方式,特征值主要用来刻画自变量得方差,诊断自变量间 就是否存在较强多重共线性得另一种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论