数据分析与SPSS软件应用 课后习题答案 - 第8章回归分析及SPSS实现_第1页
数据分析与SPSS软件应用 课后习题答案 - 第8章回归分析及SPSS实现_第2页
数据分析与SPSS软件应用 课后习题答案 - 第8章回归分析及SPSS实现_第3页
数据分析与SPSS软件应用 课后习题答案 - 第8章回归分析及SPSS实现_第4页
数据分析与SPSS软件应用 课后习题答案 - 第8章回归分析及SPSS实现_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章回归分析及SPSS实现

习题与思考题

(一)填空题

1.e=y—y

2.甲模型

3.残差

4.自变量,因变量

5.拟合优度

(二)选择题

ABDBC

(三)判断题

XXXXX

(四)简答题

1.简述回归分析的全流程。

解:回归分析的基本流程为:

(1)确定自变量与因变量之间的关系,即判定回归模型的数学形式;

(2)参数估计。

(3)模型的统计检验

(4)模型优化,确定最终模型。

2.简述回归分析的概念、基本功能和应用范围。

解:线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分析自

变量是如何影响因变量的过程。根据自变量的个数可以分为一元线性回归分析和多元线性

回归分析。回归分析是在相关分析的基础上,进一步探讨自变量对因变量的作用方式和作

用强度的方法。

3.简述相关分析与回归分析的区别与联系。

解:相关分析是对两个或两组变量之间相关关系的测度,相关分析采用相关系数作为

测度工具,待分析的变量的地位是平等的。回归分析采用回归模型来度量变量间的作用关

系,相关分析中变量的地位是不平等的,自变量是解释变量,用来说明因变量,也即是被

解释变量。

4.试说明二阶段最小二乘法、加权最小二乘法和普通最小二乘法的关系。

解:三种方法都是参数估计的常用方法。二阶段最小二乘法简称2SLS,是一种计量经

济学方法,是通过工具变量来实现参数估计,该方法对变量的分布没有限制,变量无论是

否正态分布,都可使用。加权最小二乘法是对原模型进行加权,使之成为一个新的不存在

异方差性的模型,然后再采用普通最小二乘法估计参数,其是应对异方差问题的数学优化

技术。普通最小二乘法是应用最为广泛的一种参数估计方法,其使用需要满足一系列的前

提假设,当假设被违背时,就可采用二阶段最小二乘法、加权最小二乘方法或其他方法进

行优化和改进。

5.什么是多重共线性,它的不良后果是什么,有什么解决方案。

解:线性回归模型中的解释变量之间可能存在精确相关关系或高度相关关系,从而使模

型估计失真或难以估计准确,这就是多重共线性问题。多重共线性是一个容忍度的问题,

当多重共线性比较严重时,会引起模型的参数估计结果异常,或是模型的形式异常等问题,

这时就需要做相应的处理。若诊断出引起多重共线性问题的自变量后,可采用直接删除该

自变量,或对自变量进行形态转变等方法来消除共线性问题。

案例分析题

1.调查得到某市出租车使用年限〉:与当年维修费用y(万元)的数据,如下表所示。试拟合

合适的回归模型,用以发现维修费用与使用年限之间的关系。

表8-1案例分析1数据

使用年限1234567

维修费用1.62.23.85.56.57.07.5

SPSS数据结构如下:

县"无标飘4集3]-IBMSPSSStatistics数据编茅

文件(E)编辑任)查看包)数据©)转换CD

皓圜『F}

S:

力>使用年夕维修费

变量

〃限用

111.60

222.20

333.80

445.50

556.50

667.00

777.50

8

9

先进行相关分析,根据皮尔逊相关分析的结果看,两个变量之间存在显著的线性相关

关系,可以使用线性回归分析方法。

相关性

使用年限维修费用

使用年限皮尔逊相关性1.980"

Sig.(双尾).000

个案数77

雉修费用皮尔逊相关性.980,,1

Sig.(双尾).000

个案数77

**.在0.01级别(双尾j'相关性显著

以维修费用为因变量,以使用年限为自变量,进行回归分析,结果如下:

模型摘要

标准估算的错

模型RR方调整后R方谈

1,9801.960.952,51603

a.预测变量:(常量),使用年限

ANOVAa

模型平方和自由度均方F显著性

b

1回扫32.143132.143120.708,000

残差1.3315.266

总计33.4746

a.因变量:维修费用

b.微测变量:(常量),使用年限

模型的拟合优度为0.980,调整后拟合优度为0.952,说明线性回归直线对真实数据有

较好的拟合性。模型整体线性的F检验结果显示,模型的线性是显著的。

系数3

未标准化系数标准化系数共线性统计

模型B标准铺谟Betat显著性容差V1F

1(常⑨,586.4361.343.237

使用年限1.071,098.98010,987,0001.0001.000

a.因;…

参数估计的结果显示,使用年限对维修费用具有显著的正向作用。参数估计结果为

1.071,即当其他因素保持不变时,使用年限每增加一个单位,维修费用增加1.071个单位。

2.一家皮鞋零售店将其连续18个月的广告投入费用(万元)、销售额(万元)、员工薪酬

总额(万元)指标数据进行汇总,如表8-2所示。请根据这些数据建立回归模型,尝试找

到销售额与广告投入费用和员工薪酬总额之间的关系。

表8-2案例分析2数据

月份广告投入销售额员工薪酬总额

130.61090.421.1

231.3113321.4

333.91242.122.9

42g.61003.221.4

532.51283.221.5

627.91012.221.7

724.81098.821.5

823.6826.321

933.91003.322.4

1027.71554.624.7

1145.5119923.2

1242.61483.124.3

13401407.123.1

1445.81551.329.1

1551.71601.224.6

1667.22311.727.5

17652126.726.5

1865.42256.526.8

输入软件的数据结构如下:

,♦无F罂二:教奏奂0:-旧MSPSSStatistics致索燃塔器

文件(E)余辑(E)直看(Y)数据(R)转按①分析⑷图形9)实用精

㈡画一」司熹罐”

_____________]夕月份夕广告投入,福传膜夕耕瞅息膜变量

1130.601090.4021.10

2231.301133.002140

3]333.901242.1022.90

4429.601003.202140

5n532.501283.2021.50

6627.901012.2021.70

7724.801098.8021.50

8823.60826.3021.00

9n933.901003.3022.40

101027.701554.6024.70

111145.501199.002320

121242.601483.1024.30

131340.001407.1023.10

141445.801551.3029.10

151551.701601.202460

161667.202311.7027.50

171765.002126.7026.50

181865.402256.5026.80

19_

20

判断自变量与因变量之间的线性关系:

相父性

广告投入耕酬@颠

广告投入皮尔逊相关性1.915.834”

Sig.(双尾).000.000

个案数181818

销售额皮尔逊相关性.915"1.842"

Sig.(双尾).000.000

个案数181818

新酬总额皮尔逊相关性.804"".842"1

Sig.(双尾).000.000

个案数181818

**.在0.01小别(双尾),相关性显著・

因变量与自变量之间具有显著的线性相关关系,可以构建线性回归模型。

模型摘要b

标准估算的错

模型RR方调整后R方谀德宾•沃森

1933a.870.852169.834142.721

a.他测变量:(常量),新酬总额广告投入

b.因变量:销售额

ANOVAa

模型平方和自由度均方F显著性

1回归2885622.95021442811.47550.022.00(?

残差432654.5401528843.636

总计3318277.48917

a.因变量:销售额

b.他演变量:(常量),薪酬总部广告投入

模型的拟合优度为0.852,F统计量为50.022,通过了显著性检验。线性回归模型整

体线性性显著,直线对数据的拟合较好。

系数a

未标准化系数阮准化系数共线性统计

懊型B标准讨设Betat显著性容差V1F

1(就⑧-707.749517.773-1.367,192

广告投入20.9564.885.6734.290,001.3542.828

耕酬总额53.81627.968.3021.924.074.3542.828

a.因变量:销售窥

共线性诊断a

方差比例

慎型堆将征值条件指标(常量)广告投入薪・总・

112.9381.000.00,00,00

2.0597.028.03.40,00

3.00236.415.97.591.00

a.因变量:铺告藕

回归参数的T检验结果显示,截距项和薪酬总额的参数没有通过显著性检验,配合着

多重共线性的检验结果,薪酬总额可能是引起多重共线性的主要原因,因此将薪酬总额删

除,重新构建线性回归模型,得到:

系数3

未标准化系数标准化系数共线性统计

怩吧B标准错谟Betat显著性容差VIF

1(常知260,165132.7091.960.068

广告投入28,5133.141.9159.078.0001.0001.000

a.因变量:销自割

广告投入的回归参数为28.513,即广告投入每变化一个单位,可以引起销售额变化28

个单位。而薪酬总额对销售额没有显著的作用。另外,由于该题中样本量偏小,当增加样

本量后,回归模型对现实的解释会更为精准。

3.在一次关于公用交通的社会调查中,收集到28名受访者的信息,包括是否上下班乘坐的

交通工具,y=l表示主要乘坐公交车上下班,y=0表示主要骑自行车上下班,此外还获得

了受访者的年龄、月收入、性别(1代表男性,2代表女性)。试建立y与自变量的

Logistic回归模型。

表8-3案例分析3数据

序号上下班交通工具年龄月收入性别

10188500

20218600

312315000

413018000

512815000

60318500

713615000

814218500

914619500

1002610000

1115518000

1215621000

1302312000

1401810001

1502010001

1602512001

1715015001

180288501

1913918001

2002910001

210289501

2202910001

2303811001

2402212001

2514520001

2603210001

2715215001

2815618001

软件输入的数据结构如下:

fX尢标题1磔粽5-IBMSPSSStatistics

寇」

步序号夕铐,月收入将性别

变量

1_I10188500

220218600

3312315000

4413018000

5512815000

660318500

7713615000

8814218500

9914619500

101002610000

111115518000

121215621000

131302312000

141401«mon1

1502010001

1602512001

1715015001

180288501

1913918001

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论