《统计分析与SPSS应用(第五版)》课后练习答案(第9章)_第1页
《统计分析与SPSS应用(第五版)》课后练习答案(第9章)_第2页
《统计分析与SPSS应用(第五版)》课后练习答案(第9章)_第3页
《统计分析与SPSS应用(第五版)》课后练习答案(第9章)_第4页
《统计分析与SPSS应用(第五版)》课后练习答案(第9章)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计分析与SPSS的应用(第五版)》(薛薇)

课后练习答案

第9章SPSS的线性回归分析

1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS

提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程

成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条

分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图

步骤:图形今旧对话框分散点图9简单散点图9定义今将fore导入Y轴,将phy导入X轴,将

sex导入设置标记今确定。

sex

0female

Omale

80.00-

60.00-

40.00-

20.00-

40.0050.0060.0070.0080.0090.00100.00

Phy

接下来在SPSS输出查看器中,双击上图,打开图表编辑

在图表编辑器中,选择“元素”菜单1选择总计拟合线分选择线性今应用今再选择元素菜单

分点击子组拟合线今选择线性)应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定

的线性关系。但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?

相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依

靠回归分析来表现变量之间数曷相关的具体形式,而回归分析则需要依靠相关分析来表现变

量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的

具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之

前,就进行回归分析,很容易造成“虚假回归”。与此同时:相关分析只研究变量之间相关

的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另

一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才

能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个

变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?

检验其可信程度并找出哪些变量的影响显著、哪些不显著。

主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释

变量和解释变量之间确实存在显著的线性关系。

回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用

线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。

4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?

向前、向后、逐步。

5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用

建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。

方法:采用“前进”回归策略。

步骤:分析》回归分线性今将粮食总产量导入因变量、其余变量导入自变量分方法项选“前

进”分确定。如下图:(也可向后、或逐步)

◎线性回归

因变量Q):

,年份[的I夕粮食总产量(y万吨)Rscl]

e粮食播种面积历公…

块(B)1的1

夕总播种面积历公顷)[…

,施用化肥量(kg公顷)…下一页®)j

夕风灾面积比例(%)[zh]

自变量Q):

「农业劳动者人数(百…

夕施用化肥量(k%顷)[sm

夕风灾面积比例(%)团

6年份[nn

方法国):前迸

送择变量但):

:规则(

个案标签(C):

WLS权重(旦):

〔确定J粘贴©][aa(R)j[取^[帮助

已输入/除去变量,

模型已输入变量已除去变量方法

1向前(准则:

施用化肥量(kg/

F-to-enter的

公顷)

概率<=.050)

2向前(准则:

风灾面积比例

F-to-enter的

(%)

概率<=.050)

3向前(准则:

年份F-to-enter的

概率<=.050)

4向前(准则:

总播种面积(万

•F-to-enter的

公顷)

概率<=.050)

a.因变量:粮食总产量(y万吨)

模型摘要

调整后的R平

模型RR印方标准估算的错误

1.960*.922.9192203.30154

2.975b.950.9471785.90195

3.984*.969.9661428.73617

4.994d.989.987885.05221

a.预测变量:(常量),施用化肥量ikg/公顷)

b.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例册)

c.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(幼,年

<1.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例陶),年

份,总播种面积(万公顷)

ANOVA'

模型平方和自由度均方F显著性

1回归1887863315.61611887863315.616388.886.0001,

残差160199743.070334854537.669

总计2048063058.68634

2回归1946000793.4222973000396.711305.069.000"

残差102062265.263323189445.789

总计2048063058.68634

3回归1984783160.3293661594386.776324.1C6.000d

残差63279898.356312041287.044

总计2048063058.68634

4回归2024563536.0114506140884.003646.150.0000

残差23499522.67530783317.423

总计2048063058.68634

a.因变量:粮食总产量(y万吨)

b,预测变量:(常量),施用化肥量ikg/公顷)

C.预测变量:(常量),施用化肥量[kg/公顷),风灾面积比例(幼

d.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例(幼,年份

e.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例盛),年份,总播种面积(万公

顷)

系数1

非标准化系数标准系数

模型B标准错误贝塔t显著性

1(常量)17930.148504.30835.554,000

施用化肥量(kg/公顷)179.2879.092,96C19.720.000

2(常量)20462.336720.31728.407.000

施用化肥量(kg/公顷)193.7018.1061.03723.897.000

风灾面积比例(%)-327.22276.643-.185-4.269.000

3(常量)-460006.046110231.478-4.173.000

施用化肥量(kg/公顷)137.66714.399.7379.561,000

风灾面枳比例隰)•293.43961.803-.166-4.748,000

年份244,92056.190.3234.359.000

4(常量)-512023.30768673.579-7.456.000

施用化肥量(kg/公顷)139.9448.925.74915.680.000

风灾面积比例(幼-302.32438.305-.171-7.893.000

年份253.11534.827.3347.268.000

总播种面积(万公顷)2.451.344.1417.126.000

a.因变量:粮食总产量(y万吨)

结论:如上4个表所示,影响程度中大到小依次是:施用化肥量(kg/公顷),风灾面积比例(%),

年份,总播种面积(万公顷)。(排除农业劳动者人数(百万人)和粮食播种面积(万公顷)对粮食

总产量的影响)

剔除农业劳动者人数(白万人)和粮食播种面积(万公顷)后:

步骤:分析今回归今线性今将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷),

风灾面积比例(%),年份,总播种面积(万公顷))导入自变量分方法项选“输入”今确定。如

下图:

喻线性回归

因变量(D):________________

超年份[的I夕粮食总产量(y万吨)[isci]

e粮食播种面积历公…

块(B)1的1

夕总播种面积历公顷)[…

,施用化肥量(kg公顷)…下一页国)|

夕风灾面积比例(%)[zh]

自变量Q):

,农业劳动者人数(百…

夕总播种面积历公顷)[zbzmj]

,施用化肥量(kg/公顷)[sm

/风灾面积比例陶[zh]

方法国):愉入▼|

送择变量(£):

规则@)…

个案标签(g):

WLS权重(旦):

[确定J粘贴©][gg(R)j[取^]飒—

系数

非标准化系数标准系数

模型B标准错误贝塔t显著性

1(常量)-512023.30768673.579-7.456.000

年份253.11534.827.3347.268.000

总播种面积(万公顷)2.451.344.1417.126.000

施用化肥量(kg/公惭)139.9448.925.74915.680.000

风灾面枳比例(幼-302.32438.305-.171-7.893.000

a.因变量:粮食总产量(y万吨)

粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.456

6、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售

价格(xl)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关

数据。进行多元线性回归分析所得的部分分析结果如下:

IIII

ModelSumofSquaresDfMeanSquareFSig.

Regression4008924.78.8834IE-13

1Residual

Total13458586.729

UnstandardizedCodfficients

BStd.ErrortSig.

(Constant)7589.10252445.02133.10390.00457

XI-117.886131.8974-3.69580.00103

[X2

I80.610714.76765.45860.00001

0.50120.12593.98140.00049

1)将第一张表中的所缺数值补齐。

2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归

系数的意义。

3)检验回归方程的线性关系是否显著?

4)检验各回归系数是否显著?

5)计算判定系数,并解释它的实际意义。

6)计算回归方程的估计标准误差,并解释它的实际意义。

(1)

模型平方和自由度均方F显著性

1回归

12026774.134008924.77288.88341E-13b

残差I43I8I2.62655069.7154

总计13458586.729

(2)Y=7589.1-117.886X1+80.6X2+0.5X3

(3)回归方程显著性检验:整体线性关系显著

(4)回归系数显著性检验:各个回归系数检验均显著

(5)略

(6)略

7、对参加SAT考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及

性别数据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,

分析阅读成绩对数学成绩的线性影响是否显著。

方法:采用进入回归策略。

步骤:分析今回归今线性今将MathSAT导入因变量、其余变量导入自变量)确定。

总统性回归

SMtg_____________

;Statistics...

6VerbalSAT[Readin...|夕MathSAT[MathSAT]

£Gender绘图①…j

快出)1的1

品Sex

(下一页也yj:保存更.j

上一页(Y

送项9)…

自变量Q):

eVerbalSAT[ReadingSAT]

Gender:Bootstrap...

迭择变量(9:

个案标签9):

WLS权重但):

[确定]|[粘贴©M重量®][取潴」[帮助]

结果如下:

已输入/除去变量“

模型已输入变量已除去变量方法

1Gender,Verbal

输入

SAT

a.因变量:MathSAT

b.已输入所有请求的变量。

模型摘要

调整后的R斗

模型RR平方方标准估算的错误

1.710,.505.49969.495

a.预测变量:(常量)5Gender,VerbalSAT

ANOVA1

模型平方和自由度均方F显著性

1回归782588.4682391294.23481.021.000b

残差767897.9511594829.547

总计1550486.420161

a.因变量:MathSAT

b.预测变量:(常量),Gender,VerbalSAT

系数1

非标准化系数标准系数

模型B标准错误贝塔t显著性

1(常量)184.58234.0685.418,000

VerbalSAT.686.055.69612.446.000

Gender37.21910.940,1903.402.001

a.因变量:MathSAT

因概率P值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有

显著的线性影响。

8、试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮

食总产量进行外推预测,并对平均预测误差进行估计。

采用二次曲线

步骤:图形今旧对话框分拆线图今简单9个案值今定义今将粮食总产量导入线的表征今确定

结果如下;

a量

再双击上图今“元素”菜单今添加标记今应用

接下来:分析今同归今曲线估计令粮食总产量导入因变量、年份导入变量,点击年份今在

模型中选择二次项、立方、事今点击“保存”按钮今选择保存"预测值”今继续今确定。

曲线拟合

附注

已创建输出03-MAY-201809:28:44

注释

输入数据F:\SPSS\薛薇《统计分析与spss的应用

(第五版)八PPT--jM第9章SPSS回

归分析'习题'粮食总产量.sav

活动数据集数据集1

过滤器<无>

宽度(W)<无>

拆分文件<无>

工作数据文件中的行数35

缺失值处理对缺失的定义用户定义的缺失值被视作缺失。

已使用的个案任何变量中带有缺失值的个案不用于分

析。

语法CURVEFIT

/VARIABLES^sclWITHnf

/CONSTANT

/MODEL=LINEARQUADRATICCUBIC

POWER

/PRIKTANOVA

/PLOTFIT

/SAVE=PRED.

资源处理器时间00:00:00,19

用时00:00:00,25

使用从第一个观测值

到最后一个观测值

预测从使用周期后的第一观察

到最后一个观测值

变量已创建或已修改FIT_1CURVEFIT和MOD」LINEAR中具有nf

的1SC1的拟合

FIT_2CURVEFIT和MOD」QUADRATIC中具有

nf的Iscl的拟合

FIT_3CURVEFIT和MOD_1CUBIC中具有nf

的Iscl的拟合

FIT_4CURVEFIT和MOD_1POWER中具有nf

的Iscl的拟合

时间序列设置(TSET)输出量PRIKT=DEFAULT

保存新变量NEWVAR=CURRENT

自相关或偏自相关图中的最大

MXAUTO=16

滞后数

每个交叉相关图的最大延迟数MXCROSS=7

每个过程生成的最大新变量数MXNEWVAR=4

每个过程的最大新个案数MXPREDICT=1000

用户缺失值处理MISSING=EXCLUDE

置信区间百分比值CIN=95

在回归方程中输入变量的容差TOLER=.0001

最大迭代参数变化CNVERGE=.001

计算标准的方法自相关的错误ACFSE=IND

季节周期长度未指定

值在绘图中标记观测值的变量未指定

包括方程CONSTANT

警告

由于模型项之间存在接近共线性,该二次模型无法拟合。

由于模型项之间存在接近共线性,该立方模型无法拟合。

模型描述

模型名称MOD」

因变量1粮食总产量(y万吨)

方程式1线性(L)

2二次项(Q)

3立方(U)

4W

自变量年份

常量已包括

值在绘图中标记观测值的变量未指定

对在方程式中输入项的容许.0001

a.此模型需要所有非缺失值为正。

个案处理摘要

数字

个案总计35

排除的个案“0

预测的个案0

新创建的个案0

a.任何变量中带有缺失值的

个案无需分析。

变量处理摘要

变量

从属自变量

粮食总产量(y万

吨)年份

正值的数目3535

零的数目00

负值的数目00

缺失值的数目用户缺失00

系统缺失00

粮食总产量(y万吨)

线性(L)

模型摘要

RR平方调整后的R平方标准估算的错误

.935.874.8702795.862

自变量为年份。

ANOVA

平方和自由度均方F显著性

回归(R)1790107249.41211790107249.412229.006.000

残差257955809.274337816842.705

总计2048063058.68634

自变量为年份。

系数

非标准化系数标准系数

B标准错误贝塔t显著性

年份708.11846.793.93515.133.000

|(常量)|-1369647.904192136.775|-14.865|.ooo|

二次项(Q)

模型摘要

RR平方调整后的R平方标准估算的错误

.936.875.8722782.149

自变量为年份。

ANOVA

平方和自由度均方F显著性

回归(R)1792631355.01411792631355.014231.596.000

残差255431703.672337740354.657

总计2048063058.68634

自变量为年份。

系数

非标准化系数标准系数

B标准错误贝塔|显著性

年份**2.180.012.93615.218.000

(常量)-673013.92645845.338-14.680.000

已排除的项

输入贝塔t显著性偏相关最小容差

年份,-125.061-7.851.000-.811.000

a.已达到输入变量的容许界限。

立方(U)

模型摘要

RR平方调整后的R平方标准估算的错误

.936.877.8732768.471

自变量为年份。

ANOVA

平方和自由度均方F显著性

回归(R)1795136897.27411795136897.274234.217.000

残差252926161.411337664429.134

总计2048063058.68634

自变量为年份。

系数

非标准化系数标准系数

B标准错误贝塔1显著性

年份**36.097E-5,000.93615.304.000

(常量)-440802.44130416.171-14.492.000

已排除的项

输入贝塔t显著性偏相关最小容差

年份‘-62.046-7.785.000-.809.000

年份**2-124.059-7.779.000-.809.000

a.已达到输入变量的容许界限。

模型摘要

RR平方调整后的R平方标准估算的错误

.938.880.877.108

自变量为年份。

ANCVA

平方和自由度均方F显著性

回归(R)2.82512.825242.844,000

残差.38433,012

总计3.20934

自变量为年份。

系数

非标准化系数标准系数

B标准错误贝塔t显著性

In(年份)55.3913.554.93815.583.000

(常量)7.936E-179.000

因变量为In(粮食总产量(y万吨))。

粮食总产量(y万吨)

分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0V0.05,

故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。

预测值:

g*MIW9产.WVCMMI)-IBM此TORSe.■■■'■■"r

[文即)U[g<B»Y)A*①领⑻■愀M■□出口力时

名H段四明品HS3盗金。一

可见:11支费的”

*18M»1曲kks所-1RT.2FIT_3RT_4为

11952001M92001239800U12S0066308182401»977428612(2293980126i8204331456782766

21«30016(830012664001MWOO8149218610153058W5O133256165313345幅30214976737W

31M4001M62001MWOO“238113861100101-101397tls140434X111W0747MO

41^56001W9400129W0015108001635201963014722095®)U73204%514742123971M60377W

51%600伊7500136乂0015917002129542003015430213451M36806CM31525971W0677221

61%7001^5050013363001572400239951205701613833109161»9223116U1646471677400758

7002000000127610015199003745162130016846374168443984716842479631725543921

81%90017000001160200U24O0037496420780175M5GW917M92345217M0304317750431«

9196000143600012243001505s8441165919760182626M031825443M5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论