




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《统计分析与SPSS的应用(第五版)》(薛薇)
课后练习答案
第9章SPSS的线性回归分析
1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS
提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程
成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条
分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。
选择fore和phy两门成绩体系散点图
步骤:图形今旧对话框分散点图9简单散点图9定义今将fore导入Y轴,将phy导入X轴,将
sex导入设置标记今确定。
sex
0female
Omale
80.00-
60.00-
40.00-
20.00-
40.0050.0060.0070.0080.0090.00100.00
Phy
接下来在SPSS输出查看器中,双击上图,打开图表编辑
在图表编辑器中,选择“元素”菜单1选择总计拟合线分选择线性今应用今再选择元素菜单
分点击子组拟合线今选择线性)应用。
分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定
的线性关系。但回归直线的拟合效果都不是很好。
2、请说明线性回归分析与相关分析的关系是怎样的?
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依
靠回归分析来表现变量之间数曷相关的具体形式,而回归分析则需要依靠相关分析来表现变
量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的
具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之
前,就进行回归分析,很容易造成“虚假回归”。与此同时:相关分析只研究变量之间相关
的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另
一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才
能达到研究和分析的目的。
线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个
变量的增加或减少。
3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?
检验其可信程度并找出哪些变量的影响显著、哪些不显著。
主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。
线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释
变量和解释变量之间确实存在显著的线性关系。
回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用
线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。
4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?
向前、向后、逐步。
5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用
建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。
方法:采用“前进”回归策略。
步骤:分析》回归分线性今将粮食总产量导入因变量、其余变量导入自变量分方法项选“前
进”分确定。如下图:(也可向后、或逐步)
◎线性回归
因变量Q):
,年份[的I夕粮食总产量(y万吨)Rscl]
e粮食播种面积历公…
块(B)1的1
夕总播种面积历公顷)[…
,施用化肥量(kg公顷)…下一页®)j
夕风灾面积比例(%)[zh]
自变量Q):
「农业劳动者人数(百…
夕施用化肥量(k%顷)[sm
夕风灾面积比例(%)团
6年份[nn
方法国):前迸
送择变量但):
:规则(
个案标签(C):
WLS权重(旦):
〔确定J粘贴©][aa(R)j[取^[帮助
已输入/除去变量,
模型已输入变量已除去变量方法
1向前(准则:
施用化肥量(kg/
F-to-enter的
公顷)
概率<=.050)
2向前(准则:
风灾面积比例
F-to-enter的
(%)
概率<=.050)
3向前(准则:
年份F-to-enter的
概率<=.050)
4向前(准则:
总播种面积(万
•F-to-enter的
公顷)
概率<=.050)
a.因变量:粮食总产量(y万吨)
模型摘要
调整后的R平
模型RR印方标准估算的错误
1.960*.922.9192203.30154
2.975b.950.9471785.90195
3.984*.969.9661428.73617
4.994d.989.987885.05221
a.预测变量:(常量),施用化肥量ikg/公顷)
b.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例册)
c.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(幼,年
份
<1.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例陶),年
份,总播种面积(万公顷)
ANOVA'
模型平方和自由度均方F显著性
1回归1887863315.61611887863315.616388.886.0001,
残差160199743.070334854537.669
总计2048063058.68634
2回归1946000793.4222973000396.711305.069.000"
残差102062265.263323189445.789
总计2048063058.68634
3回归1984783160.3293661594386.776324.1C6.000d
残差63279898.356312041287.044
总计2048063058.68634
4回归2024563536.0114506140884.003646.150.0000
残差23499522.67530783317.423
总计2048063058.68634
a.因变量:粮食总产量(y万吨)
b,预测变量:(常量),施用化肥量ikg/公顷)
C.预测变量:(常量),施用化肥量[kg/公顷),风灾面积比例(幼
d.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例(幼,年份
e.预测变量:(常量),施用化肥量ikg/公顷),风灾面积比例盛),年份,总播种面积(万公
顷)
系数1
非标准化系数标准系数
模型B标准错误贝塔t显著性
1(常量)17930.148504.30835.554,000
施用化肥量(kg/公顷)179.2879.092,96C19.720.000
2(常量)20462.336720.31728.407.000
施用化肥量(kg/公顷)193.7018.1061.03723.897.000
风灾面积比例(%)-327.22276.643-.185-4.269.000
3(常量)-460006.046110231.478-4.173.000
施用化肥量(kg/公顷)137.66714.399.7379.561,000
风灾面枳比例隰)•293.43961.803-.166-4.748,000
年份244,92056.190.3234.359.000
4(常量)-512023.30768673.579-7.456.000
施用化肥量(kg/公顷)139.9448.925.74915.680.000
风灾面积比例(幼-302.32438.305-.171-7.893.000
年份253.11534.827.3347.268.000
总播种面积(万公顷)2.451.344.1417.126.000
a.因变量:粮食总产量(y万吨)
结论:如上4个表所示,影响程度中大到小依次是:施用化肥量(kg/公顷),风灾面积比例(%),
年份,总播种面积(万公顷)。(排除农业劳动者人数(百万人)和粮食播种面积(万公顷)对粮食
总产量的影响)
剔除农业劳动者人数(白万人)和粮食播种面积(万公顷)后:
步骤:分析今回归今线性今将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷),
风灾面积比例(%),年份,总播种面积(万公顷))导入自变量分方法项选“输入”今确定。如
下图:
喻线性回归
因变量(D):________________
超年份[的I夕粮食总产量(y万吨)[isci]
e粮食播种面积历公…
块(B)1的1
夕总播种面积历公顷)[…
,施用化肥量(kg公顷)…下一页国)|
夕风灾面积比例(%)[zh]
自变量Q):
,农业劳动者人数(百…
夕总播种面积历公顷)[zbzmj]
,施用化肥量(kg/公顷)[sm
/风灾面积比例陶[zh]
方法国):愉入▼|
送择变量(£):
规则@)…
个案标签(g):
WLS权重(旦):
[确定J粘贴©][gg(R)j[取^]飒—
系数
非标准化系数标准系数
模型B标准错误贝塔t显著性
1(常量)-512023.30768673.579-7.456.000
年份253.11534.827.3347.268.000
总播种面积(万公顷)2.451.344.1417.126.000
施用化肥量(kg/公惭)139.9448.925.74915.680.000
风灾面枳比例(幼-302.32438.305-.171-7.893.000
a.因变量:粮食总产量(y万吨)
粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.456
6、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售
价格(xl)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关
数据。进行多元线性回归分析所得的部分分析结果如下:
IIII
ModelSumofSquaresDfMeanSquareFSig.
Regression4008924.78.8834IE-13
1Residual
Total13458586.729
UnstandardizedCodfficients
BStd.ErrortSig.
(Constant)7589.10252445.02133.10390.00457
XI-117.886131.8974-3.69580.00103
[X2
I80.610714.76765.45860.00001
0.50120.12593.98140.00049
1)将第一张表中的所缺数值补齐。
2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归
系数的意义。
3)检验回归方程的线性关系是否显著?
4)检验各回归系数是否显著?
5)计算判定系数,并解释它的实际意义。
6)计算回归方程的估计标准误差,并解释它的实际意义。
(1)
模型平方和自由度均方F显著性
1回归
12026774.134008924.77288.88341E-13b
残差I43I8I2.62655069.7154
总计13458586.729
(2)Y=7589.1-117.886X1+80.6X2+0.5X3
(3)回归方程显著性检验:整体线性关系显著
(4)回归系数显著性检验:各个回归系数检验均显著
(5)略
(6)略
7、对参加SAT考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及
性别数据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,
分析阅读成绩对数学成绩的线性影响是否显著。
方法:采用进入回归策略。
步骤:分析今回归今线性今将MathSAT导入因变量、其余变量导入自变量)确定。
总统性回归
SMtg_____________
;Statistics...
6VerbalSAT[Readin...|夕MathSAT[MathSAT]
£Gender绘图①…j
快出)1的1
品Sex
(下一页也yj:保存更.j
上一页(Y
送项9)…
自变量Q):
eVerbalSAT[ReadingSAT]
Gender:Bootstrap...
迭择变量(9:
帆
个案标签9):
WLS权重但):
[确定]|[粘贴©M重量®][取潴」[帮助]
结果如下:
已输入/除去变量“
模型已输入变量已除去变量方法
1Gender,Verbal
输入
SAT
a.因变量:MathSAT
b.已输入所有请求的变量。
模型摘要
调整后的R斗
模型RR平方方标准估算的错误
1.710,.505.49969.495
a.预测变量:(常量)5Gender,VerbalSAT
ANOVA1
模型平方和自由度均方F显著性
1回归782588.4682391294.23481.021.000b
残差767897.9511594829.547
总计1550486.420161
a.因变量:MathSAT
b.预测变量:(常量),Gender,VerbalSAT
系数1
非标准化系数标准系数
模型B标准错误贝塔t显著性
1(常量)184.58234.0685.418,000
VerbalSAT.686.055.69612.446.000
Gender37.21910.940,1903.402.001
a.因变量:MathSAT
因概率P值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有
显著的线性影响。
8、试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮
食总产量进行外推预测,并对平均预测误差进行估计。
采用二次曲线
步骤:图形今旧对话框分拆线图今简单9个案值今定义今将粮食总产量导入线的表征今确定
结果如下;
值
粮
良
产
a量
万
呼
再双击上图今“元素”菜单今添加标记今应用
接下来:分析今同归今曲线估计令粮食总产量导入因变量、年份导入变量,点击年份今在
模型中选择二次项、立方、事今点击“保存”按钮今选择保存"预测值”今继续今确定。
曲线拟合
附注
已创建输出03-MAY-201809:28:44
注释
输入数据F:\SPSS\薛薇《统计分析与spss的应用
(第五版)八PPT--jM第9章SPSS回
归分析'习题'粮食总产量.sav
活动数据集数据集1
过滤器<无>
宽度(W)<无>
拆分文件<无>
工作数据文件中的行数35
缺失值处理对缺失的定义用户定义的缺失值被视作缺失。
已使用的个案任何变量中带有缺失值的个案不用于分
析。
语法CURVEFIT
/VARIABLES^sclWITHnf
/CONSTANT
/MODEL=LINEARQUADRATICCUBIC
POWER
/PRIKTANOVA
/PLOTFIT
/SAVE=PRED.
资源处理器时间00:00:00,19
用时00:00:00,25
使用从第一个观测值
到最后一个观测值
预测从使用周期后的第一观察
到最后一个观测值
变量已创建或已修改FIT_1CURVEFIT和MOD」LINEAR中具有nf
的1SC1的拟合
FIT_2CURVEFIT和MOD」QUADRATIC中具有
nf的Iscl的拟合
FIT_3CURVEFIT和MOD_1CUBIC中具有nf
的Iscl的拟合
FIT_4CURVEFIT和MOD_1POWER中具有nf
的Iscl的拟合
时间序列设置(TSET)输出量PRIKT=DEFAULT
保存新变量NEWVAR=CURRENT
自相关或偏自相关图中的最大
MXAUTO=16
滞后数
每个交叉相关图的最大延迟数MXCROSS=7
每个过程生成的最大新变量数MXNEWVAR=4
每个过程的最大新个案数MXPREDICT=1000
用户缺失值处理MISSING=EXCLUDE
置信区间百分比值CIN=95
在回归方程中输入变量的容差TOLER=.0001
最大迭代参数变化CNVERGE=.001
计算标准的方法自相关的错误ACFSE=IND
季节周期长度未指定
值在绘图中标记观测值的变量未指定
包括方程CONSTANT
警告
由于模型项之间存在接近共线性,该二次模型无法拟合。
由于模型项之间存在接近共线性,该立方模型无法拟合。
模型描述
模型名称MOD」
因变量1粮食总产量(y万吨)
方程式1线性(L)
2二次项(Q)
3立方(U)
4W
自变量年份
常量已包括
值在绘图中标记观测值的变量未指定
对在方程式中输入项的容许.0001
a.此模型需要所有非缺失值为正。
个案处理摘要
数字
个案总计35
排除的个案“0
预测的个案0
新创建的个案0
a.任何变量中带有缺失值的
个案无需分析。
变量处理摘要
变量
从属自变量
粮食总产量(y万
吨)年份
正值的数目3535
零的数目00
负值的数目00
缺失值的数目用户缺失00
系统缺失00
粮食总产量(y万吨)
线性(L)
模型摘要
RR平方调整后的R平方标准估算的错误
.935.874.8702795.862
自变量为年份。
ANOVA
平方和自由度均方F显著性
回归(R)1790107249.41211790107249.412229.006.000
残差257955809.274337816842.705
总计2048063058.68634
自变量为年份。
系数
非标准化系数标准系数
B标准错误贝塔t显著性
年份708.11846.793.93515.133.000
|(常量)|-1369647.904192136.775|-14.865|.ooo|
二次项(Q)
模型摘要
RR平方调整后的R平方标准估算的错误
.936.875.8722782.149
自变量为年份。
ANOVA
平方和自由度均方F显著性
回归(R)1792631355.01411792631355.014231.596.000
残差255431703.672337740354.657
总计2048063058.68634
自变量为年份。
系数
非标准化系数标准系数
B标准错误贝塔|显著性
年份**2.180.012.93615.218.000
(常量)-673013.92645845.338-14.680.000
已排除的项
输入贝塔t显著性偏相关最小容差
年份,-125.061-7.851.000-.811.000
a.已达到输入变量的容许界限。
立方(U)
模型摘要
RR平方调整后的R平方标准估算的错误
.936.877.8732768.471
自变量为年份。
ANOVA
平方和自由度均方F显著性
回归(R)1795136897.27411795136897.274234.217.000
残差252926161.411337664429.134
总计2048063058.68634
自变量为年份。
系数
非标准化系数标准系数
B标准错误贝塔1显著性
年份**36.097E-5,000.93615.304.000
(常量)-440802.44130416.171-14.492.000
已排除的项
输入贝塔t显著性偏相关最小容差
年份‘-62.046-7.785.000-.809.000
年份**2-124.059-7.779.000-.809.000
a.已达到输入变量的容许界限。
帚
模型摘要
RR平方调整后的R平方标准估算的错误
.938.880.877.108
自变量为年份。
ANCVA
平方和自由度均方F显著性
回归(R)2.82512.825242.844,000
残差.38433,012
总计3.20934
自变量为年份。
系数
非标准化系数标准系数
B标准错误贝塔t显著性
In(年份)55.3913.554.93815.583.000
(常量)7.936E-179.000
因变量为In(粮食总产量(y万吨))。
粮食总产量(y万吨)
分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0V0.05,
故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。
预测值:
g*MIW9产.WVCMMI)-IBM此TORSe.■■■'■■"r
[文即)U[g<B»Y)A*①领⑻■愀M■□出口力时
名H段四明品HS3盗金。一
可见:11支费的”
*18M»1曲kks所-1RT.2FIT_3RT_4为
11952001M92001239800U12S0066308182401»977428612(2293980126i8204331456782766
21«30016(830012664001MWOO8149218610153058W5O133256165313345幅30214976737W
31M4001M62001MWOO“238113861100101-101397tls140434X111W0747MO
41^56001W9400129W0015108001635201963014722095®)U73204%514742123971M60377W
51%600伊7500136乂0015917002129542003015430213451M36806CM31525971W0677221
61%7001^5050013363001572400239951205701613833109161»9223116U1646471677400758
7002000000127610015199003745162130016846374168443984716842479631725543921
81%90017000001160200U24O0037496420780175M5GW917M92345217M0304317750431«
9196000143600012243001505s8441165919760182626M031825443M5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 太原住宅租赁合同
- 增值税发票技术服务项目规定合同
- 猪肉销售合同书
- 物联网传感器设备销售合同
- 店铺商铺租赁合同例文
- Revision of Module 7(教学设计)-2024-2025学年外研版(一起)英语一年级上册
- 泉州师范学院《学前教育中的哲学智慧》2023-2024学年第二学期期末试卷
- 江西青年职业学院《广播电视与新媒体概论》2023-2024学年第二学期期末试卷
- Unit 6 Growing Up(教学设计)-2023-2024学年人教新起点版英语五年级下册
- 4邓小平爷爷植树(教学设计)2024-2025学年统编版语文二年级下册
- 新审定人教版小学数学六年级下册教材分析课件
- 小学科学教科版五年级上册全册思维导图(2021新版)
- 全国水资源保护规划技术大纲
- 企业员工培训PPT课件:职务犯罪培训
- 蛋白质分离技术全PPT课件
- 汪小兰有机化学课件(第四版)9醛酮醌
- 磷酸铁锂电池工商业储能项目施工组织设计方案
- 震旦ad188维修手册
- 五金英语词汇盘点
- 内容讲义说明案例nxt pop trainning
- 工业自动化设备项目用地申请报告(模板)
评论
0/150
提交评论