版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.统计分析与SPSS 的应用 (第五版 )(薛薇 )课后练习答案第 9 章 SPSS 的线性回归分析1、利用第2 章第9 题的数据 ,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中 ,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。选择 fore 和 phy 两门成绩体系散点图步骤 :图形旧对话框散点图简单散点图定义将fore 导入 Y轴,将 phy 导入 X轴,将sex导入设置标记确定 。.专业资料 .接下来在
2、SPSS输出查看器中 ,双击上图 ,打开图表编辑.专业资料 .在图表编辑器中,选择 “元素 ”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用 。分析:如上图所示 ,通过散点图 ,被解释变量 y(即:fore) 与解释变量 phy 有一定的线性关系 。但回归直线的拟合效果都不是很好。2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形
3、式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确.专业资料 .判断之前 ,就进行回归分析,很容易造成 “虚假回归 ”。与此同时 ,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此 ,在具体应用过程中,只有把相关分析和回归分析结合起来 ,才能达到研究和分析的目的。线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著 。主要包括回
4、归方程的拟合优度检验、显著性检验 、回归系数的显著性检验、残差分析等。线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等 。4 、请说明 SPSS 多元线性回归分析中提供了哪几种解释变量筛选策略?向前、向后、逐步。5、先收集到若干年粮食总产量以及播种面积、使用化肥量 、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。 数据文件名为“粮食总产.专业资料 .
5、量.sav ”。方法 :采用 “前进 “回归策略 。步骤 :分析回归线性将粮食总产量导入因变量、其余变量导入自变量方法项选 “前进” 确定。如下图 :(也可向后 、或逐步 )已输入 / 除去变量 a模型已输入变量已除去变量方法1施用化肥量 (kg/向前(准则:.F-to-enter的概公顷 )率 = .050)2风灾面积比例向前(准则:.F-to-enter的概(%)率 = .050)3向前(准则:年份.F-to-enter的概率 = .050).专业资料 .4向前(准则:总播种面积 (万公F-to-enter.的概顷)率 = .050)a. 因变量 :粮食总产量 (y万吨 )模型摘要调整后的
6、R 平模型RR 平方方标准估算的错误1.960 a.922.9192203.301542.975 b.950.9471785.901953.984 c.969.9661428.736174.994 d.989.987885.05221a. 预测变量 :(常量),施用化肥量 (kg/ 公顷 )b. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ),c. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ),d. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ),份 , 总播种面积 (万公顷 )风灾面积比例 (%)风灾面积比例 (%), 年份风灾面积比例 (%), 年ANOVA a模型平方
7、和自由度均方F显著性1回归1887863315.6111887863315.616388.886.000 b6残差160199743.070334854537.669总计2048063058.683462回归1946000793.422973000396.711305.069.000 c2残差102062265.263323189445.789总计2048063058.683463回归1984783160.323661594386.776324.106.000 d9残差63279898.356312041287.044总计2048063058.683464回归2024563536.014506
8、140884.003646.150.000 e1.专业资料 .残差23499522.67530783317.423总计2048063058.68346a. 因变量 :粮食总产量 (y万吨 )b. 预测变量 :(常量),施用化肥量 (kg/ 公顷 )c. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ), 风灾面积比例 (%)d. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ), 风灾面积比例 (%), 年份e. 预测变量 :(常量),施用化肥量 (kg/ 公顷 ), 风灾面积比例 (%), 年份 , 总播种面积 (万公顷 )系数 a非标准化系数标准系数模型B标准错误贝塔t显著性1(常
9、量)17930.148504.30835.554.000施用化肥量 (kg/ 公顷 )179.2879.092.96019.720.0002(常量)20462.336720.31728.407.000施用化肥量 (kg/ 公顷 )193.7018.1061.03723.897.000风灾面积比例 (%)-327.22276.643-.185-4.269.0003(常量)-460006.046110231.478-4.173.000施用化肥量 (kg/ 公顷 )137.66714.399.7379.561.000风灾面积比例 (%)-293.43961.803-.166-4.748.000年份2
10、44.92056.190.3234.359.0004(常量)-512023.30768673.579-7.456.000施用化肥量 (kg/ 公顷 )139.9448.925.74915.680.000风灾面积比例 (%)-302.32438.305-.171-7.893.000年份253.11534.827.3347.268.000总播种面积 (万公顷 )2.451.344.1417.126.000a. 因变量 :粮食总产量 (y万吨 )结论 :如上4 个表所示 ,影响程度中大到小依次是:施用化肥量 (kg/ 公顷 ), 风灾面积比例(%), 年份 , 总播种面积 (万公顷 )。( 排除农业
11、劳动者人数(百万人 )和粮食播种面积(万公顷 )对粮食总产量的影响).专业资料 .剔除 农业劳动者人数(百万人 )和粮食播种面积(万公顷 )后:步骤 :分析回归线性将粮食总产量导入因变量、其余4 个变量 (施用化肥量 (kg/ 公顷 ), 风灾面积比例(%), 年份 , 总播种面积 (万公顷 ))导入自变量方法项选 “输入 ” 确定 。如下图 :系数 a非标准化系数标准系数模型B标准错误贝塔t显著性1(常量)-512023.30768673.579-7.456.000年份253.11534.827.3347.268.000总播种面积 (万公顷 )2.451.344.1417.126.000施用
12、化肥量 (kg/ 公顷 )139.9448.925.74915.680.000风灾面积比例 (%)-302.32438.305-.171-7.893.000.专业资料 .a. 因变量 :粮食总产量 (y万吨 )粮食总产量回归方程: Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.4566、一家产品销售公司在30 个地区设有销售分公司。为研究产品销售量(y) 与该公司的销售价格 ( x1 )、各地区的年人均收入(x2) 、广告费用 (x3) 之间的关系 ,搜集到 30 个地区的有关数据 。 进行多元线性回归分析所得的部分分析结果如下:ModelSum of Square
13、sDfMean SquareFSig.Regression4008924.78.88341E-13ResidualTotal13458586.729Unstandardized CodfficientsBStd.ErrortSig.(Constant)7589.10252445.02133.10390.00457X1-117.886131.8974-3.69580.00103X280.610714.76765.45860.00001X30.50120.12593.98140.000491 ) 将第一张表中的所缺数值补齐。2 ) 写出销售量与销售价格、年人均收入 、广告费用的多元线性回归方程,并
14、解释各回归系数的意义 。3 ) 检验回归方程的线性关系是否显著?.专业资料 .4 ) 检验各回归系数是否显著?5 ) 计算判定系数,并解释它的实际意义。6 ) 计算回归方程的估计标准误差,并解释它的实际意义。(1 )模型平方和自由度均方F显著性112026774.134008924.772.88.88341E-13 b回归残差1431812.62655069.7154总计13458586.729( 2 ) Y=7589.1-117.886 X1+80.6X2+0.5X3( 3 )回归方程显著性检验 :整体线性关系显著( 4 )回归系数显著性检验 :各个回归系数检验均显著( 5 )略( 6 )略
15、7 、对参加SAT 考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及性别数据 。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,分析阅读成绩对数学成绩的线性影响是否显著。方法 :采用进入回归策略。步骤 :分析回归线性将 MathSAT 导入因变量 、其余变量导入自变量确定 。.专业资料 .结果如下 :已输入 / 除去变量 a模型已输入变量已除去变量方法1Gender, VerbalSATb.输入a. 因变量 : Math SATb. 已输入所有请求的变量 。模型摘要调整后的R 平模型RR 平方方标准估算的错误1.710 a.505.49969.495a.
16、预测变量 :(常量), Gender, Verbal SAT ANOVA a模型平方和自由度均方F显著性1回归782588.4682391294.23481.021.000 b残差767897.9511594829.547总计1550486.420161.专业资料 .a. 因变量 : Math SATb. 预测变量 :(常量), Gender, Verbal SAT系数 a非标准化系数标准系数模型B标准错误贝塔t显著性1(常量)184.58234.0685.418.000Verbal SAT.686.055.69612.446.000Gender37.21910.940.1903.402.00
17、1a. 因变量 : Math SAT因概率 P 值小于显著性水平( 0.05 ), 所以表明在控制了性别之后,阅读成绩对数学成绩有显著的线性影响。8、试根据 “粮食总产量 .sav 数”据 ,利用 SPSS 曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。采用二次曲线步骤 :图形旧对话框拆线图简单个案值定义将粮食总产量导入线的表征确定结果如下 :.专业资料 .再双击上图“元素 ”菜单添加标记应用接下来:分析回归曲线估计粮食总产量导入因变量、年份导入变量 ,点击年份在模型中选择二次项、立方 、幂点击 “保存 ”按钮选择保存 ”预测值 ” 继续确定 。曲线拟
18、合附注已创建输出03-MAY-2018 09:28:44.专业资料 .注释输入数据薛薇统计分析与 spss的应用(第五版 )第9 章SPSS回归分析 习题粮食总产量 .sav活动数据集数据集 1过滤器宽度 (W)拆分文件工作数据文件中的行数35缺失值处理对缺失的定义用户定义的缺失值被视作缺失 。已使用的个案任何变量中带有缺失值的个案不用于分析。语法CURVEFIT/VARIABLES=lscl WITH nf/CONSTANT/MODEL=LINEAR QUADRATIC CUBICPOWER/PRINT ANOVA/PLOT FIT/SAVE=PRED .资源处理器时间00:00:00.19
19、用时00:00:00.25使用从第一个观测值到最后一个观测值预测从使用周期后的第一观察到最后一个观测值变量已创建或已修改FIT_1CURVEFIT 和 MOD_1 LINEAR中具有nf 的 lscl 的拟合FIT_2CURVEFIT 和 MOD_1 QUADRATIC中具有 nf 的 lscl的拟合FIT_3CURVEFIT 和 MOD_1 CUBIC中具有nf 的 lscl 的拟合FIT_4CURVEFIT 和 MOD_1 POWER中具有nf 的 lscl 的拟合时间序列设置 (TSET)输出量PRINT = DEFAULT保存新变量NEWVAR = CURRENT自相关或偏自相关图中的
20、最大MXAUTO = 16滞后数每个交叉相关图的最大延迟数MXCROSS = 7每个过程生成的最大新变量数MXNEWVAR = 4每个过程的最大新个案数MXPREDICT = 1000.专业资料 .用户缺失值处理MISSING = EXCLUDE置信区间百分比值CIN = 95在回归方程中输入变量的容差TOLER = .0001最大迭代参数变化CNVERGE = .001计算标准的方法自相关的错误ACFSE = IND季节周期长度未指定值在绘图中标记观测值的变量未指定包括方程CONSTANT警告由于模型项之间存在接近共线性,该二次模型无法拟合 。由于模型项之间存在接近共线性,该立方模型无法拟合
21、 。模型描述模型名称MOD_1因变量1粮食总产量 (y万吨 )方程式1线性 (L)2二次项 (Q)3立方 (U)4幂 a自变量年份常量已包括值在绘图中标记观测值的变量未指定对在方程式中输入项的容许.0001a. 此模型需要所有非缺失值为正。个案处理摘要数字个案总计35排除的个案 a0预测的个案0新创建的个案0a. 任何变量中带有缺失值的个案无需分析 。变量处理摘要变量从属自变量粮食总产量 (y万吨)年份正值的数目3535零的数目00负值的数目00缺失值的数目用户缺失00.专业资料 .系统缺失00粮食总产量 (y 万吨 )线性 (L)模型摘要调整后的R 平RR 平方方标准估算的错误.935.87
22、4.8702795.862自变量为年份。ANOVA平方和自由度均方F显著性回归 (R)1790107249.4111790107249.412229.006.0002残差257955809.274337816842.705总计2048063058.68346自变量为年份。系数非标准化系数标准系数B标准错误贝塔t显著性年份708.11846.793.93515.133.000(常量)-1369647.90492136.775-14.865.000二次项 (Q)模型摘要调整后的R 平RR 平方方标准估算的错误.936.875.8722782.149自变量为年份。ANOVA.专业资料 .平方和自由度均方F显著性回归 (R)1792631355.0111792631355.014231.596.0004残差255431703.672337740354.657总计2048063058.68346自变量为年份。系数非标准化系数标准系数B标准错误贝塔t显著性年份 *2.180.012.93615.218.000(常量)-673013.92645845.338-14.680.000已
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租赁土地厂房合同模板
- 送水合同模板
- 汽车销售佣金合同模板
- 学管师合同模板
- 房子清包合同模板
- 投资退出 合同模板
- 预应力管桩工程合同模板
- 试用期用工合同模板
- 商务ab楼合同模板
- 网吧改造合同模板
- 2025届【九省联考】全国高三10月联考数学试题
- 人教版八年级上册数学期中考试试题含答案详解
- 2023--2024学年苏少版七上综合实践教案
- 光伏发电项目投资合同三篇
- 部编版小学语文六年级上册第四单元单元整体备课设计
- 突发环境事件应急预案评审会汇报课件-(模板)
- 可编程逻辑控制器(PLC)行业竞争分析及发展前景预测报告
- 中国铁塔5G室分分场景建设方案指引
- 2023年国家执业兽医资格考试试卷及参考答案下午卷1
- 企业政府沟通与合作制度
- 项目实施方案及服务措施(2篇)
评论
0/150
提交评论