实验7相关与回归分析SPSS应用_第1页
实验7相关与回归分析SPSS应用_第2页
实验7相关与回归分析SPSS应用_第3页
实验7相关与回归分析SPSS应用_第4页
实验7相关与回归分析SPSS应用_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验7 相关与回归分析7.1实验目的熟练掌握一元线性回归分析的spss应用技能,掌握一元非线性回归分析的spss应用技能,对实验结果做出解释。7.2相关知识(略)7.3实验内容 7.3.1一元线性回归分析的spss实验7.3.2一元非线性回归分析的spss实验7.4实验要求7.4.1准备实验数据1.线性回归分析数据美国各航空公司业绩的统计数据公布在华尔街日报1999年年鉴(the wall street journal almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据,见表7-1所示。表7-1 美国航空公司航空正点率与乘客投诉次数资料航空公司名称航班正点率(%)

2、投诉率(次/10万名乘客)西南(southwest)航空公司818021大陆(continental)航空公司766058西北(northwest)航空公司766085美国(us airways)航空公司757068联合(united)航空公司738074美洲(american)航空公司722093德尔塔(delta)航空公司712072美国西部(americawest)航空公司708122环球(twa)航空公司6851252.非线性回归分析数据19922013年某国保费收入与国内生产总值的数据,试研究保费收入与国内生产总值的关系的数据,见表7-2所示。表7-2 19922013年某国保费收入

3、与国内生产总值数据 单位:万元年度保费收入国民生产总值年度保费收入国民生产总值19924.64517.82003239.721662.519937.84860.3200437826651.9199410.35301.8200552534560.5199513.25957.42006630466701996207206.7200768357494.9199733.18989.1200877666850.5 199845.810201.42009108073142.7 199971.0411954.520101247.376967.22000109.514922.320111393.2280579

4、.4 2001142.616917.820121595.988228.1 2002178.518598.420132109.3694346.47.4.2完成一元线性回归分析的spss实验,对实验结果作出简要分析。7.4.3完成一元非线性回归分析的spss实验,对实验结果作出简要分析。7.5实验步骤7.5.1 完成一元线性回归分析的spss实验步骤1.运用spss绘制散点图散点图。第一步:在excel中输入数据图7-1第二步:将excel数据导入spss 单击打开数据文档按钮(或选择菜单文件打开)选择文件航空公司航班正点率与投诉率.xls 图7-2第三步:选择菜单图形 旧对话框 散点/点状,在散

5、点图/点图对话框中,选择简单分布按钮图7-3 第三步:在简单散点图对话框中,将候选变量框中的投诉率添加到y轴,航班正点率添加到x轴,点击确定:图7-4 第四步:运行得到: 图7-5 根据散点图初步判断航班正点率和投诉率呈线性关系2计算相关系数,明确变量之间存在的相关关系。第一步:选择菜单分析(a)相关(c) 双变量相关(b),在双变量相关对话框中,将候选变量框中的航班正点率和投诉率添加到变量(v)框,点击确定:图7-6第二步:运行得到表7-1 相关性航班正点率(%)投诉率(次/10万名乘客)航班正点率(%)pearson 相关性1-.883*显著性(双侧).002n99投诉率(次/10万名乘客

6、)pearson 相关性-.883*1显著性(双侧).002n99*. 在 .01 水平(双侧)上显著相关。根据相关系数判断:航班正点率和投诉率的相关系数为-0.833,显著性水平p为0.002小于0.05,说明航班正点率和投诉率高度负相关。3拟合回归方程第一步:选择菜单分析(a) 回归(r) 线性(l),将候选变量框中的投诉率添加到因变量框(d),航班正点率添加到自变量框(t),点击确定:图7-7第二步,运行得到表7-2 系数a模型非标准化系数标准系数tsig.(显著性水平)b标准 误差试用版1(常量)6.0181.0525.719.001航班正点率(%)-.070.014-.883-4.9

7、67.002a. 因变量: 投诉率(次/10万名乘客)拟合回归方程为=-0.07 x + 6.018,常数项和自变量t值分别为5.719和-4.967,显著性水平p分别为0.001和0.002,均小于0.05,说明常数项和自变量x对因变量y有显著影响。4计算回归标准误差,说明回归直线的代表性;计算样本拟合优度,说明模型拟合的效果。第一步:操作同3第二步,运行得到表7-3 模型汇总模型rr 方调整 r 方标准 估计的误差1.883a.779.747.16082a. 预测变量: (常量), 航班正点率(%)。估计标准误差=0.16082比较小,说明回归直线代表性较好。r2为0.747接近1,表明模

8、型的拟合效果比较好。5.在不同置信水平下建立回归估计的置信区间 在置信水平1-取不同值的情况下,回归估计的置信区间为: 6对估计的回归方程的斜率作出解释回归方程的斜率,即回归系数b=-0.07,表示航班正点率每提高1%,旅客投诉率会降低0.07%。7如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数。根据回归方程=-0.7 x + 6.018,当航班正点率为80%时,每10万名乘客投诉的次数为-0.7×80+6.018=0.418(次)8如果航班按时到达的正点率为80%,试在95%可信程度下估计每10万名乘客投诉的置信区间。如果航班按时到达的正点率为80%,试在95%可信

9、程度下估计每10万名乘客投诉的置信区间为=0.1028,0.73327.5.2完成一元非线性回归分析的spss实验步骤1. 画出这些数据的散点图第一步:在excel中输入数据图7-1第二步:将excel数据导入spss 单击打开数据文档按钮(或选择菜单文件打开)选择文件国民生产总值与保费收入.xls图7-2第三步:选择菜单图形 旧对话框 散点/点状,在散点图/点图对话框中,选择简单分布按钮图7-3第四步:在简单散点图对话框中,将候选变量框中的将保费收入添加到y轴,国民生产总值添加到x轴:图7-4 第五步:运行得到:图7-5 根据散点图初步判:国民生产总值与保费收入呈非线性关系。2.计算不同模型

10、的样本拟合优度,并据此选择拟合效果最好的模型。第一步:选择菜单分析 回归 曲线估计,在曲线估计对话框中,将候选变量框中的保费收入添加到因变量,将国民生产总值添加到自变量,依次选择模型复选框中的线性、二次项、对数、指数等模型。图7-6第二步: 依次得到运行结果图7-7 直线 r2=0.941图7-8 二次曲线 r2=0.973图7-9 复合 r2=0.789 图7-10 增长 r2=0.789 图7-11 三次曲线 r2=0.990图7-12 对数 r2=0.772图7-13 s曲线 r2=0.946图7-14 指数 r2=0.789图7-15 反向 r2=0.015 图7-16 幂 r2=0.

11、015 图7-17 logistic r2=0.829通过对比上述模型,与观测点变化趋势拟合最好的是三次曲线模型,三次曲线的拟合优度最大(r2=0.990),也说明它是拟合效果最好的模型。或者在第一步中,将所有模型的复选框全部选定,得到运行结果:模型汇总和参数估计值因变量:保费收入方程模型汇总参数估计值r 方fdf1df2sig.常数b1b2b3线性.941316.551120.000-154.292.019对数.77267.889120.000-4576.241508.979倒数.48118.572120.000966.105-6138735.913二次.973336.771219.0002

12、3.846.0031.756e-7三次.990617.659318.000-166.430.029-5.364e-75.022e-12复合.78974.788120.00023.3151.000幂.972700.929120.0002.521e-61.796s.946347.778120.0007.069-27064.140增长.78974.788120.0003.1495.450e-5指数.78974.788120.00023.3155.450e-5logistic.78974.788120.000.0431.000自变量为 国民生产总值(亿元)。同样,通过对比上述模型,与观测点变化趋势拟合

13、最好的是三次曲线模型,三次曲线的拟合优度最大(r2=0.990),也说明它是拟合效果最好的模型。3.求解保费收入依国民生产总值的估计回归方程。第一步:选择菜单分析 回归 曲线估计,在曲线估计对话框中,将候选变量框中的保费收入添加到因变量,将国民生产总值添加到自变量,选择模型复选框中的立方模型图7-18第二步:单击曲线估计对话框中的保存按钮,在曲线估计:保存对话框中,选择预测值、残差、预测区间复选框图7-19第三步,运行结果表7-4 模型汇总rr 方调整 r 方估计值的标准误.995.990.98964.883自变量为 国民生产总值。r2为0.990非常接近1,表明模型的拟合效果非常好。表7-5

14、 系数未标准化系数标准化系数tsig.b标准误beta国民生产总值.029.0051.5065.836.000国民生产总值 * 2-5.364e-7.000-2.554-4.277.000国民生产总值 * 35.022e-12.0002.093.(常数)-166.43045.399-3.666.002从表中可知因变量与自变量的三次回归模型为:y=-166.430 + 0.029x - 5.364e-7x2 + 5.022e-12x37.6 思考与练习题7.6.1一元线性回归分析合金钢的强度y与碳含量x关系密切,通常根据强度要求来控制碳的含量来达到目的,二者之间关系如下:碳含量0.030.040.050.070.090.100.120.150.170.20钢强度40.5039.5041.0041.5043.0042.0045.0047.5053.0056.00(1)画出这些数据的散点图;(2)根据散点图和相关系数,表明二变量之间存在什么关系?(3)求出描述钢强度是如何依赖碳含量的估计的回归方程;(4)计算回归标准误差,说明回归直线的代表性;计算样本拟合优度,说明模型拟合的效果;(5)对估计的回归方程的斜率作出解释;(6)如果碳含量控制在0.18,试估计钢的强度;(7)如果碳含量控制在0.18,试在9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论