实验7相关及回归分析SPSS应用_第1页
实验7相关及回归分析SPSS应用_第2页
实验7相关及回归分析SPSS应用_第3页
实验7相关及回归分析SPSS应用_第4页
实验7相关及回归分析SPSS应用_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验7相关与回归分析7.1 实验目的熟练掌握一元线性回归分析的 SPSSS用技能,掌握一元非线性回归分析的 SPSSS用技能,对实验结果做出解释.7.2 相关知识(略)7.3 实验内容7.3.1 一元线性回归分析的SPSS验7.3.2 一元非线性回归分析的SPS豉验7.4 实验要求7.4.1 准备实验数据1 .线性回归分析数据美国各航空公司业绩的统计数据公布在 ?华尔街日报1999年年鉴?(The Wall Street Journal Almanac 1999)上.航班正点到达的比率和每 10万名乘客投诉 的次数的数据,见表7-1所示.表7-1美国航空公司航空正点率与乘客投诉次数资料航空公司

2、名称航班正点率()投诉率(次/10万名乘客)西南(Southwest)航空公司81. 80. 21大陆(Continental)航空公司76. 60. 58西北(Northwest)航空公司76. 60. 85美国(US Airways)航空公司75. 70. 68联合(United)航空公司73. 80. 74美洲(American)航空公司72. 20. 93德尔塔(Delta)航空公司71. 20. 72美国西部(Americawest)航空公司70. 81 . 22环球(TWA)航空公司68. 51 . 252 .非线性回归分析数据19922021年某国保费收入与国内生产总值的数据,试

3、研究保费收入与国内生产总值的关系的数据,见表7-2所示表7-2 19922021年某国保费收入与国内生产总值数据单位:万元年度保费收入国民生产总值年度保费收入国民生产总值19924.64517.82003239.721662.519937.84860.3200437826651.9199410.35301.8200552534560.5199513.25957.42006630466701996207206.7200768357494.9199733.18989.1202177666850.5199845.810201.42021108073142.7199971.0411954.520211

4、247.376967.22000109.514922.320211393.2280579.42001142.616917.820211595.988228.12002178.518598.420212109.3694346.47.4.2 完成一元线性回归分析的SPS弦验,对实验结果作出简要分析.7.4.3 完成一元非线性回归分析的SPS豉验,对实验结果作出简要分析7.5实验步骤7.5.1 完成一元线性回归分析的 SPSSJ验步骤1 .运用SPS瑟制散点图散点图.第一步:在excel中输入数据 Miciosofl -航空公司航密正点率与投诉率.出老文件© 骗强叩 视囱 推入9 格式陋

5、工具 数据叶 词口如 帮助班口安用白d&等数X电*0 O' - I ft Z - 4; 始通1谶 ,O家体, R F U 室室至沼等 ,堀郭奉厚二 勒F30 A1A 航空公司名称B 航感正点率%C投诉率1长口.力名乘客Da西南Southwest,航空公司Bl S0.2L34大 由Contirwmn航空公司76.fi.励西北.3幻制?£.航空公司.央5美国U* Airwnys航空公司75.70.686联合Unitedjffi空公司73.87美洲AinerkMi做空公司72,2队应8蔻尔塔Delu3航空公司71.20.7201.美国西AinericEiwpst 航空公司7

6、0.81.22环球 gA1航空公司63,51.2511图7-1第二步:将 excel 数据导入 spss单击翻开数据文档按钮或选择菜单文件一翻开一选择文件航空公司航班正点率与投诉率.xls土味标题2 教据集1-旧怖S限Shtislfes数据褊辑器刘艳蛹妈眦凹捌蚂转舱 姗® 画她酬四新酎M 窗口岬帮助国褊当n ss嬴w瑞啮29肮空公司翎:航班正占率投胖次二万名臻客变1西南Southw闹航空公司818212大F制Continent即航空盆用76. B,903西北Norihwe st航空公司76.6.654美国U写Aim沔耳侬公司75 7氏5胜合川加恒巾肮空公司73. B74E美洲口门加国

7、成峰公司72.2,937勤晡Delta航空公司71.272B美国西初护西加口神时航空必可70.81.229环球的桢侬公司E0.51.2610图7-2第三步:选择菜单图形一旧对话框一 散点/点状,在散点图/点图对话框中,选择简单分布按钮志散点图,点图国毗的团呻咖国国i国5 |演里耳图7-3第三步:在简单散点图对话框中,将候选变量框中的 投诉率添加到Y轴,航班正点率添加到X轴,点击确定:定简单散点图X图7-4第四步:运行得到:75,25-&3.UT2.D75JD费.口航班正点率(%)图7-5根据散点图初步判断航班正点率和投诉率呈线性关系2 .计算相关系数,明确变量之间存在的相关关系.第一步

8、:选择菜单分析A相关C 一双变量相关B,在双变量相关 对话框中,将候选变量框中的 航班正点率和投诉率添加到变量V框,点击确 定:图7-6第二步:运行得到表7-1 相关性航班正点率%投诉率次/10万名乘客航班正点率%Pearson相关性1*-.883显著性双侧.002N99投诉率次/10万名Pearson相关性*-.8831乘客显著性双侧.002N99*.在.01水平双侧上显著相关.根据相关系数判断:航班正点率和投诉率的相关系数为-0.833 ,显著性水平P为 0.002小于0.05 ,说明航班正点率和投诉率高度负相关.3 .拟合回归方程第一步:选择菜单分析A 一回归R 一线性L,将候选变量框中

9、 的投诉率添加到因变量框D,航班正点率 添加到自变量框T,点击确定:图7-7第二步,运行得到表7-2 系数模型非标-B隹化系数标准误差标准系数 试用版tSig.显著性水平1常量航班正点率为6.018-.0701.052.014-.8835.719-4.967.001.002a.因变量:投诉率次/10万名乘客拟合回归方程为Y=-0.07 X + 6.018 ,常数项和自变量t值分别为5.719和-4.967 ,显著性水平P分别为0.001和0.002,均小于0.05,说明常数项和自变量X对因变量Y有显著影响.4 .计算回归标准误差,说明回归直线的代表性;计算样本拟合优度,说明模型 拟合的效果.第

10、一步:操作同3第二步,运行得到估计标准误差=0.16082比拟小,说明回归直线代表性较好.表7-3模型汇总模型RR方调整R方标准估计的误差1a. a. a. H.883.779.747.16082a.预测变量:常量,航班正点率%R为0.747接近1,说明模型的拟合效果比拟好5 .在不同置信水平下建立回归估计的置信区问在置信水平1- a取不同值的情况下,回归估计的置信区间为: A 1 一|Y-ZaSx,Y+ZaSx =卜 0.7X +6.018-0.16082Za,-0.7X +6.018+ 0.16082Za222-26 .对估计的回归方程的斜率作出解释回归方程的斜率,即回归系数b=-0.07

11、 ,表示航班正点率每提升1%旅客投诉率 会降低0.07%.7 .如果航班按时到达的正点率为 80%,估计每10万名乘客投诉的次数.A根据回归方程Y=-0.7 X + 6.018 ,当航班正点率为80%寸,每10万名乘客投诉的次数为-0.7 X 80+6.018=0.418 次8 .如果航班按时到达的正点率为 80%试在95%T信程度下估计每10万名乘客 投诉的置信区问.如果航班按时到达的正点率为80%试在95%T信程度下估计每10万名乘客投诉 的置信区间为一八八一1Y-ZaSyx.Y+ZSyx = I-0.7X +6.018-0.16082Za,-0.7X +6.018 + 0.16082Za

12、- 万21_2W 一=0.1028,0.73327.5.2完成一元非线性回归分析的SPS弦验步骤1.画出这些数据的散点图第一步:在excel中输入数据 MiciQ&ofl Excel -同内生产总值与保费收入理 1文件史 染指屿 视图也插入CD 格式盛 工且© 数据 宙口 理助呼:口片国总 01学&I *验B,y五TIW通师 -©朱隹 L2 R上口三手叁至券% ,端*萍滓_ , %*G15ABCDEF1年度保费收入国民生产总情21992464517.8319937.34B60.3419941055301.0519951325957461996207206.7

13、7199733.18989.1S19SS45810201.49199971.04:1954.5102000109.514922.3112001142 616917.8122002178.5185984132003239.721662.51420M37E26651.91520Q5二:34560.1匚16200663D466701720QT768357494.918202177666350.5192021108073142.72020211247.376967.22120211393.22“加出2220211593.988228.12320212109 3694346.424图7-1第二步:将 e

14、xcel数据导入 spss单击翻开数据文档 按钮或选择菜单 文件一翻开一选择文件国民生产总值与 保费收入.xls噌未标题5 |数据集印IBM SPSS 5talistics数据势辐器文件9 海鼎刍视I到空过眼色衿胸1 分析邑t 直板四图行电实ffl程序5 窗口也帮助1 ttE.T不黑喳£?SZ.B/k010:年度保5?收入国艮生产总值TTTT 1H.一1Trna119924,64517 3:219937.84060.3319941D.35301LB4198513 25957 46199B20.07206 76198733.10989 17199a45.610201.48199971

15、011954 5S2000109.S14922.3102001142.616917 9112002173.510596.122003239721662 5132004378.026651.9Id200552S.034560 5153000630.046670.0162007603.057494 3172000776.066B50.51320211080.073142719201D127.376967.2202D111393.28057942120211595.900220.122202121D9.49434B4图7-2第三步:选择菜单图形一旧对话框一 散点/点状,在散点图/点图对话框中,选择简

16、单分布按钮图7-3第四步:在简单散点图对话框中,将候选变量框中的将 保费收入添加到Y轴, 国民生产总值添加到X轴:宙简单散点图X图7-4第五步:运行得到:2DD0.D-15D0.0-1000.0-5g.0300M.D40000.0£0000.0eofflooiDtmo.o国民生产总值图7-5根据散点图初步判:国民生产总值与保费收入呈非线性关系.2.计算不同模型的样本拟合优度,并据此 选择拟合效果最好的模型.10第一步:选择菜单分析一回归一曲线估计,在曲线估计对话框中,将候选 变量框中的保费收入添加到因变量,将 国民生产总值 添加到自变量,依次选择 模型复选框中的线性、二次项、对数、指

17、数 等模型.图7-6第二步:依次得到运行结果图 7-7 直线 R 2=0.94111保收入一二次图7-8二次曲线R2=0.973保费收入图 7-9 复合 R2=0.78912保於收入图 7-10 增长 R2=0.789O已;刖 一增支保费收入o已因!物三次13保费收入图 7-12 对数 R2=0.772对数保费收入图 7-13 S 曲线 R2=0.946o巳以过1-S14保费收入律政图 7-14 指数 R2=0.789保费收入C巳利摒一反向15保费收入.已门加I¥图 7-16 哥 R2=0.015保费收入o已到划I fkgtfttic16通过比照上述模型,与观测点变化趋势拟合最好的是

18、三次曲线 模型,三次曲线的拟合优度最大R2=0.990,也说明它是拟合效果 最好的模型.或者在第一步中,将所有模型的复选框全部选定,得到运行结果:模型汇总和参数估计值因变量:保费收入方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.941316.551120.000-154.292.019对数.77267.889120.000-4576.241508.979倒数.48118.572120.000966.105-6138735.913二次.973336.771219.00023.846.0031.756E-7三次.990617.659318.000-166.430.029-5

19、.364E-75.022E-12复合.78974.788120.00023.3151.000嘉.972700.929120.0002.521E-61.796S.946347.778120.0007.069-27064.140增长.78974.788120.0003.1495.450E-5指数.78974.788120.00023.3155.450E-5Logi.78974.788120.000.0431.000stic自变量为 国民生产总值亿元1725KJU0,O4QD00Q5gOOQ0WOTD 1000OT.0国民生产总值亿元保欲收入2500.0-21»0.0-15D0.0-1D0

20、0.D-&00 0-I- 比 现胜做向为次!口 .上匕 机 巳泞V:用一二他8增指小同样,通过比照上述模型,与观测点变化趋势拟合最好的是三次曲线模型, 三次曲线的拟合优度最大R2=0.990,也说明它是拟合效果最好的模型.3.求解保费收入依国民生产总值的估计回归方程.第一步:选择菜单分析一回归一曲线估计,在曲线估计对话框中,将候选 变量框中的保费收入添加到因变量,将 国民生产总值 添加到自变量,选择 模型 复选框中的立方模型18图 7-18第二步:单击曲线估计对话框中的 保存按钮,在曲线估计:保存对话框中, 选择预测值、残差、预测区间 复选框图 7-19第三步,运行结果表7-4 模型汇总RR方调整R方估计值的标准误.995.990.98964.883自变量为国美生产总值.R2为0.990非常接近1,说明模型的拟合效果非常好从表中可知因变量与自变量的三次回归模型为:y=-166.430 + 0.029x -表7-5系数未标准化系数标准化系数tSig.B标准误Beta国民生产总值.029.0051.5065.836.000国民生产总值* 2-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论