项目二 相关与回归分析案例及练习要求_第1页
项目二 相关与回归分析案例及练习要求_第2页
项目二 相关与回归分析案例及练习要求_第3页
项目二 相关与回归分析案例及练习要求_第4页
项目二 相关与回归分析案例及练习要求_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、项目二:相关与回归分析一、实验目的1、掌握Pearson简单相关分析方法,并根据相关系数判断两变量的相关程度。2、熟悉偏相关系数、Kendall tau-b和Spearman等级相关系数的计算方法,理解其区别与联系。3、掌握一元与多元回归分析方法,对回归模型估计和检验,并对结果进行分析。4、了解曲线回归分析方法。并对回归结果进行分析。二、实验内容和要求1、现有杭州市区 19782014 年的 GDP、城镇居民年人均可支配收入和年人均消费支出的数据资料(example1.sav),如下:表5-1 杭州市区GDP、年人均可支配收入、人均消费支出和CPI指数年份GDP(亿元)人均可支配收入(元)人均

2、消费支出(元)定基CPI指数(%)1978 14.1995338301100.1197916.7206396 365100.5198020.8220521 491101.3198122.9243540 513103.3198224.8297532 532105.4198328.2171578 535107.6198435.3781729 679110.9198544.85741026 908130.0198651.363911691072137.8198760.52341260 1118152.3198870.84741565 1515185.7198977.22081764 1615218.

3、7199089.64961985 1685228.81991109.66282128 1894245.91992141.32872580 2296271.51993208.65713525 3183329.61994278.83145249 4559400.51995369.779463015559466.51996472.737772066095515.51997541.426578966766550.11998590.572684657235560.01999631.733590857424562.22000711.158696687790566.720011226.08911089689

4、68563.920021404.2278117789215557.120031664.7332128989949.76554.320042036.27381456511212.78568.220052349.54591660113438577.820062748.312119026.8614471.74584.820073273.884221689.3614895.75605.220083813.983424103.5816719.10634.920094069.868726863.9318594.75626.020104740.77883003520219650.420115589.8574

5、3406522642681.620126213.24863751122800698.720136639.86093931024833716.120149201.16004463232165730.5数据来源:历年杭州统计年鉴和2014年杭州市国民经济和社会发展统计公报。要求:(1) 求人均可支配收入、GDP、人均消费性支出与消费价格指数的双变量Pearson相关系数。相关性incomebcpiincomePearson 相关性1.841*显著性(双侧).000N3737bcpiPearson 相关性.841*1显著性(双侧).000N3737*. 在 .01 水平(双侧)上显著相关。 相关性g

6、dpbcpigdpPearson 相关性1.751*显著性(双侧).000N3737bcpiPearson 相关性.751*1显著性(双侧).000N3737*. 在 .01 水平(双侧)上显著相关。相关性payoutbcpipayoutPearson 相关性1.873*显著性(双侧).000N3737bcpiPearson 相关性.873*1显著性(双侧).000N3737*. 在 .01 水平(双侧)上显著相关。(2) 画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并给出方程的估计标准误差。模型汇总模型RR 方调整 R 方标准 估计的

7、误差1.994a.989.988912.186a. 预测变量: (常量), income。(3) 求人均可支配收入倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。模型汇总模型RR 方调整 R 方标准 估计的误差1.985a.969.9692250.284a. 预测变量: (常量), gdp。(4) 求人均消费支出倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。模型汇总和参数估计值因变量: payout方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1线性.952698.757135.0002500.6903.553自变量为 gdp。模型汇总模型RR 方调

8、整 R 方标准 估计的误差1.976a.952.9511865.083a. 预测变量: (常量), gdp。(5) 若将GDP的单位改为万元,再做第3和第4题,观察单位变化对回归方程的影响。无影响(6)求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。(7)求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。(8)以定基居民消费价格指数为控制变量,对居民年人均可支配收入和消费支出进行偏相关分析。(9)计算居民年人均消费支出倚GDP,居民年人均可支配收入和消费价格指数的多元线性回归方程,确定最终模型并对估计结果进行解释。*(10)求人均可支

9、配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:一个变量Y对另一个变量X的弹性系数E定义为:E=Y的增长率÷X的增长率)。2、由表5-2所示的2013年浙江省各地级市GDP、第三产业就业人数数据资料(example2.sav),进行Kendall tau-b和Spearman等级相关分析。表5-2 2013年浙江省11地市经济数据 单位:亿元/万人地区杭州宁波嘉兴湖州绍兴舟山GDP8343.527128.873147.661803.153967.29930.85三产就业人数288.93200.44101.8263.52114.0030.98地区温州金华衢州台州丽水-G

10、DP4003.86 2958.781056.573153.34983.08-三产就业人数259.56113.5140.14147.1450.54-数据来源:2014年浙江统计年鉴。练 习一、请打开数据文件exercise1.sav,该数据文件是有关浙江省人均可支配收入、服务业产值等基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。1、Pearson线性相关分析:计算城镇居民人均可支配收入、地区生产总值、服务业产值和服务业就业人数的Pearson线性相关系数和sig值,并判断变量间的相关程度。表1 双变量间的Pearson线性相关系数居民人均可支配收入地区生产总值服务业产值服务

11、业就业人数居民人均可支配收入地区生产总值服务业产值服务业就业人数相关性城镇居民可支配收入地区生产总值服务业产值服务业城镇就业人数城镇居民可支配收入Pearson 相关性1.995*.990*.996*显著性(双侧).000.000.000N30303030地区生产总值Pearson 相关性.995*1.998*.997*显著性(双侧).000.000.000N30303030服务业产值Pearson 相关性.990*.998*1.995*显著性(双侧).000.000.000N30303030服务业城镇就业人数Pearson 相关性.996*.997*.995*1显著性(双侧).000.000

12、.000N30303030*. 在 .01 水平(双侧)上显著相关。相关程度判断: 各项Sig<0.01,表明在置信度99%下,相关系数在0.990到0.998之间,高度相关 2、偏相关分析:以地区生产总值为控制变量,计算双变量的偏相关系数和sig值,并将计算结果填入下表。居民人均可支配收入服务业产值服务业就业人数居民人均可支配收入服务业产值服务业就业人数相关性控制变量城镇居民可支配收入服务业产值服务业城镇就业人数地区生产总值城镇居民可支配收入相关性1.000-.464.497显著性(双侧).011.006df02727服务业产值相关性-.4641.000-.002显著性(双侧).011

13、.993df27027服务业城镇就业人数相关性.497-.0021.000显著性(双侧).006.993.df272703、一元线性回归分析(1)建立居民人均可支配收入倚服务业产值的直线回归方程,将计算结果填入下表:表2 居民人均可支配收入的一元线性回归回归系数T值P值常数项3205.9777.8140.000服务业产值2.05036.9120.000得到的线性回归方程: Y=3205.977+2.050X 。(2)分析回归模型的判别系数及其含义: P值等于0,小于0.05,表明拟合效果显著。 (3)回归方程的经济含义是,服务业产值每增加1亿元,_ 城镇居民可支配收入增加2.050元。 _ (

14、4)回归方程整体显著性检验 sig<0.05,整体拟合效果显著 。4、多元线性回归分析(1) 建立以居民人均可支配收入为因变量,外商直接投资和服务业就业人数为自变量的直线回归方程,将计算结果填入下表:表3 居民人均可支配收入的多元线性回归回归系数T值P值共线性统计量容差VIF常数项-5714.828-7.241.000服务业就业人数38.60710.826.000.04323.335外商直接投资34.2401.886.070.04323.335得到的线性回归方程: 居民可支配收入=-5714.828+38.607*服务业就业人数+34.240*外商直接投资 。(2)分析回归模型的判别系数

15、及其含义: 服务业就业人数的P值小于0.05,拟合效果显著,外商直接投资的P值大于0.05,效果不显著。 (3) 假设服务业就业人数不变时,外商直接投资每增加1万美元,_ 居民可支配收入增加34.240元。 _ (4) 回归方程整体显著性检验 表二中的sig小于0,。05,整体拟合效果显著。 (5)回归方程的多重共线性诊断结果 。(6)对模型实施逐步向后回归,请写出回归估计方程和主要诊断结果: 。5、曲线回归分析(1)曲线回归的系数表表4 居民人均可支配收入的二次回归回归系数标准误T值P值常数2037.735320.8326.351.000服务业产值2.824.12622.371.000服务业

16、产值2-4.669E-5.000-6.389.000(2) 以城镇人均可支配收入为因变量,服务业产值为自变量,估计的二次方程是 居民人均可支配收入=2037.735+2.824*服务业产值+(-4.669E-005)*(服务业产值)2 (3) 二次方程的判定系数R2= 0.992 ,标准误为 1097.108 ,而对比原线性回归时,R2= 0.980 ,标准误差为 1707.499 ,因此,二次方程比线性回归的拟合效果更 好 。(4) 方差分析结果,F值为 1670.577 ,显著性水平为 0.000 ,方程具有统计显著性。6、等级相关分析请打开数据文件exercise2.sav,该数据文件是

17、2013年浙江省各地市GDP和年末高校在校生人数的基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。表5 2013年浙江省11地市的GDP和高校在校生人数 单位:亿元/人地区杭州宁波嘉兴湖州绍兴舟山GDP8343.527128.873147.661803.153967.29930.85高校在校生人数47182014895463731266737753223301地区温州金华衢州台州丽水-GDP4003.862958.781056.573153.34983.08-高校在校生人数7915881281129373201839750-数据来源:2014年浙江统计年鉴。按GDP规模排序后,结果见下表: 表6 2013年浙江省11地市的GDP和高校在校生人数排序表 地区舟山丽水衢州湖州金华嘉兴GDP排序123456高校在校生人数251396地区台州绍兴温州宁波杭州-GDP排序7891011-高校在校生人数4781011-(1) GDP与高等学校在校生人数的Pearson线性相关系数为 0.845 ,显著性水平P= 0.001 ,因此GD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论