计量经济学实验五-多重共线性的检验与修正-完成版_第1页
计量经济学实验五-多重共线性的检验与修正-完成版_第2页
计量经济学实验五-多重共线性的检验与修正-完成版_第3页
计量经济学实验五-多重共线性的检验与修正-完成版_第4页
计量经济学实验五-多重共线性的检验与修正-完成版_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、习题1.下表给出了中国商品进口额Y、国内生产总值GDP、消费者价格指数CPI。年份商品进口额(亿元)国内生产总值(亿元)居民消费价格指数(1985=100)19851257.88964.410019861498.310202.2106.519871614.211962.5114.319882055.114928.3135.819892199.916909.2160.219902574.318547.9165.219913398.721617.8170.819924443.326638.1181.719935986.234634.4208.419949960.146759.4258.619951

2、1048.158478.1302.8199611557.467884.6327.9199711806.574462.6337.1199811626.178345.2334.4199913736.482067.5329.7200018638.889468.1331.0200120159.297314.8333.3200224430.3105172.3330.6200334195.6117251.9334.6资料来源:中国统计年鉴,中国统计出版社2000年、2004年。请考虑下列模型:(1)利用表中数据估计此模型的参数。解:t= (-11.32) (9.93) (-3.415)(2)你认为数据中有

3、多重共线性吗?多重共线性的检验1)综合统计检验法若 在OLS法下:R2与F值较大,但t检验值较小,则可能存在多重共线性。2)简单相关系数检验在Eviews软件命令窗口中键入:COR GDP CPI 或在包含所有解释变量的数组窗口中点击ViewCorrelations,其结果如图所示。由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间是高度相关的。GDPCPIGDP1.0000000.941303CPI0.9413031.0000003)判定系数检验法当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。在Eviews软件命令

4、窗口中键入:LS GDP C CPI 得到相应的回归结果,分析方程对应的F值和T值,来检验这些变量间是否相关以及相关联程度。对应的回归结果如下图所示。上述回归方程的F检验值非常显著,方程回归系数的T检验值表明:GDP与CPI的T检验值较大,变量之间相关。 (3)进行以下回归:根据这些回归你能对数据中多重共线性的性质说些什么?解:进行ls检验,得到如下的三个结果:t= (-9.143) (30.6594)t= (-4.064) (14.63)t= (0.334) (24.21)数据中多重共线性的性质:单个解释变量也可以解释被解释变量,但是本题的两个解释变量之间的相关性较大,若在同一个线性方程中使

5、用就会造成多重共线性。(4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?解:应该考虑。此时并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已经失去了应有的经济含义。所以不能根据变量的参数显著及F检验的显著来判断没有共线性的情况出现。如果模型的经济意义明显不合理,我们就要考虑是否有多重共线性的问题出现并予以相应的解决方法来现出多重共线性的影响。2. 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消

6、费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:年份能源消费国民总收入工业建筑业交通运输邮电人均生活电力消费能源加工转换效率yX1X2X3X4X5X6X71985766828989.18964.43448.7417.9406.921.368.291986808501

7、0201.410202.23967.0525.7475.623.268.3219878663211954.511962.54585.8665.8544.926.467.4819889299714922.314928.35777.2810.0661.031.266.5419899693416917.816909.26484.0794.0786.035.366.5119909870318598.418547.96858.0859.41147.542.467.2199110378321662.521617.88087.11015.11409.746.965.9199210917026651.9266

8、38.110284.51415.01681.854.666199311599334560.534634.414143.82284.72123.261.267.32199412273746670.046759.419359.63012.62685.972.765.2199513117657494.958478.124718.33819.63054.783.571.05199613894866850.567884.629082.64530.53494.093.171.5199713779873142.774462.632412.14810.63797.2101.869.23199813221476

9、967.278345.233387.95231.44121.3106.669.44199913011980579.482067.535087.25470.64460.3118.170.45200013029788254.089468.139047.35888.05408.6132.470.96200113491495727.997314.842374.66375.45968.3144.670.412002148222103935.3105172.345975.27005.06420.3156.369.78资料来源:中国统计年鉴2004、2000年版,中国统计出版社。要求:(1) 建立对数线性多

10、元回归模型解:(2) 如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?解:存在多重共线性,ls的结果显示R2与F值较大,但t检验值较小,考虑多重共线性的存在。(3) 如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。解:逐步回归:1)、cor lnx1 lnx2 lnx3 lnx4 lnx5 lnx6 lnx7得到7个变量之间的相关系数:10.9999880.9995570.9968860.9928160.9949290.6318470.99998810.9996430.9970180.9923590.9946210.6347530.999557

11、0.99964310.9980620.9896160.9924820.6457440.9968860.9970180.99806210.9849930.9865380.6441970.9928160.9923590.9896160.98499310.9971970.5820550.9949290.9946210.9924820.9865380.99719710.6071650.6318470.6347530.6457440.6441970.5820550.6071651从中可以看出,除lnx7与lnx1 lnx2 lnx3 lnx4 lnx5 lnx6的相关系数不超过0.93外,其余各变量两两

12、之间的相关系数均超过了0.93,说明这些变量均高度相关。2)、建立基本的一元线性方程:被解释变量对每一个解释变量进行初始回归(得到回归的结果如图所示),选取拟合优度最高的首先进入方程;根据经济理论分析和回归结果,可知中国能源消费总量Y和国内生产总值(亿元)X1关联度最大,所以建立基本的一元回归方程:Ls lny c lnx1: Ls lny c lnx2:Ls lny c lnx3:Ls lny c lnx4:Ls lny c lnx5:Ls lny c lnx6:Ls lny c lnx7:3)、将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程(如表所示):CLnx1Lnx2Lnx3

13、Lnx4Lnx5Lnx6Lnx7R2 lnY=f(lnX1)9.1680.2360.9607t值73.191419.79lnY=f(lnX1,lnX2)8.90473.259-2.9960.9645t值37.131.3529-1.255lnY=f(lnX1,lnX3)8.2111.455-0.637-0.53670.9672t值12.0890.5-0.198-1.08990.9673lnY=f(lnX1, lnX4)9.033.448-3.220.0320.9646t值14.8361.313-1.210.2256lnY=f(lnX1, lnX5)8.58534.5019-4.1667-0.05

14、730.9648t值10.2881.134-1.0915-0.4007lnY=f(lnX1, lnX6)7.4466.4753-5.95-0.30740.9707t值8.512.208-2.108-1.725lnY=f(lnX1, lnX7)12.1190.1350.1162-0.740.9672t值4.040.0350.031-1.08讨论:第一步:在初始模型中加入lnx2,模型拟合优度提高,但变量未通过t检验;第二步:去掉lnx2,引入lnx3,模型拟合优度提高了,但是变量的显著性均未通过t检验,且参数的符号不合理(从直观上看,工业增加值越大,中国能源消费总量也应该越大,lnx3前的系数应

15、该为正数);第三步:去掉lnx3,引入lnx4,不止模型的拟合优度降低了,变量的显著性也未通过检验,lnx3前的系数符号仍然不合理;第四步:去掉lnx4,引入lnx5,模型的拟合优度稍微提高了一点,但是变量均未通过检验,变量的符号仍然不合理;第五步:去掉lnx5,引入lnx6,模型的拟合优度提高了,但是变量的显著性未通过t检验;第六步:去掉lnx6,引入lnx7,模型的拟合优度未明显提高,且变量的显著性均未通过t检验。第二步到第六步表明,lnx2到lnx7是多余的,且通过7个变量的相关系数表可以看出,这些变量之间高度相关。因此,最终的中国能源消费总量的函数关系式为:3.经济理论指出,家庭消费指

16、出Y不仅取决于可支配收入,还决定于个人财富,即可设定如下回归模型: 试根据下表的资料进行回归分析,并说明估计的模型是否可靠,给出你的分析。 单位: 元编号编号170080081006115018001876026501000100907120020002052039001200127308140022002201049501400142509155024002435051100160016930101500260026860解:(1)、首先画出Y与两个变量的线性图:(2)、进行ls估计:(3)、ls的结果显示R2与F值较大,但t检验值较小,考虑多重共线性的存在。(4)、进行逐步回归以消除多重共线性:1)、逐步回归:cor x1 x2得到2个变量之间的相关系数:10.9985770.9985771从中可以看出,两变量之间的相关系数超过了0.93,说明这两个变量高度相关。2)、建立基本的一元线性方程:被解释变量对每一个解释变量进行初始回归(得到回归的结果如图所示),选取拟合优度最高的首先进入方程;根据经济理论分析和回归结果,可知中国能源消费总量Y和国内生产总值(亿元)X1关联度最大,所以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论