计量经济学:第七章 多重共线性_第1页
计量经济学:第七章 多重共线性_第2页
计量经济学:第七章 多重共线性_第3页
计量经济学:第七章 多重共线性_第4页
计量经济学:第七章 多重共线性_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 多重共线性 多重共线性定义 多重共线性影响 多重共线性确认和解决方法 应用多重共线性定义完全共线性 多元回归模型的假设之一是模型中任何自变量间不存在精确的线性关系,若这种线性关系存在,则认为自变量是完全共线的或存在完全共线性。如: 表示每周平均学习的小时数 表示每天平均学习的小时数显然 ,所以两个变量是完全共线的。完全共线性易发现,因为它会使参数的最小二乘估计求不出完全共线性的后果用离差形式正规方程若两个变量存在完全共线性,则参数没有唯一解。多重共线性定义 多重共线性是指两个或多个自变量之间存在高度相关。 存在多重共线性时,仍然能获得参数的最小二乘估计,但很难对系数做出合理的解释。多重

2、共线性产生原因经济变量间通常存在共同的变化趋势经济变量间往往存在着密切的关联度模型中采用滞后变量解释变量选择不当多重共线性影响多重共线性影响 存在多重共线性时,虽然估计量还是最优线性无偏估计 (BLUE),但标准误通常较高,导致t统计量值较低和不显著。两个自变量时多重共线性影响(续)是第j个解释变量对模型中其它解释变量作辅助回归模型时的决定系数。定义为方差膨胀因子例 设HOUSING为t年的动工的住房单位数量,POP是该年以百万计的人口,GNP是以十亿计的国民生产总值,INTRATE为百分制新房抵押利率。数据data41.xls,估计下面三个模型:相关系数矩阵意味高度正相关cd D:econo

3、metrics15zdataload data71.wf1group group1 gnp pop intratecor group1group1.corGNPPOPINTRATEGNP10.9903860.879361POP0.99038610.912876INTRATE0.8793610.9128761模型估计结果变量 模型(1) 模型(2) 模型(3) C -3812.93 687.90 -1315.75 (-2.40) (1.80) (-0.27)INTRATE -198.40 -169.66 -184.75 (-3.87) (-3.87) (-3.18)POP 33.82 14.90

4、 (3.61) (0.41)GNP 0.91 0.52 (3.64) (0.54)F 7.50 7.61 4.92Adj.R sq 0.371 0.375 0.348通过t统计量和F统计量可初步判断存在共线性equation eq1.ls housing c intrate popequation eq2.ls housing c intrate gnpequation eq3.ls housing c intrate pop gnpeq1.resultseq2.resultseq2.results多重共线性确认和解决方法多重共线性确认 值较高,t统计量值低解释变量间的高相关系数值通过增减变量

5、来观察回归系数的变动是否很大通过方差膨胀因子来判断,一般认为大于10时存在较为严重的共线性计算解释变量矩阵的条件数指数,超过30(20,Greene)意味着存在严重的共线性。条件数指数的一种计算方法group gr1 c gnp pop intratematrix m=convert(gr1)sym X=transpose(m)*mvector v=eigenvalues(X)scalar lammax=max(v)scalar lammin=min(v)scalar xcond=sqrt(lammax/lammin)scalar xxcond=cond(X)上例(续)方差膨胀因子计算equa

6、tion eq4.ls gnp c intrate popequation eq5.ls pop c intrate gnpequation eq6.ls intrate c pop gnpgenr vif1=1/(1-eq4.r2)genr vif2=1/(1-eq5.r2)genr vif3=1/(1-eq6.r2)show vif1show vif2show vif3 library(car) taoattach(tao) vif(lm(housingintrate+pop+gnp) intrate pop gnp 7.425353 87.978078 64.669527 XX kapp

7、a(XX,exact=T)1 236205.4R解决办法忽略着重预测;回归系数的符号和大小; 理论方面的要求等。去除变量通常去除t统计量不显著的重建模型增加样本容量其它岭回归、主成分分析前例的模型重建注:这样处理一般只能降低多重共线性而不能完全消除show cor(GNP/pop,intrate)应用 考察加利福利亚州58个县的贫困率与影响这些比率的若干因素。因变量为povrate,指生活在贫困线以下的家庭百分比。自变量如下:urb城市人口百分比famsize每个家庭的人口数量unemp失业率百分比highschl只受过中学教育的人口(25岁及以上)百分比college完成大学四年或更高教育的人口(25岁及以上)百分比medinc中等家庭收入,以千美元计数据data72.xls程序72.prg模型比较全部变量不含自变量unemp不含自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论