第六章多重共线性_第1页
第六章多重共线性_第2页
第六章多重共线性_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章多重共线性前面两章所讲的异方差性和自相关性都是表现在随机误差项中的,我们下面所讲的多重共线性讨论的是模型中的解释变量违背基本假设的问题。回忆以下我们在讲多元线性回归模型时,基本假定与简单线性回归模型不同的是哪一点?——就是无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。这一章我们讨论的多重共线性就是当解释变量违背了这一条基本假定的情形。第一节多重共线性概念先看一个实例:我们研究某个地区家庭消费及其影响因素。我们除了引入收入X1以外,还引入了消费者的家庭财产X2作为第2个解释变量。根据抽样数据回归得到以下结果:YA=24.7747+0.9415X1-0.0424X2t=(3.6690)(1.1442) (-0.5261)2 2——R2=0.9635 R2——=0.9531F=92.4020这一回归结果说明什么?1、 可决系数和修正可决系数都很理想2、F统计量高度显著,说明 X1、X2联合对Y的影响显著3、 各变量参数的t检验都不显著,不能否定等于零的假设4、 财产变量的系数竟然与预期的符号相反。为什么会出现这样的结果呢?再看一个例子:分析某地区汽车保养费用支出与汽车的行程数以及汽车拥有的时间建立模型,通过样本数据估计得: YA=7.29+27.58X1-151.15X2t=(0.06)(0.958) (-7.06)R2——=0.946 F=52.53这个结果修正可决系数理想,F检验也显著,但X的T检验不显著,X2的T检验虽然显著,但系数符号与经济意义不符。为什么也出现这种结果?一、 多重共线性的概念:如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。完全共线性与不完全共线性表示的是一种线性相关程度。比如我们在第一个例子中,发现可支配收入与家庭财富之间有明显的共线性关系,他们的相关系数高达 0.9989,第二个例子中汽车的行程数与拥有汽车的时间的相关系数也为0.9960,表明两个变量之间存在一种不完全的线性相关关系,我们可以认为他们之间有程度很高的多重共线性 .不存在多重共线性只说明解释变量之间没有线性关系,而不排除他们之间存在某种非线性关系。二、 产生多重共线性的原因1、 许多经济变量在随时间的变化过程中往往存在共同的变动趋势。这就使得它们之间容易产生多重共线性。例如在经济繁荣时期,收入、消费、储蓄、投资、就业都趋向于增长;在经济衰退时期,都趋向于下降。如果将这些变量作为解释变量同时引入模型,则它们之间极有可能存在很强的相关性。时间序列中的这种增长因素和趋向因素是造成多重共线性的主要根源2、 用截面数据建立回归模型时,根据研究的具体问题选择的解释变量常常从经济意义上存在着密切的关联度。比如P69以某一行业的企业为样本建立企业生产函数模型,以产出量为解释变量,选择资本、劳动、技术等投入要素为解释变量。而这些投入要素的数量往往与产出量呈正比,产出量高的企业,投入的各种要素都比较多,这就使得投入要素之间出现线性相关性。3、 在模型中大量采用滞后变量也容易产生多重共线性。因为滞后变量从经济性质来看与原来的变量无区别,只是时间上有所不同,从经济意义上这些变量之间的关联度比较紧密。P69一般来讲,解释变量之间存在多重共线性是难以避免的,所以在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的程度。当多重共线性程度过高时,给最小二乘估计量带来严重的后果。因此,我们追求的也是使多重共线性的程度尽可能地减弱。第二节多重共线性产生的后果一、 OLS估计式变得不确定或不精确当解释变量完全线性相关时——OLS估计式不确定从偏回归系数意义看:在X1和X2完全共线性时,即X1=a0+a1X2,无法保持X2不变,去单独考虑X1对Y的影响。另外,从OLS估计式看:可以证明3"=0/0,32人=0/0在微积分中,我们知道这种情况称为不定型,即当XI、X2完全共线性条件下,参数的估计值是不确定的。从估计量的方差看:将X1=a0+a1X2代入模型参数估计量的方差的表达式中,可以得到:Var(31A)=g,Var(32A)=^。即参数估计值的方差无穷大,也不是确定的。1、当解释变量为不完全多重共线性时一一OLS估计式不精确在实际经济问题中,完全共线性是一种不常见的极端情况,大多数情况下是解释变量之间存在不完全的共线性,虽然可以得到普通最小二乘法参数估计量,但参数估计量的方差变得很大,而且会随共线性程度的提高而增大。从而导致估计值不精确。2、 参数估计量经济含义不合理如果两个解释变量具有线性相关性,那么它们中的一个变量可以由另一个变量表征,这时它们前面的参数并不反映各自与被解释变量之间的结构关系,而是反映他们对被解释变量的共同影响。所以,各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如,本来应该是正的,结果恰是负的。3、 变量的显著性检验失去意义随着方差的增大,意味着t值将会变小,使得本身在经济意义上对被解释变量影响很强的变量被判定为不显著。4、 区间估计与模型的预测精度降低。注意:如果研究目的仅在于预测 Y,而解释变量X之间的多重共线性关系的性质在未来将继续保持(前提条件),这时多重共线性可能并不是严重的问题,只要可决系数高, F检验显著就可行。但要是分析经济结构就不行了,第三节多重共线性的检验(判断)在多元线性回归模型中,由于多重共线性是普遍存在的,造成的后果也比较复杂,因此,对多重共线性的检验缺少统一的准则。下面介绍几种简单容易操作的办法:一、 利用解释变量之间的相关系数判断由于多重共线性表现为解释变量之间具有相关关系,对于二个解释变量的模型,利用解释变量样本观测值的散点图,或者计算二者的相关系数r,Irl越接近1,二者的线性关系越强;对于有两个以上解释变量的模型,可用两两变量的相关系数矩阵来判断。二、 利用可决系数与偏回归系数的显著性检验去判断当可决系数较高,F检验显著,但偏回归系数的显著性检验不显著时,通常存在多重共线性。三、 利用解释变量之间的辅助回归及检验判断因为解释变量之间存在多重共线性可以看做是一个解释变量对其余解释变量的近似线性表出,找出这种线性表达式,可以逐次将每个解释变量作为被解释变量对其他解释变量进行回归——称为辅助回归,分别估计其参数,计算可决系数、作 F检验。若F检验显著,认为该变量与其他变量存在多重共线性。若不显著,则认为该变量与其他变量不存在严重的多重共线性。第四节多重共线性的补救既然当模型出现严重多重共线性时,会产生严重后果,但由于经济系统的复杂性,多重共线性的表现往往比较顽固,欲将多重共线性消除干净几乎是不可能的,只能选用合适的方法减弱影响。目前,常用的方法有以下几种:一、 增大样本容量在具体建立计量经济模型时,如果变量的样本数据太少, 很容易产生多重共线性。而且,多重共线性的后果主要是方差变大, Var(31A)=c2/工X1i2(1-r2)当r确定时,增大样本容量,工X1i2就越大,使方差变小,从而减轻多重共线性的影响。但是,增大样本容量只能减轻多重共线性的影响,不能根本解决它。而且增大样本容量在实际操作时都十分困难。二、 利用先验信息先验信息:在此之前的研究成果所提供的信息。即知道某些变量之间满足一定的关系利用某些先验信息可把有共线性的变量组合成新的变量,从而消除多重共线性。比如生产函数为:Qt=ALt“Kt$ut,利用对数变换,转换为线性模型 InQt=lnA+alnLt+3InKt+ut通常资金投入量K和劳动力投入量L是高度相关的。但如果已知规模报酬不变, 即a+$=1,则将此代入模型,可以消除多重共线性。还可以直接略去不重要的解释变量试一试,或者采用截面数据与时间序列数据结合、或者变换模型的形式等等方法,减轻多重共线性的影响。三、逐步回归法——最好的方法基本思想:用逐步回归法发现产生共线性的解释变量,并将其剔除,从而减少多重共线性的影响。1、将被解释变量Y逐步对每一个解释变量Xi分别进行回归,LSYCXi;2、比较每个回归方程的可决系数 Ri2;3、选出Ri2最大的解释变量作为下一步回归的基础,如 X5;4、 将被解释变量逐步对上一步选出的解释变量以及其它解释变量分别进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论