计量经济学7多重共线性_第1页
计量经济学7多重共线性_第2页
计量经济学7多重共线性_第3页
计量经济学7多重共线性_第4页
计量经济学7多重共线性_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 多重共线性一、多重共线性问题二、多重共线性的后果三、多重共线的检验四、多重共线性的修正五、案例分析一、多重共线性问题基本假定: 1、u零均值。所有的ui均值为0,E(ui)=0。 2、u同方差。Var(ui)=2,i=1,2,n 如果假定6不成立,即解释变量X1,X2,XP存在线性关系,即存在不全为零的常数 这种关系称为完全多重共线性,实际上更多的情况是,解释变量间存在不完全的线性关系:即存在不全为零的数:假定1 0,其中vi 为随机项。我们把这种关系称为不完全多重共线性。由于经济变量自身的性质,多重共线性或强或弱,普遍存在的。多重共线:解释变量之间存在完全的或近似的线性关系。解释变量

2、存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全(近似)多重共线。多重共线性产生的原因: 1、经济变量之间的内在联系引起多重共线 2、经济变量在时间上有同方向变化的趋势 3、模型中引入滞后变量引起多重共线。1.完全多重共线性: 以两个解释变量的回归模型为例,假定回归模型为:如果采用OLS估计,则有:二、多重共线性的后果根据最小平方和原则,并求解正规方程组,可得到: 如果X1与X2存在完全共线性,即 则:因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无限大。2.不完全多重共线性 假定X1,X2 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机

3、项。则 显然,当解释变量X1、X2之间的相关系数 r12 的绝对值越大,共线性程度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大,方差以更大的幅度增加。 VIF(Variance Inflation Factor)称为方差膨胀因子,一般如果某变量的VIF大于50 以上,说明模型存在多重共线性。多重共线性的后果: 1、参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准确度和置信区间)。 2、参数估计值的标准差增大,使得 t 检验值变小,增大了接受H0,舍弃对因变量有显著影响的变量。 3、尽管t 检验不显著,但是R2仍可能非常高。 4、OLS估计量对观测值的轻微变化相当敏

4、感。三、多重共线的检验1、利用解释变量之间的拟合优度(判定系数)检验法每次以一个解释变量对余下的P-1个解释变量做回归,即建立P个回归方程:2、不含某个解释变量Xj的拟合优度(判定系数)检验法将Y对全部解释变量X1,X2,XP做回归,得回归方程3、R2、F、t检验结果进行综合分析检验法无多重共线性: R2、F、t检验均显著存在多重共线性: R2、F检验很显著,但t检验不全显著(一般是不显著的Xj与显著的Xi存在共线性。)四、多重共线性的修正 如果发现解释变量之间存在高度得多重共线性,就必须消除这种多重共线性的影响,保证模型的正确性和估计的有效性。有以下几种解决方法。 1、剔除不重要的变量 把回

5、归模型中引起多重共线性,而可以剔出对因变量的影响不大的变量。但是变量的剔除可能导致模型的设定偏误。 已知X1和X2 之间高度共线。根据先验信息,确定2=21,带入模型后可得:2、利用先验信息 假定对回归模型: 例如:C-D生产函数 ,K与L高度相关。已知规模收益不变,则+=1。生产函数的双对数模型可变为:可以对这一新回归方程进行估计。3、变换模型的形式 如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模型模型的形式。4、增加样本容量 如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以二元

6、回归方程为例,根据前面的结果,参数估计值的方差为:当样本容量增大时, 增大,方差将减小,可以提高参数估计的精度。5、横截面数据与时间序列数据并用 如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量,在消除多重共线性影响下估计因变量与剩余变量间的回归式。 例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消费者收入的时间序列数据。设定回归式:新的回归式中消除了多重共线性的影响。 由于在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此,直接估计上面的回归式将存在问题。由于在同一

7、式点上,价格与收入的相关程度不高,可以先利用截面数据估计出收入弹性 ,再利用这一估计结果修改原回归式,变为:6、利用时间序列数据的差分或离差进行估计 如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不一定相关。因此利用差分进行回归能降低多重共线性的程度。7、逐步分析估计法 先对设定的总体回归模型用普通最小二乘法进行估计,并检验总体回归模型的效果; 若经检验后总体回归方程显著,再计算解释变量之间的相关系数,分析多重共线的程度; 若多重共线相当严重,则进一步将被解释变量对每一个解释变量做回归,并根据经济理论和实际经验及它们的判定系数,从中选择一个最合理的作为基本回归方程式; 在上

8、述这个最合理的基本回归方程式中,逐步插入新的解释变量进行回归,并对其结果进行检验,直到变量插入完为止。五、案例分析随机解释变量问题Random Explanatory Variables一、随机解释变量问题二、随机解释变量的后果三、工具变量法四、解释变量的内生性检验五、案例 基本假设:解释变量X1,X2,Xk是确定性变量。 如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。 假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况: 1、随机解释变量问题 (2) 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相

9、关。 (3) 随机解释变量与随机误差项同期相关(contemporaneously correlated)。 (1) 随机解释变量与随机误差项独立(Independence)2、实际经济问题中的随机解释变量问题 在实际经济问题中,经济变量往往都具有随机性。 但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。 于是随机解释变量问题主要表现于:用滞后被解释变量作为模型的解释变量的情况。 例如:(1) 耐用品存量调整模型耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定: Qt=0+1It+2Qt-1+t t=1,T如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt

10、-1只与t-1相关,与t不相关,属于上述的第2种情况。(2) 合理预期的消费函数模型Ct-1是一随机解释变量,且与 (t-t-1)高度相关(为什么?)。属于上述第3种情况。二、随机解释变量的后果 计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。 下面以一元线性回归模型为例进行说明。 1、随机解释变量与随机误差项相关图 (a)正相关 (b)负相关 拟合的样本回归线可能低估截距项,而高估斜率项。 拟合的样本回归线高估截距项,而低估斜率项。2、如果X与相互独立,OLS参数估计量仍然是无偏、一致估计量。 3、如果X与同

11、期不相关,异期相关,得到的参数估计量有偏、但却是一致的。 kt的分母中包含不同期的X, kt与t相关4、如果X与同期相关,得到的参数估计量有偏、且非一致。 前面已经证明。1、工具变量的选取工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。选择为工具变量的变量必须满足以下条件:与所替代的随机解释变量高度相关;Cov(X,Z)0与随机误差项不相关;与模型中其它解释变量不相关,以避免出现多重共线性。三、工具变量法 Instrument variables2、工具变量的应用多元线性模型的正规方程组X2为与相关的随机变量能否说“用工具变量代替了模型中的随机解释变量”?

12、(不能)能否说“其它解释变量用自己作为工具变量”?(能)Z作为X2的工具变量 这种求模型参数估计量的方法称为工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量(instrumental variable (IV) estimator)。工具变量矩阵3、工具变量法估计量是一致估计量 一元回归中,工具变量法估计量为(1)在小样本下,工具变量法估计量仍是有偏的。 4、几个重要的概念 (2)工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。(3)如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。

13、但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果。(4)OLS可以看作工具变量法的一种特殊情况。 (5)如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(Generalized Method of Moments, GMM)。 在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。 工具变量法是GMM的一个特例。 (6)要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。 5、工具变量IV 案例:居民总消费模型以居民消费总额JMXF为被解释变量;以GDP和JMXF(-1)为解释变量;进行OLS估计。JMXF(-1)为随机解释变量,且与随机误差项相关;以政府消费ZFXF作为工具变量,进行IV估计;以政府消费ZFXF和资本形成ZBXC作为工具变量,进行GMM估计。数据OLS估计IV估计GMM估计估计结果OLS: JMXF = 1001.1648 + 0.1368*GDP + 0.7239*JMXF(-1)IV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论