违背基本假定问题(2)_第1页
违背基本假定问题(2)_第2页
违背基本假定问题(2)_第3页
违背基本假定问题(2)_第4页
违背基本假定问题(2)_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、多重共线性的概念一、多重共线性的概念二、多重共线性的后果二、多重共线性的后果三、多重共线性的检验三、多重共线性的检验四、克服多重共线性的方法四、克服多重共线性的方法五、例题五、例题六、分部回归与多重共线性六、分部回归与多重共线性 4.3 4.3 多重共线性多重共线性 Multicollinearity一、多重共线性的概念一、多重共线性的概念1 1、多重共线性、多重共线性如果某两个或多个解释变量之间出现了相关性,则如果某两个或多个解释变量之间出现了相关性,则称为称为多重共线性多重共线性(Multicollinearity)。ikikiiiXXXY22110ni, 2 , 102211kiki

2、iXcXcXc02211ikikiivXcXcXc1)( kR Xperfect multicollinearity imperfect multicollinearity 2 2、实际经济问题中的多重共线性、实际经济问题中的多重共线性 产生多重共线性的主要原因:产生多重共线性的主要原因:(1 1)经济变量具有相关的共同趋势)经济变量具有相关的共同趋势(2 2)滞后变量的引入)滞后变量的引入(3 3)样本资料的限制)样本资料的限制二、多重共线性的后果二、多重共线性的后果Consequences of Multicollinearity 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计

3、量不存在如果存在如果存在完全共线性完全共线性,则,则(XX)-1不存在,无法得不存在,无法得到参数的估计量。到参数的估计量。XYYXXX1)(2 2、近似共线性下、近似共线性下OLS估计量的方差增大估计量的方差增大 近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX) -1主对角线元素较大,使参数估计值的方差增大。12)()(XXCov 以二元线性模型以二元线性模型 为例为例: 221211rxi 2221221)(iiiixxxx恰为X1与X2的线性相关系数的平方r2由于 0r2 1,故 1/(1- r2 )1。01122YXX 2221221

4、212221222122211121)(1/)()()var(iiiiiiiiiixxxxxxxxxxXX多重共线性使参数估计值的方差增大重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子方差膨胀因子(Variance Inflation Factor, VIF)当完全不共线完全不共线时, r2 =0 2121/)var(ix当近似共线近似共线时, 0 r2 12122212111)var(iixrx表表4.3.1 方方差差膨膨胀胀因因子子表表相关系数平方00.50.80.90.950.960.970.980.990.999方差膨胀因子12510202533501001000当完全

5、共线完全共线时, r2=1,)var(13 3、参数估计量经济含义不合理、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 , 这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象似乎反常的现象:例如1本来应该是正的,结果恰是负的。4 4、变量的显著性检验失去意义、变量的显著性检验失去意义存在多重共线性时存在多重共线性时参数估计值的方差与标准差变大参数估计值的方差与标准差变大容易使通过样本计算的容易使通过样本计算的t值小于临界值,值小于临界值,

6、误导作出参数为误导作出参数为0的推断的推断可能将重要的解释变量排除在模型之外可能将重要的解释变量排除在模型之外5 5、模型的预测功能失效、模型的预测功能失效 变大的方差容易使区间预测的“区间”变大,使预测失去意义。注意:注意: 除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。估计量仍具有线性性等良好的统计性质。 问题在于问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无在统计推断上无法给出真正有用的信息。法给出真正有用的信息。三、多重共线性的检验三、多重共线性的检验Dete

7、ction of Multillinearity 多重共线性检验的任务多重共线性检验的任务是: (1)检验多重共线性是否存在;)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量)估计多重共线性的范围,即判断哪些变量之间存在共线性。之间存在共线性。 多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法用于多重共线性的检验方法主要是统计方法:如判定系数检验法判定系数检验法、逐步回归检验法逐步回归检验法等。说明说明1 1、检验多重共线性是否存在、检验多重共线性是否存在 (1)(1)对两个解释变量的模型,采用对两个解释变量的模型,采用简单相关系数法简

8、单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 (2) (2)对多个解释变量的模型,对多个解释变量的模型,采用综合统计检验法采用综合统计检验法 如果在如果在OLS法下,法下,R2与与F值较大,但值较大,但t检验值较小检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。2 2、判明存在多重共线性的范围、判明存在多重共线性的范围 (1) 判定系数检验法判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行辅助回归(Auxiliary Regression),并计

9、算相应的拟合优度。 如果某一种回归Xji= 0+1X1i+2X2i+LXLi的判定系数判定系数较大,说明Xj与其他X间存在共线性共线性。 可以构造可以构造F检验:检验:2.2./(1) (1,)(1)/()jjjRkFF kn kRn k 在模型中排除某一个解释变量在模型中排除某一个解释变量Xj,估计模型,估计模型; 如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。 (2) 排除变量法排除变量法(Stepwise Backward Regression )(3)(3)逐步回归法(逐步回归法(Stepwise forward Regression) 以Y为被解释变量,逐

10、个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著如果拟合优度变化显著,则说明新引入的变量是一,则说明新引入的变量是一个独立解释变量;个独立解释变量; 如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的变量,则说明新引入的变量与其它变量之间存在共线性关系。与其它变量之间存在共线性关系。四、克服多重共线性的方法四、克服多重共线性的方法Remedial Measures of Multicollinearity 找出引起多重共线性的解释变量,将它排除。找出引起多重共线性的解释变量,将它排除。 以以逐步回归法逐步回归法得到最

11、广泛的应用。得到最广泛的应用。 注意:注意:剩余解释变量参数的经济含义和数值都发剩余解释变量参数的经济含义和数值都发生了变化。生了变化。1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量2 2、第二类方法:差分法、第二类方法:差分法 时间序列数据为样本的线性模型时间序列数据为样本的线性模型; 将原模型变换为差分模型将原模型变换为差分模型,可以有效地消除原模可以有效地消除原模型中的多重共线性。型中的多重共线性。 一般讲,对于经济数据,一般讲,对于经济数据,增量之间的线性关系增量之间的线性关系远比总量之间的线性关系弱得多。远比总量之间的线性关系弱得多。12211iikiki

12、iiXXXY 另外一个重要的意义,差分可以将非平稳序列另外一个重要的意义,差分可以将非平稳序列变为平稳序列。在第变为平稳序列。在第9章将介绍。章将介绍。差分模型随机项的序列相关问题差分模型随机项的序列相关问题3、第三类方法:减小参数估计量的方差、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较大多重共线性的主要后果是参数估计量具有较大的方差。的方差。 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没虽然没有消除模型中的多重共线性,但确能消除多重共有消除模型中的多重共线性,但确能消除多重共线性造成的后果。线性造成的后果。 例如,例如,增加样本容量增

13、加样本容量,可使参数估计量的方差可使参数估计量的方差减小减小。 例如,例如,岭回归法岭回归法*岭回归法岭回归法(Ridge Regression) 20世纪70年代发展,以引入偏误为代价减小参数估以引入偏误为代价减小参数估计量的方差计量的方差。 具体方法是:引入矩阵D,使参数估计量为 其中矩阵D一般选择为主对角阵,即D=aI,a为大于0的常数。YXDXX1)( 显然,与未含显然,与未含D D的参数的参数B B的估计量相比,估计量有的估计量相比,估计量有较小的方差。较小的方差。五、案例五、案例中国粮食生产函数中国粮食生产函数(自学自学) 步骤步骤以粮食产量作为被解释变量,以影响粮食产量的主以粮食

14、产量作为被解释变量,以影响粮食产量的主要因素农业化肥施用量、粮食播种面积、成灾面积要因素农业化肥施用量、粮食播种面积、成灾面积、农业机械总动力、农业劳动力为解释变量,建立、农业机械总动力、农业劳动力为解释变量,建立中国粮食生产函数模型;中国粮食生产函数模型; 用用OLSOLS法估计模型;法估计模型; 检验简单相关系数;检验简单相关系数;找出最简单的回归形式;找出最简单的回归形式;采用逐步回归方法得到最终模型。采用逐步回归方法得到最终模型。 六、补充:分部回归与多重共线性六、补充:分部回归与多重共线性 Partitioned Regression and MultillinearityYX221

15、1XXY在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组: 212212211121xxxxxxxxYXYX将解释变量分为两部分,对应的参数也分为两部分1 1、分部回归法、分部回归法(Partitioned Regression)(Partitioned Regression)()()()(22111122111111111XYXXXXXXXYXXX0XX21YXXX11111)(YXXX21222)(这就是仅以这就是仅以X X2 2作为解释变量时的参数估计量作为解释变量时的参数估计量。这就是仅以这就是仅以X X1 1作为解释变量时的参数估计量。作为解释变量时的参数估计

16、量。2 2、由分部回归法、由分部回归法得到的启示得到的启示 如果一个多元线性模型的解释变量之间完全正交,如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模可以将该多元模型分为多个一元模型、二元模型、型、进行估计,参数估计结果不变;进行估计,参数估计结果不变; 实际模型由于存在或轻或重的共线性,如果将它实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、们分为多个一元模型、二元模型、进行估计,进行估计,参数估计结果将发生变化;参数估计结果将发生变化; 当模型存在共线性,将某个共线性变量去掉,当模型存在共线性,将某个共线性变量去掉,剩余变量的参

17、数估计结果将发生变化,而且经剩余变量的参数估计结果将发生变化,而且经济含义有发生变化;济含义有发生变化; 严格地说,实际模型由于总存在一定程度的共严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不线性,所以每个参数估计量并不 真正反映对应真正反映对应变量与被解释变量之间的结构关系。变量与被解释变量之间的结构关系。4.4 4.4 随机解释变量问题随机解释变量问题Random Explanatory Variables一、一、随机解释变量问题随机解释变量问题二、随机解释变量的后果二、随机解释变量的后果三、工具变量法三、工具变量法四、四、解释变量的内生性检验解释变量的内生性检验五、

18、例题五、例题 一、一、随机解释变量问题随机解释变量问题 基本假设:解释变量X1,X2,Xk是确定性变量。 如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题随机解释变量问题。 假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况: 1 1、随机解释变量问题、随机解释变量问题ikikiiiXXYY221100)()()()(22, 2ExExEXCov (2) 随机解释变量与随机误差项同期无关随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。,但异期相关。0)()(2,2iiiixEXCov0)()(2,2s

19、iisiixEXCov0s (3) 随机解释变量与随机误差项同期相关随机解释变量与随机误差项同期相关(contemporaneously correlated)。 0)()(2,2iiiixEXCov (1) 随机解释变量与随机误差项独立随机解释变量与随机误差项独立(Independence)2 2、实际经济问题中的随机解释变量问题、实际经济问题中的随机解释变量问题 在实际经济问题中,经济变量往往都具有随机性。 但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。 于是于是随机解释变量问题随机解释变量问题主要表现于:用滞后被解释主要表现于:用滞后被解释变量作为模型的解释变量的情况变量

20、作为模型的解释变量的情况。 例如:例如:(1)(1) 耐用品存量调整模型耐用品存量调整模型耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定: Qt=0+1It+2Qt-1+t t=1,T如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与t-1相关,与t不相关,属属于上述的第于上述的第2种情况。种情况。(2)(2) 合理预期的消费函数模型合理预期的消费函数模型tettYC10ettetYYY1)1 (tetttYYC1110)1 (ttttCY)()1 (101101110)1 ()1 (ttttCYCt-1是一随机解释变量,且与 (t-t-1)高度相关(为什么?

21、)。属于上述第属于上述第3种情况。种情况。二、随机解释变量的后果二、随机解释变量的后果 计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。 下面以一元线性回归模型为例进行说明。 1 1、随机解释变量与随机误差项相关图、随机解释变量与随机误差项相关图 (a)正相关 (b)负相关 拟合的样本回归拟合的样本回归线可能低估截距项,线可能低估截距项,而高估斜率项。而高估斜率项。 拟合的样本回归线拟合的样本回归线高估截距项,而低高估截距项,而低估斜率项。估斜率项。2、如果如果X与与 相互独立,相互独立,OLSOLS参数估计量

22、仍参数估计量仍然是无偏、一致估计量。然是无偏、一致估计量。 tttXY102121ttttttxxxyx11()E3 3、如果如果X与与 同期不相关,异期相关,得到同期不相关,异期相关,得到的参数估计量有偏、但却是一致的。的参数估计量有偏、但却是一致的。 kt的分母中包含不同期的X, kt与 t相关)()()(1211tttttkExxEE11)(E0)(),()lim()lim(1211121limttttnttntttnXVarXCovxPxPxxP4 4、如果、如果X与与 同期相关,得到的参数估计同期相关,得到的参数估计量有偏、且非一致。量有偏、且非一致。 前面已经证明三、工具变量法三、

23、工具变量法 Instrument variables1 1、工具变量的选取、工具变量的选取 工具变量工具变量:在模型估计过程中被作为工具使用,:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变以替代模型中与随机误差项相关的随机解释变量。量。 选择为工具变量的变量必须满足以下条件:选择为工具变量的变量必须满足以下条件: 与所替代的随机解释变量高度相关;与所替代的随机解释变量高度相关; 与随机误差项不相关;与随机误差项不相关; 与模型中其它解释变量不相关,以避免出现多重共与模型中其它解释变量不相关,以避免出现多重共线性。线性。2 2、工具变量的应用、工具变量的应用01122

24、0112211011222201122)0()0()0()0iiikkiiiiikkiiiiiiiikkiiiiiiikkikiikiYXXXeYXXXXe XYXXXXe XYXXXXe X (01122110112210112201122222( )0()()0()()0()()iiiikkiiiiiikkiiiiiiikkikikiiiikikikiiEeYXXXE Xe XYXXXXEeYXXXE Xe XYXXXXXXX(0多元线多元线性模型性模型的正规的正规方程组方程组X2为为与与相相关的关的随机随机变量变量 能否说能否说“用工具变量代替了模型中的随机解释用工具变量代替了模型中的随

25、机解释变量变量”? 能否说能否说“其它解释变量用自己作为工具变量其它解释变量用自己作为工具变量”? 能否说能否说“用用Z Z作为作为X1X1的工具变量,用的工具变量,用X1X1作为作为X2X2的工具变量的工具变量”?01122110112210112201122222( )0()()0()()0()()iiiikkiiiiiikkiiiiiiikkikikiiiikikikiiEeYXXXE XeXYXXXXEeYXXXE XeXYXXXXZZZ (0Z作为作为X2的工的工具变量具变量XZYZYZXZ1)(knkknnXXXZZZXXX212111211111Z 这种求模型参数估计量的方法称为

26、工具变量法工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量工具变量法估计量(instrumental variable (IV) estimator)。XY工具变量矩阵工具变量矩阵3 3、工具变量法估计量是一致估计量、工具变量法估计量是一致估计量 一元回归中,工具变量法估计量为iiiiiiiiixzzxzxz111)(iiniinxzPzPP1111limlim)lim(0),cov(1limiiiiZznP0),cov(1limiiiiXZxznP11)lim(P(1)(1)在小样本下,工具变量法估计量仍是有偏的在小样本下,工具变量法估

27、计量仍是有偏的。 4 4、几个重要的概念、几个重要的概念0)()1()1(iiiiiiiizExzEzxzE (2)(2)工具变量并没有替代模型中的解释变量工具变量并没有替代模型中的解释变量,只是,只是在估计过程中作为在估计过程中作为“工具工具”被使用。被使用。(3)(3)如果模型中有两个以上的随机解释变量与随如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果用的次序不影响估计结果(Why?)。(4)OLS(4)OL

28、S可以看作工具变量法的一种特殊情况。可以看作工具变量法的一种特殊情况。 ( (5)5)如果如果1 1个随机解释变量可以找到多个互相独立个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的的工具变量,人们希望充分利用这些工具变量的信息,就形成了信息,就形成了广义矩方法(广义矩方法(Generalized Method of Moments, GMM)。)。 在在GMM中,矩条件大于待估参数的数量,于中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。是如何求解成为它的核心问题。 工具变量法是工具变量法是GMM的一个特例。的一个特例。 ( (6)6)要找到与随机扰动项不相关而又与随机解释变要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事量相关的工具变量并不是一件很容易的事 可以用可以用Xt-1作为原解释变量作为原解释变量Xt的工具变量。的工具变量。 5、 IV演示:居民总消费模型演示:居民总消费模型 以居民消费总额以居民消费总额JMXF为被解释变量;为被解释变量; 以以GDP和和JMXF(-1)为解释变量;为解释变量; 进行进行OLS估计。估计。 JMXF(-1)为随机解释变量,且与随机误差项相为随机解释变量,且与随机误差项相关;关; 以政府消费以政府消费ZFX

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论