第四章回归假设的二级检验_第1页
第四章回归假设的二级检验_第2页
第四章回归假设的二级检验_第3页
第四章回归假设的二级检验_第4页
第四章回归假设的二级检验_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 回归假设的二级检验回归假设的二级检验:计量经济学检验计量经济学检验v 异方差性异方差性v 序列相关性序列相关性v 多重共线多重共线性不满足基本假定的情况,主要包括:不满足基本假定的情况,主要包括:(1)随机误差项序列存在)随机误差项序列存在异方差异方差性;性;(2)随机误差项序列存在)随机误差项序列存在序列相关序列相关性;性;(3)解释变量之间存在)解释变量之间存在多重共线多重共线性;性;(4)解释变量是随机变量且与随机误差项相关)解释变量是随机变量且与随机误差项相关 (随机解释变量随机解释变量);); 计量经济检验:计量经济检验:对模型基本假定的检验对模型基本假定的检验 本章学

2、习要点:本章学习要点:v有无不满足假设条件的可能性有无不满足假设条件的可能性v若不满足假设条件,用若不满足假设条件,用OLS得到的估计量得到的估计量会发生什么偏差会发生什么偏差v用什么方法检验假设条件是否成立用什么方法检验假设条件是否成立v补救措施补救措施4.1 异方差性异方差性一、异方差的概念一、异方差的概念二、产生异方差的原因二、产生异方差的原因三、异方差的后果三、异方差的后果四、异方差的检验四、异方差的检验五、异方差的修正五、异方差的修正对于模型对于模型ikikiiiiXXXY2210 同方差:同方差:var(i)=2 i=1,2,nVarii()2即即对于不同的样本点,随机误差项的方差

3、对于不同的样本点,随机误差项的方差不再是常数,而是随着不再是常数,而是随着X的变化而变化,则的变化而变化,则认为出现了认为出现了异方差性异方差性。 一、异方差一、异方差(方差非齐性方差非齐性)的概念的概念异方差:异方差:常数常数 同方差性假定同方差性假定:i2 = 常数 f(Xi) 异方差时异方差时: i2 = f(Xi)122)()var()(XXIE异方差一般可归结为异方差一般可归结为三种类型三种类型: 用矩阵表示:用矩阵表示: 同方差:同方差:异方差:异方差:12222221)()var()(XXIEn 二、产生异方差的原因二、产生异方差的原因1、省略自变量、省略自变量 随函数自变量由小

4、到大,因省略自变量随函数自变量由小到大,因省略自变量 而带来的误差也由小变大而带来的误差也由小变大2、样本数据的测量误差、样本数据的测量误差3、模型函数形式的设定误差、模型函数形式的设定误差4、随机因素的影响、随机因素的影响横截面数据更易产生异方差横截面数据更易产生异方差 高收入家庭:高收入家庭:储蓄的差异较大储蓄的差异较大 低收入家庭:低收入家庭:储蓄则更有规律性,差异较小储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化 例例4.1.1:截面资料下研究居民家庭的储蓄行为截面资料下研究居民家庭的储蓄行为 Yi= 0+ 1Xi+ i Yi:第:第i个家庭的储蓄额个家

5、庭的储蓄额 Xi:第:第i个家庭的可支配收入个家庭的可支配收入 三、异方差性的后果三、异方差性的后果12)()var(XX 计量经济学模型一旦出现异方差性,如果仍采计量经济学模型一旦出现异方差性,如果仍采用用OLS估计模型参数,会产生下列不良后果:估计模型参数,会产生下列不良后果: 1 1、 OLS估计量估计量仍然具有仍然具有无偏性无偏性,但,但不不具有有效性具有有效性 2 2、变量的显著性检验失去意义、变量的显著性检验失去意义不是一个有限数值,随不是一个有限数值,随X的变化而变化的变化而变化iS 3 3、模型的预测失效、模型的预测失效 四、异方差性的检验四、异方差性的检验v检验思路:检验思路

6、: 由于异方差性异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相方差与解释变量观测值之间的相关性及其相关的关的“形式形式”。 1 1、图示法、图示法 利用利用ols进行估计,作进行估计,作|e|ei i| |与与X Xi i或或Y Yi i的散点图。的散点图。多元时,可以用多元时,可以用|ei i|对每个自变量逐个进行检验。对每个自变量逐个进行检验。 X X 同方差 递增异方差 递减异方差 复杂型异方差ieieieieXX2、spearman级次相关检验(级次

7、相关检验(等级相关系数检验等级相关系数检验)iiiieXdnndr其中:) 1(6122 Xi原原Xi的等级,的等级,|e|ei i|原原|ei|的等级的等级注:注:按同规则(升序或降序)排序后所在位置按同规则(升序或降序)排序后所在位置 (或等级)(或等级)检验:检验:H0:总体等级相关系数为零:总体等级相关系数为零 r存在异方差。存在异方差。,等级相关系数显著,等级相关系数显著,否定,否定若若011),11, 0(HZZnrZnN 3 3、戈德菲尔德、戈德菲尔德- -匡特匡特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以检验以F检验为基础,适用条

8、件:检验为基础,适用条件: (1)观察次数比估计的参数个数大两倍以上;)观察次数比估计的参数个数大两倍以上; (2)i服从正态分布,除异方差外,其他假定服从正态分布,除异方差外,其他假定均满足;均满足; (3)异方差递增或递减的情况。)异方差递增或递减的情况。 H0: i同方差同方差 H1: i异方差,方差递增(或递减)异方差,方差递增(或递减) G-QG-Q检验的步骤:检验的步骤:将将n对样本观察值对样本观察值(Xi,Yi)按观察值按观察值Xi的大小的大小排队排队将序列中间的将序列中间的c=n/4个观察值除去,并将剩个观察值除去,并将剩下的观察值划分为较小与较大的相同的两下的观察值划分为较小

9、与较大的相同的两个子样本,每个子样样本容量均为个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行对每个子样分别进行OLS回归,并计算各回归,并计算各自的残差平方和自的残差平方和122221kcneeii自由度均为自由度均为平方和,平方和,表示较小和较大的误差表示较小和较大的误差和和分别用分别用 在同方差性假定下,构造如下满足在同方差性假定下,构造如下满足F分布的分布的统计量(统计量(把高方差段放在分子把高方差段放在分子) 给定显著性水平给定显著性水平 ,确定临界值,确定临界值F (v1,v2), 若若F F (v1,v2), 则拒绝同方差性假设,表明则拒绝同方差性假设,表明存存在异

10、方差。在异方差。 当然,还可根据两个残差平方和对应的子样的当然,还可根据两个残差平方和对应的子样的顺序判断是顺序判断是递增型异方差递增型异方差还是还是递减异型方差递减异型方差。) 12, 12() 12() 12(2122kcnkcnFkcnekcneFii4 4、戈里瑟、戈里瑟( (Gleiser)检验检验原理:原理:建立误差序列对解释变量的回归模型,建立误差序列对解释变量的回归模型,判断两者是否存在较强的相关关系。判断两者是否存在较强的相关关系。 选择关于变量选择关于变量X的不同的函数形式,对方的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一程进行估计并进行显著性检验,如果存

11、在某一种函数形式,使得方程显著成立,则说明原模种函数形式,使得方程显著成立,则说明原模型存在异方差性。型存在异方差性。212110,hvXaaeihii 5 5、怀特(、怀特(White)检验)检验 怀特检验适合任何形式的异方差,要求大样本。怀特检验适合任何形式的异方差,要求大样本。基本思想与步骤基本思想与步骤(以二元为例)(以二元为例):2) 1 (ieOLS估计模型,计算估计模型,计算用用iiiiXXY22110然后做如下辅助回归然后做如下辅助回归iiiiiiiiXXXXXXee215224213221102)(22102iiiivXaXaae一元:一元:(2)计算统计量)计算统计量nR2

12、,n为样本容量,为样本容量,R2为判定系数为判定系数 可以证明,在同方差假设下:可以证明,在同方差假设下: R2为为辅助回归辅助回归的可决系数,的可决系数,h为为辅助回归辅助回归解释变解释变量的个数,量的个数,表示渐近服从某分布。表示渐近服从某分布。(3),存在异方差,存在异方差,拒绝,拒绝若若,查临界值,查临界值给定给定022222543210)5()5()5(0:HxnRxxnRaaaaaH注意:注意: 辅助回归仍是检验与解释变量可能的组合的辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释显著性,因此,辅助回归方程中还可引入解释变量的更高次方。变量的更高次方。

13、 如果存在异方差性,则表明确与解释变量的如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的较高的可决系数以及某一参数的t检验值较大。检验值较大。 当然,在多元回归中,由于辅助回归方程中当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。时可去掉交叉项。五、异方差的修正五、异方差的修正1、加权最小二乘法、加权最小二乘法(WLS)基本思想:基本思想:对原模型加权,使之变成一个新的不存对原模型加权,使之变成一个新的不存在异方

14、差性的模型,然后采用在异方差性的模型,然后采用OLS估计其参数。估计其参数。 Y Yi i= =0 0+ +1 1X Xi i+ +i i var( var(i i)=)=2 2f(Xf(Xi i) ) 变换:变换:为权数为权数称称)(1)()()()(10iiiiiiiiXfXfXfXXfXfY 即满足同方差性即满足同方差性,可用,可用OLS法估计。法估计。22)()(1)var()(1)(var(iiiiiiXfXfXfXf则:则: 如何决定如何决定f(Xf(Xi i) )的形式的形式利用利用ols估计估计ei ,将,将|ei|对对Xi的不同次幂进行回的不同次幂进行回归(同归(同戈里瑟方法

15、)戈里瑟方法),挑选最优模型作为,挑选最优模型作为f(Xi)的形式。的形式。例例4.1.2, Yi=1Xi+i var(i)=2XiiiiiiiiiiXXXXXXY11210)var(iiiiiXY2、WLS的另一种形式的另一种形式XYXYXXXYiiiiii21)(代替。代替。为权数,实际中用为权数,实际中用iiiiiiiiieXY11软件操作软件操作: (1)利用利用OLS求求ei (2)求求1/|e|ei i| | (3) (3)选选WLSWLS(命令:(命令:LSLS(W W),权数为),权数为1/|ei i|3、广义最小二乘法、广义最小二乘法GLS 对于模型:对于模型:Y=X + 若

16、存在若存在异方差:异方差:W2)()(0)(ECovEW wwwn12 W是一对称正定矩阵,存在一可逆矩阵是一对称正定矩阵,存在一可逆矩阵D使得使得 W=DD 用用D-1左乘左乘Y=X + 两边,得到一个新的模型:两边,得到一个新的模型: DXDYD111*XY该模型具有同方差性。因为该模型具有同方差性。因为 1211211111)()()(DDDDDDDDDD*EEEI2*1*)(YXXXYWXXWXYDDXXDDX11111111)()(这就是原模型这就是原模型Y=X + 的的加权最小二乘估计量加权最小二乘估计量,是无偏、有效的估计量。是无偏、有效的估计量。 )(11)()var(1211

17、2*eWeknXWX 实际中可取:实际中可取:22221neeeW例例4.1.3 设回归方程为:设回归方程为:jiEEEXYjiiiiiii, 0)(,)(, 0)22(且:且:问当问当i2满足什么假定时,以下估计量是满足什么假定时,以下估计量是的最的最优线性无偏估计量优线性无偏估计量? ?)(1)3()2() 1 (2iiiiiiiXYnXYXYX例例4.1.4 现有现有X和和Y的样本观察值如下表:的样本观察值如下表: X 2 5 10 4 10 Y 4 7 4 5 9 假设假设Y对对X的回归模型为的回归模型为:22)var(iiiiiXXY 试用适当的方法估计此回归模型。试用适当的方法估计

18、此回归模型。解:解:vXYXXXYYXXXYiiiiiiiiiiii11111,1则:则:令:令:Y1i 2 1.4 0.4 1.25 0.9X1i 0.5 0.2 0.1 0.25 0.1 19. 123. 03725. 095. 515. 17225. 111211111YXXYXYX28. 315. 13725. 0595. 515. 17225. 15)(221211111XXnYXYXn436. 023. 028. 319. 111XYiiXY436. 028. 3原模型为:原模型为:注意:注意: 在实际操作中在实际操作中通常采用如下的经验方法:通常采用如下的经验方法: 不对原模型进

19、行异方差性检验,而是直接不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据选择加权最小二乘法,尤其是采用截面数据作样本时。作样本时。 如果确实存在异方差,则被有效地消除了;如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。价于普通最小二乘法。一、一、序列相关性概念序列相关性概念二、自相关性产生的原因二、自相关性产生的原因 三、序列相关性的后果三、序列相关性的后果四、序列相关性的检验四、序列相关性的检验五、具有序列相关性模型的估计五、具有序列相关性模型的估计 4.2 序列相关性(自相关性)

20、序列相关性(自相关性) 一、序列相关性概念一、序列相关性概念 如果对于不同的样本点,随机误差项之间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性。 Cov( i , j)=E ( i . j)0 i j, i,j=1,2, ,n 1、 对于模型对于模型 Yi= 0+ 1X1i+ 2X2i+ kXki+ i i=1,2, ,n随机项互不相关的基本假设表现为随机项互不相关的基本假设表现为 Cov( i , j)=0 i j, i,j=1,2, ,n2112)()()()(nnEEECov211

21、2nnI22或或2、一阶序列相关或一阶自相关、一阶序列相关或一阶自相关 Cov( i , i-1)=E ( i . i-1)0 ,i=1,2, ,n 总体总体一阶自相关系数为:一阶自相关系数为: 11varvar),cov(iiii2121iiii)(211212代替代替用估计值用估计值实际计算时,误差实际计算时,误差大样本时,大样本时,eiiiii 由于序列相关性经常出现在以时间序列为样本的由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标模型中,因此,本节将用下标t代表代表i。 设一阶序列相关设一阶序列相关t=f(t-1)是线性的,称一是线性的,称一阶自回归模型。阶自回归

22、模型。 t=a1 t-1+vt 其中其中vt是随机变数,且满足:是随机变数,且满足:)(0)(,)(, 0)(22stvvEvEvEstvtt1:112111ttttttvaaols大样本下:大样本下:由由二、自相关性产生的原因二、自相关性产生的原因221),cov(,),cov(sstttt称二阶自回归模型。称二阶自回归模型。如果如果),(21tttf 大多数经济时间数据都有一个明显的特点大多数经济时间数据都有一个明显的特点: :惯性惯性,表现在时间序列不同时间的前后关联上。表现在时间序列不同时间的前后关联上。 1 1、经济变量固有的惯性、经济变量固有的惯性例如,例如,居民总消费函数模型居民

23、总消费函数模型: Ct=0+1Yt+t t=1,2,n由于由于消费习惯消费习惯的影响被包含在随机误差项中,则的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关可能出现序列相关性(往往是正相关 )。)。 2 2、模型设定的偏误、模型设定的偏误 所谓模型所谓模型设定偏误设定偏误(Specification error)是指)是指所设定的模型所设定的模型“不正确不正确”。主要表现在模型中丢掉。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。了重要的解释变量或模型函数形式有偏误。 3 3、数据的、数据的“编造编造” 在实际经济问题中,有些数据是通过已知数在实际经济问题中,有些数据

24、是通过已知数据生成的据生成的, ,因此,新生成的数据与原数据间就有因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。了内在的联系,表现出序列相关性。 还有就是两个时间点之间的还有就是两个时间点之间的“内插内插”技术往往技术往往导致随机项的序列相关性。导致随机项的序列相关性。 三、序列相关性的后果三、序列相关性的后果 1 1、参数估计量无偏非有效、参数估计量无偏非有效 2、变量的显著性检验失去意义、变量的显著性检验失去意义 3、模型的预测失效模型的预测失效 然后,通过分析这些然后,通过分析这些“近似估计量近似估计量”之间的相之间的相关性,以判断随机误差项是否具有序列相关性。关性,以

25、判断随机误差项是否具有序列相关性。 序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同: 基本思路基本思路: : 三、序列相关性的检验三、序列相关性的检验首先首先,采用OLS 法估计模型,以求得随机误差项的“ 近似估计量近似估计量”,用 ei表示: lsiiiYYe0)( 1 1、图示法、图示法2 2、杜宾、杜宾- -瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 该方法的假定条件是该方法的假定条件是:(1)大样本大样本(2)随机误差项)随机误差项 i为为一阶自回归形式一阶自回归形式: i=i-1+e ei(3)回归模型中不应含

26、有滞后应变量作为解释变)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:量,即不应出现下列形式: Yi= 0+ 1X1i+kXki+ Yi-1+ i(4)回归含有截距项)回归含有截距项 (5) 解释变量解释变量X非随机非随机提出假设提出假设 H H0 0:=0 =0 无一阶自相关无一阶自相关 H H1 1:0 0 存在一阶自相关性存在一阶自相关性构造统计量构造统计量nttnttteeeDW12221)(nttnttntteee1222122大样本下:大样本下:nttnttttteeeee1221212)2() 1 (2)1 (222121nttnttteeeDW关关存存在在完完全

27、全负负一一阶阶序序列列相相无无序序列列相相关关关关存存在在完完全全正正一一阶阶序序列列相相412001DWDWDW 0DW4 判断方法判断方法 0DWdL 存在一阶正自相关存在一阶正自相关 4dL DW4 存在一阶负自相关存在一阶负自相关 dU DW4dU 无自相关无自相关 dLDWdU 或或4dU DW 2(p) ,否定否定H0, 可可能存在直到能存在直到p阶的序列相关。阶的序列相关。实际检验中,可从实际检验中,可从1阶、阶、2阶、阶、逐次向更高阶检验。逐次向更高阶检验。 )(22pnRLMtptptktktteeXXee11110 如果模型被检验证明存在序列相关性,则需要发展新的方法估计模

28、型。 最常用的方法是广义最小二乘法广义最小二乘法(GLS: Generalized least squares)和广义差分法广义差分法(Generalized Difference)。 四、序列相关的补救四、序列相关的补救 1 1、广义最小二乘法、广义最小二乘法 对于模型对于模型 Y=X + 如果存在序列相关,同时存在异方差,即有如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵是一对称正定矩阵,存在一可逆矩阵D,使得,使得 =DD.,22212222111221)()Cov(nnnnnE变换原模型:变换原模型: D-1Y=D-1X +D-1 即即 Y*=X* + * (

29、*)(*)式的式的OLS估计:估计: 这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏有效估计量。,是无偏有效估计量。 该模型无异方差性和序列相关该模型无异方差性和序列相关YXXX111)(的估计:的估计:2212221212121nnnnneeeeeeeeeeeeeee 2 2、广义差分法、广义差分法 广义差分法广义差分法是将原模型变换为满足是将原模型变换为满足OLS法法的差分模型,再进行的差分模型,再进行OLS估计。估计。已知已知设:设:ttttktktttvXXXY122110)(0)(,)(, 0)(22stvvEvEvEstvt

30、t1112211101tktktttXXXY令:令:)()()()1 (11111101ttktktkttttXXXXYY 该模型为该模型为广义差分模型广义差分模型,不存在序列相关问题,不存在序列相关问题,可进行可进行OLS估计。估计。 kjXXXYYYjtjtjtttt, 2 , 11*1*设:设:tktktttvXXXY*22*110*)1 (1,*1*1nXYj为为不存在,模型观察次数不存在,模型观察次数则有:则有:21121*121*11, 2 , 11,1vkjXXYYjj补:补: 的估计的估计21DW21,) 1() 1()21 (2222DWnkknkDWn当当为解释变量个数为解

31、释变量个数 大样本大样本小样本小样本21ttteee或:或: 杜宾杜宾(durbin)两步法两步法 以一元为例:以一元为例:Yt=0+ +1X Xt+ +t 第一步第一步,变换差分模型为下列形式变换差分模型为下列形式:ttttttttttvXXYYvXXYY111101101)1 ()()1 (求出求出利用利用OLS第二步,第二步,用用 对原模型进行广义差分。对原模型进行广义差分。科克伦科克伦-奥科特迭代法奥科特迭代法。 以一元线性模型为例: 首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+e

32、i得到, 12l,作为随机误差项的相关系数 12,l的第一次估计值第一次估计值。求出i新的“近似估计值”, 并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+eiilln12 ,ililiilliliiXXXYYYe)()1 (1111011 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦科克伦-奥科奥科特两步法特两步法。应用软件中的广义差分法应用软件中的

33、广义差分法 在在Eview/TSP软件包下,广义差分采用了科克软件包下,广义差分采用了科克伦伦-奥科特(奥科特(Cochrane-Orcutt)迭代法估计)迭代法估计 。 在解释变量中引入在解释变量中引入AR(1)(1)、AR(2)(2)、,即可得即可得到参数和到参数和1、2、的估计值。的估计值。 其中其中AR( (m) )表示随机误差项的表示随机误差项的m阶自回归。在阶自回归。在估计过程中自动完成了估计过程中自动完成了1、2、的迭代。的迭代。例例4.2.1,设模型为,设模型为 Yt=0+1Xt+t t=0.6t-1+vt观察值:观察值: Yt 12 16 19 25 22 28 Xt 6.5

34、 8 10 12 10 15 试用广义差分法估计参数。试用广义差分法估计参数。tttvXY*10*)1 (改造模型:解:解:=0.6=0.6121*1121*11*1*8 . 01,8 . 016 , 5 , 4 , 3 , 26 . 0,6 . 0XXXYYYtXXXYYYttttttYt*: 9.6 8.8 9.4 13.6 7 14.8Xt*: 5.2 4.1 5.2 6 2.8 944. 86 . 0138. 533. 153.10133. 13 .3273.19562 .633 .3228.3696)()(*1*022*2*1XYXXnYXYXn软件实现:软件实现:LS Y C X

35、AR(1) AR(1)求的是求的是ttXY33. 144. 8一、多重共线性的概念一、多重共线性的概念二、产生多重共线性的原因二、产生多重共线性的原因三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例 4.3 多重共线性多重共线性 一、多重共线性的概念一、多重共线性的概念 对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性 (Multicollinearity

36、)。 如果存在不全为如果存在不全为0的的ci,使,使 c1X1i+c2X2i+ckXki=0 i=1,2,n 则称为解释变量间存在则称为解释变量间存在完全共线性完全共线性。 如果存在如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中其中ci不全为不全为0,vi为随机误差项,则称为为随机误差项,则称为 近似共线近似共线性性或或交互相关交互相关。 在矩阵表示的线性回归模型在矩阵表示的线性回归模型 Y=X + 中,中,完全共线性完全共线性指:指:秩秩(X)5或或VIF10)9 . 08 . 0(22iiRR或或认为模型存在较严重的多重共线性。认为模型存在较严重的多重共线性。

37、(3)(3)逐步回归法逐步回归法( (FrischFrisch综合分析综合分析) ) 第一步第一步,将因变量将因变量Y分别对分别对k个解释变量个解释变量X1、 X2、XK进行简单回归:进行简单回归: Y=f1(X1), Y=f2(X2), , Y=fk(Xk)根据经济理论和统计标准,挑选出最优简单回归方程。根据经济理论和统计标准,挑选出最优简单回归方程。 第二步第二步,把新的变量加到选出的方程中把新的变量加到选出的方程中 如果新变量能提高如果新变量能提高R2 ,且符合经济理论,予以,且符合经济理论,予以 接纳;接纳; 如新变量不能提高如新变量不能提高R2 ,且对其他系数没有大的,且对其他系数没

38、有大的 影响,便认为是多余的;影响,便认为是多余的; 如新变量严重影响其他变量的系数值或符号时,如新变量严重影响其他变量的系数值或符号时,便认为是有害的,可能已产生严重的多重共线性,而且便认为是有害的,可能已产生严重的多重共线性,而且这个新变量可能是重要的。这个新变量可能是重要的。找出引起多重共线性的解释变量,将它排除出去。找出引起多重共线性的解释变量,将它排除出去。注意:注意: 这时,剩余解释变量参数的经济含义和数值都这时,剩余解释变量参数的经济含义和数值都发生了变化。发生了变化。 如果模型被检验证明存在多重共线性,则需要如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的

39、方法有三类。发展新的方法估计模型,最常用的方法有三类。 五、克服多重共线性的方法五、克服多重共线性的方法 1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 2 2、第二类方法:差分法、第二类方法:差分法 时间序列数据、线性模型:将原模型变时间序列数据、线性模型:将原模型变换为差分模型换为差分模型: Yi= 1 X1i+ 2 X2i+ k Xki+ i可以有效地消除原模型中的多重共线性。可以有效地消除原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量一般讲,增量之间的线性关系远比总量之间的线性关系弱得多之间的线性关系弱得多。3、第三类方法:减小参数估计量的方差、

40、第三类方法:减小参数估计量的方差 多重共线性多重共线性的主要后果后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如: 增加样本容量增加样本容量,可使参数估计量的方可使参数估计量的方差减小差减小。 岭回归法岭回归法(使用有偏估计使用有偏估计) 以引入偏误为代价减小参数估计量的方差以引入偏误为代价减小参数估计量的方差 其中矩阵其中矩阵D一般选择为主对角阵,即一般选择为主对角阵,即 D=aI a为大于为大于0的常数。的常数。YXDXX1)((*) 显然,与未含显然,与未含D的参

41、数的参数B的估计量相比,的估计量相比,(*)式的估式的估计量有较小的方差。计量有较小的方差。具体方法具体方法是:引入矩阵是:引入矩阵D,使参数估计量为,使参数估计量为 六、案例六、案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +表表 4.3.3 中国粮食生产与相关投入资料中国粮食生产与相关投入资料年份粮食产量Y(万吨)农业

42、化肥施用量1X(万公斤)粮食播种面积2X(千公顷)受灾面积3X(公顷)农业机械总动力4X(万千瓦)农业劳动力5X(万人)1983387281659.811404716209.31802231645.11984407311739.811288415264.01949731685.01985379111775.810884522705.32091330351.51986391511930.611093323656.02295030467.01987402081999.311126820392.72483630870.01988394082141.511012323944.72657531455.7

43、1989407552357.111220524448.72806732440.51990446242590.311346617819.32870833330.41991435292806.111231427814.02938934186.31992442642930.211056025894.73030834037.01993456493151.911050923133.03181733258.21994445103317.910954431383.03380232690.31995466623593.711006022267.03611832334.51996504543827.911254

44、821233.03854732260.41997494173980.711291230309.04201632434.91998512304083.711378725181.04520832626.41999508394124.311316126731.04899632911.82000462184146.410846334374.05257432797.5 1 1、用、用OLS法估计上述模型法估计上述模型: R2接近于1; 给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19,故认上述粮食生产的总体线性关系显著成立。 但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。54321028. 0098. 0166. 0421. 0213. 644.12816XXXXXY (-0.91) (8.39) (3.32) (-2.81) (-1.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论