第三章 经典假设条件不满足时的问题与对策_第1页
第三章 经典假设条件不满足时的问题与对策_第2页
第三章 经典假设条件不满足时的问题与对策_第3页
第三章 经典假设条件不满足时的问题与对策_第4页
第三章 经典假设条件不满足时的问题与对策_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 经典假设条件不满足经典假设条件不满足时时的问题及对策的问题及对策本章内容本章内容第一节第一节 多重共线性多重共线性第二节第二节 异方差性异方差性第三节第三节 自相关自相关第四节第四节 随机解释变量随机解释变量 OLS估计量令人满意的性质,是根据一组假估计量令人满意的性质,是根据一组假设条件而得到的。在实践中,如果某些假设条设条件而得到的。在实践中,如果某些假设条件不能满足,则件不能满足,则OLS就不再是模型的最佳估计就不再是模型的最佳估计法。下面列出实践中可能碰到的一些常见问题法。下面列出实践中可能碰到的一些常见问题 多重共线性多重共线性(Multicollinearity) 异

2、方差性异方差性(Heteroscedasticity或或Heteroskedasticity) 自相关自相关(Autocorrelation) 随机解释变量随机解释变量(Stochastic explanatory variables) 本章将对上述问题作简要讨论,主要介绍问题的本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。后果、检测方法和解决途径。第一节第一节 多重共线性多重共线性 应用应用OLS法的一个假设条件是;矩阵法的一个假设条件是;矩阵X的秩的秩=K+110作为存在严重多重共线性的作为存在严重多重共线性的标准标准, 特别在解释变量多的情形应当如此。特别在解释变量

3、多的情形应当如此。 需要指出的是,所有需要指出的是,所有VIF值都低,并不能排除严值都低,并不能排除严重多重共线性的存在,这与使用相关系数矩阵检验重多重共线性的存在,这与使用相关系数矩阵检验的情况相似。的情况相似。5)(iVIF 四四 、解决多重共线性的方法、解决多重共线性的方法 思路:加入额外信息。思路:加入额外信息。 具体方法有以下几种:具体方法有以下几种: 增加数据增加数据 对模型施加某些约束条件对模型施加某些约束条件 删除一个或几个共线变量删除一个或几个共线变量 将模型适当变形将模型适当变形1增加数据增加数据 多重共线性实质上是数据问题,因此,增加数据多重共线性实质上是数据问题,因此,

4、增加数据就有可能消除或减缓多重共线性,具体方法包括增就有可能消除或减缓多重共线性,具体方法包括增加观测值、利用不同的数据集或采用新的样本。加观测值、利用不同的数据集或采用新的样本。例例3.1 需求函数需求函数Yt = 1+2Xt+3Pt+ ut 在时间序列数据中,收入(在时间序列数据中,收入(X)和价格()和价格(P)往往)往往是高度相关的,用时间序列数据估计往往会产生多是高度相关的,用时间序列数据估计往往会产生多重共线性。然而,在横截面数据中,则不存在这个重共线性。然而,在横截面数据中,则不存在这个问题,因为某个特定时点问题,因为某个特定时点P为常数。如果取一横截为常数。如果取一横截面样本(

5、如从面样本(如从5000个家庭取得的数据),则可用来个家庭取得的数据),则可用来估计估计 Yi = 1+2Xi+ ui 然后将得到的估计值然后将得到的估计值 作为一个约束条件(作为一个约束条件(2 = )施加于时间序列数据的回归计算中,即估计)施加于时间序列数据的回归计算中,即估计 Yt - - Xt =1+3Pt+ ut ,得到,得到 , 。22213221322对模型施加某些约束条件对模型施加某些约束条件 在存在多重共线性的模型中,依据经济理论施在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差,如加某些约束条件,将减小系数估计量的方差,如在在CobbDougl

6、as生产函数中加进规模效益不变生产函数中加进规模效益不变的约束,可解决资本和劳动的高度相关而引起的的约束,可解决资本和劳动的高度相关而引起的多重共线性问题。多重共线性问题。 3删除一个或几个共线性变量删除一个或几个共线性变量 这样做,实际上就是利用给定数据估计这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可以解决多重共线性问题。删除哪些变量,可根据假设检验的结果确定。根据假设检验的结果确定。 应注意的是,这种做法可能会使得到的应注意的是,这种做法可能会使得到的系数估计量产生偏倚,因而需要权衡利弊

7、。系数估计量产生偏倚,因而需要权衡利弊。4将模型适当变形将模型适当变形例例1某商品的需求函数为:某商品的需求函数为:其中:其中:Q = 需求量,需求量, X = 收入,收入, P = 该商品的价格,该商品的价格, P* = 替代商品的价格替代商品的价格 在实际数据中,在实际数据中,P和和P*往往呈同方向变动,它们往往呈同方向变动,它们之间高度相关,模型存在多重共线性。之间高度相关,模型存在多重共线性。 如果我们仅要求在知道两种商品的相对价格变如果我们仅要求在知道两种商品的相对价格变动时,对需求量进行预测,则可将需求函数变为:动时,对需求量进行预测,则可将需求函数变为:就可以解决多重共线性问题。

8、就可以解决多重共线性问题。u*3210PPXQvPPXQ)(*321例例2有滞后变量的情形有滞后变量的情形 Yt = 1+2Xt+3 Xt- -1 + ut 一般而言,一般而言,Xt和和Xt 1往往高度相关,将模型变换往往高度相关,将模型变换为:为: Yt = 1+2(Xt - - Xt 1)+3 Xt - -1+ ut 其中其中3 =3 +2 经验表明:经验表明:Xt和和Xt 1的相关程度要远远小于和的相关程度要远远小于和Xt和和Xt 1的相关程度,因而这种变换有可能消除或的相关程度,因而这种变换有可能消除或减缓多重共线性。减缓多重共线性。五、五、 处理多重共线性问题的原则处理多重共线性问题

9、的原则1. 多重共线性是普遍存在的,轻微的多重共线多重共线性是普遍存在的,轻微的多重共线性问题可不采取措施。性问题可不采取措施。 2. 严重的多重共线性问题,一般可根据经验严重的多重共线性问题,一般可根据经验或通过分析回归结果发现。如影响系数的符号,或通过分析回归结果发现。如影响系数的符号,重要的解释变量重要的解释变量t 值很低。要根据不同情况采取值很低。要根据不同情况采取必要措施。必要措施。 3. 如果模型仅用于预测,则只要拟合好,可如果模型仅用于预测,则只要拟合好,可不处理多重共线性问题,存在多重共线性的模不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不影响预测结果。型用于预测

10、时,往往不影响预测结果。六、实例六、实例 选取全国选取全国1978-2008年的时间序列数据对我国年的时间序列数据对我国城镇就业人数建立多元线性回归模型。影响因素有城镇就业人数建立多元线性回归模型。影响因素有名义名义GDP、GDP平减指数、工业总产值、城镇登平减指数、工业总产值、城镇登记失业人数、时间(记失业人数、时间(1978年为年为1,1979年为年为2,依,依此类推)。具体数据与变量名称见教材表此类推)。具体数据与变量名称见教材表3-5,回,回归结果如下。归结果如下。 回归结果显示,模型拟合优度非常高,为回归结果显示,模型拟合优度非常高,为0.9968,F统计量也显示模型具有整体显著性。

11、但是统计量也显示模型具有整体显著性。但是GDP、GDP平减指数、工业总产值均未能通过平减指数、工业总产值均未能通过5%显著性检显著性检验,且验,且GDP平减指数的系数为负,与理论预期不符,平减指数的系数为负,与理论预期不符,同时同时GDP与工业总产值的系数非常小,因此怀疑存与工业总产值的系数非常小,因此怀疑存在多重共线性问题。在多重共线性问题。 为了更加清晰的进行说明,表为了更加清晰的进行说明,表3-2给出了所有变量给出了所有变量之间的相关系数。从第之间的相关系数。从第1行可以看出,被解释变量与行可以看出,被解释变量与所有解释变量之间的关系均为正相关。此外,解释所有解释变量之间的关系均为正相关

12、。此外,解释变量间显示出高度相关,如变量间显示出高度相关,如GDP与工业总产值,与工业总产值,GDP平减指数与时间平减指数与时间T之间的相关性都大于之间的相关性都大于0.95,这,这意味着多重共线性的存在。意味着多重共线性的存在。 下面我们对多重共线性进行处理。将下面我们对多重共线性进行处理。将GDP与与GDP平减指数合并,即将名义平减指数合并,即将名义GDP用平减指数进用平减指数进行调整,得到实际行调整,得到实际GDP作为新的解释变量,同时作为新的解释变量,同时去掉工业总产值变量。最终结果如下。去掉工业总产值变量。最终结果如下。回归模型拟合回归模型拟合程度非常好。程度非常好。所有参数都具所有

13、参数都具有显著性,符有显著性,符号符合经济意号符合经济意义,且拟合优义,且拟合优度几乎没有下度几乎没有下降。可以认为降。可以认为原模型的多重原模型的多重共线性问题已共线性问题已得到解决。得到解决。 第二节第二节 异方差性异方差性 上面我们讨论了误设定和多重共线性问题。回顾上面我们讨论了误设定和多重共线性问题。回顾我们应用我们应用OLS法所需假设条件,其中大部分是有关法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:扰动项的统计假设,它们是:(1)E(ut)=0, t=1,2,n. 扰动项均值为扰动项均值为0(2)Cov(ui,uj) = E(uiuj) =0, ij. 扰动项相互独立扰

14、动项相互独立(3)Var(ut) = E(ut) = 2 , , t=1,2,n. 常数方差常数方差(4)ut N(0, 2). ). 正态性正态性 对于(对于(1 1),我们可论证其合理性。而第(),我们可论证其合理性。而第(4 4)条,)条,也没有多大问题。大样本即可假定扰动项服从正态也没有多大问题。大样本即可假定扰动项服从正态分布。而对于(分布。而对于(2 2),(),(3 3)两条,则无法论证其合)两条,则无法论证其合理性。实际问题中,这两条不成立的情况比比皆是理性。实际问题中,这两条不成立的情况比比皆是。下面即将讨论它们不成立的情况,即异方差性和。下面即将讨论它们不成立的情况,即异方

15、差性和自相关的情形。自相关的情形。一一 、异方差性及其后果、异方差性及其后果1 1定义定义 若若Var(ut) = = = 常数的假设不成立,即常数的假设不成立,即 Var(ut) = 常数,则称扰动项具有异方差性。常数,则称扰动项具有异方差性。2什么情况下可能发生异方差性问题?什么情况下可能发生异方差性问题? 解释变量取值变动幅度大时,常数方差的假设往往解释变量取值变动幅度大时,常数方差的假设往往难以成立。异方差性主要发生在横截面数据的情况,难以成立。异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时间跨度过大。时间序列问题中一般不会发生,除非时间跨度过大。22t例例3.

16、4 Yi = +Xi+ ui 其中:其中:Y=指定规模和组成的家庭每月消费支出指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入这样的家庭的每月可支配收入 设设X的的N个观测值取自一个家庭可支配收入的横截个观测值取自一个家庭可支配收入的横截面样本。某些家庭接近于勉强维持生存的水平,另面样本。某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入。不难设想,低收入家庭一些家庭则有很高的收入。不难设想,低收入家庭的消费支出不大可能离开他们的均值的消费支出不大可能离开他们的均值E(Y)过远,)过远,太高无法支持,太低则消费将处于维持生存的水平太高无法支持,太低则消费将处于维持生存的

17、水平之下。因此,低收入家庭消费支出额的波动应当较之下。因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差。而高收入家庭则小,因而扰动项具有较小的方差。而高收入家庭则没有这种限制,其扰动项可能有大得多的方差。没有这种限制,其扰动项可能有大得多的方差。 这就意味着异方差性。这就意味着异方差性。 3异方差性的后果异方差性的后果(1)参数估计量不再具有最小方差的性质)参数估计量不再具有最小方差的性质 异方差性不破坏异方差性不破坏OLS估计量的无偏性,但不再估计量的无偏性,但不再是有效的。是有效的。 事实上,异方差性的存在导致事实上,异方差性的存在导致OLS估计量既不估计量既不是有效的,

18、也不具有渐近有效性。是有效的,也不具有渐近有效性。 这有两层含义。首先,小样本性质这有两层含义。首先,小样本性质BLUE的丧的丧失意味着存在着另外的线性无偏估计量,其抽样方失意味着存在着另外的线性无偏估计量,其抽样方差小于差小于OLS估计量的方差。其次,渐近有效性这一估计量的方差。其次,渐近有效性这一大样本性质的丧失,意味着存在着另外的一致估计大样本性质的丧失,意味着存在着另外的一致估计量,其抽样分布当样本容量增大时,向被估计的回量,其抽样分布当样本容量增大时,向被估计的回归参数收缩的速度要比归参数收缩的速度要比OLS估计量快。估计量快。 (2)系数的置信区间和假设检验结果不可信赖)系数的置信

19、区间和假设检验结果不可信赖 更为严重的是,在异方差性的情况下,矩阵更为严重的是,在异方差性的情况下,矩阵 主对角元素不再是主对角元素不再是OLS估计量方差的无偏估计量方差的无偏估计量,从而导致系数的置信区间和假设检验结果不估计量,从而导致系数的置信区间和假设检验结果不可信赖。可信赖。 在异方差性的情况下,系数估计量的方差既有可在异方差性的情况下,系数估计量的方差既有可能低估,也有可能高估真实方差。在这两种情况下,能低估,也有可能高估真实方差。在这两种情况下,都会产生检验结果的误导。都会产生检验结果的误导。例如,被检验的系数实际例如,被检验的系数实际上不是统计上显著的,而由于矩阵上不是统计上显著

20、的,而由于矩阵 的主对角的主对角元素低估了元素低估了OLS估估 计量的相应方差,检验结果却表计量的相应方差,检验结果却表明其显著。(明其显著。(问题:低估方差是否是好事?问题:低估方差是否是好事?)12) (X X(X X21)(XX21)(XX二、二、 异方差性的检验异方差性的检验 异方差性后果的严重性意味着我们在实践中必须了异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性。解是否存在异方差性。 常用的检验方法有:常用的检验方法有: 戈德弗尔德戈德弗尔德匡特检验法匡特检验法(Goldfeld Quandt test)(Goldfeld Quandt test) 格里瑟检验法格里

21、瑟检验法(Glesjer testGlesjer test) 帕克检验法帕克检验法(Park testPark test) 怀特检验法怀特检验法 (White(Whites General Heteroscedasticity test)s General Heteroscedasticity test) 布鲁奇帕根检验法布鲁奇帕根检验法(Breusch-Pagan Test)(Breusch-Pagan Test)1.1.戈德弗尔德戈德弗尔德匡特检验法匡特检验法基本思路:假定基本思路:假定 随随YtYt的数值大小变动。的数值大小变动。检验步骤:检验步骤:(1 1)将数据分为三组:小)将数据分

22、为三组:小YtYt值组,中值组,中YtYt值组,大值组,大YtYt值组(数据项大致相等)值组(数据项大致相等)(2 2)对小)对小YtYt值组估计模型,给出值组估计模型,给出 (3 3)对大)对大YtYt值组估计模型,给出值组估计模型,给出 2t11221kne13223kne (4) H0 0: H1 1: (或(或 ) 检验统计量为检验统计量为F0 = F(n n3 3-k-1, n-k-1, n1 1-k-1-k-1) 若若F F0 0F Fc c,则拒绝,则拒绝H0 0,存在异方差性。,存在异方差性。 2321232123212123例例3.5 S=+Y + u 3.5 S=+Y +

23、u 其中:其中:S=S=储蓄储蓄 Y=Y=收入收入 设设 195119516060年,年, =0.01625=0.01625 1970 19707979年,年, =0.9725=0.9725 F F0 0 = 0.9725/0.01625=59.9 = 0.9725/0.01625=59.9 查表得查表得: d.f.: d.f.为(为(8 8,8 8)时,)时,5% F5% Fc c=3.44=3.44 F F0 0F Fc c 因而因而拒绝拒绝H0 0。 结论:存在异方差性。结论:存在异方差性。21232. 怀特检验法怀特检验法(Whites General Heteroscedastici

24、ty Test) 怀特提出的检验异方差性的方法在实践中用起来怀特提出的检验异方差性的方法在实践中用起来很方便,下面用一个三变量线性模型扼要说明其检很方便,下面用一个三变量线性模型扼要说明其检验步骤。设模型如下:验步骤。设模型如下:01122(1)iiiiYXXuWhite检验步骤如下:检验步骤如下: (1)用)用OLS法估计(法估计(1)式,得到残差)式,得到残差e i ; (2)进行如下辅助回归)进行如下辅助回归222011223142512(2)iiiiiiiieXXXXX Xv即残差平方对所有原始变量、变量平方以及变即残差平方对所有原始变量、变量平方以及变量交叉积回归,得到量交叉积回归,

25、得到R2值值;(3)进行假设检验)进行假设检验 原假设原假设 H0:不存在异方差性(即方程(:不存在异方差性(即方程(2)全部)全部 斜率系数均为零)斜率系数均为零) 备择假设备择假设 H1:存在异方差性:存在异方差性(即即H0不成立不成立) 怀特证明了下面的命题:怀特证明了下面的命题: 在在 原假设原假设 H0成立的情况下,从(成立的情况下,从(2)式得到的)式得到的R2值与观测值数目(值与观测值数目(n)的乘积()的乘积(n R2)服从)服从自由度自由度为为 k的的 2分布,自由度分布,自由度 k 为为(2)式中解释变量的个数。式中解释变量的个数。即即 n R2 2(k) 因此,怀特检验的

26、检验统计量就是因此,怀特检验的检验统计量就是n R2 ,其抽样,其抽样分布为自由度为分布为自由度为k的的 2分布。分布。 检验步骤类似于检验步骤类似于t检验和检验和F检验。检验。例例3.6 根据2006年内地31省市的数据,研究文化娱乐支出Y与人均可支配收入X1和文化娱乐价格X2之间的关系,建立回归模型,得到如下估计结果: Y = 1661.54+ 0.135X1 -20.64X2 t: (14.44) (-1.18)由于各个省市的收入差距比较大,文化娱乐支出的差距也会比较大,因此可能存在异方差性。下面通过white检验来判断是否存在异方差性。89. 02R先对该模型作OLS回归,得到残差;然

27、后做如下辅助回归:使用EViews软件,得到辅助回归的 ,因此 (3) 检验 :不存在异方差性 :存在异方差性 查表,在5%的显著性水平下,自由度为5的 值为11.07,因为 11.07,所以拒绝原假设,结论是存在异方差性。222011223142512iiiiiiiieXXXXX X20.812R231 0.81225.17nR0H1H2225.17nR三、三、 广义最小二乘法广义最小二乘法1 1消除异方差性的思路消除异方差性的思路 基本思路:变换原模型,使经过变换后的模型具有基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用同方差性,然后再用OLSOLS法进行估计。法进行估计。

28、 对于模型对于模型 Yt = 0+1X1t+k Xkt+ ut (1) 若扰动项满足若扰动项满足 E(ut) = 0,E(uiuj) = 0, ij, 但但 E(ut2 2) = t2 常数常数. 也就是说,该模型只有同方差性这一条件不满足,则也就是说,该模型只有同方差性这一条件不满足,则只要能将具有异方差性的扰动项的方差表示成如下形只要能将具有异方差性的扰动项的方差表示成如下形式:式: 222( )1,2,.tttVar utn 由于由于 011.(2)ttKttKtttttYXXu222221)(1)(ttttttuVaruVar 其中其中 为一未知常数,为一未知常数, 表示一组已知数值,

29、表示一组已知数值,则用则用t t去除模型各项,得变换模型去除模型各项,得变换模型: :22t 所以变换后模型的扰动项的方差为常数,可以应用OLS法进行估计,得到的参数估计量为BLUE。但这里得到的OLS估计量是变模后模型(2)的OLS估计量。对于原模型而言,它已不是OLS估计量,称为称为广义最小二乘估计量(广义最小二乘估计量(GLS估计量)。估计量)。2 广义最小二乘法广义最小二乘法(Generalized least squares) 下面用矩阵形式的模型来推导出下面用矩阵形式的模型来推导出GLS估计量的一估计量的一般计算公式。般计算公式。 设设GLS模型为模型为 Y=X+u (1) 满足满

30、足 E(u)= 0,E(uu ) )= 2, X 非随机,非随机, X的秩的秩=K+1n, n, 其中其中为正定矩阵。为正定矩阵。 根据矩阵代数知识可知,对于任一正定矩阵根据矩阵代数知识可知,对于任一正定矩阵,存在着一个满秩(非退化,非奇异)矩阵存在着一个满秩(非退化,非奇异)矩阵P P,使得,使得111)(, PPPPuPXPYP111 用用P-1左乘原模型(左乘原模型(1)(对原模型进行变换):)(对原模型进行变换):令令 Y* = P-1Y ,X* = P-1X,u* = P-1u,得到,得到 Y*= X*+ u* (2) 下面的问题是,模型(下面的问题是,模型(2)的扰动项)的扰动项u

31、*是否是否 满足满足OLS法的基本假设条件。法的基本假设条件。我们有()() )EE-1-1*u uP uu (P11()()EPuuP121()() P P2)-1-1P (PP )(P2()-1-1P P)(P P2I这表明,模型(这表明,模型(2 2)中的扰动项)中的扰动项u*满足满足OLS法的基法的基本假设,可直接用本假设,可直接用OLS估计,估计量向量估计,估计量向量 这就是广义最小二乘估计量(这就是广义最小二乘估计量(GLS估计量)估计量) 的的公式,该估计量是公式,该估计量是BLUE。 从上述证明过程可知,我们可将从上述证明过程可知,我们可将GLS法应用于法应用于为为任意正定矩阵

32、的情形。任意正定矩阵的情形。*-1* = (X X ) X Y( -1-1-1-1-1X(P )P X) X(P )P Y( -1-1-1X X) X Y如果只存在异方差性,则如果只存在异方差性,则 2)( uuE222212.000.0.000.00nntt,.,2 , 1, 02PPn .000.0.000.0021其中其中我们显然有我们显然有)(1.000.0.0100.0011211 PPn 2222111.000.0.0100.001n 四、解决异方差问题的方法四、解决异方差问题的方法1. 可行广义最小二乘法(可行广义最小二乘法(FGLS法)法) 广义最小二乘法从理论上解决了扰动项存

33、在异方差性的情况下模型的估计问题,但在实践中是否可行呢? 从GLS估计量的公式可知,要计算GLS估计值,我们必须知道 矩阵。而实际问题中 矩阵极少为已知。因此,在实践中直接应用GLS法基本上不可行。 但在很多情况下,我们可以根据实际问题提供的但在很多情况下,我们可以根据实际问题提供的信息估计信息估计 矩阵,再应用矩阵,再应用GLS法,这种方法称为法,这种方法称为可行可行广义最小二乘法广义最小二乘法(Feasible Generalized Least Squares, FGLS)。)。 例如在仅存在异方差性的情况下,如果在实际问例如在仅存在异方差性的情况下,如果在实际问题中,研究人员确信可以准

34、确估计异方差性的结构,题中,研究人员确信可以准确估计异方差性的结构,如扰动项方差与某个解释变量成正比,就可以采用如扰动项方差与某个解释变量成正比,就可以采用FGLS法。由于法。由于FGLS法的核心是估计法的核心是估计 矩阵,因此矩阵,因此亦称为亦称为估计的广义最小二乘法估计的广义最小二乘法(Estimated Generalized Least Squares, EGLS)。)。 FGLS法的第一步是确定异方差性的具体形式,也法的第一步是确定异方差性的具体形式,也就是找出决定扰动项方差与某组已知数值之间关系就是找出决定扰动项方差与某组已知数值之间关系的函数形式,然后用这个关系得到每个扰动项方差

35、的函数形式,然后用这个关系得到每个扰动项方差的估计值,从而得到的估计值,从而得到 矩阵的估计值矩阵的估计值 ,最后计,最后计算算FGLS估计量估计量 :FGLS111()FGLSX XX Y例例3.7 3.7 Yt = 1+2Xt+ ut t=1,2,n.其中其中 Y=Y=家庭消费支出家庭消费支出 X=X=家庭可支配收入家庭可支配收入 我们在前面已分析过,高收入家庭有较大的扰我们在前面已分析过,高收入家庭有较大的扰动项方差,因此不妨假定扰动项方差与可支配收动项方差,因此不妨假定扰动项方差与可支配收入成正比,即入成正比,即 Var(uVar(ut t)=)=Xt , t=1,2,n. 式中式中是

36、一未知常数,由于是一未知常数,由于Xt为已知,相当于为已知,相当于 ,而而相当于相当于 ,因此,因此 应用应用GLS法,即可得出法,即可得出的的FGLSFGLS估计量。估计量。 nXXX.000.0.000.00212t2 在上例中我们假设扰动项方差与解释变量的取值在上例中我们假设扰动项方差与解释变量的取值成正比,这种假设是否真正合理呢?根据经验和分析成正比,这种假设是否真正合理呢?根据经验和分析做出的这种假设,虽然有一定道理,但未免显得过于做出的这种假设,虽然有一定道理,但未免显得过于武断,这方面还可做一些比较细致的工作。武断,这方面还可做一些比较细致的工作。 GlesjerGlesjer检

37、验法不仅可检验异方差性的存在,还检验法不仅可检验异方差性的存在,还可用于提供有关异方差形式的进一步信息,对于确定可用于提供有关异方差形式的进一步信息,对于确定矩阵很有用,下面我们扼要说明格里瑟检验法的思矩阵很有用,下面我们扼要说明格里瑟检验法的思路和步骤。路和步骤。 格里瑟检验法的思路格里瑟检验法的思路 格里瑟检验法的思路是假定扰动项方差与解释变量格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系,方法是用之间存在幂次关系,方法是用 对被认为与扰动项对被认为与扰动项方差有关的解释变量回归,确定方差有关的解释变量回归,确定 和该解释变量的和该解释变量的关系。由于与该解释变量之间关系的实

38、际形式是未知关系。由于与该解释变量之间关系的实际形式是未知的,因此需要用该解释变量的不同幂次进行试验,选的,因此需要用该解释变量的不同幂次进行试验,选择出最佳拟合形式。择出最佳拟合形式。 具体步骤如下:具体步骤如下:tete (1)(1)因变量因变量Y Y对所有解释变量回归,计算残差对所有解释变量回归,计算残差e et t (t=1,2,t=1,2,n,n)(2 2) 对所选择解释变量的各种幂次形式回归,如对所选择解释变量的各种幂次形式回归,如 然后利用决定系数,选择拟合最佳的函数形式。然后利用决定系数,选择拟合最佳的函数形式。(3 3)对)对1 1进行显著性检验,若显著异于进行显著性检验,若

39、显著异于0 0,则表明存在,则表明存在异方差性,否则再试其它形式。异方差性,否则再试其它形式。.1101010210tjtttjtttjtttjttuXeuXeuXeuXete 例例3.8 3.8 Yt = 1+2X1t+k Xkt+ ut 假设我们根据经验知道扰动项方差与假设我们根据经验知道扰动项方差与Xjt有关,并有关,并用用格里瑟法试验,得出:格里瑟法试验,得出: 则则 jttX2 jnjjXXX.000.0.000.0021 在大多数应用中,由于通过矩阵运算计算相对复在大多数应用中,由于通过矩阵运算计算相对复杂,因而对于仅存在异方差性的问题,通常采用另杂,因而对于仅存在异方差性的问题,

40、通常采用另一种等价的方法加权最小二乘法(一种等价的方法加权最小二乘法(WLS)。)。加权最小二乘法加权最小二乘法 对于仅存在异方差性的问题,其对于仅存在异方差性的问题,其矩阵是一个对角矩阵,即矩阵是一个对角矩阵,即 22221n 在这种情况下应用在这种情况下应用广义最小二乘法,也就是在广义最小二乘法,也就是在原模型两端左乘原模型两端左乘矩阵矩阵 nP 1.11211 变换变换原模型,再对原模型,再对变换变换后的模型应用普通最小二后的模型应用普通最小二乘法进行估计。乘法进行估计。这种作法实际上等价于在代数形式的原模型这种作法实际上等价于在代数形式的原模型 Yt = 0+1X1 t+k X k t

41、+ u t 的两端除以的两端除以 t,得,得变换变换模型:模型:tttKtKtttttuXXY110相当于在回归中给相当于在回归中给因变量和解释变量的每个观测值因变量和解释变量的每个观测值都 赋 予 一 个 与 相 应都 赋 予 一 个 与 相 应 扰 动 项 的 方 差 相 联 系 的 权扰 动 项 的 方 差 相 联 系 的 权数数 ,然后再对这些变换后的数据,然后再对这些变换后的数据进行进行OLSOLS回归,因而被称为回归,因而被称为加权最小二乘法加权最小二乘法(WLSWLS法法, , Weighted Least SquaresWeighted Least Squares)。)。),.

42、,2 , 1,1(ntt 加权最小二乘法是加权最小二乘法是FGLS法的一个特例,在法的一个特例,在 矩矩阵为对角矩阵这种特殊情形下,我们既可以直接应阵为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式的可行用矩阵形式的可行广义最小二乘广义最小二乘估计量公式得到估计量公式得到FGLSFGLS估计值,亦可避开矩阵运算,采用估计值,亦可避开矩阵运算,采用加权最小二加权最小二乘法乘法得到其得到其WLSWLS估计值,两者结果完全相同,无论你估计值,两者结果完全相同,无论你称之为称之为FGLSFGLS估计值还是估计值还是WLSWLS估计值,二者是一码事。估计值,二者是一码事。例例3.93.9 其中:其中

43、:Y=R&DY=R&D支出,支出,X=X=销售额销售额 采用美国采用美国19881988年年1818个行业的数据估计上述方程,个行业的数据估计上述方程,结果如下(括号中数字为结果如下(括号中数字为t t值):值):12(1)iiiYXu 这里是横截面数据,由于行业之间的差别,可能这里是横截面数据,由于行业之间的差别,可能存在存在异方差性。异方差性。)8434. 3()1948. 0(4783. 00319. 099.1922RXYii 假设假设 应用应用格里瑟法试验,得到格里瑟法试验,得到异方差性形式为:异方差性形式为:iiX2将原模型(将原模型(1)的两端除以)的两端除以 ,

44、得,得iX)2(121iiiiiiXuXXXY 用用OLS法估计(法估计(2)式,)式,结果如下(括号中数字为结果如下(括号中数字为t t值):值): 与(与(1)式的结果比较,两个方程斜率系数的估)式的结果比较,两个方程斜率系数的估计值相差不大,但计值相差不大,但采用采用WLSWLS法估计的比直接用法估计的比直接用OLS法法估计的系数更为显著。估计的系数更为显著。21246.680.03680.6258( 0.647)(5.172)iiiiYXRXX 2. 仍采用仍采用OLS法估计系数,法估计系数, 但采用但采用OLS估计量标准估计量标准误差的异方差性一致估计值代替其误差的异方差性一致估计值

45、代替其OLS估计值估计值 怀特(怀特(H. White)在)在1980年提出的产生年提出的产生OLS估计估计量的异方差性一致标准误差的方法,为解决异方差性量的异方差性一致标准误差的方法,为解决异方差性问题提供了另一种途径。问题提供了另一种途径。 怀特的贡献是解决了异方差性造成系数的置信区间怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,该后果是由于方差和假设检验结果不可信赖的问题,该后果是由于方差的的OLS估计量不再是无偏估计量而造成的。估计量不再是无偏估计量而造成的。 我们用简单线性回归模型对怀特方法作一说明。我们用简单线性回归模型对怀特方法作一说明。在异方差的情况

46、下,在异方差的情况下, 的方差是的方差是 可以证明,可以证明, 将涉及所有的将涉及所有的 ,而不是一个共同的,而不是一个共同的 。这意味着回归软件包所。这意味着回归软件包所报告的报告的 作为作为 的方差估计值有两个错误的方差估计值有两个错误。OLS222222()()/()(5.25)olsiiiiiiiVarVarkukxx22()(/(2)iE sEen2i222/isxOLS扰动项方差的估计量的期望均值第一,它用的不是方差的正确公式(第一,它用的不是方差的正确公式(5.25););第二,它用第二,它用 估计一个共同的估计一个共同的 ,而事实上诸,而事实上诸 是不同的。是不同的。 2s22

47、i怀特的方法是在(怀特的方法是在(5.25)式中用)式中用 取代取代 ,这里,这里 是第是第i个个OLS残差,即残差,即2ie2iie222 2()/()(5.26)OLSiiiWhite s Varx ex 请注意,我们并不能用请注意,我们并不能用 得到得到 的一致估计的一致估计量,因为在这种情况下,每个要估计的参数仅有一量,因为在这种情况下,每个要估计的参数仅有一个观测值,当样本增大时,未知的数目也在同步增个观测值,当样本增大时,未知的数目也在同步增加。怀特得到的是加。怀特得到的是 的一致估计量,它是的一致估计量,它是 的的加权平均。同样的分析适用于多元回归加权平均。同样的分析适用于多元回

48、归OLS估计量估计量的情况,在这种情况下,用怀特方法得到的第的情况,在这种情况下,用怀特方法得到的第K个个OLS回归系数的方差的异方差性一致估计值由下式回归系数的方差的异方差性一致估计值由下式给出:给出:2ie2i()olsVar2ie其中其中 是从是从 对方程中所有其它解释变量回归得到对方程中所有其它解释变量回归得到的的OLS残差残差 的平方,的平方, 为原多元回归模型的第为原多元回归模型的第i个个OLS残差。很多回归软件包提供诸方差的怀特异方残差。很多回归软件包提供诸方差的怀特异方差性一致估计值以及对应的稳健差性一致估计值以及对应的稳健t统计值(统计值(robust t-statistic

49、s)。例如,使用)。例如,使用EViews,先点击,先点击Quick,选择选择Estimate Equation,再击,再击Options,从下拉菜,从下拉菜单中选其中的一个选项单中选其中的一个选项White,即可得到诸方差的,即可得到诸方差的异方差性一致估计值。异方差性一致估计值。 2kkXie222211()/()nnkkiikiiiWhite s Vare 通过使用诸方差的怀特异方差性一致估计值代替通过使用诸方差的怀特异方差性一致估计值代替其其OLS估计值,我们解决了异方差性造成系数的置估计值,我们解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,从而也就信区间和假设检验结果

50、不可信赖的问题,从而也就解决了在异方差性存在的情况下能否使用解决了在异方差性存在的情况下能否使用OLS法估法估计方程的问题。计方程的问题。 结论是我们仍可用结论是我们仍可用OLS法估计方程的系数,因为法估计方程的系数,因为尽管存在异方差性,系数的尽管存在异方差性,系数的OLS估计量毕竟还是无估计量毕竟还是无偏和一致估计量,应该说还是具有良好性质的估计偏和一致估计量,应该说还是具有良好性质的估计量。只不过方差量。只不过方差-协方差矩阵不能再用协方差矩阵不能再用OLS法估计,法估计,而要采用怀特之类的方法,得到一致估计量,如怀而要采用怀特之类的方法,得到一致估计量,如怀特的异方差性一致估计量。特的

51、异方差性一致估计量。 这类估计量的性质不是这类估计量的性质不是“最好最好”,但它们对于某,但它们对于某些假设条件(在这里是同方差性)的违背不敏感,些假设条件(在这里是同方差性)的违背不敏感,这类的估计量称为这类的估计量称为稳健估计量稳健估计量(robust estimators)。)。 与我们前面介绍的与我们前面介绍的FGLS法相比,本段介绍的解法相比,本段介绍的解决异方差性的方法的优越之处在于,不需要知道异决异方差性的方法的优越之处在于,不需要知道异方差性的具体形式。因此,在异方差性的基本结构方差性的具体形式。因此,在异方差性的基本结构未知的情况下,建议仍采用未知的情况下,建议仍采用OLS法

52、估计系数,而采法估计系数,而采用其方差的稳健估计量,如怀特的异方差性一致估用其方差的稳健估计量,如怀特的异方差性一致估计量。计量。五、实例五、实例 表表3-6(具体数据见教材)给出世界(具体数据见教材)给出世界31个国家个国家2008年居年居民人均消费支出和人均国民总收入的数据(以民人均消费支出和人均国民总收入的数据(以2000价格计价格计算)。算)。 第三节第三节 自相关自相关一一 、定义、定义 若若Cov(ui , uj) = E(uiuj) =0, ij不成立,即线性回不成立,即线性回归模型扰动项的方差归模型扰动项的方差协方差矩阵的非主对角线元协方差矩阵的非主对角线元素不全为素不全为0,

53、则称为扰动项自相关,或序列相关,则称为扰动项自相关,或序列相关(Serial Correlation)。)。 自相关不是指两个变量间的相关关系,而是自相关不是指两个变量间的相关关系,而是同同一变量前后期之间的相关关系一变量前后期之间的相关关系。二、二、 自相关的原因及后果自相关的原因及后果 (1)冲击的延期影响(惯性)冲击的延期影响(惯性) 在时间序列数据的情况下,随机冲击(扰动)的影在时间序列数据的情况下,随机冲击(扰动)的影响往往持续不止一个时期。例如,地震、洪水、罢工响往往持续不止一个时期。例如,地震、洪水、罢工或战争等将在发生期的后续若干期中影响经济运行。或战争等将在发生期的后续若干期

54、中影响经济运行。1. 原因原因 自相关主要发生在时间序列数据的情形,因而自相关主要发生在时间序列数据的情形,因而亦称为序列相关,主要有以下两种原因:亦称为序列相关,主要有以下两种原因: 微观经济中也与此类似,如一个工厂的产量,由微观经济中也与此类似,如一个工厂的产量,由于某种外部偶然因素的影响(如某种原材料的供应于某种外部偶然因素的影响(如某种原材料的供应出了问题),该厂某周产量低于正常水平,那么,出了问题),该厂某周产量低于正常水平,那么,随后的一周或几周中,由于这种影响的存在或延续,随后的一周或几周中,由于这种影响的存在或延续,产量也很可能低于正常水平(即扰动项为负)。产量也很可能低于正常

55、水平(即扰动项为负)。 不难看出,观测的周期越长,这种延期影响的严不难看出,观测的周期越长,这种延期影响的严重性就越小,因此,年度数据比起季度数据来,序重性就越小,因此,年度数据比起季度数据来,序列相关成为一个问题可能性要小。列相关成为一个问题可能性要小。 (2)误设定)误设定 如果忽略了一个有关的解释变量,而该变量是如果忽略了一个有关的解释变量,而该变量是自相关的,则将使扰动项自相关,不正确的函数形自相关的,则将使扰动项自相关,不正确的函数形式也将导致同样后果。在这些情况下,解决的方法式也将导致同样后果。在这些情况下,解决的方法是纠正误设定。本章后面将介绍的纠正自相关的方是纠正误设定。本章后

56、面将介绍的纠正自相关的方法都不适用于这种情况的自相关。法都不适用于这种情况的自相关。2后果后果 自相关的后果与异方差性类似。自相关的后果与异方差性类似。(1)在扰动项自相关的情况下,尽管)在扰动项自相关的情况下,尽管OLS估计量估计量 仍为无偏估计量,但不再具有最小方差的性质仍为无偏估计量,但不再具有最小方差的性质, 即不是即不是BLUE。 (2)OLS估计量的标准误差不再是真实标准误差估计量的标准误差不再是真实标准误差 的无偏估计量,使得在自相关的情况下,无法的无偏估计量,使得在自相关的情况下,无法 再信赖回归参数的置信区间或假设检验的结果。再信赖回归参数的置信区间或假设检验的结果。三三 、

57、自相关的检验、自相关的检验1检验一阶自相关的德宾检验一阶自相关的德宾沃森检验法(沃森检验法(DurbinWatson test) (1)一阶自相关)一阶自相关 自相关的最简单模式为:自相关的最简单模式为: ut = ut-1 + t, t=1,2,n. 其中其中称为自相关系数(称为自相关系数(-11-11),这种扰动项),这种扰动项的自相关称为一阶自相关,即扰动项仅与其前一期的的自相关称为一阶自相关,即扰动项仅与其前一期的值有关。我们有:值有关。我们有: 0 0 正自相关正自相关 0 0 负自相关负自相关 =0 =0 无自相关无自相关 在一阶自相关在一阶自相关模式模式中,假定中,假定t具有以下

58、性质:具有以下性质: E(t) = 0 , E(t) = 2 = 常数,常数, E(ij)=0, ij, t服从正态分布。服从正态分布。 在计量经济学中,具备在计量经济学中,具备上述上述性质的量称为性质的量称为白噪白噪声声(White noise),表示为),表示为 t= White noise 或或 t= 白噪声白噪声(2)德宾)德宾沃森检验法沃森检验法(Durbin=Watson d test) 统计软件包和研究报告在提供回归结果时通常都给出统计软件包和研究报告在提供回归结果时通常都给出DW(或(或d)统计量的值,该统计量是从)统计量的值,该统计量是从OLS回归的残差回归的残差中计算得来的

59、,它被用于一阶自相关的检验,计算公式为:中计算得来的,它被用于一阶自相关的检验,计算公式为: nttnttteeeDW12221)(DW和一阶自相关系数和一阶自相关系数的估计值之间存在以下近似的估计值之间存在以下近似关系:关系: DW 2 - 2 由于由于 -1 1,因而,因而0 DW 4。不难看出,直观判断准则是,当不难看出,直观判断准则是,当DW统计量接近统计量接近2时,则无自相关,时,则无自相关,DW值离值离2越远,则自相关存在的越远,则自相关存在的可能性越大。可能性越大。DWDW检验的缺陷检验的缺陷 我们当然期望有一张能够给出相应的我们当然期望有一张能够给出相应的n n、k k和和值值

60、下各种下各种DWDW临界值的表(就象临界值的表(就象t t检验,检验,F F检验一样),检验一样),使得我们可以按常规假设检验那样根据临界值作出使得我们可以按常规假设检验那样根据临界值作出判断。判断。 不幸的是,不幸的是,DWDW统计量的分布依赖于解释变量的具统计量的分布依赖于解释变量的具体观测值(即依赖于体观测值(即依赖于X X矩阵)。因此不象矩阵)。因此不象t t、F F检验那检验那样,有一张能够给出样,有一张能够给出DWDW临界值的表。临界值的表。 为解决这一问题,德宾为解决这一问题,德宾和和沃森证明,沃森证明,DW统计量统计量的真实分布位于两个极限分布之间,这两个分布分的真实分布位于两个极限分布之间,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论