期末精华:计量经济学针对三种误差检验方法_第1页
期末精华:计量经济学针对三种误差检验方法_第2页
期末精华:计量经济学针对三种误差检验方法_第3页
期末精华:计量经济学针对三种误差检验方法_第4页
期末精华:计量经济学针对三种误差检验方法_第5页
已阅读5页,还剩112页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 计量经济学检验计量经济学检验 违背基本假设的情况违背基本假设的情况 一方面,建立一个计量经济学模型要经过四一方面,建立一个计量经济学模型要经过四重检验,其中经济意义检验、统计检验、预重检验,其中经济意义检验、统计检验、预测检验已讲,这一章主要讲计量经济学检验测检验已讲,这一章主要讲计量经济学检验的范畴。的范畴。 另一方面,前面讨论了最小二乘估计的优良另一方面,前面讨论了最小二乘估计的优良性质,但都是基于经典假设。如果这些假设性质,但都是基于经典假设。如果这些假设不满足,会出现什么问题呢?这一章对其进不满足,会出现什么问题呢?这一章对其进行分析。行分析。本章内容本章内容 误设定误设

2、定(Misspecification 或或specification error) 多重共线性多重共线性(Multicollinearity) 异方差性异方差性(Heteroscedasticity) 自相关自相关(Autocorrelation)采用采用OLS法估计模型时,实际上有一个隐含的假法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:设,即模型是正确设定的。这包括两方面的含义:函数形式正确和解释变量选择正确函数形式正确和解释变量选择正确。在实践中,这。在实践中,这样一个假设或许从来也不现实。我们可能犯下列三样一个假设或许从来也不现实。我们可能犯下列三个方面

3、的错误:个方面的错误: 选择错误的函数形式选择错误的函数形式遗漏有关的解释变量遗漏有关的解释变量包括无关的解释变量包括无关的解释变量从而造成所谓的从而造成所谓的“误设定误设定”问题。问题。第一节第一节 误设定误设定 这类错误中比较常见的是将非线性关系作为线这类错误中比较常见的是将非线性关系作为线性关系处理。性关系处理。 前面介绍了被解释变量和解释变量都采用对数前面介绍了被解释变量和解释变量都采用对数的双对数模型,下面再介绍一种比较常见的函数形的双对数模型,下面再介绍一种比较常见的函数形式的模型:半对数模型。式的模型:半对数模型。一、选择错误的函数形式一、选择错误的函数形式 半对数模型指的是被解

4、释变量和解释变量中一个半对数模型指的是被解释变量和解释变量中一个为对数形式而另一个为线性的模型。被解释变量为为对数形式而另一个为线性的模型。被解释变量为对数形式的称为对数对数形式的称为对数-线性模型线性模型(log-lin model)。解。解释变量为对数形式的称为线性释变量为对数形式的称为线性-对数模型对数模型(lin-log model)。我们先介绍前者,其形式如下:。我们先介绍前者,其形式如下: 对数对数-线性模型中,斜率的含义是线性模型中,斜率的含义是Y的百分比变动,的百分比变动,即解释变量即解释变量X变动一个单位引起的被解释变量变动一个单位引起的被解释变量Y的百的百分比变动。这是因为

5、,利用微分可以得出:分比变动。这是因为,利用微分可以得出:tttuXY10ln) 1(1ln1dXYdYdXdYYdXYd半对数模型半对数模型 这表明,斜率度量的是这表明,斜率度量的是解释变量解释变量X的单位变动所的单位变动所引起的应变量引起的应变量Y的相对变动的相对变动。将此相对变动乘以。将此相对变动乘以100,就得到就得到Y的百分比变动,或者说得到的百分比变动,或者说得到Y的增长率。的增长率。由于对数由于对数-线性模型中斜率系数的这一含义,因而线性模型中斜率系数的这一含义,因而也叫增长模型也叫增长模型 (growth model)。增长模型通常用于。增长模型通常用于测度所关心的经济变量(如

6、测度所关心的经济变量(如GDP)的增长率。例如,)的增长率。例如,我们可以通过估计下面的半对数模型我们可以通过估计下面的半对数模型 得到一国得到一国GDP的年增长率的估计值的年增长率的估计值,这里,这里t为时间为时间趋势变量趋势变量。ttutGDP10)ln(二、二、 遗漏有关的解释变量遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量模型中遗漏了对因变量有显著影响的解释变量的后果是:可能使的后果是:可能使模型参数估计量不再是无偏估模型参数估计量不再是无偏估计量计量。证明如下:证明如下:三、三、 包括无关的解释变量包括无关的解释变量 模型中包括无关的解释变量,模型中包括无关的解释变量

7、,(1)参数估计量仍无偏,但会增大估计量的方差参数估计量仍无偏,但会增大估计量的方差,即增大误差(证明如下:)。即增大误差(证明如下:)。(2)出现)出现“过度拟合过度拟合”,损失模型自由度。,损失模型自由度。四、四、 解决解释变量误设定问题的原则解决解释变量误设定问题的原则 在模型设定中的一般原则是尽量不漏掉有关的解在模型设定中的一般原则是尽量不漏掉有关的解释变量。释变量。因为估计量有偏比增大误差更严重因为估计量有偏比增大误差更严重。但如。但如果方差很大,得到的无偏估计量也就没有多大意义果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。了,因此也不宜随意乱增加解释

8、变量。 在回归实践中,有时要对某个变量是否应该作为在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还件容易的事,因为目前还没有行之有效的方法没有行之有效的方法可供可供使用。尽管如此,还是有一些有助于我们进行判断使用。尽管如此,还是有一些有助于我们进行判断的准则可用,它们是:的准则可用,它们是:选择解释变量的四条准则选择解释变量的四条准则2R2R1.理论:理论: 从理论上看,该变量是否应该作为解释变从理论上看,该变量是否应该作为解释变量包括在方程中?量包括在方程中?2. t检验:该变量的系数估计

9、值是否显著检验:该变量的系数估计值是否显著?3. :该变量加进方程中后,:该变量加进方程中后, 是否增大?是否增大?4. 偏倚:偏倚: 该变量加进方程中后,其它变量的系数估该变量加进方程中后,其它变量的系数估计值是计值是否显著变化?否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是括在方程中;如果对四个问题的回答都是“否否”, 则该变则该变量是无关变量,可以安全地从方程中删掉它。量是无关变量,可以安全地从方程中删掉它。 当这四项用于判断一个变量是否应加进回归方程的准则当这四项用于判断一个变量是否应加进回归

10、方程的准则出现不一致的情况出现不一致的情况时,应当特别小心。在这种情况下,作出时,应当特别小心。在这种情况下,作出正确判断不是一件容易的事,但可以让事情变得容易一些,正确判断不是一件容易的事,但可以让事情变得容易一些,办法是将理论准则放在第一位办法是将理论准则放在第一位,再多的统计证据也不能将一,再多的统计证据也不能将一个理论上很重要的变量变成个理论上很重要的变量变成“无关无关”变量。变量。 在选择变量的问题上,应当坚定不移地在选择变量的问题上,应当坚定不移地根据理论而不是根据理论而不是满意的拟合结果来作决定满意的拟合结果来作决定,对于是否将一个变量包括在回归,对于是否将一个变量包括在回归方程

11、中的问题,方程中的问题,理论是最重要的判断准则理论是最重要的判断准则。如果不这样做,。如果不这样做,产生不正确结果的风险很大。产生不正确结果的风险很大。五、五、 检验误设定的检验误设定的RESET方法方法 上面给出了选择解释变量的四条准则。可是,有上面给出了选择解释变量的四条准则。可是,有时这些准则不能提供足够的信息使研究人员确信其时这些准则不能提供足够的信息使研究人员确信其设定是最恰当的,在这种情况下,可考虑使用一些设定是最恰当的,在这种情况下,可考虑使用一些更正规的检验方法来比较不同估计方程的性质。这更正规的检验方法来比较不同估计方程的性质。这类方法相当多,有一、二十种,这里就不一一列出,

12、类方法相当多,有一、二十种,这里就不一一列出,仅介绍仅介绍Ramsey的的回归设定误差检验法(回归设定误差检验法(RESET法)法)。 RESET检验法的思路检验法的思路 RESET检验法的思路是在要检验的回归方程中加检验法的思路是在要检验的回归方程中加进进 等项作为解释变量,然后看结果是否有等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在显著改善。如有,则可判断原方程存在遗漏有关变遗漏有关变量量的问题或的问题或其它的误设定其它的误设定问题。问题。432,YYY和RESET检验法的步骤检验法的步骤 RESET检验的具体步骤是:检验的具体步骤是:(1) 用用OLS法估计要要检

13、验的方程,得到法估计要要检验的方程,得到 (2) 由上一步得到的值由上一步得到的值 (i=1,2,n),计算),计算 ,然后用然后用OLS法估计:法估计: (3) 用用F检验比较两个方程的拟合情况(类似于上一章中检验比较两个方程的拟合情况(类似于上一章中联合假设检验采用的方法),如果两方程总体拟合情况联合假设检验采用的方法),如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论。显著不同,则我们得出原方程可能存在误设定的结论。使用的检验统计量为:使用的检验统计量为: iiiXXY22110432,YYY和iYiiiiiiiuYYYXXY45342322110) 1/(/ )(k

14、nRSSMRSSRSSFM其中:其中:RSSM为第一步中回归(有约束回归)的残差为第一步中回归(有约束回归)的残差平方和,平方和,RSS为第二步中回归(无约束回归)的残差为第二步中回归(无约束回归)的残差平方和,平方和,M为约束条件的个数,这里是为约束条件的个数,这里是M=3。 注意!注意! RESET检验仅能检验误设定的存在,而不能告诉我检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定们到底是哪一类的误设定。 研究表明,研究表明,RESET检验能够检验某个方程的设定误检验能够检验某个方程的设定误差,即使所有传统的检验标准,如拟合优度、一阶差,即使所有传统的检验标准,如拟合优度、一

15、阶自相关检验、系数符号以及较高的自相关检验、系数符号以及较高的t值都已给出令人值都已给出令人满意的结果。满意的结果。 因变量预测值的幂次从因变量预测值的幂次从2开始,因为开始,因为1次幂与次幂与x完全完全线性相关。线性相关。 Ramsey的的RESET检验只适用于检验只适用于LS估计的方程。估计的方程。 多重共线性的概念多重共线性的概念 多重共线性的后果多重共线性的后果 多重共线性的检验多重共线性的检验 克服多重共线性的方法克服多重共线性的方法第二节第二节 多重共线性多重共线性( Multi-Collinearity )一、多重共线性的概念一、多重共线性的概念1、多重共线性、多重共线性 对于模

16、型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相关性,如果某两个或多个解释变量之间出现了相关性,则称为则称为多重共线性多重共线性。 如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中: ci不全为0,即某一个解释变量可以用其它解某一个解释变量可以用其它解释变量的线性组合表示,则称为解释变量间存在释变量的线性组合表示,则称为解释变量间存在完完全共线性全共线性。 如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为一般共线性一

17、般共线性(近似共线性近似共线性)或或交互相关交互相关(intercorrelated)。 在矩阵表示的线性回归模型 Y=XB+N中,完全共线性指:秩完全共线性指:秩(X)10作为存在严重多重共线性的标准作为存在严重多重共线性的标准, 特别在解释变量多的情形应当如此。特别在解释变量多的情形应当如此。5.5.逐步回归法逐步回归法 以以Y为被解释变量,逐个引入解释变量,构成为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释

18、变量。合代替,而不作为独立的解释变量。 如果拟合优度变化显著,如果拟合优度变化显著,则说明新引入的变量则说明新引入的变量是一个独立解释变量;是一个独立解释变量; 如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的,则说明新引入的变量不是一个独立解释变量,它可以用其它变量变量不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存的线性组合代替,也就是说它与其它变量之间存在共线性关系。在共线性关系。四、克服多重共线性的方法四、克服多重共线性的方法 1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排

19、除出去,找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。是最为有效的克服多重共线性问题的方法。 注意:注意:剩余解释变量参数的经济含义和数值都发生了变化。剩余解释变量参数的经济含义和数值都发生了变化。2 2、第二类方法:差分法、第二类方法:差分法 对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型 Yi=1 X1i+2 X2i+k Xki+ i可以有效地消除存在于原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。线性关系弱得多。例如例如:在中国:在

20、中国消费模型中的消费模型中的2个变量个变量: 收入(Y:GDP)与消费 C 的总量与增量数据YC(-1)C(-1)/YYC(-1)C(-1)/Y1981490129760.60721982548933090.60285883330.56631983607636380.59965873290.56051984716440210.561310883830.35201985879246940.533916286730.413419861013357730.5697144110790.748819871178465420.555216517690.465819881470474510.50672920

21、9090.311319891646693600.5684176219091.083199018320105560.5762185411960.6451199121280113620.533929608060.2723199225864131460.5083458417840.3892199334501159520.4624863728060.3249199447111201820.42841261042300.3354199559405272160.45811229470340.5721199668498345290.5041909373130.8042 进一步分析:进一步分析: Y与C(-1

22、)之间的判定系数为0.9845, Y与C(-1)之间的判定系数为0.7456。 一般认为:一般认为:两个变量之间的判定系数大于0.8时,二者之间存在线性关系。 所以,原模型经检验地被认为具有多重共线性,而差分模型则可认为不具有多重共线性。3、第三类方法:减小参数估计量的方差、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较大多重共线性的主要后果是参数估计量具有较大的方差,所以采取适当方法减小参数估计量的方的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。消除多重共线性造

23、成的后果。 例如:增加样本容量增加样本容量,可使参数估计量的方差,可使参数估计量的方差减小。减小。 再如:再如:对系数施加约束对系数施加约束。 前面已讲过,约束性条件虽然通常使得残差前面已讲过,约束性条件虽然通常使得残差平方和增加,但可以使得参数的方差减少。平方和增加,但可以使得参数的方差减少。 如在如在CobbDouglas生产函数中加进规生产函数中加进规模效益不变的约束,可缓和资本和劳动的高模效益不变的约束,可缓和资本和劳动的高度相关而引起的多重共线性问题的影响。度相关而引起的多重共线性问题的影响。 再如再如:岭回归法岭回归法(Ridge Regression) 70年代发展的岭回归法,以

24、引入偏误为代价减小参数估计以引入偏误为代价减小参数估计量的方差,量的方差,受到人们的重视。 具体方法是:引入矩阵对角矩阵,使参数估计量为 4第四类方法:主成分法第四类方法:主成分法 该方法的原理:使用原来解释变量的主成该方法的原理:使用原来解释变量的主成分变量进行回归。分变量进行回归。 对全部解释变量运用主成分分析以得到主成分,对全部解释变量运用主成分分析以得到主成分,每个主成分是全部解释变量的线性组合,如每个主成分是全部解释变量的线性组合,如 其系数其系数 1, 2, k的计算涉及到矩阵的的计算涉及到矩阵的特征根、计算迭代过程和取值标准可参阅多元特征根、计算迭代过程和取值标准可参阅多元统计书

25、籍,这里不做介绍。统计书籍,这里不做介绍。kkXXXC.22111 需要了解的是,主成分的特点是,各主成需要了解的是,主成分的特点是,各主成分之间互不相关,并且,用很少几个主成分就分之间互不相关,并且,用很少几个主成分就可以解释全部可以解释全部X变量的绝大部分方差,因而在出变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。原成原模型中的参数估计值。一、异方差性的概念一、异方差性的概念二、异方差性的后果二、异方差性的后果三、异方差性的

26、检验三、异方差性的检验四、异方差性的估计四、异方差性的估计五、案例五、案例第三节第三节 异方差性(异方差性(Heteroskedasticity)说明说明 回顾我们应用回顾我们应用OLS法所需假设条件,其中大部法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:分是有关扰动项的统计假设,它们是:(1)E(ut)=0, t=1,2,n. 扰动项均值为扰动项均值为0(2)Cov(ui,uj) = E(uiuj) =0, ij. 扰动项相互独立扰动项相互独立(3)Var(ut) = E(ut) = 2 , , t=1,2,n. 常数方差常数方差(4)ut N(0, 2). ). 正态性正态性

27、对于(对于(1 1),我们可论证其合理性。而第(),我们可论证其合理性。而第(4 4)条,)条,也没有多大问题。大样本即可假定扰动项服从正态也没有多大问题。大样本即可假定扰动项服从正态分布。而对于(分布。而对于(2 2),(),(3 3)两条,则无法论证其合)两条,则无法论证其合理性。实际问题中,这两条不成立的情况比比皆是理性。实际问题中,这两条不成立的情况比比皆是。下面即将讨论它们不成立的情况,即。下面即将讨论它们不成立的情况,即异方差性异方差性和和自相关自相关的情形。的情形。一、异方差的概念一、异方差的概念 1 1、异方差的概念、异方差的概念对于模型 ikikiiiiXXXY2210 i=

28、1,2,n同方差性假设为 2)(iVar i=1,2,n如果出现 Varii()2 i=1,2,n即对于不同的样本点,随机误差项的方差不再是即对于不同的样本点,随机误差项的方差不再是常数,则认为出现了常数,则认为出现了异方差性异方差性。 什么情况下可能发生异方差性问题?什么情况下可能发生异方差性问题? 解释变量取值变动幅度大时,常数方差的假设解释变量取值变动幅度大时,常数方差的假设往往难以成立。异方差性主要发生在往往难以成立。异方差性主要发生在横截面数据横截面数据的的情况,时间序列问题中一般不会发生,除非时间跨情况,时间序列问题中一般不会发生,除非时间跨度过大。度过大。2 2、异方差的类型、异

29、方差的类型 同方差性假定的意义是指每个i围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个i的方差保持相同,即 i2 =常数 在异方差的情况下, i2已不是常数,它随X的变化而变化,即 i2 =f(Xi) 异方差一般可归结为三种类型:异方差一般可归结为三种类型:(1)单调递增型: i2随X的增大而增大;(2)单调递减型: i2随X的增大而减小;(3)复 杂 型: i2与X的变化呈复杂形式。3 3、实际经济问题中的异方差性、实际经济问题中的异方差性 在该模型中,在该模型中, i的同方差假定往往不符合实际情的同方差假定往往不符合实际情况。对高收入家庭来说,储蓄的

30、差异较大;低收入况。对高收入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定目的而储家庭的储蓄则更有规律性(如为某一特定目的而储蓄),差异较小。蓄),差异较小。 因此,因此, i的方差往往随的方差往往随Xi的增加而增加,呈单调递的增加而增加,呈单调递增型变化。增型变化。 例如:例如:在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi和Xi分别为第i个家庭的储蓄额和可支配收入。例:例:Yi = +Xi+ ui 其中:其中:Y=指定规模和组成的家庭每月消费支出指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入这样的家庭的每月可支配收入 设设X的的N个观

31、测值取自一个家庭可支配收入的横截个观测值取自一个家庭可支配收入的横截面样本。某些家庭接近于勉强维持生存的水平,另面样本。某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入。不难设想,低收入家庭一些家庭则有很高的收入。不难设想,低收入家庭的消费支出不大可能离开他们的均值的消费支出不大可能离开他们的均值E(Y)过远,)过远,太高无法支持,太低则消费将处于维持生存的水平太高无法支持,太低则消费将处于维持生存的水平之下。因此,低收入家庭消费支出额的波动应当较之下。因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差。而高收入家庭则小,因而扰动项具有较小的方差。而高收入家庭则没有这

32、种限制,其扰动项可能有大得多的方差。没有这种限制,其扰动项可能有大得多的方差。 这就意味着异方差性。这就意味着异方差性。二、异方差性的后果二、异方差性的后果1 1、参数估计量非有效、参数估计量非有效 普通最小二乘法参数估计量仍然具有无偏性仍然具有无偏性,但不具有有效性不具有有效性。因为在有效性证明中利用了 E(NN)=2I 而且,在大样本情况下,参数估计量仍然不具有仍然不具有渐近有效性渐近有效性,这就是说参数估计量不具有一致性。以一元线性回归模型为例进行说明:以一元线性回归模型为例进行说明:(1 1)仍存在无偏性:证明过程与方差无关)仍存在无偏性:证明过程与方差无关由于 iiiXY10 (2.

33、4.1)的参数1的 OLS 估计量1为: iiiiiiixxkYk2111故 1211)()()(iiiExxEE (2.4.2)(2 2)不具备最小方差性)不具备最小方差性由于 222222111)()()()()var(iiiiiixxExxEE 2222)()(iiixEx (注:交叉项)(,jjiijijixx的期望为零)在i为同方差的假定下, 22)()var(iiE 2222221)()var(iiixxx (2.4.3)在i存在异方差的情况下 )()()var(222iiiiXfE假设2)(iiXXf,并且记异方差情况下1的 OLS 估计为1,则 2222222221)()()v

34、ar(iiiiiiixXxxxXfx (2.4.4)对大多数经济资料有:1222iiixXx,比较(2.4.3)与(2.4.4), )var()var(11 (2.4.5)2 2、变量的显著性检验失去意义、变量的显著性检验失去意义在该统计量中包含有随机误差项共同的方差,并且有t统计量服从自由度为(n-k-1)的t分布。如果出现了异方差性,t检验就失去意义。其它检验也类似。 3 3、模型的预测失效、模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质; 另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2。 所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造

35、成对Y的预测误差变大,降低预测精度,预测功能失效。三、异方差性的检验三、异方差性的检验1 1、检验方法的共同思路、检验方法的共同思路 由于由于异方差性异方差性就是相对于不同的解释变量观测值,就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的解释变量观测值之间的相关性及其相关的“形式形式”。各种检验方法就是在这一思路下发展起来的。各种检验方法就是在这一思路下发展起来的。 问题在于用什么来表示随机误差项的方差问题在于用什么来表示随机

36、误差项的方差 一般的处理方法:一般的处理方法: 首先采用 OLS 法估计模型,以求得随机误差项的估计量 (注意, 该估计量是不严格的) , 我们称之为 “近近似估计量似估计量” ,用ei表示。于是有 OLSiiiYYe)( VarEeiii()()22 (2.4.7)即用ei2来表示随机误差项的方差。2 2、图示检验法(用的较多,最简单)、图示检验法(用的较多,最简单)(1)用)用X-Y的散点图进行判断的散点图进行判断 看是否存在明显的散点扩大散点扩大、缩小缩小或复杂型趋复杂型趋势势(即不在一个固定的带型域中)看是否形成一斜率为零的直线看是否形成一斜率为零的直线 ( (2 2) )X X- -

37、ei2的的散散点点图图进进行行判判断断ei2 ei2 X X 同方差 递增异方差ei2 ei2 X X 递减异方差 复杂型异方差 3 3、解析法、解析法(1 1)戈德菲尔德)戈德菲尔德- -匡特(匡特(Goldfeld-Quandt)检验)检验(几乎不用)(几乎不用) G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。 G-QG-Q检验的思想检验的思想: 先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差之比构造统计量进行异方差检验。 由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。G-QG-Q检

38、验的步骤:检验的步骤:将n对样本观察值(Xi,Yi)按某一解释变量Xi (可能是因为它引起的异方差性)观察值的大小排队;将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;对每个子样分别求回归方程,并计算各自的残差平方和。 分别用21ie与22ie表示对应较小iX与较大iX的子样本的残差平方和(自由度均为12kcn)提出假设:0H:2221,1H:2221 21与22分别为两个子样对应的随机项方差。构造统计量 ) 12, 12() 12() 12(2122kcnkcnFkcnekcneFii检验。给定显著性水平,确定 F

39、分布表中相应的临界值),(21vvF。 若 F),(21vvF,存在递增异方差; 反之,不存在异方差。(2 2)戈里瑟()戈里瑟(GleiserGleiser)检验与帕克()检验与帕克(ParkPark)检验)检验 戈里瑟检验与帕克检验的思想戈里瑟检验与帕克检验的思想(与图示法完全相同(与图示法完全相同) 选择关于变量jX的不同的函数形式(如2)(jijiXXf或ivjijieXXf2)() ,对方程进行估计并进行显著性检验; 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。例如:以|e|或ei2为被解释变量,以原模型的某一解释变量jX为解释变量,建立如下方程: ijiiX

40、fe)(| i=1,2,n (Gleiser)或 ijiiXfe)(2 i=1,2,n (Park)注意:注意: 由于f(Xj)的具体形式未知,因此需要进行各种形式的试验。 如 Park 检验法中,对一般的方程形式: ivjijieXXf2)(通过 ijiivXelnln)ln(22检验的显著性,若存在统计上的显著性,表明存在异方差性。(3 3)怀特()怀特(WhiteWhite)检验)检验(eviewseviews软件采用)软件采用)四、异方差性的估计四、异方差性的估计加权最小二乘法加权最小二乘法(WLS)Weighted Least SquaresWeighted Least Square

41、s1 1、加权最小二乘法的基本思想、加权最小二乘法的基本思想 加权最小二乘法加权最小二乘法是对原模型加权,使之变成一是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。小二乘法估计其参数。2 2、一个例子、一个例子 例如,如果在检验过程中已经知道:VarEf xiiiji( )( )()222即随机误差项的方差与解释变量jX之间存在相关性,那么可以用)(jXf去除原模型,使之变成如下形式的新模型: ijiijijiijiXXfXXfXfyXf22110)(1)(1)(1)(1 ijikijikXfXXf)(1)(1在

42、该模型中,存在 222)()(1)(1()(1(ijiijiijiEXfXfEXfVar即满足同方差性。于是可以用 OLS 估计其参数,得到关于参数01,k的无偏的、有效的估计量。这就是加权最小二乘法,在这里权就是)(1jiXf。3 3、一般情况、一般情况对于模型 Y=XB+N (2.4.8)存在 ECovE( )()() 02W W wwwn12 (2.4.9)即存在异方差性异方差性。 设 WDD其中 nwwD1该模型具有同方差性。因为 1111*)()()(DDDDNNEENNE IDDDDWDD1111222用D1左乘(2.4.8)两边,得到一个新的模型: D YD XD111 (2.4

43、.10)即 YX* 这就是原模型(2.4.8)的加权最小二乘估计量,它是无偏、有效的。 这里权矩阵为D-1,它来自于矩阵W 。于是,可以用 OLS 法估计模型(2.4.10),得 ()* X XX Y1 ()()X DD XX DD YX W XX W Y11111111 (2.4.11) 如果方差已知的话,估计过程就变得很简单。如果方差已知的话,估计过程就变得很简单。但通常情况下,方差未知,从而还需要构造但通常情况下,方差未知,从而还需要构造权重矩阵。权重矩阵。4 4、求得权矩阵、求得权矩阵W W的一种实用方法的一种实用方法 从前面的推导过程看,它来自于原模型(2.4.8)残差项N的方差-协

44、方差矩阵,因此仍然可对原模型(2.4.8)首先采用OLS法,得到随机误差项的近似估计量,以此构成权矩阵的估计量,即 W eeen12222,| /1|1|1211neeeD (2.4.12)5 5、加权最小二乘法具体步骤、加权最小二乘法具体步骤 选择普通最小二乘法估计原模型,得到随机误差项的近似估计量ei; 建立|1ie的数据序列; 选择加权最小二乘法,以|1ie序列作为权,进行估计得到参数估计量。实际上是以|1ie乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。Eviews操作操作 演示加权最小二乘法的演示加权最小二乘法的eviews操作。工作文操作。工作文件名为加权最小二乘法

45、。件名为加权最小二乘法。 例子来自高铁梅例子来自高铁梅eviews应用与实例应用与实例 例子中,被解释变量例子中,被解释变量cum表示人均家庭交通表示人均家庭交通与通讯支出,解释变量为可支配收入与通讯支出,解释变量为可支配收入in。6、注意、注意 在实际建模过程中,尤其是截面数据作样本时,在实际建模过程中,尤其是截面数据作样本时,人们通常人们通常并不对原模型进行异方差性检验,而是直并不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样接选择加权最小二乘法,尤其是采用截面数据作样本时。本时。 如果确实存在异方差,则被有效地消除了;如果确实存在异方差,则被有效地消除了;

46、如果不存在异方差性,则加权最小二乘法等价如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。于普通最小二乘法。 加权最小二乘法分两步进行:加权最小二乘法分两步进行: 第一步:先对原模型进行回归,求出残差。第一步:先对原模型进行回归,求出残差。 第二步:建立一些序列,其值等于残差绝对第二步:建立一些序列,其值等于残差绝对值的倒数。以该序列为权重进行加权最小二值的倒数。以该序列为权重进行加权最小二乘回归。乘回归。 在应用软件中,给出了权矩阵的多种选择。在应用软件中,给出了权矩阵的多种选择。 其中,其中,加权最小二乘法加权最小二乘法需要自己输入权矩阵,需要自己输入权矩阵,这在已知异方差的形式时

47、经常采用(权重的形式这在已知异方差的形式时经常采用(权重的形式可以多样,可能是某个解释变量的倒数,或者平可以多样,可能是某个解释变量的倒数,或者平方的倒数,如果事前确实知道异方差的形式时)。方的倒数,如果事前确实知道异方差的形式时)。 如果对异方差形式一无所知时,如果对异方差形式一无所知时,eviews提供提供了两种更一般的异方差解决方法:了两种更一般的异方差解决方法: White权矩阵(权矩阵(假设残差没有序列相关假设残差没有序列相关)、Newey-West权矩阵(权矩阵(假设残差可以存在序假设残差可以存在序列相关列相关)。 这意味着,即使不需要实际指明异方差这意味着,即使不需要实际指明异方

48、差的类型,也可以基于普通最小二乘估计结果的类型,也可以基于普通最小二乘估计结果进行合理推断。进行合理推断。 其中,后两种方式可与第一种方式(自其中,后两种方式可与第一种方式(自己输入权重)结合起来使用。己输入权重)结合起来使用。五、案例五、案例1某地区居民储蓄模型某地区居民储蓄模型某地区某地区31年来居民收入与储蓄额数据表年来居民收入与储蓄额数据表 表 4-1 单位:万元年份 居民收入(X)储蓄(Y)年份 居民收入(X)储蓄(Y)年份 居民收入(X)储蓄(Y)19688777264197917663950 199029560210519699210105198018575779 1991281

49、5016001970995490198119535819 19923210022501971105081311982211631222 19933250024201972109791221983228801072 19943525025701973119121071984241271578 19953350017201974127474061985256041654 19963600019001975134995031986265001400 19973620021001976142694311987276701829 1998382002300197715522588198828300220

50、019781673089819892743020171、直接使用OLS法得: XY0846. 060.665 (-5.87) (18.04) 2R=0.91821 1、普通最小二乘估计、普通最小二乘估计2 2、异方差检验、异方差检验(1 1)图示检验)图示检验050010001500200025003000050001000015000200002500030000350004000045000XY G-Q G-Q检验检验求两个子样本(求两个子样本(n1=n2=12)回归方程的残差平方和)回归方程的残差平方和RSS1与与RSS2;对第 1 个子样本(19681979) :XY0954.058.

51、8231 (- 4.864) (7.300)2R=0.842, 1RSS=2ie=162899.2计算F统计量 F=RSS2/RSS1=769899.2/162899.2=4.726查表 在5%的显著性水平下,第1和第2自由度均为(31-7)/2-2=10的F分布临界值为 F0.05(10,10)=2.97由于 F=4.72 F0.05(10,10)= 2.97因此,否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性总体随机项存在递增异方差性。 Park Park检验检验 显然,lnXi前的参数表现为统计上显著的,表明原数据存在异方差性表明原数据存在异方差性。 对直接使用 OLS 法估计的残差项的平方2ie进行如下一般形式的回归:iiivXelnln2得: iiivXeln81. 299.17ln2 t (-2.89) (4.48) 2R=0.40933 3、异方差模型的估计、异方差模型的估计设异方差222iiX, 以iiXXf)(去除原模型两边,得新模型*1*0*XY其中iXYY/*,iXX/1*,iX/*运用 OLS 法得 086. 05 .70

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论