版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章经典假设条件不满足时的问题及对策本章内容第一节多重共线性第二节异方差性第三节自相关第四节随机解释变量OLS估计量令人满意的性质,是根据一组假设条件而得到的。在实践中,如果某些假设条件不能满足,则OLS就不再是模型的最佳估计法。下面列出实践中可能碰到的一些常见问题
★多重共线性(Multicollinearity)★异方差性(Heteroscedasticity或Heteroskedasticity)★自相关(Autocorrelation)★随机解释变量(Stochasticexplanatoryvariables)
本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。第一节多重共线性
应用OLS法的一个假设条件是;矩阵X的秩=K+1<N。即自变量之间不存在严格的线性关系,观测值个数大于待估计的参数的个数。这两条无论哪一条不满足,则OLS估计值的计算无法进行,估计过程由于数学原因而中断,就象分母为0一样。
这两种情况都很罕见。然而,自变量之间存在近似的线性关系则是很可能的事。事实上,在经济变量之间,这种近似的线性关系是很常见的。当某些解释变量高度相关时,尽管估计过程不会中断,但会产生严重的估计问题,我们称这种现象为多重共线性。解释变量间存在严格线性相关关系时,称为完全的多重共线性。一、定义在实践中,若两个或多个解释变量高度线性相关,我们就说模型中存在多重共线性。二、后果
1.不改变参数估计量的无偏性;事实上,对于不完全多重线性,参数估计量仍为BLUE。
这是因为,尽管解释变量之间存在多重共线性,但并不影响扰动项和解释变量观测值的性质,故仍有
2.但各共线变量的参数的OLS估计值方差很大,即估计值精度很低。(BLUE表明在各线性无偏估计量中方差最小,但不等于方差的值很小。)3.由于若干个X变量共变,它们各自对因变量的影响无法确定。
4.各共线变量系数估计量的t值低,使得犯第Ⅱ类错误的可能性增加。由于各共线变量的参数的OLS估计值方差大,因而系数估计量的t值低,使得我们犯第Ⅱ类错误(接受错误的原假设H0:βj=0)的可能性增加,容易将本应保留在模型中的解释变量舍弃了。1.根据回归结果判别判别是否存在多重共线性的最简单方法是分析回归结果。如果发现:
系数估计值的符号不对;某些重要的解释变量t值低,而R2不低;当一不太重要的解释变量被删除后,回归结果显著变化。则可能存在多重共线性。其中上述第二种现象是多重共线性存在的典型迹象。此方法简便易行,因而是实践中最常用的方法,缺点是无法确诊。三、多重共线性的判别和检验2.使用相关矩阵检验
统计软件一般提供各解释变量两两之间的相关系数矩阵,如发现某些相关系数高(绝对值高于0.8或0.90),则表明多重共线性存在。但即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。
3.通过条件指数检验条件指数(Conditionindex)或条件数Conditionnumber)是X´X矩阵的最大和最小特征根之比的平方根,条件指数高,表明存在多重共线性。至于什么程度算高,也没有一个绝对的标准。通常认为大于10即存在多重共线性,大于30表明存在严重多重共线性。大多数统计软件提供此检验值。4.使用VIF检验VIF是方差膨胀因子的英文
(VarianceInflationFactors)缩写,这是一种比较正规的检验方法。该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性。方程中每个解释变量有一个VIF,该VIF是关于多重共线性使相应的系数估计值的方差增大了多少的一个估计值。高VIF表明多重共线性增大了系数估计值的方差,从而产生一个减小了的t值。VIF检验的具体步骤如下:
设原方程为:Y=0+1X1+2X2+…+kXk+u我们需要计算K个不同的VIF,每个Xi一个。为指定Xi计算VIF涉及以下三步:
(1)Xi对原方程中其它全部解释变量进行OLS回归,例如,若i
=1,则回归下面的方程:
X1=1+2X2+3X3+…+kXk
+v(2)计算的方差膨胀因子(VIF):
其中Ri2是第一步辅助回归的决定系数。
(3)分析多重共线性的程度VIF越高,多重共线性的影响越严重。由于没有VIF临界值表,我们只能使用经验法则:若,则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。需要指出的是,所有VIF值都低,并不能排除严重多重共线性的存在,这与使用相关系数矩阵检验的情况相似。
四、解决多重共线性的方法
思路:加入额外信息。具体方法有以下几种:增加数据对模型施加某些约束条件删除一个或几个共线变量将模型适当变形1.增加数据多重共线性实质上是数据问题,因此,增加数据就有可能消除或减缓多重共线性,具体方法包括增加观测值、利用不同的数据集或采用新的样本。例3.1需求函数Yt=β1+β2Xt+β3Pt+ut
在时间序列数据中,收入(X)和价格(P)往往是高度相关的,用时间序列数据估计往往会产生多重共线性。然而,在横截面数据中,则不存在这个问题,因为某个特定时点P为常数。如果取一横截面样本(如从5000个家庭取得的数据),则可用来估计
Yi=α1+α2Xi+ui
然后将得到的估计值作为一个约束条件(β2=
)施加于时间序列数据的回归计算中,即估计
Yt
-Xt
=β1+β3Pt+ut
,得到,。2.对模型施加某些约束条件在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差,如在Cobb—Douglas生产函数中加进规模效益不变的约束,可解决资本和劳动的高度相关而引起的多重共线性问题。
3.删除一个或几个共线性变量这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可根据假设检验的结果确定。应注意的是,这种做法可能会使得到的系数估计量产生偏倚,因而需要权衡利弊。4.将模型适当变形例1.某商品的需求函数为:其中:Q=需求量,X=收入,
P=该商品的价格,P*=替代商品的价格在实际数据中,P和P*往往呈同方向变动,它们之间高度相关,模型存在多重共线性。如果我们仅要求在知道两种商品的相对价格变动时,对需求量进行预测,则可将需求函数变为:就可以解决多重共线性问题。例2.有滞后变量的情形
Yt=β1+β2Xt+β3Xt-1+ut
一般而言,Xt和Xt–1往往高度相关,将模型变换为:
Yt=β1+β2(Xt
-
Xt–1)+β3´Xt-1+ut
其中β3´=β3+β2
经验表明:△Xt和Xt–1的相关程度要远远小于和Xt和Xt–1的相关程度,因而这种变换有可能消除或减缓多重共线性。五、处理多重共线性问题的原则1.多重共线性是普遍存在的,轻微的多重共线性问题可不采取措施。
2.严重的多重共线性问题,一般可根据经验或通过分析回归结果发现。如影响系数的符号,重要的解释变量t值很低。要根据不同情况采取必要措施。
3.如果模型仅用于预测,则只要拟合好,可不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不影响预测结果。六、实例
选取全国1978-2008年的时间序列数据对我国城镇就业人数建立多元线性回归模型。影响因素有名义GDP、GDP平减指数、工业总产值、城镇登记失业人数、时间(1978年为1,1979年为2,依此类推)。具体数据与变量名称见教材表3-5,回归结果如下。
回归结果显示,模型拟合优度非常高,为0.9968,F统计量也显示模型具有整体显著性。但是GDP、GDP平减指数、工业总产值均未能通过5%显著性检验,且GDP平减指数的系数为负,与理论预期不符,同时GDP与工业总产值的系数非常小,因此怀疑存在多重共线性问题。为了更加清晰的进行说明,表3-2给出了所有变量之间的相关系数。从第1行可以看出,被解释变量与所有解释变量之间的关系均为正相关。此外,解释变量间显示出高度相关,如GDP与工业总产值,GDP平减指数与时间T之间的相关性都大于0.95,这意味着多重共线性的存在。
下面我们对多重共线性进行处理。将GDP与GDP平减指数合并,即将名义GDP用平减指数进行调整,得到实际GDP作为新的解释变量,同时去掉工业总产值变量。最终结果如下。回归模型拟合程度非常好。所有参数都具有显著性,符号符合经济意义,且拟合优度几乎没有下降。可以认为原模型的多重共线性问题已得到解决。第二节异方差性
上面我们讨论了误设定和多重共线性问题。回顾我们应用OLS法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:(1)E(ut)=0,t=1,2,…,n.扰动项均值为0(2)Cov(ui,uj)=E(uiuj)=0,i≠j.扰动项相互独立(3)Var(ut)=E(ut²)=2
,t=1,2,…,n.常数方差(4)ut
~N(0,2).正态性
对于(1),我们可论证其合理性。而第(4)条,也没有多大问题。大样本即可假定扰动项服从正态分布。而对于(2),(3)两条,则无法论证其合理性。实际问题中,这两条不成立的情况比比皆是。下面即将讨论它们不成立的情况,即异方差性和自相关的情形。一、异方差性及其后果1. 定义若Var(ut)==常数的假设不成立,即
Var(ut)=≠常数,则称扰动项具有异方差性。2. 什么情况下可能发生异方差性问题?解释变量取值变动幅度大时,常数方差的假设往往难以成立。异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时间跨度过大。例3.4Yi=α+βXi+ui
其中:Y=指定规模和组成的家庭每月消费支出
X=这样的家庭的每月可支配收入设X的N个观测值取自一个家庭可支配收入的横截面样本。某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入。不难设想,低收入家庭的消费支出不大可能离开他们的均值E(Y)过远,太高无法支持,太低则消费将处于维持生存的水平之下。因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差。而高收入家庭则没有这种限制,其扰动项可能有大得多的方差。这就意味着异方差性。
3.异方差性的后果(1)参数估计量不再具有最小方差的性质异方差性不破坏OLS估计量的无偏性,但不再是有效的。事实上,异方差性的存在导致OLS估计量既不是有效的,也不具有渐近有效性。这有两层含义。首先,小样本性质—BLUE的丧失意味着存在着另外的线性无偏估计量,其抽样方差小于OLS估计量的方差。其次,渐近有效性这一大样本性质的丧失,意味着存在着另外的一致估计量,其抽样分布当样本容量增大时,向被估计的回归参数收缩的速度要比OLS估计量快。
(2)系数的置信区间和假设检验结果不可信赖更为严重的是,在异方差性的情况下,矩阵主对角元素不再是OLS估计量方差的无偏估计量,从而导致系数的置信区间和假设检验结果不可信赖。在异方差性的情况下,系数估计量的方差既有可能低估,也有可能高估真实方差。在这两种情况下,都会产生检验结果的误导。例如,被检验的系数实际上不是统计上显著的,而由于矩阵的主对角元素低估了OLS估计量的相应方差,检验结果却表明其显著。(问题:低估方差是否是好事?)二、异方差性的检验
异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性。
常用的检验方法有:
戈德弗尔德—匡特检验法(Goldfeld
Quandttest)
格里瑟检验法(Glesjertest)帕克检验法(Parktest)怀特检验法(White’sGeneralHeteroscedasticitytest)
布鲁奇-帕根检验法(Breusch-PaganTest)1.戈德弗尔德——匡特检验法基本思路:假定随Yt的数值大小变动。检验步骤:(1)将数据分为三组:小Yt值组,中Yt值组,大Yt值组(数据项大致相等)(2)对小Yt值组估计模型,给出
(3)对大Yt值组估计模型,给出
(4)H0:
H1:(或)
检验统计量为F0=
~F(n3-k-1,n1-k-1)若F0>Fc,则拒绝H0,存在异方差性。
例3.5S=α+βY+u其中:S=储蓄Y=收入设1951—60年,=0.016251970—79年,
=0.9725F0=0.9725/0.01625=59.9
查表得:d.f.为(8,8)时,5%Fc=3.44∵F0>Fc
因而拒绝H0。结论:存在异方差性。2.怀特检验法(White’sGeneralHeteroscedasticityTest)
怀特提出的检验异方差性的方法在实践中用起来很方便,下面用一个三变量线性模型扼要说明其检验步骤。设模型如下:White检验步骤如下:(1)用OLS法估计(1)式,得到残差ei
;(2)进行如下辅助回归即残差平方对所有原始变量、变量平方以及变量交叉积回归,得到R2值;(3)进行假设检验原假设H0:不存在异方差性(即方程(2)全部斜率系数均为零)
备择假设H1:存在异方差性(即H0不成立)
怀特证明了下面的命题:在原假设H0成立的情况下,从(2)式得到的R2值与观测值数目(n)的乘积(n×R2)服从自由度为k的2分布,自由度k为(2)式中解释变量的个数。即
n·R2
~
2(k)
因此,怀特检验的检验统计量就是n·R2
,其抽样分布为自由度为k的2分布。检验步骤类似于t检验和F检验。例3.6
根据2006年内地31省市的数据,研究文化娱乐支出Y与人均可支配收入X1和文化娱乐价格X2之间的关系,建立回归模型,得到如下估计结果:
Y=1661.54+0.135X1-20.64X2
t:(14.44)(-1.18)由于各个省市的收入差距比较大,文化娱乐支出的差距也会比较大,因此可能存在异方差性。下面通过white检验来判断是否存在异方差性。先对该模型作OLS回归,得到残差;然后做如下辅助回归:使用EViews软件,得到辅助回归的,因此
(3)检验:不存在异方差性:存在异方差性查表,在5%的显著性水平下,自由度为5的值为11.07,因为>11.07,所以拒绝原假设,结论是存在异方差性。三、广义最小二乘法1.消除异方差性的思路基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用OLS法进行估计。对于模型
Yt=β0+β1X1t+…+βk
Xkt+ut
(1)若扰动项满足E(ut)=0,E(uiuj)=0,i≠j,但E(ut2)=σt2≠常数.
也就是说,该模型只有同方差性这一条件不满足,则只要能将具有异方差性的扰动项的方差表示成如下形式:
由于
其中为一未知常数,表示一组已知数值,则用λt去除模型各项,得变换模型:
所以变换后模型的扰动项的方差为常数,可以应用OLS法进行估计,得到的参数估计量为BLUE。但这里得到的OLS估计量是变模后模型(2)的OLS估计量。对于原模型而言,它已不是OLS估计量,称为广义最小二乘估计量(GLS估计量)。2. 广义最小二乘法(Generalizedleastsquares)
下面用矩阵形式的模型来推导出GLS估计量的一般计算公式。设GLS模型为Y=Xβ+u
(1)满足E(u)=0,E(uu´)=2Ω,X
非随机,
X的秩=K+1<n,其中Ω为正定矩阵。
根据矩阵代数知识可知,对于任一正定矩阵Ω,存在着一个满秩(非退化,非奇异)矩阵P,使得用P-1左乘原模型(1)(对原模型进行变换):令Y*=P-1Y,X*=P-1X,u*=P-1u,得到
Y*=X*β+u*
(2)
下面的问题是,模型(2)的扰动项u*是否满足OLS法的基本假设条件。我们有这表明,模型(2)中的扰动项u*满足OLS法的基本假设,可直接用OLS估计,估计量向量
这就是广义最小二乘估计量(GLS估计量)的公式,该估计量是BLUE。从上述证明过程可知,我们可将GLS法应用于Ω为任意正定矩阵的情形。如果只存在异方差性,则其中我们显然有四、解决异方差问题的方法1.可行广义最小二乘法(FGLS法)
广义最小二乘法从理论上解决了扰动项存在异方差性的情况下模型的估计问题,但在实践中是否可行呢?从GLS估计量的公式可知,要计算GLS估计值,我们必须知道矩阵。而实际问题中矩阵极少为已知。因此,在实践中直接应用GLS法基本上不可行。
但在很多情况下,我们可以根据实际问题提供的信息估计矩阵,再应用GLS法,这种方法称为可行广义最小二乘法(FeasibleGeneralizedLeastSquares,FGLS)。例如在仅存在异方差性的情况下,如果在实际问题中,研究人员确信可以准确估计异方差性的结构,如扰动项方差与某个解释变量成正比,就可以采用FGLS法。由于FGLS法的核心是估计矩阵,因此亦称为估计的广义最小二乘法(EstimatedGeneralizedLeastSquares,EGLS)。FGLS法的第一步是确定异方差性的具体形式,也就是找出决定扰动项方差与某组已知数值之间关系的函数形式,然后用这个关系得到每个扰动项方差的估计值,从而得到矩阵的估计值,最后计算FGLS估计量:例3.7Yt=β1+β2Xt+utt=1,2,…,n.其中Y=家庭消费支出X=家庭可支配收入我们在前面已分析过,高收入家庭有较大的扰动项方差,因此不妨假定扰动项方差与可支配收入成正比,即Var(ut)=δXt,t=1,2,…,n.
式中δ是一未知常数,由于Xt为已知,相当于,而δ相当于,因此
应用GLS法,即可得出β的FGLS估计量。
在上例中我们假设扰动项方差与解释变量的取值成正比,这种假设是否真正合理呢?根据经验和分析做出的这种假设,虽然有一定道理,但未免显得过于武断,这方面还可做一些比较细致的工作。
Glesjer检验法不仅可检验异方差性的存在,还可用于提供有关异方差形式的进一步信息,对于确定Ω矩阵很有用,下面我们扼要说明格里瑟检验法的思路和步骤。
格里瑟检验法的思路格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系,方法是用对被认为与扰动项方差有关的解释变量回归,确定和该解释变量的关系。由于与该解释变量之间关系的实际形式是未知的,因此需要用该解释变量的不同幂次进行试验,选择出最佳拟合形式。具体步骤如下:
(1)因变量Y对所有解释变量回归,计算残差et
(t=1,2,…,n)(2)对所选择解释变量的各种幂次形式回归,如然后利用决定系数,选择拟合最佳的函数形式。(3)对β1进行显著性检验,若显著异于0,则表明存在异方差性,否则再试其它形式。
例3.8Yt=β1+β2X1t+…+βk
Xkt+ut
假设我们根据经验知道扰动项方差与Xjt有关,并用格里瑟法试验,得出:
则
在大多数应用中,由于通过矩阵运算计算相对复杂,因而对于仅存在异方差性的问题,通常采用另一种等价的方法-加权最小二乘法(WLS)。加权最小二乘法
对于仅存在异方差性的问题,其Ω矩阵是一个对角矩阵,即
在这种情况下应用广义最小二乘法,也就是在原模型两端左乘矩阵
变换原模型,再对变换后的模型应用普通最小二乘法进行估计。这种作法实际上等价于在代数形式的原模型
Yt=β0+β1X1t+…+βkXkt+ut
的两端除以
t,得变换模型:相当于在回归中给因变量和解释变量的每个观测值都赋予一个与相应扰动项的方差相联系的权数,然后再对这些变换后的数据进行OLS回归,因而被称为加权最小二乘法(WLS法,WeightedLeastSquares)。
加权最小二乘法是FGLS法的一个特例,在矩阵为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式的可行广义最小二乘估计量公式得到FGLS估计值,亦可避开矩阵运算,采用加权最小二乘法得到其WLS估计值,两者结果完全相同,无论你称之为FGLS估计值还是WLS估计值,二者是一码事。例3.9
其中:Y=R&D支出,X=销售额采用美国1988年18个行业的数据估计上述方程,结果如下(括号中数字为t值):
这里是横截面数据,由于行业之间的差别,可能存在异方差性。
假设
应用格里瑟法试验,得到异方差性形式为:将原模型(1)的两端除以,得
用OLS法估计(2)式,结果如下(括号中数字为t值):
与(1)式的结果比较,两个方程斜率系数的估计值相差不大,但采用WLS法估计的比直接用OLS法估计的系数更为显著。2.仍采用OLS法估计系数,但采用OLS估计量标准误差的异方差性一致估计值代替其OLS估计值怀特(H.White)在1980年提出的产生OLS估计量的异方差性一致标准误差的方法,为解决异方差性问题提供了另一种途径。怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,该后果是由于方差的OLS估计量不再是无偏估计量而造成的。
我们用简单线性回归模型对怀特方法作一说明。在异方差的情况下,的方差是
可以证明,将涉及所有的,而不是一个共同的。这意味着回归软件包所报告的作为的方差估计值有两个错误。扰动项方差的估计量的期望均值第一,它用的不是方差的正确公式(5.25);第二,它用估计一个共同的,而事实上诸是不同的。怀特的方法是在(5.25)式中用取代,这里是第i个OLS残差,即
请注意,我们并不能用得到的一致估计量,因为在这种情况下,每个要估计的参数仅有一个观测值,当样本增大时,未知的数目也在同步增加。怀特得到的是的一致估计量,它是的加权平均。同样的分析适用于多元回归OLS估计量的情况,在这种情况下,用怀特方法得到的第K个OLS回归系数的方差的异方差性一致估计值由下式给出:其中是从对方程中所有其它解释变量回归得到的OLS残差的平方,为原多元回归模型的第i个OLS残差。很多回归软件包提供诸方差的怀特异方差性一致估计值以及对应的稳健t统计值(robustt-statistics)。例如,使用EViews,先点击Quick,选择EstimateEquation,再击Options,从下拉菜单中选其中的一个选项White,即可得到诸方差的异方差性一致估计值。
通过使用诸方差的怀特异方差性一致估计值代替其OLS估计值,我们解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,从而也就解决了在异方差性存在的情况下能否使用OLS法估计方程的问题。结论是我们仍可用OLS法估计方程的系数,因为尽管存在异方差性,系数的OLS估计量毕竟还是无偏和一致估计量,应该说还是具有良好性质的估计量。只不过方差-协方差矩阵不能再用OLS法估计,而要采用怀特之类的方法,得到一致估计量,如怀特的异方差性一致估计量。
这类估计量的性质不是“最好”,但它们对于某些假设条件(在这里是同方差性)的违背不敏感,这类的估计量称为稳健估计量(robustestimators)。与我们前面介绍的FGLS法相比,本段介绍的解决异方差性的方法的优越之处在于,不需要知道异方差性的具体形式。因此,在异方差性的基本结构未知的情况下,建议仍采用OLS法估计系数,而采用其方差的稳健估计量,如怀特的异方差性一致估计量。五、实例
表3-6(具体数据见教材)给出世界31个国家2008年居民人均消费支出和人均国民总收入的数据(以2000价格计算)。第三节自相关一、定义
若Cov(ui
,uj)=E(uiuj)=0,i≠j不成立,即线性回归模型扰动项的方差—协方差矩阵的非主对角线元素不全为0,则称为扰动项自相关,或序列相关(SerialCorrelation)。自相关不是指两个变量间的相关关系,而是同一变量前后期之间的相关关系。二、自相关的原因及后果
(1)冲击的延期影响(惯性)在时间序列数据的情况下,随机冲击(扰动)的影响往往持续不止一个时期。例如,地震、洪水、罢工或战争等将在发生期的后续若干期中影响经济运行。1.原因自相关主要发生在时间序列数据的情形,因而亦称为序列相关,主要有以下两种原因:
微观经济中也与此类似,如一个工厂的产量,由于某种外部偶然因素的影响(如某种原材料的供应出了问题),该厂某周产量低于正常水平,那么,随后的一周或几周中,由于这种影响的存在或延续,产量也很可能低于正常水平(即扰动项为负)。不难看出,观测的周期越长,这种延期影响的严重性就越小,因此,年度数据比起季度数据来,序列相关成为一个问题可能性要小。
(2)误设定如果忽略了一个有关的解释变量,而该变量是自相关的,则将使扰动项自相关,不正确的函数形式也将导致同样后果。在这些情况下,解决的方法是纠正误设定。本章后面将介绍的纠正自相关的方法都不适用于这种情况的自相关。2.后果
自相关的后果与异方差性类似。(1)在扰动项自相关的情况下,尽管OLS估计量仍为无偏估计量,但不再具有最小方差的性质,
即不是BLUE。(2)OLS估计量的标准误差不再是真实标准误差的无偏估计量,使得在自相关的情况下,无法再信赖回归参数的置信区间或假设检验的结果。三、自相关的检验1.检验一阶自相关的德宾—沃森检验法(Durbin—Watsontest)(1)一阶自相关自相关的最简单模式为:
ut
=ρut-1+εt,t=1,2,…,n.
其中ρ称为自相关系数(-1≤ρ≤1),这种扰动项的自相关称为一阶自相关,即扰动项仅与其前一期的值有关。我们有:
ρ>0正自相关
ρ<0负自相关
ρ=0无自相关
在一阶自相关模式中,假定εt具有以下性质:
E(εt)=0,E(εt²)=σ2=常数,
E(εiεj)=0,i≠j,εt服从正态分布。在计量经济学中,具备上述性质的量称为白噪声(Whitenoise),表示为
εt=Whitenoise
或
εt=白噪声(2)德宾—沃森检验法(Durbin=Watsondtest)
统计软件包和研究报告在提供回归结果时通常都给出DW(或d)统计量的值,该统计量是从OLS回归的残差中计算得来的,它被用于一阶自相关的检验,计算公式为:
DW和一阶自相关系数ρ的估计值之间存在以下近似关系:
DW≈2-2
由于-1≤ρ≤1,因而0≤DW≤4。不难看出,直观判断准则是,当DW统计量接近2时,则无自相关,DW值离2越远,则自相关存在的可能性越大。DW检验的缺陷
我们当然期望有一张能够给出相应的n、k和α值下各种DW临界值的表(就象t检验,F检验一样),使得我们可以按常规假设检验那样根据临界值作出判断。不幸的是,DW统计量的分布依赖于解释变量的具体观测值(即依赖于X矩阵)。因此不象t、F检验那样,有一张能够给出DW临界值的表。为解决这一问题,德宾和沃森证明,DW统计量的真实分布位于两个极限分布之间,这两个分布分别称为下分布和上分布,如下图所示:每个分布的95%临界水平用A,B,C,D表示。概率密度0ABCDDW值下分布上分布
现假设DW统计量的值位于A的左边,则不管这种情况下的DW统计量服从何种分布(上,下或中间),无自相关的原假设将被拒绝。与此类似,若DW统计量的值位于D的右边,则亦可拒绝无自相关的原假设。若DW统计量的值位于B和C之间,则可接受原假设。而当DW统计量的值位于A和B之间或C和D之间时,则无法得出结论。上述分析可以概括为:
DW<A或DW>D存在自相关
B<DW<C无自相关
A<DW<B或C<DW<D无结论区德宾和沃森据此导出了一个下界dL和一个上界du来检验自相关,dL和du仅依赖于观测值的数目n、解释变量k,以及显著性水平α,而不依赖于解释变量所取的值。(请参阅DW表)。无结论区的存在是DW法的最大缺陷。实际的检验程序可用下面的示意图说明。0
dL
du
24—du
4—dL
4正自相关无结论区无自相关无结论区负自相关
若DW<dL,则存在正相关若DW<2若dL
<DW<du,无结论 若du
<DW,则无自相关若DW>2,则令DW´=4-DW,按上述准则进行判别。
检验程序如下:a.用OLS法对原模型进行回归,得残差et(t=1,2,…,n)。
b.计算DW值(计算机程序给出DW值)。
c.用N,K和α查表得dL,du。
d.判别例:DW=3.5,则DW´=4-3.5=0.5
查表(n=30,k=2,α=5%)得:dL=1.28DW´=0.5<1.28
结论:存在自相关。2.布鲁奇-戈弗雷检验法
DW检验法的优点是简单方便,各类回归软件包的回归输出中都会提供DW值,通常为判断是否存在一阶自相关提供了直观的依据。可是DW检验法除了我们上面讨论过的存在无结论区的缺陷外,还有一些使用范围上的限制:(1)只能检验一阶自相关;(2)在方程的解释变量中包括滞后因变量(如Yt-1、Yt-2等)时,用DW法容易产生偏差;(3)当回归中无常数项时,也不宜采用DW法。
针对DW检验法的上述缺陷和限制,计量经济学家提出了不少检验扰动项自相关的方法,其中用得最广泛的是布鲁奇(T.S.Breusch)和戈弗雷(L.G.Godfrey)在20世纪70年代末期提出的方法,该方法也被称为拉格朗日乘数法(LM法)。
布鲁奇和戈弗雷的思路是用原模型的OLS残差et对et-1以及原模型中的诸解释变量进行回归,检验统计量是nR2,它在原假设(et-1的系数为0)下的分布是自由度为1的
分布。A式中诸X也可以包括滞后因变量。
布鲁奇-戈弗雷检验法解决了DW法的缺陷和限制,用起来也不复杂。该方法的优势在于它不仅可检验一阶自相关,而且很容易推广到高阶自相关的检验。
考虑回归模型我们要检验的是:,即扰动项不存在任何阶数的自相关。LM检验步骤如下:
(1)用OLS法估计A式,得到最小二乘残差;
(2)然后估计下面的方程:计算R2值,(3)检验是否所有的系数都等于0。这里通常不用F检验而用检验,因为LM检验是大样本检验。检验统计量为,该统计量服从自由度为P的分布,即LM检验的缺点是,滞后长度P不能先验地确定,需要反复试,可以考虑用赤池和施瓦茨信息准则来选择滞后长度。四、消除自相关的方法从自相关的定义和所造成的后果来看,自相关与异方差性有很多类似之处。这不是偶然的,它们都涉及扰动项的方差-协方差矩阵等于的假设条件遭到了破坏。因此可以将它们归为同一类问题:非球形扰动项(Non-sphericaldisturbances)。由于这个原因,消除自相关的方法也与异方差性类似,一是采用FGLS法,二是仍用OLS法,但使用方差-协方差矩阵的稳健估计值。1.FGLS法我们在上一节介绍时提到,FGLS法的核心是估计矩阵。对于单纯异方差性的情况,只涉及主对角线元素的估计,结合实际问题提供的有关异方差性基本结构的信息,就有可能估计出矩阵。自相关的情况下,需要估计的元素要多得多,事实上,由于是对称矩阵,要估计的元素个数是。在只有n个观测值的情况下,不存在可行的估计方法。因此需要做某种假设以简化问题,使得我们可以用很少的参数来表示矩阵中的各协方差,估计出这些参数后,也就估计出了矩阵。其中最著名的是假设扰动项的自相关模式为一阶自相关,我们下面就来讨论消除一阶自相关的方法。
如果实际问题的自相关模式为一阶自相关,则只要知道ρ,就可以完全消除自相关,下面用双变量模型来说明,但同样的原理适用于多个解释变量的情形。设Yt=α+βXt+ut
(1)
ut=ρut-1+εt
其中εt是白噪声,且ρ≠0。(1)式两端取一期滞后,得
Yt-1=α+βXt-1+ut
-1
(2)
(2)式两端乘以ρ,得
ρYt-1=αρ+βρXt-1+ρut
-1
(3)(1)-(3),得:
Yt-ρYt-1=α(1-ρ)+β(Xt-ρXt-1)+(ut
-ρut
-1)
(4)(4)式中的扰动项为ut
-ρut–1=εt,从而满足标准假设条件。令Yt´=
Yt-ρYt-1
Xt´=Xt-ρXt-1
α´=α(1-ρ),有
Yt´=α´+βXt´+εt
(5)若ρ为已知,我们就可用OLS法直接估计(5)式,否则需要先估计ρ。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。
常用的估计方法有:
科克伦-奥科特(Cochrane-Orcutt)迭代法。希尔德雷斯—卢法(1)科克伦—奥克特法(Cochrane—Orcutt)
科克伦—奥克特法是一个迭代过程,步骤如下:① 估计原模型((1)式),计算OLS残差et(t=1,2,…,n)。② et对et-1回归,即估计et=ρet-1+εt,得到ρ的估计值③ 用产生
然后估计Yt´=α´+βXt´+εt
,得到α和β的估计值和。④ 重新计算残差,返回第②步。此过程不断修改,和,直至收敛。(2)希尔德雷斯—卢法(Hildreth—lu)
此方法实际上是一种格点搜索法(Gridsearch),即在ρ的预先指定范围(如-1至1)内指定格点之间距离(如0.01),然后用这样产生的全部ρ值(-1.00,-0.99,…,1.00)产生
Yt´=
Yt-ρYt—1
Xt´=
Xt-ρXt—1然后估计
Yt´=α´+βXt´+εt
产生最小标准误差的ρ值即作为ρ的估计值,用该值得到的和即为原模型的系数估计值。
上面消除一阶自相关的方法,不难推广到高阶自相关,如二阶或三阶自相关的处理。当然,阶数不宜过高,要估计的参数越多,困难越大。事实上,也没有必要,因为前面各期扰动项对当期扰动项的影响是迅速衰减的。计量经济软件通常提供消除一阶自相关和高阶自相关的命令,操作非常简便,如EViews中的AR(1)、AR(2)等,加在回归命令的最后即可。
4.仍用OLS法估计系数,但使用方差-协方差矩阵的稳健估计值
Newey和West1987年给出了OLS估计量一个简单的异方差性和自相关一致方差协方差矩阵,无须规定序列相关的函数形式。该方法在怀特用OLS残差平方替代方差思路的基础上进行了拓展,加上了OLS残差的积其中p是我们希望假定的序列相关的最大阶数。Newey和West方法允许给高阶的协方差项赋予递减的权重。
EViews中也提供了Newey和West方法。五、实例
表3-10(见教材)给出我国1985-2009年农村居民人均消费支出和人均纯收入及农村居民消费价格指数的数据。OLS回归结果如下(括号中数字为标准误差):其中,CR=农村居民人均不变价消费支出(1985=100);YR=农村居民人均不变价纯收入(1985=100);下面对模型进行自相关的检验。1.DW检验模型DW值为0.366,查临界值表(n=25,k=1,=5%)得dL=1.288,由于DW=0.366<dL,故存在一阶自相关。下面我们再检验是否存在高阶自相关。2.布鲁奇-戈弗雷检验(LM检验)采用布鲁奇-戈弗雷法检验四阶(P=4)自相关,结果如表3-11所示。根据表3-6的结果,我们有:检验统计量nR2=17.028,由于相应的P值为0.0019,因而拒绝无序列相关的原假设。但从结果中看到,et-2、et-3、et-4的t值都不显著,如此看来,模型仅存在一阶自相关。在EViews中,可直接通过下面命令得到上面这两步的结果:LsCRtcYRtAR(1)原方程:第五节随机解释变量本节讨论解释变量为非随机量的假设不成立的情况。一、随机解释变量造成的估计问题为简单起见,我们以双变量模型为例来讨论,结论同样适用于多元线性回归模型。第(4)条假设是一个比较强的假设,它表明解释变量X是非随机的,即在重复抽样的情况下取固定值,因而与各期扰动项无关。由此,我们证明了最小二乘估计量的无偏性,我们也不难证明最小二乘估计量的一致性。
由统计学得知,一致性(即估计量是一致估计量)的充分条件是:对于OLS估计量,我们有对于任何n成立,并且当n趋向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度物流仓储管理与服务合同2篇
- 2024年度皮卡车租赁合同
- 二零二四年度南宁新能源汽车充电设施建设合同
- 二零二四年度窗帘设计、制作、安装一体化服务合同
- 2024年度版权使用合同具体规定使用范围与授权期限
- 2024年度人力资源服务合同:企业招聘外包
- 二零二四年公园草坪种植及改造项目承包合同
- 商业股权合同范本
- 2024年度企业能源管理合同2篇
- 二零二四年度房地产买卖及开发合作协议
- 北京市初级注册安全工程师真题
- 环保设备智能监控系统开发合同
- 北师大版小学数学六年级上册课时练习试题及答案(全册)
- 二十四节气与三角函数课件 高一上学期数学人教A版(2019)必修第一册
- 历届“挑战杯”全国大学生课外科技学术作品竞赛获奖作品
- 生成式人工智能数据安全风险及其应对
- 短途调味品运输合同范本
- 澳门(2024年-2025年小学四年级语文)人教版专题练习(下学期)试卷及答案
- 2024江苏地区“三新”供电服务公司招聘600人高频500题难、易错点模拟试题附带答案详解
- 房屋安全鉴定理论考试复习题库(含答案)
- 亚马逊合伙运营协议书模板
评论
0/150
提交评论