版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§4.2序列相关性
SerialCorrelation2引子:t检验和F检验一定就可靠吗?研究居民储蓄存款
与居民收入
的关系:
用普通最小二乘法估计其参数,结果为
(1.8690)(0.0055) =(14.9343)(64.2069)
3检验结果表明:回归系数的标准误差非常小,t统计量较大,说明居民收入对居民储蓄存款的影响非常显著。同时可决系数也非常高,F统计量为4122.531,也表明模型异常的显著。但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的。为什么呢?一、序列相关性概念二、实际经济问题中的序列相关性
三、序列相关的形式四、序列相关性的后果五、序列相关性的检验六、具有序列相关性模型的估计七、案例§4.2序列相关性
序列相关(serialcorrelation)又称自相关(autocorrelation),是指总体回归模型的随机误差项之间存在相关关系。即不同观测点上的误差项彼此相关。
一、序列相关性概念
对于模型
Yi=
0+
1X1i+
2X2i+…+
kXki+
i
i=1,2,…,n随机项互不相关的基本假设表现为
Cov(
i
,
j)=0
i
j,i,j=1,2,…,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。如果:Cov(i
,j)=E(i,j)≠0(t=1,2,…,s)
则称模型存在着序列相关或称为一阶列相关,或自相关(autocorrelation)其中:
被称为自协方差系数(coefficientofautocovariance)或一阶自相关系数(first-ordercoefficientofautocorrelation)
i是满足以下标准的OLS假定的随机干扰项:如果仅存在
E(
i
i+1)0
i=1,2,…,n自相关往往可写成如下形式:
i=
i-1+
i-1<
<1
由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。9一阶自相关系数自相关系数的定义与普通相关系的公式形式相同的取值范围为上式中,是滞后一期的随机误差项。因此,将上式计算的自相关系数
称为一阶自相关系数。二、实际经济问题中的序列相关性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
1、经济变量固有的惯性如GDP、价格、就业等经济指标都会随经济系统的周期而波动。例如,在经济高涨时期,较高的经济增长率会持续一段时间;而在经济衰退期,较高的失业率也会持续一段时间,这种现象就会表现为经济指标的自相关现象。由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例如,绝对收入假设下居民总消费函数模型:
Ct=
0+1Yt+tt=1,2,…,n12
滞后效应是指某一指标对另一指标的影响不仅限于当期而是延续若干期。由此带来变量的自相关。例如,居民当期可支配收入的增加,不会使居民的消费水平在当期就达到应有水平,而是要经过若干期才能达到。因为人的消费观念的改变客观上存在自适应期。
2、经济活动的滞后效应
3、模型设定的偏误——虚假自相关所谓模型设定偏误(Specificationerror)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。
例如,本来应该估计的模型为
Yt=
0+1X1t+2X2t+3X3t+t但在模型设定中做了下述回归:
Yt=
0+1X1t+1X2t+vt因此,vt=
3X3t+t,如果X3确实影响Y,则出现序列相关。
但建模时设立了如下模型:
Yt=
0+1Xt+vt
因此,由于vt=
2Xt2+t,
,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。又如:如果真实的边际成本回归模型应为:
Yt=
0+1Xt+2Xt2+t其中:Y=边际成本,X=产出,自相关关系主要存在于时间序列数据中,但是在横截面数据中,也可能会出现自相关,通常称其为空间自相关(Spatialautocorrelation)。
例如,在消费行为中,一个家庭、一个地区的消费行为可能会影响另外一些家庭和另外一些地区,就是说不同观测点的随机误差项可能是相关的。多数经济时间序列在较长时间内都表现为上升或下降的趋势,因此大多表现为正自相关。但就自相关本身而言是可以为正相关也可以为负相关。
4、数据的“编造”例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
17蛛网现象是微观经济学中的一个概念。它表示某种商品的供给量受前一期价格影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。许多农产品的供给呈现为蛛网现象,供给对价格的反应要滞后一段时间,因为供给需要经过一定的时间才能实现。如果时期的价格
低于上一期的价格,农民就会减少时期的生产量。如此则形成蛛网现象,此时的供给模型为:
5、蛛网现象第一时期的价格P1由供给量Q1来决定;生产者按这个价格来决定他们在第二时期的产量Q2。Q2又决定了第二时期的价格P2。第三时期的产量Q3,由第二时期的价格P2来决定,依此类推。
6、随机因素的影响如政策变动、自然灾害、金融危机等。19自相关产生的原因自相关产生的原因经济系统的惯性经济活动的滞后效应模型设定偏误数据的“编造”蛛网现象随机因素20自相关的性质可以用自相关系数的符号判断即为负相关,为正相关。当接近1时,表示相关的程度很高。自相关是序列自身的相关,因随机误差项的关联形式不同而具有不同的自相关形式。自相关多出现在时间序列数据中。
四、序列相关性的形式21对于样本观测期为的时间序列数据,可得到总体回归模型(PRF)的随机项为,如果自相关形式为其中
为自相关系数,为经典误差项,即则此式称为一阶自回归模式,记为。因为模型中是滞后一期的值,因此称为一阶。此式中的也称为一阶自相关系数。自相关的形式ρ为自回归系数(数值上等于自相关系数,证明略)νt是满足回归模型基本假定的随机误差项。
22如果式中的随机误差项不是经典误差项,即其中包含有
的成份,如包含有则需将显含在回归模型中,其为其中,为一阶自相关系数,为二阶自相关系数,是经典误差项。此式称为二阶自回归模式,记为。23一般地,如果之间的关系为其中,
为经典误差项。则称此式为阶自回归模式,记为。在经济计量分析中,通常采用一阶自回归形式,即假定自回归形式为一阶自回归。
计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:
四、序列相关性的后果
1、参数估计量非有效因为,在有效性证明中利用了
E(NN’)=
2I
即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。25当模型存在自相关性时,OLS估计仍然是无偏估计,但不再具备有效性。在有自相关的条件下,仍然使用普通最小二乘法将低估估计量的方差
并且将低估真实的26对于一元线性回归模型,当
为经典误差项时,普通最小二乘估计量的方差为:随机误差项有自相关时,依然是无偏的,即,这一点在普通最小二乘法无偏性证明中可以看到。因为,无偏性证明并不需要满足无自相关的假定。那么,最小二乘估计量是否是有效呢?下面我们将说明。27例如,一元回归中28当存在自相关时,普通最小二乘估计量不再是最佳线性无估计量,即它在线性无偏估计量中不是方差最小的。在实际经济系统中,通常存在正的自相关,即,同时序列自身也呈正相关,因此上式右边括号内的值通常大于0。因此,在有自相关的条件下,仍然使用普通最小二乘法将低估估计量的方差。将低估真实的
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。t检验的可靠性降低。
在自相关性的影响下,很可能使原来不显著的t值变为显著的,即易将不重要的因素误引入模型。类似地,由于自相关的存在,参数的最小二乘估计量是无效的,使得F检验和R^2检验也是不可靠的。
3、模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。31模型预测的精度决定于抽样误差和总体误差项的方差
。抽样误差来自于对的估计,在自相关情形下,
的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在自相关情形下,对
的估计也会不可靠。由此可看出,影响预测精度的两大因素都会因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低预测的精度。
然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
序列相关性检验方法有多种,但基本思路相同:基本思路:五、序列相关性的检验33图示法是一种直观的诊断方法,它是把给定的回归模直接用普通最小二乘法估计参数,求出残差项,作为随机项的真实估计值,再描绘的散点图,根据散点图来判断的相关性。残差的散点图通常有两种绘制方式。
1、图示法(1)绘制和的散点图。(2)按照时间顺序绘制回归残差项的图形。35图6.1与的关系绘制的散点图。用作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项存在着正自相关。36如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误差项
存在着负自相关。
et-1et图6.2et与et-1的关系37图:的分布如果随着的变化逐次变化并不频繁地改变符号,而是几个正的后面跟着几个负的,则表明随机误差项存在正自相关。38二、对模型检验的影响按照时间顺序绘制回归残差项的图形。如果
随着
的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,就可断言
存在相关,表明存在着自相关;如果随着
t的变化逐次变化并不断地改变符号,那么随机误差项存在负自相关
方法:在方程窗口中点击Resids按钮,或者点击View\Actual,Fitted,Residual\Tabel,都可以得到残差分布图。
如果随着时间的推移残差分布呈现出周期性的变化,说明很可能存在自相关性。若呈现不规则的随机分布,则直观认为不存在自相关性。
2、回归检验法……
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。3、杜宾-瓦森(Durbin-Watson)检验法
D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种适用于小样本检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项
i为一阶自回归形式:
i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi=
0+1X1i+kXki+Yi-1+i(4)回归含有截距项为了检验序列的相关性,杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归
D.W.统计量:随机误差项的一阶自回归形式为:为了检验上述假设,构造DW统计量首先要求出回归估计式的残差定义DW统计量为:
该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。但是,他们成功地导出了临界值的下限dL和上限dU
,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。
D.W.统计量:当D.W.值在2左右时,模型不存在一阶自相关。
证明:展开D.W.统计量:
(*)此式为自相关系数ρ的估计
这里,为一阶自回归模型
i=
i-1+
i的参数估计。如果存在完全一阶正相关,即
,则D.W.0
完全一阶负相关,即
,则D.W.4
完全不相关,即
,则D.W.2由可得DW值与的对应关系如表所示。
4(2,4)2(0,2)0-1(-1,0)0(0,1)1DW由上述讨论可知DW的取值范围为:
0≤DW≤4
D.W检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断:依下列准则考察计算得到的DW值,以决定模型的自相关状态。若0<D.W.<dL
存在正自相关
dL<D.W.<dU
不能确定
dU<D.W.<4-dU
无自相关
4-dU<D.W.<4-dL
不能确定
4-dL<D.W.<4存在负自相关
48用坐标图更直观表示DW检验规则:不能确定正自相关无自相关不能确定负自相关42●
DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法●
DW统计量的上、下界表要求
,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断●
DW检验不适应随机误差项具有高阶序列相关的检验●只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量
DW检验的缺点和局限性在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关;经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。所以在实际应用中,对于序列相关问题一般只进行D.W.检验。4、拉格朗日乘数(Lagrangemultiplier)检验
拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验。
对于模型如果怀疑随机扰动项存在p阶序列相关:
LM检验可用来检验如下受约束回归方程
约束条件为:
H0:
1=
2=…=
p=0约束条件H0为真时,大样本下其中,n为样本容量,R2为如下辅助回归的可决系数:
给定
,查临界值
2(p),与LM值比较,做出判断,若LM值大于临界值
2(p),拒绝H0实际检验中,可从1阶、2阶、…逐次向更高阶检验。
EViews软件操作:在方程窗口中点击View\ResidualTest\SerialCorrelationLMTest。
注:BG检验需要人为确定滞后期的长度。滞后期的长度确定:一般是从低阶的p(p=1)开始,直到p=10左右,若未能得到显著的检验结果,可以认为不存在自相关性。
偏相关系数检验【命令方式】IDENTRESID【菜单方式】在方程窗口中点击View\ResidualTest\Correlogram-Q-statistics
屏幕将直接输出et与et-1,et-2…et-p
(p是事先指定的滞后期长度)的相关系数和偏相关系数。
【例】中国农村居民收入-消费模型消费模型(自相关性检验)。数据收集:1985—2007年农村居民人均收入和消费
(1)SCATXY
为线性相关,所以函数形式初步确定为一元线性模型。(2)估计模型
LSYCX估计结果为:
(3)检验自相关性
①残差图分析:残差图表明呈现有规律的波动。
②D-W检验:n=23,k=1,α=0.01时,查表得dL=1.018,dU=1.187,而0<0.4102=DW<dL,所以存在一阶(正)自相关性。③偏相关系数检验:滞后期为10,结果如下图
操作演示自相关系数直方图偏自相关系数直方图滞后期自相关系数偏自相关系数自相关系数>0.5偏自相关系数>0.5
④LM检验:在方程窗口中点击View\ResidualTest\SerialCorrelationLMTest,选择滞后期为2,屏幕将显示信息(右图)nR2=23×0.6479临界概率如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。
最常用的方法是广义最小二乘法(GLS:Generalizedleastsquares)和广义差分法(GeneralizedDifference)。五、序列相关的补救
1、广义最小二乘法
对于模型
Y=X
+
如果存在序列相关,同时存在异方差,即有
是一对称正定矩阵,存在一可逆矩阵D,使得
=DD’变换原模型:
D-1Y=D-1X
+D-1
即
Y*=X*
+
*(*)(*)式的OLS估计:这就是原模型的广义最小二乘估计量(GLSestimators),是无偏的、有效的估计量。该模型具有同方差性和随机误差项互相独立性:
如何得到矩阵
?
对
的形式进行特殊设定后,才可得到其估计值。如设定随机扰动项为一阶序列相关形式
i=
i-1+
i则
2、广义差分法
广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。如果原模型存在可以将原模型变换为:
该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。
注意:
广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。
如:一阶序列相关的情况下,广义差分是估计这相当于去掉第一行后左乘原模型Y=X
+
。即运用了GLS法,但第一次观测值被排除了。
68在进行广义差分时,解释变量
与被解释变量
均以差分形式出现,因而样本容量由
减少为,即丢失了第一个观测值。如果样本容量较大,减少一个观测值对估计结果影响不大。但是,如果样本容量较小,则对估计精度产生较大的影响。此时,可采用普莱斯-温斯滕(Prais-Winsten)变换,将第一个观测值变换为:补充到差分序列中,再使用普通最小二乘法估计参数。
3、随机误差项相关系数的估计应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数
1,
2,…,
L
。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。
常用的估计方法有:近似估计法科克伦-奥科特(Cochrane-Orcutt)迭代法。杜宾(durbin)两步法在大样本(n≥30)情况下,DW≈2(1-ρ),所以,对于小样本(n<30),泰尔(Thei1.H)建议使用下述近似公式:
其中k为解释变量个数,当n→∞时,=1-DW/2。
(1)近似估计法71在实际应用中,自相关系数
往往是未知的,必须通过一定的方法估计。最简单的方法是据DW统计量估计。由DW与的关系可知:但是,这是一个粗略的结果,是对精度不高的估计。其根本原因在于我们对有自相关的回归模型使用了普通最小二乘法。为了得到的精确的估计值,通常采用科克伦-奥克特(Cochrane-Orcutt)迭代法。(2)科克伦-奥科特迭代法。(2)科克伦-奥科特迭代法。
以一元线性模型为例:首先,采用OLS法估计原模型
Yi=
0+
1Xi+
i得到的
的“近似估计值”,并以之作为观测值使用OLS法估计下式
i=
1
i-1+
2
i-2+
L
i-L+
i求出
i新的“近拟估计值”,
并以之作为样本观测值,再次估计
i=
1
i-1+
2
i-2+
L
i-L+
i
类似地,可进行第三次、第四次迭代。
关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次
1,
2,,
L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。
该方法仍是先估计
1,
2,,
l,再对差分模型进行估计第一步,变换差分模型为下列形式进行OLS估计,得各Yj(j=t-1,t-2,…,t-l)前的系数
1,
2,,
l的估计值(2)杜宾(durbin)两步法如果能够找到一种方法,求得Ω或各序列相关系数
j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS,FeasibleGeneralizedLeastSquares)。FGLS估计量,也称为可行的广义最小二乘估计量(feasiblegeneralleastsquaresestimators)可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。
注意:应用软件中的广义差分法
在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计
。在解释变量中引入AR(1)、AR(2)、…,即可得到参数和ρ1、ρ2、…的估计值。
其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。
4、虚假序列相关问题由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(falseautocorrelation)
,应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。六、案例:中国商品进口模型经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。1.通过OLS法建立如下中国商品进口方程:
(2.32)(20.12)
2.进行序列相关性检验。
DW检验
取
=5%,由于n=24,k=2(包含常数项),查表得:
dl=1.27,
du=1.45由于DW=0.628<dl
,故:存在正自相关。
拉格朗日乘数检验(0.23)(-0.50)(6.23)(-3.69)
R2=0.6614
于是,LM=22
0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《GB-T 28889-2012复合材料面内剪切性能试验方法》专题研究报告
- 《GBT 20944.3-2008纺织品 抗菌性能的评价 第3部分:振荡法》专题研究报告
- 《GBT 9978.7-2008建筑构件耐火试验方法 第7部分:柱的特殊要求》专题研究报告
- 2026年广东省辅警人员招聘考试题库含答案
- 迪士尼承包商安全培训课件
- 车险知识课件总结
- 车间行车十不吊课件培训
- 车间级安全培训过程描述课件
- (2025)客服数据复盘与服务能力提升专项工作总结(3篇)
- (新)安全生产培训的心得体会(2篇)
- 2024-2025学年河南省南阳市社旗县九年级(上)期末英语试卷(含答案)
- 山东省泰安市泰山区2024-2025学年五年级上学期期末英语试题
- 挤塑机工操作规程(4篇)
- 陕西省咸阳市秦都区2024-2025学年七年级上学期1月期末考试语文试卷(无答案)
- AI虚拟数字人教学课件 第5章 腾讯智影:生成数字人视频与主播
- CJJT269-2017城市综合地下管线信息系统技术规范正式版
- 环保局基础知识考试题库100道及答案解析
- 道闸施工方案
- 适用于新高考新教材天津专版2024届高考英语一轮总复习写作专项提升Step3变魔句-提升描写逼真情境能力课件外研版
- 脚手架稳定性计算
- DB31T+598-2023政府质量奖个人评价准则
评论
0/150
提交评论