版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章序列相关主讲人:杨君线性回归模型的基本假设
(1)解释变量X是确定性变量,不是随机变量;(2)随机误差项具有0均值和同方差正态分布:
E(
i)=0i=1,2,…,nVar(
i)=
2i=1,2,…,n
I~N(0,
2)i=1,2,…,n(3)随机误差项在不同样本点之间是独立的, 不存在序列相关:
Cov(
i,
j)=0i≠ji,j=1,2,…,n(4)随机误差项与解释变量之间不相关:Cov(Xi,
i)=0i=1,2,…
,n(5)各解释变量之间互不相关
(1)异方差性随机项序列不是同方差的
(2)自相关性随机项序列存在序列相关性
(3)多重共线性解释变量之间存在线性相关性
(4)随机解释变量解释变量不是固定性变量,而是随机性变量不满足基本假定的情况,称为基本假定违背。主要包括:基本假定违背计量经济检验在进行计量经济的回归分析时,必须对所研究对象是否满足OLS下的基本假定进行检验,即检验是否存在一种或多种违背基本假定的情况,这种检验称为计量经济检验。主要包括:(1)序列相关性检验(2)自相关性检验(3)多重共线性检验(4)随机解释变量检验一、序列相关性的概念二、序列相关性的后果三、序列相关性的检验四、序列相关性的估计五、案例序列相关性1、序列相关性的概念
2、序列相关性的类型
3、序列相关性产生的原因一、序列相关性的概念1、序列相关性的概念
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性(SerialCorrelation
)。2、序列相关性的类型称为一阶序列相关,或自相关(autocorrelation)。这是最常见的一种序列相关问题。
自相关往往可写成如下形式:其中:
被称为自协方差系数(coefficientofautocovariance)或一阶自相关系数(first-ordercoefficientofautocorrelation),
t是满足以下标准的OLS假定的随机干扰项:3、序列相关性产生的原因(1)惯性(2)设定偏误:模型中未含应包括的变量(3)设定偏误:不正确的函数形式(4)蛛网现象(5)数据的“编造”(1)惯性大多数经济时间数据都有一个明显的特点,就是它的惯性。
GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势头,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率和个税的升高)出现才把它拖慢下来)。(2)设定偏误:模型中未含应包括的变量例如:如果对牛肉需求的正确模型应为:Yt=
0+1X1t+2X2t+3X3t+t
其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入,X3=猪肉价格但如果模型设定为:Yt=
0+1X1t+2X2t+vt则该式中,vt=
3X3t+t,
于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。(3)设定偏误:不正确的函数形式例如:
如果真实的边际成本回归模型应为:
Yt=
0+1Xt+2Xt2+t其中:Y=边际成本,X=产出如果建模时设立了如下模型:Yt=
0+1Xt+vt因此,由于vt=
2Xt2+t,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。(4)蛛网现象例如:农产品供给对价格的反映本身存在一个滞后期:
供给t=
0+1价格t-1+t
意味着,农民由于在年度t的过量生产(使该期价格下降)很可能导致在年度t+1时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。(5)数据的“编造”例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使干扰项中出现系统性的因素,从而出现序列相关。还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
二、序列相关性的后果1、参数估计量非有效2、变量的显著性检验失去意义3、模型的预测失效计量经济学模型一旦出现序列相关性,如果仍采用OLS估计模型参数,会产生下列不良后果:首先,OLS参数估计量仍具无偏性(无偏性的证明不需要随机项的同方差性以及无序列相关性假设)。1、参数估计量非有效在实际经济问题中的自相关,大多是正自相关,且一般经济变量X的时间序列也大多为正自相关,因此(2.5.4)在多数经济问题中成立。这说明,当随机项存在自相关时,参数的OLS估计量的方差较无自相关时大。2、变量的显著性检验失去意义在关于变量的显著性检验中,当存在序列相关时,参数的OLS估计量的方差增大,标准差也增大,因此:实际的t统计量变小,从而接受原假设
i=0的可能性增大,检验就失去意义。采用其它检验也是如此。3、模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。三、序列相关性的检验1.检验思路2.图解法3.解析法1.检验思路:然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有序列相关性的目的。
序列相关性检验方法有多种,但基本思路是相同的:一般的处理方法:
问题在于用什么来表示随机误差项的方差2、图示法
2.图示法(1)回归检验法(2)杜宾-瓦森(Durbin-Watson)检验法(3)拉格朗日检验
3.解析法(1)回归检验法
具体应用时需要反复试算。
回归检验法的优点是:
a、一旦确定了模型存在序列相关性,也就同时知道了相关的形式;
b、它适用于任何类型的序列相关性问题的检验。对各方程估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。(2)杜宾-瓦森(Durbin-Watson)检验法D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项
i为一阶自回归形式:
i=i-1+i(3)回归模型中不应含有滞后因变量作为解释变 量,即不应出现下列形式:
Yi=
0+1X1i+kXki+Yi-1+i(4)回归含有截距项;(5)没有缺落数据。
该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。
D.W.统计量①计算该统计量的值,②根据样本容量n和解释变量数目k查D.W. 分布表,得到临界值dL和dU,③按照下列准则考察计算得到的D.W.值, 以判断模型的自相关状态。
但是,Durbin和Watson成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。检验步骤
可以看出,当D.W.值在2左右时,模型不存在一阶自相关。如果存在完全一阶正相关,即
=1,则D.W.0
如果存在完全一阶负相关,即
=-1,则D.W.4如果完全不相关,即
=0,则D.W.2D.W.值与相关系数的关系(1)从判断准则看到,存在一个不能确定的D.W. 值区域,这是这种检验方法的一大缺陷。(2)D.W.检验虽然只能检验一阶自相关,但在实 际计量经济学问题中,一阶自相关是出现最 多的一类序列相关;(3)经验表明,如果不存在一阶自相关,一般 也不存在高阶序列相关。
所以在实际应用中,对于序列相关问题一般只进行D.W.检验。注意:3、拉格朗日乘数检验
拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验。
对于模型如果怀疑随机扰动项存在p阶序列相关:
假设:H0:
1=
2=…=
p=0H1:
1、2…
p
不全为0。3、约束条件H0为真时,布罗斯和戈弗雷证明了:大样本下其中,n为样本容量,R2为辅助回归的可决系数。
et=b0+b1X1t+b2X2t+…+bkXkt+
1et-1+
2et-2+…+
pet-p+vt检验步骤:
1、用OLS法估计模型,得残差序列。
2、建立残差序列与原模型中各解释变量及残差滞后值之间的辅助回归模型。
GB检验过程如下:
注意:拉格朗日乘数检验的优点包括:克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形,在检验上更具一般性。拉格朗日乘数检验的缺点是:滞后期长度p值难以得到先验的确定。实际检验中,可从1阶、2阶、…逐次向更高阶检验。4、给定
,查临界值
2(p),与LM值比较,做出判断。
利用EView软件可以直接进行拉格朗日乘数检验。在方程窗口依次单击“View”→ResidualTest”→SerialCorrelationLMTest”,屏幕将输出辅助回归模型的有关信息。在拉格朗日乘数检验中,需要人为确定滞后期的长度。实际应用中,一般试从低阶的p=1开始,直到p=10左右。若未能找到显著的检验结果,可以认为不存在自相关性。四、具有序列相关性模型的估计1.广义最小二乘法
(GLS:GeneralizedLeastSquares)广义差分法(Difference)虚假序列相关问题1、广义最小二乘法
对于模型
Y=XB+N(2.5.7)
如果存在序列相关,同时存在异方差,即有设
=DD’
用D-1左乘(2.5.7)两边,得到一个新的模型:
D-1
Y=D-1
XB+D-1N(2.5.8)即
Y*=X*B+N*该模型具有同方差性和随机误差项互相独立性。于是,可以用OLS法估计模型(2.5.8),得(2.5.9)
这就是原模型(2.5.7)的广义最小二乘估计量(GLSestimators),是无偏的、有效的估计量。
如何得到矩阵
?仍然是对原模型(2.5.7)首先采用普通最小二乘法,得到随机误差项的近似估计量,以此构成矩阵的估计量
,即2、差分法差分法
是一类克服序列相关性的有效的方法, 被广泛地采用。差分法
是将原模型变换为差分模型,分为一阶差分法
(first-differencemethod)和广义差分法
(generalizeddifferencemethod)。
(1)一阶差分法
由于
i不存在序列相关,该差分模型满足应用OLS法的基本假设;
因此,用OLS法估计可得到原模型参数的无偏的、有效的估计量。即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。如果原模型存在完全一阶正自相关,即在
i=i-1+i中,
=1。(2.5.10)可变换为:
Yi=1Xi+i(2)广义差分法模型(2.5.12)为广义差分模型,该模型不存在序列相关问题。采用OLS法估计可以得到原模型参数的无偏、有效的估计量。
广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。2.随机误差项相关系数的估计(
未知)
应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数
1,
2,…,
L
。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。简单的方法有:(1)由DW-d统计量中估计
(2)从OLS残差中估计:较为常用的方法
科克伦-奥科特(Cochrane-Orcutt)迭代法杜宾(durbin)两步法(1)科克伦-奥科特迭代法。首先,采用OLS法估计原模型Yi=
0+1Xi+i得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式
i=1
i-1+2
i-2+L
i-L+i
类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次
1,2,,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。(2)杜宾(durbin)两步法
该方法仍是先估计
1,2,,L,再对差分模型进行估计应用软件中的广义差分法
在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计
。
在解释变量中引入AR(1)、AR(2)、…,即可得到参数和ρ1、ρ2、…的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代.3、虚假序列相关问题
由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关,应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。五、案例:地区商品出口模型某地区商品出口总值与国内生产总值的关系研究。1、检验(1)图示法检验(2)D.W.检验:在5%在显著性水平下,n=19,k=2(包含常数项),查表得dL=1.18,dU=1.40,
由于DW=0.9505<dL,故存在正自相关。2、自相关的处理(1)一阶差分法R2=0.4747,D.W.=1.8623由于DW>du=1.39(注:样本容量为18个),已不存在自相关。(2)广义差分法:①采用杜宾两步法估计
由于DW>=1.39(注:样本容量为19-1=18个),已不存在自相关。于是原模型估计式为:②采用科克伦-奥科特迭代法估计
一阶广义差分的结果:由于DW>du=1.39(注:样本容量为18个),已不存在自相关。二阶广义差分的结果:由于DW>du=1.38(注:样本容量为19-2=17个),已不存在自相关。但由于AR[2]前的系数的t值为-0.15,在5%的显著性水平下并不显著,说明随机干扰项不存在二阶序列相关性,模型中应去掉AR[2]项。
案例3:天津市城镇居民人均消费与人均可支配收入的关系。改革开放以来,天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME)以及消费价格定基指数(PRICE)数据(1978~2000年)见表6.2。现在研究人均消费与人均可支配收入的关系。先定义不变价格(1978=1)的人均消费性支出(Yt)和人均可支配收入(Xt)。令Yt=CONSUM/PRICE,Xt=INCOME/PRICE假定所建立的回归模型形式是Yt=
0+
1
Xt+ut
Yt和Xt散点图残差图
(1)估计线性回归模型并计算残差。
=111.44+0.7118Xt
(6.5)(42.1)R2=0.9883,s.e.=32.8,DW=0.60,T=23(2)分别用DW、LM统计量检验误差项ut是否存在自相关。已知DW=0.60,若给定
=0.05,查附表4,得DW检验临界值dL
=1.26,dU
=1.44。因为DW=0.60
1.26,认为误差项ut存在严重的正自相关。LM(BG)自相关检验辅助回归式估计结果是
et=0.6790et-1+3.1710–0.0047
Xt+vt
(3.9)(0.2)(-0.4)R2=0.43,DW=2.00LM=TR2=23
0.43=9.89。因为
20.05(1)=3.84,LM=9.89>3.84,所以LM检验结果也说明误差项存在一阶正自相关。
注意:(1)R2值有所下降。不应该不相信估计结果。原因是两个回归式所用变量不同,所以不可以直接比较确定系数R2的值。(2)两种估计方法的回归系数有差别。计量经济理论认为回归系数广义最小二乘估计量优于误差项存在自相关的OLS估计量。所以0.6782应该比0.7118更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边际系数为0.6782更可信。(3)用EViews生成新变量的方法:从工作文件主菜单中点击Quick键,选择GenerateSeries…功能。打开生成序列(GenerateSeriesbyEquation)对话框。在对话框中输入如下命令(每次只能输入一个命令),Y=CONSUM/PRICEX=INCOME/PRICE按OK键。变量Y和X将自动显示在工作文件中。案例4:天津市保费收入和人口的回归关系
本案例主要用来展示当模型误差项存在2阶自回归形式的自相关时,怎样用广义差分法估计模型参数。
1967~1998年天津市的保险费收入(Yt,万元)和人口(Xt,万人)数据散点图见图。Yt与Xt的变化呈指数关系。对Yt取自然对数。LnYt与Xt的散点图见图。可以在LnYt与Xt之间建立线性回归模型。LnYt=
0+
1
Xt+ut
Yt和Xt散点图LnYt和Xt散点图
对残差序列的拟合发现,ut存在二阶自相关。回归式如下。
et=1.186et-1-0.467et-2+vt
(6.9)(-2.5)R2=0.71,s.e.=0.19,DW=1.97(1969-1998)误差项具有二阶自回归形式的自相关。(3)用广义差分法消除自相关。首先推导二阶自相关ut=
1ut–1+
2ut–2+vt条件下的广义差分变换式。设模型为
LnYt=
0+
1Xt+ut
写出上式的滞后1期、2期表达式并分别乘以
1、
2,
1LnYt-1=
1
0+
1
1Xt-1+
1ut-1
2LnYt-2=
2
0+
2
1Xt-2+
2ut-2
用以上3式做如下运算,
LnYt-
1LnYt-1-
2LnYt-2=
0-
1
0-
2
0+
1Xt-
1
1Xt-1-
2
1Xt-2+ut-
1ut-1-
2ut-2将2阶自相关关系式,ut=
1ut–1+
2ut–2+vt,代入上式并整理,得
(LnYt-
1LnYt-1-
2LnYt-2)=
0(1-
1-
2)+
1(Xt-
1Xt-1-
2Xt-2)
+vt
二阶广义差分变换应该是
GDLnYt
=LnYt-
1LnYt-1-
2LnYt-2
GDXt
=Xt-
1Xt-1-
2Xt-2
LnYt和Xt的广义差分变换应该是
GDLnYt=LnYt-1.186LnYt-1+0.467LnYt-2
GDXt
=Xt-1.186Xt-1+0.467Xt-2广义最小二乘回归结果是
=-3.246
+0.0259GDXt
(-10.0)(17.9)R2=0.92,DW=1.99,(1969-1998)
0=-3.246/(1-
1-
2)
=-3.246/(1-1.186+0.467)=-11.55原模型的广义最小二乘估计结果是
LnYt=-11.55+0.0259Xt
广义最小二乘估计值0.0259比最小二乘估计值0.0254值可信。经济含义是每增加1万人,LnYt增加0.0259,即保费增加1.0262万元。
研究范围:中国农村居民收入-消费模型(1985~2003)研究目的:消费模型是研究居民消费行为的工具和手段。通过消费模型的分析可判断居民消费边际消费倾向,而边际消费倾向是宏观经济系统中的重要参数。建立模型-居民消费,-居民收入,-随机误差项。数据收集:1985~2003年农村居民人均收入和消费案例分析51985-2003年农村居民人均收入和消费
单位:元年份全年人均纯收入(现价)
全年人均消费性支出(现价)消费价格指数(1985=100)人均实际纯收入(1985可比价)人均实际消费性支出(1985可比价)1985397.60317.42100.0397.60317.401986423.80357.00106.1399.43336.481987462.60398.30112.7410.47353.421988544.90476.70132.4411.56360.051989601.50535.40157.9380.94339.081990686.30584.63165.1415.69354.111991708.60619.80168.9419.54366.961992784.00659.80176.8443.44373.191993921.60769.70201.0458.51382.94
年份全年人均纯收入(现价)全年人均消费性支出(现价)消费价格指数(1985=100)人均实际纯收入(1985可比价)人均实际消费性支出(1985可比价)19941221.001016.81248.0492.34410.0019951577.701310.36291.4541.42449.6919961923.101572.10314.4611.67500.0319972090.101617.15322.3648.50501.7719982162.001590.33319.1677.53498.2819992214.301577.42314.3704.52501.7520002253.401670.00314.0717.64531.8520012366.401741.00316.5747.68550.0820022475.601834.00315.2785.41581.8520032622.241943.30320.2818.86606.81续表据表的数据使用普通最小二乘法估计消费模型得:该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知,,模型中,显然消费模型中有自相关。这也可从残差图中看出,点击EViews方程输出窗口的按钮Resids可得到残差图,如下图所示。模型的建立、估计与检验残差图自相关问题的处理使用科克伦-奥克特的两步法解决自相关问题:由模型可得残差序列,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为的残差序列。在主菜单选择Quick/GenerateSeries或点击工作文件窗口工具栏中的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 2424.7-2024环境试验第3部分:支持文件及导则试验A(低温)和B(高温)的温度箱测量(带负载)
- GB/T 44411-2024机动车检验设备及场地附着系数检测方法
- 面积的逻辑推理与思维训练
- 苏科版小学一年级上劳动技术第一单元劳动启蒙02各种各样的职业课件
- (2019部编)人教版道德与法治七年级上册:全册教案教学设计
- DB1506-T 54-2024 积分制基层社会治理数字平台建设规范
- DB3301∕T 65.19-2024 反恐怖防范系统管理规范 第19部分:长途道路客运
- 中班美术教案下(园本教材)
- 星星火炬代代相传主题队会
- 2022-2023学年高二物理竞赛课件:铁电体的畴结构
- 年末营销活动方案
- 2024年无锡市锡山环保能源集团招聘笔试参考题库附带答案详解
- 四年级【语文(统编版)】牛和鹅(第一课时)课件
- 淋巴排毒知识课件
- 屋顶光伏施工安全知识讲座
- 新人教版九年级数学第二十一章一元二次方程测试题
- 【盒马鲜生新零售模式探析13000字(论文)】
- 屋顶分布式光伏电站施工组织设计
- 现代职业教育高质量发展背景下“职教高考”制度建设研究
- 幼儿园伤害预防及急救措施培训
- 2024年江苏省宿迁产业发展集团有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论