异方差修正序列相关原因_第1页
异方差修正序列相关原因_第2页
异方差修正序列相关原因_第3页
异方差修正序列相关原因_第4页
异方差修正序列相关原因_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

异方差修正序列相关原因第一页,共六十七页,2022年,8月28日2(对一元模型,其辅助回归模型:)

(3)可以证明,在同方差假设下:(*)

R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。(4)在原假设H0:,(i=0,1,2,3,4,5)若,则拒绝H0,表明回归参数至少有一个显著不为零,扰动项存在异方差性。iiiiiiiiXXXXXXeeaaaaaa++++++=215224213221102第二页,共六十七页,2022年,8月28日3

Eviews中的White检验步骤:(1)建立回归模型:LSYCX(2)检验异方差:

1)命令:

View\ResidualTest\White\Heteroskedasticity2)在选项中选择在辅助模型中是否包含交叉乘积项(Crossterms)

3)输出结果中Obs*R-squared即White检验统计量,由其双侧概率可判断是否拒绝无异方差性的原假设。第三页,共六十七页,2022年,8月28日4例如:欲判断某二元回归模型是否存在异方差。辅助回归模型有4个解释变量,不存在交叉项。则执行命令后,显示EViews的辅助回归模型估计结果(见下表):第四页,共六十七页,2022年,8月28日5当显著性水平为0.05时,由于所以存在异方差。实际上,统计量的P值为0.0135,小于0.05的水平,所以存在异方差。实际应用中,一般是直接观察P值的大小,若P值校小,则拒绝不存在异方差的假设,认为模型存在异方差。第五页,共六十七页,2022年,8月28日6注意:

辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。

如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。第六页,共六十七页,2022年,8月28日7六、异方差的修正

常见以下四种修正方法:1.模型对数变换法2.原模型变换法3.加权最小二乘法4.广义最小二乘法第七页,共六十七页,2022年,8月28日81.模型对数变换法

在模型Yi=0+1Xi+i中,变量Yi和Xi分别用lnYi和lnXi

取代,则对全对数模型:

lnYi=0+1lnXi+i

进行回归后,通常可降低异方差性的影响。

原因:

⑴对数变换能使测定变量值的尺度缩小。⑵经对数变换的模型,其残差表示为相对误差,而相对误差往往具有较小的差异。全对数模型中,1

可看作反映Y对X的弹性,即Y相对于X的百分比变化,这在实际分析中有较强的应用意义。第八页,共六十七页,2022年,8月28日92.原模型变换法

对存在异方差的模型作适当的变量变换,使变换后的模型满足同方差假定,则可用OLS重新估计模型,得最佳线性无偏估计。模型的前提是要合理确定异方差性的具体形式,这可以通过对问题的经验分析,或用帕克检验,戈里瑟检验等方法所提供异方差的具体形式来确定。第九页,共六十七页,2022年,8月28日10设模型为:Yi=0+1Xi+I(*)

扰动项i具有异方差性,由前面Glejser检验知,异方差性与Xi的变化有关,且σ2为常数,ƒ(Xi)为解释变量Xi的函数,当ƒ(Xi)=1时,为同方差;当ƒ(Xi)≠1时,为异方差。用去乘原模型的两端得第十页,共六十七页,2022年,8月28日11记,则vi具有同方差性。事实上,函数ƒ(Xi)可以有不同的形式,Glejser检验提供了相应的信息。ƒ(Xi)一般取如下形式:第十一页,共六十七页,2022年,8月28日12(1)

ƒ(Xi)=Xi,

则Var(µi)=σ2Xi。对原模型两端同除得令,则Var(vi)为同方差,因为第十二页,共六十七页,2022年,8月28日13(2)

ƒ(Xi)=Xi2,

则Var(µi)=σ2Xi2。对原模型两端同除得令,则Var(vi)为同方差,因为第十三页,共六十七页,2022年,8月28日14(3)ƒ(Xi)=(a0+a1Xi)2

,则Var(µi)=σ2(a0+a1Xi)2。对原模型两端同除(a0+a1Xi)得令,则Var(vi)为同方差,因为第十四页,共六十七页,2022年,8月28日15注意:对原模型变换的方法与加权最小二乘法实际上是等价的,他们最多相差一个常数因子;对原模型变换后的拟合优度有可能变小,这是对样本观测值加权的结果。第十五页,共六十七页,2022年,8月28日163.加权最小二乘法(WLS)

模型检验出存在异方差性,可用加权最小二乘法(WeightedLeastSquares,WLS)进行估计。加权最小二乘法的基本思想:

加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。即对加了权重的残差平方和实施OLS法:其中:Wi为权数21102)]ˆˆˆ([åå+++-=kkiiiiXXYWeWbbb…第十六页,共六十七页,2022年,8月28日17

设Var(µi)随X的递增而递增,则:对较小的残差平方ei2赋予较大的权数;对较大的残差平方ei2赋予较小的权数。以更好地使∑ei2反映Var(µi)对残差平方和的影响程度,从而改善参数估计的统计性质。设取权数Wi为1/σi2(i=1,2,…,n),且σi2越小Wi越大,σi2越大Wi越小。因此,称为加权的残差平方和,运用最小二乘法得参数估计式:1102ˆˆ([åå+-=iiiiX)]2YWeWbb第十七页,共六十七页,2022年,8月28日18其中,这一求解参数估计的方法为加权最小二乘法。容易看出,当w1=w2=…=wn时,即对于每一个样本有相同的权数,则加权最小二乘估计式就是普通最小二乘估计式。第十八页,共六十七页,2022年,8月28日19EViews中可直接进行加权最小二乘估计,但需要事先确定权数变量,这可以通过Park检验、Glejser检验等判断异方差的具体形式,也可以选取某个与异方差变动趋势反向变动的变量序列,如1/|et|,1/et2等等。第十九页,共六十七页,2022年,8月28日20EViews具体执行过程:

(1)生成权数变量;(2)使用加权最小二乘法估计模型,命令和菜单两种方式。命令方式:LS(W=权数变量或表达式)YCX菜单方式:在方程窗口中点击“Estimate”按钮;在弹出的方程说明对话框中点击“Option”进入参数设置对话框;在参数设置对话框中选定“WeightedLS”方法,并在权数变量栏中输入权数变量,然后点击“OK”返回方程说明对话框;点击“OK”,系统将采用WLS方法估计模型。(3)对估计后的模型,再使用White检验判断是否消除了异方差性。第二十页,共六十七页,2022年,8月28日21

对于模型Y=X+存在:

即存在异方差性。

显然W是一对称正定矩阵,故存在一可逆矩阵D使得:

W=DD’

W=éëêêêêùûúúúúwwwn12…4.广义最小二乘法(GLS)第二十一页,共六十七页,2022年,8月28日22用D-1乘以方程:Y=X+的两边,得到一个新的模型:

该模型具有同方差性。因为

1211211111)()()(--------¢¢=¢=¢¢=¢¢=¢DDDDDWDDμμDDμμDμμ**ssEEE第二十二页,共六十七页,2022年,8月28日23

这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。

这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵2W

。第二十三页,共六十七页,2022年,8月28日24

如何得到2W

从前面的推导过程看,它来自于原模型残差项的方差—协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量,以此构成权矩阵的估计量,即这时可直接以

作为权矩阵。

úúúûùêêêëé=2212ˆnee…Ws|}|/1,|,|/1|,|/1{211neeediagL=-D第二十四页,共六十七页,2022年,8月28日25

注意:

在实际操作中人们通常采用如下的经验方法:

不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。第二十五页,共六十七页,2022年,8月28日26七、案例分析案例1—我国城镇居民收入对通信交通支出的影响第二十六页,共六十七页,2022年,8月28日27七、案例分析

中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响,可用以下双对数模型:案例2——中国农村居民人均消费函数第二十七页,共六十七页,2022年,8月28日28表4.1.4中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)

地区

人均消费

支出Y从事农业经营

的收入

1X其他收入

2X

地区

人均消费

支出

Y

从事农业经营

的收入

1X

其他收入

2X

3552.1

579.1

4446.4

2703.36

1242.9

2526.9

2050.9

1314.6

2633.1

1550.62

1068.8

875.6

1429.8

928.8

1674.8

广

1357.43

1386.7

839.8

西

1221.6

609.8

1346.2

广

西

1475.16

883.2

1088.0

内蒙古

1554.6

1492.8

480.5

1497.52

919.3

1067.7

1786.3

1254.3

1303.6

1098.39

764.0

647.8

1661.7

1634.6

547.6

1336.25

889.4

644.3

黑龙江

1604.5

1684.1

596.2

1123.71

589.6

814.4

4753.2

652.5

5218.4

1331.03

614.8

876.0

2374.7

1177.6

2607.2

西

1127.37

621.6

887.0

3479.2

985.8

3596.6

西

1330.45

803.8

753.5

1412.4

1013.1

1006.9

1388.79

859.6

963.4

2503.1

1053.0

2327.7

1350.23

1300.1

410.3

西

1720.0

1027.8

1203.8

2703.36

1242.9

2526.9

1905.0

1293.0

1511.6

1550.62

1068.8

875.6

1375.6

1083.8

1014.1

第二十八页,共六十七页,2022年,8月28日29普通最小二乘法的估计结果:

可看出:其他收入(不是农业经营收入)的增长,对农村人均消费支出的增长更有刺激作用。第二十九页,共六十七页,2022年,8月28日30异方差检验

从结果分析中可认为,不同地区农村人均消费支出的差别主要来源于非农经营收入和其他收入的差别。因此,如果存在异方差性,则可能是X2引起的。第三十页,共六十七页,2022年,8月28日31图示检验法表明存在单调递增型异方差第三十一页,共六十七页,2022年,8月28日32进一步的统计检验

(1)G-Q检验

将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:

第三十二页,共六十七页,2022年,8月28日33表4.1.4中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)

地区

人均消费

支出Y从事农业经营

的收入

1X其他收入

2X

地区

人均消费

支出

Y

从事农业经营

的收入

1X

其他收入

2X

3552.1

579.1

4446.4

2703.36

1242.9

2526.9

2050.9

1314.6

2633.1

1550.62

1068.8

875.6

1429.8

928.8

1674.8

广

1357.43

1386.7

839.8

西

1221.6

609.8

1346.2

广

西

1475.16

883.2

1088.0

内蒙古

1554.6

1492.8

480.5

1497.52

919.3

1067.7

1786.3

1254.3

1303.6

1098.39

764.0

647.8

1661.7

1634.6

547.6

1336.25

889.4

644.3

黑龙江

1604.5

1684.1

596.2

1123.71

589.6

814.4

4753.2

652.5

5218.4

1331.03

614.8

876.0

2374.7

1177.6

2607.2

西

1127.37

621.6

887.0

3479.2

985.8

3596.6

西

1330.45

803.8

753.5

1412.4

1013.1

1006.9

1388.79

859.6

963.4

2503.1

1053.0

2327.7

1350.23

1300.1

410.3

西

1720.0

1027.8

1203.8

2703.36

1242.9

2526.9

1905.0

1293.0

1511.6

1550.62

1068.8

875.6

1375.6

1083.8

1014.1

第三十三页,共六十七页,2022年,8月28日34

子样1子样2地区YX1X2地区YX1X2青海1350.21300.1410.3辽宁1786.31254.31303.6内蒙古1554.61492.8480.5山西1221.6609.81346.2吉林1661.71634.6547.6山东1905.01293.01511.6黑龙江1604.51684.1596.2河北1429.8928.81674.8四川1336.3889.4644.3福建2503.11053.02327.7重庆1098.4764.0647.8宁夏2703.41242.92526.9陕西1330.5803.8753.5湖北2703.41242.92526.9贵州1123.7589.6814.4江苏2374.71177.62607.2广东1357.41386.7839.8天津2050.91314.62633.1湖南1550.61068.8875.6浙江3479.2985.83596.6云南1331.0614.8876.0北京3552.1579.14446.4西藏1127.4621.6887.0上海4753.2652.55218.4第三十四页,共六十七页,2022年,8月28日35子样本1:

(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648

子样本2:

(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729第三十五页,共六十七页,2022年,8月28日36计算F统计量:

F=RSS2/RSS1=0.2792/0.0648=4.31

查表给定=5%,查得临界值F0.05(9,9)=3.18判断

F>F0.05(9,9)

否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。第三十六页,共六十七页,2022年,8月28日37(2)怀特检验

作辅助回归:

(-0.04(0.10)(0.21)(-0.12)(1.47)(-1.11)R2=0.4638

似乎没有哪个参数的t检验是显著的。但

nR2=31*0.4638=14.38=5%下,临界值,nR2

所以,拒绝同方差性的原假设。第三十七页,共六十七页,2022年,8月28日38去掉交叉项后的辅助回归结果

(1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374查表得临界值:所以,X2项与X2的平方项的参数的t检验是显著的,且nR2

=310.4374=13.56

=5%下,临界值20.05(4)=9.49,因此,拒绝同方差的原假设。

第三十八页,共六十七页,2022年,8月28日39原模型的加权最小二乘回归

对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵2W的估计量;再以1/|ěi|为权重进行WLS估计,得可看出:各项统计检验指标全面改善第三十九页,共六十七页,2022年,8月28日40一、序列相关性概念二、实际经济问题中的序列相关性

三、序列相关性的产生原因及后果四、序列相关性的检验五、案例§4.2序列相关性

第四十页,共六十七页,2022年,8月28日41一、序列相关性概念

如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性(SerialCorrelation)。

对于模型

Yi=0+1X1i+2X2i+…+kXki+i

i=1,2,…,n随机项互不相关的基本假设表现为

Cov(i

,j)=0ij,i,j=1,2,…,n第四十一页,共六十七页,2022年,8月28日42或IΩ22ss¹=第四十二页,共六十七页,2022年,8月28日43

称为一阶序列相关,或一阶自相关(autocorrelation),或一阶自回归。

其中:被称为一阶自相关系数(first-ordercoefficientofautocorrelation)随机扰动项的序列相关可有多种形式⑴一阶序列相关形式即随机扰动项只与它的前一期值相关。如果仅存在

cov(t,t-1)=

E(t

t-1)0

或t=1,2,…,n一阶自相关往往可写成如下形式:

t=t-1+t-1<<1第四十三页,共六十七页,2022年,8月28日44

由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。

⑵p阶序列相关形式(模型存在p阶序列相关)

t=1t-1+2t-2+…+

pt-p+t

此为序列相关(自相关)的一般形式t是满足以下OLS基本假定的随机扰动项:

0)(=tEe,2)var(se=t,0),cov(=stee

s¹t

第四十四页,共六十七页,2022年,8月28日45二、实际经济问题中的序列相关性

大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列在不同时间的前后关联上。由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例如,绝对收入假设下居民总消费函数模型:

Ct=0+1Yt+tt=1,2,…,n1.经济变量固有的惯性第四十五页,共六十七页,2022年,8月28日462.模型设定的偏误

所谓模型设定偏误(Specificationerror)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。

例如,本来应该估计的模型为

Yt=0+1X1t+2X2t+3X3t+t但在模型设定中做了下述回归:

Yt=0+1X1t+1X2t+

vt又如:现期消费水平(Ct)往往受到其上一期的影响,若放入U中即存在自相关。Ct=B0+B1Ct-1+B2Yt第四十六页,共六十七页,2022年,8月28日47因此,vt=3X3t+t,如果X3确实影响Y,则出现序列相关。又如:如果真实的边际成本回归模型应为:

Yt=0+1X1t+2X1t2+t其中:Y=边际成本,X=产出。但建模时设立了如下模型:

Yt=0+1X1t+vt因此,由于vt=2X1t2+t

,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。第四十七页,共六十七页,2022年,8月28日483.数据的“编造”

例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。

在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。

第四十八页,共六十七页,2022年,8月28日49(一)产生原因

1.许多经济变量往往存在序列相关是因为其时间序列有一种惯性,呈现出时间趋势变化,且其前后期总相关(如上例)。对这种经济变量(作为因变量)的模型作回归分析时,若其滞后量不作为解释变量,其影响必反映在随机扰动项u中,导致u前后期的自相关。同时u中非重要解释变量之间的自相关,也可引起u的自相关。以上自相关也称“伪自相关”。三、序列相关性的产生原因和后果

从一般经验讲,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。第四十九页,共六十七页,2022年,8月28日502。构造模型错误

如构造Y=A+BX为线性,但实际应为曲线形式。错误的模型形式所产生对Y的系统影响带入u中,使u呈序列相关趋势。3。许多情况下,u本身存在自相关性(“真正自相关”)

如生产过程中出现的偶然事故,天灾等,不仅影响生产,且影响以后的时期,从而导致自相关。

第五十页,共六十七页,2022年,8月28日514.数据的处理方法实际问题中,有时为需要,原始数据往往都经过拟合“编造”处理,即有些数据是通过已知数据生成的。故新原数据间的内在联系,表现出序列相关性。例如,季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,此匀滑性本身就能使随机扰动项中出现系统性的因素,从而出现序列相关性。当然原因还有很多,不一一列举。第五十一页,共六十七页,2022年,8月28日521.参数估计量非有效

因为,在有效性证明中利用了

E(uu’)=2I即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。(二)后果

计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:第五十二页,共六十七页,2022年,8月28日53

2.变量的显著性检验失去意义

在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存在序列相关,估计的参数方差出现偏误(偏大或偏小),t检验就失去意义。

其他检验也是如此。第五十三页,共六十七页,2022年,8月28日543.模型的预测失效

区间预测与参数估计量的方差有关,在方差(标准差)有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。第五十四页,共六十七页,2022年,8月28日55

然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。

序列相关性各检验方法的基本思路都相同:基本思路:

四、序列相关性的检验首先,采用OLS法估计模型,以求得随机误差项的

“近似估计量”,用ei表示:

lsiiiYYe0)ˆ(-=检验方法多:如回归检验法、DW检验、冯诺曼比检验等第五十五页,共六十七页,2022年,8月28日561.图示法几种常用检验方法:第五十六页,共六十七页,2022年,8月28日572.回归检验法

……

t=2,…,nt=3,…,n对方程估参并作显著性检验。以te为被解释变量,以各种可能的相关量,诸如以1-te、2-te、2te等为解释变量,建立各种方程:

ttteeer+=-1tttteeeerr++=--2211第五十七页,共六十七页,2022年,8月28日58

如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。

回归检验法的优点是:(1)能够确定序列相关的形式。(2)适用于任何类型序列相关性问题的检验。

但工作量大,计算复杂繁琐。第五十八页,共六十七页,2022年,8月28日593.杜宾—瓦森(Durbin-Watson,D-W)检验法

D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法。该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:

i=i-1+i第五十九页,共六十七页,2022年,8月28日60(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:

Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项针对原假设:H0:=0,即不具有一阶自相关形式

对立假设:H1:≠0即具有一阶自相关形式

为的自相关系数,且∣∣≤1构造如下统计量:

D.W.统计量:第六十页,共六十七页,2022年,8月28日61

该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。

但是,他们成功地导出了临界值的下限dL和上限dU

,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。注意:n≥15

åå==--=nttnttteeeWD12221)(..第六十一页,共六十七页,2022年,8月28日62D.W检验步骤:(1)计算DW值(2)给定显著性水平,由n和k的大小查DW分布表,得临界值的下限dL和上限dU(3)比较、判断:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论