第三章 回归模型的扩展_第1页
第三章 回归模型的扩展_第2页
第三章 回归模型的扩展_第3页
第三章 回归模型的扩展_第4页
第三章 回归模型的扩展_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章回归模型的扩展第一页,共一百四十三页,2022年,8月28日本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。

第三章回归模型的扩展第二页,共一百四十三页,2022年,8月28日一、异方差性及其产生的原因二、异方差性产生的后果三、异方差性的检验四、异方差的解决方法

练习题及参考资料

返回第一节异方差性第三页,共一百四十三页,2022年,8月28日一、异方差性及其产生的原因

1、异方差性的概念对于线性回归模型

yi=b0+b1x1i+b2x2i+…+bkxki+εi如果出现:

D(εi)=σ2i≠常数

(i=1,2,….n)则称模型出现了异方差性(Heteroskedasticity)。第一节异方差性第四页,共一百四十三页,2022年,8月28日2、异方差性产生的主要原因⑴模型中遗漏了随时间变化影响逐渐增大的因素。⑵模型函数形式的设定误差。⑶随机因素的影响。第一节异方差性第五页,共一百四十三页,2022年,8月28日二、异方差性产生的后果

1.最小二乘估计不再是有效估计;2.无法正确估计系数的标准误差;3.t检验的可靠性降低;4.增大模型的预测误差。

第一节异方差性第六页,共一百四十三页,2022年,8月28日三、异方差性的检验【例1】我国制造工业利润函数。教材P71表3-1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。1、图示检验法(1)相关图分析键入命令:ScatYX(3.1版不同)

操作演示第一节异方差性第七页,共一百四十三页,2022年,8月28日(2)残差分布图分析注意观察之前需要先将数据关于解释变量排序,命令格式为:

SORTXLSYCX

操作演示第一节异方差性第八页,共一百四十三页,2022年,8月28日2、怀特(White)检验

设:yi=b0+b1x1i+b2x2i+εiWhite检验的具体步骤为:(1)估计回归模型,并计算e2i

;(2)估计辅助回归模型;(3)计算辅助回归模型的R2;可以证明,在同方差的假设下,有:nR2~χ2(q)q:辅助回归模型中的自变量个数(此时q=5)。第一节异方差性第九页,共一百四十三页,2022年,8月28日(4)给定α,若nR2>χ2α(q),存在异方差性;反之,不存在。

EViews软件中:①建立回归模型:LS YC X

②检验异方差性:在方程窗口中依次点击View\ResidualTest\WhiteHeteroskedastcity一般是直接观察p值的大小,若p值较小,认为模型存在异方差性。

操作演示第一节异方差性第十页,共一百四十三页,2022年,8月28日四、异方差性的解决方法基本思想:变异方差为同方差,或尽量缓解方差变异的程度。

1.模型变换法例如,对于模型yi=a+bxi+εi

(1)如果σi2=D(εi)=λxi2

(λ>0,且为常数)因为第一节异方差性第十一页,共一百四十三页,2022年,8月28日所以,用xi除以原模型的两端,将模型变换成:设:则(2)如果σi2=D(εi)=λxi,因为

第一节异方差性第十二页,共一百四十三页,2022年,8月28日

所以用xi的平方根除以原模型,得到:设:则

一般情况下,若D(εi)=λf(xi),则以f(xi)的平方根除以原模型的两端,即可将原模型中的异方差性予以消除.第一节异方差性第十三页,共一百四十三页,2022年,8月28日

2、加权最小二乘法(WLS)WLS是使:ωi是权数

ωi有两个作用:一是权重,二是为了消除异方差。由于在极小化过程中对通常意义的残差平方加上了权数ωi,所以称为加权最小二乘法(WeightedLeastSquare—WLS。注意权数的变化趋势应与异方差的变化趋势相反,通常将ωi直接取成1/σi2

。第一节异方差性第十四页,共一百四十三页,2022年,8月28日3、加权最小二乘估计的EViews软件实现(1)利用原始数据和OLS法计算ei;(2)生成权数变量ωi

;(3)使用加权最小二乘法估计模型:【命令方式】 LS(W=权数变量)YCX【菜单方式】①在方程窗口中点击Estimate按钮;②点击Options,进入参数设置对话框;注意:中间不能有空格第一节异方差性第十五页,共一百四十三页,2022年,8月28日③选定WeightedLS方法,在权数变量栏中输入权数变量,点击OK返回;④点击OK,采用WLS方法估计模型。(4)对估计后的模型,再使用White检验判断是否消除了异方差性。

【例2】我国制造工业利润函数中异方差性的调整。现在设法利用EViews软件消除异方差性的影响。第一节异方差性第十六页,共一百四十三页,2022年,8月28日(1)LSYCX操作演示估计结果为:R2的值标准差T统计量值(2)生成权数变量根据Park检验,得到:

取权数变量为:

GENR W1=1/X^1.6743GENR W2=1/SQR(X)第一节异方差性第十七页,共一百四十三页,2022年,8月28日另外,取:

GENR W3=1/ABS(RESID) GENR W4=1/RESID^2

(3)利用WLS法估计模型:按命令方式或菜单方式,可以得到以下估计结果:比较分析各模型第一节异方差性第十八页,共一百四十三页,2022年,8月28日①(W=W1)操作演示

R2=0.8483nr2=4.92p=0.085②(W=W2)R2=0.6115nr2=3.16p=0.206

③(W=W3)R2=0.9754nr2=6.64p=0.036④(W=W4)t=(3.11)(54.16)R2=0.9969nr2=3.10p=0.213第一节异方差性第十九页,共一百四十三页,2022年,8月28日1、异方差产生的原因及其后果。2、异方差检验的方法主要有哪些。3、模型变换法的基本原理和实质。4、WLS估计的基本原理。课外练习第二十页,共一百四十三页,2022年,8月28日1、《计量经济学》庞皓编著,西南财大出版社,2001年2、《经济计量学》张保法编著,经济科学出版社,2000年版3、《计量经济学》赵国庆编著,中国人民大学出版社,2001年参考文献第二十一页,共一百四十三页,2022年,8月28日一、自相关性及其产生的原因二、自相关性的后果三、自相关性的检验四、自相关性的修正方法

练习题及参考资料

返回第二节自相关性第二十二页,共一百四十三页,2022年,8月28日一、自相关性及其产生的原因

1、概念对于模型yt=b0+b1x1t+b2x2t+…+bkxkt+εt

如果:Cov(εt,εt-i)=E(εtεt-i)≠0(i=1,2,…,s)

则称模型存在着自相关性(Autocorrelation)。第二节自相关性第二十三页,共一百四十三页,2022年,8月28日2、产生原因(1)经济惯性。(2)模型中遗漏了重要的解释变量。(3)模型形式设定不当。(4)随机因素的影响。(5)数据处理造成的自相关。

第二节自相关性第二十四页,共一百四十三页,2022年,8月28日

3、表示

εt=ρ1εt-1+ρ2εt-2+…+ρpεt-p+νt

称之为p阶自回归形式,或模型存在p阶自相关。

νt是满足回归模型基本假定的随机误差项。

ρ为自回归系数(数值上等于自相关系数,证明略)第二节自相关性第二十五页,共一百四十三页,2022年,8月28日二、自相关性的后果

1.最小二乘估计不再是有效估计。2.低估OLS估计的标准误差。

3.t检验失效。4.模型的预测精度降低。

第二节自相关性第二十六页,共一百四十三页,2022年,8月28日三、自相关性的检验1、残差图分析2.德宾-沃森(Durbin-Watson,DW)检验

适用条件:随机项一阶自相关性;解释变量与随机项不相关,样本容量较大。基本原理和步骤:

(1)提出假设H0:ρ=0第二节自相关性第二十七页,共一百四十三页,2022年,8月28日(2)构造检验统计量:

DW统计量与ρ之间的关系:因为对于大样本,

第二节自相关性第二十八页,共一百四十三页,2022年,8月28日所以:

所以有:

此式为自相关系数ρ的估计

第二节自相关性第二十九页,共一百四十三页,2022年,8月28日因为-1≤ρ≤1,所以0≤DW≤4。(3)检验自相关性:

DW=0即存在完全正自相关性

DW=4即存在负自相关性

DW=2即不存在(一阶)自相关性

DW的概率分布很难确定,实际检验过程为(见下图):

第二节自相关性第三十页,共一百四十三页,2022年,8月28日①0≤DW≤dL时,拒绝H0,存在(正)自相关性。②4-dU≤DW≤4时,拒绝H0,存在(负)自相关性。③dU≤DW≤4-dU时,接受H0,不存在自相关性。④dL<DW<dU,或4-dU<DW<4-dL时,无法判定是否存在自相关性。

4-dLdLdU4-dU42无自相关负自相关正自相关无法判定无法判定第二节自相关性第三十一页,共一百四十三页,2022年,8月28日注意问题:

(1)D-W检验只能判断是否存在一阶自相关性。(2)D-W检验有两个无法判定的区域。(3)如果模型的解释变量中间含有滞后的被解释变量,此时D-W检验失效。对此类模型Durbin又提出了一个新的检验统计量,称为Durbin-h统计量:

第二节自相关性第三十二页,共一百四十三页,2022年,8月28日3.高阶自相关性检验(1)偏相关系数检验【命令方式】IDENTRESID【菜单方式】在方程窗口中点击View\ResidualTest\Correlogram-Q-statistics

屏幕将直接输出et与et-1,et-2…et-p

(p是事先指定的滞后期长度)的相关系数和偏相关系数。

第二节自相关性第三十三页,共一百四十三页,2022年,8月28日(2)布罗斯—戈弗雷(Breusch—Godfrey)检验对于模型yt=b0+b1x1t+b2x2t+…+bkxkt+εt设自相关形式为:

εt=ρ1εt-1+ρ2εt-2+…+ρpεt-p+νt假设H0:ρ1=ρ2=…=ρp=0①利用OLS法估计模型,得到et;②将et关于所有解释变量和残差的滞后值et-1,et-2…et-p

进行回归,并计算出其R2;第二节自相关性第三十四页,共一百四十三页,2022年,8月28日③在大样本情况下,有nR2~χ2(p)给定α,若nR2大于临界值,拒绝H0。

EViews软件操作:在方程窗口中点击View\ResidualTest\SerialCorrelationLMTest。滞后期的长度确定:一般是从低阶的p(p=1)开始,直到p=10左右,若未能得到显著的检验结果,可以认为不存在自相关性。第二节自相关性第三十五页,共一百四十三页,2022年,8月28日

【例3】中国城乡居民储蓄存款模型(自相关性检验)。教材P89表3-2列出了我国城乡居民储蓄存款年底余额(单位:亿元)和国内生产总值指数(1978年=100)的历年统计资料,试建立居民储蓄存款模型,并检验模型的自相关性。第二节自相关性第三十六页,共一百四十三页,2022年,8月28日

(1)SCATXY

操作演示为曲线相关,所以函数形式初步确定为:双对数模型、指数曲线模型、二次多项式模型。第二节自相关性第三十七页,共一百四十三页,2022年,8月28日(2)估计并选择模型

GENRLNY=LOG(Y)GENRLNX=LOG(X)GENRX2=X^2LSLNYCXLSYCXX2LSLNYCLNX经过比较,取双对数模型,估计结果为:操作演示对应的标准差对应的R2值调整的R2值对应的DW值第二节自相关性第三十八页,共一百四十三页,2022年,8月28日(3)检验自相关性操作演示

①残差图分析:残差图表明呈现有规律的波动。②D-W检验:n=21,k=1,α=0.05时,查表得dL=1.22,dU=1.42,而0<0.7028=DW<dL,所以存在(正)自相关性。③偏相关系数检验:滞后期为10,结果如下图。第二节自相关性第三十九页,共一百四十三页,2022年,8月28日

操作演示滞后期自相关系数偏自相关系数自相关系数直方图偏自相关系数直方图偏自相关系数>0.5自相关系数>0.5第二节自相关性第四十页,共一百四十三页,2022年,8月28日④BG检验:在方程窗口中点击View\ResidualTest\SerialCorrelationLMTest,选择滞后期为2,屏幕将显示信息(右图)第二节自相关性操作演示nR2=21×0.54309临界概率nR2=21×0.54309临界概率第四十一页,共一百四十三页,2022年,8月28日四、自相关性的修正方法1、广义差分法设yt=a+bxt+εt,εt=ρεt-1+υt模型滞后一期:yt-1=a+bxt-1+εt-1两边同乘以ρ,与原模型相减:

yt-ρyt-1=a(1-ρ)+b(xt-ρxt-1)+(εt-ρεt-1)作广义差分变换:则其中,A=a(1-ρ)。第二节自相关性第四十二页,共一百四十三页,2022年,8月28日利用OLS法估计A、b,进而得到:

若ρ=1,则可得到一阶差分模型

yt-yt-1=b(xt-xt-1)+υt如果为高阶自回归形式:

εt=ρ1εt-1+ρ2εt-2+…+ρpεt-p+νt同理得到满足基本假定的模型:第二节自相关性则:第四十三页,共一百四十三页,2022年,8月28日ρ的常用估计方法有:(1)近似估计法在大样本(n≥30)情况下,DW≈2(1-ρ),所以,对于小样本(n<30),泰尔(Thei1.H)建议使用下述近似公式:其中k为解释变量个数,当n→∞时,=1-DW/2。第二节自相关性第四十四页,共一百四十三页,2022年,8月28日(2)迭代估计法①利用OLS法估计模型,计算第一轮残差et(1);②根据残差et(1)

计算ρ的(第一轮)估计值:

③利用估计的ρ值进行广义差分变换,并估计广义差分模型④计算(第二轮)残差和ρ的估计值:⑤重复执行③、④两步,直到ρ的前后两次估计值比较接近,即估计误差小于事先给定的精度δ时为止:第二节自相关性第四十五页,共一百四十三页,2022年,8月28日3.广义差分法的EViews软件实现(1)LS Y C X(2)IDENT RESID(3)利用广义差分法估计模型,命令为

LSYCXAR(1)LSYCXAR(1)AR(2)……AR(k)(4)迭代估计过程的控制

EViews软件按照默认的迭代次数(100次)和误差精度(0.001)来控制迭代估计程序,也可以修改。第二节自相关性第四十六页,共一百四十三页,2022年,8月28日【例4】中国城乡居民储蓄存款模型(自相关性调整)。

(1)迭代估计法例3的检验表明模型存在一、二阶自相关性,则

LSYCXAR(1)AR(2)

模型为:ρ1的估计值ρ2的估计值调整后的DW值R2的值对应的标准差第二节自相关性操作演示第四十七页,共一百四十三页,2022年,8月28日(2)广义差分变换法

取ρ1=0.9531,ρ2=-0.5966;GENR LNY=log(Y)GENR LNX=log(X)GENR NY=LNY-0.9531*LNY(-1)+0.5966*LNY(-2)GENR NX=LNX-0.9531*LNX(-1)+0.5966*LNX(-2)再利用OLS法估计变换后的模型:LSNYCNX估计结果如下图所示:第二节自相关性第四十八页,共一百四十三页,2022年,8月28日变换后的模型为:

=-5.0499/(1-0.9531+0.5966)=-7.8476,所以使用广义差分变换直接估计出的模型为:对应的标准差R2的值DW的值

除了计算误差之外,两种方法的估计结果是一致的。

第二节自相关性操作演示第四十九页,共一百四十三页,2022年,8月28日1、简述自相关性产生的原因及其后果。2、简述DW检验的基本原理和步骤。3、简述BG检验的基本原理。

课外练习第五十页,共一百四十三页,2022年,8月28日1、《计量经济学》庞皓编著,西南财大出版社,2001年2、《经济计量学》张保法编著,经济科学出版社,2000年版3、《计量经济学》赵国庆编著,中国人民大学出版社,2001年参考文献第五十一页,共一百四十三页,2022年,8月28日一、多重共线性及其产生的原因二、多重共线性的后果三、多重共线性的检验四、多重共线性的修正方法

练习题及参考资料

返回第三节多重共线性第五十二页,共一百四十三页,2022年,8月28日一、多重共线性及其产生的原因

1、概念对于模型yi=b0+b1x1i+b2x2i+…+bkxki+εi,若解释变量之间存在较强的线性相关关系,即存在一组不全为零的常数λ1,λ2,…λk,使得λ1x1i+λ2x2i+…+λkxki+νi=0则称模型存在着多重共线性如果νi=0,则称存在完全的多重共线性。第三节多重共线性第五十三页,共一百四十三页,2022年,8月28日2、多重共线性产生的主要原因:⑴经济变量的内在联系。⑵经济变量变化趋势的“同向性”。⑶滞后变量作为解释变量。

第三节多重共线性第五十四页,共一百四十三页,2022年,8月28日二、多重共线性的后果

1.增大OLS估计的方差。设模型为:yi=a+b1x1i+b2x2i+εi则,的方差为:称为方差膨胀因子(VarianceInflatingFactor),记成VIF。r12为x1、x2的相关系数第三节多重共线性第五十五页,共一百四十三页,2022年,8月28日2、无法正确反映每个解释变量对被解释变量的单独影响。3、t检验的可靠性降低。4.回归模型缺乏稳定性。

VIF表明:当x1、x2高度相关时(即r12→1),VIF→+∞;OLS估计量的方差将成倍增长,直至趋于无穷大。第三节多重共线性第五十六页,共一百四十三页,2022年,8月28日三、多重共线性的检验1、简单相关系数法【命令方式】COR解释变量名【菜单方式】将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations。2、辅助回归模型检验(i=1,2,…,k)第三节多重共线性第五十七页,共一百四十三页,2022年,8月28日3.方差膨胀因子检验对于多元线性回归模型,的方差可以表示成:

一般当VIF>10时(此时Ri2>0.9),认为模型存在较严重的多重共线性。

Ri2为xi关于其它解释变量辅助回归模型的判定系数

为方差膨胀因子第三节多重共线性第五十八页,共一百四十三页,2022年,8月28日另一个与VIF等价的指标是“容许度”(Tolerance),其定义为:

显然,0≤TOL≤1;当xi与其它解释变量高度相关时,TOL→0。因此,一般当TOL<0.1时,认为模型存在较严重的多重共线性第三节多重共线性第五十九页,共一百四十三页,2022年,8月28日四、多重共线性的修正方法

首先明确建立模型的目的:预测、结构分析或政策评价。

1、直接剔除次要或可替代的变量需注意产生新的问题:①模型的经济意义不合理;②是否使模型产生异方差性或自相关性;③若剔除不当,可能会产生模型设定误差,造成参数估计严重有偏第三节多重共线性第六十页,共一百四十三页,2022年,8月28日2、间接剔除重要的解释变量⑴利用附加信息生产函数,L与K通常高度相关已知附加信息:α+β=1(规模报酬不变)

记y=Y/L,k=K/L则C-D生产函数可以表示成:y=Akβ利用OLS法估计,进而得到则第三节多重共线性第六十一页,共一百四十三页,2022年,8月28日(2)变换模型的形式

①变换模型的函数形式②变换模型的变量形式③改变变量的统计指标(3)综合使用时序数据与横截面数据。

可以看出,最终还是通过减少模型中解释变量个数的方式来消除多重共线性的影响,但并不是直接剔除有重要影响的解释变量。第三节多重共线性第六十二页,共一百四十三页,2022年,8月28日3、逐步回归

基本原理:从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入—剔除—引入,直到模型之外所有变量均不显著时为止。

第三节多重共线性第六十三页,共一百四十三页,2022年,8月28日

【例5】服装需求函数。根据理论和经验分析,影响居民服装需求的主要因素有:可支配收入X、流动资产拥有量K、服装类价格指数P1和总物价指数P0

。教材P115的表3-4给出了有关统计资料。设服装需求函数为:Y=a+b1x+b2P1+b3P0+b4K+ε第三节多重共线性第六十四页,共一百四十三页,2022年,8月28日(1)相关系数检验键入:CORYXKP1P0相关系数矩阵为:

操作演示可见每个因素都与服装需求高度相关,而且解释变量之间也是高度相关的。第三节多重共线性第六十五页,共一百四十三页,2022年,8月28日(2)建立一元回归模型

以Y=a+bX+ε作为最基本的模型。(3)将其余变量逐个引入模型。操作演示

具体数据见教材P115表3-5

经过逐步引入—检验过程,最终确定服装需求模型为:

LSYCXP1P0操作演示对应的服装需求函数为:第三节多重共线性第六十六页,共一百四十三页,2022年,8月28日对应的t统计量R2的值调整的R2值DW的值第三节多重共线性第六十七页,共一百四十三页,2022年,8月28日1、简述多重共线性产生的原因及其后果。2、常用的多重共线性检验方法有哪些?3、逐步回归的基本原理及具体步骤。

课外练习第六十八页,共一百四十三页,2022年,8月28日1、《计量经济学》庞皓编著,西南财大出版社,2001年2、《经济计量学》张保法编著,经济科学出版社,2000年版3、《计量经济学》赵国庆编著,中国人民大学出版社,2001年参考文献第六十九页,共一百四十三页,2022年,8月28日一、虚拟变量及其作用二、虚拟变量的设定三、虚拟变量的特殊应用四、虚拟被解释变量

练习题及参考资料

返回第四节虚拟变量第七十页,共一百四十三页,2022年,8月28日一、虚拟变量(dummy)及其作用1、定义:反映品质指标变化、数值只取0和1的人工变量。用符号D来表示。

如:城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划分应遵循穷举与互斥原则。第四节虚拟变量第七十一页,共一百四十三页,2022年,8月28日2、作用:⑴可以描述和测量定性因素的影响。⑵能够正确反映经济变量之间的相互关系,提高模型的精度。⑶便于处理异常数据。即将异常数据作为一个特殊的定性因素

异常时期正常时期第四节虚拟变量第七十二页,共一百四十三页,2022年,8月28日二、虚拟变量的设定

1.虚拟变量的引入方式。(1)加法方式

Yi=a+bxi+αDi+εi

等价为:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=(a+α)+bxi+εiD=0D=1aa+αα以加法方式引入,反映定性因素对截距的影响

第四节虚拟变量第七十三页,共一百四十三页,2022年,8月28日(2)乘法方式

Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=a+(b+β)xi+εiD=0D=1aβ以乘法方式引入,可反映定性因素对斜率的影响,系数β描述了定性因素的影响程度。第四节虚拟变量第七十四页,共一百四十三页,2022年,8月28日(3)一般方式同时用加法与乘法方式引入虚拟变量,然后再利用t检验判断α、β是否显著的不等于零,进而确定虚拟变量的具体引入方式。

【例7】教材P126表3-8列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。

第四节虚拟变量第七十五页,共一百四十三页,2022年,8月28日观察相关图操作演示

从相关图可以看出,前3个样本点与后5个样本点存在较大差异,因此,可设置虚拟变量反映“收入层次”:中高收入家庭低收入家庭第四节虚拟变量第七十六页,共一百四十三页,2022年,8月28日将我国城镇居民的彩电需求函数设成:

Yi=a+bxi+αDi+βXDi+εiDATAD1(由于D是EViews软件的保留字,所以将虚拟变量取名为D1;另外,此时也可以用SMPL和GENR命令直接生成D1变量)

GENR XD=X*D1 生成变量XD LSYCXD1XD 估计需求函数结果如下图所示:第四节虚拟变量第七十七页,共一百四十三页,2022年,8月28日我国城镇居民彩电需求函数的估计结果为:

对应的t统计量值R2的值调整的R2值SE的值

结果表明不同收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异。第四节虚拟变量第七十八页,共一百四十三页,2022年,8月28日低收入家庭:

此例说明了三个问题:①如何设置和在模型中引入虚拟变量;②如何测量定性因素(即收入层次)的影响;③如何区分不同类型的模型(即需求函数)。

中高收入家庭:

第四节虚拟变量第七十九页,共一百四十三页,2022年,8月28日2.虚拟变量的设置原则

⑴一个因素多个类型

对于有m个不同属性的定性因素,应该设置m-1个虚拟变量来反映该因素的影响。

例如,设公司职员的年薪与工龄和学历有关。学历分成三种:大专以下、本科、研究生。为反映“学历”的影响,应该设置两个虚拟变量:本科其他研究生其他第四节虚拟变量第八十页,共一百四十三页,2022年,8月28日

Yi=a+bxi+εi大专以下(D1=D2=0)Yi=(a+α1)+bxi+εi本科(D1=1,D2=0)Yi=(a+α2)+bxi+εi研究生(D1=0,D2=1)而将年薪模型取成(假设以加法方式引入):

Yi=a+bxi+α1D1i+α2D2i+εi其等价于:三类年薪函数的差异情况如下图所示:第四节虚拟变量第八十一页,共一百四十三页,2022年,8月28日大专以下本科研究生工龄年薪α2-α1

α1

第四节虚拟变量D=设置虚拟变量D或增设D3行吗?研究生其他第八十二页,共一百四十三页,2022年,8月28日(2)多个因素各两种类型

如果有m个定性因素,且每个因素各有两个不同的属性类型,则引入m个虚拟变量。

例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成:yi=a+bxi+α1D1i+α2D2i+εi

其中y,x分别是居民住房消费支出和可支配收入,虚拟变量设为:第四节虚拟变量第八十三页,共一百四十三页,2022年,8月28日这样可以反映各类居民家庭的住房消费情况:

农村居民城镇居民高收入家庭低收入家庭城市低收入家庭(D1=0,D2=0)

城市高收入家庭(D1=0,D2=1)

农村低收入家庭(D1=1,D2=0)

农村高收入家庭(D1=1,D2=1)第四节虚拟变量思考:若是多因素、多个属性水平的问题,如何设置?第八十四页,共一百四十三页,2022年,8月28日三、虚拟变量的特殊应用

1、调整季节波动例如,用季度数据分析某公司利润y与销售收入x之间的相互关系时,为研究四个季度的季节性影响,引入三个虚拟变量(设第1季度为基础类型):利润函数可取为:

Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi第i+1季度i=1,2,3其他季度第四节虚拟变量第八十五页,共一百四十三页,2022年,8月28日2、检验模型结构的稳定性

设根据两个样本估计的回归模型分别为:样本1:Yi=a1+b1xi+εi

样本2:Yi=a2+b2xi+εi

估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi其中,XDi=xi*Di。样本2样本1

设置虚拟变量:

第四节虚拟变量第八十六页,共一百四十三页,2022年,8月28日利用t检验判断D、XD系数的显著性,得到四种检验结果:(1)a2=a1,b2=b1,两个回归模型没有显著差异。(2)a2≠a1,b2=b1,两个回归模型之间的差异仅仅表现在截距上。(3)a2=a1,b2≠b1,两个回归模型的截距相同,但斜率存在显著差异。(4)a2≠a1,b2≠b1,表明两个回归模型完全不同。第(1)种情况下模型结构是稳定的,其余情况都表明模型结构不稳定。重合回归平行回归汇合回归相异回归第四节虚拟变量第八十七页,共一百四十三页,2022年,8月28日3、分段回归

设虚拟变量为:

分段回归模型设置成:

Yi=a+bxi+β(xi-x*)Di+εi

其中,x*是已知的临界水平(分段点)。这样各段的函数为:

Yi=a+bxi+εix<x*Yi=(a-β)+(b+β)xi+εix>x*

x>x*x<x*使用虚拟变量能如实描述不同阶段的经济关系,又未减少估计模型时样本容量,保证了估计精度。

第四节虚拟变量第八十八页,共一百四十三页,2022年,8月28日4、混合回归【例8】教材P143表3-9为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料。试使用混合样本数据估计我国城镇居民消费函数。设1998年、1999年我国城镇居民消费函数分别为:

1998年:Yi=a1+b1xi+εi1999年:Yi=a2+b2xi+εi

能否将变量的时序数据和横截面数据混合建模第四节虚拟变量第八十九页,共一百四十三页,2022年,8月28日为比较两年的消费函数是否有显著差异,设置虚拟变量:

并且合并两年的数据,估计以下模型:

Yi=a1+b1xi+αDi+βXDi+εi其中α=a2-a1,β=b2-b1。1999年1998年第四节虚拟变量第九十页,共一百四十三页,2022年,8月28日使用EViews软件的估计过程如下:

CREATEU16建立工作文件

DATAYX(输入1998、1999年消费支出和收入的数据,1~8期为1998年资料,9~16期为1999年资料)

SMPL18样本期调为1998年GENRD1=0输入虚拟变量的值SMPL916样本期调为1999年GENRD1=1输入虚拟变量的值第四节虚拟变量第九十一页,共一百四十三页,2022年,8月28日SMPL116样本期调至1998~1999年GENRXD=X*D1生成XD的值LSYCXD1XD利用混合样本估计模型t统计量R2的值调整的R2值估计结果为:操作演示第四节虚拟变量第九十二页,共一百四十三页,2022年,8月28日1、简述虚拟变量的引入方式及其影响。2、设置虚拟变量时应遵守哪些原则?3、虚拟变量有哪些特殊应用。

课外练习第九十三页,共一百四十三页,2022年,8月28日1、《计量经济学》庞皓编著,西南财大出版社,2001年2、《经济计量学》张保法编著,经济科学出版社,2000年版3、《计量经济学》赵国庆编著,中国人民大学出版社,2001年参考文献第九十四页,共一百四十三页,2022年,8月28日一、滞后变量模型二、分布滞后模型的估计三、考耶克模型的经济理论基础四、自回归模型的估计五、滞后效应分析六、因果关系检验

练习题及参考资料

返回第五节滞后变量第九十五页,共一百四十三页,2022年,8月28日一、滞后变量模型

1、滞后变量将变量的前期值、即带有滞后作用的变量称为滞后变量(laggedvariable),含有滞后变量的模型称为滞后变量模型。2.产生滞后效应的原因(1)心理因素(2)技术因素(3)制度因素

第五节滞后变量第九十六页,共一百四十三页,2022年,8月28日3、滞后变量模型⑴分布滞后模型。如果模型中的滞后变量只是解释变量x的过去各期值,即

yt=a+b0xt+b1xt-1+…+bkxt-k+εt则称其为分布滞后模型,表明x对y的滞后影响分布在过去各个时期。如消费函数:Ct=a+b0Yt+b1Yt-1+b2Yt-2+εt第五节滞后变量第九十七页,共一百四十三页,2022年,8月28日⑵自回归模型如果模型中包含解释变量x的本期值和被解释变量y的若干期滞后值,即:

yt=a+b0xt+b1yt-1+…+bkyt-k+εt则称其为(k阶)自回归模型。例如,消费函数:Ct=a+b0Yt+b1Ct-1+εt滞后变量模型有限滞后模型无限滞后模型滞后期有限滞后期无限第五节滞后变量第九十八页,共一百四十三页,2022年,8月28日4、滞后变量模型的特点⑴可以更加全面、客观地描述经济现象。⑵使计量经济模型成为动态模型。⑶可以模拟分析经济系统的变化和调整过程。估计模型时也存在以下问题:(1)经济变量的各期值之间经常是高度相关的;(2)滞后变量个数的增加将会降低样本的自由度;(3)难以客观地确定滞后期的长度。

第五节滞后变量第九十九页,共一百四十三页,2022年,8月28日二、分布滞后模型的估计

1.经验加权法经验加权法就是针对问题的特点,根据实际经验指定各期滞后变量的权数,再将各期滞后变量加权组合成新的解释变量wt,然后估计变换后的模型yi=f(wt)+εt,得到原模型中各参数的估计值。根据滞后结构特点,常使用的权数类型有:第五节滞后变量第一百页,共一百四十三页,2022年,8月28日(1)递减型

即各期权值是递减的

例如,消费函数中近期收入对消费的影响较大,而远期收入的影响将越来越小;如果设滞后期为2,各期权数取成:1/21/41/6则组合成新的解释变量:估计模型(此时模型已无多重共线性):

yt=a+bwt+εt第五节滞后变量第一百零一页,共一百四十三页,2022年,8月28日得到a、b的估计值,将wt代入原模型,得:

所以原模型中各参数的估计值为:

第五节滞后变量第一百零二页,共一百四十三页,2022年,8月28日(2)常数型:

设滞后期为2,各期权数均为1/3,则:估计模型:yt=a+bwt+εt同理得到原模型各参数的估计值为:i=0,1,2即各期权数值相等第五节滞后变量第一百零三页,共一百四十三页,2022年,8月28日(3)倒V型

即各期权数先递增后递减呈倒V型

例如,历年投资对产出的影响一般为倒V型结构。设滞后期为4,各期权数取成:

1/61/41/21/41/6

则组合成新的解释变量:估计模型:yt=a+bwt+εt之后,就可以得到原模型中各参数的估计值。

第五节滞后变量第一百零四页,共一百四十三页,2022年,8月28日2、阿尔蒙估计法(S.Almom)(1)阿尔蒙估计法的原理设有限分布滞后模型为

yt=a+b0xt+b1xt-1+…+bkxt-k+εt连续函数bi=f(i)可以用滞后期i的适当次多项式逼近:

bi=f(i)=α0+α1i+α2i2+…+αmim(m<k)将此关系式代入原分布滞后模型,经过适当的变量变换,可以减少模型中的变量个数,从而在削弱多重共线性影响的情况下,估计模型中的参数。第五节滞后变量第一百零五页,共一百四十三页,2022年,8月28日*****biibi=α0+α1i+α2i2*****biibi=α0+α1i+α2i2+α3i3**第五节滞后变量第一百零六页,共一百四十三页,2022年,8月28日(2)阿尔蒙估计法的步骤分布滞后模型可以表示成:

设bi可以用二次多项式近似表示,即:

bi=α0+α1i+α2i2第五节滞后变量第一百零七页,共一百四十三页,2022年,8月28日将此代入分布滞后模型,整理得:

定义:

称该变量变换为Almon变换,则原分布滞后模型可以表示成:

第五节滞后变量第一百零八页,共一百四十三页,2022年,8月28日利用OLS法估计系数,进而得到bi的估计值。(3)阿尔蒙估计法的特点阿尔蒙估计法的原理巧妙、简单,估计参数时有效地消除了多重共线性的影响,并且适用于多种形式的分布滞后结构。第五节滞后变量第一百零九页,共一百四十三页,2022年,8月28日使用阿尔蒙估计时需要事先确定两个问题:滞后期长度和多项式的次数。

滞后期长度可以根据经济理论或实际经验加以确定,也可以通过相关系数、调整的判定系数、施瓦兹准则SC等统计检验获取信息。利用Eviews软件可以直接得到上述各项检验结果。

多项式次数可以依据经济理论和实际经验加以确定,一般取m=1~3。

第五节滞后变量第一百一十页,共一百四十三页,2022年,8月28日(4)阿尔蒙估计的EViews软件实现在EViews软件的LS命令中使用PDL项,其命令格式为:

LS Y C PDL(X,k,m,d)

其中,k为滞后期长度,m为多项式次数,d是对分布滞后特征进行控制的参数。在LS命令中使用PDL项,应注意以下几点:

①在解释变量x之后必须指定k和m的值,d为可选项,不指定时取默认值0;第五节滞后变量第一百一十一页,共一百四十三页,2022年,8月28日②如果有多个具有滞后效应的解释变量,则分别用几个PDL项表示;例如:

LSYC PDL(x1,4,2)PDL(x2,3,2,2)③在估计分布滞后模型之前,最好使用互相关分析命令CROSS初步判断滞后期的长度k;命令格式为:CROSS Y X

接着输入滞后期p之后,将输出yt与xt,xt-1…xt-p的各期相关系数。也可以在PDL项中逐步加大k的值,再利用调整的判定系数和SC判断较为合适的滞后期长度k。

第五节滞后变量第一百一十二页,共一百四十三页,2022年,8月28日【例9】教材P159表3-11列出了某地区制造行业历年库存Y与销售额X的统计资料,试利用分布滞后模型建立库存函数。

①键入:CROSSYX,输出结果见下图。根据结果可设:

并假定:bi可以用一个二次多项式逼近。

操作演示第五节滞后变量第一百一十三页,共一百四十三页,2022年,8月28日表示滞后i期表示超前i期第五节滞后变量第一百一十四页,共一百四十三页,2022年,8月28日②键入:

LSYCPDL(X,3,2)操作演示输出结果见下图。经Almon变换之后的估计结果为(其中Zi用PDL表示):

对应的t统计量R2的值调整的R2值DW的值

③还原成原分布滞后模型:在Eviews软件的输出窗口下部已给出了还原后的bi估计值。对应各bi的估计值因此库存模型为:对应的t统计量第五节滞后变量第一百一十五页,共一百四十三页,2022年,8月28日3.考耶克(Koyck)方法

估计方法:将分布滞后模型转化成形式较为简单的自回归模型进行估计。(1)Koyck方法的原理设模型为无限分布滞后模型:

在许多情况下,滞后变量的影响随着时间的推移将越来越小,即系数bi的值呈递减趋势。设:bi=b0λi第五节滞后变量第一百一十六页,共一百四十三页,2022年,8月28日其中λ是一个介于0和1之间的常数;λ值的大小决定了递减速度的快慢,λ值越小则递减速度越快,所以称λ为衰退率或下降率。

将bi代入原模型,得则原分布滞后模型变换成一个自回归模型:

其中,υt=εt-λεt-1。称上述变换过程为考耶克变换,经变换得到的自回归模型称为考耶克模型。第五节滞后变量第一百一十七页,共一百四十三页,2022年,8月28日(2)考耶克模型的特点模型中解释变量个数的大幅度减少,有效地解决了多重共线性和样本自由度减少的问题。考耶克变换虽然简化了分布滞后模型,但如果用OLS法估计考耶克模型却又产生了模型存在一阶自相关性、模型中存在与随机误差项相关的随机解释变量等问题:

第五节滞后变量第一百一十八页,共一百四十三页,2022年,8月28日

阿尔蒙方法和考耶克方法都可以用来估计分布滞后模型,但各有特点。

阿尔蒙估计适用于多种类型的分布滞后模型,变换后的模型中不存在与随机误差项相关的解释变量;但却需要人为确定滞后期长度和多项式次数。考耶克方法不需要事先确定滞后期长度,模型变换后形式比较简单,有效地解决了多重共线性和自由度减少的问题;但模型只适用于递减的几何分布滞后模型,而且还不能直接使用OLS法估计变换后的自回归模型。第五节滞后变量第一百一十九页,共一百四十三页,2022年,8月28日三、考耶克模型的经济理论基础

1、自适应预期模型(AdaptiveExpectation)在一些实际问题中,被解释变量yt的变化并不取决于解释变量的实际值xt,而是x的未来“预期水平”或“长期均衡水平”x*t+1,即:

yt=a+bx*t+1+εt

由于预期变量x*t+1无法直接观测,所以假设:

x*t+1-x*t=γ(xt-x*t)其中γ称为预期系数,0<γ<1;xt-x*t为预期误差。称为自适应预期假设(简称AE假设)

第五节滞后变量第一百二十页,共一百四十三页,2022年,8月28日

AE假设的含义是:

预期的形成是一种预期误差不断调整的过程,预期误差乘以系数γ就是两个时期预期的改变量。如果预期值偏高,即xt-x*t<0,下期预期就会自动调低;反之,则调高下期预期。自适应预期假设也可以表示成:

x*t+1=γxt+(1-γ)x*t

即新一期的预期是前期实际值与预期值的加权平均。第五节滞后变量第一百二十一页,共一百四十三页,2022年,8月28日将上式代入模型方程,并整理得:

yt=a+γbxt+(1-γ)bx*t+εt

由:yt-(1-γ)yt-1=γa+γbxt+εt-(1-γ)εt-1

整理后得到:

yt=γa+γbxt+(1-γ)yt-1+νt

其中,νt=εt-(1-γ)εt-1。该模型称为自适应预期模型,如果取λ=1-γ,则与考耶克模型完全一致。第五节滞后变量第一百二十二页,共一百四十三页,2022年,8月28日

上述推导过程说明了两个问题:(1)如果被解释变量y主要受某个预期变量x*的影响,并且预期变量的变化满足自适应预期假设,则y的变化可以用考耶克模型(即几何分布滞后模型)来描述。(2)如果模型的解释变量中含有不可观测的预期变量,则在自适应预期假设下,可以将模型转化成只含变量实际值的自回归模型。从而可以利用实际观测数据估计模型。第五节滞后变量第一百二十三页,共一百四十三页,2022年,8月28日四、自回归模型的估计

利用最小二乘法估计自回归模型

yt=a+b0xt+b1yt-1+…+bkyt-k+νt

主要会遇到两个问题:

(1)模型中会有随机解释变量yt-1,yt-2,……,且可能与随机误差项相关,使OLS估计成为有偏估计;

(2)模型很可能存在自相关性,这样OLS估计为非有效估计。下面分别讨论不同情况下的估计问题:第五节滞后变量第一百二十四页,共一百四十三页,2022年,8月28日2.νt存在自相关性

设法消除随机解释变量与随机误差项的相关问题,然后再利用广义差分法消除自相关性的影响。可以采用工具变量法和搜索估计法。1.νt不存在自相关性使用OLS法估计模型。

第五节滞后变量第一百二十五页,共一百四十三页,2022年,8月28日

工具变量法工具变量法,即设法寻找一个yt-1的替代变量zt,要求zt与yt-1高度相关,但与误差项νt互不相关。实际应用中,一般取将其替代模型中的yt-1,得:再用广义差分法消除νt的自相关性,估计出模型中的各个参数。

第五节滞后变量第一百二十六页,共一百四十三页,2022年,8月28日利用EViews软件的具体操作步骤为:

①利用CROSS命令确定分布滞后模型的滞后期长度SCROSSY X②利用OLS法估计分布滞后模型(设滞后期长度为3)

LSYCX(0TO-3)③计算zt=yt-etGENR Z=Y-RESID④将zt替代自回归模型中的yt-1,并用广义差分法(设存在一阶自相关性)估计模型:

LS Y CX Z(-1) AR(1)上述命令过程也可以用TSLS命令统一写成:

TSLS YCXY(-1)AR(1)@CX(0TO3)第五节滞后变量第一百二十七页,共一百四十三页,2022年,8月28日五、滞后效应分析

1.滞后效应的乘数分析对于分布滞后模型

yt=a+b0xt+b1xt-1+…+bkxt-k+εtb0:短期乘数,表示解释变量变化一个单位对同期被解释变量所产生的影响;即短期影响;

bi:延期乘数或动态乘数,反映解释变量在各滞后时期的单位变化对yt产生的影响,即x的滞后影响;

第五节滞后变量第一百二十八页,共一百四十三页,2022年,8月28日

:为长期乘数,表明x变动一个单位对y产生的累计总影响(假设b=存在)

利用乘数可以分析解释变量对被解释变量的滞后影响过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论