




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章其他回归方法
本章讨论加权最小二乘估计,异方差性和自相关一致协方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘估计和广义矩估计(GMM)。这里的大多数方法在第十二章的联立方程系统中也适用。本章中某些估计方法中含有AR和MA误差项,这些概念将在第五章中深入介绍。1第四章其他回归方法本章讨论加权最小二乘估计
线性回归模型的基本假设
i=1,2,…,N
在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设:1.解释变量之间互不相关;2.随机误差项具有0均值和同方差。即i=1,2,…,N
即随机误差项的方差是与观测时点t无关的常数;3.不同时点的随机误差项互不相关(序列不相关),即s≠0,i=1,2,…,N
2线性回归模型的基本假设i=1,2,…
当随机误差项满足假定1~4时,将回归模型”称为“标准回归模型”,当随机误差项满足假定1~5时,将回归模型称为“标准正态回归模型”。如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。5.随机误差项服从0均值、同方差的正态分布。即~i=1,2,…,N
4.随机误差项与解释变量之间互不相关。即
j=1,2,…,k,i=1,2,…,N
3当随机误差项满足假定1~4时,将回归模型”称为
古典线性回归模型的一个重要假设是总体回归方程的随机扰动项ui同方差,即他们具有相同的方差
2。如果随机扰动项的方差随观测值不同而异,即ui的方差为i2,就是异方差。用符号表示异方差为E(ui2)
=
i2
。异方差性在许多应用中都存在,但主要出现在截面数据分析中。例如我们调查不同规模公司的利润,会发现大公司的利润变化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小公司利润的方差大。利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。又如在分析家庭支出模式时,我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差。§4.1异方差
4古典线性回归模型的一个重要假设是总体回归方程的随机扰变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出地区INCUM地区INCUM甘肃山西宁夏吉林河南陕西青海江西黑龙江内蒙古贵州辽宁安徽湖北海南4009.614098.734112.414206.644219.424220.244240.134251.424268.504353.024565.394617.244770.474826.364852.87159.60137.11231.51172.65193.65191.76197.04176.39185.78206.91227.21201.87237.16214.37265.98新疆河北四川山东广西湖南重庆江苏云南福建天津浙江北京上海广东5000.795084.645127.085380.085412.245434.265466.576017.856042.786485.637110.547836.768471.988773.108839.68212.30270.09212.46255.53252.37255.79337.83255.65266.48346.75258.56388.79369.54384.49640.56表1中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出
单位:元5变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出
例4.1:我们研究人均家庭交通及通讯支出(cum)和可支配收入(in)的关系,考虑如下方程:cumi=0+1ini
+ui
利用普通最小二乘法,得到如下回归模型:cumi=-56.917+0.05807ini
(4.1.4)
(-1.57)(8.96)R2=0.74D.W.=2.0086例4.1:我们研究人均家庭交通及通讯支出(
从图形上可以看出,平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是,值得注意的是:随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。异方差的存在并不破坏普通最小二乘法的无偏性,但是估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性,所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在,则采取补救措施就很重要。7从图形上可以看出,平均而言,城镇居民家庭交通和通讯支§4.1.1异方差检验
1.图示检验法
(1)用X-Y的散点图进行判断
观察是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)8§4.1.1异方差检验8
(2)X-ûi2的散点图进行判断
首先采用OLS方法估计模型,以求得随机误差项u的方差i2的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用ei2表示。于是有(4.1.5)即用ei2来表示随机误差项的方差。用解释变量x和ei2的散点图进行观察是否随着x增加,出现方差的逐渐增加、下降或者不规则变化。
9(2)X-ûi2的散点图进行判断10102.White异方差性检验
White(1980)提出了对最小二乘回归中残差的异方差性的检验。包括有交叉项和无交叉项两种检验。普通最小二乘估计虽然在存在异方差性时是一致的,但是通常计算的标准差不再有效。如果发现存在异方差性,利用加权最小二乘法可以获得更有效的估计。
112.White异方差性检验11检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计算的。例如:假设估计如下方程(4.1.6)式中b是估计系数,ûi是残差。检验统计量基于辅助回归:(4.1.7)EViews显示两个检验统计量:F统计量和Obs*R2统计量。White检验的原假设:不存在异方差性(也就是,式(4.1.7)中除0以外的所有系数都为0成立)。12检验统计量是通过利用解释变量所有可能的交叉乘White证明出:(4.1.8)其中:N是样本容量,k为自由度,等于式(4.1.7)中解释变量个数(不包含截距项)。如果计算的2值大于给定显著性水平对应的临界值,则可以拒绝原假设,得出存在异方差的结论。也就是说,回归方程(4.1.7)的R2越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异方差。如果原模型中包含的解释变量较多,那么辅助回归中将包含太多的变量,这会迅速降低自由度。因此,在引入变量太多时,必须谨慎一些。White检验的另外一种形式,就是辅助回归中不包含交叉项。因此White检验有两个选项:交叉项和无交叉项。13White证明出:13例4.2:人均家庭交通及通讯支出(CUM)和可支配收入(IN)的回归方程的White异方差检验的结果:
该结果F统计量和Obs*R2
统计量的P值均很小,表明拒绝原假设,即残差存在异方差性。14例4.2:人均家庭交通及通讯支出(CUM)和§4.1.2加权最小二乘估计
1.方差已知的情形考虑一个一元回归线性方程:(4.1.11)假设已知随机误差项的真实的方差,var(ui)=i2,则令wi=1/i,将模型两端同乘wi,变换为(4.1.12)令ui*=wiui,则(4.1.13)因此,变换后的模型(4.1.12)不再存在异方差的问题,可以用OLS估计。加权最小化残差平方和为:(4.1.14)由此获得的估计量就是权重序列为{wi}的加权最小二乘估计量。15§4.1.2加权最小二乘估计15假设有已知形式的异方差性,并且有序列w,其值与误差标准差的倒数成比例。这时可以采用权数序列为w的加权最小二乘估计来修正异方差性。对加权最小化残差平方和得到估计结果:其中是k1维向量。在矩阵概念下,令权数序列w在权数矩阵W的对角线上,其他地方是零,即W矩阵是对角矩阵,y和X是因变量和自变量矩阵。则加权最小二乘估计量为:(4.1.18)
估计协方差矩阵为:(4.1.19)
16假设有已知形式的异方差性,并且有序列w,其值
2.方差未知的情形
由于一般不知道异方差的形式,人们通常采用的经验方法是,并不对原模型进行异方差检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。具体步骤是:1.选择普通最小二乘法估计原模型,得到随机误差项的近似估计量ût
;2.建立wi=1/|ût
|的权数序列;3.选择加权最小二乘法,以wi=1/|ût
|序列作为权,进行估计得到参数估计量。实际上是以1/|ût
|乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。
172.方差未知的情形17
使用加权最小二乘法估计方程,首先到主菜单中选Quick/EstimateEquation…,然后选择LS-LeastSquares(NLSandARMA)。在对话框中输入方程说明和样本,然后按Options钮,出现如下对话框:18使用加权最小二乘法估计方程,首先到主菜单中选Quic
单击WeightedLS/TSLS选项在Weighted项后填写权数序列名,单击OK。例子:19单击WeightedLS/TSLS选项在Weigh例4.4:20例4.4:20
EViews会打开结果窗口显示标准系数结果(如上图),包括加权统计量和未加权统计量。加权统计结果是用加权数据计算得到的:
未加权结果是基于原始数据计算的残差得到的:
估计后,未加权残差存放在RESID序列中。如果残差方差假设正确,则加权残差不应具有异方差性。如果方差假设正确的话,未加权残差应具有异方差性,残差标准差的倒数在每个时刻t与w成比例。21EViews会打开结果窗口显示标准系数结果§4.1.3存在异方差时的一致协方差
当异方差性形式未知时,使用加权最小二乘法提供在异方差存在时的一致参数估计,但通常的OLS标准差将不正确。在描述协方差估计技术之前,应注意:使用White异方差一致协方差或Newey-West异方差一致协方差估计不会改变参数的点估计,只改变参数的估计标准差。可以结合几种方法来计算异方差和序列相关。如把加权最小二乘估计与White或Newey-West协方差矩阵估计相结合。
22§4.1.3存在异方差时的一致协方差当异方差性形
1.异方差一致协方差估计(White)Heteroskedasticity
ConsistentCovariances(White)
White(1980)得出在存在未知形式的异方差时,对系数协方差进行正确估计的异方差一致协方差估计量。White协方差矩阵公式为:其中N是观测值数,k是回归变量数,ûi是最小二乘残差。EViews在标准OLS公式中提供White协方差估计选项。打开方程对话框,说明方程,然后按Options钮。接着,单击异方差一致协方差(HeteroskedasticityConsistentCovariance),选择White钮,接受选项估计方程。231.异方差一致协方差估计(White)例4.5:在输出结果中,EViews会包含一行文字说明表明使用了White估计量。
24例4.5:在输出结果中,EViews会包含一行文字说明表明使2.HAC一致协方差(Newey-West)
前面描述的White协方差矩阵假设被估计方程的残差是序列不相关的。Newey和West(1987)提出了一个更一般的估计量,在有未知形式的异方差和自相关存在时仍保持一致。Newey-West估计量为:其中
252.HAC一致协方差(Newey-West)前
q是滞后截尾,一个用于评价OLS随机误差项ut的动态的自相关数目的参数。根据Newey-West假设,EViews中令q为:Newey-West异方差一致协方差估计量,不能和加权最小二乘法一起使用。使用Newey-West方法,在估计对话框中按Options钮。在异方差一致协方差项中选Newey-West钮。26q是滞后截尾,一个用于评价OLS随机误差
Newey-West估计量为:
27Newey-West估计量为:27§4.2
二阶段最小二乘法
回归分析的一个基本假设是方程的解释变量与扰动项不相关。但是,由于解释变量测量误差的存在,用于估计模型参数的数据经常与它们的理论值不一致;或者由于遗漏了变量,使得随机误差项中含有可能与解释变量相关的变量,这些都可能导致解释变量与扰动项的相关。出现这种问题时,OLS和WLS估计量都有偏差且不一致,因而要采用其他方法估计。最常用的估计方法是二阶段最小二乘法。28§4.2二阶段最小二乘法回归分析的考虑多元线性回归模型的矩阵形式(4.2.1)其中:y和X是因变量和解释变量数据矩阵,是系数向量。
为简化起见,我们称与残差相关的变量为内生变量,与残差不相关的变量为外生变量或前定变量。解决方程右边解释变量与残差相关的方法是使用工具变量回归。就是要找到一组变量满足下面两个条件:(1)与方程解释变量相关;(2)与扰动项不相关;29考虑多元线性回归模型的矩阵形式29选择zi=(z1i,z2i,…,zki)作为工具变量,它与解释变量相关,但与扰动项不相关,即(4.2.2)
这些变量就可成为工具变量。用这些工具变量来消除右边解释变量与扰动项之间的相关性。30选择zi=(z1i,z2i,…,
二阶段最小二乘方法(twostageleastsquare,TSLS)本质上属于工具变量法,它包括两个阶段:第一个阶段,找到一组工具变量,模型中每个解释变量分别关于这组变量作最小二乘回归;第二个阶段,所有变量用第一个阶段回归得到的拟合值来代替,对原方程进行回归,这样求得的回归系数就是TSLS估计值。可以证明二阶段最小二乘估计量是一致估计量。3131不必担心TSLS估计中分离的阶段,因为EViews会使用工具变量技术同时估计两个阶段。令Z为工具变量矩阵,y和X是因变量和解释变量矩阵。则二阶段最小二乘估计的系数由下式计算出来:
系数估计的协方差矩阵为:其中s2是回归标准差(估计残差协方差)。
32不必担心TSLS估计中分离的阶段,因为EVi
使用二阶段最小二乘估计,打开方程说明对话框,选择Method中的TSLS估计。随着选择的变化,方程对话框也会发生变化,包括一个工具变量列表对话框。33使用二阶段最小二乘估计,打开方程说明对话框,选择Met
输入工具变量时,应注意以下问题:1.使用TSLS估计,方程说明必需满足识别的阶条件,即工具变量的个数至少与方程的系数一样多。参见Davidson和MacKinnon(1994)和Johnston和DiNardo(1997)的讨论。2.根据经济计量学理论,与扰动项不相关的解释变量可以用作工具变量。3.常数c是一个合适的工具变量,如果忽略了它,EViews会自动把它加进去。34输入工具变量时,应注意以下问题:34
TSLS估计结果:
下面我们利用中国19782000的宏观数据计算城镇居民消费增量D(cs)关于城镇居民收入增量D(inc)
和利率D(rate)
、居民消费价格D(cpi)
的OLS估计:35TSLS估计结果:35
注意到,利率D(rate)
和居民消费价格D(cpi)与残差相关,于是采用TSLS估计。工具变量选择c、D(cs(-1))
、D(cpi(-1))
、D(rate(-1))、D(inc(-2))、D(tax)。
36注意到,利率D(rate)和居民消费价格D§4.3非线性最小二乘估计
经典的计量经济学模型理论与方法是在线性模型的基础上发展、完善起来的,因而线性计量经济学模型领域的理论与方法已经相当成熟。但是,现实经济活动并不都能抽象为线性模型,所以非线性计量经济学模型在计量经济学模型中占据重要的位置,关于它的理论与方法的研究是计量经济学理论与方法研究的一个广泛的领域。假设回归方程为:其中f
是解释变量和参数
的函数。最小二乘估计就是要选择参数的估计值b使残差平方和最小:37§4.3非线性最小二乘估计经典的计量经济学
如果
f关于参数的导数不依赖于参数,则我们称模型为参数线性的,反之,则是参数非线性的。例如,是参数线性的,f关于参数的导数与参数无关。而其函数的导数仍依赖于参数,所以它是参数非线性的。对于这个模型,没有办法使用普通最小二乘估计来最小化残差平方和。必须使用非线性最小二乘估计技术来估计模型参数。
38如果f关于参数的导数不依赖于参数,则我们称模型
非线性最小二乘估计根据参数的估计值b选择最小化残差平方和。最小化的一阶条件是:其中G(b)是f(X,
b)关于b的导数。
估计协方差矩阵为:
关于非线性估计的详细讨论,参见Pindick和Rubinfeld(1991,231-245页)或Davidson和MacKinon(1993)。即令39非线性最小二乘估计根据参数的估计值b选择
估计非线性最小二乘模型很简单,对于任何系数非线性的方程,EViews自动应用非线性最小二乘估计,会使用迭代算法估计模型。1.说明非线性最小二乘估计
对于非线性最小二乘模型,必须使用直接包含系数约束的EViews表达式以方程形式来说明。可以使用缺省系数向量C中的元素(例如,c(1),c(2),c(34),c(87)),也可以定义使用其它系数向量。例如:Y=c(1)+c(2)*(K^c(3)+L^c(4))就是缺省系数向量C的4个元素从c(1)到c(4)。40估计非线性最小二乘模型很简单,对于任何系数非线性的方
例4.6:如果设定例3.1中的消费函数为非线性形式:(4.3.11)其中:cst是实际居民消费,inct是实际可支配收入。利用我国1978年~2002年的年度数据估计此非线性方程,由于用迭代法计算,首先要赋初值,比如可以设3的估计值b3初值是1,则可以利用OLS估计值(例3.1中,b1=414.88,b2=0.51)作为b1,b2
的初值。经过迭代,得到的非线性消费方程为
(4.3.12)b1,b2,b3
的标准差分别为386.3,0.21和0.096。41例4.6:如果设定例3.1中的消费函数为非线非线性形式的边际消费倾向为
即MPCt
=c(2)c(3)
inct(
C(3)-1)=
0.214*1.0857*inc^(1.0857-1)42非线性形式的边际消费倾向为42图4.3动态的边际消费倾向
因此,非线性情况下的MPC是时变的,根据式(4.3.11)计算得到的边际消费倾向序列如图4.3所示。注意,inc的平均值(9795.355)对应的边际消费倾向为
MPC=0.2139*1.0857*9795.355^(1.0857-1)=0.51等于线性模型估计值,因为线性模型的参数反映的是变量之间平均意义上的影响关系。
43图4.3动态的边际消费倾向因此,非线性情
2.估计方法选项
(1)初始值
迭代估计要求模型系数有初始值。选择参数初始值没有通用的法则。越接近于真值越好,因此,如果你对参数值有一个合理的猜测值,将是很有用的。在某些情况下,可以用最小二乘法估计严格形式的模型得到良好的初始值。总体说来,必须进行试验以找到初始值。在开始迭代估计时,EViews使用系数向量中的值。很容易检查并改变系数的初始值。要察看初始值,双击系数向量。如果初始值是合理的,可以对模型进行估计。如果想改变初始值,首先确定系数向量表使处于编辑状态,然后输入系数值。完成初始值设定后,关闭系数向量窗口,估计模型。442.估计方法选项(1)初始值44
也可以从命令窗口使用PARAM命令设定初始系数值。只需输入关键词PARAM,然后是每个系数和想要的初值:paramc(1)414.88c(2)0.51c(3)1中设定c(1)=414.88,c(2)=0.51和c(3)=1。详情参见附录E。
45也可以从命令窗口使用PARAM命令设定初始系数值。只
(2)迭代和收敛选项
可以通过说明收敛标准和最大迭代次数来控制迭代过程。按Options钮并输入想要的数值。如果系数变化的最大值低于阈值,EViews报告估计过程已经收敛。例如,设定阈值为0.001,则EViews会通过检查系数的最大变化是不是小于0.001来决定是否收敛。在大多数情况下,不许改变最大迭代次数。然而,对于某些难于估计的模型,在最大迭代次数下迭代过程不收敛。这时,只需单击Options钮,然后,增加最大迭代次数并点OK接受选项,开始估计。EViews会使用最后一组参数值作为初始值进行估计。46(2)迭代和收敛选项46§4.4广义矩方法(GMM)GeneralizedMethodofMoments
广义矩估计方法(GMM)是基于模型实际参数满足一些矩条件而形成的一种参数估计方法,是矩估计方法的一般化。如果模型的设定是正确的,则总能找到该模型实际参数满足的若干矩条件而采用GMM方法。GMM估计的出发点是参数应满足的一种理论关系。其思想是选择参数估计尽可能接近理论上的关系。把理论上的关系用样本近似值代替,并且估计量的选择就是要最小化理论值和实际值之间的加权距离。47§4.4广义矩方法(GMM)广义矩估计方法(G
由于传统的计量经济模型估计方法,例如普通最小二乘法、工具变量法、极大似然法等,都有它们的局限性,其参数估计量必须在模型满足某些假设时才具有良好的性质,如只有当模型的随机误差项服从正态分布或某一已知分布,极大似然法估计量才是可靠的估计量;而GMM估计是一个稳健估计量,因为它不要求扰动项的准确分布信息,允许随机误差项存在异方差和序列相关,所得到的参数估计量比其他参数估计方法更合乎实际;而且可以证明,GMM包容了许多常用的估计方法,普通最小二乘法、工具变量法、极大似然法都是它的特例。48由于传统的计量经济模型估计方法,例如普通最小二乘法4.4.1矩法估计量矩估计是基于实际参数满足一些矩条件而形成的一种参数估计方法,如果随机变量Yt的期望值是,即(4.4.1)则是满足相应的样本矩条件,即(4.4.2)494.4.1矩法估计量矩估计是基于实际参数现在,考虑一元古典线性回归模型中的假设条件:(4.4.3)(4.4.4)其所对应的样本矩条件分别为
(4.4.5)这就是OLS估计量的正规方程组。因此,OLS估计量是一个矩法估计量。50现在,考虑一元古典线性回归模型中的假设条件再比如二阶段普通最小二乘法中,假定解释变量与随机扰动项可能相关,找到一组与扰动项不相关的工具变量Z,因而正规方程组发生变化,由式(4.2.2)的矩条件:得到了式(4.2.3)的参数估计量形式。因此许多标准估计量,包括所有EViews提供的系统估计量,都可以看作GMM估计量的特例。51再比如二阶段普通最小二乘法中,假定解释变量
参数要满足的理论关系通常是参数函数
f()
与工具变量zt之间的正则条件:
是被估计参数
其中m()=f()Z,
A是加权矩阵;任何对称正定矩阵A都是的一致估计。然而,可以推出要得到
的(渐近)有效估计的一个必要条件是令A等于样本矩m的协方差矩阵的逆。
GMM估计量选择参数估计的标准是使工具变量与函数f之间的样本相关性越接近于0越好。用函数表示为:4.4.2广义矩估计52参数要满足的理论关系通常是参数函数f()下面考虑多元线性回归模型的GMM参数估计,假设回归方程为
t=1,2,…,T(4.3.9)其中:解释变量向量xt=(x1t,x2t,…,xkt),参数向量
=(1,2,…,k
),T是样本个数。对于k维单方程参数向量
的GMM估计,由于解释变量向量xt与随机扰动项ut可能相关,因此可以假设存在含有L(Lk)个分量的工具变量向量zt与随机扰动项不相关(如果假设xt与随机扰动不相关,zt就是xt),t时刻含有L个变量的向量zt与ut满足L个正交的矩条件:
(4.4.10)其中:zt
=(z1t,z2t,…,zJt)是L维向量。53下面考虑多元线性回归模型的GMM参数估计,假相应的L个样本矩为(4.4.11)其中:Z是工具变量数据矩阵,是式(4.4.9)的残差序列。选择参数估计量b,使式(4.4.12)所示的加权距离最小。(4.4.12)样本矩的协方差矩阵为(4.4.13)可以使用White异方差一致协方差或Newey-WestHAC一致协方差估计矩阵[见式(4.1.31)、式(4.1.33)],则A=-1
。54相应的L个样本矩为54
用GMM法估计方程,从说明对话框中选择GMM估计方法,GMM对话框会变为:
55用GMM法估计方程,从说明对话框中选择GMM估计方法
要得到GMM估计,应该写出矩条件作为参数表达式和工具变量之间的正交条件。写正交条件的方法有两种:有因变量和没有因变量。如果使用列表法或有等号的表达式法说明方程,EViews会把矩条件理解为工具变量和方程残差之间的正交条件。如果用没有等号的表达式,EViews会正交化表达式和工具变量。在方程说明对话框的工具变量(Instrumentlist)列表中,必须列出工具变量名。如果要保证GMM估计量可识别,工具变量个数不能少于被估计参数个数。当然常数会自动被EViews加入工具变量表中。
56要得到GMM估计,应该写出矩条件作为参数表达式和工
例如,方程说明:ycx工具变量:czw正交条件为:
如果方程说明为:c(1)*log(y)+x^c(2)工具变量表:czz(-1)则正交条件为:57例如,方程说明:ycx
在方程说明框右边是选择目标函数的权数矩阵A。如果选择基于White协方差的加权矩阵,则GMM估计对未知形式的异方差将是稳健的。如果选择基于HAC时间序列的加权矩阵,则GMM估计量对未知形式的异方差和自相关是稳健的。对于HAC选项,必须说明核和带宽。58在方程说明框右边是选择目标函数的权数矩阵A。如果选例4.7利用中国的1978~1999的宏观经济数据,消费CS、GDP、投资IFCK,利用GMM方法计算消费方程:59例4.7利用中国的1978~1999的宏§4.5多项分布滞后(PDLS)
在经济分析中人们发现,一些经济变量,它们的数值是由自身的滞后量或者其他变量的滞后量所决定的,表现在计量经济模型中,解释变量中经常包含某些滞后变量。以投资函数为例,分析中国的投资问题发现,当年的投资额除了取决于当年的收入(即国内生产总值)外,由于投资的连续性,它还受到前1个、2个、3个…时期投资额的影响。已经开工的项目总是要继续下去的,而每个时期的投资额又取决于每个时期的收入,所以可以建立如下关于投资的计量经济方程其中I
表示投资额,Y
表示国内生产总值。
60§4.5多项分布滞后(PDLS)在经济分析中在分析货币政策的效应时,经常会分析货币供给对产出的影响,这时要在模型中加入货币供给的多期滞后,以反映出货币政策的时滞性。再如消费理论告诉我们,人们的消费不仅是当期收入决定的,以前的收入水平和消费习惯等都对消费产生影响。因此,收入和消费的滞后变量可能都应该包含到模型中。这时的模型考虑了变量跨时期的影响关系,因此叫做动态模型(dynamicmodels)。61在分析货币政策的效应时,经常会分析货币供给对如果模型中仅包含解释变量滞后,形如式(4.5.1)的模型叫做分布滞后模型(distributedlagmodels),这是因为解释变量每单位变化的影响分布到了多个时期:其中系数
描述
x对
y作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS估计参数。但是,一个显然的问题是解释变量之间,即
x的当前和滞后值之间具有高度共线性,而共线性问题的一个直接后果是参数估计量失去意义,不能揭示
x的各个滞后量对因变量的影响,所以必须寻求另外的估计方法。
(4.5.1)一、多项式分布滞后模型的估计方法
62如果模型中仅包含解释变量滞后,形如式(4.5可以使用多项式分布滞后(PolynomialDistributedLags,PDLs)来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。p阶PDLs模型限制
系数服从如下形式的
p阶多项式
j=0,1,2,…,k(4.5.3)c是事先定义常数:63可以使用多项式分布滞后(Polynomial
PDLs有时被称为Almon分布滞后模型。常数c仅用来避免共线性引起的数值问题,不影响的估计。这种定义允许仅使用参数
p来估计一个x
的
k阶滞后的模型(如果
p>k,将显示“近似奇异“错误信息)。定义一个PDL模型,EViews用(4.5.3)式代入到(4.5.1)式,将产生如下形式方程其中
(4.5.4)64PDLs有时被称为Almon分布滞后模型
一旦从(4.5.3)式估计出,利用(4.5.3)式就可得到的各系数。这一过程很明了,因为是的线性变换。定义一个PDLs要有三个元素:滞后长度k,多项式阶数(多项式最高次幂数)p和附加的约束条件。一个近端约束限制
x对
y一期超前作用为零:
一个远端约束限制
x对
y的作用在大于定义滞后的数目衰减:
如果限制滞后算子的近端或远端,参数个数将减少一个来解释这种约束。如果对近端和远端都约束,参数个数将减少二个。EViews缺省不加任何约束。65一旦从(4.5.3)式估计出,利用(4.5.3
二、如何估计包含PDLs的模型
通过PDL项定义一个多项式分布滞后,信息在随后的括号内,按下列规则用逗号隔开:1.序列名2.滞后长度(序列滞后数)3.多项式阶数4.一个数字限制码来约束滞后多项式:1=限制滞后近端为零2=限制远端为零3=两者都限制如果不限制滞后多项式,可以省略限制码。方程中可以包含多个PDL项。例如:salescpdl(y,8,3)是用常数,解释变量y的当前和8阶分布滞后来拟合因变量sales,这里解释变量y的滞后系数服从没有约束的3阶多项式。66二、如何估计包含PDLs的模型通过PDL
类似地,
ycpdl(x,12,4,2)
包含常数,解释变量x的当前和12阶分布滞后拟合因变量y,这里解释变量x的系数服从带有远端约束的4阶多项式。
PDL也可用于二阶段最小二乘法TSLS。如果PDL序列是外生变量,应当在工具表中也包括序列的PDL项。为此目的,可以定义PDL(*)作为一个工具变量,则所有的PDL变量都将被作为工具变量使用。例如:如果定义TSLS方程为
salesc
incpdl(y(-1),12,4)使用工具变量:zz(-1)pdl(*)则y的分布滞后和z,z(-1)都被用作工具变量。
PDLs不能用于非线性定义。67类似地,ycpdl(x,12,4例4.8
投资INV关于关于GDP的分布滞后模型的结果如下68例4.8投资INV关于关于GDP的分布滞
逐个观察,GDP滞后的系数统计上都不显著。但总体上讲回归具有一个合理的R2,
(尽管D.W.统计量很低)。这是回归自变量中多重共线的典型现象,建议拟合一个多项式分布滞后模型。估计一个无限制的3阶多项式滞后模型,输入变量列表:cPDL(GDP,4,2),窗口中显示的多项式估计系数,PDL01,PDL02,PDL03分别对应方程(4.5.4)中z1,z2,z3的系数1,
2,
3。69逐个观察,GDP滞后的系数统计上都不显著。但总体上讲
方程(4.5.1)中的系数
j在表格底部显示。
表格底部的滞后值是分布滞后的估计系数值,并且在平稳的假设下有GDP对INV的长期影响的解释。
70方程(4.5.1)中的系数j在表格底部显示。待估计的方程:
INV=C(1)+C(5)*GDP+C(6)*GDP(-1)+C(7)*GDP(-2)+C(8)*GDP(-3)+C(9)*GDP(-4)估计的方程:
INVt=-343.83+0.1297GDPt+0.065GDPt-1+0.021GDPt-2-0.000987GDPt-3–0.002GDPt-4+ût71待估计的方程:71加了限制滞后近端为零的近端约束,显著性有明显改善。72加了限制滞后近端为零的近端约束,显著性有明显改善。72加了INV(-1),估计系数非常显著。73加了INV(-1),估计系数非常显著。7第四章其他回归方法
本章讨论加权最小二乘估计,异方差性和自相关一致协方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘估计和广义矩估计(GMM)。这里的大多数方法在第十二章的联立方程系统中也适用。本章中某些估计方法中含有AR和MA误差项,这些概念将在第五章中深入介绍。74第四章其他回归方法本章讨论加权最小二乘估计
线性回归模型的基本假设
i=1,2,…,N
在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设:1.解释变量之间互不相关;2.随机误差项具有0均值和同方差。即i=1,2,…,N
即随机误差项的方差是与观测时点t无关的常数;3.不同时点的随机误差项互不相关(序列不相关),即s≠0,i=1,2,…,N
75线性回归模型的基本假设i=1,2,…
当随机误差项满足假定1~4时,将回归模型”称为“标准回归模型”,当随机误差项满足假定1~5时,将回归模型称为“标准正态回归模型”。如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。5.随机误差项服从0均值、同方差的正态分布。即~i=1,2,…,N
4.随机误差项与解释变量之间互不相关。即
j=1,2,…,k,i=1,2,…,N
76当随机误差项满足假定1~4时,将回归模型”称为
古典线性回归模型的一个重要假设是总体回归方程的随机扰动项ui同方差,即他们具有相同的方差
2。如果随机扰动项的方差随观测值不同而异,即ui的方差为i2,就是异方差。用符号表示异方差为E(ui2)
=
i2
。异方差性在许多应用中都存在,但主要出现在截面数据分析中。例如我们调查不同规模公司的利润,会发现大公司的利润变化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小公司利润的方差大。利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。又如在分析家庭支出模式时,我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差。§4.1异方差
77古典线性回归模型的一个重要假设是总体回归方程的随机扰变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出地区INCUM地区INCUM甘肃山西宁夏吉林河南陕西青海江西黑龙江内蒙古贵州辽宁安徽湖北海南4009.614098.734112.414206.644219.424220.244240.134251.424268.504353.024565.394617.244770.474826.364852.87159.60137.11231.51172.65193.65191.76197.04176.39185.78206.91227.21201.87237.16214.37265.98新疆河北四川山东广西湖南重庆江苏云南福建天津浙江北京上海广东5000.795084.645127.085380.085412.245434.265466.576017.856042.786485.637110.547836.768471.988773.108839.68212.30270.09212.46255.53252.37255.79337.83255.65266.48346.75258.56388.79369.54384.49640.56表1中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出
单位:元78变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出
例4.1:我们研究人均家庭交通及通讯支出(cum)和可支配收入(in)的关系,考虑如下方程:cumi=0+1ini
+ui
利用普通最小二乘法,得到如下回归模型:cumi=-56.917+0.05807ini
(4.1.4)
(-1.57)(8.96)R2=0.74D.W.=2.00879例4.1:我们研究人均家庭交通及通讯支出(
从图形上可以看出,平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是,值得注意的是:随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。异方差的存在并不破坏普通最小二乘法的无偏性,但是估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性,所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在,则采取补救措施就很重要。80从图形上可以看出,平均而言,城镇居民家庭交通和通讯支§4.1.1异方差检验
1.图示检验法
(1)用X-Y的散点图进行判断
观察是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)81§4.1.1异方差检验8
(2)X-ûi2的散点图进行判断
首先采用OLS方法估计模型,以求得随机误差项u的方差i2的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用ei2表示。于是有(4.1.5)即用ei2来表示随机误差项的方差。用解释变量x和ei2的散点图进行观察是否随着x增加,出现方差的逐渐增加、下降或者不规则变化。
82(2)X-ûi2的散点图进行判断83102.White异方差性检验
White(1980)提出了对最小二乘回归中残差的异方差性的检验。包括有交叉项和无交叉项两种检验。普通最小二乘估计虽然在存在异方差性时是一致的,但是通常计算的标准差不再有效。如果发现存在异方差性,利用加权最小二乘法可以获得更有效的估计。
842.White异方差性检验11检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计算的。例如:假设估计如下方程(4.1.6)式中b是估计系数,ûi是残差。检验统计量基于辅助回归:(4.1.7)EViews显示两个检验统计量:F统计量和Obs*R2统计量。White检验的原假设:不存在异方差性(也就是,式(4.1.7)中除0以外的所有系数都为0成立)。85检验统计量是通过利用解释变量所有可能的交叉乘White证明出:(4.1.8)其中:N是样本容量,k为自由度,等于式(4.1.7)中解释变量个数(不包含截距项)。如果计算的2值大于给定显著性水平对应的临界值,则可以拒绝原假设,得出存在异方差的结论。也就是说,回归方程(4.1.7)的R2越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异方差。如果原模型中包含的解释变量较多,那么辅助回归中将包含太多的变量,这会迅速降低自由度。因此,在引入变量太多时,必须谨慎一些。White检验的另外一种形式,就是辅助回归中不包含交叉项。因此White检验有两个选项:交叉项和无交叉项。86White证明出:13例4.2:人均家庭交通及通讯支出(CUM)和可支配收入(IN)的回归方程的White异方差检验的结果:
该结果F统计量和Obs*R2
统计量的P值均很小,表明拒绝原假设,即残差存在异方差性。87例4.2:人均家庭交通及通讯支出(CUM)和§4.1.2加权最小二乘估计
1.方差已知的情形考虑一个一元回归线性方程:(4.1.11)假设已知随机误差项的真实的方差,var(ui)=i2,则令wi=1/i,将模型两端同乘wi,变换为(4.1.12)令ui*=wiui,则(4.1.13)因此,变换后的模型(4.1.12)不再存在异方差的问题,可以用OLS估计。加权最小化残差平方和为:(4.1.14)由此获得的估计量就是权重序列为{wi}的加权最小二乘估计量。88§4.1.2加权最小二乘估计15假设有已知形式的异方差性,并且有序列w,其值与误差标准差的倒数成比例。这时可以采用权数序列为w的加权最小二乘估计来修正异方差性。对加权最小化残差平方和得到估计结果:其中是k1维向量。在矩阵概念下,令权数序列w在权数矩阵W的对角线上,其他地方是零,即W矩阵是对角矩阵,y和X是因变量和自变量矩阵。则加权最小二乘估计量为:(4.1.18)
估计协方差矩阵为:(4.1.19)
89假设有已知形式的异方差性,并且有序列w,其值
2.方差未知的情形
由于一般不知道异方差的形式,人们通常采用的经验方法是,并不对原模型进行异方差检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。具体步骤是:1.选择普通最小二乘法估计原模型,得到随机误差项的近似估计量ût
;2.建立wi=1/|ût
|的权数序列;3.选择加权最小二乘法,以wi=1/|ût
|序列作为权,进行估计得到参数估计量。实际上是以1/|ût
|乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。
902.方差未知的情形17
使用加权最小二乘法估计方程,首先到主菜单中选Quick/EstimateEquation…,然后选择LS-LeastSquares(NLSandARMA)。在对话框中输入方程说明和样本,然后按Options钮,出现如下对话框:91使用加权最小二乘法估计方程,首先到主菜单中选Quic
单击WeightedLS/TSLS选项在Weighted项后填写权数序列名,单击OK。例子:92单击WeightedLS/TSLS选项在Weigh例4.4:93例4.4:20
EViews会打开结果窗口显示标准系数结果(如上图),包括加权统计量和未加权统计量。加权统计结果是用加权数据计算得到的:
未加权结果是基于原始数据计算的残差得到的:
估计后,未加权残差存放在RESID序列中。如果残差方差假设正确,则加权残差不应具有异方差性。如果方差假设正确的话,未加权残差应具有异方差性,残差标准差的倒数在每个时刻t与w成比例。94EViews会打开结果窗口显示标准系数结果§4.1.3存在异方差时的一致协方差
当异方差性形式未知时,使用加权最小二乘法提供在异方差存在时的一致参数估计,但通常的OLS标准差将不正确。在描述协方差估计技术之前,应注意:使用White异方差一致协方差或Newey-West异方差一致协方差估计不会改变参数的点估计,只改变参数的估计标准差。可以结合几种方法来计算异方差和序列相关。如把加权最小二乘估计与White或Newey-West协方差矩阵估计相结合。
95§4.1.3存在异方差时的一致协方差当异方差性形
1.异方差一致协方差估计(White)Heteroskedasticity
ConsistentCovariances(White)
White(1980)得出在存在未知形式的异方差时,对系数协方差进行正确估计的异方差一致协方差估计量。White协方差矩阵公式为:其中N是观测值数,k是回归变量数,ûi是最小二乘残差。EViews在标准OLS公式中提供White协方差估计选项。打开方程对话框,说明方程,然后按Options钮。接着,单击异方差一致协方差(HeteroskedasticityConsistentCovariance),选择White钮,接受选项估计方程。961.异方差一致协方差估计(White)例4.5:在输出结果中,EViews会包含一行文字说明表明使用了White估计量。
97例4.5:在输出结果中,EViews会包含一行文字说明表明使2.HAC一致协方差(Newey-West)
前面描述的White协方差矩阵假设被估计方程的残差是序列不相关的。Newey和West(1987)提出了一个更一般的估计量,在有未知形式的异方差和自相关存在时仍保持一致。Newey-West估计量为:其中
982.HAC一致协方差(Newey-West)前
q是滞后截尾,一个用于评价OLS随机误差项ut的动态的自相关数目的参数。根据Newey-West假设,EViews中令q为:Newey-West异方差一致协方差估计量,不能和加权最小二乘法一起使用。使用Newey-West方法,在估计对话框中按Options钮。在异方差一致协方差项中选Newey-West钮。99q是滞后截尾,一个用于评价OLS随机误差
Newey-West估计量为:
100Newey-West估计量为:27§4.2
二阶段最小二乘法
回归分析的一个基本假设是方程的解释变量与扰动项不相关。但是,由于解释变量测量误差的存在,用于估计模型参数的数据经常与它们的理论值不一致;或者由于遗漏了变量,使得随机误差项中含有可能与解释变量相关的变量,这些都可能导致解释变量与扰动项的相关。出现这种问题时,OLS和WLS估计量都有偏差且不一致,因而要采用其他方法估计。最常用的估计方法是二阶段最小二乘法。101§4.2二阶段最小二乘法回归分析的考虑多元线性回归模型的矩阵形式(4.2.1)其中:y和X是因变量和解释变量数据矩阵,是系数向量。
为简化起见,我们称与残差相关的变量为内生变量,与残差不相关的变量为外生变量或前定变量。解决方程右边解释变量与残差相关的方法是使用工具变量回归。就是要找到一组变量满足下面两个条件:(1)与方程解释变量相关;(2)与扰动项不相关;102考虑多元线性回归模型的矩阵形式29选择zi=(z1i,z2i,…,zki)作为工具变量,它与解释变量相关,但与扰动项不相关,即(4.2.2)
这些变量就可成为工具变量。用这些工具变量来消除右边解释变量与扰动项之间的相关性。103选择zi=(z1i,z2i,…,
二阶段最小二乘方法(twostageleastsquare,TSLS)本质上属于工具变量法,它包括两个阶段:第一个阶段,找到一组工具变量,模型中每个解释变量分别关于这组变量作最小二乘回归;第二个阶段,所有变量用第一个阶段回归得到的拟合值来代替,对原方程进行回归,这样求得的回归系数就是TSLS估计值。可以证明二阶段最小二乘估计量是一致估计量。10431不必担心TSLS估计中分离的阶段,因为EViews会使用工具变量技术同时估计两个阶段。令Z为工具变量矩阵,y和X是因变量和解释变量矩阵。则二阶段最小二乘估计的系数由下式计算出来:
系数估计的协方差矩阵为:其中s2是回归标准差(估计残差协方差)。
105不必担心TSLS估计中分离的阶段,因为EVi
使用二阶段最小二乘估计,打开方程说明对话框,选择Method中的TSLS估计。随着选择的变化,方程对话框也会发生变化,包括一个工具变量列表对话框。106使用二阶段最小二乘估计,打开方程说明对话框,选择Met
输入工具变量时,应注意以下问题:1.使用TSLS估计,方程说明必需满足识别的阶条件,即工具变量的个数至少与方程的系数一样多。参见Davidson和MacKinnon(1994)和Johnston和DiNardo(1997)的讨论。2.根据经济计量学理论,与扰动项不相关的解释变量可以用作工具变量。3.常数c是一个合适的工具变量,如果忽略了它,EViews会自动把它加进去。107输入工具变量时,应注意以下问题:34
TSLS估计结果:
下面我们利用中国19782000的宏观数据计算城镇居民消费增量D(cs)关于城镇居民收入增量D(inc)
和利率D(rate)
、居民消费价格D(cpi)
的OLS估计:108TSLS估计结果:35
注意到,利率D(rate)
和居民消费价格D(cpi)与残差相关,于是采用TSLS估计。工具变量选择c、D(cs(-1))
、D(cpi(-1))
、D(rate(-1))、D(inc(-2))、D(tax)。
109注意到,利率D(rate)和居民消费价格D§4.3非线性最小二乘估计
经典的计量经济学模型理论与方法是在线性模型的基础上发展、完善起来的,因而线性计量经济学模型领域的理论与方法已经相当成熟。但是,现实经济活动并不都能抽象为线性模型,所以非线性计量经济学模型在计量经济学模型中占据重要的位置,关于它的理论与方法的研究是计量经济学理论与方法研究的一个广泛的领域。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办理户口借用所需材料清单3篇
- 重庆中烟工业有限责任公司招聘笔试真题2024
- 2024年台州市玉环市经济和信息化局选聘工作人员考试真题
- 2024年齐齐哈尔富裕县龙安桥镇招聘公益性岗位人员考试真题
- 果品、蔬菜销售过程中的食品安全管理考核试卷
- 红河州泸西县永宁乡卫生院招聘笔试真题2024
- 市政道路绿化与景观设计考核试卷
- 中乐器制作与生产自动化考核试卷
- 煤炭加工中的煤矸石堆场建设与环境影响评价考核试卷
- 小型发电机组应用考核试卷
- 工业和信息化部产业发展促进中心招聘笔试真题2024
- 2025年江西上饶铅山城投控股集团有限公司招聘笔试参考题库附带答案详解
- 模拟雨的形成课件
- 多维数据循环嵌套分析-全面剖析
- 数学全等三角形教学设计 2024-2025学年北师大版数学七年级下册
- 桥梁水下结构内部缺陷超声波检测基于技术
- 事故隐患内部报告奖励制度1
- 2024年河北普通高等学校对口招生考试数学试题
- 认知与实践:AI技术在高校图书馆应用现状调研分析
- 护理行政查房内容
- 精神科患者自缢应急演练
评论
0/150
提交评论