面板数据模型_第1页
面板数据模型_第2页
面板数据模型_第3页
面板数据模型_第4页
面板数据模型_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录223471113212125303032第八章目录223471113212125303032第八章面板数据模型8.18.2....................................................................................4固定效应模型...................................随机效应模型.........................................................................STATA实现....................................8.3...........................................4异方差.......................................................................................................STATA实现....................................8.4参考文献..........................................1第八章面板数据模型8.1简介面板数据,简言之是时间序列和截面数据的混合。严格地讲是指对一组(如居家、公司等)连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。近年来,由于面板数据资料获得变得相对容易,使得其应用范围也不断扩大。而关于面板数据的计量理论也几乎涉及到了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的面板向量自回归模型(PanelVAR)、面板根检验(PanelUnitRoottest)、面板协整分析(PanelCointegeration)、门槛面板数据模型(PanelThreshold)等,都是在现有截面分析和时间序列分析中的热点主题的基础上发展起来的。采用面板数据模型进行分析的主要目的在于两个方向:一是控制不可观测的异质性;二是描述和分析动态调整过程,处理误差成分。使用面板数据主要有以下几方面的优点:30个省份居民人均消费青岛啤酒的数量•便于控制的异质性。比如,我们在研究时。可以选取居民的收入、当地的啤酒价格、上一年的啤酒消费量等变量作为解释变量。习惯、1风俗文化、2而言,前两种因素但同时我们认为费量。对于特定的投放等因素也会显著地影响居民的啤酒消随时间的推移而有明显的变化,通常称为个体效应。而的投放往往通过电视或广播,我们可以认为在特定的年份所有省份所接受的投放量是相同的,通常称为时间效应。这些因素往往因为难以获得数据或不易衡量而无法进入我们的模型,在截面分析中者往往会引起遗漏变量的问题。而面板数据模型的主要用途之一就在于处理这些不可观测的效应或时间效应。••包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的有效性。第八章面板数据模型8.1简介面板数据,简言之是时间序列和截面数据的混合。严格地讲是指对一组(如居家、公司等)连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。近年来,由于面板数据资料获得变得相对容易,使得其应用范围也不断扩大。而关于面板数据的计量理论也几乎涉及到了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的面板向量自回归模型(PanelVAR)、面板根检验(PanelUnitRoottest)、面板协整分析(PanelCointegeration)、门槛面板数据模型(PanelThreshold)等,都是在现有截面分析和时间序列分析中的热点主题的基础上发展起来的。采用面板数据模型进行分析的主要目的在于两个方向:一是控制不可观测的异质性;二是描述和分析动态调整过程,处理误差成分。使用面板数据主要有以下几方面的优点:30个省份居民人均消费青岛啤酒的数量•便于控制的异质性。比如,我们在研究时。可以选取居民的收入、当地的啤酒价格、上一年的啤酒消费量等变量作为解释变量。习惯、1风俗文化、2而言,前两种因素但同时我们认为费量。对于特定的投放等因素也会显著地影响居民的啤酒消随时间的推移而有明显的变化,通常称为个体效应。而的投放往往通过电视或广播,我们可以认为在特定的年份所有省份所接受的投放量是相同的,通常称为时间效应。这些因素往往因为难以获得数据或不易衡量而无法进入我们的模型,在截面分析中者往往会引起遗漏变量的问题。而面板数据模型的主要用途之一就在于处理这些不可观测的效应或时间效应。••包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的有效性。便于分析动态调整。1如属于,那里的因为信仰教,所以不允许饮酒的,而生活在的许多汉民也往往因为自己的朋友无法饮酒而无形中减少了啤酒的消费量。2如中国南部地区啤酒的消费量比较大,而北方很多地区只有在夏天才会饮用较多的啤酒,冬天他们一般是只喝白酒的。238.2静态面板数据模型我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关(如AR(1),AR(2),MA(1)等)的模型也不是静态模型。动态模型和静态模型在处理方法上往往有较大的差异。本38.2静态面板数据模型我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关(如AR(1),AR(2),MA(1)等)的模型也不是静态模型。动态模型和静态模型在处理方法上往往有较大的差异。本节中我们重点介绍两种最为常用的静态模型—固定效应模型和随机效应模型。考虑如下模型:=0tβ+uit=ai+εityit(8.1)uit(8.2)i=12···N,t=12···T;xitK1列向量,K为解释变量的个数,β为K×1系数列向量。对于特定的个体i而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、国家的社会制度等,我们一般称其为“个体效应”(individualeffects)。对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型。这两种模型的差异主要反映在对“个体效应”的处理上。固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上,因此该模型通常也称为“误差成分模型”。基于此,一种常见的观点认为,当我们的样本来自一个较小的母体时,我们应该使用固定效应模型,而当样本来自一个很大的母体时,应当采用随机效应模型。比如在研究中国地区经济增长的过程中,我们以全国28个省区为研究对象,可以认为这28个省区几乎代表了整个母体。同时也可以假设在样本区间内,各省区的经济结构、人口素质等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的。而当我们研究西安市居民的消费行为时,即使样本数为10000人,相对于西安市600万人口的母体而言仍然是个很小的样本。此时,可以认为不同的居民在个人能力、消费习惯等方面的差异是随机的,此时采用随机效应模型较为合适。遗憾的是,很多情况下,我们并不能明确地区分我们的样本来自一个较大母体还是较小的母体。因此有些学者认为,区分固定效应模型和随机效应模型应当看使用二者的假设条件是否满足。由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件。所以如果我们的检验结果表明该假设满足,那么就应该采用随机效应模型,因为它更为有效,反之,就需要采用固定效应模型。另外,有些学者认为具体采用哪一种模型主要决定于我们的分析目的。如果主要目的在于4估计模型的参数,而模型中个体的数目又不是很大的情况下,采用固定效应模型是个不错的选择,因为它非常容易估计。但当我们需要对模型的误差成分进行分析时(通常分解为长期效果和短期效果),就只能采用随机效应模型。在这种情况下,即使模型中的部分解释变量与个体效应相关,我们仍然可以通过工具变量法对模型进行估计。简言之,两种模型有各自的优缺点和适用范围,在实证分析的过程中,我们一方面要根据分析的目的选择合适的模型,同时也要以8.2.3节中介绍的假设检验方法为基础进行模型筛选。8.2.1 固定效应模型模型的基本设定和假设条件若视ai为固定效应,模型(8.1)可以采用向量的形式表示为:y4估计模型的参数,而模型中个体的数目又不是很大的情况下,采用固定效应模型是个不错的选择,因为它非常容易估计。但当我们需要对模型的误差成分进行分析时(通常分解为长期效果和短期效果),就只能采用随机效应模型。在这种情况下,即使模型中的部分解释变量与个体效应相关,我们仍然可以通过工具变量法对模型进行估计。简言之,两种模型有各自的优缺点和适用范围,在实证分析的过程中,我们一方面要根据分析的目的选择合适的模型,同时也要以8.2.3节中介绍的假设检验方法为基础进行模型筛选。8.2.1 固定效应模型模型的基本设定和假设条件若视ai为固定效应,模型(8.1)可以采用向量的形式表示为:yi=ai1T+xiβ+εi其中,yi=(yi1yi2···yiT)0,xi=(xi1xi2···xiT)0,εi=(εi1εi2···εiT)0,1T1列向量。我们有如下两个基本假设:3(8.3)1T是一个所有元1:E[εi|xi,ai]=0(8.4)2:Var[εi|xi,ai]=σ2IT(8.5)假设1表明干扰项ε与解释变量x的当期观察值、前期观察值以及未来的观察值均不相关,也就是说我们的模型中所有的解释变量都是严格外生的。假设2就是一般的同方差假设,在此假设下模型(8.1)的OLS估计是BLUE的。当此假设无法满足时,我们就需要处理异方差或序列相关以便得到稳健性估计量。组内估计量上面我们已经提到,在假设1和假设2同时成立的情况下,模型(8.1)的OLS估计是BLUE的。但在实际操作的过程中,如果N比较大,那么我们的模型中将包含(N+K)个解释变量,4计算的工作量往往很大,对于N相当大的情况(如N=10000),一般的计算机都无法胜3一般应用中,我们也常采用如下两个相对较弱的假设。假设10:E[εi|i]=0和假设20:Var[εi|i]=σ2IT。4此时,我们可以将模型(8.1)视为一个包含N个虚拟变量,X中不包含常数项的普通OLS模型。当然,我们也XN-16。5任。所以我们有必要先进行一些变换以消除固定效应,进而对简化的模型进行估计,本小节和下一小节介绍的这两种方法都是基于此目的进行的。我们首先将所有观察值进行堆叠,于是模型(8.1)可用矩阵形式表示为:y=Da+Xβ+ε(8.6)其中,y=(1,5任。所以我们有必要先进行一些变换以消除固定效应,进而对简化的模型进行估计,本小节和下一小节介绍的这两种方法都是基于此目的进行的。我们首先将所有观察值进行堆叠,于是模型(8.1)可用矩阵形式表示为:y=Da+Xβ+ε(8.6)其中,y=(1,y2,···,N)0,ε=(ε1ε2···εN)0,均为NT1向量,D=IN⊗1T,a=(a1a2···aN)0。考虑到D矩阵的构造形式,它事实上对应着N个虚拟变量。因此,模型(8.6)等价于给混合OLSy=Xβ+εN个虚拟变量。在正式估计模型之前,我们先定义一些有用的矩阵运算,它们将在后面的分析中反复使用。定义D0=IN⊗JT,其中,JT=1T1T为T×T维矩阵,每个元素均为1。同时,我们定义P=D(D0D)1D0=IN⊗¯T, =(1/T)JT是T×T维矩阵,每个元素均为/T;Q=INT−D(D0D)−1D0=INT−P。矩阵P和Q都具有如下性质:对称、幂等性:P0=P,且P2=P;正交性PQ0和为单位矩阵:PQ=INT.我们可以从上述三个性质中的任意两个推导出第三个。易于证明,QD=0,因此,我们可以通过在等式(8.6)Q以消除固定效应:Qy=QXβ+Qε(8.7)变换后的模型的OLS估计量为:5G=(X0QX)−1X0Qy(8.8)方差估计量为:a(ˆWG)=σ2(X0Q)−1(8.9)σ2的一致估计量为: 1 ˆ2= (Qy−QXˆ)0(Qy−QXˆ(8.10))WGWGNT−N−K5事实上,模型(8.7)并不满足OLS的经典假设,因为E[(Qε)(Qε)0]=σ2Q6=σ2I,但其GLS估计量与(8.8)同。具体推导过程留给读者。6个体效应的估计值为:Gˆi=¯i−¯i(8.11)该估计量通常称为“组内估计量”,因为上述变换实质上是从每个观察值中减去其组内平均值,以去除组内不随时间变化的个体效应。变换后的模型(8.8)的特定元素为:(it−¯i)=(0t−¯i)β+(it−6个体效应的估计值为:Gˆi=¯i−¯i(8.11)该估计量通常称为“组内估计量”,因为上述变换实质上是从每个观察值中减去其组内平均值,以去除组内不随时间变化的个体效应。变换后的模型(8.8)的特定元素为:(it−¯i)=(0t−¯i)β+(it−¯i)(8.12)PTit,¯i和¯i的定义方式与此相同。所以,要得到G,我们只需要从原,1/T)t=1始数据中间去其组内平均,然后对变换后的模型执行OLS估计即可。需要注意的是,在模型(8.6)中,Da项实际上对应着N个虚拟变量,所以为了避免共线性问题,解释变量X中不应再包含常数项。6一阶差分估计量除了上述通过“组内去心”的办法消除固定效应外,我们还可以通过一阶差分的方式去除固定效应。对(8.1)式取一阶差分,得到4yi2 = 4xi2β+4εi2.(8.13).4yiT =4xiTβ+4εiT采用矩阵形式可表示为Byi=Bxi+Bεi(8.14)其中,1 1010000−······...···0−1B=(8.15). ... ..1000−1(T−1×T)对所有观察值进行堆叠,得到(IN⊗B)y=(IN⊗B)X+(IN⊗B)εQB=IN⊗B,则相应的OLS的估计量为:ˆS=(X0QBX)−1X0QBy(8.16)(8.17)PN6当然,我们也可以在X中加入常数项,但此时要同时加入约束条件:ai=0。这样我们估计出的个体效i=1应ˆi就应当解释为个体i的相对截距项,而不是前面得到的绝对截距项。SA8.0就采取了在X中包含常数项的处理方式。7根据假设1可知,E[εX]=0,所以ˆS是7根据假设1可知,E[εX]=0,所以ˆS是ˆ的无偏估计量,在N较大的情况下,ˆS也是一致的。由假设2可知,ε满足同方差假设,且不存在序列相关。但变换后的干扰项Bε却并不满足同方差的假设,a(QBε)=σ2QBQB但此时模型(8.16)的GLS估计量是BLUE的,(8.18)LS=[XQB(QBQB)−1QBX]−1XQB(QBQB)−1QBy.易于证明QB(QBQB)−1QB=Q。7因此,S∼G也就是说,我们采用一阶差分去除“固定效应”后,再用GLS估计差分后的模型以消除由于差分而导致的干扰项的序列相关问题得到的GLS估计量与我们前面介绍的组内估计是等价的。由于S满足经典OLS的基本假设,所以G是BLUE的。8.2.2 随机效应模型(8.19)模型的基本设定和GLS估计当N很大时,采用固定效应模型往往会使参数的个数迅速增加,自由度的损失往往较大。另一方面,固定效应模型的基本目的是在控制个体效应的前提下估计模型的参数,而我们采用面板数据模型的另一个重要的目的在于分离出方差中的长期成分和短期成分。此时,随机效应模型可能更为适用。模型的基本设定同(8.1)=xitβ+uit=ai+εityit(8.20)uit(8.21)随机效应模型可以视为固定效应模型的一个扩展,这需要我们在上一节中假设1和假设2的基础上再增加如下假设:7利用矩阵直乘的性质:(A⊗F)(C⊗D)=()⊗(FD),我们可以得到QB(QBQB)−1QB=IN⊗B0(BB0)−1B。进一步,我们可以证明B0(BB0)1B=IT−T:由于矩阵T−/21TH=0−1/2(BB) B满足HH0=IT,所以H0H=IT,即1T1T/T+B0(BB0)−1B=IT因此,QB(QBQB)−1QB=IN⊗(IT−T)=INT−P=Q.83:2∼IID(0(8.22),σ)a4:Cov(ai,xit)=0(8.23)5:ui|xi∼IID(0,σ2IT+σ1201)(8.24)TaT其中,假设1将个体效应设定为服从均值为0,方差为σ2的随机数,而我们在固定效应模型中a没有对E[ai]作任何限制;假设2非常显然,因为此时我们将ai视为随机干扰项的一部分,所3ai83:2∼IID(0(8.22),σ)a4:Cov(ai,xit)=0(8.23)5:ui|xi∼IID(0,σ2IT+σ1201)(8.24)TaT其中,假设1将个体效应设定为服从均值为0,方差为σ2的随机数,而我们在固定效应模型中a没有对E[ai]作任何限制;假设2非常显然,因为此时我们将ai视为随机干扰项的一部分,所3aiεit相互独立。基于以上设定,我们可以写出模型的方差-协方差矩阵:=Euu0]=IN⊗(σ2IT+σ201)=I⊗6(8.25)TNaT其中,6=σ2IT+σ1 ,具体形式为:2 10Ta T22σ2σ2σ+σ···aaaσ222σ2σ+σ···aaa6=(8.26)..........σ2σ222···σ+σaaaβ的GLS估计量为:S=X0−1X]−1X0(8.27)方差估计量为:ar(S)=[X0(8.28)这里,我们也可以像第四章那样将OLS估计−1/2=[In⊗6]−1/26−1/2即可,I− 11σεθ6−1/2=01TTT其中, σε θ=1−pσ+Tσ22aε9于是我们可以对原始数据作如下转换:16−1/2y=(8.29)iσ.ε.按照同样的方法我们可以对xi进行转换。对转换后的数据执行OLS回归即可得到与(8.27)式相同的结果。我们注意到,如果(8.29)式中的θ=1,则上述变换就是我们前面讲到的“去心变换”,得到的就是固定效应模型对应的组内估计量。事实上,我们可以证明ˆGLS可以表示为组内估计量和组间估计量的加权平均,详细过程请参考Greene(2002,pp.295-296)。FGLS9于是我们可以对原始数据作如下转换:16−1/2y=(8.29)iσ.ε.按照同样的方法我们可以对xi进行转换。对转换后的数据执行OLS回归即可得到与(8.27)式相同的结果。我们注意到,如果(8.29)式中的θ=1,则上述变换就是我们前面讲到的“去心变换”,得到的就是固定效应模型对应的组内估计量。事实上,我们可以证明ˆGLS可以表示为组内估计量和组间估计量的加权平均,详细过程请参考Greene(2002,pp.295-296)。FGLS估计我们上面介绍的GLS估计是在假设方差成分已知的前提下进行了,但多数情况下我们并不知道σ2和σ2,因此需要先估计这两个未知参数,继而用它们去代替(8.51)式中的真实值并采ε a22用GLS估计即可。基本思路是:先估计固定效应模型,得到σ的估计值ˆ,继而估计混合εε22OLS模型,利用其残差和第一步得到的ˆˆ。uε由于组内估计量是无偏且一致的,所以我们可以利用固定效应模型的残差来估计σ2,因为ε在估计固定效应模型的过程中我们已经去除了个体效应。设it=(it−¯i)−(it−¯i)0ˆWG为固定效应模型的残差,则PPnTe22 i=1 t=1itˆ=(8.30)εnT−n−K接着我们看如何估计σ2。模型(8.20)的OLS估计仍然是一致的,多数情况下也是无偏a的。设˜it为模型(8.20)的OLS残差,则P Pn T2˜2i=1 t=1it22aˆ==ˆ+ˆ(8.31)uεnT−K−1由此,我们可以得到:222εˆ=ˆ−ˆau采用该估计量的一个问题是它有时可能是负值,此时我们可以略去(8.30)式和(8.31)式中队自22由度的调整。这样就可以保证ˆˆ的,因为前者是后者的受限模型的估计量。这uε种处理方法的依据在于我们只需要σ2和σ2的一致估计即可,至于是否无偏并不影响大样本性ε a质。上述估计方法虽然简单易行,但是当随机效应模型中包含不随时间改变的变量,如性别、种族等,我们就无法通过估计固定效应模型来估计σε了。不过此时,我们可以沿袭上面的思10路,利用组间估计和混合OLSσ2σ2。采用OLS估计模型ε a¯i=¯0β+¯i(8.32)m∗2ˆ/T)2m∗2可以得到一致估计量 =ˆ+,结合 和ˆ我们可以得到:auεT 22∗ˆ10路,利用组间估计和混合OLSσ2σ2。采用OLS估计模型ε a¯i=¯0β+¯i(8.32)m∗2ˆ/T)2m∗2可以得到一致估计量 =ˆ+,结合 和ˆ我们可以得到:auεT 22∗ˆ=ˆ−m)uεT 1 T−12∗2um−ˆ=ˆa那么以上介绍的各种FGLS估计量哪个更为有效呢?我们知道,对于随机效应模型而言,针对方差成分的真实值进行GLS估计将得到BLUE估计量。而以上介绍的FGLS估计量在N→∞T→∞或二者都成立的情况下,都是渐进有效的。Maddala和Mount(1973)采用蒙特卡罗模拟方法对各种FGLS估计量的比较表明,在小样本下各种估计方法难分仲伯,所以建议采用简单易行的方法进行估计。Taylor(1980)比较了小样本下随机效应的FGLS估计和固定效应的LSDV估计,结果表明:(1)相对于LSDV,FGLS更具有效性,且具有较小的自由度;(2)FGLS的方差不会大于Cramer-Rao17%。(3)选择相对有效的方差成分估计量并不必然能够提高FGLS估计量的有效性。序列相关性易于证明:22σ+σforfori=j,t=si=j,t6=aCov(uit,ujs)=(8.33)σa和ρ=Crr(u,u)=1for i=j,t=sfor i=j,t6=(8.34)it js222σ/(σ+σ)aa不同截面间干扰项的协方差和相关系数都为0。从(8.34)式可以看出,由于随机效应的引入使222ρ=σ/(σ+σ)。这aa很容易理解,因为尽管个体效应是随机的,但在组内并不随时间改变,组内不同期间固定的相关性也就很显然了。显然,在某些情况下这个假设并不合理。如在研究投资或消费时,我们往往会假设组内不同期间的相关性是随时间逐渐减弱的。关于序列相关更为一般性的设定将在8.3.2小节中讲述。118.2.3 假设检验检验固定效应在本章的(8.2.1)小节中,我们已经提到,固定效应模型的设定是建立在如下假设基础之上的,即,我们认为个体间存在显著差异,但是对于特定的个体而言,组内不存在时间序列上的差异。但是,如果个体间(组间)的差异不明显,那么采用OLS对混合数据(PooledOLS)进行估计即可。检验的基本思路为,在个体效应不显著的原假设下,应当有如下关系成立:H0:α1=α2=···=αn我们可以采用F统计量来检验上述假设是否成立,22(R−R)/(n−1) u r F=~118.2.3 假设检验检验固定效应在本章的(8.2.1)小节中,我们已经提到,固定效应模型的设定是建立在如下假设基础之上的,即,我们认为个体间存在显著差异,但是对于特定的个体而言,组内不存在时间序列上的差异。但是,如果个体间(组间)的差异不明显,那么采用OLS对混合数据(PooledOLS)进行估计即可。检验的基本思路为,在个体效应不显著的原假设下,应当有如下关系成立:H0:α1=α2=···=αn我们可以采用F统计量来检验上述假设是否成立,22(R−R)/(n−1) u r F=~F(n−1,nT−n−K)(8.35)1−R)/(2nT−n−K)(u其中,u表示不受约束的模型,即我们的固定效应模型;r表示受约束的模型,即混合数据模型,仅有一个公共的常数项。同理,我们可以构造相应的F统计量来检验时间效应的显著性,以及个体效应和时间效应的联合显著性。检验随机效应Breusch和Pagan(1980)则基于OLS估计的残差构造LM统计量,针对如下假设来检验随机效应,22H0: σ=0v.s. H:σ6=1aa相应的检验统计量为:2hiP P2nTenTi=1 t=1it —LM=(8.36)P P2(T−1)n Te2i=1 =1it在原假设下,LM统计量服从一个自由度为1的卡方分布。如果拒绝原假设则表明存在随机效应。如果采用矩阵的形式,该LM统计量可以表示为:2 nT e0DD0eLM=2(T−1) 0e—1(8.37)需要说明的是,该检验假设模型的设定是正确的,即ai与解释变量不相关,而这一假设是否正确还需要作进一步的检验,这是我们下面要分析的内容。12固定效应还是随机效应?Hausman检验在前面的分析中,我们从不同角度比较了固定效应模型和随机效应模型的差别,但是在实际分析中应该使用哪个模型呢?某些学者指出,试图区分固定效应和随机效应本身就是错误的,二者似乎不具可比性。Mundlak(1978)指出,一般情况下,我们都应当把个体效应视为随机的。如果从单纯的实际操作角度来考虑,固定效应模型往往会耗费很大的自由度,尤其是对于截面数目很大的面板数据,随机效应模型似乎更合适。但另一方面,固定效应模型有一个独特的优势,我们无须做个体效应与其它解释变数不相关的假设,而在随机效应模型中,这个假设是必须的,在模型的设定中如果遗漏了重要的变量,就会导致参数估计的非一致性。因此,我们可以通过检验固定效应ai12固定效应还是随机效应?Hausman检验在前面的分析中,我们从不同角度比较了固定效应模型和随机效应模型的差别,但是在实际分析中应该使用哪个模型呢?某些学者指出,试图区分固定效应和随机效应本身就是错误的,二者似乎不具可比性。Mundlak(1978)指出,一般情况下,我们都应当把个体效应视为随机的。如果从单纯的实际操作角度来考虑,固定效应模型往往会耗费很大的自由度,尤其是对于截面数目很大的面板数据,随机效应模型似乎更合适。但另一方面,固定效应模型有一个独特的优势,我们无须做个体效应与其它解释变数不相关的假设,而在随机效应模型中,这个假设是必须的,在模型的设定中如果遗漏了重要的变量,就会导致参数估计的非一致性。因此,我们可以通过检验固定效应ai与其它解释变量是否相关作为进行固定效应和随机效应模型筛选的依据。Hausman检验就是这样一个检验统计量。其基本思想是,在ai与其他解释变量不相关的原假设下,我们采用OLS估计固定效应模型和采用GLS估计随机效应模型得到的参数估计都是无偏且一致的,只是前者不具有效性。若原假设不成立,则固定效应模型的参数估计仍然是一致的,但随机效应模型却不是。因此,在原假设下,二者的参数估计应该不会有显著的差异,我们可以基于二者参数估计的差异构造统计检验量。假设b和ˆ分别为固定效应模型的OLS估计和随机效应模型的GLS估计,则arb−ˆ]=ar[b]+ar[ˆ]−Cv[b−ˆ]−Cvb−ˆ0(8.38)基于上述Hausman检验的思想,有效估计量与它和非有效估计量之差的协方差应当为零,即Cv(b−ˆ),ˆ]=Cvb,ˆ]−ar[ˆ]=0(8.39)由此我们可以得到:Cvb,ˆ]=ar[ˆ]将(8.40)式的结果代入(8.38)式得到:(8.40)ar[b−ˆ]=ar[b]−ar[ˆ]=9Hausman检验基于如下Wald统计量:(8.41)W=[b−ˆ]0ˆ−1[b−ˆ]∼χ2(K−)(8.42)其中,ˆ采用固定效应和随机效应模型的协方差矩阵进行计算.如果拒绝了原假设,就表明个体效应ai和解释变量xit是相关的,此时我们有两种处理办法:一是采用固定效应模型,某些情况下这是一种无奈的选择;8二是采用工具变量法来处理内生问题。8因为有时我们通过B-P检验发现存在随机效应,但Hausman检验又表明使用随机效应模型的前提假设得不到满足,而我们又往往很难找到合适的工具变量,所以只能采用固定效应模型。13序列相关检验考虑固定效应模型yit=ai+xitβ+εit(8.43)13序列相关检验考虑固定效应模型yit=ai+xitβ+εit(8.43)其一阶差分的形式为:4yit=4xitβ+4εitεit=ρεit−1uit,4εit=ρ4εit−14uit。那么序列相关的原假设为:H0:ρ=0 v.s. ρ6=04εiteitH0下,我们易于证明有如下关系成立:Corr(eit,eit−1)=−0.5(8.44)(8.45)由于在存在序列相关的情况下,(8.44)式的OLS估计量仍然是其真实值的一致估计量,设用ˆit对ˆit1进行OLS回归的系数估计值为ˆ,那么上述序列相关检验就转化为检验ˆ是否显著异于-0.5,这采用一般的t检验即可完成。9至于随机效应模型设定下的序列相关检验就要相对复杂一些,有兴趣的读者可以参考Baltagi(2001)。10异方差检验seexttest2andxttest38.2.4 STATA实现基本设定Data具有如下数据存储格式:9对于这部分内容的详细介绍,请参考Wooldridge(2002,pp.282),STATA中的xtserial可以完成该检验。10不过STATA中的xttest1可以完成这一任务,我们在下面会介绍该命令的使用。company year invest 1 1951 755.9 1 1952 891.2 4924.91 1953 1304.4 6241.71 1954 1486.7 5593.62 1951 588.2 2289.52 1952 645.5 2159.42 1953 641.0 2031.32 1954 459.3 2115.514其中,变量company和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定paneldata的数据存储格式。因此,在使用STATA估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所用的命令为tsset14其中,变量company和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定paneldata的数据存储格式。因此,在使用STATA估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所用的命令为tsset,11命令为:输出结果为:这里需要指出的是,由于PanelData本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到PanelData身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量Laginvest,也就是invest的一阶滞后,那么我们可以采用如下命令:得到的新的数据为:11Seehelptsset,[whelptsset]PanelData[whelpxt]。company year invest Lag_invest 1 1951 755.9 . 1 1952 891.2 755.9 4924.91 1953 1304.4 891.2 6241.71 1954 1486.7 1304.4 5593.62 1951 588.2 . 2289.52 1952 645.5 588.2 2159.42 1953 641.0 645.5 2031.32 1954 459.3 641.0 2115.53 1951 135.2 . 1819.43 1952 157.3 135.2 2079.73 1953 179.5 157.3 2371.63 1954 189.6 179.5 2759.9. . . . .. . . . .. . . . .genLag_invest=L.investpanelvariable:company,1to5timevariable:time,1to20tssetcompanyyear3 1951 135.2 1819.43 1952 157.3 2079.73 1953 179.5 2371.63 1954 189.6 2759.9. . . .. . . .. . . .15当然,按照这样的思路,我们还可以产生某个变量的移动平均、差分等。总之,凡是可以应用到时间序列上的命令,基本上都可以应用到PanelData中来。在完成了上述设定后,我们就可以进行基于PanelData的数据描述性统计和模型的估计了。统计描述在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于PanelData而言,我们至少要知道我们的数据中有多少个截面(个体),每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成:1215当然,按照这样的思路,我们还可以产生某个变量的移动平均、差分等。总之,凡是可以应用到时间序列上的命令,基本上都可以应用到PanelData中来。在完成了上述设定后,我们就可以进行基于PanelData的数据描述性统计和模型的估计了。统计描述在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于PanelData而言,我们至少要知道我们的数据中有多少个截面(个体),每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成:12xtdes命令用于8-1:面板数据描述统计命令命令用途xtdesxtsumxttab对PanelData截面个数、时间跨度的整体描述分组内、组间和样本整体计算各个变量的基本统计量采用列表的方式显示某个变量的分布,较少使用初步了解数据的大体分布状况,我们可以知道数据中含有多少个截面,最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下,我们可以采用该命令来诊断处理后的数据是否为平行数据。xtsum命令事实上是我们经常使用的命令summary的扩展,各个统计量都分别在样本总体、组内和组建三个层次上进行计算。需要指出的是,由于我们可以把面板数据简单地视为混合数据(pooleddata),所以以往针对截面数据设定的命令,如list、sum、des、tabstat、histogram、kdensity等命令也都可以用于Paneldata的样本描述。估计STATA8.0主要提供了如下模型的估计方法,如表8-2所示。其中多数模型的估计方法我们都会在随后的章节中陆续讲到。这里我们先介绍固定效应模型和随机效应模型的估计方法。二者都是采用xtreg命令来估计的,差别在于选项的设定,基本命令格式如下:12另外一些用于面板数据统计性描述的命令可以从网上下载,包括xtcount、xtlist、countby、xtpattern、xtcorr和xtcorr2。168-2:STATA8.0PanelData模型的主要命令一览命令模型xtregxtregarxtglsxtpcse168-2:STATA8.0PanelData模型的主要命令一览命令模型xtregxtregarxtglsxtpcsextrchhxtivregxtabondxtabond2xttobitxtintregxtlogitxtprobitxtcloglogxtpoissonxtnbregxtfrontierxthtylorFixed-,between-andrandom-effects,andpopulation-averagedlinearmodelsFixed-andrandom-effectslinearmodelswithanAR(1)disturbancePanel-datamodelsusingGLSOLSorPrais-Winstenmodelswithpanel-correctedstandarderrorsHildreth-HouckrandomcoefficientsmodelsInstrumentalvariablesandtwo-stageleastsquaresforpanel-datamodelsArellano-Bondlinear,dynamicpaneldataestimatorArellano-Bondsystemdynamicpaneldataestimator(需要从网上下载)Random-effectstobitmodelsRandom-effectsintervaldataregressionmodelslogitmodelsRandom-effectsandpopulation-averagedprobitmodelsRandom-effectsandpopulation-averagedcloglogmodelsrandom-effects,population-averagedPoissonmodelsnegativebinomialmodelsStochasticfrontiermodelsforpanel-datarerror-componentsmodels其中modeltype选项用于指定需要估计的模型,对应关系如表8-3所示:这里有三点需要说明:其一,,如果不填modeltype项,则STATA默认采用GLS方法估计随机效应模型;其二,mle项事实上是估计随机效应模型的另一种方法而已;其三,我们上面给出的命令格式只是一个基本形式,对于不同模型的估计,还有一些相当灵活的控制选项,读者可以参考相应的帮助。level(#)选项用于标明显著水平,默认值为95%,如果需要将显著水平设定为99%,那么可以将该选项设定为level(99)即可。xtregdepvar[varlist][ifexp],model_type[level(#)]178-3:xtreg命令中选项的含义modeltype模型beferepamleFixed-effectsestimatorGLSRandom-effectsestimator178-3:xtreg命令中选项的含义modeltype模型beferepamleFixed-effectsestimatorGLSRandom-effectsestimatorestimatorRandom-effectsestimator下面,我们通过一个具体实例来说明上述命令的使用方法。我们采用STATA8.0自带的范例数据,文件名为grunfeld.dta。里面包含了六个变量,其中company和year分别表示样本公司的代码和观察的年份,相当于我们前面提到的截面变量和时间变量;invest表示公司的投资额;mvalue表示公司的市场价值;kstock表示公司的资本存量。我们的目的是看公司的投资额和资本存量如何影响公司的市场价值。第一步,声明截面变量和时间变量。命令为:命令执行后屏幕上会显示:第二步,进行样本的描述性统计。首先我们看看样本的大体分布情况,命令为:我们发现,我们的样本中包含10家公司(n=10),每家公司有20年的资料(T=20,1935-1954),整体上为平行面板数据,因为各个百分位上的Ti均为20。接着,我们列示出样本中主要变量的基本统计量,命令为:命令执行后,屏幕上会显示:Variable | Mean Std.Dev. Min Max|Obs-----------------+--------------------------------------------+----------xtsuminvestmvaluekstockxtdespanelvariable:company,1to10timevariable:year,1935to1954tssetcompanyyear18我们发现统计结果是按照“整体”、“组间”和“组内”三个层次进行的。当然,你也可以采用sum命令来得到基本统计量,而且在正是写论文时,所需列示的结果并不要求像上面那么详细,此时sum命令反而更实用。第三步,面板数据模型回归分析。18我们发现统计结果是按照“整体”、“组间”和“组内”三个层次进行的。当然,你也可以采用sum命令来得到基本统计量,而且在正是写论文时,所需列示的结果并不要求像上面那么详细,此时sum命令反而更实用。第三步,面板数据模型回归分析。我们先做固定效应模型,命令为:其中,fe表明我们采用的是固定效应模型。执行上述命令后,屏幕显示结果为:结果的前两行列示了模型的类别(本例中为固定效应模型)、截面变量、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度,分为组内、组间和样本总Fixed-effects(within)regression Numberofobs =200Groupvariable(i):company Numberofgroups =10R-sq:within=0.4117 Obspergroup:min=20between=0.8078 avg=20.0overall=0.7388 max=20F(2,188) =65.78corr(u_i,Xb)=0.6955 Prob>F =0.0000mvalue| Coef. Std.Err. t P>|t| [95%Conf.Interval]--------+----------------------------------------------------------------invest| 2.856166 .3075147 9.29 0.000 2.249543 3.462789kstock|-.5078673 .1403662 -3.62 0.000 -.7847625-.2309721_cons| 804.9802 32.43177 24.82 0.000 741.0033 868.9571--------+----------------------------------------------------------------sigma_u|905.81517sigma_e|268.73329rho |.91910377(fractionofvarianceduetou_i)Ftestthatallu_i=0: F(9,188)=113.76 Prob>F=0.0000xtregmvalueinvestkstock,feinvest overall|145.9583 216.8753 .93 1486.7|N=200between| 198.8242 3.0845 608.02|n= 10within| 106.1986-204.3617 1024.638|T= 20| |mvalue overall|1081.681 1314.47 58.12 6241.7|N=200between| 1334.917 70.921 4333.845|n= 10within| 340.5421 -459.964 2989.536|T= 20| |kstock overall|276.0172 301.1039 .8 2226.3|N=200between| 200.9701 5.9415 648.435|n= 10within| 232.6603-369.6179 1853.882|T= 2019体三个层次。第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中分别为65.78和19体三个层次。第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中分别为65.78和0.0000,表明参数整体上相当显著。第8-11行列示了解释变量的估计系数、标准差、t统计量和相应的P值以及95%置信区间,这和我们在进行截面回归是得到的结果是一样的。最后四行列示了固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigmau和sigmae)、二者之间的关系(rho)。最后一行给出了检验固定效应是否显著的F统计量和相应的P值,本例中固定效应非常显著。估计随机效应的命令为:读者可以比较一下执行该命令后的输出结果与固定效应模型的估计结果的差异。第四步,模型的筛选和检验。这是模型设定过程中最为关键同时也是最难的一步,在这方面功力的提高还需要大量的实践经验和对理论的深入理解。1)检验个体效应的显著性。我们做固定效应模型时,F检验表明固定效应模型由于混合OLS模型。下面我们说明如何检验随机效应是否显著,命令为:输出结果为:P值为0.0000,表明随机效应非常显著。2)Hausman检验。具体步骤为:step1:估计固定效应模型,存储估计结果;BreuschandPaganLagrangian estforrandomeffects:mvalue[company,t]=Xb+u[company]+e[company,t]Estimatedresults:| Var sd=sqrt(Var)---------+-----------------------------mvalue| .47e| 72217.58 268.7333u| 298685.7 546.5214Test: Var(u)=0chi2(1)= 772.32Prob>chi2= 0.0000xttest0xtregmvalueinvestkstock,re20step2:估计随机效应模型,存储估计结果;step3:进行Hausman检验;命令为:这里,qui20step2:估计随机效应模型,存储估计结果;step3:进行Hausman检验;命令为:这里,qui的作用在于不把估计结果输出到屏幕上,eststore的作用在于把估计结果存储到名称为fe的临时性文件中。输出结果为:我们注意到输出结果的最后一行提示说固定效应模型和随机效应模型的参数估计方差的差是一个非正定矩阵,因此sqrt(diag(Vb-VB))一项全为缺失值。这是在进行Hausman检验过程中经常遇到的问题,有时我们还会得到负的chi2值。产生这些情况的原因可能有多种,但我认为一个主要的原因是我们的模型设定有问题,导致Hausman检验的基本假设得不到满足。这时,我们最好先对模型的设定进行分析,看看是否有遗漏变量的问题,或者某些变量是非平稳的等等。在确定模型的设定没有问题的情况下再进行Hausman检验,如果仍然拒绝原假设或是出现上面的问题,那么我们就认为随机效应模型的基本假设(个体效应与解释变量不相关)得不到满足。此时,需要采用工具变量法或是使用固定效应模型。----Coefficients----| (b) (B) (b-B) sqrt(diag(V_b-V_B))| fe . Difference S.E.---------+---------------------------------------------------------------invest| 2.856166 3.113429 -.2572636 .kstock| -.5078673 -.578422 .0705548 .b=consistentunderHoandHa;obtainedfromxtregB=inconsistentunderHa,efficientunderHo;obtainedfromxtregTest:Ho:differenceincoefficientsnotsystematicchi2(2)=(b-B)’[(V_b-V_B)ˆ(-1)](b-B)= 2366.62Prob>chi2= 0.0000(V_b-V_Bisnotpositivedefinite)quixtregmvalueinvestkstock,fe eststorefequixtregmvalueinvestkstock,re eststorerehausmanfe /*step3*/8.3.非均齐方差218.3非均齐方差.2小节的模型设定中,我们都做了同方差假设,即εit∼(0σ2)ai∼(0,σ2)。该假设在有些情况下并不合理,如我们在研究不同省份的消费或不同规模的上市u公司的时,一般都会认为干扰项会存在异方差;而在研究投资和消费时,不可观测冲击有可能会持续多期,致使干扰项存在序列相关。当模型中存在异方差或序列相关时,在同方差假设下得到的估计量虽然仍旧是无偏且一致的,但不具有效性。同时,这些估计的标准差也将是8.3.非均齐方差218.3非均齐方差.2小节的模型设定中,我们都做了同方差假设,即εit∼(0σ2)ai∼(0,σ2)。该假设在有些情况下并不合理,如我们在研究不同省份的消费或不同规模的上市u公司的时,一般都会认为干扰项会存在异方差;而在研究投资和消费时,不可观测冲击有可能会持续多期,致使干扰项存在序列相关。当模型中存在异方差或序列相关时,在同方差假设下得到的估计量虽然仍旧是无偏且一致的,但不具有效性。同时,这些估计的标准差也将是有偏的,除非我们针对可能存在的异方差进行稳健性估计。8.3.1 异方差本节中放松同方差的假设,介绍三种允许异方差设定的模型:固定效应模型中,εit存在异方差;随机效应模型中εit和ui分别存在异方差。1模型的基本设定同8.2.1小节,考虑模型(8.6),y=Da+Xβ+ε假设(8.5)放松为:(8.46)其中,ε=(ε1,ε2,···,εn)0。这里2Var[ε|x,a]=σI(8.47)ii iTi26diag[σ]N×N矩阵,则0=Var[ε]=E[εε0]=6⊗.i(8.48)在(8.46)Q以消除效应,得到y∗=X∗β+ε∗y∗=Qy,X∗=QX,ε∗=Qε。干扰项的方差-协方差矩阵可以表示为:=a(ε∗)=E[Qεε0Q0]=Q0Q0于是,模型(8.49)的GLS估计量为:(8.49)(8.50)S=[X∗0−1X∗]−1X∗0−1∗=[X001X]−1X01y而S的方差估计量为:Var[S]=[X∗0−1X∗]−1=[X001X]−1(8.51)(8.52)8.3.非均齐方差22要获得相应的FGLS估计量,我们需要首先估计出6中包含的未知参数σ2。由于在异方差i的设定下组内估计量仍然是无偏且一致的,所以我们可以基于组内估计的残差来估计σ2。令i=it−0tG其中,G为模型(8.46)在同方差设定下的组内估计量,如(8.8)。则我们eitσ2的如下一致估计量:iTX1T22ˆ=eiit8.3.非均齐方差22要获得相应的FGLS估计量,我们需要首先估计出6中包含的未知参数σ2。由于在异方差i的设定下组内估计量仍然是无偏且一致的,所以我们可以基于组内估计的残差来估计σ2。令i=it−0tG其中,G为模型(8.46)在同方差设定下的组内估计量,如(8.8)。则我们eitσ2的如下一致估计量:iTX1T22ˆ=eiitt=1于是,21ˆ22ˆˆ6=(8.53)...2nˆ用ˆ0=ˆ⊗IT分别代替(8.51)式和(8.52)式中的0我们就可以得到相应的FGLS如果需要的话,还可将上述过程迭代直到前后两次得到的估计值差别不大为止。一个问题:这里我们发现,上述估计结果和对如下不考虑混合模型进行GLS估计得到的结果相同:效应,但设定组间异方差的y=Xβ+ε(8.54)其中,2Var[ε|x,a]=σI(8.55)ii iTi现在的问题是,是我们的推导有误,还是这两个模型本身有一些特定的内在关系?132模型的基本设定为:=xitβ+uit=ai+εityit(8.56)uit(8.57)2ε∼IID(0σ2)。采用矩阵形式可表示为:ai(0,,w)itiy=Xβ+uu=Zaa+ε(8.58)(8.59)13ForSTATAimplements,seechp8het1.do.8.3.非均齐方差23其中,a=IN⊗1T,a=a1,a2,···,an)0。干扰项的方差矩阵为:=Var[u]=E[uu0]=a6a0+σ8.3.非均齐方差23其中,a=IN⊗1T,a=a1,a2,···,an)0。干扰项的方差矩阵为:=Var[u]=E[uu0]=a6a0+σ(8.60)其中,6=Eaa0]=diag[w]为N×N矩阵。(8.60)式可进一步表示为:2ai=diag[w]⊗J+diag[σ2]⊗2(8.61)Ti这里diag[σ2]也是N×N对角矩阵。若我们用JT=¯T和IT=ET+¯T分别替换(8.61)式中的JTIT,则(8.61)式可采用Fuller和Battese(1974)的方法变换为:=diag[Tw+σ]⊗J+diag[σ2]⊗22¯(8.62)Ti其中,ET=IT−¯T。因此,r¯=diag[(τ)]⊗J+diag[(σ2)r]⊗ET2r(8.63)Ti222其中,τ=Twσ,r为任意实数。最终,我们可以采用Fuller和Battese(1974)的变换方法,ii对(8.58)式左乘σ−12=diag[σ/i]⊗¯T+(IN⊗)(8.64)得到变换后的模型为:y∗=X∗β+v∗y∗=σ−1/2y,X∗=σ−1/2X,v∗=σ−1/2vVar[v∗]=σ2INT,y∗中的特定元素为(8.65)其中,θi=1σ/τi。22要获得FGLSσw(i=12···n)。由于在存在异方差的情况下,模i型(8.56)的组内估计量仍然是一致的,所以我们可以利用组内估计的残差eit来估计σ2:N TXX 1 NT−N−K2e(8.66)iti=1t=1同时,我们注意到22Var[u]=w+σ,iti而模型(8.56)的混合最小二乘估计也是一致的,所以我们可以利用OLS残差ˆit先估计TX1 T−122ˆ=ˆ−ˆ),(8.67)(it ii=18.3.非均齐方差24进而得到222ˆ=ˆ−ˆ(8.68)ii上述估计过程可归结如下:估计(8.46)eit,进而采用(8.66)σˆ2;采用混合最小二乘法估计模型(8.56),得到OLS残差ˆit,采用(8.67)得到22ˆ,进而利用i(8.68)ˆ;i3.计算i=1−ˆ/i,其中,i8.3.非均齐方差24进而得到222ˆ=ˆ−ˆ(8.68)ii上述估计过程可归结如下:估计(8.46)eit,进而采用(8.66)σˆ2;采用混合最小二乘法估计模型(8.56),得到OLS残差ˆit,采用(8.67)得到22ˆ,进而利用i(8.68)ˆ;i3.计算i=1−ˆ/i,其中,i=T22ˆ+ˆ;iˆS。4.用(it−i¯i)对it−i¯i做OLS回归即可得到2222ˆˆ后,代入(8.61)的一致wσii计量ˆ,我们直接得到β的FGLS估计量为1 −1ˆS=[X0ˆ−X]1X0ˆ y(8.69)相应的方差估计量为:1Var[ˆS]=[X0ˆ−(8.70)这也是我们在GLS的框架下处理异方差问题的常用方法。这里之所以着墨给出上面的分解过程是因为这种方法基于对模型方差的分解,为我们后续的分析提供了一个很好的分析框架。3222ai∼(0,ε~(0,此时,σ),w)itui22=diag[σ]⊗J+diag[w]⊗(8.71)TTui用JT=¯T和IT式可表示为:=ET+¯T分别替换式中的JT和IT,并采用Fuller和Battese变换,则(8.71)¯222=diag[Tσ+w]⊗J+diag[w]⊗(8.72)TTuii同时,¯r2r2r=diag[(τ)]⊗J+diag[(w)]⊗E(8.73)TTii222τ=Tσw,r为任意实数。因此,其中,iui−1/2=diag[1/i]⊗¯T+diag[1/i]⊗(8.74)8.3.非均齐方差25y∗=−1/2yyi∗t可进一步表示为:=(¯i/i)+(it−¯i)/i(8.75)(8.76)θi=1(wi/τi)。为了获得FGLS估计量,我们可以仿照模型2中的处理方式,采用OLS和组内估计量的残222σweˆ分别为OLSw8.3.非均齐方差25y∗=−1/2yyi∗t可进一步表示为:=(¯i/i)+(it−¯i)/i(8.75)(8.76)θi=1(wi/τi)。为了获得FGLS估计量,我们可以仿照模型2中的处理方式,采用OLS和组内估计量的残222σweˆ分别为OLSw的估计式为:it ituiiTX1 T−122ˆ=e−¯)(8.77)(itiit=1PT2 221/T)eVar[u]=σ=σw,所以我们可以先得到:ititt=1i uiTX1 T−12i=2ˆ−ˆ)(it it=1P其中ˆi=(T21/T)ˆ,进而得到Nσ的估计值:itt=1u2 22ˆ =ˆ−w (i=1,2,···,n)ui ii2于是,我们可利用这N个估计值的平均值得到Nˆ:uNXX1N1N2222ˆ=ˆ =ˆ−w)(8.78)uuiiii=1i=1当然,我们也可以同时对效应ui和干扰项εit进行异方差的设定。推导过程会变得相对复杂,但基本的思路都是相同的:那就是首先求得干扰项的方差-协方差矩阵,继而推导出系数的GLS估计量。在进行FGLS估计时,我们可以利用模型干扰项的一致估计量,如混合最小二乘估计的残差、组内估计和组间估计的残差来获得方差成分的一致估计量。8.3.2 序列相关尽管我们在8.2.2小节中已经提到,由于效应作为最为随机效应模型干扰项的一部分,在组内是不随时间变化的,所以组内观察值会存在不随时间改变的序列相关性。但这种不随时间减弱的相关性在许多情况下显然是一个过强的假设。本节中,我们放松随机效应模型中干扰项项服从IID分布的假设,允许其存在自相关。这里我们仅介绍εit服从AR(1)过程时的估计方法,至于εit服从AR(2)、AR(4)或MA(1)过程时的估计方法,有Baltagi(2001)第五章相关内容。14的读者可以参考14Franzini和Narendranathan(1982)给出了在固定效应模型中对干扰项的序列相关进行设定的处理方法。8.3.非均齐方差26模型的基本设定如下:yit=xitβ+uit(8.79a)uit=ai+εit(8.79b)εit=ρεi,t−1+vit(8.79c)22ai∼IID(0,σ),v~IID0,σ)aε8.3.非均齐方差26模型的基本设定如下:yit=xitβ+uit(8.79a)uit=ai+εit(8.79b)εit=ρεi,t−1+vit(8.79c)22ai∼IID(0,σ),v~IID0,σ)aεit均不相关,且满足稳定性(itiuv条件|ρ|<1。处理的基本思路很简单,我们首先采用第五章中处理时间序列模型的方法消除序列相关,进而采用GLS估计变换后的模型。对于第一期观察值,我们同样有两种处理方法:一是采用Cochrane-Orcutt(1949)建议的方法,舍弃第一期观察值;二是依据Prais-Winsten(1956)的方法,对第一期观察值进行特别处理。Cochrane-Orcutt估计我们对模型(8.79)进行准差分处理,得到(it−ρi,t−1)=(it−ρi,t−1)0β+(1−ρi+it对应的向量形式为:=Cxi+C1ai+CviC1=(1ρ)1T−1(T−1)×1列向量,(8.80)ρ 1 0000000−···············0−ρ 1. . .. . .. . .. . .C=(8.81),000 00 0−ρ01 0−ρ 1(T−1)×T我们可进一步写出(8.80)的矩阵形式:(IN⊗C

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论