版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.Chaper5 面板数据模型1。基本概念介绍在联立方程模型中,我们已接触到面板数据模型,它只是作为一种特殊的联立式来讨论的。不同时间和不同个体仅是一种混合的普通样本,采用POLS方法处理。面板数据中不同时间段和不同个体的二元特征没有考虑。而这些特征往往包含有明确的经济信息。本章以存在不可观测效应(Unobserved effect)的现代观点重新阐释面板数据模型。不可观测效应的含义是,从不同时间抽取的样本数据中,存在一个相对时间不变的不可观测的因素,称为异质性。例如,样本个体选择家庭,认知能力、动机、遗传等;样本个体选择企业,管理水平,创新能力等。可以认为它们是相对时间不变的且不可观测。如何
2、处理这些对结果产生影响的潜在因素?除了前述的代理变量和多指标工具变量法外,合理应用面板数据的特征就是本章讨论的问题。此外,面板数据作为截面数据和时间序列数据的混合,能反映模型的动态结构,故也可作为动态分析的内容加以讨论。深入的分析面板数据是学习时间序列分析之后,本章只是一个初步。面板数据有广泛的来源,有大量的应用背景,并针对不同的问题设计有各种不同的模型。合理运用面板数据和模型,能给我们带来更多有意义的统计分析结果。本章也是伍书认为下了功夫的部分。请看例:例1:职业培训的评价欲评价培训的效果,(或实施某一政策的效果,等等。)一个标准的评价模型是:这里特设为二期,。表示随时间变化的截距项,是可观
3、察的影响因素的随机变量,是被关注的虚拟变量,表示参加第二期培训为1否则为0;为个人是否选择接受培训的选择,它是不可观测的,是一个与个人内在因素相关的且与无关的潜在因素。又为了消除政策因素外其它因素的影响,在时间段2中将分成处理组A和控制组B两部分。在无人处在处理组,在,部分人处在控制组部分人处在处理组。并再设置一个虚拟变量,表示如为1,否则为0。模型成为:,则参数就反映了政策因素对的贡献。假设检验:0。拒绝说明培训效果有显著性。例2:RD的分布滞后模型 欲评价过去投入产生的效果,采用时间序列的滞后模型: 这里是厂商在期用于RD的投入,滞后表示过去的投入对现在的影响。是专利收入,是企业不可观测的
4、内在与时间无关的因素。则反映的就是技术研究投入对企业的贡献。这里问题的关键是的存在导致是内生的。例3: 时间序列自回归模型仅利用自身的数据进行评价,采用自回归的模型:这里模型尽管简单,但由于时间的关联性,导致滞后有明显的内生性。问题,如何估计与检验?回忆联立方程模型中的有关PD模型的假设条件:,。 假定:Pols1: ,; Pols2: 秩,; Pols3: , ; ,。注:Pols1并没有要求与不相关,;Pols2仅仅是排除所有,的完全共线性,保证可识别。Pols3类似同方差假定,不成立不影响一致性,只是为检验提供了方便。于是,一致的Pols估计,在假定Pols3下有,所以渐近估计为,又当(
5、1K)向量有某些解释变量同相关,令(1L向量,)是工具变量,且满足工具变量的假定条件,那么P2SLS估计为:1) on ,得,;2) on,得P2sls估计为:。并可得相应残差形式的统计量:。与单方程的完全相同,只是增加了不同时间下的样本容量。我们在上述PD模型的基础上,扩展各种特色的PD模型和估计检验方法。当然这是建立在某些更强的数据信息假定基础上的。 不可观测效应模型的严格外生性假定设不可观测效应模型(UEM)为:,。这里,作为不可观测的与时间无关的个体特质的潜在变量(latent variable)也称为不可观测的差异性(unobserved heterogenity)。它是面板数据模型
6、的基本特色。 由于不可观测,传统观点有两种理解,一种是将,合并称为随机效果,另一种是视为与有关的未知常数,称为固定效果。但按现代观点,关键要看与解释变量是否相关。若认为与不相关,则作为随机效果处理,将与合并;若认为与相关,则作为固定效果处理。面板数据现代观点的另一个重要特点是,时间不是给定的,即可观测的可按时间无限抽样。从而存在未来原因对当前结果的反馈(feedback),导致与之间复杂相关关系,为消除这种复杂性,引入严格外生性假定:对,有。含义是,一旦当前和给定,那么对,对没有边际影响(直观理解是,仅与当前的相关,而与其它的时间无关)。由于不可观测,一个更加严格的外生性假定是:。,如果,即与
7、某一 相关,则更严格的外生假定就不成立。UEM模型的严格外生假定,实际应用中常用误差项表述成:(1)0,。于是有(2)0,。 注:(1)意味着和 与都是不相关的,而(2)则没有要求与是不相关的。这不会影响估计的一致性,但会影响假设检验。一般,在UEM下,我们总假定更强的(1)成立。于是,UEM可改写成:,。称为复合误差。如果知,那么我们就可以采用POLS方法,得到POLS。这当然不是本章的意思。因为混合误差有许多信息没有提取出来。用“粗”的POLS方法虽然能得到的一致估计。但在有限样本时,估计很差,而且统计推断需要用稳健的方差矩阵估计和采用稳健的检验统计量形式。这样,面板数据除了增加样本容量就
8、没有提供任何其它帮助。又当中如果包含某项与相关,或含有的滞后项,由于与相关,从而条件就不成立,POLS估计就不再是一致的了。 对于面板数据的UEM模型,在更强的假定条件(1)下,可采用不同的统计方法,能取得更好的估计和推断效果。最基本的方法有随机效果(RE)、固定效果(FE)和一阶差分(FD)三种方法。我们分别介绍。2。随机效果方法1关于模型与估计设模型为,。假定RE1:(a)=0, , (b);这里且中包含有截距项,无妨设 0不失一般性。(b)意味着是与t无关的个体特征。从而,所以成立。将按写成紧凑的矩阵式:,又令。假定RE2:秩;进一步,对复合误差的方差和协方差增加如下信息:(1),和;
9、(个体、时间同方差)(2)0, 。 (时间不相关)从而,2,记,则。同样,对,。因此,有,称为随机效果结构。这里只有两个未知参数。又把(1)和(2)用统一的条件期望的形式表示成:假定RE3. (a)=, (b)=,注:假定条件RE3比(1)(2)要求更强,但含义更直观。在假定RE13下,模型满足联立式GLS方法的一切条件,如果知道和的一致估计,那么可得一致估计。从而得到比更有效的估计:。下面完成和的估计。 由,。设是的POLS估计,即,由条件知,是一致的。从而可得残差。由大数律,。为保证有限样本的无偏性,修正为(减去K个自由度)。 又由,。再减去个自由度,得到的一致估计为:。并由此得到,。注1
10、:有可能为负值,可能是中关于存在负序列相关性。此意味着RE3(a)不成立。需要选择更一般的对估计做FGLS。如,。但当N不是充分大的时候,由于有个被估参数,所以,有限样本的性质很差。而当RE13成立时,对任意T只要估计二个方差参数,体现了面板数据的优势。2、当RE3不成立时,则就没有随机效果结构。若没有其它信息提供帮助,一般只能改用,其中是POLS估计的残差,再采用联立式的FGLS方法,这就失去了面板数据运用的特色。特别地,尽管RE3不成立,但如果服从一个稳定的一阶自回归过程(, iid)那么可以得到,则只有、和三个关于的未知参数,从而也能得到更好的(的估计采用序列相关常用的CO迭代法,略)。
11、2关于假设检验关于随机效果的检验,最重要的自然是不可观测因素的影响是否存在?检验的命题自然是:0。关于的检验,我们可用误差项一阶自回归过程, 。用检验来完成。如果误差项关于检验被拒绝,不成立。则认为随机效果的影响存在。另一个基于Lagrange乘子的得分检验的方便方法是,在不存在随机效果时,用统计量:。这里是POLS的残差。拒绝意味随机效果存在。值得一提的是,如果中内生性明显存在,如中含有的滞后项,随机效果建模已不合适,该检验自然也不能用。3。固定效果方法1 关于模型与估计认为基本模型中,中不可观测的因素与,i可以是相关的,则复合误差必与中某个解释变量是相关的。因此随机效果的观点就不合适。于是
12、,将单列为一个仅与有关的常数,将基本模型把按列排成矩阵形式:,其中是T1的每个元素为1的向量。为消除不可观测因素,FE模型对求和,并求平均,即:,于是有:,。记,。则,称为去时间平均模型。这又回到联立的面板数据模型。可用POLS方法的条件是0和秩。回到原模型就是要求0。从而可推得固定效果模型的假定条件为:假定:FE1:,;(不必要求)假定:FE2:秩。POLS条件成立。 on ,, 。可得。具体做法是,令,则对称且秩。满足,。用乘模型,可得。再对抽样,做可得:。假定:FE3: 。(即),(再由FE1成立)。此意味着关于具有同方差性和序列不相关性。2。又, 0。相关系数。所以,去时间平均的误差是
13、负相关的,且当T相关性趋于0。可以证明,是正态的,且。为求得的一致估计,由,对求和,得,再对求和,得。用残差代替,其中是 on ,用POLS方法所得。于是,可得到的一致估计为:,其中。减去为保证有限样本的无偏性。此外,对潜在的异质性因素,可粗略地用,来估计。如果充分大,能部分反映的信息。也可通过增设虚拟变量表示个体的特征,得前的系数来估计。但代价是减少了自由度。 得残差,再得的一致估计,再用可得固定效应下广义最小二乘估计。它比更有效。如果对的信息有更多的假定,还可以得到更精确的的表达式。2 关于假设检验1在FE13条件成立的前提下,未知参数有Q个限制的整体性检验,直接用F统计量的残差形式:。2
14、、当FE3不成立,例如存在时间序列相关性,检验就不再适用。但仍有渐近方差估计,改用Wald检验。不再详述。4。一阶差分方法1 关于模型与估计基本模型,不变。但关于做差分变换也可消除,得,。比较FE方法,区别仅在于失去了一个的样本。类似于FE方法。一阶差分方法的假定条件是:假定FD1:,。此意味着与对一切是不相关的;假定FD2:秩;(比条件:秩要弱)假定FD3:。将按列写成矩阵式:,其中误差项的差分意味着是随机游走。这是一种特殊的序列相关。由POLS可得,和。且由,得的一致估计为:。又当FD3不成立,则稳健的异方差矩阵估计为:。2 关于假设检验欲检验条件FD3成立,即检验误差的序列相关性,代替转
15、向检验的序列相关性,。:0,不能拒绝则FD3成立,拒绝,则方差要采用稳健的异方差矩阵。注:采用一阶差分法的理由是,当不存在序列相关时,FE方法更有效。而当服从一个随机游走时,则FD方法更有效。实际的情况是介乎于两者之间,有。如果已知更多关于的信息,我们也可采用FGLS的方法提高有效性。 此外,一阶差分法对评价、政策分析来得更方便。如例1,略去项用一阶差分法,。可得:,。5。三种方法RE,FE,FD的比较1 固定效果和一阶差分的比较如果与相差很大,那么有理由怀疑严格外生性假定不成立。因为任何内生性问题都会产生与现时的相关性。导致FD和FE方法的不一致以及产生不同的概率极限。此外,如果与的相关性也
16、会引致FD和FE估计的不同。我们可以采用豪斯曼检验,验证二个结果是否一致来验证严格外生性条件是否成立。拒绝表示严格外生性假定不成立。但更方便的基于回归的检验方法是:对FD而言:,其中是的部分,(不包括对时间的虚拟变量),(列)。检验。FD13成立,用统计量;FD3不成立用Wald统计量或LM统计量。不能拒绝表示严格外生假定成立,和是一致的。也可对FE做检验:,。同样,是的子集。在严格外生性假定成立下,有。做检验。不能拒绝表示严格外生性成立。注:没有通过严格外生性假定,FE和FD都有可能是不一致的。我们需要对怀疑的部分引入工具变量,并用面板数据的或方法,后面介绍。2随机效果与固定效果的比较模型采
17、用随机效果还是固定效果?我们知道,如果不可观测变量与是不相关的,那么随机效果估计就应当有比固定效果估计有更小的方差。问题是,不可观测无法检验。因此,我们需要把随机效果通过适当的变换,以便同固定效果进行比较。因为随机效果结构是。注意到,()(+)。其中,。定义 ,那么。(注意)所以, 。 ()因此,。如果已知,即和已知,则已知。用对RE模型做变换:,得,则:。且:,即 。,即 。因此随机效果变换后有:。在RE3成立的条件下,用POLS可得和的一致估计,从而可得的一致估计。再对 on ,做POLS,可得:。称为拟去时间平均,可以看出,。或,1。随机效果就回到了固定效果。所以很大,特别是潜在因素在模
18、型的误差项中占主导地位,即使很小,FE和RE也没有很大区别。有了随机效果的变换形式,下面证明,当条件RE13成立时,则随机效果模型估计就有比固定效果估计更小的方差。设中只包含有时间变化的因素,不包含有关于时间常数的因素。那么,;,。(1)。是正定的。是正定的,得证。为要严格检验RE和FE的效果,采用如下的Hausman检验。设是只包含时间变化的解释变量,共有M个。用Hausman统计量:。拒绝,意味着两个估计有显著差异,即认为潜在变量与某些解释变量是相关的。应当采用固定效果的方法。注:和中的未知方差,要用统一的一致估计 另一种基于回归形式的统计量方法是:,。其中和是拟去时间的平均。用代替。是中
19、随时间变化的子集。设有M个。是去时间平均。那么。得到:。接受,意味着RE1-3成立。采用随机效果,拒绝,采用固定效果。注:有可能出现这样的情况,与相差很大,但它们的方差也相差很大,使得统计量很小,导致不能拒绝而采用随机效果模型。而实际上,我们可能犯了第二类错误,与相关,假。但我们不能拒绝。6。一些深入的专题本节介绍一些严格外生性条件不成立时和一些具有更多个体特征的面板数据模型。它们是面板模型的深入,有广泛的实际应用背景。从方法的角度看,就是要把各种异质性与内生性结合在一起处理,这当然加大了问题的处理难度。1 一些严格外生性条件不成立的模型在基本模型,中,把严格外生假定:改成 。即与的过去是严格
20、外生的,而对将来,则不做限制。我们称与不可观测因素有序列式条件外生效应。(Sequencially exogenous conentional on the unobserved effect)例如:,。这里是严格外生的,而是序列式条件外生的。因此有0。这种即有严格外生,又有序列式外生面板模型,典型例子是中含有因变量的时间滞后项,传统观点常把此作为分布滞后模型。如,。则满足序列式外生条件。可以证明,当0,由于不可观测因素存在,与相关,采用随机效果FE或一阶差分FD变换得到的估计和是不一致的,但区别是,当,有一致性,而却没有。因此,当充分大,倾向选择FE方法。另一种严格外生性条件不成立的背景是,
21、与相关。称为现时相关的面板数据模型。这种现时相关性与前述的内生性的讨论是一致的。 即中隐含了一个重要的与时间相关的解释变量或中某些变量存在典型测量误差,以及与中某个或某些变量存在联立性。同样可以证明,现时相关性和不可观测因素的存在,导致FE和FD变换得到的估计是有偏不一致的。 如同解决内生性问题,我们可以通过引入工具变量消除非严格外生性。但寻求工具变量并不是一件容易的事。这也失去了面板数据模型的意义。事实上,面板数据可用自身的数据在时间上的差异,在不同假定条件下,选择不同时间的数据作为其工具变量。然后再采用P2SLS方法,可得到模型的一致估计,或再用GMM方法进一步提高有效性。这里面的细节问题
22、很多,也很复杂。详细的讨论参见伍德里奇的书第11章,或其它有关面板数据分析的书籍,(如Econometric Analysis of Panel Data, Badi H. Baltagi)。这里仅给出简单的说明。对模型:,。首先,用FD或FE变换消除不可观测因素的影响。如FD变换得:,。其次,在不同的假设条件下,选择不同的工具变量。例如,在有序列式外生条件下,将排成列,把写成矩阵紧凑式:。选取工具变量矩阵为:,其中=表示过去和现时的数据。也可以选择的滞后项等作为工具变量。然后选择Pooled 2SLS或GMM方法。统计检验则需要一些更细致的假设条件。又在FE和FD变换中,常采用FE的变换。理
23、由是,它对各种非严格外生性条件都适用,并且几乎不加条件可以照搬原来的检验方法。例:吸烟对收入的影响模型:。认为与是相关的。理由是收入会影响吸烟,产生联立性。如果我们关心的不是后者,那么我们必须找到的一些工具变量。如果认为是严格外生的,那么,可以用上述可作为有效的工具变量。如果认为,与是不相关的,则中包括作为工具可能是有效的。此意味与只有现时的相关性,但对本问题而言,有些不合理。又如果利用的滞后作为工具,那么必须是序列不相关的。又本问题仅依靠作为工具也不合适,因为与而不是的某些线性组合相关,而这种可能很小的偏相关性会导致很差的工具变量性质。稳妥的办法是,找到不在模型中出现但却影响吸烟的外生变量作
24、为工具,如当地香烟的价格或香烟税水平,可以认为它们是严格外生的。 在基本模型中,还可以加入更多的下标特征。例如,扩展基本模型为: 。称为随机趋势模型,也称随机增长模型,其中被认为是不同个体随时间的增长率。扩大严格外生性条件为:,做差分变换消除,得,。于是,我们可接着用FE或FD方法(当T3)得到一致估计。特别当存在序列相关性时,采用FD方法,即二阶差分:更稳健。一般地具有更多个体特征面板数据模型为:,。其中(固定)是1J的。是J1的,称为不可观测的异质性向量。特别当1就是基本模型,当就是随机趋势模型。引入更多时间常数的不可观测的个体特征后,我们除了关注,当然也关注,但当很小时,我们无法得到好的
25、估计(因为无法得到的样本)。转而考虑估计。具体做法是:1. 将,按排成列,得紧凑式为:。 2. 定义投影矩阵,则。用乘方程两边消去得,记成。又在秩假定下做OLS,得是的一致估计。3. 假定,又知秩,因此, 。再用代替,可得的一致估计。再考虑无偏性,得到的无偏一致估计为:。4. ,由0,取期望。,。记 , ; ,可以证明,的渐近方差为:。注:更有效的同时给出和的估计方法涉及到非线性工具变量,计算麻烦。2豪斯曼泰勒模型有时我们更关注的是那些可观测的有关时间常数的解释变量,而不是时间变化的解释变量。然而,我们又认为某些解释变量又与不可观测因素相关。因此,前述的随机效果方法结果是不一致的。而固定效果或
26、一阶差分方法又消除了我们所需要的时间常数的解释变量。所以,这三种方法都不适用。但是,如果时间常数的解释变量与是不相关的,而时间变化的解释变量与可能是相关的,内生性不可避免。豪斯曼泰勒(HT)提出了一个一般形式的可同时处理随时间变化和不随时间变化的又有内生性的两类解释变量的面板数据模型:,。其中是时间常数的解释变量,满足条件。于是,我们可以按前述的方法按FE变换消除和,并获得一致估计。问题:如何估计?若再加上假定条件0,(与不相关)和非奇异。那么,为去时间平均。所以有, 。是的一致估计。 进一步考虑和有严格外生性条件成立和不成立两部分组成的情形:设,且是1,是1的,即有个内生性变量;,且是1,是1的,即有个内生性变量。又假定:0且0。即 和的第一部分与是不相关的。仍假定:,。所以和与对和是不相关的。HT模型按排成列写成: ,有随机效果结构。令是去时间平均矩阵,则。所以,0。是TK矩阵,可作为模型的工具。如果手头没有其它的工具,那么我们只能回到原来的固定效果模型,用消除时间常数项,而不能够估计。但由假设条件知和的第一部分与是不相关的。故,又是1的,也满足0。即和与是正交的。因此,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2市人民医院远程医疗服务管理制度
- 第六章 染色体病课件
- Methyl-4-azido-4-6-dideoxy-2-O-methyl-3-O-phenylmethyl-α-D-glucopyranoside-生命科学试剂-MCE
- 教画古风人物课程设计
- 教案怎么写识字课程设计
- 教师语言课程设计
- 浙教版2021-2022学年度七年级数学上册模拟测试卷 (654)【含简略答案】
- 键控音乐播放器课程设计
- 磷石膏手工抹灰施工方案
- 教室节能灯控制课程设计
- 幼儿园主题活动中家长资源的利用现状研究-毕业论文
- 中煤陕西公司招聘笔试题
- 第1单元水复习(课件)科教版科学三年级上册
- 天堂旅行团读书分享
- 【课件】第3课+象外之境-中国传统山水画+课件-高中美术人教版(2019)美术鉴赏
- 计算机毕业设计jsp咖啡馆管理系统论文
- 现在的窗帘行业分析
- 便利店实操手册课件
- 校园充电桩可行性方案
- 《就业形势分析》课件
- 先进核电技术研发项目实施方案
评论
0/150
提交评论