面板数据模型

上传人：d*** IP属地：广东上传时间：2021-07-16 格式：PPT 页数：29 大小：90KB 积分：20 举报 版权申诉

已阅读5页，还剩24页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、面板数据模型面板数据模型 4.4.1面板数据简介面板数据简介所谓面板数据，是指同一截面单元数据集上对不同时间段上的重复观测值(repeated observations on the same set of cross - section units) 。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据；截面数据是变量在截面空间上的数据。面板数据（panel data）也称时间序列截面数据（time series and cross section data）或混合数据（pool data）。面板数据是同时在时间和截面空间上取得的二维数据。这种数

2、据具有如下优点： (1)面板数据可以很好地容纳、控制不可观测的个体单元集之间的异质性、动态性。 (2)面板数据充分利用了时间段和截面单元的信息，给出了更多的变量、数据信息、自由度，从而减少了变量之间多重共线性的产生，使估计结果更加有效、稳定、可靠。 (3)面板数据可以将不同时间点上的经历和行为联系起来，表明不同个体的截面数据是如何随时间的变化而变化的，能够更好地研究数据的动态矫正。截面变量和时间变量的结合信息能够显著地减少缺省变量所带来的问题。一般地，截面参数随时间变化的方式可能不能由时间序列解释变量的选择反映出来。或者个体在截面上的重要变化方式不由截面变量的选择所反

3、映。 (4)面板数据可以研究不断变化的个体类型。 (5)面板数据模型可以构造和检验比纯时间序列和截面数据更为复杂的行为模型，如技术的有效性。面板数据集可以区分出单用截面数据或时间序列数据都不能得到的经济作用。 (6)面板数据使我们能够研究每个样本随时间的变化，以及每个样本在某时间点上的不同。面板数据模型可以给出较纯时间序列和截面数据更好的预测。因此，面板数据的使用使得模型的确认变得更加困难；面板数据的干扰可能包含了时间序列干扰、截面干扰，以及时间序列和截面的混合干扰。最常见的面板数据有以下几类：平衡面板数据：这种数据结构的个体在所有的时间段上都是相同的；不平衡面

4、板数据：在每一个时间段上，都有旧的个体退出，新的个体进入，即每一个时间段上个体的数目都不相同；旋转面板数据：每一个时间段上更新相同数目的样本；伪面板数据。 4.4.2传统面板数据模型及其估计传统面板数据模型及其估计面板数据一个明显的特点是：可以从模型中反映出个体异质性。 yit =i +Xit + uit （i = 1 ，N t = 1 ，T）其中，N 为截面个数(或个体个数) ，T为每一个体对应的时间长度，uit 为误差成分。随着个体的不同，i也不相同，称为个体的异质性(通常是不可观测的)。对所有的N都是一致的，为保证估计的一致性和有效性，对模型作如下设定： (1)

5、同均值：E( ei) = 0 (2) 外生性：Corr ( ei ，x i) = 0 (3) 同方差性：Var ( ei) = s2 = 常数 (4) 序列不相关性：Corr ( ei ，ej) = 0 ，i j 在小样本的情况下还要保证随机扰动项的正态性。若直接用普通最小二乘法估计会存在如下的问题：i是偶然参数，它的数目随着N 的增大而增大，而且参数的个数N + K 数目将会很大。为此可以考虑将偶然参数i 的异质性剔除，将异质性归并到误差项中，即令模型为： yit = +Xit + uit （i = 1 ，N t = 1 ，T） uit = i + vit 此处i 代表不可观测的

6、异质性，vit 代表剩余扰动项。随着对误差项成分的进一步分解，又可将面板数据模型分解为单项误差成分模型(one - way error component regression model) 和二项误差成分模型(two - way error component regression model) ，下面仅讨论单项误差成分模型的设定和估计。单项误差成分模型(one - way error component regression model)模型设定为： yit = +Xit +i + vit （i = 1 ，N t = 1 ，T）此处i代表随个体变化的不可观测的异质性，不随时

7、间变化。vit代表随时间和个体变化的剩余扰动项。对i设定的不同又将模型区分为固定效应模型和随机效应模型两大类。在固定效应模型固定效应模型中，假设i是待估的固定参数，直接采用最小二乘哑元变量的回归会造成估计结果的不一致性，根本原因就在于，模型中包含了随个体变化而变化的偶然参数。因此可以考虑先对模型进行变换，消去偶然参数，即采用组内回归(within regression) 方法估计。随机效应模型随机效应模型中，i、vit都是随机变量。固定效应模型的组内回归结果具有如下特点： (1) T ，固定效应的估计是一致的。 (2) T 固定及T 组内回归的是一致的。只有当T 较大时

8、，组内回归的i 才是一致的。固定效应模型与Pooled Model相比，充分利用了面板数据的信息，它的弱点在于：若是在个体或(和)时间上有过多的虚拟变量，模型会损失大量的自由度，导致检验的势过弱的困境。随着变量的增多可能带来多重共线性问题。随着标准差的增大，会减少参数检验的势。不可避免地会出现异方差和自相关。随偶然参数的增多，模型结果会不一致。无法直接估计时不变的变量。线性单变量模型类型有下面几种：（1）固定效应和固定系数模型（Fixed Effect Models and Fixed Coefficient Models）：通常采用OLS估计。固定效应包括时间效应以及

9、时间和个体效应，并可以进一步放宽条件，允许在有异方差、自相关性和等相关矩阵块情况下，用GLS估计。（2）误差成分模型（Error Components Models）：最常用的Panel Data模型。针对不同情况，通常可以用OLS估计、GLS估计、内部估计（Within Estimator）和FGLS估计，并检验误差成分中的个体效应以及个体和时间效应，同时将自相关和异方差情况也纳入该模型框架。（3）随机系数模型(Random Coefficient Models)：即模型自变量的系数可能包含时间效应或个体效应，再加上一个随机数，系数通常用抽样方法或者贝叶斯方法来估计。（4）带

10、有随机自变量的线性模型(Linear models with random regressiors)：通常用工具变量估计（IV估计）和GMM估计。同时，利用工具变量可以对相关的特定效应模型(the Correlated Specific Effect Models)估计，并对随机变量与特定效应之间的相关性进行检验。（5）动态线性模型（Dynamic linear Models），该模型同样又包含固定效应自回归模型（通常用LSDV估计、Within估计、IV估计法估计参数）、动态误差成分模型（-类估计、IV估计、GMM估计、极大似然估计( IMLE) 以及似然不相关分析方法( SUR)

11、等方法估计参数）以及带有异方差的动态线性模型（联合估计、组均值估计和截面估计等方法估计参数，并检验异方差性），成为近来Panel Data单位根和协整理论发展的基础。 4.4.3面板数据模型的检验问题面板数据模型的检验问题近年来，Panel Data 模型得到了理论与应用研究者们的广泛关注，而方法也在原有的经典模型的基础上得到了迅猛发展。动态Panel Data模型、离散数据模型(Discrete Data)、非平衡Panel Data 模型、 Panel Data的离散选择模型、Panel Data 的单位根检验与向量自回归模型以及因果关系检验等方面的理论成果层出不穷。

12、无论是较为经典的Panel Data模型，还是在此基础上发展起来的其他模型，在模型设定与应用过程中，依然面临要对误差分解成分满足固定效应还是随机效应进行判断与检验问题，加之误差成分不同的分解方式以及两种不同维度的组合搭配，使得固定与随机的检验与判断变得更加复杂与扑朔迷离。关于面板数据的检验问题主要有两类：一是关于面板数据的设定性问题，即针对前面提出的面板数据的四类模型：混合估计、固定效应、随机效应，究竟用哪一种? 再就是在个体和时间轴上的效应的检验；二是误设问题的检验，检验模型中是否有序列相关、异方差等。下面着重对第一种情况加以讨论。 2.1 混合估计模型。如果从时

13、间上看，不同个体之间不存在显著性差异；从截面上看，不同截面之间也不存在显著性差异，那么就可以直接把面板数据混合在一起用普通最小二乘法（OLS）估计参数。如果从时间和截面看模型截距都不为零，且是一个相同的常数，以二变量模型为例，则建立如下模型 yit = +1 xit +it, i = 1, 2, , N; t = 1, 2, , T (1) 和1不随i，t变化。称模型(1)为混合估计模型。 2.2 固定效应模型。在面板数据散点图中，如果对于不同的截面或不同的时间序列，模型的截距是不同的，则可以采用在模型中加虚拟变量的方法估计回归参数，称此种模型为固定效应模型（fixed e

14、ffects regression model）。固定效应模型分为3种类型：个体固定效应模型（entity fixed effects regression model）时刻固定效应模型（time fixed effects regression model）时刻个体固定效应模型（time and entity fixed effects regression model）。下面分别介绍。（1）个体固定效应模型。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列（个体）截距是不同的，但是对于不同的横截面，模型截距没有显著性变化，那么应该建立个体固定效应

15、模型，表示如下， yit = 1 xit +1 W1 + 2 W2 + +N WN +it, t = 1, 2, , T (3) 相对于混合估计模型来说，是否有必要建立个体固定效应模型可以通过F检验来完成。原假设H0：不同个体的模型截距项相同（建立混合估计模型）。备择假设H1：不同个体的模型截距项不同（建立个体固定效应模型）。 F统计量定义为： F = = 其中SSEr，SSEu分别表示约束模型（混合估计模型）和非约束模型（个体固定效应模型）的残差平方和。非约束模型比约束模型多了N-1个被估参数。（混合估计模型给出公共截距项。） ) 1/( )1()2/()( NNTSSE N

16、NTNTSSESSE u ur ) 1/( ) 1/()( NNTSSE NSSESSE u ur 注意：当模型中含有k个解释变量时，F统计量的分母自由度是NT-N-k。 F= 因为F F0.05，所以，拒绝原假设。应该建立个体固定效应模型。 ) 1/( ) 1/()( NNTSSE NSSESSE u ur （2）时刻固定效应模型。时刻固定效应模型就是对于不同的截面（时刻点）有不同截距的模型。如果确知对于不同的截面，模型的截距显著不同，但是对于不同的时间序列（个体）截距是相同的，那么应该建立时刻固定效应模型，表示如下， yit = 1 xit +1 + 2 D2 + +T DT

17、 +it, i = 1, 2, , N (10) 相对于混合估计模型来说，是否有必要建立时刻固定效应模型可以通过F检验完成。 H0：对于不同横截面模型截距项相同（建立混合估计模型）。 H1：对于不同横截面模型的截距项不同（建立时刻固定效应模型）。 F统计量定义为： F= = 其中SSEr，SSEu分别表示约束模型（混合估计模型的）和非约束模型（时刻固定效应模型的）的残差平方和。非约束模型比约束模型多了T-1个被估参数。 ) 1/( )1()2/()( TNTSSE TNTNTSSESSE u ur ) 1/( ) 1/()( TNTSSE TSSESSE u ur 注意：当模型中含

18、有k个解释变量时，F统计量的分母自由度是NT-T- k。 F= 因为F F0.05，拒绝原假设，应该建立时刻固定效应模型。 ) 1/( ) 1/()( TNTSSE TSSESSE u ur （3）时刻个体固定效应模型。时刻个体固定效应模型就是对于不同的截面（时刻点）、不同的时间序列（个体）都有不同截距的模型。如果确知对于不同的截面、不同的时间序列（个体）模型的截距都显著地不相同，那么应该建立时刻个体效应模型，表示如下， yit = 1 xit +1+2D2 +T DT +1W1+2W2 +N WN+it, i=1,2,N，t = 1, 2, , T (12) 相对于混合估计模

19、型来说，是否有必要建立时刻个体固定效应模型可以通过F检验来完成。 H0：对于不同横截面，不同序列，模型截距项都相同（建立混合估计模型）。 H1：不同横截面，不同序列，模型截距项各不相同（建立时刻个体固定效应模型）。 F统计量定义为： F= = 其中SSEr，SSEu分别表示约束模型（混合估计模型的）和非约束模型（时刻个体固定效应模型的）的残差平方和。非约束模型比约束模型多了N+T个被估参数。 )/( )() 2/()( TNNTSSE TNNTNTSSESSE u ur )/( ) 2/()( TNNTSSE TNSSESSE u ur 注意：当模型中含有k个解释变量时，F统计量

20、的分母自由度是NT-N-T-k+1。 F= 因为F F0.05，拒绝原假设，结论是应该建立时刻个体固定效应模型。 )/( )2/()( TNNTSSE TNSSESSE u ur （4）随机效应模型在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。也可以通过对误差项的分解来描述这种信息的缺失。 yit = + 1 xit + it (14) 其中误差项在时间上和截面上都是相关的，用3个分量表示如下。 it = ui + vt + wit (15) 其中ui N(0, u2)表示截面随机误差分量； vt N(0, v2)表示时间随机误差分量； wit N(0, w2)表示混和随机误差分量。同时还假定ui，vt，wit之间互不相关，各自分别不存在截面自相关、时间自相关和混和自相关。上述模型称为随机效应模型。随机效应模型和固定效应模型比较，相当于把固定效应模型中的截距项看成两个随机变量。一个是截面随机误差项（ui），一个是时间随机误差项（vt）。如果这两个随机误差项都服从正态分布，对模型估计时就能够节省自由度，因为此

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

面板数据模型

文档简介

温馨提示

最新文档

评论

面板数据模型

文档简介

温馨提示

最新文档

评论

相关文档