第十三章面板数据原理(共14页)

上传人：a*** IP属地：湖北上传时间：2022-07-19 格式：DOCX 页数：18 大小：10.34MB 积分：30 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、PAGE PAGE 18面板(min bn)数据模型1面板(min bn)数据定义。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到(d do)的数据；截面数据是变量在截面空间上的数据。面板数据（panel data）也称时间序列截面数据（time series and cross section data）或混合数据（pool data）。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面（cross section）上看，是由若干个体（entity, unit, individual）在某一时刻构成的截面观测值，从纵剖面（longit

2、udinal section）上看是一个时间序列。面板数据用双下标变量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , TN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变，yi ., ( i = 1, 2, , N)是横截面上的N个随机变量；若固定i不变，y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列（个体）。图1 N=7，T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。固定在某一年份上，它是由30个农业总产总值数字组成的截面数据；固定在某一省份上，它是由11年农业总产值数据组成的一个时间序列。面板数

3、据由30个个体组成。共有330个观测值。对于面板数据yi t, i = 1, 2, , N; t = 1, 2, , T来说，如果从横截面上看，每个变量都有观测值，从纵剖面上看，每一期都有观测值，则称此面板数据为平衡面板数据（balanced panel data）。若在面板数据中丢失若干个观测值，则称此面板数据为非平衡面板数据（unbalanced panel data）。注意：EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。例1（file:panel02）：1996-2002年中国东北、华北、华东(Hudng)15个省级地区的居民家庭人均消费（不变价

4、格）和人均收入数据见表1和表2。数据是7年的，每一年都有15个数据，共105组观测值。人均消费和收入(shur)两个面板数据都是平衡面板数据，各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。表1 1999-2002年中国(zhn u)东北、华北、华东15个省级地区的居民家庭人均消费数据（不变价格）地区人均消费1996199719981999200020012002CP-AH（安徽） 3282.466 3646.150 3777.41

5、0 3989.581 4203.555 4495.174 4784.364CP-BJ（北京） 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ（福建） 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB（河北） 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ（黑龙江） 2904.687 3077.989 3289.990 3596.839

6、 3890.580 4159.087 4493.535CP-JL（吉林） 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS（江苏） 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX（江西） 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN（辽宁） 3237.275 3608.060 3918.167 4046.582 4360.420 46

7、54.420 5402.063CP-NMG（内蒙古） 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD（山东） 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH（上海） 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX（山西） 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 478

8、7.561CP-TJ（天津） 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ（浙江） 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210资料来源：中国统计年鉴1997-2003。表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据（不变价格）地区人均收入1996199719981999200020012002IP-AH（安徽） 4106.251 4540.247 4770.470 5178.528 525

9、6.753 5640.597 6093.333IP-BJ（北京） 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38IP-FJ（福建） 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538IP-HB（河北） 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152IP-HLJ（黑龙江） 3518.497 3918.314 4251.494 4747.045 4997.843 5382

10、.808 6143.565IP-JL（吉林） 3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618IP-JS（江苏） 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP-JX（江西） 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311IP-LN（辽宁） 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.08

11、8IP-NMG（内蒙古） 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922IP-SD（山东） 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH（上海） 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX（山西） 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ（天津）

12、 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060IP-ZJ（浙江） 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00资料来源：中国统计年鉴1997-2003。图2 15个省级地区(dq)的人均消费序列（纵剖面）图3 15个省级地区(dq)的人均收入序列（file:4panel02）图4 15个省级地区(dq)的人均消费散点图图5 15个省级地区的人均收入散点图（7个横截面叠加）(每条连线表示同一年度15个地区的消费值) (每条连线表示

13、同一年度15个地区的收入值)用CP表示消费，IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代表一个年度的截面散点图（共7个截面）。相当于观察7个截面散点图的叠加。图6 用15个时间序列(xli)表示的人均消费对收入的

14、面板数据图7 用7个截面(jimin)表示的人均消费对收入的面板数据（7个截面叠加）为了观察得更清楚一些(yxi)，图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出，无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。可见6年之后15个地区的消费和收入都有了相应的提高。图8 北京和内蒙古1996-2002年消费对收入时序图图9 1996和2002年15个地区的消费对收入散点图2面板(min bn)数据的估计。用面板数据建立的模型通常有3种。即混

15、合估计(gj)模型、固定效应模型和随机效应模型。2.1 混合估计(gj)模型。如果从时间上看，不同个体之间不存在显著性差异；从截面上看，不同截面之间也不存在显著性差异，那么就可以直接把面板数据混合在一起用普通最小二乘法（OLS）估计参数。如果从时间和截面看模型截距都不为零，且是一个相同的常数，以二变量模型为例，则建立如下模型， yit = +1 xit +it, i = 1, 2, , N; t = 1, 2, , T (1) 和1不随i，t变化。称模型(1)为混合估计模型。以例1中15个地区1996和2002年数据建立关于消费的混合估计模型，得结果如下：图10 EViwes估计方法：在打开工

16、作文件窗口的基础上，点击主功能菜单中的Objects键，选New Object功能，从而打开New Object（新对象）选择窗。在Type of Object选择区选择Pool（混合数据库），点击OK键，从而打开Pool（混合数据）窗口。在窗口中输入15个地区标识AH（安徽）、BJ（北京）、ZJ（浙江）。工具栏中点击Sheet键，从而打开Series List（列写序列名）窗口，定义变量CP?和IP?，点击OK键，Pool（混合或合并数据库）窗口显示面板数据。在Pool窗口的工具栏中点击Estimate键，打开Pooled Estimation（混合估计）窗口如下图。图11在Dependen

17、t Variable（相依变量）选择窗填入CP?；在Common coefficients（系数相同）选择窗填入IP?；Cross section specific coefficients（截面系数不同）选择窗保持(boch)空白；在Intercept（截距项）选择窗点击(din j)Common；在Weighting（权数(qunsh)）选择窗点击No weighting。点击Pooled Estimation（混合估计）窗口中的OK键。得输出结果如图10。相应表达式是= 129.6313 +0.7587 IPit (2.0) (79.7) R2 = 0.98, SSEr = 482458

18、8, t0.05 (103) = 1.9915个省级地区的人均支出平均占收入的76%。如果从时间和截面上看模型截距都为零，就可以建立不含截距项的（ = 0）的混合估计模型。以二变量模型为例，建立混合估计模型如下， yit = 1 xit +it, i = 1, 2, , N; t = 1, 2, , T (2)对于本例，因为上式中的截距项有显著性（t = 2.0 t0.05 (103) = 1.99），所以建立截距项为零的混合估计模型是不合适的。EViwes估计方法：在Pooled Estimation（混合估计）对话框中Intercept（截距项）选择窗中选None，其余选项同上。2.2 固

19、定效应模型。在面板数据散点图中，如果对于不同的截面或不同的时间序列，模型的截距是不同的，则可以采用在模型中加虚拟变量的方法估计回归参数，称此种模型为固定效应模型（fixed effects regression model）。固定效应模型分为3种类型，即个体固定效应模型（entity fixed effects regression model）、时刻固定效应模型（time fixed effects regression model）和时刻个体固定效应模型（time and entity fixed effects regression model）。下面分别介绍。（1）个体固定效应模型。个

20、体固定效应模型(mxng)就是对于不同的个体有不同截距的模型。如果对于不同的时间序列（个体）截距是不同的，但是对于不同的横截面，模型的截距没有显著性变化，那么就应该建立个体固定效应模型，表示如下， yit = 1 xit +1 W1 + 2 W2 + +N WN +it, t = 1, 2, , T (3)其中(qzhng)Wi =it, i = 1, 2, , N; t = 1, 2, , T，表示(biosh)随机误差项。yit, xit, i = 1, 2, , N; t = 1, 2, , T分别表示被解释变量和解释变量。模型（3）或者表示为 y1t = 1 +1 x1t +1t, i

21、 = 1（对于第1个个体，或时间序列），t = 1, 2, , T y2t = 2 +1 x2t +2 t, i = 2（对于第2个个体，或时间序列），t = 1, 2, , T yN t = N +1 xN t + N t, i = N（对于第N个个体，或时间序列），t = 1, 2, , T写成矩阵形式，y1 = (1 x1)+1 = 1 + x1 +1yN = (1 xN)+N = N + xN +N上式中yi，i，i，xi都是N1阶列向量。为标量。当模型中含有k个解释变量时，为k1阶列向量。进一步写成矩阵形式，= + + 上式中的元素1，0都是T1阶列向量。面板数据模型用OLS方法估

22、计时应满足如下5个假定条件：（1）E(it|xi1, xi2, , xiT, i) = 0。以xi1, xi2, , xiT, i为条件的it的期望等于零。（2）(xi1, xi2, , xiT), ( yi1, yi2, , yiT), i = 1, 2, , N分别来自于同一个联合分布总体，并相互独立。（3）(xit, it)具有非零的有限值4阶矩。（4）解释变量之间不存在完全共线性。（5）Cov(it is|xit,xis, i) = 0, t s。在固定效应模型中随机误差项it在时间上是非自相关的。其中xit代表一个或多个解释变量。对模型（1）进行(jnxng)OLS估计，全部参数估计

23、量都是无偏的和一致的。模型的自由度是N T 1N。当模型(mxng)含有k个解释(jish)变量，且N很大，相对较小时，因为模型中含有k + N个被估参数，一般软件执行OLS运算很困难。在计量经济学软件中是采用一种特殊处理方式进行OLS估计。估计原理是，先用每个变量减其组内均值，把数据中心化（entity-demeaned），然后用变换的数据先估计个体固定效应模型的回归系数（不包括截距项），然后利用组内均值等式计算截距项。这种方法计算起来速度快。具体分3步如下。（1）首先把变量中心化（entity-demeaned）。仍以单解释变量模型（3）为例，则有 = i + 1+, i = 1, 2,

24、 , N (4)其中=，=，=, i = 1, 2, , N。公式(1)、(4)相减得， (yit -) = 1(xit -) + (it -) (5)令(yit -) =，(xit -) =，(it -) =，上式写为 = 1+ (6)用OLS法估计（1）、（6）式中的1，结果是一样的，但是用（6）式估计，可以减少被估参数个数。（2）用OLS法估计回归参数（不包括截距项，即固定效应）。在k个解释变量条件下，把用向量形式表示，则利用中心化数据，按OLS法估计公式计算个体固定效应模型中回归参数估计量的方差协方差矩阵估计式如下，() = ()-1 (7)其中=，是相对于的残差向量。（3）计算回归

25、模型截距项，即固定效应参数i。=- (8)以例1（file:panel02）为例得到的个体固定效应模型估计结果如下：注意：个体固定效应模型的EViwes输出(shch)结果中没有公共截距项。图12EViwes估计(gj)方法：在EViwes的Pooled Estimation对话框中Intercept选项中选(zhng xun)Fixed effects。其余选项同上。注意：（1）EViwes输出结果中没有给出描述个体效应的截距项相应的标准差和t值。不认为截距项是模型中的重要参数。（2）当对个体固定效应模型选择加权估计时，输出结果将给出加权估计和非加权估计两种统计量评价结果。（3）点击View

26、选Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能可以分别得到按个体计算的残差序列表，残差序列图，残差序列的方差协方差矩阵，残差序列的相关系数矩阵。从结果看，北京、上海、浙江是消费函数截距（自发消费）最大的3个地区。相对于混合估计模型来说，是否有必要建立个体固定效应模型可以通过F检验来完成。原假设H0：不同个体的模型截距项相同（建立混合估计模型）。备择假设(jish)H1：不同个体(gt)的模型截距项不同（建立个体固定效应模型）。F统计(tngj)量定义为：F= (9)其中SSEr，SSEu分别表示约束模型（混合估

27、计模型）和非约束模型（个体固定效应模型）的残差平方和。非约束模型比约束模型多了N-1个被估参数。（混合估计模型给出公共截距项。）注意：当模型中含有k个解释变量时，F统计量的分母自由度是NT-N-k。用上例计算，已知SSEr = 4824588，SSEu = 2270386，F= 7.15F0.05(14, 89) = 1.81因为F= 7.15 F0.05(14, 89) = 1.81，所以，拒绝原假设。结论是应该建立个体固定效应模型。（2）随机效应模型在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。也可以通过对误差项的分解来描述这种信息的缺失。 yit = + 1 xit

28、 + it (14)其中误差项在时间上和截面上都是相关的，用3个分量表示如下。it = ui + vt + wit (15)其中ui N(0, u2)表示截面随机误差分量；vt N(0, v2)表示时间随机误差分量；wit N(0, w2)表示混和随机误差分量。同时还假定ui，vt，wit之间互不相关，各自分别不存在截面自相关、时间自相关和混和自相关。上述模型称为随机效应模型。随机效应模型和固定效应模型比较，相当于把固定效应模型中的截距项看成两个随机变量。一个是截面随机误差项（ui），一个是时间随机误差项（vt）。如果这两个随机误差项都服从正态分布，对模型估计时就能够节省自由度，因为此条件下只

29、需要估计两个随机误差项的均值和方差。假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应，而且对均值的离差分别是ui和vt，固定效应模型就变成了随机效应模型。为了容易理解，先假定模型中只存在截面随机误差项ui，不存在时间随机误差分量（vt）， yit = + 1 xit + (wit+ ui) = + 1 xit +it (16)截面随机误差项ui是属于第个个体的随机波动分量，并在整个时间范围(t = 1,2, , T)保持不变。随机误差项ui, wit应满足如下条件：E(ui) =0, E(wit) = 0E(wit 2) = w2, E(ui 2)= u2,E(wit

30、uj) =0, 包括(boku)所有的i, t, j。E(wit wjs) =0, i j, t sE(ui uj) =0, i j因为(yn wi)根据上式有it = wit+ ui所以这种随机效应模型又称为(chn wi)误差分量模型（error component model）。有结论，E(it ) = E(wit +uj) = 0,(16)式，yit = + 1 xit + (wit+ ui)，也可以写成yit = ( + ui) + 1 xit + wit。服从正态分布的截距项的均值效应u被包含在回归函数的常数项中。E(it 2) = E(wit +uj)2 = w2 +u2,E(i

31、t is) = E(wit+ ui)(wis+ ui) = E(wit wis + ui wis + wit ui + ui2) =u2, t s 令i = (i1, i2, iT)则 = E(ii) = =w2 I(TT) +u2 1(T1) 1(T1) 其中I(TT)是(TT)阶单位阵，1(T1)是(T1)阶列向量。因为第i期与j期观测值是相互独立的，所以NT个观测值所对应的随机误差项的方差与协方差矩阵V是V = = = INN 其中INN表示由(T1)阶列向量为元素构成的单位阵，其中每一个元素1或0都是(T1)阶列向量。表示科罗内克积（Kronecker product）。其运算规则是 ANKB =检验个体随机效应的原假设与检验统计量是H0：u2 = 0。（混合估计模

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第十三章面板数据原理(共14页)

文档简介

温馨提示

最新文档

评论

第十三章 面板数据原理(共14页)

文档简介

温馨提示

最新文档

评论

相关文档

第十三章面板数据原理(共14页)