版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-. z.面板数据分析案例一、翻开数据 利用stata软件翻开数据gurnfeld.dta,得到有关第一步,声明截面变量和时间变量。命令为:tsset pany year或*tset pany year显示:panelvariable: pany (stronglybalanced)time variable: year, 1935to 1954delta: 1 year第二步,进展样本的描述性统计。首先我们看看样本的大体分布情况,命令为:*tdespany: 1, 2, ., 10 n = 10 year: 1935, 1936, ., 1954 T = 20 Delta(year) = 1
2、 year Span(year) = 20 periods (pany*year uniquely identifies each observation)Distribution of T_i: min 5% 25% 50% 75% 95% ma* 20 20 20 20 20 20 20 Freq. Percent Cum. | Pattern -+- 10 100.00 100.00 | 111 -+- 10 100.00 | *接下来,我们列示出样本中主要变量的根本统计量,命令为:*tsum*tsum invest mvalue kstock我们发现统计结果是按照整体、组间和组三个层次
3、进展的。当然,你也可以采用sum命令来得到根本统计量,而且在写论文时,所需列示的结果并不要求像上面则详细,此时sum命令反而更实用。第三歩,面板数据模型回归分析。我们先做固定效应模型,命令为:*treg mvalue invest kstock,fe软件默认为随机效应Fi*ed-effects (within) regression Number of obs = 200Group variable: pany Number of groups = 10R-sq: within = 0.4117 Obs per group: min = 20 between = 0.8078 avg = 20
4、.0 overall = 0.7388 ma* = 20 F(2,188) = 65.78corr(u_i, *b) = 0.6955 Prob F = 0.0000- mvalue | Coef. Std. Err. t P|t| 95% Conf. Interval-+- invest | 2.856166 .3075147 9.29 0.000 2.249543 3.462789 kstock | -.5078673 .1403662 -3.62 0.000 -.7847625 -.2309721 _cons | 804.9802 32.43177 24.82 0.000 741.003
5、3 868.9571-+- sigma_u | 905.81517 sigma_e | 268.73329 rho | .91910377 (fraction of variance due to u_i)-F test that all u_i=0: F(9, 188) = 113.76 Prob F = 0.0000结果的前两行列示了模型的类别(本例中为固定效应模型、截面变量、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度,分为组、组间和样本总体三个层次。第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中分别为65.78和0.0000,说明参数
6、整体上相当显著。第8-11行列示了解释变量的估计系数、标准差、t统计量和相应的P值以及95%的置信区间,这和我们在进展截面回归是得到的结果是一样的。最后四行列示了固定效应模型中个体效应和隨机干扰项的方差估计值分别为sigma_u和sigma_e,二者之间的关系(rho)。最后一行给出了检验固定效应是否显著的F统计量和相应的P值,本例中固定效应非常显著。估计随机效应模型的命令为:*treg mvalue invest kstock,reRandom-effects GLS regression Number of obs = 200Group variable: pany Number of g
7、roups = 10R-sq: within = 0.4115 Obs per group: min = 20 between = 0.8043 avg = 20.0 overall = 0.7371 ma* = 20 Wald chi2(2) = 149.94corr(u_i, *) = 0 (assumed) Prob chi2 = 0.0000- mvalue | Coef. Std. Err. z P|z| 95% Conf. Interval-+- invest | 3.113429 .3076132 10.12 0.000 2.510519 3.71634 kstock | -.5
8、78422 .1424721 -4.06 0.000 -.8576622 -.2991819 _cons | 786.9048 182.1715 4.32 0.000 429.8553 1143.954-+- sigma_u | 546.52144 sigma_e | 268.73329 rho | .80529268 (fraction of variance due to u_i)-第四歩,模型的筛选和检验。这是模型设定过程中最为关键同时也是最难的一歩,主要涉及使用【混合效应】混合OLS模型(最小二乘估计、固定效应模型还是随机效应模型,更进一歩还可能包括序列相关和异方差的检验等问题。在这方
9、面功力的提髙需要大量的实践经历和对理论的深入理解。1检验个体效应的显著性。对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上是否显著。在我们的例子中,上而的检验结果说明固定效应模型优于混合的OLS模型。下面我们说明如何检验随机效应是否显著,命令为:假设模型检验下面没有F检验,就输入*ttest0注明:通过豪斯曼检验,使用固定效应/随机效应Breusch and Pagan Lagrangian multiplier test for random effects mvaluepany,t = *b + upany + epany,t Estimated res
10、ults: | Var sd = sqrt(Var) -+- mvalue | 1727831 1314.47 e | 72217.58 268.7333 u | 298685.7 546.5214 Test: Var(u) = 0 chibar2(01) = 772.32 Prob chibar2 = 0.0000检验得到的P值为0.0000,说明随机效应非常显著。可见,随机效应模型也优于混合OLS模型,至于固定效应模型和随机效应模型何者更佳,则要采用Hausman检验来确定。2) hausman检验。具体步骤为:step1:估计固定效应模型模型,存储估计结果;step2:估计随机效应模型,
11、存储估计结果;step3:进展Hausman检验qui *treg mvalue invest kstock, fe /*step1*/. est store fe. qui *treg mvalue invest kstock, re /*step2*/. est store re. hausman fe /*step3*/这里qui的作用在于不把估计结果输出到屏幕上,est store 的作用在十把估计结果存储到名称为fe的临时性文件中。输出结果为: - Coefficients - | (b) (B) (b-B) sqrt(diag(V_b-V_B) | fe re Difference
12、 S.E.-+- invest | 2.856166 3.113429 -.2572636 . kstock | -.5078673 -.578422 .0705548 .- b = consistent under Ho and Ha; obtained from *treg B = inconsistent under Ha, efficient under Ho; obtained from *treg Test: Ho: difference in coefficients not systematic chi2(2) = (b-B)(V_b-V_B)(-1)(b-B) = 2366.
13、62 Probchi2 = 0.0000 (V_b-V_B is not positive definite)我们注意到输出结果的最后一行提示说固定效应模型和随机效模型的参数估计方差的差是-个非正定矩阵,因此sqrt(diag(V_b-V_B)一项全为缺失值。这是在进展Hausman检验过程中经常遇到的问题,有时我们还会得到负的chi2值。产生这些情况的原因可能有多种,但一个主要的原因是我们的模型设定有问题,导致hausman检验的根本假设得不到满足。这时,我们最好先对模型的设定进展分析,看看是否有遗漏变量的问题,或者*些变量是非平稳的等等。在确定模型的设定没有问题的情况再进展检验,如果仍然拒
14、绝原假设或是出现上面的问题,则我们就认为随机效应模型的根本假设(个体效应与解释变量不相关得不到满足。此时,需要采用工具变量法或是使用固定效应模型。在本例中,如果抛开sqrt(diag(V_b-V_B)一项全为缺失值这一问题,从检验的P值为零这一结果来看,随机效应模型的假设无法满足,所以采用同定效应模型是比拟适宜的。对于采用stata9.0或以上版本的读者而言,使用Hausman命令中新增的sigmaless和sigmamore两个选项可以大大降低上述chi2值为负的情况出现的次数。着下面的例子:hausman fe, sigmaless - Coefficients - | (b) (B) (
15、b-B) sqrt(diag(V_b-V_B) | fe re Difference S.E.-+- invest | 2.856166 3.113429 -.2572636 .0803747 kstock | -.5078673 -.578422 .0705548 .0283398- b = consistent under Ho and Ha; obtained from *treg B = inconsistent under Ha, efficient under Ho; obtained from *treg Test: Ho: difference in coefficients
16、not systematic chi2(2) = (b-B)(V_b-V_B)(-1)(b-B) = 16.58 Probchi2 = 0.0003以及hausman fe, sigmamore - Coefficients - | (b) (B) (b-B) sqrt(diag(V_b-V_B) | fe re Difference S.E.-+- invest | 2.856166 3.113429 -.2572636 .0832959 kstock | -.5078673 -.578422 .0705548 .0293698- b = consistent under Ho and Ha
17、; obtained from *treg B = inconsistent under Ha, efficient under Ho; obtained from *treg Test: Ho: difference in coefficients not systematic chi2(2) = (b-B)(V_b-V_B)(-1)(b-B) = 15.44 Probchi2 = 0.0004时间固定效应如果希望进一歩在上述模型中参加时间效应,则可以采用时间虛拟变量来实现。首先我们需要定义T-1个时间虚拟变量:tab year, gen (dumt)drop dumt1这里,为样本中标示时
18、间的变量,选项gen (dumt)的作用在于产生T个年度虛拟变量,第二条命令的作用在于去掉第一个虛拟变量以防止共线性。假设在固定效应模型中参加时间虚拟变量,则估计命令为:*treg mvalue invest kstock dumt*, fe假设估计随机效应模型,命令为:*treg mvalue invest kstock dumt*, re无论估计哪一个模型,检验时间效应的命令均为:test dumt2 = dumt3 = dumt4 = dumt5 = dumt6 = =0这里我们假设T = 6,所以 有5个时间虚拟变量序列相关和截面相关检验对于固定效应模型,我们可以采用前面介绍的基于差分
19、估计量的检验方法来检验序列相关是否存在,命令为:*tserial mvalue invest kstock 输出结果为:Wooldridge test for autocorrelation in panel dataH0: no first order autocorrelation F( 1, 9) = 5.698 Prob F = 0.0408可见,我们在5%的显著水平上拒绝了不存在序列相关的原假设,考虑到本例中样本的时间跨度为20年,这个结论还是比拟合理的。对于随机效应模型,我们可以采用*ttest1命令进展检验,命令为:qui *treg mvalue invest kstock,
20、re *ttest1 输出结果为:Tests for the error ponent model: mvaluepany,t = *b + upany + vpany,t vpany,t = lambda vpany,(t-1) + epany,t Estimated results: | Var sd = sqrt(Var) -+- mvalue | 1727831 1314.47 e | 72217.58 268.73329 u | 298685.7 546.52144 Tests: Random Effects, Two Sided: ALM(Var(u)=0) = 634.29 Pr
21、chi2(1) = 0.0000 Random Effects, One Sided: ALM(Var(u)=0) = 25.19 PrN(0,1) = 0.0000 Serial Correlation: ALM(lambda=0) = 13.91 Prchi2(1) = 0.0002 Joint Test: LM(Var(u)=0,lambda=0) = 786.24 Prchi2(2) = 0.0000该命令是针对随机效应模型的,汇报了7个统计量,用于检验随机效应(单尾和双尾)、序列相关以及二者的联合显著性。检验结果说明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著
22、。许多面板数据都是针对国家或公司的,因此截面间往往会存在相关性,我们可以利用*ttest2命令来检验固定效应模型中截面间的相关性是否显著。对于该命令的理论解释局部请参考Greene(2000,第601页),检验的命令为:qui *treg mvalue invest kstock, fe *ttest2 输出结果为:Correlation matri* of residuals: _e1 _e2 _e3 _e4 _e5 _e6 _e7 _e8 _e9 _e10 _e1 1.0000 _e2 0.3746 1.0000 _e3 0.6064 0.4337 1.0000 _e4 0.8056 0.1370 0.5072 1.0000 _e5 -0.1700 -0.5253 0.1597 -0.0227 1.0000 _e6 -0.0799 -0.4317 0.3103 0.0086 0.9428 1.0000 _e7 0.2392 -0.4190 0.3872 0.2967 0.5548 0.6132 1.0000 _e8 0.2090 -0.1227 0.6950 0.3424 0.7438 0.7888 0.5264 1.0000 _e9 0.1894 -0.2176 0.5794 0.2217 0.72
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 在药店工作实习报告(7篇)
- 关于升学宴家长讲话稿(9篇)
- 油田工程建设系统人员测试复习测试附答案
- 高考数学复习解答题提高第一轮专题复习专题07解三角形(面积问题(含定值最值范围问题))(典型题型归类训练)(学生版+解析)
- 语文统编版(2024)一年级上册汉语拼音-③b p m f 教案
- 语文统编版(2024)一年级上册语文园地二 教案
- 湖南英语高考语法
- 第2章 药物效应动力学课件
- 学校突发公共卫生事件防控专题讲座课件
- 会计数据分析 课件 第6章 审计数据分析
- 2025届高考语文复习:补写语句+课件
- 苏教版(2024新版)一年级上册科学全册教案教学设计
- LS/T 1234-2023植物油储存品质判定规则
- 2024年西安市政道桥建设集团有限公司招聘笔试参考题库含答案解析
- 小学英语 国际音标 练习及答案
- HP-DL380-Gen10-服务器用户手册
- 《安徒生童话》读书分享名著导读ppt
- 重点工作督办单.doc
- 中联新版泵车说明书
- 公路平面交叉工程专项施工方案(优秀)
- 写给女友的1000字情书
评论
0/150
提交评论