面板数据的常见处理[谷风软件]_第1页
面板数据的常见处理[谷风软件]_第2页
面板数据的常见处理[谷风软件]_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、面板数据的常见处理(2012-03-02 11:16:14)标签:杂谈在写论文时经常碰见一些即是时间序列又是截面的数据,比如分析1999-2010的公司盈余管理影响因素,而影响盈余管理的因素有6个,那么会形成如下图的数据公司1公司2公司100因素1因素6盈余管理程度因素1因素6盈余管理程度因素1因素6盈余管理程度199920002010如上图所示的数据即为面板数据。显然面板数据是三维的,而时间序列数据和截面数据都是二维的,把面板数据当成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多,一般使用Eviews6.0、Stata等。个人推荐使用Stata,因为Stata比较适合处理

2、面板数据,且个性化强。以下以Stata11.0为例来讲解怎么样处理面板数据。由于面板数据的存储结构与我们通常使用的存储结构不太一样,所在统计分析前,最好在excel中整理一下数据,形成如下图所示的数据年份公司名称因素1因素2因素6盈余管理程度1999公司12000公司1公司12010公司11999公司22000公司2公司22010公司2变量定义及输入数据启动Stata11.0,Stata界面有4个组成部分,Review(在左上角)、Variables(左下角)、输出窗口(在右上角)、Command(右下角)。首先定义变量,可以输入命令,也可以通过点击Data-Create new Variab

3、le or change variable。特别注意,这里要定义的变量除了因素1、因素2、因素6、盈余管理影响程度等,还要定义年份和公司名称两个变量,这两个变量的数据类型(Type)最好设置为int(整型),公司名称不要使用中文名称或者字母等,用数字代替。定义好变量之后可以输入数据了。数据可以直接导入(File-Import),也可以手工录入或者复制粘贴(Data-Data Edit(Browse)),手工录入数据和在excel中的操作一样。以上面说的为例,定义变量 year、 company、 factor1、 factor2、 factor3、 factor4、 factor5、 fact

4、or6、 DA。变量company 和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定panel data 的数据存储格式。因此,在使用STATA 估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所用的命令为tsset,命令为:tsset company year输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量Lag _factor1 ,也就是factor1 的一阶滞后,那么我们可以采用如下命令:ge

5、n Lag_factor1=L.factor1统计描述:在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言,我们至少要知道我们的数据中有多少个截面(个体) ,每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成:xtdes命令用于初步了解数据的大体分布状况,我们可以知道数据中含有多少个截面,最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下,我们可以采用该命令来诊断处理后的数据是否为平行数据。Xtsum用来查询对组内、组间、整体计算

6、各个变量的基本统计量(如均值、方差等)。为了方便,以下的举例都只用factor1,factor2两个自变量。xtdes DA factor1 facto2xtsum DA factor1 facto2模型回归。常用的处理面板数据的模型有混合OLS模型、固定效应模型、随机效应模型。各个模型的区别请上网查查。下面说说各个模型的命令:混合OLS模型输入命令:regress DA factor1 facto2固定效应模型输入命令:xtreg DA factor1 factor , fe随机效应模型输入命令:xtreg DA factor1 factor , re模型的选择及检验固定效应模型要检验个体效

7、应的显著性,这可以通过固定效应模型回归结果的最后一行的F统计量看出,F越大越好,可以得出固定效应模型优于混合OLS模型的结论。随机效应模型要检验随机效应是否显著,要输入命令:xttest0如果检验得到的p值为0,则随机效应显著,随机效应模型也优于固定效应模型。至于固定效应模型与随机效应模型选哪一个,则要通过hausman检验来得出。Hausman检验Hausman检验的原假设是固定效应模型优于随机效应模型,如果hausman检验的p值为0,则接受原假设,使用固定效应模型。相关命令:qui xtreg DA factor1 factor2 ,feest store fequi xtreg DA factor1 factor2 ,reest store rehausmanfe检验序列相关固定效应模型使用xtserial命令,随机效应模型使用xttest1命令:qui xtreg DA factor1 factor2 ,rexttest1对于随机效应模型xtserial DA factor1 factor2如果没有xtserial命令即输入上面的命令后弹出no command,则输入finditxtserial.ado可以自动搜索到进行安装。检验截面相关性及截面异方差性由于面板数据都是针对国家或公司的,因此截面间往往会

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论