版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十三章
面板数据分析
主要内容面板数据的基本操作固定效应与随机效应模型长面板模型面板工具变量法动态面板模型面板数据的离散选择模型面板数据的计数模型随机效应tobit模型实验13-1:面板数据的基本操作实验基本原理在利用stata对面板数据进行分析之前,我们通常需要对截面变量和时间变量进行定义。只有定义之后,我们才可以使用相关的面板数据分析命令以及各种时间序列算子。另外,在对面板数据进行建模之前,我们有时会希望对数据有一个直观的了解,像观察面板数据各截面的最大值、最小值等描述统计量,或者是了解数据的结构和分布等。对于这些,我们都可以通过stata的命令来实现。实验内容及数据来源本书附带光盘data文件夹下的“wage.dta”工作文件给出了对4711名妇女的调查数据,调查的时间跨度为1968年到1988年。该文件的主要变量包括:idcode=编号,year=调查时间,hours=平均每周的工作时间,msp=是否已婚(1代表已婚且随配偶居住,0代表其他情况),ln_wage=小时工资的自然对数,grade=受教育年数,age=年龄,ttl_exp=总工作年数,tenure=现有岗位的任职时间,race=种族(1表示白人,2表示黑人,3表示其他人种),not_smsa=是否居住在SMSA区(1表示不住在SMSA区-StandardMetropolitanStatisticalArea),south=是否生活在南方(1表示住在南方),union=是否为工会成员(1表示是工会成员)。利用这些数据,我们来讲解面板数据的定义、描述统计量的获得、数据结构的描述、分布频率和转移概率的获得以及各个截面时间趋势图的绘制等操作。实验操作指导1面板数据的设定与时间序列分析类似,在对面板数据进行分析之前,我们要先对面板数据进行设定。只有定义过面板数据之后,才能使用相关的面板数据命令。设定面板数据的命令有三种:①
xtsetpanelvar②xtsetpanelvartimevar[,tsoptions]③tssetpanelvartimevar[,tsoptions]其中,xtset是“定义面板数据”的基本命令,panelvar代表截面变量的名称,timevar代表时间变量的名称,tsoptions代表其他选项。tsset作为定义时间序列的基本命令,也可以用来定义面板数据,如③所示。此外,可用的tsoptions选项与十二章中时间序列变量的设定相同,详见表12.2和表12.3。在第一种格式当中,我们只设定了截面变量,这样,每一截面中,各个观测值的顺序是无关紧要的。例如,我们有对多个家庭的调查数据,每个家庭是一个截面,而家庭的各个成员是截面内的观测值,这种情况下,我们就不必设定时间变量。第二种和第三种定义面板数据的格式是等价的。这两种情况下,每一截面中的观测值会被按照时间变量进行排序。这时,我们还可以使用stata的各种时间序列算子,像滞后算子“L.”、领先算子“F.”等。需要注意的是,截面变量和时间变量都必须为数值型,还要是整数。如果某个变量是字符串型,我们可以通过如下命令将其转换为数值型:encodevarname,gen(newvar)其中,命令encode表示生成带标签的数值变量,varname是原字符串变量的名称,生成的新变量命名为newvar,其类型为数值型,且每个数值以原变量varname的值为标签。对于数据文件“wage.dta”,我们定义idcode为截面变量,year为时间变量。输入命令:xtsetidcodeyear2获得面板数据的描述统计量获得面板数据描述统计量的基本命令为:xtsum[varlist][if]其中,xtsum是“计算面板数据描述统计量”的基本命令,varlist代表变量的名称,if代表条件语句。xtsum命令实际是summarize命令的扩展,该命令还会给出组内和组间的描述统计量。我们要获得“wage.dta”中变量hours的描述统计量,可输入命令:xtsumhours3显示面板数据的结构为了直观地了解面板数据的分布,我们可以对其结构进行描述。命令为:xtdescribe[if][in][,options]其中,xtdescribe是“显示面板数据结构”的基本命令,if代表条件语句,in代表范围语句,options为其他选项。可用的选项包括patterns(#)和width(#)。patterns(#)用于指定显示结构的种数,默认为patterns(9);而width(#)用于指定每一行的显示宽度,默认为width(100)。对于“wage.dta”的数据,我们要知道其数据分布情况,可输入命令:xtdescribe4显示面板数据的分布频率获得面板数据分布频率的基本命令为:xttabvarname[if]其中,xttab是“计算面板数据分布频率”的基本命令,varname代表变量的名称,if代表条件语句。xttab命令实际是tabulate命令的扩展,该命令还会给出组内和组间的分布频率。我们要获得“wage.dta”中变量msp的分布频率,可输入命令:xttabmsp5显示面板数据的转移概率获得面板数据转移概率的基本命令为:xttransvarname[if][,freq]其中,xttrans是“计算面板数据转移概率”的基本命令,varname代表变量的名称,if代表条件语句,选项freq表示同时显示频数。我们要获得“wage.dta”中变量msp的转移概率,可输入命令:xttransmsp6面板数据绘图对面板数据的各个截面分别绘制时间序列图的基本命令为:xtlinevarlist[if][in][,panel_options]其中,xtline是“面板数据绘图”的基本命令,varlist代表变量的名称,if代表条件语句,in代表范围语句,panel_options代表其他选项。选项主要包括i(varname_i)、t(varname_t)和overlay。默认情况下,xtline会对各个截面分别作图,y轴变量为varlist,x轴变量为时间变量。选项i()和t()可以指定新的截面变量和时间变量来作图,且varname_i可以为字符串型,varname_t的值也可以不是整数。但要求选项i()和t()同时设定。此外,如果设定选项overlay,各个截面会被绘制到一幅图中。对于截面数比较少的面板数据,进行作图观察比较会很直观。但当截面数非常多时,作图观察的意义就不大了。考虑到工作文件“wage.dta”有4711个截面,我们这里用变量hours的前4个截面作图进行说明。输入命令:xtlinehoursin1/50因为前50个观测值构成了前4个截面,这样,通过范围语句“in1/50”我们可以得到前4个截面中变量hours的时间趋势图。7长宽面板数据的转换实验13-2:固定效应与随机效应模型实验基本原理实验内容及数据来源本实验中,我们继续使用实验13-1所用的数据文件,即本书附带光盘data文件夹下的“wage.dta”工作文件。利用该面板数据,我们要分析受教育年数、年龄、工作年数、现有岗位的任职时间、是否是黑人、是否居住在SMSA区、是否生活在南方等因素对工资收入的影响。这样,利用“wage.dta”的数据,我们会讲解组间效应模型的回归、固定效应和随机效应模型的拟合、Hausman检验以及模型预测等内容。实验操作指导1组间效应模型对于“wage.dta”的数据,我们要分析受教育年数、年龄、工作年数、现有岗位的任职时间、是否是黑人、是否居住在SMSA区、是否生活在南方等因素对工资收入的影响。考虑到年龄、工作年数、现有岗位任职时间等因素对工资收入的影响可能不是线性的,我们先生成这三个变量的平方项,并在模型中包括这三个变量的水平项和平方项。输入命令:genage2=age*agegenexp2=ttl_exp*ttl_expgentenure2=tenure*tenure我们生成变量age、ttl_exp和tenure的平方项,并分别将其命名为age2、exp2和tenure2。此外,我们需要由变量race生成一个虚拟变量,来表示是否是黑人。输入命令:genbyteblack=race==2这里,我们生成新变量black,并令其类型为type。注意,race后为两个等号。该命令的含义为,对race是2的(黑人)观测值,我们令black的值为1;对race取其他值的观测值,我们令black的值为0。也就是说新生成的变量black为虚拟变量,1表示黑人,0表示其他人种。进行完这些变换之后,下面,我们进行组间回归。输入命令:xtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,be这里,被解释变量为ln_w,解释变量包括grade、age、age2、ttl_exp、exp2、tenure、tenure2、black、not_smsa和south,选项be表示进行组间估计。2固定效应模型获取固定效应估计量的命令与组间效应模型类似,为:xtregdepvar[indepvars][if][in][weight],fe[FE_options]其中,xtreg代表“拟合面板数据模型”的基本命令语句,选项fe表明要获取固定效应估计量。FE_options代表获取固定效应估计量的其他选项,主要有level(#)和vce(type),标准差的类型可以是conventional、robust、clusterclustvar、bootstrap和
jackknife。这里,设定稳健标准差vce(robust)与聚类稳健的标准差vce(clusterpanelvar)效果是一样的。其中,panelvar代表截面变量。对于“wage.dta”的数据,我们下面进行固定效应回归。输入命令:xtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,fe这里,选项fe表明是进行固定效应回归分析。3随机效应模型利用“wage.dta”的数据,我们进行随机效应的回归分析。输入命令:xtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,re其中,选项re表明进行随机效应回归分析。因为这是默认选项,所以可以省略。对于随机效应模型,我们通常使用可行的广义最小二乘(FGLS)来进行回归。但如果假定随机扰动项服从正态分布,我们还可以用极大似然估计法(MLE)进行估计。用MLE拟合随机效应模型的命令为:xtregdepvar[indepvars][if][in][weight],mle[MLE_options]其中,xtreg代表“拟合面板数据模型”的基本命令语句,选项mle表明用极大似然估计法来估计随机效应模型。MLE_options代表其他选项,主要有noconstant(设定没有常数项)、level(#)和vce(type)。其中,标准差的类型包括oim、bootstrap和jackknife。对于前面的随机效应模型,我们使用MLE重新进行回归。输入命令:xtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,mle其中,选项mle表明用极大似然估计法进行随机效应回归分析。4Hausman检验对于前面拟合的模型,我们要判断究竟应选择固定效应模型还是随机效应模型,可以输入命令:quietlyxtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,reestimatesstorerequietlyxtregln_wagegradeageage2ttl_expexp2tenuretenure2blacknot_smsasouth,feestimatesstorefehausmanfere其中,第一步是进行随机效应模型的拟合,quietly表明不显示回归结果。第二步中,“estimatesstore”表明保存回归结果,这里,我们将结果命名为re。第三步是拟合固定效应模型,第四步将固定效应结果保存为fe,最后一步是进行Hausman检验。需要注意的是,Hausman检验要把固定效应的结果放在前面。5面板模型的预测实验13-3:长面板模型实验基本原理实验内容及数据来源本书附带光盘data文件夹下的“grunfeld.dta”工作文件给出了某10家公司1935到1954年这20年间的投资数据。变量主要包括:company=公司,year=年,invest=投资额,mvalue=上一年的公司市值,kstock=上一年的公司资本存量。利用这些数据,我们分析公司上一年的市值和资本存量对其投资额的影响。因为数据为长面板,我们要考虑可能存在的组间和组内异方差以及自相关等情况。这样,利用“grunfeld.dta”的数据,我们来讲解面板修正的标准差估计、可行的广义最小二乘估计以及随机系数模型的操作以及相关预测。实验操作指导1面板修正的标准差估计面板修正的标准差估计(PCSE)的基本命令为:xtpcsedepvar[indepvars][if][in][weight][,options]其中,xtpcse代表“面板修正的标准差估计”的基本命令语句,depvar代表被解释变量的名称,indepvar代表解释变量的名称,if代表条件语句,in代表范围语句,weight代表权重语句,options代表其他选项。表13.9显示了主要的options选项。对于“grunfeld.dta”的数据,我们来分析前一年的公司市值和资本存量对其投资的影响。输入命令:xtpcseinvestmvaluekstock,correlation(ar1)这里,被解释变量为invest,解释变量为mvalue和kstock。选项correlation(ar1)意味着,我们设定每个截面内的扰动项服从相同的一阶自回归过程。此外,因为我们没有设定选项hetonly和independent,就意味着我们假定模型存在组间异方差,且不同个体的扰动项相关。与命令
xtpcse类似,对于命令xtgls,如果模型中没有个体虚拟变量,则为随机效应模型;如果加上个体虚拟变量,则为固定效应模型。对于“grunfeld.dta”的数据,我们用可行的广义最小二乘法来重新进行回归。输入命令:xtglsinvestmvaluekstock,panels(correlated)corr(ar1)这里,选项panels(correlated)意味着,我们假定模型存在组间异方差,且不同个体的扰动项相关。选项correlation(ar1)则表明,我们设定每个截面内的扰动项服从相同的一阶自回归过程。3组间异方差和组内自相关的检验我们前面在进行xtpcse和xtgls的回归时,对随机扰动项的组间异方差和组内自相关情况做了随意的假定。事实上,我们有必要在回归之前进行检验,看究竟是否存在异方差和自相关。要判断不同个体的扰动项方差是否相等,我们可以使用似然比检验。其基本原理为,如果“同方差”的约束使似然函数值降低很多,则倾向于拒绝“同方差”的原假设。对于前面的回归,我们可以通过如下操作实现:xtglsinvestmvaluekstock,iglspanel(het)estimatesstoreheteroxtglsinvestmvaluekstock,iglsestimatesstorehomolocaldf=e(N_g)-1lrtestheterohomo,df(`df')其中,第一步进行迭代的GLS回归,并允许扰动项存在异方差。之所以使用迭代的GLS回归(选项igls),是因为在“面板异方差”的情况下,迭代GLS估计法等价于最大似然估计法。第二步将异方差条件下的估计结果储存为hetero。第三步在同方差条件下进行FGLS的估计,第四步则将同方差条件下的估计结果储存为homo。第五步计算自由度,即约束条件个数,其中e(N_g)为个体个数。最后一步进行似然比检验,注意选项中引号的写法。此外,我们也可以从网上下载一个命令来检验面板异方差。在可以上网的情况下,输入命令:sscinstallxttest3我们就可以安装命令“xttest3”。该命令可在命令xtreg,fe或xtgls之后使用。这样,如果我们要对前面的模型进行面板异方差检验,可以输入命令:quietlyxtglsinvestmvaluekstockxttest3其中,第一步为进行FGLS回归,且quietly命令要求不显示该回归的结果。第二步则是进行面板异方差的检验。要检验面板模型是否存在组内自相关,我们也可以下载一个命令。输入命令:netinstallst0039我们就可以下载并安装“xtserial”命令。之后,输入以下命令来进行组内自相关的检验:xtserialinvestmvaluekstock要检验面板模型的各个截面是否存在自相关,我们可以下载并安装“xttest2”命令来实现。输入命令:finditxttest2会出现该命令的资源,我们就可以下载安装。该命令是在命令xtreg,fe或xtgls之后使用。这样,如果我们要对前面的模型进行面板间相关性检验,可以输入命令:quietlyxtglsinvestmvaluekstockxttest2其中,第一步为进行FGLS回归,且不显示该回归的结果。第二步则是进行面板间相关性的检验。4模型的预测在进行xtpcse或xtgls的回归之后,对模型进行预测的命令为:predict[type]newvar[if][in][,xbstdp]其中,predict代表“预测”的基本命令,type代表新变量的类型,newvar代表生成的新变量的名称,if代表条件语句,in代表范围语句。选项xb为默认选项,计算的是线性预测,选项stdp计算的是线性预测的标准差。例如,我们要对被解释变量进行线性预测,可输入命令:predictpv,xb这里,我们将预测的新变量命名为pv。5随机系数模型对于“grunfeld.dta”的数据,我们怀疑系数可能会随时间而变。这样,我们考虑用随机系数模型重新进行拟合。输入命令:xtrcinvestmvaluekstock在进行随机系数模型的回归之后,进行预测的基本命令为:predict[type]newvar[if][in][,statisticnooffset]其中,predict代表“预测”的基本命令,type代表新变量的类型,newvar代表生成的新变量的名称,if代表条件语句,in代表范围语句。statistic代表预测的统计量,选项nooffset只有在拟合方程式设定了offset(varname)时才相关,它使得预测时计算的是而非。此外,统计量statistic包括默认的xb,用于计算线性预测值;stdp,用于计算线性预测的标准差;group(#),基于第#组的拟合方程进行线性预测。实验13-4:面板工具变量法实验基本原理实验内容及数据来源本书附带光盘data文件夹下的“labordemand.dta”工作文件包括了对英国140家公司1976年到1984年的调查数据。主要变量包括:id=公司编号,year=年,n=公司雇佣劳动数量的自然对数,w=实际工资的自然对数,k=资本存量的自然对数,ys=行业产出的自然对数。利用这些数据,我们建立一个劳动需求模型,分析以前年度的劳动需求、实际工资、资本存量、行业产出等因素对当年劳动需求的影响。考虑到存在内生变量问题,我们要使用工具变量法。这样,利用“labordemand.dta”的数据,我们来讲解面板工具变量法的估计以及相关的预测。实验操作指导1面板工具变量法的估计这样,我们可以输入以下命令来进行这个回归:xtivregnL2.nL(0/1).(wkys)(L.n=L3.n),fd其中,xtivreg是面板工具变量法的基本命令,被解释变量为n,解释变量包括n的2阶滞后值(L2.n),以及w、k和ys的当期值和一期滞后值。此外,n的一阶滞后值也是解释变量,因为是内生变量,我们用n的三阶滞后值(L3.n)作为其工具变量。选项fd表示用一阶差分法进行估计。这里,命令“L(0/1)”中,L为滞后算子;所以,“L(0/1)”表示当期值和滞后一期值。2面板工具变量模型的预测实验13-5:动态面板模型实验基本原理实验内容及数据来源仍然使用实验13-4所用的数据,即本书附带光盘data文件夹下的“labordemand.dta”工作文件。该文件包括了对英国140家公司1976年到1984年的调查数据。主要变量包括:id=公司编号,year=年,n=公司雇佣劳动数量的自然对数,w=实际工资的自然对数,k=资本存量的自然对数,ys=行业产出的自然对数。利用这些数据,我们建立一个动态的劳动需求模型,分析以前年度的劳动需求、实际工资、资本存量、行业产出等因素对当年劳动需求的影响。我们将讲解如何用差分GMM和系统GMM拟合动态面板模型,以及如何对模型的假设进行检验和如何进行预测等内容。实验操作指导1用差分GMM估计动态面板用差分GMM估计动态面板的基本命令为:xtabonddepvar[indepvars][if][in][,options]其中,xtabond代表“用差分GMM估计动态面板”的基本命令语句,depvar代表被解释变量的名称,indepvars代表满足严格外生性的解释变量的名称,if代表条件语句,in代表范围语句,options代表其他选项。表13.15显示了主要的options选项。对于“labordemand.dta”的数据,我们考虑在模型的解释变量中包括劳动需求的两期滞后值,实际工资、资本存量、行业产出的当期值和一期滞后值。命令为:xtabondnL(0/1).(wkys),lags(2)vce(robust)其中,xtabond是差分GMM的基本命令,被解释变量为n,解释变量包括w、k和ys的当期值和一期滞后值,选项lags(2)表明在模型中包括被解释变量的两期滞后期,选项vce(robust)表示使用稳健的标准差。此外,需要注意的一点是,如果我们在之前的差分GMM的估计中使用一步系统估计量(默认情况),则必须要设定选项vce(robust)才可以进行残差的序列相关检验。对于我们前面回归的模型,我们猜测实际工资和资本存量可能不是外生变量,而仅仅是前定变量。也就是说,扰动项的波动可能对后面时期的实际工资和资本存量产生影响。对于这种情形,我们可以通过如下命令进行拟合:xtabondnL(0/1).ys,lags(2)pre(w,lag(1,3))pre(k,lag(1,3))vce(robust)其中,n为被解释变量,ys和其滞后一期值为解释变量,且假定ys为外生变量。选项pre(w,lag(1,3))表明,设定变量w为前定变量;且其中的选项lag(1,3)意味着,将w的一期滞后值也包括到解释变量中去,并设定用作工具变量的前定变量的最大滞后期为3。对选项pre(k,lag(1,3))的解释与之类似。此外,选项vce(robust)表明,设定标准差为异方差稳健的标准差。这里需要说明一点,之所以设定用作工具变量的前定变量的最大滞后期,是因为工具变量过多时(尤其是在样本较小的情况下),估计会变得很不精确。2用系统GMM估计动态面板用系统GMM估计动态面板的基本命令为:xtdpdsysdepvar[indepvars][if][in][,options]其中,xtdpdsys代表“用系统GMM估计动态面板”的基本命令语句,depvar代表被解释变量的名称,indepvars代表解释变量的名称,if代表条件语句,in代表范围语句,options代表其他选项。可用的选项包括noconstant、lags(#)、maxldep(#)、maxlags(#)、twostep、pre(varlist[…])、en
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- tob企业品牌年度规划
- 制作和管理工作日志一
- 化妆品公司培训方案
- 医疗废物的处置原则
- 5月份规划报告
- 中小学安全知识培训
- 学期末汇报培训
- 外科相关疾病护理科普
- 315幼儿园主题活动
- 数学学案:课堂导学ax+b≤cax+b≥c型不等式的解法
- 特应性皮炎积分指数AD 病情严重程度积分法(SCORAD)
- GB/T 19520.1-2007电子设备机械结构482.6mm(19in)系列机械结构尺寸第1部分:面板和机架
- GB/T 16762-2020一般用途钢丝绳吊索特性和技术条件
- 2023年北京市昌平区广播电视台(融媒体中心)招聘笔试题库及答案解析
- 主要耗能设备管理台账
- 2018年木地板公司组织架构及部门职能
- 露天矿山开采课件
- 语篇的衔接和连贯课件
- 蒋介石-教学讲解课件
- 《中级财务会计(二)》作业册形成性考核册国家开放大学电大
- 儿化音变课件
评论
0/150
提交评论