stata命令大全全_第1页
stata命令大全全_第2页
stata命令大全全_第3页
stata命令大全全_第4页
stata命令大全全_第5页
免费预览已结束,剩余27页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、*面板数据计量分析与软件实现*说明:以下do文件相当一部分内容来自于中山大学连玉君STAT徽程,感谢他的贡献本人做了一定的修改与筛选。* 面板数据模型* 1.静态面板模型:FE和RE* 2.模型选择:FEvsPOLS,REvsPOLS,FEvsRE(pols混合最小二乘估计)* 3.异方差、序列相关和截面相关检验* 4.动态面板模型(DID-GMM,SYS-GMM* 5.面板随机前沿模型* 6.面板协整分析(FMOLS,DOLS*说明:1-5均用STAT就件实现,6用GAUSS件实现。*生产效率分析(尤其指TFP):数据包络分析(DEA与随机前沿分析(SFA*说明:DE和DEAP2.依件实现,

2、SF/ttFrontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应(SpilloversEffect)、工业行业效率状况等。*空间计量分析:SLMK型与SEM1型* 说明:STATArMatlab结合使用。常应用于空间溢出效应(R&D、财政分权、地方政府公共行为等。* 一、常用的数据处理与作图* 指定面板格式xtsetidyear(id为截面名称,year为时间名称)xtdes/添加标签或更改变量名labelvarh"人力资本"renamehhum数据特征*/xtsumlogyh/*

3、数据统计特征*/sumlogyh/*数据统计特征*/* 排序sortidyear/*是以STATAf板数据格式出现*/sortyearid/*是以DEA&式出现*/* 删除个别年份或省份dropifyear<1992dropifid=2/*注意用=*/* 如何得到连续year或id编号(当完成上述操作时,year或id就不连续,为形成panel格式,需要用egen命令)egenyear_new=group(year)xtsetidyear_new* *保留变量或保留观测值keepinv/*删除变量*/* *日keepifyear=2000* *排序sortidyear/*是以ST

4、ATA3板数据格式出现sortyearid/*是以DEA&式出现* *长数据和宽数据的转换* 长>>>宽数据reshapewidelogy,i(id)j(year)* 宽>>><数据reshapelogy,i(id)j(year)* *追加数据(用于面板数据和时间序列)xtsetidyear*或者xtdestsappend,add(5)/表示在每个省份再追加5年,用于面板数据/tsset*或者tsdes.tsappend,add(8)/表示追加8年,用于时间序列/*方差分解,比如三个变量Y,X,Z都是面板格式的数据,且满足Y=X+Z求方差var

5、(Y),协方差Cov(X,Y)和Cov(Z,Y)bysortyear:corrYXZ,cov* *生产虚拟变量* 生成年份虚拟变量tabyear,gen(yr)* 生成省份虚拟变量tabid,gen(dum)* *生成滞后项和差分项xtsetidyeargenylag=l.y/二、静态面板模型产生一阶滞后项),同样可产生二阶滞后项*/genylag2=L2.ygendy=D.y/*产生差分项*/* 求出各省2000年以前的openinv的平均增长率collapse(mean)openinvifyear<2000,by(id)变量排序,当变量太多,按规律排列。可用命令aorder或者ord

6、erfdiopeninsti*简介* 面板数据的结构(兼具截面资料和时间序列资料的特征)useproduct.dta,clearbrowsextsetidyearxtdes* 固定效应模型* 实质上就是在传统的线性回归模型中加入N-1个虚拟变量,* 使得每个截面都有自己的截距项,* 截距项的不同反映了个体的某些不随时间改变的特征* 例如:lny=a_i+b1按不同个体画散点图,sobeautiful!*graphtwowayscatterlogyhifid=1|scatterlogyhifid=2,msymbol(Sh)|scatterlogyhifid=3,msymbol(T)|scatte

7、rlogyhifid=4,msymbol(d)|,legend(position(11)ring(0)label(1"北京”)lnK+b2*lnL+e_it* 考虑中国29个省份的C-Dft产函数* *H图* 散点图+线性拟合直线twoway(scatterlogyh)(lfitlogyh)* 散点图+二次拟合曲线twoway(scatterlogyh)(qfitlogyh)* 散点图+线性拟合直线+置信区间twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)* 按不同个体画出散点图和拟合线,可以以做出fevsre的初判断*twoway(scatt

8、erlogyhifid<4)(lfitlogyhifid<4)(lfitlogyhifid=1)(lfitlogyhifid=2)(lfitlogyhifid=3)label(2"天津")label(3"河北")label(4"山西")* *每个省份logy与h的散点图,并将各个图形合并xlabel(,format(%3.0f)twowayscatterlogyh,by(id)ylabel(,format(%3.0f)* 每个个体的时间趋势图stata的估计方法解析*目的:如果截面的个数非常多,那么采用虚拟变量的方式运算量

9、过大*因此,要寻求合理的方式去除掉个体效应*因为,我们关注的是x的系数,而非每个截面的截距项*处理方法:*y_it=u_i+x_it*b+e_it(1)*ym_i=u_i+xm_i*b+em_i(2)组内平均*ym=um+xm*b+em(3)样本平均*(1)-(2),可得:*(y_it-ym_i)=(x_it-xm_i)*b+(e_it-em_i)(4)/*withinestimator*/*(4)+(3),可得:*(y_it-ym_i+ym)=um+(x_it-xm_i+xm)*b+(e_it-em_i+em)*可重乐表示为:*Y_it=a_0+X_it*b+E_it*对该模型执行OLSM计

10、,即可得到b的无偏估计量xtlinehifid<11,overlaylegend(on)*一个例子:中国29个省份的C-D生产函数的估计tabid,gen(dum)list*回归分析reglogylogklogldum*,eststorem_olsxtreglogylogklogl,feeststorem_feesttablem_olsm_fe,b(%6.3f)star(0.10.050.01)*Wald检验testlogk=logl=0testlogk=logl*stata后台操作,揭开fe估计的神秘面纱!egeny_meanw=mean(logy),by(id)/解读xtreg,fe

11、的估计结果xtreglogyhinvgovopen,fe*-RA2*y_it=a_0+x_it*b_o+e_it(1)pooledOLS*y_it=u_i+x_it*b_w+e_it(2)withinestimator*ym_i=a_0+xm_i*b_b+em_i(3)betweenestimator*->R-sq:within模型(2)对应的R2,是一个真正意义上的R2*->R-sq:betweencorrxm_i*b_w,ym_iA2*->R-sq:overallcorrx_it*b_w,y_itA2*-F(4,373)=855.93检验除常数项外其他解释变量的联合显著性

12、个体内部平均*/egeny_mean=mean(logy)/*样本平均*/egenk_meanw=mean(logk),by(id)egenk_mean=mean(logk)egenl_meanw=mean(logl),by(id)egenl_mean=mean(logl)gendyw=logy-y_meanwgendkw=logk-k_meanwgendlw=logl-l_meanwregdywdkwdlw,noconseststorem_statagendy=logy-y_meanw+y_meangendk=logk-k_meanw+k_meangendl=logl-l_meanw+l_m

13、eanregdydkdleststorem_stataesttablem_*,b(%6.3f)star(0.10.050.01)*-corr(u_i,Xb)=-0.2347*-sigma_u,sigma_e,rho* rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)* 个体效应是否显著?* F(28,373)=338.86H0:al=a2=a3=a4=a29* Prob>F=0.0000表明,固定效应高度显著* -如何得到调整后的R2,即adj-R2?ereturnlistregl

14、ogyhinvgovopendum* -拟合值和残差* y_it=u_i+x_it*b+e_it* predictnewvar,option/*xbxb,fittedvalues;thedefaultstdpcalculatestandarderrorofthefittedvaluesueu_i+e_it,thecombinedresidualxbuxb+u_i,predictionincludingeffectuu_i,thefixed-orrandom-errorcomponentee_it,theoverallerrorcomponent*/xtreglogylogklogl,fepre

15、dicty_hatpredicta,upredictres,epredictcres,uegenares=a+reslistarescresin1/10随机效应模型y_it=x_itWaldchi2(2)=10962.50Prob>chi2=0.0000b+(a_i+u_it)=x_it*b+v_it基本思想:将疝机干扰项分成两种一种是不随时间改变的,即个体效应a_i另一种是随时间改变的,即通常意义上的不扰项u_it估计方法:FGLSVar(v_it)=sigma_aA2+sigma_uA2Cov(v_it,v_is)=sigma_aA2Cov(v_it,v_js)=0利用PooledO

16、LS,WithinEstimator,BetweenEstimator可以估计出sigma_aA2和sigma_uA2,进而采用GLSEFGLSRe估计量是Fe估注量和Befe计量的加权平均yr_it=y_it-theta*ym_ixr_it=x_it-theta*xm_itheta=1-sigma_u/sqrt(T*sigma_aA2+sigma_uA2)解读xtreg,re的估计结果useproduct.dta,clearxtreglogylogklogl,re*-R2- ->R-sq:withincorr(x_it-xm_i)*b_r,y_it-ym_iA2- ->R-sq:

17、betweencorrxm_i*b_r,ym_iA2- ->R-sq:overallcorrx_it*b_r,y_itA2上述R绵不是真正意交上而R2,因为Re®型采用的是GL3&计。*rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)*corr(u_i,X)=0(assumed)这血机效应模型的一个最重要,也限制该模型应用的一个重要假设然而,采用固定效应模型,我们可以粗略估计出corr(u_i,X)xtregmarketinveststock,fe*时间效应、模型

18、的筛选和常见问题* 目录* 7.2.1时间效应(双向固定(随机)效应模型)* 7.2.2模型的筛选* 7.2.3面板数据常见问题* 7.2.4面板数据的转换* 时间效应* 单向固定效应模型* y_it=u_i+x_it*b+e_it* 一双向而定效应极型一* y_it=u_i+f_t+x_it*b+e_itquitabyear,gen(yr)dropyr1xtreglogylogkloglyr*,fe* 随机效应模型中的时间效应xtreglogylogkloglyr*,fe* 模型的筛选* 固定效应模型还是PooledOLS?xtreglogylogkloglyr*,fe/*Wald检验*/q

19、uitabid,gen(dum)/*LR检验*/reglogylogklogl/Hausman检验值为负怎么办?*通常是因为REi型的基本假设Corr(x,u_i)=0无法得到满足检验过程中两个模型的方差-协方差矩阵都采用Fe真型的POLS*/eststorem_olsreglogylogklogldum*,noconseststorem_felrtestm_olsm_feesttablem_*,b(%6.3f)star(0.10.050.01)* REvsPooledOLS?* H0:Var(u)=0*方法一:B-P检验xtreglogylogklogl,rexttest0*FEvsRE?*

20、y_it=u_i+x_it*b+e_it*-Hausman检验-和Re都是一致的,但ReM有效仍然有效,但Rei有偏的* 基本思想:如果Corr(u_i,x_it)=0,Fe* 如果Corr(u_i,x_it)!=0,Fe* 基本步骤* *情形1:huasmarfc正数xtreglogylogklogl,feeststorem_fextreglogylogklogl,reeststorem_rehausmanm_fem_re*情形2:quixtreglogyhinvgovopen,feeststorefequixtreglogyhinvgovopen,reeststorerehausmanfe

21、rehausmanfere,sigmaless*两个模型的方差-协方差矩阵都采用Re真型的hausmanfere,sigmamore* =为何有些变量会被drop掉?usenlswork.dta,cleartssetidcodeyearxtregln_wagehourstenurettl_exp,fe/y_it=x_it*b+u_i+e_it*由于面板数据同时兼顾了截面数据和时间序列的特征,*所以异方差和序列相关必然会存在于面板数据中;*同时,由于面板数据中每个截面(公司、个人、国家、地区)之间还可能存在内在的联系,*所以,截面相关性也是一个需要考虑的问题。*此前的分析依赖三个假设条件:*(1

22、)Vare_it=sigmaA2同方差假设*(2)Corre_it,e_it-s=0序列无关假设*(3)Corre_it,e_jt=0截面不相关假设*当这三个假设无法得到满足时,便分别出现异方差、序列相关和截面相关问题;*我们一方面要采用各种方法来检验这些假设是否得到了满足;正常执行*/* 产生血族虚拟变量tabrace,gen(dum_race)xtregln_wagehourstenurettl_expdum_race2dum_race3,fe* 为何dum_race2和dum_race3会被dropped?* 固定效应模型的设定:y_it=u_i+x_it*b+e_it(1)* 由于个体

23、效应u_i不随时间改变,* 因此若x_it包含了任何不随时间改变的变量,* 都会与u_i构成多重共线性,Stata会自动删除之。*异方差、序列相关和截面相关问题另一方面,也要在这些假设无法满足时寻求合理的估计方法。假设检验* =组间异方差检验(截面数据的特征)* Var(e_i)=sigma_iA2* Fe模型xtreglogylogklogl,fexttest3* Re模型* Re本身已经较大程度的考虑了异方差问题,主要体现在sigma_uA2上*=序列相关检验*Fe模型* xtserialWooldridge(2002),若无序列相关,则一阶差分后残差相关系数应为-0.5xtseriall

24、ogylogkloglxtseriallogylogklogl,output* Re模型xtreglogylogklogl,rexttestl/xtcsd命令(提供了三种检验方法)xtreglogylogklogl,fe提供多个统计检验量*/*=截面相关检验*xttest2命令H0:所有截面残差的相关系数都相等xtreglogylogklogl,fexttest2*由于检验过程中执行了SU骷计,所以要求T>Nxtreglogylogkloglifid<6,fexttest2xtcsd,pesaran/(2)其临界值见Bhargavaetal.49:553-549)*(3)Balta

25、gi-WuLBI=1.4739834*因为他们并未提供临界值表,Pesaran(2004)*/xtcsd,friedman/*Friedman(1937)*/xtreglogylogklogl,rextcsd,pesaran估计方法*=异方差稳健型估计xtreglogyhinvgovopen,ferobusteststorefe_rbxtreglogyhinvgovopen,ferobusteststorefe*结果对比esttabfe_rbfe,b(%6.3f)se(%6.3f)mtitle(fe_rbfe)*=序列相关估计*一阶自相关xtregar,fe/re* 模型:y_it=u_i+x

26、_it*b+v_it* v_it=rho*v_it-1+z_it(2)xtregarlogyhinvgovopen,feeststorefearlxtregarlogyhinvgovopen,felbi/*Baltagi-WuLBItest*/* 说明:* (1)这里的Durbin-Watson=1.280677具有较为复杂的分布,* 不同于时间序列中的D-W充计量。(1982,TheReviewofEconomicStudies基本上没有太大的参考价值,而该统计量的分布又相当复杂xtregarlogyhinvgovopen,reeststorere_ar1* 两阶段估计xtregarlogy

27、hinvgovopen,fetwostepeststorefe_ar1_two* 结果对比xtreglogyhinvgovopen,feeststorefelocalmodels"fefe_ar1re_ar1fe_ar1_two"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_wcorr)*高阶自相关*newey2命令newey2logyhinvgovopen,lag(2)-=组间相关(截面相关)*cluster选项usextcs.dta,clearxtreglogyhinvg

28、ovopen,fecluster(id)eststorefe_clusterxtreglogyhinvgovopen,recluster(id)eststorere_cluster*看过去很晕,采用一种综合处理:* xtgls命令* xtpcse命令*-简介(Greene,2000,chp15)* (1)异方差(2)序列相关(3)截面相关性* 应用范围:多用于“大T,小M型面板数据,* 因为,此时截面的异质性并不是重点关注的,而时序特征则较为明显* 因此,模型设定中未考虑个体效果*y_1IIX_1|e_1|y_2IIX_2IIe_2I.II.II.I.I=I.I*b+I.I.II.II.Iy_

29、nIIX_nIIe_nI*-截面异方差*Ee_i*e_i'=s_iA2Is1A20.0II0s2A2.0II.IV=I.II.II00.snA2I*-截面相关*Ee_i*e_i'=s_ijA2*Is_11s_12.s_1nIIs_21s_22.s_2nII.IV=I.I*sigmaA2I.IIs_n1s_n2.s_nnI*-序列相关*Ee_i*e_i'=s_iA2*M_i*等同于PooledOLS*/截面异方差*/所有截面具有相同的自相关系每个截面有自己的自相关系数截面间相关且异方差*/截面异方差*/|s1A2检验序列相关M_10.0|0s2A2*M_2.0|I.|V=

30、|.|.|00.sM2*M_n|*GLS估计*b=X'VA-1*XA-1X'VA-1y*Varb=X'VA-1*XA-1*-估计和检验*=xtgls命令useinvest2.dta,clearxtglsmarketinveststock,panels(iid)/*iid,eststoreg_0regmarketinveststockeststoreg_olsxtglsmarketinveststock,panel(het)/*eststoreg_phetxtglsmarketinveststock,corr(ar1)/*数*/eststoreg_par1xtglsmar

31、ketinveststock,corr(psar1)/*/eststoreg_psar1xtglsmarketinveststock,panel(corr)/*eststoreg_pcorrxtglsmarketinveststock,p(c)corr(ar1)eststoreg_all* 检验异方差xtglsmarketinveststock,panel(het)/*xttest3xtserialmarketinveststock* 检验截面相关xtglsmarketinveststock,panel(het)xttest2* 结果对比xtregmarketinveststock,feest

32、storefelocalmodels"feg_0g_ols"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)localmodels"feg_phetg_par1g_psar1g_pcorrg_all"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)compress* 说明:* 为何xtgls不汇报R2?* 因为此时的R殊必介于0和1之间,不具有传统线性回

33、归模型中R2勺含义*=xtpcse命令* 默认假设:存在截面异方差和截面相关* 估计方法:OLS或Prais-Winsten回归* 有别于xtgls(采用FGLSf计)* 更适于方块面板N不大(10-20),T不大(10-40)* 与xtgls的区别:估计方法不同* xtgls采用GLSS行估计,而xtpsce采用OLSuseinvest2.dta,clearxtpcseinvestmarketstockeststorepcse_full/*OLS估计,调整异方差和截面相关后的标准误*/xtglsinvestmarketstock,panels(correlated)eststorem_xtg

34、ls/*FGLS估计,异方差和截面相关*/xtpcseinvestmarketstock,correlation(ar1)eststorepcse_ar1/*Prais_Winsten估计,共同的自相关系数*/xtpcseinvestmarketstock,correlation(ar1)hetonlyeststorepcse_ar1/*不考虑截面相关*/* 结果对比xtreginvestmarketstock,feeststorefelocalmodels"fepcse_fullm_xtglspcse_ar1pcse_ar1"esttab'models',

35、b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)* xtpcse的结果与xtgls非常相似,但前者可以汇报R2* 当酿大时,采用该方法会非常费时,* 因为方差协方差矩阵是采用OLSfc计的残差计算的usextcs.dta,clearxtdesxtpcsetlsizendtstangtobinnpr/*大约5-8分钟*/eststorextpcsextregtlsizendtstangtobinnpr,feeststorefe* 结果对比localmodels"fextpcse"esttab'models'

36、;,b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)* 系数估计值有较大差别,但符号和显著性是一致的。一动态面板模型PartI*动态面板模型*简介*一阶差分IV估计量(AndersonandHisao,1982)*一阶差分GMM计量(ArellanoandBond,1991)*系统GMM计量(AB,1995;BB,1998)* =简介=* 模型:yit=a0基本思想:采用一阶差分去除个体效应u_i,y的滞后二阶作为D.yit-1的工具变量同时,D.yit-2也可以作为D.yit-1的工具变量yit-1+a1*xit+a2*wit+u_i+

37、eit*特征:解释变量中包含了被解释变量的一阶滞后项可以是非平行面板,但要保证时间连续xit严格外生变量Ex_it,e_is=0foralltands即,所有干扰项与Xtb云相关wit先决变量Ew_it,e_is!=0fors<t,butEx_it,v_is=0foralls>=t* 一一即,前期干扰项与当期x相关,但当期和未来期干扰项与x不相关。* yit-1内生变量Ex_it,e_is!=0fors<=t* 即,前期和当期,/兀是当期干扰项与x相关* u_i随机效应,在截面间是iid的。u_i与eit独立。*内生性问题:*(1)若假设u_i为随机效应,则Corr(yi,t

38、-1,u_i)!=0*(2)若假设u_i为个体效应,需要想办法去除之,因为数据为“大N、T”*一阶差分:D.yi,t-1=yi,t-1-yi,t-2D.ei,t=ei,t-ei,t-1显然:Corr(D.yi,t-1,D.ei,t)!=0,差分方程存在内生问题;组内去心:ymi,t-1=yi,t-1-1/(T-1)*(yi,t-1+yi,T)emi,t=ei,t-1/T*(ei,t+ei,t-1+ei,T)显然:Corr(ymi,t-1,emi,t)!=0,仍然存在内生性问题*处理办法:IV估计或GMM计,选择合适的工具变量*矩条件:Ee_it,z_it=0=一阶差分IV估计量=Anderso

39、nandHisao(1982)useabdata.dta,cleardes/基本思想:变量的定义*/tssetidyear模型:n_it=b1*n_it-1+b2*n_it-2+b3*w_it+b4*w_it-1+b5*k_it+b6*k_it-1+b7*k_it-2+b8*ys_it+b9*ys_it-1+b10*ys_it-2xtivregnL2.nwL1.wkL1.kL2.kysL1.ysL2.ysyr1981-yr1984/(L.n=L3.n),fdxtivregnL2.nL(0/1).wL(0/2).(kys)yr1981-yr1984(L.n=L3.n),fd一阶差分GMMT计量=

40、AB91=* L.Hansen(1982)提出GMM* ArellanoandBond(1991)*模型:yit=a0*yit-1+a1*xit+a2*wit+u_i+vit假设条件:干扰项vit不存在序列相关;适用范围:大N,小T随后,我们会介绍“小N庆T”型动态面板的估计方法在AndersonandHisao(1982)基础上增加了更多可用的工具变量* 在t=3处,y_i1可以作为所有滞后项的工具变量* 在t=4处,y_i1,y_i2可以作为所有滞后项的工具变量* D.yit=a1*D.yit-1+a2*D.Xit+D.vitX_it=x_it,w_it* 因此,所有工具变量构成的矩阵如下

41、:* |y_i100000.0.0D.x_i3|* |0y_i1y_i2000.0.0D.x_i4|* |000y_i1y_i2y_i3.0.0D.x_i5|* Z_i=|* |* |000000.y_i1.yiT-2D.x_iT|* Z_i的行数为T-2* Z_i的列数为sum_(m=1)A(T-2)m+K,K为X的列数* 以T=7,K=3为例,贝UZ_i的列数为(1+2+3+4+5)+3=18*设定工具变量的基本原则:*对-内生-变量的处理:与上述方法类似,* 即滞后两阶以上的水平变量均可作为差分方程的工具变量(GMMtype)* 对-先决-变量的处理:滞后一阶以上的水平变量均可作为工具变

42、量(GMMtype)* 对-外生-变量的处理:自己作为自己的工具变量(StandardIV)* =例1:一阶差分估计量的基本设定* 解释变量仅包含y_it的一阶滞后项,默认设定* 干扰项同方差,一阶段估计useabdata.dta,clearxtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984eststoreab_0*-结果释疑*-1-工具变量的个数是如何确定的?(xtdpd,p.74)* 外生变量的工具变量等于外生变量的个数共13个* L(0/1).wL(0/2).(kys)yr1980-yr1984* 内生变量的工具变量:共27个*listidyearnL2.

43、nDL2.nifid=140* 差分方程的可用工具变量* yearofYearsofNumberof* differenceequationinstrumentsinstruments*197819761*19791976-19772*19801976-19783*19811976-19794*19821976-19805*19831976-19816*-19841976-19827*28* -2-GMM-type和Standard两种类型的工具变量有何差异?(xtabond,p.27)* GMM-type是针对内生变量或先决变量而言的工具变量,有多列* Standard是针对外生变量而言的工

44、具变量,只有一列* -过度识别检验(工具变量的使用是否合理)*estatsargan* 说明:* H0:overidentifyingrestrictionsarevalid* 这里,我们拒绝了原假设,但AB91旨出,当干扰项存在异方差时,* Sargan检验倾向于过度拒绝原假设,因此此处得到的结论并不可信。* 采用两阶段估计,然后再执行Sargan检验较为稳妥:*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,twostepestatsargan*说明:不过,AB9位现,* 若存在异方差,在两阶段估计后执行Sargan检验往往倾向于* Underrejec

45、t问题,即过度接受原假设。* 通常而言,这很可能是我们的模型设定不当,或是工具变量的选择不合理。* -干扰项序列相关检验* AB91一阶差分估计量要求原始模型的干扰项不存在序列相关,* 显然,差分后的干扰项必然存在一阶序列相关,* 因此,我们需要检验差分方程的残差是否存在二阶(或更高阶)序列相关即可*默认,二阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)estatabond*说明:若存在二阶相关,则意味着选取的工具变量不合理*高阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr198

46、4,vce(robust)artest(3)estatabond*=稳健型估计xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)robusteststoreab4_one_rb*此时,无法Sargan统计量estatsargan*=两阶段估计AB91(Tab4(a2)考虑异方差问题*利用第一阶段估计得到的残差构造方差-协方差矩阵,进而重新估计模型*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepeststoreab4_twostep* 此时,Sargan检验无法拒绝原假设*estat

47、sargan* AB91重要建议:* (1)采用一阶段估计结果进行系数显著性的统计推断;* (2)采用两阶段估计给出的Sargan统计量进行模型筛选* 进一步的讨论:* 虽然AB9健议不要采用两阶段(非稳健)估计进行统计推断,* 但Windmeijer(2005,JournalofEconometrics)通过模拟分析表明,* 采用纠偏(bias-corrected,WC)后的稳健性VCE可以更好地进行统计推断xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepvce(robust)eststoreab_wc_rb* 结果对比loca

48、lmm"ab4_one_rbab4_twostepab_wc_rb”esttab'mm',mtitle('mm')* 结论:* AB91_onestep_rb的结果与AB91_WC_rb的参数估计相同,后者标准误较大* 建议采用Windmeijer(2005)两阶段-纠偏-稳健型估计量。*=先决变量的设定*由于当期干扰项显然会影响后续w和k,所以把它们设定为先决变量更为合理*注意:此时逗号前就不能再出现这两个变量了xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(wk)eststoreab4_prees

49、tatsargan* 从Sarganp值来看,将w和k设为先决变量似乎更为合理* pre()选项的设定xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(w,lag(1,3)pre(k,lag(2.)* 解释:* pre(w,lag(1,3)* lag(1,3)中的1表示L.w也会作为解释变量,* lag(1,3)中的3表示L2.w和L3.w可以作为L.w的工具变量,但L4.w不可以;* pre(k,lag(2.)* lag(2,.)中的2表示L1.k,L2.k都会作为解释变量;* lag(2,.)中的.表示L3KL4.k.都可以作为L2.k的工

50、具变量选项以便获得稳健型标准误*说明:上述设定都可附加-vce(robust)-*=工具变量过多导致的问题* 过多的工具变量往往导致过度约束假设无法满足* 估计结果的有效性降低,因为部分工具变量与内生或先决变量的相关性很弱* 对矩阵尺寸的要求增加* 解决办法:限制最大的滞后阶数xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(w,lag(1,3)pre(k,lag(2,3)* =系数估计的上下限* 虽然PooledOLS和FixedEffects估计都是有偏的,* 但是二者却决定了y_it-1真是估计值的上界和下界* 换言之,PooledOLS

51、估计高估了真实值* 而Fixedeffects估计则低估了真实值*=* =系统GMMf计量=*=AB95,BB98=*=ArellanoandBover(1995),BlundellandBond(1998)Haha(1999),JudsonandOwen(1999)适用范围:AB91(1)(2)大N,小T的局限当yi,t-1的系数较大,即yi,t表现出强烈的序列相关时;当Varu_i/Vare_it较大时,即个体效应的波动远大于常规干扰项的波动;*AB91的表现欠佳。原因在于,水平滞后项是差分方程中内生变量的-弱工具变量-;因此,需要寻求更佳的工具变量*=基本思想:几个概念-水平值差分值yx

52、D.yD.x水平方程:y_it=b1-xtabond2命令-Roodman(2005)*既可以估计差分GMM估计量,也可以估计系统GMM估计量;同时可以估计一般化的回归模型提供两阶自相关检验,Sargan检验,Hansert佥验,以及工具变量外生性检验y_it-1+b2*x_it+u_i+v_it可用工具变量:D.yi,t-1可以作为yi,t-1的工具变量差分方程:D.y_it=b1*D.y_it-1+b2*D.x_it+D.v_it可用工具变量:yi,t-2,yi,t-3.都可以作为D.yi,t-1的工具变差分GMM计量与系统GMM计量的区别-差分GMM计量采用水平值的滞后项作为差分变量的工

53、具变量;如y_it-3是D.y_it-1的工具变量系统GMM计量进一步采用差分变量的滞后项作为水平值的工具变量;相当于进一步增加了可用的工具变量,且估计过程中同时使用水平方程和差分方程过低主要原因在于差分GMM工具变量往往是弱工具变量,即corr(X,Z)*-xtdpdsys命令-Stata官方命令,以xtabond2命令为基础* xtabond2命令* 适用于Stata8-10各个版本* 既可以完成-一阶差分GMM计-* 也可以完成-系统GMM计-* 详细参考资料:* Roodman,D.2006.HowtoDoxtabond2:* AnIntroductionto"Difference"and"System"GMMinStata.* WorkingPaper103.CenterforGlobalDevelopment,Washington.* =使用xtabond2命令得到-一阶差分估计量-* -附力口-noleveleq-选项即可* 采用xtabond2估计AB91文中表4的结果* Are

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论