stata命令大全全要点_第1页
stata命令大全全要点_第2页
stata命令大全全要点_第3页
stata命令大全全要点_第4页
stata命令大全全要点_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、*面板数据计量分析与软件实现*STAT续程,感谢他的贡献。本人做了一定说明:以下do文件相当一部分内容来自于中山大学连玉君的修改与筛选。* 面板数据模型* 1,静态面板模型:FE和RE* 2,模型选择:FEvsPOLS,REvsPOLS,FEvsRE(pols混合最小二乘估计)* 3.异方差、序列相关和截面相关检验* 4.动态面板模型(DID-GMM,SYS-GMM* 5.面板随机前沿模型* 6.面板协整分析(FMOLS,DOLS*说明:1-5均用STATAM牛实现,6用GAUS献件实现。*生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前7&分析(SFA)*说明:DE袖DE

2、AP2.1软件实现,SF岫Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应(SpilloversEffect)、工业行业效率状况等。*空间计量分析:SLM莫型与SEMI型*说明:STATAMatlab结合使用。常应用于空间溢出效应(R&D、财政分权、地方政府公共行为等。*一、常用的数据处理与作图* 指定面板格式xtsetidyear(id为截面名称,year为时间名称)xtdes/*数据特征*/xtsumlogyh/*数据统计特征*/sumlogyh/*数据统计特征*/* 添加标签或更改变量名l

3、abelvarh"人力资本"renamehhum* 排序sortidyear/*是以STATAU板数据格式出现*/sortyearid/*是以DE醺式出现*/* 删除个别年份或省份dropifyear<1992dropifid=2/*注意用=*/year或id就不连续,为形成panel格式,需要用* 如何得到连续year或id编号(当完成上述操作时,egen命令)egenyear_new=group(year)xtsetidyear_new* *保留变量或保留观测值keepinv/*删除变量*/* *或keepifyear=2000* *排序sortidyear/*是

4、以STATAU板数据格式出现sortyearid/*是以DE醺式出现* *长数据和宽数据的转换* 长>>>宽数据reshapewidelogy,i(id)j(year)* 宽>>>长数据reshapelogy,i(id)j(year)* *追加数据(用于面板数据和时间序列)xtsetidyear* 或者xtdestsappend,add(5)/表示在每个省份再追加5年,用于面板数据/tsset* 或者tsdes.tsappend,add(8)/表示追加8年,用于时间序列/协方差Cov(X,Y)* 方差分解,比如三个变量Y,X,Z都是面板格式的数据,且满足Y=

5、X+Z,求方差var(Y),和Cov(Z,Y)bysortyear:corrYXZ,cov* *生产虚拟变量* 生成年份虚拟变量tabyear,gen(yr)* 生成省份虚拟变量tabid,gen(dum)* *生成滞后项和差分项xtsetidyeargenylag=l.y/*genylag2=L2.ygendy=D.y/*产生一阶滞后项),同样可产生二阶滞后项*/产生差分项*/*求出各省2000年以前的openinv的平均增长率collapse(mean)openinvifyear<2000,by(id)变量排序,当变量太多,按规律排列。可用命令aorder或者orderfdiopen

6、insti* 二、静态面板模型* 简介* 面板数据的结构(兼具截面资料和时间序列资料的特征)useproduct.dta,clearbrowsextsetidyearxtdes* 固定效应模型* 实质上就是在传统的线性回归模型中加入N-1个虚拟变量,* 使得每个截面都有自己的截距项,* 截距项的不同反映了个体的某些不随时间改变的特征* 例如:lny=a_i+b1*lnK+b2*lnL+e_it* 考虑中国29个省份的C-D生产函数*画图*散点图+线性拟合直线twoway(scatterlogyh)(Ifitlogyh)* 散点图+二次拟合曲线twoway(scatterlogyh)(qfitl

7、ogyh)* 散点图+线性拟合直线+置信区间twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)* 按不同个体画出散点图和拟合线,可以以做出fevsre的初判断*twoway(scatterlogyhifid<4)(lfitlogyhifid<4)(lfitlogyhifid=1)(lfitlogyhifid=2)(lfitlogyhifid=3)* 按不同个体画散点图,sobeautiful!*graphtwowayscatterlogyhifid=1|scatterlogyhifid=2,msymbol(Sh)|scatterlogyhifi

8、d=3,msymbol(T)|scatterlogyhifid=4,msymbol(d)|,legend(position(11)ring(0)label(1"北京")label(2"天津")label(3"河北")label(4"山西")* *每个省份logy与h的散点图,并将各个图形合并twowayscatterlogyh,by(id)ylabel(,format(%3.0f)xlabel(,format(%3.0f)* 每个个体的时间趋势图*xtlinehifid<11,overlaylegend(on

9、)*一个例子:中国29个省份的C-D生产函数的估计tabid,gen(dum)list* 回归分析reglogylogklogldum*,eststorem_olsxtreglogylogklogl,feeststorem_feesttablem_olsm_fe,b(%6.3f)star(0.10.050.01)* Wald检验testlogk=logl=0testlogk=logl* stata的估计方法解析* 目的:如果截面的个数非常多,那么采用虚拟变量的方式运算量过大* 因此,要寻求合理的方式去除掉个体效应* 因为,我们关注的是x的系数,而非每个截面的截距项*处理方法:*组内平均样本平均

10、*y_it=u_i+x_it*b+e_it(1)*ym_i=u_i+xm_i*b+em_i(2)*ym=um+xm*b+em(3)/*withinestimator*/R2* (1)-(2),可得:* (y_it-ym_i)=(x_it-xm_i)解读xtreg,fe的估计结果xtreglogyhinvgovopen,fe*-RA2*y_it=a_0+x_it*b_o+e_it(1)pooledOLS*y_it=u_i+x_it*b_w+e_it(2)withinestimator*ym_i=a_0+xm_i*b_b+em_i(3)betweenestimator*->R-sq:with

11、in模型(2)对应的R2,是一个真正意义上的*->R-sq:betweencorrxm_i*b_w,ym_iA2*->R-sq:overallcorrx_it*b_w,y_itA2*-F(4,373)=855.93检验除常数项外其他解释变量的联合显著性*b+(e_it-em_i)* (4)+(3),可得:* (y_it-ym_i+ym)=um+(x_it-xm_i+xm)*b+(e_it-em_i+em)* 可重新表示为:* Y_it=a_0+X_it*b+E_it* 对该标型执行OLS估计,即可得到b的无偏估计量*stata后台操作,揭开fe估计的神秘面纱!egeny_meanw

12、=mean(logy),by(id)/*个体内部平均*/egeny_mean=mean(logy)/*样本平均*/egenk_meanw=mean(logk),by(id)egenk_mean=mean(logk)egenl_meanw=mean(logl),by(id)egenl_mean=mean(logl)gendyw=logy-y_meanwgendkw=logk-k_meanwgendlw=logl-l_meanwregdywdkwdlw,noconseststorem_statagendy=logy-y_meanw+y_meangendk=logk-k_meanw+k_meange

13、ndl=logl-l_meanw+l_meanregdydkdleststorem_stataesttablem_*,b(%6.3f)star(0.10.050.01)* -corr(u_i,Xb)=-0.2347* -sigma_u,sigma_e,rho* rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u2+e(sigma_e2)* 个体效应是否显著?* F(28,373)=338.86H0:al=a2=a3=a4=a29* Prob>F=0.0000表明,固定效应高度显著* -如何得到调整后的R2,即adj-

14、R2?ereturnlistreglogyhinvgovopendum*,-拟合值和残差* y_it=u_i+x_it*b+e_it* predictnewvar,option/*xbxb,fittedvalues;thedefaultstdpcalculatestandarderrorofthefittedvaluesueu_i+e_it,thecombinedresidualxbuxb+u_i,predictionincludingeffectuu_i,thefixed-orrandom-errorcomponentee_it,theoverallerrorcomponent*/xtreg

15、logylogklogl,fepredicty_hatpredicta,upredictres,epredictcres,uegenares=a+reslistarescresin1/10随机效应模型* y_it=x_it*b+(a_i+u_it)* =x_it*b+v_it* 基本思想:将血机干扰项分成两种* 一种是不随时间改变的,即个体效应a_i* 另一种是随时间改变的,即通常意义上的干注项u_it*估计方法:FGLS* Var(v_it)=sigma_aA2+sigma_uA2* Cov(v_it,v_is)=sigma_aA2* Cov(v_it,v_js)=0* 利用PooledOL

16、S,WithinEstimator,BetweenEstimator* 可以估计出sigma_aA2和sigma_uA2,进而采用GLJSFGLS* Re估计量是Fe估计量和Be估计量的加权平均* yr_it=y_it-thetaym_i* xr_it=x_it-theta*xm_i* theta=1-sigma_u/sqrt(T*sigma_aA2+sigma_uA2)*解读xtreg,re的估计结果useproduct.dta,clearxtreglogylogklogl,re* -R2* ->R-sq:withincorr(x_it-xm_i)*b_r,y_it-ym_iA2* -

17、>R-sq:betweencorrxm_i*b_r,ym_iA2* ->R-sq:overallcorrx_it*b_r,y_itA2* 上述R潴B不是真正吉"日勺一R2,因为Re模型采用的是GLS古计* rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)* corr(u_i,X)=0(assumed)* 这些随机效应模型的一个最重要,也限制该模型应用的一个重要假设* 然而,采用固定效应模型,我们可以粗略估计出corr(u_i,X)xtregmarketinvests

18、tock,fe* Waldchi2(2)=10962.50Prob>chi2=0.0000时间效应、模型的筛选和常见问题* 目录* 7.2.1时间效应(双向固定(随机)效应模型)* 7.2.2模型的筛选* 7.2.3面板数据常见问题* 7.2.4面板数据的转换* 时间效应* 单向固定效应模型* y_it=u_i+x_it*b+e_it* 双向固定效应模型* y_it=u_i+f_t+x_it*b+e_itquitabyear,gen(yr)dropyr1xtreglogylogkloglyr*,fe* 随机效应模型中的时间效应xtreglogylogkloglyr*,fe*模型的筛选*

19、固定效应模型还是PooledOLS?xtreglogylogkloglyr*,fe/*Wald检验*/quitabid,gen(dum)/*LR检验*/reglogylogklogl/*POLS*/eststorem_olsreglogylogklogldum*,noconseststorem_felrtestm_olsm_feesttablem_*,b(%6.3f)star(0.10.050.01)* REvsPooledOLS?* H0:Var(u)=0* 方法一:B-P检验xtreglogylogklogl,rexttest0* FEvsRE?* y_it=u_i+x_it*b+e_it

20、致的,但Re更有效Re有偏的* -Hausman检验-* 基本思想:如果Corr(u_i,x_it)=0,Fe和Re者B是一* 如果Corr(u_i,x_it)!=0,Fe仍然有效,但* 基本步骤*情形1:huasman为正数xtreglogylogklogl,feeststorem_fextreglogylogklogl,reeststorem_rehausmanm_fem_re*情形2:quixtreglogyhinvgovopen,feeststorefequixtreglogyhinvgovopen,reeststorerehausmanfere* Hausman检验值为负怎么办?*

21、通常是因为RE莫型的基本假设Corr(x,u_i)=0无法得到满足*检验过程中两个模型的方差-协方差矩阵都采用Fe模型的hausmanfere,sigmaless*两个模型的方差-协方差矩阵都采用Re模型的hausmanfere,sigmamore* =为何有些变量会被drop掉?usenlswork.dta,cleartssetidcodeyearxtregln_wagehourstenurettl_exp,fe/*正常执行*/* 产生种族虚拟变量tabrace,gen(dum_race)xtregln_wagehourstenurettl_expdum_race2dum_race3,fe*

22、 为何dum_race2和dum_race3会被dropped?* 固定效应模型的设定:y_it=u_i+x_it*b+e_it(1)* 由于个体效应u_i不随时间改变,* 因此若x_it包含了任何不随时间改变的变量,* 都会与u_i构成多重共线性,Stata会自动删除之。* *异方差、序列相关和截面相关问题* 简介* y_it=x_it*b+u_i+e_it* 由于面板数据同时兼顾了截面数据和时间序列的特征,* 所以异方差和序列相关必然会存在于面板数据中;* 同时,由于面板数据中每个截面(公司、个人、国家、地区)之间还可能存在内在的联系,* 所以,截面相关性也是一个需要考虑的问题。同方差假设

23、序列无关假设截面不相关假设* 此前的分析依赖三个假设条件:* (1)Vare_it=sigmaA2* (2)Corre_it,e_it-s=0* (3)Corre_it,e_jt=0* 当这三个假设无法得到满足时,便分别出现异方差、序列相关和截面相关问题;* 我们一方面要采用各种方法来检验这些假设是否得到了满足;* 另一方面,也要在这些假设无法满足时寻求合理的估计方法。假设检验*=组间异方差检验(截面数据的特征)*Var(e_i)=sigma_iA2* Fe模型xtreglogylogklogl,fexttest3* Re模型* Re本身已经较大程度的考虑了异方差问题,主要体现在sigma_u

24、A2上=序列相关检验* Fe模型-0.5* xtserialWooldridge(2002),若无序列相关,则一阶差分后残差相关系数应为xtseriallogylogkloglxtseriallogylogklogl,output* Re模型xtreglogylogklogl,rexttestl/*提供多个统计检验量*/=截面相关检验* xttest2命令H0:所有截面残差的相关系数都相等xtreglogylogklogl,fexttest2*由于检验过程中执行了SUE古计,所以要求T>Nxtreglogylogkloglifid<6,fexttest2*xtcsd命令(提供了三种

25、检验方法)xtreglogylogklogl,fextcsd,pesaran/*Pesaran(2004)*/xtcsd,friedman/*Friedman(1937)*/xtreglogylogklogl,rextcsd,pesaran*估计方法*=异方差稳健型估计xtreglogyhinvgovopen,ferobusteststorefe_rbxtreglogyhinvgovopen,ferobusteststorefe*结果对比*=*esttabfe_rbfe,b(%6.3f)se(%6.3f)mtitle(fe_rbfe)序列相关估计一阶自相关xtregar,fe/re(1)模型:

26、y_it=u_i+x_it*b+v_itv_it=rho*v_it-1+z_it(2)xtregarlogyhinvgovopen,feeststorefear1xtregarlogyhinvgovopen,felbi/*Baltagi-WuLBItest*/* 说明:* (1)这里的Durbin-Watson=1.280677具有较为复杂的分布,* 不同于时间序列中的D-W充计量。* (2)其临界值见Bhargavaetal.(1982,TheReviewofEconomicStudies49:553-549)* Baltagi-WuLBI=1.4739834基本上没有太大的参考价值,* 因

27、为他们并未提供临界值表,而该统计量的分布又相当复杂xtregarlogyhinvgovopen,reeststorere_ar1* 两阶段估计xtregarlogyhinvgovopen,fetwostepeststorefear1two* 结果对比xtreglogyhinvgovopen,feeststorefelocalmodels"fefear1rear1fear1two"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_wcorr)* 高阶自相关* newey2命令new

28、ey2logyhinvgovopen,lag(2)*=组间相关(截面相关)* cluster选项usextcs.dta,clearxtreglogyhinvgovopen,fecluster(id)eststorefe_clusterxtreglogyhinvgovopen,recluster(id)eststorere_cluster*看过去很晕,采用一种综合处理:* xtgls命令* xtpcse命令*-简介(Greene,2000,chp15)*模型* y=X*b+U* 重点在于考虑干扰项U的结构,包括* (1)异方差(2)序列相关(3)截面相关性* 应用范围:多用于大T,小N'

29、型面板数据,因为,此时截面的异质性并不是重点关注的,而时序特征则较为明显因此,模型设定中未考虑个体效果* Iy_1IIX_1|e_1|* Iy_2IIX_2IIe_2I* |.|.|.|* I.I=I.I*b+I.I* I.II.II.I* Iy_nIIX_nIIe_nI截面异方差* Ee_i*e_i'=s_iA2*Is1A20.0I0s2A2.0V=|.|.|00.snA2|截面相关|s_11s_12.s_1n|*=xtgls命令useinvest2.dta,clearxtglsmarketinveststock,panels(iid)/*iid,eststoreg_0regmark

30、etinveststockeststoreg_olsxtglsmarketinveststock,panel(het)/*eststoreg_phetxtglsmarketinveststock,corr(ar1)/*eststoreg_par1xtglsmarketinveststock,corr(psar1)/*eststoreg_psar1等同于PooledOLS*/截面异方差*/所有截面具有相同的自相关系数*/每个截面有自己的自相关系数*/|s_21s_22.s_2n|.|V=|.|*sigmaA2|.|s_n1s_n2.s_nn|序列相关* Ee_i*e_i'=s_iA2*M

31、_i* |s1A2*M_10.0|* |0s2A2*M_2.0|* |.|* V=|.|* |.|* |00.snA2*M_n|* GLS估计*b=X'VA-1*XA-1X'VA-1y* Varb=X'VA-1*XA-1估计和检验截面间相关且异方差*/截面异方差*/xtglsmarketinveststock,panel(corr)/*eststoreg_pcorrxtglsmarketinveststock,p(c)corr(ar1)eststoreg_all* 检验异方差xtglsmarketinveststock,panel(het)/*xttest3* 检验序列

32、相关xtserialmarketinveststock* 检验截面相关xtglsmarketinveststock,panel(het)xttest2* 结果对比xtregmarketinveststock,feeststorefelocalmodels"feg_0g_ols"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)localmodels"feg_phetg_par1g_psar1g_pcorrg_all"esttab'models

33、9;,b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)compress* 说明:* 为何xtgls不汇报R2?* 因为此时的R以必介于0和1之间,不具有传统线性回归模型中R2的含义*=xtpcse命令* 默认假设:存在截面异方差和截面相关* 估计方法:OLS或Prais-Winsten回归* 有别于xtgls(采用FGLS古计)* 更适于方块面板N不大(10-20),T不大(10-40)* 与xtgls的区别:估计方法不同* xtgls采用GLS®行估计,而xtpsce采用OLSuseinvest2.dta,clearxtpcs

34、einvestmarketstockeststorepcse_full/*OLS估计,调整异方差和截面相关后的标准误*/xtglsinvestmarketstock,panels(correlated)eststorem_xtgls/*FGLS估计,异方差和截面相关*/xtpcseinvestmarketstock,correlation(ar1)eststorepcse_ar1/*Prais_Winsten估计,共同的自相关系数*/xtpcseinvestmarketstock,correlation(arl)hetonlyeststorepcse_ar1/*不考虑截面相关*/* 结果对比x

35、treginvestmarketstock,feeststorefelocalmodels"fepcse_fullm_xtglspcse_ar1pcse_ar1"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)* xtpcse的结果与xtgls非常相似,但前者可以汇报R2* 当峨大时,采用该方法会非常费时,* 因为方差协方差矩阵是采用OLS古计的残差计算的usextcs.dta,clearxtdesxtpcsetlsizendtstangtobinnpr/*大约5-8分钟*

36、/eststorextpcsextregtlsizendtstangtobinnpr,feeststorefe* 结果对比localmodels"fextpcse"esttab'models',b(%6.3f)se(%6.3f)mtitle('models')r2sca(r2_w)* 系数估计值有较大差别,但符号和显著性是一致的。一*动态面板模型PartI* 动态面板模型* 简介* 一阶差分IV估计量(AndersonandHisao,1982)* 一阶差分GMM计量(ArellanoandBond,1991)* 系统GMM'计量(A

37、B,1995;BB,1998)* =简介=* 模型:yit=a0*yit-1+a1*xit+a2*wit+u_i+eit* 特征:解释变量中包含了被解释变量的一阶滞后项* 可以是非平行面板,但要保证时间连续*xit*wit严格外生变量Ex_it,e_is=0foralltands即,所有干扰项与x都不相关先决变量Ew_it,e_is!=0fors<t,butEx_it,v_is=0foralls>=t* 即,前期干扰项与当期x相关,但当期和未来期干扰项与x不相关。* yit-1内生变量Ex_it,e_is!=0fors<=t* 即,前期和当期,丸其弃当期干扰项与x相关* u_

38、i随机效应,在截面间是iid的。u_i与eit独立。*内生性问题:* (1)若假设u_i为随机效应,则Corr(yi,t-1,u_i)!=0* (2)若假设u_i为个体效应,需要想办法去除之,因为数据为"大NJ、T"* 一阶差分:D.yi,t-1=yi,t-1-yi,t-2D.ei,t=ei,t-ei,t-1差分方程存在内生问题;显然:Corr(D.yi,t-1,D.ei,t)!=0,组内去心:ymi,t-1=yi,t-1-1/(T-1)*(yi,t-1+yi,T)emi,t=ei,t-1/T*(ei,t+ei,t-1+ei,T)显然:Corr(ymi,t-1,emi,t)

39、!=0,仍然存在内生性问题*处理办法:IV估计或GMMr计,选择合适的工具变量*矩条件:Ee_it,z_it=0*=*=一阶差分IV估计量=*=AndersonandHisao(1982)=*=*基本思想:采用一阶差分去除个体效应u_i,y的滞后二阶作为D.yit-1的工具变量同时,D.yit-2也可以作为D.yit-1的工具变量useabdata.dta,cleardes/*变量的定义*/tssetidyear* 模型:n_it=b1*n_it-1+b2*n_it-2* +b3*w_it+b4*w_it-1* +b5*k_it+b6*k_it-1+b7*k_it-2* +b8*ys_it+b

40、9*ys_it-1+b10*ys_it-2*xtivregnL2.nwL1.wkL1.kL2.kysLl.ysL2.ysyr1981-yr1984/(L.n=L3.n),fd* 等价于*xtivregnL2.nL(0/1).wL(0/2).(kys)yr1981-yr1984(L.n=L3.n),fd* =一阶差分GM岫计量=* =AB91=* L.Hansen(1982)提出GMM* ArellanoandBond(1991)* 模型:*yit=aO*yit-1+a1*xit+a2*wit+u_i+vit*假设条件:*干扰项vit不存在序列相关;* 适用范围:* 大N,小T* 随后,我们会介

41、绍小N大T”型动态面板的估计方法* 基本思想:* 在AndersonandHisao。982)基础上增加了更多可用的工具变量* 在t=3处,y_i1可以作为所有滞后项的工具变量* 在t=4处,y1,y_i2可以作为所有滞后项的工具变量*D.yit=a1*D,yit-1+a2*D.Xit+D.vitX_it=x_it,w_it*因此,所有工具变量构成的矩阵如下:* |y_i100000.0.0D.x_i31* I0y_i1y_i2000.0.0D.x_i41* |000y_i1y_i2y_i3.0.0D.x_i51* Z_i=|* I000000.y_i1.yiT-2D.xJT|* Z_i的行数

42、为T-2* Z_i的列数为sum_(m=1)A(T-2)m+K,K为X的列数*以T=7,K=3为例,贝ijZ_i的列数为(1+2+3+4+5)+3=18*设定工具变量的基本原则:*对-内生-变量的处理:与上述方法类似,*又t-外生-变量的处理:自己作为自己的工具变量(StandardIV)*=例1:一阶差分估计量的基本设定解释变量仅包含y_it的一阶滞后项,默认设定干扰项同方差,一壶估计useabdata.dta,clearxtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984eststoreab0结果释疑*-1*工具变量的个数是如何确定的?(xtdpd,p.74)

43、外生变量的工具变量等于外生变量的个数L(0/1).wL(0/2).(kys)yr1980-yr1984内生变量的工具变量:共27个共13个listidyearnL2.nDL2.nifid=140*差分方程的可用工具变量*yearofYearsofNumberof(GMMtype)(GMMtype)*197819761*19791976-19772*19801976-19783*19811976-19794*19821976-19805*19831976-19816*1984*1976-19827*28个-2-GMM-type和Standard两种类型的工具变量有何差异?instruments*

44、differenceequationinstruments(xtabond,p.27)即滞后两阶以上的水平变量均可作为差分方程的工具变量又t-先决-变量的处理:滞后一阶以上的水平变量均可作为工具变量GMM-typeStandard是针对内生变量或先决变量而言的工具变量,有多列是针对外生变量而言的工具变量,只有一列过度识别检验(工具变量的使用是否合理)estatsargan说明:* H0:overidentifyingrestrictionsarevalid* 这里,我们拒绝了原假设,但AB91指出,当干扰项存在异方差时,* Sargan检验倾向于过度拒绝原假设,因此此处得到的结论并不可信。*

45、采用两阶段估计,然后再执行Sargan检验较为稳妥:*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,twostepestatsargan* 说明:不过,AB91发现,* 若存在异方差,在两阶段估计后执行Sargan检验往往倾向于* Underreject问题,即过度接受原假设。* 通常而言,这很可能是我们的模型设定不当,或是工具变量的选择不合理。* -干扰项序列相关检验* AB91一阶差分估计量要求原始模型的干扰项不存在序列相关,* 显然,差分后的干扰项必然存在一阶序列相关,* 因此,我们需要检验差分方程的残差是否存在二阶(或更高阶)序列相关即可* 默认,

46、二阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)estatabond*说明:若存在二阶相关,则意味着选取的工具变量不合理*高阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)artest(3)estatabond*=稳健型估计xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)robusteststoreab4_one_rb*此时,无法Sargan统计量estatsargan*=两阶段估计AB91(Tab4

47、(a2)考虑异方差问题*利用第一阶段估计得到的残差构造方差-协方差矩阵,进而重新估计模型*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepeststoreab4_twostep* 此时,Sargan检验无法拒绝原假设*estatsargan* AB91重要建议:* (1)采用一阶段估计结果进行系数显著性的统计推断;* (2)采用两阶段估计给出的Sargan统计量进行模型筛选* 进一步的讨论:* 虽然AB91建议不要采用两阶段(非稳健)估计进行统计推断,* 彳1Windmeijer(2005,JournalofEconometric

48、s)通过模拟分析表明,* 采用纠偏(bias-corrected,WC)后的稳健性VCE,可以更好地进行统计推断xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepvce(robust)eststoreab_wc_rb* 结果对比localmm"ab4_one_rbab4_twostepab_wc_rb"esttab'mm',mtitle('mm')*AB91_WC_rb的参数估计相同,后者标准误较大两加段-纠偏-稳健型估计量。*结论:* AB91_onestep_rb的结果与* 建

49、议采用Windmeijer(2005)*=先决变量的设定* 由于当期干扰项显然会影响后续w和k,所以把它们设定为先决变量更为合理* 注意:此时逗号前就不能再出现这两个变量了xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(wk)eststoreab4_preestatsargan* 从Sarganp值来看,将w和k设为先决变量似乎更为合理* pre()选项的设定xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep/pre(w,lag(1,3)pre(k,lag(2,.)* 解释:* pre(w,lag(1,

50、3)* lag(1,3)中的1表示L.w也会作为解释变量,* lag(1,3)中的3表示L2.w和L3.w可以作为L.w的工具变量,但L4.w不可以;* pre(k,lag(2,.)* lag(2,.)中的2表示L1.k,L2.k都会作为解释变量;* lag(2,.)中的.表示L3.k,L4.k.都可以作为L2.k的工具变量*说明:上述设定都可附加-vce(robust)-选项以便获得稳健型标准误。*=工具变量过多导致的问题*过多的工具变量往往导致过度约束假设无法满足* 估计结果的有效性降低,因为部分工具变量与内生或先决变量的相关性很弱* 对矩阵尺寸的要求增加* 解决办法:限制最大的滞后阶数x

51、tabondnL(0/1).ysyr1980-yr1984,lags(2)twostepIIIpre(w,lag(1,3)pre(k,lag(2,3)*=系数估计的上下限* 虽然PooledOLS和FixedEffects估计都是有偏的,* 但是二者却决定了y_it-1真是估计值的上界和下界* 换言之,PooledOLS估计高估了真实值* 而Fixedeffects估计则低估了真实值*=* =系统GM岫计量=*=AB95,BB98=*=* ArellanoandBover(1995),* BlundellandBond(1998)* Haha(1999),JudsonandOwen(1999)

52、* 适用范围:* 大N,小T* AB91的局限* (1)当yi,t-1的系数较大,即yi,t表现出强烈的序列相关时;* (2)当Varu_iIVare_it较大时,即个体效应的波动远大于常规干扰项的波动;* AB91的表现欠佳。* 原因在于,水平滞后项是差分方程中内生变量的-弱工具变量-;* 因此,需要寻求更佳的工具变量* =基本思想:* -几个概念-*水平值yx差分值D.yD.x水平方程:y_it=b1*y_it-1+b2*x_it+u_i+v_it可用工具变量:D.yi,t-1可以作为yi,t-1的工具变量差分方程:D.y_it=b1*D.y_it-1+b2*D.x_it+D.v_it可用

53、工具变量:yi,t-2,yi,t-3.都可以作为D.yi,t-1的工具变量差分GMM计量与系统GMM计量的区别* (1)差分GM的计量采用水平值的滞后项作为差分变量的工具变量;* 如y_it-3是D.y_it-1的工具变量* (2)系统GM的计量进一步采用差分变量的滞后项作为水平值的工具变量;* 相当于进一步增加了可用的工具变量,* 且估计过程中同时使用水平方程和差分方程* (3)主要原因在于差分GMM1工具变量往往是弱工具变量,即corr(X,Z)过低* -xtabond2命令-Roodman(2005)* 既可以估计差分GMM估计量,也可以估计系统GMM估计量;* 同时可以估计一般化的回归模型* 提供两阶自相关检验,Sargan检验,Hansen检验,以及工具变量外生性检验*-xtdpdsys命令-Stata官方命令,以xtabond2命令为基础* xtabond2命令* 适用于S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论