stata高级-2016暑期讲义_第1页
stata高级-2016暑期讲义_第2页
stata高级-2016暑期讲义_第3页
stata高级-2016暑期讲义_第4页
stata高级-2016暑期讲义_第5页
免费预览已结束,剩余141页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Stata研讨班讲高级群 扫 (邮箱主页

:课程概 课程大 如何使用Stata提供的范例数据 如何查看每次执行Stata的log文件 讨论和建 2016连玉君课程概地点:首都体育学院教学实验 (2) 连玉君,经济学博士,。2007年7月毕业于西安交通大学金禾经济,现任教于基金项目各一项,并参与了多项国家自科和社科基金项目的研究工作。目前已完成PanelVAR、PanelThreshold、Two-tierStochasticFrontierStata如winsor2、xtbalance、bdiff、hausmanxt、ttable3、hhi5等。 地址:云盘

Stata13.rar PX_B_2016b.rar而非D:\stata13\ado\ al\PX_B_2016b\PX_B_2016b(有些人在解压过程会导致双层文件在第2讲中,将介绍Bootstrap和MonteCarlo模拟相关的知识;内生性问题,包括处理效应模型和倾向得分匹配分析两类模型(5,作为这一讲的基础,在第4讲中,将介绍Logit模型;边SFA模型(第6讲);计数模型(第7讲:被解释变量为计数变量,如专利个数、违章次数、被批评的结构方程模型(8课程的特色和详情介绍如下135主要应对解释变量中所包含的0/1内生变量;二是倾向得分匹配分析方法,主要通过配对的方式来解决自我选择偏误。翻阅最近2年于经济研究、管理世界、经济学季等期的文章,这的模型中(如Heckman选择模型、PSM、DID、RDD等,Logit(SFASFA,是产出效率、成本效率、议价能力、投资效率估算等领域的主要分析工具。异质性随期文献中,固定效应面板SFA模型的估计是一直是个难题,本课程中提供了Greene(2005)effectSFA)模型的Stata估计程序,能够很方便地估计包含固定效应的面板SFA模型。双边随机边界模型(Two-tierSFA)由KumbhakarTsionasandSipilinen(2009)提出,在衡量信息不对称程度、投资效率、议价能力等方面有重要应用,如,连玉君and(2011)使用该模型测度了中国医疗市场的信息不对称程度,LianandChung(2008)使用该模型测度了中国上市公司的融资效率。完其三,在第7讲中,我将为大家介绍CountData模型。这是以往stata培训班和stata 新产品数量、融资次数、CEO变更次数等,此时使用计数模型(CountDataModel)更为合理。在近其四,新增了结构方程模型的讲解。在stata12中,Stata公司首次推出SEM模块,并提供了近多页。Stata对于SEM的重视和快速发展由此可见一斑。类似于GMM在解决内生性问题方面的独低估诸位的学习能力或的授课能力,而是因为高级班的内容和难度都明显增加了。希一阶序分GMM估计量(FD-相关检验和过度识别检验(Sargan检验VAR应应函数(IRF)实例(介绍3篇2讲(3小时)Bootstrap获取复杂统计量的临MonteCarloMonteCarlo应用实例:内生性偏误的截面门槛模型(Cross-sectionalThresholdModel)面板门槛模型(PanelThresholdModel)应用实例(介绍2篇Logit模型简4讲(3小时LogitLogit模型(MultinomialLogit)应用实例(介绍3篇)Heckman选择模型(HeckmanSelectionModel)处理效应模型(TreatmentEffectModel)倾向得分匹配分析(PropensityScoreMatching,PSM)应用实例(介绍2篇)的模型设定和异质SFA模型(HeterogeneitySFA模型(Two-tier应用范例(介绍3篇(CountDataPoisson回归模型)8讲(3小时)使用SEM估计传统线SEM的图形界面分析(SEMBuilder,课程资料使用说明stata13软件的基本设定stata13stata13.rarD盘根,即D:\stata13(注意:是D:\stata13,而不是D:\stata13\stata13,另外,stata13是小写)。如果你的电脑中没有D盘,请阅读第(4)条说明。图 关于profile.do文件。每次启动stata13时,它会自动执行D:\stata13文件夹下的profile.dostata:runningrunningD:\stata13\profile.dodoeditdoedit动我提供的stata13后,屏幕上会显示如下信息:.Stata:UPDATES:F:\stata13\ado\updates\(存放stata就只需从“开始”菜单中单击这个logo即可BASE:F:\stata13\ado\base\ SITE:F:\stata13\ado\site\PLUS:F:\stata13\ado\plus\ AL:F:\stata13\ado\ al\(存放用户的个人文件)编命令)无法识别,常见的错误信息如下(3.2小节Q3):unrecognizedunrecognizedcommand:文件统一存放于PX_B_2016b文件夹下,详情参见图1。表1资PX_B_2016b\Refs(子文件夹1:PX_B_2016b文件夹下的内 文件夹):存放了课程中使用的自编程序,例如(Refs文件夹):课程中涉及的文章的PDF原文,以及相关文献的PDF其他文件配对出现:例如下B4_Logit.do文件()为本课程第一讲的do-file,而B4_Logit文Q2.如何打开课堂上使用的do al\PX_B_2016b。若希望练习第一讲中的相关操作,可依次执行如下命令:cdcd

doeditStep2:输 命令,即可打开第一讲的讲义B4_Logit.do文件doeditStep2:在第一 出的“Do- Editor”窗口中点击“Open”图标,然后选中上图中第47-50行令,点击图中带有蓝色阴影的按钮(ExecuteSelection(do),快捷键为Q3.PDFA:Stata13配备了完整的PDF格式的使用手册,统一存放于“D:\stata13\docs”文件夹下。你完整的PDF使用手册,依次点击菜单Help→PDF ation即可:[R]regress即可打开regressPDF帮助文件。Q4.如何使用 求,本还进一步提供了Stata范例数据,统一存放于D:\stata13\ado\Example文件夹中。例 ]EditPreferenceGeneralPreferenceResultsColorsColorscheme,在下拉菜单中选择“Classic”或“Custom2”,把bold左侧方框中的对勾都去掉。截图如下:EditPreferenceGeneralPreferenceViewerColorsColorscheme,在下拉菜单Q6.使用其他版本的StataQ6.使用其他版本的Stata一修改成“stata11stata10或更低版本的用户而言,本次培训中涉及的部分命令可能无法执行,此时,建议您使用课程附带的stata13.rar软件。由于该软件包无需安装,你可以把它放在任何一个盘符下,如D盘、EF盘,相关设定方法参见3.1小节第(5)点的说明。adopathA:当屏幕上显示红色错误提示信息“unrecognizedcommand:xxx”时,意味着命令“xxx”无法识别。课件中涉及到令,主要包括三类:第一类是stata13自带的,统一存放于法设定了stata的文件路径,则不会出现命令无法识别的问题;3第三类是编写令,统一 命令将上述路径加入stata13的搜索范围内,详情参见Q2的解答。adopathstata执行命令的原理。当我们输入命令时,stata需要找到并执行一个名称为describe.ado的程序文件(ado文件)。需要注意的是,为了提高执行速度,stataadopath. (AL) adopathadopath其一,采 adopath+其二,把我们自己编写令放入"D:\stata13\ado\base/"文件夹中,5此时该命令的与3您可以使

可以搜索出很多有关PanelDatafinditpanel令,按照指引可以点击到plus文件夹中finditpanel4如,本课程中使用的所以自编命令都存放于 入D:\stata13\ado\base\m文件夹中。Q8.如何查看每次执行StataQ8.如何查看每次执行StatalogAprofile.doStata13后,屏幕上呈现的所有结果都会被自时的时间,例如,名称为“log-15Jan2015-21-00-45.txt201511521:00:45打开Stata13时自动生成的日志文件。讨论和建议(1)经济Stata专版:(2)经济“统计软件培训班VIP答疑区。这里汇集了大量stata应用的实例和问题连玉君的博客和:博客 /arlion)中提供了大量 ************************************$$$$$$$$$$$$ $$ $$$ $ $$ $ $$————————————————————————————————————————Stata研讨班(基础班(2016.7.12-群(stata-连老师-2016暑假————————————————————————————————————————主讲人:连玉君位:中山大学岭南学院金融系邮:页:客:程:课***第一讲A动态面板数据模型23456789*-注意:执行后续命令之前,请先执行如下命令globalpath" al)'\PX_B_2016b"//定义课cd$path\B1a //进入本globalR //参考文献所在文件夹adopath //自编程序 *-1.1 ****-参考*连玉君计量笔记第8章,重点介绍stata操作,可 博客*Greene(2000),chp14较为清晰的介绍了静态面板模型*Baltagi(2001),一本专门介绍Panel的书 *Arrllano(2003),重点关注动态面板和GMM估计 *StataLongitudinal/PaneldataReference 详细介绍了stata中有关Panel的各种命令**E[xit,eis]=0foralltand**E[xit,eis]=0foralltand即,所有干扰项与x都不相关 out"$R\连玉君(2011)_Panel_Data.pdf"*-Paneldata out out"$R\Hisao out out"$R\Wooldridge *-应 *-DynamicPanelDatamodel, *-Horioka,C.Y.,J.Wan, Thedeterminantsofhouseholdsavingin Adynamicpanel ysisofprovincial JournalofMoney,CreditandBanking,39(8):2077- *-DynamicPanelDatamodel, *-Huang,B.-N.,M.Hwang,C.Yang, Causalrelationshipbetweenenergyconsumptionandgdp revisited:Adynamicpaneldata EcologicalEconomics,67(1):41- **-1.2**-1.2动态面板模型* == 录 1.2.1 1.2.2一阶差分GMM估计量 1.2.3.1估计方 1.2.3.2过度识别检验 1.2.3.3干扰项序列相关检验 1.2.3.4稳健型估计和两阶段估计 1.2.3.5先决变量和内生变量的设定 1.2.3.6系数估计的上下限 1.2.3.7结果输出到**-1.2.1**-1.2.1简 *-模型:y[ita0*y[it-1a1*x[ita2*w[itu_ie[it]*-特征:解释变量中包含了被解释变量的一阶滞后项 可以是非平行面板,但要保证时间连续 ——严格外生变 先决变量(前定变量 E[w_it,e_is]!=0fors<t,butE[x_it,v_is]=0forall 即,前期干扰项与当期x相关,但当期和未来期干扰项与x不相关 y[it-1]——内生变 E[x_it,e_is]!=0for 即,前期和当期,尤其是当期干扰项与x相关 u_i随机效应,在截面间是iid的。u_i与e[it]独立。*-内生性问题:*(1)若假设u_i为随机效Corr(y[i,t-1],u_i)!= (2)若假设u_i 效应,需要想办法去除之,因为数据为"大N小 一阶差分:D.y[i,t-1]=y[i,t-1]-y[i,t- D.e[i,t]=e[i,t]-e[i,t- 显然:Corr(D.y[i,t-1],D.e[i,t])!=0,差分方程存在内生问题; 组内去心:ym[i,t-1]=y[i,t-1]-1/(T-1)*(y[i,t- em[i,t]=e[i,t]-1/T*(e[i,t]+e[i,t- 显然:Corr(ym[i,t-1],em[i,t])!=0,仍然存在内生性问 *-处理办法:IV估计或GMM估计,选择合适的工具变量 矩条件:E[e_it,z_it]= *-1.2.2一阶差分GMM估计 *-背景:*L.Hansen(1982)提出*ArellanoandBond(1991) *-模型: y[it]=a0*y[it-1]+a1*x[it]+a2*w[it]+u_i+v[it]*-假设条件: 干扰项v[it]不存在序列相关;即,corr(v[it],v[it-1])=0 *-适用范围:大N,小*-基本思想:**在AndersonandHisao(1982)基础上增加 可用的工具变**在t=3处,y_i1可以作为所有滞后项的工具变量*在t=4处,y_i1,y_i2可以作为所有滞后项的工具变量* D.y[it]=a1*D.y[it-1]+a2*D.X[it]+ X_it=[x_it,**因此,所有工具变量构成的矩阵如下:* |y_i1 ... ... D.x_i3 | y_i1 ... ... D.x_i4 | y_i1y_i2y_i3... ... D.x_i5 Zi=| | | ...yi1...yiT-2D.xiT**Z_i的行数为T-*Z_i的列数为sum_(m=1)^(T-2){m}+K,K为X的列**以T=7,K=3为例,则Z_i的列数为(1+2+3+4+5+6+7)+3=****OLS的估计系数偏高 FE的估计系数偏低(downward*-设定工具变量的基本原则 对-内生-变量的处理:与上述方法类似, 即滞后两阶以上的水平变量均可作为差分方程的工具变量(GMM*对-先决-变量的处理:滞后一阶以上的水平变量均可作为工具变量(GMM 对-外生-变量的处理:自己作为自己的工具变量(Standard**-1.2.2.1估计方法 *-一个简单的例子:OLS|FE|*-产生模拟数据 *y[it]=0.6*y[it-1]+1.3*x[it]+a[i]+ *x[it]=0.2*x[it-1]+ //*corr(x[it],a[i])=xtarsimyxeta,n(1000)t(10)gamma(0.6)beta(1.3)rho(0.2)one(corr3)sn(9)*- yL.yeststore*- yL.yx,eststore*-xtabond eststoreGMM localm"OLSFE esttab`m',mtitle(`m')nogapb(%6.3f)s(Nr2) *- *c1.L.y系数的无偏性 GMM的估计系数介于OLS和FE之间,这是一个不错的判断方法*c2.x的系数也存在相似的特征*c3.FE和OLS会损失1年的数据;GMM会损失2年的数据*c4.corr(x[it],a[i])越大,OLS的偏误越严重*-ArellanoandBond(1991)原文数*-一阶差分估计量的基本设定 解释变量仅包含y_it的一阶滞后项,默认设定 干扰项同方差,一阶段估计useabdata.dta,xtsetid globalxx"L(0/1).wL(0/2).(kys)yr1980-xtabondneststoreab_0*-结果*-1-L.y会被自动加入*-2-工具变量的个数是如何确定的?(helpxtdpd,*外生变量的工具变量等于外生变量的个数 L(0/1).wL(0/2).(kys)yr1980- 共13*内生变量的工具变量:共27listidyearnL2.nDL2.nifid==**差分方程的可用工具变量* year Years Number*differenceequation 1976- 1976- 1976- 1976- 1976- 1976- * 27*-3-GMM-type和Standard两种类型的工具变量有何差异? GMM-type是针对内生变量或先决变量而言的工具变量,有多列 Standard是针对外生变量而言的工具变量,只有一列 外生变量的一阶差分可以作为自身的工具变量(自己和自己玩**- 过度识别检验(工具变量的使用是否合理 xtabondnL(0/1).wL(0/2).(kys)yr1980- estat *-说明:*H0:overidentifyingrestrictionsare*换言之,干扰项与工具变量不相关 这里,我 了原假设,但AB91 ,当干扰项存在异方差时 Sargan检验倾向于过 原假设,因此此处得到的结论并不可信*采用两阶段估计,然后再执行Sargan检验较为稳妥:xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,estat*-Note:Sargan检验是联合检验--(1)模型设定正确+(2)工具变量合理*因此 原假设时,即p<0.10,意味着上述两个假设至少有一个存在问题*此时,应首先考虑模型设定是否有问题,*进而分析工具变量的设定是否合理,参见Sec**-1.2.2.3干扰项序列相关检验*-*AB91一阶差分估计量要求原始模型的干扰项不存在序列相关,*显然,差分后的干扰项必然存在一阶序列相关, 因此,我们需要检验差分方程的残差是否存在二阶(或更高阶)序列相关即可*-二阶序列相关检验(默认xtabondnL(0/1).wL(0/2).(kys)yr1980-estat 说明:若存在二阶相关,则意味着选取的工具变量不合理**-1.2.2.4稳健型估计和两阶段估计*-稳健型估计xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)eststore*-说明:此时,无法Sargan统计量estat*-两阶段估计*-AB91(Tab4(a2))考虑异方差问题*-思路: 利用第一阶段估计得到的残差构造方差-协方差矩阵,进而重新估计模型xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)eststoreab4*-说明:此时,Sargan检验无 原假estat*-AB91重要建议: (1)采用一阶段估计结果进行系数显著性的统计推断; (2采用两阶段估计给出的Sargan统计量进行模型筛选*-结果对比localmm"ab4_one_rbesttab`mm',mtitle(`mm')nogap *-结论:*AB91_onestep_rb的结果与AB91_WC_rb的参数估计相同,后者标准误较大*建议采用Windmeijer(2005)两阶段-纠偏-稳健型估计量。**-1.2.2.5解释变量中包含内生变量的情形*-基本思想: y[it]=a0*y[it-1]+a1*x[it]+a2*w[it]+u_i+ *上述模型中y[it-1]就是一个典型的内生变量*我们用L(2/.).y[it]作为D.y[it-1]的工具变量*因此,如果假设w[it是内生变量,则*我们用L(2/.)w[it]作为w[it]的工具变量。*-内生变量的设定方法 由于当期干扰项显然会影响后续wln 所以把它设定为内生变量更为合理*-基本设定:xtabondnL(0/2).(kys)yr1980-yr1984,endog(k)estatestat*注意:此时逗号前就不能再出现这个变量了*从Sarganp值来w设为内生变量似乎更为合理**-1.2.2.6弱工具变量问题(很重要 *-问题 *当TT=30,则工具变量的数目会很多,会产生弱工具变量问题*-解决办法:*限制工具变量的个数即限定L(p).y作为工具变量的最大滞后阶数globalxx"L(0/2).(kys)xtabondnL(0/1).w$xx,maxldep(5)estatestat *-此时,只有(L2.n,L3.n,L4.n,L5.n)可以作为D.L.y的工具变量 *而L6.n则不能作为工具变 *-对于一般的内生性变量,处理方法相似 xtabond $xx,maxlags(5)twostep estat estat * *-1.2.2.7系数估计的上下限 *虽然PooledOLS和FixedEffects估计都是有偏的, *但是二者却决定了y_it-1真实估计值的上界和下界 *换言之,PooledOLS估计高估了真实值 而Fixedeffects估计则低估了真实值 useabdata.dta, regnL.nL(0/1).wL(0/2).(kys)yr1980-yr1984, eststore xtregnL.nL(0/1).wL(0/2).(kys)yr1980-yr1984, eststore xtabondnL(0/1).wL(0/2).(kys)yr1980- eststore *-结果对比 esttabOLSDAbondFE,b(%6.3f)t(%6.2f) mtitle(OLSDAbondFE)nogapcompress * *-1.2.2.8结果输出到 useabdata.dta, regnL.nL(0/1).wL(0/2).(kys)yr1980-yr1984, eststore xtregnL.nL(0/1).wL(0/2).(kys)yr1980-yr1984, eststoreFExtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,localdf=e(zrank)-estaddscalarsarganp=estaddscalarar1p=estaddscalarar2p=eststoreDAbond locals"using localmodel"OLSDAbond esttab`model'`s',mtitle(`model')replace b(%6.3f)t(%6.2f)star(*0.1**0.05*** scalar(sargansarganparm1arm2ar1par2pNN_g)///compressnogap *-1.3其他相关命令*-基于Bootstraphelpxtbcfe//BootstrapCorrectedFixedEffects(BCFE)//andinferenceindynamicpaneldata*-截面相关和共同因素问题help//CommonCorrelatedEffectsEstimation//DynamicPanelswithCross-Sectional2*3*4 $$5 $$$$$$$$6 7 $$8 $$9 $$ $$$$$$****————————————————————————————————————————Stata研讨班(基础班 (2016.7.12-群 (stata-连老师-2016暑假————————————————————————————————————————主讲人:连玉君单位:中山大学岭南学院金融系 邮 页 客 程 第一讲B面板VAR模型 PanelVAR*-注意:执行后续命令之前,请先执行如下命令globalpath" //定义课cd //进入本讲文件 globalR //参考文献所在文件夹adopath+ //自编程 *Love,I.,L.Zicchino, Financialdevelopmentanddynamicinvestment Evidencefrompanel QuarterlyReviewofEconomicsandFinance,46(2):190- *-source:Stata学 专题viewbrowse *-原始 out*-主要方法*-PVAR:Panel ||helppvar;helppvar2;help*-PVAR滞后阶数筛 ||help*-面板Granger检 ||help*-PVARIRF和 ||help*-Note:有关VAR的介绍,参见stata高级 B6TimeS.do**-**-应用PVAR模型的几篇文章*Fort,T.C.,Haltiwanger,J.,Jarmin,R.S.,Miranda,*Howfirmsrespondtobusiness*Theroleoffirmageandfirmsize*IMFEconomicReview,2013,61(3):520- * .是土地供应量与房地产税赋提高了房价吗*南方经济,2013,11:27- out ****->PartI:面板VAR模型简介***-1B.1**-1B.1PanelVAR模型简介 help //PVAR的估计,IRF,FEVD,滞后阶数选择、因果检验等*-VAR out"$R\连玉君_chp11_TS.pdf"//时间序列基础 out"$R\连玉君_chp15_VAR.pdf"//书稿,较全面,勿外传 :B6_TimeS.do*-PVAR out"$R\Holtz_1988_PVAR.pdf"//Holtz*-PVAR out"$R\Love2006pvar.pdf" //I.Love的*-在 Scholar中能搜到很多采用Love程序的 :"pvarLove"**-pvar**-pvar命令LOVE的原程序 usegrunfeld.dta, renamecompanyid//截面变量的名称必须为 xtsetidyear helminvestmvaluekstock//前向差分,去 相 pvarkstockinvestmvalue,lag(2)gmmmonte50" p30"pvarkstockinvestmvalue,lag(2)gmmmonte500list_mon p30"impulse**-1B.2**-1B.2pvar2命令:连玉君更新后的程序* *-1B.2.1主要改进 helppvar2 //seeSection:`Whatisnew?'*-(1)*-(2)helm*-(3)timeeffect*-(4)irf(#)*- *-(6)AIC,BIC,HQIC(滞后阶数选择依据 估计结果可以用eststore ,并进而用esttab输*-(7)nographsaving 设定irf()选项后,MC后产生的CI数据会自 在irf_data.dta文件 若附加nograph选项,则只采用MC获得IRF数据,不输出图形*-(8)Granger因果检 *-高级应用:可以自行修改改程序(建议另存后修改doedit"$path\adofiles\pvar2.ado"//打开adodoedit"$path\adofiles\pvar2.hlp"//打开帮助文件* *-1B.2.2PVAR模型的GMM usegrunfeld.dta, xtsetcompanyyear pvar2kstockinvest //默认为PVAR(1) pvar2kstockinvestmvalue,lag(2)*-屏幕呈现方 *-基本列表方式esttab,b(%6.3f)star(*0.1**0.05***0.01)s(NAICBIC nogap*-横向列 esttab,b(%6.3f)star(*0.1**0.05***0.01)s(NAICBICHQIC)widenogap*-横向列表(接排esttab,b(%6.3f)star(*0.1**0.05***0.01)s(NAICBICHQIC)wideonecellstarauxreplace* *-1B.2.3PVAR滞后阶数的选择pvar2kstockinvestmvalue,lag(4)pvar2kstockinvestmvalue,lag(5)soc*-判断规则*1选择AICBIC或HQIC值最小的模型*(2)但三者不一致时,BIC/HQIC倾向于选择比较精简的模型 AIC倾向于选择比较"丰满"的模型 通常,BIC/HQIC优于*(3有时也不能完全依赖上述准则需要做一些人为判断第四章*(4)计算公式:pp.56Eq.(4-31)-Eq.(4-第四章 out"$R\连玉君_PhD_chp4_Panel_VAR.pdf"// 方法: 连玉君.中国上市公司投资效率研究. :经济管 ,2009:*-基本原理pvar2kstockinvestmvalue,eststorepvar2kstockinvestmvalue,eststorepvar2kstockinvestmvalue,eststorepvar2kstockinvestmvalue,eststore*-呈现结果globalm"L1L2L3esttab$m,mtitle($m)star(*0.1**0.05***0.01)s(NAICBICHQIC)b(%6.3f)* *-1B.2.4PVAR冲击反应函数*-Whatis out"$R\连玉君_chp11_TS.pdf"//时间序列基础 out"$R\连玉君_chp15_VAR.pdf"//参见第15.2.4 out"$R\PVAR*AnIRFmeasurestheeffectofashocktoanendogenous*onitselforonanotherendogenousvariable*-参考资料*Lutkepohl(2005, *Lütkepohl,H.NewIntroductiontoMultipleTimeSeries ysis.Springer,*Hamilton(1994, *Hamilton,J.TimeSeries ysis.Princeton:PrincetonUniversityPress,*-pvar2命 pvar2kstockinvestmvalue,lag(2)irf(6)*-*-(1)向前10期 期数的选择决定于你的资料结构,年\月\日pvar2kstockinvestmvalue,lag(2)irf(10)*-(2)默认MC200次,通过reps()选项可以更改MC次数, 报 最终结果时,以500-1000次为宜,视样本数而定 设定reps()时必须同时设定pvar2kstockinvestmvalue,lag(2)irf(10)reps(500) *- 值(seed)的作用*-A.不 值的效*请执行2次,对比结果beginquipvar2kstockinvestmvalue,reps(100)irf(6)preserve//IRFuseIRF_data,listsorderkstock5kstockkstock95in *-B. 值的效 **-结论前一定要设值,以保证结果**-结论前一定要设值,以保证结果的可重现preserve//IRFuseIRF_data,listsorderkstock_5kstockkstock_95in *-C.也可以预先设 (两条命令一起执行 setseedquipvar2kstockinvestmvalue,reps(10)irf(6)preserve//IRFuseIRFdata,listsorderkstock_5kstockkstock_95in*

*-(4)默认自动输出 ,可以进一步输出为.wmf格式,以便贴入pvar2kstockinvestmvalue,lag(2)graphexportFigure.wmf,replace*-(5)图形纵轴的刻度pvar2kstockinvestmvalue,lag(2)irf(6)irfformat(%4.0f)*-(6)绘制黑 :更 模setscheme //设定reps(100),只是为了节省时间pvar2kstockinvestmvalue,lag(2)graphexportFigure_black.wmf,*-Note:其他模helpsetschemes2color//改回默认值(彩 片) *-(7)关于IRF图形的进一步说明*-更改图形的显示模式为黑白graphusegr1_2.gph,scheme(s1mono)//IRFofv1tographexportfig_kstock_invest.wmf,replace//另存*-这个模式的效果也不 graphusegr1_3.gph,graphexportfig_kstock_mvalue.wmf,replace*-利用内存中的数据绘制IRFs图 xtsetcompanypvar2kstockinvestmvalue,lag(2)reps(500)irf(10)dir*.dta//当前工作路径 的数据文件列 //useirf_data.dta,clear//此前自 的IRF数twowaylineinvest_5investinvest_95sifvarname=="kstock",title(IRFsofkstocktoinvest)xtitle(Steps)ylabel(,angle(0))yline(0, scheme(s1mono)graphexportfig_kstock_invest.wmf,*-重新合并多个graphcombinegr11.gphgr12.gphgr1 title("IRFsofkstocktoothervariables")rows(1)ycommoncolfirst * *-1B.2.5PVAR预测误差之方差分解*-含义:ForecastError position, 对内生变量预测的误差变异数中,每一个正交单位冲击的贡献比例。 *-详见 out"$R\连玉君*-Section15.1.6;Section usegrunfeld.dta, xtsetcompany pvar2kstockinvestmvalue,lag(2)irf(5) *-Note:附加nograph选项有助于节省时间 pvar2kstockinvestmvalue,lag(2)irf(10)nograph p(10//更改steps=10 * *-1B.2.6Granger因果检 pvar2kstockinvestmvalue,lag(3)granger*-检验过程解析invest是否为kstock的Granger因?localEq 方程名localv"htest[`Eq']L.`v'=[`Eq']L2.`v'=[`Eq']L3.`v'=*-*执行Granger因果检验时,可以不必拘泥于xtvarsoc选出的滞后阶数*因为Granger因果检验的目的在于检验x滞后项对y的联合影响* *-1B.2.7pvar2.ado的返回 macro //暂 matrix //矩阵 dir //数据文件 dirgr*.gph//图形文件IRFs***-1B.2.8 help //另一个命令,PVAR的估计和冲击反应 sout"$R\Cagala_2015_xtvar_app.pdf"//应*-xtsetyourusextvar.dta,xtsetit*-estimatesvarwithcontemporaneouseffectofy1on*confidenceintervalswithMonte- xtvary1y2,mclags(1)*-estimatesvarwithcontemporaneouseffectofy1on*confidenceintervalswithDoublextvary1y2,dbsnlags(1)*-estimatesvarwithcontemporaneouseffectofy1on*confidenceintervalswithMonte-*savedivcashdivyessicdab001101000divcashdivyessicdab001101000c001000000a001212000///a001101000c002006000a001100000///a002100000a001101000a001123000/// *-estimatesvarwithcontemporaneouseffectofy1on *confidenceintervalswithMonte- *no *300 *10 xtvary1y2,mclags(1)nodrawreps(300)step(10)**-1B.3**-1B.3LoveandZicchino(2006)的实证分析过程 out"$R\Love_2006_pvar.pdf" //I.Love的 * *-1B.3.1样本初筛 clearall setmemory80m//设定Stata占用的内存空间 use"$path\data\GTA2008_my.dta",clear//调入数据 keepidyeartobinsizetlTATDllsgrtagr/// b002000000a003000000province renamea001212000netpeq//期初固定资产净值 renamec002006000capex//购建固定资产、无形资产和其他长期资产支付的现金 renamec001000000cflow//经营活动产生的现金流净额 renameb001101000sales营业收入 keepifyear>1997 //1998年以后采用现金流量表 keepidyeartobinnetpeqcapexcapexsalescflowtagrprovince save"$path\data\LovePVARdata.dta",replace */ * *-1B.3.2定义变量 use"$path\data\Love_PVAR_data.dta",cleargenSTDnetpeq-capex//genIKB=genSKB=genCFKB=renametobintssetidorderidyearSKBCFKBIKBTOBINQ * *-1B.3.3样本再次筛选 *-M&A兼并收购dessumtagr,histogramcountifdropif*-Note:这个完全 判断了,这个处理对结果有何影响**-**-处理为平行面板 xtbalance,range(19992007)miss(*KBTOBINQ)//市场化指数数据:1999- * pp.209,Appendix*-TrimforeachvofvarlistIKBSKBquisum`v',replace`v'=.ifreplace`v'=.if *-New *winsor2IKBSKBCFKB,replacetrimcuts(5 *desIKBSKB * *-1B.3.4合并市场化进程指数数据 *-重新定义省名capsafedropgenstr6prov=replaceprov= ifreplaceprov= ifreplaceprov="福建 ifprovince==3|province==31//31=厦replaceprov= ifreplaceprov= ifprovince==5|province==27replaceprov="广西 ifprovince==6|province==7//7=广*replaceprov="桂林 if= ="海南="河北= ="黑龙江= ="湖南="吉林="江苏="江西="辽宁*replaceprov= ifreplaceprov=" "ifreplaceprov= ifreplaceprov="青海 ifreplaceprov="山东 ifreplaceprov="山西 ifreplaceprov="陕西 ifreplaceprov= if*replaceprov= ifreplaceprov= ifreplaceprov= ifreplaceprov= if*replaceprov="厦门 ifreplaceprov= ifreplaceprov="云南 ifreplaceprov="浙江 ifreplaceprov="重庆 if * *-合并数据 mergen:1provyearusing"$path\D dropif "//删除没有省份归属数据的观察值 * *-1B.3.5Love文中的结 *-定义High-Low虚拟变量dropvarsgenFD //4a.金融业市场化程度bysortprov:egenFD_p50=median(FD) 的中位数,去除年度差异quisumFD_p50,genHigh_FD=FD_p50>r(p50)//FD大于样本中位数的省份定义为1,否则为 * *-表 * *-Column2-tabproviftabprovif*-Column panelsid:tabprovifpanelsid:tabprovif*-ColumntabstatFDifHighFD==1,s(mean)by(prov)tabstatFDifHigh_FD==0,s(mean)by(prov)f(%6.3f) * *-表 * bysortHigh_FD: tabstatSKBCFKBIKBTOBINQ,s(meansdminqmax)c(s)f(%4.2f) *-模型设定:滞后阶数的选取 pvar2SKBCFKBIKB,lag(4) //Full pvar2SKBCFKBIKBifHigh_FD==1,lag(4)soc// pvar2SKBCFKBIKBifHigh_FD==0,lag(4)soc//Low * *-表 3-variablesPVAR **-区分金融发展水平pvar2SKBCFKBIKBifHigh_FD==1,eststorepvar2SKBCFKBIKBifHigh_FD==0,eststoreLow localm"Low esttab`m',mtitle(`m')star(*0.1**0.05***0.01) s(NAICBICHQIC)b(%6.3f)widenogapcompressreplace * *-表 4-variablesPVAR*xtsetidpvar2SKBCFKBTOBINQ,eststorepvar2SKBCFKBTOBINQifHigh_FD==1,eststorepvar2SKBCFKBTOBINQifHighFD==0,eststore localm"All4High4 esttab`m',mtitle(`m')star(*0.1**0.05***0.01) s(NAICBICHQIC)b(%6.3f)widenogapcompressreplace**-图 Low-FDIRF3-variablesPVARmodel||冲击反应函* xtsetid*正式投稿前一定要设 pvar2SKBCFKBIKBifHigh_FD==0,reps(1000)irf(6)graphexportFig013IRFlow.wmf,replace//保存 ,可直接贴入word*-Note:变量的顺序很重要(seepp.194-*-(1)所谓"正交冲击反应函数"是指经过Cholesky分解后的干扰项 Cholesky分解与变量的先后顺序有关*-(2排序依据外生性越强的变量越先出现 SKB[t]-->IKB[t]--> CFKB[t]-->IKB[t]-->*so,SKBandCFKB应该放在IKB之前 TOBINQ[t-1]-->SKB[t],CFKB[t],*so,TOBINQ应该放在最后*白话版规则:分析一下 "的先后顺序,进而按此顺序放置变量即**-图 High-FDIRF3-variablesPVARmodel||冲击反应函* xtsetidpvar2SKBCFKBIKBifHigh_FD==1,reps(1000)irf(6)graphexportFig01_3IRF_high.wmf,replace//保存 ,可直接贴入word**-图 IRF-differenceHighv.s.* *-计算依据:pp.195倒数第9行(合理性值得怀疑*-Assumption:两个样本独立 globaloption"reps(1000)irf(6)seed(13579) xtsetid pvar2SKBCFKBIKBifHigh_FD==0,saving(IRF3_low) pvar2SKBCFKBIKBifHigh_FD==1,saving(IRF3_high)$option pvar2irfdiff"IRF3low""IRF3high" graphexportFig03_3IRF_diff.wmf, * *-图 Low-FDIRF4-variablesPVARmodel||冲击反应函 * idSKBCFKBIKBTOBINQifHighFD==0,reps(1000)irf(6)exportFig04_4IRF_low.wmf,**-图 High-FDIRF4-variablesPVARmodel||冲击反应函* xtsetidpvar2SKBCFKBIKBTOBINQifHigh_FD==1,reps(1000)irf(6)graphexportFig05_4IRF_high.wmf,replace**-图 IRF-differenceHighv.s.Low(4-* *-计算依据:pp.195倒数第9行(合理性值得怀疑*-Assumption:两个样本独立 globaloption"reps(1000)irf(6)seed(13579) xtsetid pvar2SKBCFKBIKBTOBINQifHigh_FD==0,saving(IRF4_low) pvar2SKBCFKBIKBTOBINQifHigh_FD==1,saving(IRF4_high)$option pvar2irfdiff"IRF4low""IRF4high" graphexportFig06_4IRF_diff.wmf, * *-表 方差分解3-variablesPVAR * *-PanelA:LowFD 3variables pvar2SKBCFKBIKBifHigh_FD==0, irf(10)nograph p(10)//10periodsahead*-*(1)结果释义 最后三行就 中报告的结 *(2) 就目前这个版本而言,首次计算FEVD时,还需设定irf(10*-Love程序的做法xtsetid KBCFKB //前向差分,去 相pvarSKBCFKBIKB,lag(1)gmm p *-PanelB:High 3 pvar2SKBCFKBIKBifHigh_FD==1, irf(10)nograph *-PanelC:Low 4 pvar2SKBCFKBIKBTOBINQifHighFD==0, irf(10)nograph *-PanelD:High 4 pvar2SKBCFKBIKBTOBINQifHigh_FD==1, irf(10) *Appendix: 化进程指数(1999-2007)处理过程**-**-(1)相关文件存放路径 *-(2调用方法 cd al\PX_papers\Data\mkt_index//数据所在文件 use"China_MI.dta",*-(3)致谢:这些数据和主要处理过程由人民大学的黄继承博士提供,特此致谢! ,黄继承 市场化进程与资本结构动态调整 管理世界,(3):124- clear //让 处于初始状态,清除所有使用过的痕 cd doeditChina_MI_dofile.do//dofile处理过程************************************$$$$$$$$$$$$ $$ $$$ $ $$ $ $$————————————————————————————————————————Stata研讨班(基础班(2016.7.12-群(stata-连老师-2016暑假————————————————————————————————————————主讲人:连玉君位:中山大学岭南学院金融系邮:页:客:程:课* 本*23456789 第二讲:自抽样与MonteCarlo模拟分析 BootstrapandMonteCarlo *-注意:执行后续命令之前,请先执行如下三条命令globalpath" //定义课cd //进入本globalR //参考文献所在文件夹adopath //自编程序 2.1Bootstrap 2.1.1一些基本概念 2.1.1.1抽样样本与 2.1.1.2获得经验样本的两种方法 2.1.1.3标准差(SD)标准误(SE与临界值 2.1.1.4p值与经验p****工具变量面板数据模**

Bootstrap简介范例1:OLS估计系数的标准误BS的相关说明 2.2Stata常用命令中BS标准误的设定 2.2.1 2.3Bootstrap组间系数差异检验 2.3.1利用交乘项 2.3.2分组回归 2.4 模 2.4.1MC的基本思想 2.4.2MC应用实例:内生偏误的 产生模拟数据 2.4.2.2OLS估计量的性质 2.4.2.3IV估计量的性质*-2.1Bootstrap *-Bootstrap out"$R\BS_Guan_SJ3-1.pdf"//非常简洁明了 *-Efron,B.,R.Tibshirani.Anintroductiontothe*NewYork:Chapmann&Hall, out"$R\BS_Efron_1993.pdf"//经典著*-Chernick,M.R.Bootstrap*Aguideforpractitionersand*Wiley-Interscience, *-Good,P.Permutation,parametric,andbootstraptestsof *NewYork:Springer, **-2.1.1**-2.1.1一些基本概念 * *-2.1.1.1抽样样本(sample)与 (population) *-Population:符合特定条件的一组样本, 市身高在185cm以上 *-Sample: 中随机抽取的一部分样本,代 的特征*-随机抽取的样本应该具有如下两个特征:*-1每个观察值被抽到的概率是相同的:*-2A观察值与B观察值是独立抽取的 *-EmpiricalSample:若现有的Sample是 中随机抽取的我们把这个二我们把这个二次抽取的样本称为"经验样本那么从这个Sample中随机抽取的样本也能够代****- 获得经验样本的两种方法*数据useB9_intro_x,list,*传统随机抽样:不重复(无放回抽样useB9_intro_x,sample5,count//抽样个 过原始样本 //原始抽样结果sort //便于查看结果*Bootstrap抽样:可重复(有放回抽样useB9_intro_x,list,table //请反复执行上述4条命令,总结规**-2.1.1.3标准差(SD),标准误(SE与临界值 out"$R\BSSDSE.pdf"* *-标准差* 衡量了某个变量的观测值与其均值之间的偏离程度 描述数据特征时,必须报告这个统计量**-标准误* 以样本均值的标准误为例,即 衡量了"平均值"与其"真实值 均值)之间的偏离程*[SD] lsusabouttheshapeofour howclosetheindividualdatavaluesarefromthemeanoftheoverall***[SE] lsushowcloseoursamplemeanistotheoftheoverall** SE= *-标准误的另一种理解方式*假设我们有足够的经费,可以获得J=50组样本*每组样本中包含N=1000个观察值*对应于这50组样本,可以获得50个均值:*它们都 均值的一个替代指*注意:mean只是衡 分布的一个统计量而已,类似的统计量还有 SD(m1,m2,...,m50)= *这是SE最原始的定义:很重要*对于一些无法确知分布形式的统计量Q,如果能通过Jackknife,Bootstrap*方式获得J组经验样本,并计算出相应的(Q1,Q2,...QJ),则 SE(Q)= *-范例:基于经验样本获得均值的标准误*-传统方法得到的结果useB9_intro_x,list 数据形sum //Mean=4;dis2.828427/sqrt(6)//ci //regx,noheader 求取mean和SE*-Case1:无放回的抽样useB9introx,sample5, //抽样个 过原始样本 //原始抽样结果sort //排序后的结果doBS_intro_case1.do//抽样50sumregx,noheader//与传统方法对 *-Case2:有放回的抽样useB9_intro_x,table //请反复执行上述4条命令doeBS_intro_case2.do//抽样50sumregx,noheader//与传统方法对比**-临界值**(Q1,Q2,...QJ)的第95th百分位数值就是Q的95%置信水平下的临界值setobssetseedgenz= //histogramz,normal*Q:z的90%置信区间是多少?*ACI90[p5 表示第5百分位上的数值*本例中CI90=[-1.624514,sumz,detail*理论上的数值为:disdis*p countifdis //这是什么**-2.1.1.4p值与经验p *-p-value normal(- dis1-normal(+1.96) //probility(x>=1.96)twoway(functiony=normalden(x),range(-4 e) (functiony=normalden(x), recast(area)color(pink*0.2)xlabel(01.96)),legend(off)text(0.20 *-p值:假设x~N(0,1),x>=1.96的概率是2.5% *-另一个视角:经验p值(EmpiricalP-value)local *localsetobsgenx=rnormal()//countif //orcountifdis //这就是经验p值,它完全来自于手头的经验样本 sort geni= dis //这是什么?Hint: dis *-comments:可以根据排位找出特定分位点上数值**-2.1.2**-2.1.2Bootstrap简 * *-2.1.2.1范例1:OLS估计系数的标准 *-问题的背景*假设手头的样本(S0) 中随机抽取的 regyxusingS0,bx(x变量的OLS估计系数*b_x是无偏的,如何求取SE(b_x) *-基本思想:采用Bootstrap获取系数的标准误*从S0中随机抽取的经验样本s1,s2,...,也可以推 特征 *-步骤:*1.从S0中可重复地(有放回地)抽取N个观察值,形成经验样本*2.使用s1执行OLS,得到x的系数估计值*3.将第2-3步重复进行K=300次,得到系数估计值的300个经验值, b_j={b1,b2,...,*4.计算这300个估计值的标准差SD(b_j)=SD{b1,b2,..., 将其视为实际估计值b_x的标准误,即SD(b_j)=*5.计算t值:t=b_x/SE(b_x),以及相应的p *-Stata实现过程sysuseauto,regpriceweight,vce(bs,reps(50))*-过程解析(了解思路即可**(3若采用BS**(3若采用BS获得多个描述样本分布的统计量,1000次以上;多数情况下次可重复抽样即可获得非常稳定的结果。genbj //记录抽样估计结果forvaluesj= //Bootstrapquiregpricequireplacebj=_b[weight]in sumbj //计算标准差=SE(weight)regpricewei //OLS的regpriceweinoheaderrobust//white(1980)标准*-Q:p5和p95有没有特殊的含义sumbj,detail**-小结:Boostrap的基本原理*以上便是Bootstrap的基本思想。*如果我们把上例中的b_x替换为其他统计量,*如OLS回归中的R2F检验统计量,样本的中位数,样本的方差,等等,*采用上述方法都可以得到这些统计量的标准误。 在得到标准误后,我们可以根据大数定理(LLN) 极限定理*计算这些统计量的置信区间。*虽然Bootstrap有很多变种,在具体问题的分析过程中可能会相对复杂,*但其基本思想就是如此简单 从“观测样本”中进行多次可重复抽样可以近 出 因此,我们可以通过分析这些“经验样本”的特征 ”的分布特征 **-2.1.2.2BS的相关说明 *-BS的基本假设 观测样本是 中随机抽取的,能够很好地描 的分布特*因此,若反复对观测样本进行可重复抽样,*得到的经验分布(empiricaldistribution)将 分布非常接近 *-BS的精度*决定于*(1原始观测样本中包含的样本数;*(2)BS抽样的次数。 *-BS抽样的次数*视研究的目的而定:*(1)若采用BS获得标准误,50-200次即可;Efron(1993,*(2)若采用BS获得置信区间,500-1000次即可; *-BS产生的经验样本个数 *-Q:为什么采用BS可以近似模拟 m

分布?) (其中) n n!(m- capprogramdropprogramdefinebsargslocalm=2*`n'-localN=comb(`m',`n')//helpmathdising"n="inydising"N="iny%-20.0f bs_N 运行程 *以n=2为例:X=( *则BS样本将有3 *(x1,x1);(x2,x2); *以n=3为例,X=(*则BS样本将有10个 *(x1,x1,x1);(x2,x2,x2);*(x1,x2,x2);*(x1,x1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论