一文读懂倾向匹配得分Stata及R操作应用_第1页
一文读懂倾向匹配得分Stata及R操作应用_第2页
一文读懂倾向匹配得分Stata及R操作应用_第3页
一文读懂倾向匹配得分Stata及R操作应用_第4页
一文读懂倾向匹配得分Stata及R操作应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文读懂倾向匹配得分Stata及R操作应用本文将介绍Stata及R软件进行倾向匹配得分操作应用,主要包括倾向匹配得分命令简介、语法格式、倾向匹配得分操作步骤思路,涉及倾向匹配得分应用、平衡性检验、共同取值范围检验、核密度函数图等内容。1命令简介Statadoesnothaveabuilt-incommandforpropensityscorematching,anon-experimentalmethodofsamplingthatproducesacontrolgroupwhosedistributionofcovariatesissimilartothatofthetreatedgroup.

2、However,thereareseveraluser-writtenmodulesforthismethod.Thefollowingmodulesareamongthemostpopular:Stata没有一个内置的倾向评分匹配的命令,一种非实验性的抽样方法,它产生一个控制组,它的协变量分布与被处理组的分布相似。但是,这个方法有几个用户编写的模块。以下是最受欢迎的模块(主要有如下几个外部命令)psmatch2.adopscore.adonnmatch.adopsmatch2.adowasdevelopedbyLeuvenandSianesi(2003)andpscore.adobyBeck

3、erandIchino(2002).Morerecently,Abadie,Drukker,Herr,andImbens(2004)introducednnmatch.ado.Allthreemodulessupportpair-matchingaswellassubclassification.Ycommandasfollows:netsearchpsmatch2netsearchpscorenetsearchnnmatchYcommand,forexample:sscinstallpsmatch2,replaceAfterinstallation,readthehelpfilestofin

4、dthecorrectusage,forexample:helppsmatch2上述主要介绍了如何获得PSM相关的命令,总结一下目前市面上用的较好的命令为osmatch2.PSM相关命令helppsmatch2helpnnmatchhelppsmatchhelppscore持续获取最新的PSM信息和程序持续获取最新的PSM信息和程序finditpropensityscorefinditmatchingpsmatch2isbeingcontinuouslyimprovedanddeveloped.Makesuretokeepyourversionup-to-dateasfollowssscins

5、tallpsmatch2,replacewhereyoucancheckyourversionasfollows:whichpsmatch22语法格式语法格式为:helppsmatch2psmatch2depvarindepvarsifexpinrange,outcome(varlist)pscore(varname)neighbor(integer)radiuscaliper(real)mahalanobis(varlist)ai(integer)populationaltvariancekernelllrkerneltype(type)bwidth(real)splinenknots(in

6、teger)commontrim(real)noreplacementdescendingoddsindexlogittiesquietlyw(matrix)ate选项含义为:depvar因变量;indepvars表示协变量;outcome(varlist)表示结果变量;logit指定使用logit模型进行拟合,默认的是probit模型;neighbor脂定按照1:1进行匹配,如果要按照1:3进行匹配,则设定为neighbor);radius表示半径匹配核匹配(Kernelmatching)其他匹配方法广义精确匹配(CoarsenedExactMatching)|helpcem局部线性回归匹配

7、(Locallinearregressionmatching)样条匹配(Splinematching)样条匹配(Splinematching)马氏匹配(Mahalanobismatching)pstest$X,both做匹配前后的均衡性检验,理论上说此处只能对连续变量做均衡性检验,对分类变量的均衡性检验应该重新整理数据后运用c2检验或者秩和检验。但此处对于分类变量也有一定的参考价值。psgraph对匹配的结果进行图示。3Stata操作与应用政策背景:国家支持工作示范项目(NationalSupportedWork,NSW)研究目的:检验接受该项目(培训)与不接受该项目(培训)对工资的影响。基本

8、思想:分析接受培训组(处理组,treatmentgroup)接受培训行为与不接受培训行为在工资表现上的差异。但是,现实可以观测到的是处理组接受培训的事实,而处理组没有接受培训会怎样是不可能观测到的,这种状态也成为反事实(counterfactual)。匹配法就是为了解决这种不可观测事实的方法。在倾向得分匹配方法(PropensityScoreMatching)中,根据处理指示变量将样本分为两个组,一是处理组,在本例中就是在NSW实施后接受培训的组;二是对照组(comparisongroup),在本例中就是在NSW实施后不接受培训的组。倾向得分匹配方法的基本思想是,在处理组和对照组样本通过一定的

9、方式匹配后,在其他条件完全相同的情况下,通过接受培训的组(处理组)与不接受培训的组(对照组)在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。1、首先进行数据结构查看useldw_exper.dta,cleareddesc结果为:g数琳辑器屣辑-I竝邙曰文唄R编辑(E:视国懈叨工具nodegree80142123214124-10-7474514951.3414*dcContainsdatafromlchcxper.dtibs:vars;44512拥Jan201312:47storagedisplayvariableraitotypeformatlabelvariablelabelt

10、byte灌啣participatiorinjobtrainingprognn死已byt&educbytess.agyearsofeducationblackbyteindicatorforAfrican-Americanhi印byteindicatorforHispanicmarriedbyteindicatorformarried2、描述性分析叽indicatorfornwrethangradeschoolbutlesstharhigh-schooleducationre74float3.3grealearningsIn1974(inthouundsof1371$re75floatreale

11、arningsin1975(inthousandstrf1978$)re73floatrealearningsLn19Z8(irthousandsof1978$)tabulatet,flDatzsummarizee78炸ansstandardindicatorforunemployedin19744i片川fh+at#nrlAnciFnlAl/aH107b:I.三.匸*才亠ill口#勺rri-Iflitabulatet#summarize(re78)meansstandardparttLcipationiijobtrainingprogramSunnaryofrealearningsin1976

12、(inthcusandsof1978$)MeanStd.Dev.a3、倾向匹配彳4*55480寻分6.34914545,48383667.B67W73.1首先进沸IE序,生成随机数种子4的4setseed20180105产生随机数种子genu=runiformsortu/排序或者orderu3.2倾向匹配得分localv1tlocalv2ageedublackhispmarriedre74re75u74u75globalxv1v2psmatch2$x,out(re78)neighbor(1)atetieslogitcommon/1:1匹配$表示引用宏变量,等价于psmatch2tageedub

13、lackhispmarriedre74re75u74u75,out(re78)neighbor(1)atetieslogitcommon结果为:3.3查看匹配后数据结果为:打开数据编辑窗口,会发现软件自动生成了几个新变量:其中_pscore是每个观测值对应的倾向值;小是自动生成的每一个观测对象唯一的ID(事实上这列变量即是对_pscore排序);_treated表示某个对象是否试验组;_n1表示的是他被匹配到的对照对象的d(如果是1:3匹配,还会生成2,_n3);_pdi俵示一组匹配了的观察对象他们概率值的差。3.4均衡性检验pstest$v2,bothgraph结果为:3.5共同取值范围ps

14、graph结果为:3.6核密度函数图twoway(kdensity_psif_treat=1,legend(label(1Treat)(kdensity_psif_treat=0,legend(label(2Control),xtitle(Pscore)title(BeforeMatching).twoway(kdensity_psif_treat=1,legend(label(1Treat)(kdensity_psif(_weight!=1&_weight!=.),legend(label(2Control),xtitle(Pscore)title(AfterMatching)结果为:3R操

15、作与应用描述:这是国家支持工作示范(NSW)处理组数据的子样本和当前人口调查(CPS)的比较样本。Lalonde(1986)、Dehejia和Wahba(1999)对这些数据进行了广泛的分析。R软件操作倾向匹配得分的函数安装包比较多,下面介绍一种,叫做Matching,其他的还有Matchit等。使用Matching前,需要先进行安装:install.packages(“Matching)就可以安装了。1、首先进行数据查看data(lalonde)summary(lalonde)ageeducblackMin.:17.00Min.:3.0Min.:0.00001stQu.:20.001stQu

16、.:9.01stQu.:1.0000Median:24.00Median:10.0Median:1.0000Mean:25.37Mean:10.2Mean:0.83373rdQu.:28.003rdQu.:11.03rdQu.:1.0000Max.:55.00Max.:16.0Max.:1.0000hispmarriedMin.:0.00000Min.:0.00001stQu.:0.000001stQu.:0.0000Median:0.00000Median:0.0000Mean:0.08764Mean:0.16853rdQu.:0.000003rdQu.:0.0000Max.:1.00000

17、Max.:1.0000nodegrre74Min.:0.000Min.:0.01stQu.:1.0001stQu.:0.0Median:1.000Median:0.0Mean:0.782Mean:2102.33rdQu.:1.0003rdQu.:824.4Max.:1.000Max.:39570.7re75re78u74Min.:0Min.:0Min.:0.00001stQu.:01stQu.:01stQu.:0.0000Median:0Median:3702Median:1.0000Mean:1377Mean:5301Mean:0.73263rdQu.:12213rdQu.:81253rdQ

18、u.:1.0000Max.:25142Max.:60308Max.:1.0000u75treatMin.:0.0000Min.:0.00001stQu.:0.00001stQu.:0.0000Median:1.0000Median:0.0000Mean:0.6494Mean:0.41573rdQu.:1.00003rdQu.:1.0000Max.:1.0000Max.:1.0000View(lalonde)结果为:数据介绍:包含对以下12个变量的445个观察值。age表示年龄educ:受教育年限black:是否为黑人hispan:是否为西班牙裔married:是否已婚nodegree:是否没有毕业文凭。re74,1974年的实际收入。re75,1975年的实际收入。re78,1978年的实际收入。u74,1974年的收入指标变量为零。u75,1975年收入的指标变量为零。treat:是否接受职业培训。2、估计倾向匹配模型glm1-glm(treatage+I(ageA2)+educ+I(educA2)+black+hisp+married+nodegr+re74+I(re74A2)+re75+I(re75A2)+u74+u75,family=binomial,data=lalonde)3保存数据对象X-glm1$fittedY-lalonde$

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论