版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
References:JoshuaAngrist(2006)."TreatmentEffects"(entryfortheNewPalgraveDictionaryofEconomics)availableathttp:/,/ec:/facility/indcx.litin?prof_id=aiigristAlrtype=pnblica-JeffreyM.Wooldridge(2002),EconometricAnalysisofCrossSectionandPanelData,MITPress.Chapter18Myoiiiig-.IacLee(2005),Micw-EconometriesforPolicy.Program,andTreatmentEffects.OUP.,AngusDeaton(2009),^InstnunentsofDcvelopiiieirt:RandomizationintheTropicsandtheSearchfortheElusiveKeystoEconomicDevelopment.NBERWorkingPaper14690GuidoW.Iinbcns(2009),"BetterLATEThanNotliing;SomeCoiiuncntsonDeaton(2009)andHeckmanandUrzua(2009)(miiiieograpli)OptionalreadingsAngrist(1990),LifetimeEarningsandtheVietnamEraDraftLottery:EvidencefromSocialSecurityAdministrativeRecords.AmericanEconomicReview.80(3):313-36.[onnaturalexperiments]Manski(1996),LearningaboutIreatinentEtiectsirouiExperimentswitliKaiidomAssignmentofTrcatinciits,JournalofHuinaiiResources,31(4):709-33.[onCDinpliancc]Black,S.E.(1999),“DoBetterSchoolsMatter?PaientalEvaluationofElemcntaiyEducationQuarterly.JournalofEconomics.114:577-99[onregressiondiscontinuitydesign]Bertrand.DufloandMullainatlian(2004),"HowMuchShouldWeTrustDiffercnces-in-DiffercncesEstimates?",QuarterlyJournalofEconomics[onestimatingstandarderrors]RaymondFisman(2001).EstimatingtheValueofPoliticalConnections.AmericanEconomicReview,91(4):1095-1102.September2001[eventstudies]Onpropensityscorematching:Rubin(1974).EstimatingCausalEffectsofTreatmentsinRandomizedandNonrandoinizedStndips.Joni'TinlofF.du.c.at:ionalPsychology.66(5):6SS-701.RosciibauinandRubin(1983),TheCentralRoleofthePropensityScoreinObservationalStudiesforCausalEffect,Biomctrika.70(1):41-55Heckman.IchinniraandTodd(1998),MatchingasanEconometricEvaluationEstimator.ReviewofEconomicStudies.65(2):261-94.LaLonde(1986),EvaluatingtheEconometricEvaluationsofTrainingProgramswithExperimentalData,AmericanEconomicReview.76(4):604-20Dchija.R.HandS.Waliba(1999),“CausalEffectsinNoiicxpcrimcntalStudies:ReevaluatingtheEvaluationofTrainingPrograms",,Journalofthe.4rnehcanStatistical.Association,94(448):1053-62SmithandTodd(2005),DoesMatchingOvercomeLaLonde^sCritiqueofNonexperimentalEstimators?.JournalofEconometrics.125:305-353.Abadie.Drukker.HerrandImbeiis(2004),IinplementingMatchingEstimatorsforAverageTicatiiieutEffectsiiiStata,Stata.Journal.4(3):290-311DavidMcKenzie(2008),"InPursuitofBalance:RandomizationinPracticeinDevelopmentFieldExperiuicuts”.The\VdrldBank(miiiieograpli)Oninstrumentalvariables:Heckman(1997).InstmiuentalVariables:AStudyofImplicitBehavioralAssiiiiiptionsUsediiiMakingProgramEvaluations,,JournalofHumanResources.32(3):441-62Angiist.Imbeiis.andRubin(1996),IdentificationofCausalEffectsUsingInstrumentalVariables.Joui'jialoftheAmericalStatisticalInstitute.91(434):444-72Angt'ist;1998),EstimatingtheLaborMarketImpactofVoluntaryMilitaryServiceUsingSocialSecurityDataonMilitaryApplicants.Econometrica,66(2):249-SSAngristandKrueger(2001LInstrumentalVariablesaniltheSearch,forIdentification:FromSupplyDemandtoNaturalExperiments;JournalofEconomicPerspective,13(4〕:69-85.ImbeiisandAngrist(1994].](lenrificariunandEstimarionofLocalAverageTteatmentEffects.Econometrica,62(2):467-75.Onmarginalmatchingestimators:Behrman,ChengandTodd(2004〕「'EvaluatingPreschoolProgramswithLengthofExposuretothePiogi'amVaries:ANonparanietricApproacli'.ReviewofEconomicsandStatistics.8G(1i;108-32.第七讲政策项目评估和参与效应MarcelFafchamps
OxfordUniversity第一部分问题1、彩排2、符号第二部分 基于可观测因素的选择/参与的无关性3.介绍假定实验法随机实验法平衡和随机化方法自然实验法顺从性和污染性双盲90皿10-611加),安慰剂效应(placeboeffect),霍桑效应(Hawthorneeffect),响应偏差(responsebias)内部有效性和外部有效性4、估计非参数法识别(identification)回归法同质效应异质效应推理和假说验证5、回归不连续设计参数RDD灵敏非参数RDD模糊非参数RDD前后估计(before-after)6、匹配法(Matching)面板数据事件研究和差异中的差分(eventstudiesanddif-in-dif)扩充部分(多于两期)使用dif-in-dif推导.倾向得分法方法a:方法b:部分出局(partiallingout)方法C异质性效应部分出局(partiallingoutwithheterogeneouseffects).倾向得分匹配一般概念估计法的选择共同支撑平衡性应用其它最近邻居匹配法STATA命令第三部分工具变量法.方法a(标准IV)10方法b(以倾向得分为工具).方法c(异质性参与下的IV).方法d(额外项的IV).方法e(选择修正OLS)、LATELATE,随机化,异质性第四部分非二元参与15参与无关性16边际匹配估计(marginalmatching)17工具变量法第一部分问题参与效应的文献,关注于科学或政策问题中,二元变量W(称之为参与变量,或政策变量)对产出变量Y的因果影响。正如“参与"(treatment)这一词条暗含的含义,文献发现,它起源于医药试验评估,因此W表示执行一种新药或外科手术,Y衡量了健康的结果一一如:存活或康复。在参与效应术语和方法用于检测美国培训项目补贴的效应时,这个方法成为经济学家的关注点。从这个应用中,经济学家们认识到,简单的回归分析,虽然很有用,但是却不能尽数解决(exhaust)参与效应评估提出的问题。事实上,现在参与效应的方法已经遍布在经济学经验研究的各个领域,并且在劳动经济学和发展经济学有了强劲的发展。如果你打算在这些领域做实证研究,你绝对需要掌握好这篇文献的知识。甚至如果你不打算在这些领域工作,这篇文献也是有用的,因为参与效应的文献帮助你把经济学的因果推理问题进行分类。在这一过程中,我们将会学习一些新的词汇和新的技巧,我们还会把以前的技巧赋予一种新的含义。JoshuaAngrist为新帕尔格雷夫(NewPalgrave)编写的名为参与效应的入门材料,是一篇优秀的参与效应文献的简介。可参看Josh的个人网站。伍德里奇的第18章,严谨、简洁介绍了评估的主要问题。它最大的优点是,它是从经济学会刊的视角来编写的,也就是说:它使用的是为经济学家熟知的词汇和表述。任何可能的情况下,我会按照伍德里奇的方法(进行编写)。不幸的是,有些问题伍德里奇没有包括。在这些情况下我尽量使用Lee的书(参看前面阅读列表)。Lee的书包含的内容更全面,而且是对伍德里奇很有用的补充。但我发现,有时候它有点啰嗦。再说,选择修正(selectioncorrection)这种技术性问题,伍德里奇的书陈述的更好。在讨论倾向得分匹配的时候,我使用在阅读列表里的文章。1、例子围绕估计参与效应的问题,可能可以从一个例子开始。说政府为失业者实施补贴培训项目。政府要求你去评估:该项目在帮助失业者就业和获得更高工资方面的效果。你希望检验的假设是,接受培训的人比那些不接受培训的人处境要好。假设你有工人的随机样本数据,其中一些人已经参与了培训。你有所有工人的工资和培训数据。形式上,Y是收益(工资)的产出,W={0,1}是参与变量,一一也就是说w=1表示工人接受培训,0则相反。定义Y0是不培训的产出,Y1是培训的产出。你计算样本的估计值:E[y1|4=1]-E[y0|4=0]也就是说,你计算这些接受和不接受培训工人两个平均值。你发现,两者之差是负的:意味着培训的人工资更低些!难道是培训减少了工资?到底怎么回事?你怎么告诉政策制定者这个结果?那么,一种可能是,接受培训的工人和那些不培训的工人,不是真实同类,不可比。他们可能在年龄,教育,工作经验和其他方面不相同。一种可能的解决方法就是,控制样本工人的教育,年龄,性别,种族,等等,可以影响工资的属性。如果说,受教育的工人工资更高,参与培训的主要是未受教育的工人,那么,无条件平均差异E[y11w=1]-E[y01w=0]应该是负的。有两种方法可以控制可观察属性。一种方法是估计下面形式的回归:y.=5+a3,+XP+u (1.1)这里X是可观察属性向量。这个回归暗含了下面的假设:Zy=5+XP+uy=5+a+XP+u从这两式可以得到:E[y1IX,①=1]-E[y0IX,①=0]二a系数a是参与效应的估计值。这是标准的计量经济学(econometric)方法:加入控制变量,可以减少遗漏变量带来的偏差,例如,有些控制变量既对产出有影响,也和接受培训相关。另一种方法是限制对比个人的选择,也即,选取具有相同属性的个体作为对照。例如,假设参与培训的都是未受教育的。我们就可以简单对比未受教育的培训者、未培训者的工资差异,而不考虑受教育的工人组。这种方法的优点是,我们不用做关于教育对产出影响的形式的任何假设(如,线性,函数形式)。这类估计法叫做匹配评估法。我们将会在这一过程中讨论一系列这类方法。现在假设你控制可观测变量,你还是发现:E[y1IX,3=1]-E[y0IX,3=0]<0那么,你打算怎样告知政策制定者?他们应该取消这一项目?然而,不仅仅是这样,我们之前就说过,我们应该与对比者进行对比。这些接受培训的的工人,可能是在第一阶段找工作很困难的个体,他们可能就有使他们就业能力更低的不可观测的因素一一如,他们技术不好,或者他们忘记了学校里学的技术。如果这是真的,那么方程(1.1)中的误差项和培训的虚拟变量相关了:接受培训的个体如果没有培训,就应该具有更低的U,因此在不培训的情况下,他们的工资本来就比不培训的个体(受教育个体)更低。如果相关性太强,会导致估计结果为负,密标记。在这篇文献中,这个问题就是基于不可观测因素的选择问题:培训的个体是以一种不可观测的方式被“选择的”,同时这方式与产业收益是相关的。作为一名优秀的经济研究者,你马上想起解决这个问题的可能的方法:我们可以把W作为工具变量来消除由于没有观察的选择影响导致的遗漏变量偏差。显然,只有我们能有一个合适的工具变量,这个方法才是可行的。另一种可能的解决方法是通过Mill比率(Millration)方法直接修正选择偏差。这也需要工具变量。我们将会讨论这些方法如何应用在参与效应中。现在,你对可信地估计参与效应的难度有了更深的了解,你可能从一开始就预想到了这些困难。下次政策制定者要求你协助评估一个项目,需要一个随机试验。在一个随机试验里,参与是在个体间随机安排的,而且收集了参与者(treated)和未参与者(untreated)的相应产出的信息。接受参与的个体称为参与者;其他称为控制组-或简称为controls。因而,通过构建随机试验,W和方程(1.1)误差项不相关了,随机化消除了基于不可观察因素的选择问题。就算是随机试验,人们还是要小心解释结果。可以合理的预想,补贴培训项目帮助缺乏培训的人。但是它应该对不需要培训的人不产生影响(意味着忽视了一般均衡影响)。这意味着随机试验的结果并不一定适用于其他组。这个思想即后面讲到的参与者的参与效应(treatmenteffectonthetreated),意思是说,只考虑那些接受参与的个体组的参与效应。这里还存在参与的自选择问题,即。尽管有资格参与却拒绝参与。在这篇文献中,这个问题表述为“主动参与”问题或自选择参与:政策制定者想要关注那些有资格但却拒绝参与的特定个体。这是我们要讨论的另一个问题。2、符号既然已经以一个例子引出这一课程的主要问题,就让我们介绍一些符号。我们定义文献中的平均参与效应或ATE。在最简单的情况下,ATE简单表示为:ATE=E(y1-y0)如前所述这里的Y1,Y0是参与和未参与的相应的产出变量,ATE是所有涉及人群的参与的平均收益。文献也关注参与者的平均参与效应(Averagetreatmenteffectonthetreated),伍德里奇标记为ATE1我们就标记为ATT。,定义如下:ATT=E[y1-y0|①=1]第一眼看过去,这个表达式看起来很无理,通过定义,我们不能观察到参与个体的丫0,因此以W=1为条件使丫0不可能观测到。这当然是真的:我们不能观察到参与者的Y0。但是我们可以寻求反事实(counter-factual)来得到Y0。ATT是要求出参与者由于参与,多获得多少Y。为了说明ATE和ATT的区别,参考PROGRESSA的例子,二十世纪90年代后期墨西哥乡村引入的扶贫干预,从那时开始这个项目被许多拉丁美洲国家模仿。在PROGRESSA项目里,乡村人口依据他们的收入和健康情况被划分为合格(注:穷人)和不合格的住户,合格住户获得有条件的财政补助,而不合格住户什么都没有得到。因此在每个村子不是每个人都参与。ATE给出整个村子的平均参与效应-包括合格和不合格的住户。ATT给出参与者--就是说穷人的平均参与效应。在这种情形下,我们预期ATT>ATE.这些定义可以扩展到允许以协变量为条件。比如说X是协变量的向量,以X为条件的ATE和ATT:atex)=e(y—y।x)1 0ATT(x)=E(yi—y0Ix,①=1)通过选择X,我们可以定义样本的子集的参与效应-如,女性或未受教育的人群。通过整合X可以获得包含整个相关群体的ATE和ATT。举个例子,如果ATE(men)二a,ATE(women)二b那么整个人群的ATE就是男性和女性ATE的平均值。如之前提到的,估计ATE和ATT的困难在于我们不能观察到反事实:我们只能观察到同一个人的Y1,或者Y0,不能同时观察到两个。换言之,可观察到的结果就是:y=(1-3)y0+3yi=y0+3(y1-y0) ^那么我们怎么才能估计ATE和ATT呢?第一种可能的方法就是W和(Y1,Y0)在统计上是独立的(注:随机实验)。不要搞混。这不表示W和(2.1)的Y是独立的,我们知道这也不可能发生。它的意思是:Y0,Y1的分布不依赖于一个人是否接受参与。例如:如果参与是随机分布的,则可以确保独立性。独立性意味着,接受参与的可能性和参与的收益是独立的。在这种情况下,可以得出,ATE二ATT因为E(y1-y0|3=1)=E(y1-y0)。而且ATE可以简化为:E(y13=1)=E(yJ3=1) (由方程(2.1)得到)=E(y) (由独立性得到)1同样的E(y13=0)=E(y013=0)=E(y0)从而得到:ATE=ATT=E(y13=1)-E(y13=0)通过从参与者的平均产出减去未参与者的平均产出可以得到平均参与效应。这表示,简单的随机试验可以简单的从均值之差获得无偏一致和渐近的估计平均参与效应。有时候这种方法被称为“差分”(dif)估计法,因为它取的是两个均值之差。参与的随机化不是经常可以实现的。假设W和Y0相互独立,则结果是差分估计法的ATT,仍然是一致估计量。为了验证,我们这样写:E(y13=1)—E(y13=0)=E(y13=1)—E(y13=0)=E(y13=1)—E(y13=0)+E(y13=1)—E(y13=1)=E(y13=1)—E(y13=0)+E(y—y13=1)现在如果W和丫0是相互独立的,我们可以得到E(y013)=E(y0) (2.2)上面方程的前两项消失了:差分估计量是ATT。不幸的是条件(2.2)是一个强假设。如果个体可以决定是否参与,这些从参与中获利最多的人群会选择参与。这导致一个选择偏差,因为参与者比未参与者期望的Y0更低。在就业培训项目中,例如,挣得极少的人群更有可能加入就业培训。许多参与效应文献关注于参与这个原因的偏差。定义晨=E(yg),这里g={0,1}y0=N0+u°,=)+\那么:y1-y0=ATE+(u「u0)以W=1条件,有ATT=ATE+E(\-uj这里E(u1-u0)是特定个人从参与中的获益。如果Y1-Y0和W不独立,ATE和ATT一般情况下是不等同的。幸运的是,通常我们可以在比W与(丫0,丫1)相互独立更弱的假设下估计ATE和ATT。谈到这里我们现在跳转到下一章。第二部分 基于可观测因素的选择/参与的无关性参与效应评估方法可以分为两大类,只依赖于可观察因素或只依赖于不可观察产生的偏差。我们先看第一类。可观察因素偏差在文献中也叫做 参与的无关性(Ignorabilityoftreatment)。这个术语使人有点困惑——为什么大家都想忽略参与,因为这正是我们试图估计的东西。它基本的含义是:一旦我们以可观测因素为条件,参与不再和产出相关,因此我们忽略选择效应。3.介绍假定在文献中我们已经定义了两种类型的可观测偏差的假定。假定1.(伍德里奇ATE.1):条件独立以X为条件,W和(Y0,Y1)是独立的假定2.(伍德里奇ATE.1,):条件均值独立性E(y0|x,w)=E(y0k),E(y1k,w)=E(y1k)在绝大多数情况下,假定ATE.1,足够确保参与的无关性。假定ATE.1w是x的一个决定性函数时成立,如:如果W=g(x)-那么就是“可观测选择”。这种情况下的问题在于,如果X也影响产出,我们需要在估计参与效应时控制X。如果X完全可以预测W那么参与者和未参与者的X值就不会重叠(overlap)。结果是我们不能计算条件参与效应。下面我来说明其中的道理。想象一下,个体当且仅当他们都是未受教育时才接受培训:未受教育可以完美的预测到参与。这里的问题就是:我只能估计到受教育者的Y0和未受教育者的Y1。那么我不能计算参与效应,因为我没有参与者的对照者的反事实。这暗指如果选择是纯粹由可观测因素决定的-那些可观测因素进入产出方程-那么我不能估计出参与效应。为了得出参与效应,我们需要某些重叠,就是说,我们需要可观测因素不完全决定选择,例如,通过设定w=g(x,a),这里a独立于(x,y0,y1),a一个不可观察的,严格说来,已经不是“基于可观测因素的选择”,但是只要a独立于(x,y0,y1),就满足ATE.1了。谨记的点是,要使ATE.1成立,a不能与(Y0,Y1)任意相关。语义的讨论解释了为什我们推荐“参与的无关性”而不是“基于可观测因素选择”。但是这个术语本身也是令人困惑的。最后,重要的不是我们应该使用那个术语,而是我们要明白这一假定的真正本质。由ATE.1,我们可以得到:ATT(x)=E(y-y|x,①=1)=E(y1-y01x)=ATE(x)但是无条件的情况不能以此类推。那么我们可以这样写ATE=E[ATE(x)]ATT=E[ATE(x),①=1]如果参与者和一般个体有不同的X(如,贫穷和未受教育),那就不是上面这个结果了。3.2实验法随机实验法随机实验的目的是确保产出和参与的独立性。因此ATE.1是成立的。因为参与是完全随机分配的,通过计算参与者和未参与者的平均产出差值,就可以得出一致估计
的ATE。甚至控制协变量都是不必要的-除非你想检验个体间的效应是否不同,在这种情况下,你可以参看ATE(x),即子群体的平均参与效应-如,女人,小孩,穷人。近几年人们对随机实验法的兴趣按指数增长,以至于我有时感觉在经济学里只有引用随机实验法才能做实证。尽管这是绝对的夸大了,但随机实验法在近期是极度有影响势力的,特别是对于能简单了解到随机实验法用处的政策制定者来说,很有影响力。就因为如此,我认为随机试验将会越来越普及。平衡和随机化方法个体间参与的随机化,在原理上应该会导致参与者和控制组在各个角度看都是相似的。因此,如果我们观察每个个体的特性向量Zi,随机化可以保证:E[zI3=1]=E[zI3=0]1N~1N~T(3.1)(3.1)iieT这里T和C分别表示参与组和控制组。我们马上可以想到,如果随机化质量不好,就会违背(3.1)。因此,如果参与组和控制组之间Zi的差别过大,就表示随机化过程出错了-如,政治力量的干预,选择的消弱(selectiveattrition),干预(干预政策)提供者的操纵。然而,有时由于机会的不同(astheresultofchance),也可能引起Zi之间的差别。如果样本量很小,那么两组Zi区别过大的情况就特别容易出现,这种情况时常发生,因为典型随机化常常发生在乡村或社区级别,参与者和控制组的数量都很小。正因如此,许多研究者会报告控制组和参与组之间的平衡统计量。---如,求出」Ez和-LEz之差的平均数,和t值。这很好。但是必须注意,我们预期部分N@iNiT统计量是显著的,例如:就算零假设是真的,具有5%的显著性的检验平均会产生5%的错误的拒绝。因此,说20个Zi变量应该平均有一个显著T统计值。这不是我们应该关注的原因,但是,20个变量中有一半在统计上的显著,应该是我们关注的原因。尽管应该关注多少个变量的显著性还不清楚。如果Zi和产出相关,控制Zi在随后的分析中将可以消除偏差(参看基于可观测因素的选择)。这很容易实现。但是,因为不平衡,就表示参与者和控制组样本不是完全随机选择的,它表明,他们可能不具有完全的可对比性。这也会使得基于不可观察因素的选择问题出现的可能性增加,因此对实验法的结果产生怀疑。诸如这些原因,研究者常常寻求方法,即通过选择满足初始平衡条件的参与组和控制组来确保平衡性。已经有很多种技术应用于实践中,主要的技术有:1.分层法(stratification);2.再随机化(re-randomization);3.配对匹配(pairwisematching)o它们都假定研究者在随机化之前收集了Zi的信息。义分层法工作方式如下面所述。假设说,我们有一个样本为2N的样本,我们希望把它们划分为两个相等的组,参与者和控制组。样本首先根据Zi的值被划分为个体或区间段。例如,假设Z包括性别和年龄,分层会要求将2N分为M组具有相同性别和年龄的组,然后随机的选取每组的一半个体参与参与,另外一半作为控制组。注意,分层影响标准差,所以分层法会影响干预(inference)。但是,修正标准差的方法是存在的。Stata可以执行这个修正,例如使用SVY命令。McKenzie进一步指出,在使用分层法时,研究者在随后的分析中应该包括每一层的虚拟变量。力再随机化的工作方式如下:(1)将2N样本随机抽取一半作为参与者,另一半作为控制组;(2)计算所有的Zi的t统计量;(3)如果所有(或一小部分)t统计量不是显著的,继续这个随机化;否则回到第(1)步;直到找到可以所有Zi通过平衡性检验,再随机化才结束。这个方法在实践中应用很少。它的问题在于,很难对在随机化过程中的标准误进行修正。大部分研究者在操作时忽略修正这个难题。/配对匹配法工作方式如下面所述:(1)把2N样本划分为具有相似特性的N对;(2)使每一对中的一个随机进入参与组,另一个进入控制组。这个方法也保证了平衡性。McKenzie认为,用这个方法获得有效干预的最简单的方法,就是在随后的分析中使用配对虚拟变量。但问题是,如何把样本配对。操作时,我们需要测量样本间的“相似性”标准。有一种标准就是Mahalanobis距离测量法。Mahalanobis距离是这样计算的。假设说特性向量Z,我们构建计算Z的差距:||z—z,11=(("—z),V("—z.))「2这里V是一个合适权重矩阵。对矩阵V来说,我们可以使用特性Z的方差的对角线的逆矩阵。在这种情况下,矩阵V通过它的标准差对Z进行标准化。两个样本的距离就是标准化协变量的差值的绝对值的加总。另一种方法就是使V=S-1,这里S是特性变量Z的协方差矩阵。得出的距离就称为Mahalanobis公制(metric)。有了这个距离测量法后,我们构建匹配对(pair):(1)随机选择个体i;(2)找到最接近的j,构成匹配对(i,j);(3)除非所有的2N个体都配对成功,否则放弃匹配对(i,j),回到(1)。这叫做最近邻居匹配法。这个方法我将会在后面的文章里讨论。自然实验法随机实验法的组织费用很高,需要花费很大一笔钱财。在许多情况下也会出现伦理问题。例如。,进行以下试验就违背伦理:毁灭某些学校,来研究其对教育和今后收入的影响。相似地,随机选取去越南打仗的人,其他人待在美国,同样地违背伦理。幸运的是,这种实验有时是自然发生的。例如:想想看,台风或地震毁坏了某些村子的学校,或多或少是随机的,而其他邻近且非常相似的社区的学校却依然挺立。对比由人控制的实验法一受控实验法(controlledexperiment)这些实验被称为自然试验。人们有时也进行非控制的试验(uncontrolled)。一些在参与效应方面最有权威的论文利用了诸如准-实验法(quasi-experiment)的优点。下面是一些例子。(参看Angrist,Krueger2001,表1是其它的例子)Angrist(1990),使用越南战争期间使用的美国军队应征抽奖号码,来鉴定无意识的参军对今后收入的影响。Angrist,Krueger(1991)使用出生时间作为教育时间的工具变量-在12月31日之前出生的孩子法律允许他比那些在12月31日之后出生的孩子早离开学校一年。12月31日是美国小学的入学截止日期(cutoffdate)。所以出生时间可以用作衡量教育的回报。Fisman从股票市场的数据中,使用Suharto终止来鉴定由crony运作的公司。LaFerrara同样使用Savimbi来鉴定与贸易战争(wardiamonds)有牵连的公司。其他的准实验的例子包括学生宿舍的分配(检验同龄人效应-许多大学是随机分配的。);中奖者和意外的遗产(在公司投资中用来检验信用约束);签证/绿卡抽奖(用来估计从国际移民得到的经济回报)。顺从性和污染性在实验中有些事不能严格的按照计划进行是很正常的。例如,在控制组的个体,可能在研究者进行的实验之外的场合,接受参与(Manski1996)。换句话说,某些未参与者却也是参与的。这就叫做“污染"(contamination)。例如。在医药实验时就会发生污染,如安慰剂(placebo)的服用者会自己在网上获得药物。这种污染对参与组和控制组之间的显著差异会产生偏差。这意味着参与效应被低估了。但是,如果在污染存在的情况下参与仍然显著,这常常就是说明参与效应比报告的效应还要强。负的污染也是有可能发生的。ChrisWoodruff提到这样一种情况。在他的实验里,Chris为斯里兰卡的小公司提供资金赞助。在一个部门-竹子家具-资金赞助的接受者用它购买所有的竹子原料,把它的竞争对手赶出市场。在这种情况下来比较参与和未参与的效应,是高估了参与的效应。同样也有可能个体会拒绝提供的参与。在医药实验里,某些参与者可能不服用药物。在经济实验里,一些人可能有机会参加职业培训,但不能好好利用它。在文献里,这些问题叫做顺从性(compliance)问题。有时“顺从性”指的是两个问题都有的情况---如,参与者把一些参与漏给控制组。在不顺从的情况下,通过对比参与者和控制组来检验主动参与(intenttotreat)的效应还是可行的。不测量参与本身,却测量干预的效应。某些情况下,这可能比测量参与效应还要好。说明一下,想象政策制定者考虑介绍一个职业培训项目,但是他们知道,不是所有的个体都是他们的培训目标,然而同时,他们意识到就算没有这个项目,某些个体也参加私人组织的培训。在其他各点都相同的情况下,很明显,控制组和参与组之间的差别,比参与者和未参与者的差别要小:一些控制者接受了参与,一些合格的参与者拒绝参与。因此,仅仅比较资格者和控制组,低估了参与效应,但它缩小了对目标人群的政策效应。在这个情况下,评估主动参与(intent-to-treat)的效应,在某种程度上是对政策参与者参与效应的较好的测量。但这并不总是成立。在近期的一篇论文里,VandeWalle描述了一个道路修复工程的评估。世界银行提供资金给越南政府给贫穷山村修路。其他的乡村不会从世界银行获得资助,也就意味着,只能作为道路修复工程对经济增长和福利水平提高的控制组。如VandeWalle描述,越南政府简单地把参与组省下的资金,重新分配给控制乡村。这表示控制乡村最后得到了和参与组一样多的道路修复资金。在这种极度污染的情况下,我们能发现两组的产出有显著的差异,这是令人诧异的3。从这个例子我们可以学到两点。第一,它教给我们,不能天真的认为控制组不会获得参与---而且进行实验的人(政府,NGO)会成功的抵制住压力来参与控制组。第二,在这个实验里,主动参与的方法不管用,因为干预取代了对控制组的资金支持。对比控制组和参与组不能得到任何证据,以了解如果我们把干预推广,会发生什么事情。这个例子说明,这个方法在什么情况下是不管用的。双盲(double-blind),安慰剂效应(placeboeffect),霍桑效应(Hawthorneeffect),响应偏差(responsebias)在医药实验里,在参与组和控制组之间设定双盲装置的贯常方法,不能区别他们属于哪个组。通过给控制组提供一个安慰剂就可以解决,如。糖药片或水注射液。执行参与的人(护士)必须对她用的是安慰剂还是真药不知情---否则她可能会走漏消息。这就是所谓的双盲(double-blind):病人和护士都不知道他们用的是什么药。接受安慰剂的病人比什么都没用的病人康复更好,这常常发生。为什么会这样还不清楚。但是可能与错误报告或精神-肉体效应(psycho-somaticeffect)有关。病人相信他们使用的是真药,因此相信他们能从中获得益处,而错误地报告他们的情况,这就发生了响应偏差。如果“某些事正在作用”于病患的信念,改善了病人的免疫系统,你就是产生了精神-肉体效应。这种效应经常被称为安慰剂效应。加入安慰剂参与的目的,是从参与的化学效应中净除精神-肉体效应。“霍桑效应”是用来描述实验中另一种形式的扭曲。在19世纪30年代,芝加哥的霍桑工作室(Hawthorneworks)进行各种各样的实验,检验照明条件的变化对工人生产率的影响。研究者们发现,改善的照明条件提高了生产率,而且建议提供更好的照明条件。这个结论随后遭到人们的批评,因为它没有意识到,工人可能会觉得在研究者的观察下,他们会更加努力工作。乃至于,Hawthorne效应现在普遍用于描述这样一种情形:在一个实验里能发现参与效应,仅仅是因为实验条件本身导致产出/行为的变化。其他形式的响应偏差,发生在调查对象希望通过回答他们察觉到的问题来帮助研究者。减小响应偏差的一种方法是避免“引导”问题,即避免调查对象知晓研究的目的。在医药实验(和其它实验)里,这些词条很容易理解。但是他们也开始影响经济研究者的思想。可能在干预具有使调查者偏向于放大他们从中获得的收益的“暖光”(warmglow)效应时,出现Hawthorne效应。因此,经济研究者开始对从主观的调查者身上推断的参与效应产生怀疑,除非它们(参与和收益)之间的联系足够模糊不清(使调查者不清楚研究者的目的)一例如,通过设计质询----介于参与的相关问题和从参与得到的收益的相关问题之间。如果控制组只是因为他们被调查而改变他们的行为或产出一一例如,因为他们觉得某些人关心他们的近况,那么就会出现安慰剂效应。一些控制实验也引入安慰剂参与来净除其它干预操作可能借助的渠道。但是在社会科学中,设置一个确实令人信服的安慰剂参与很困难。(顺便说一句,在医药实验里这也是困难的,因为病人常常通过其它资源获得信息来确认他们在哪个组。)设想一个经济或政策实验,这些顾虑已经引导研究者寻找确认人口普查员(enumerator)不知道他们要研究的确切目标---因此不会引起鼓励调查者错误地陈述不同的产出估计。这个方法也不总能实现,因为研究者的时间有限,等等原因。底线是,希望执行受控实验的人,必须严格注意把错误的报告或安慰剂效应导致的偏差最小化。内部有效性和外部有效性我们已经知道,建议一个避免偏差的实验是很困难的。如果能找到这样的实验法,它会获得研究总体正确的参与效应,我们就说是内部有效的。接下来的问题是:这个估计结果告诉我们什么?即另外的人群,或在不同时间的同一人群接受同样的参与可能得到参与效应是什么?这个问题称为外部有效性。为什么参与可能对同一人群具有效应,但是对另外的人群却没有效应的原因很多。Deaton(2009)提到一个案例,治疗关节炎的药物对年龄20-65岁的个体是非常有效的。但是对65岁以上的个体却有很大的负作用,最后实验必须取消,因为它的坏处多过好处。据推测,医药实验在更年轻的人群中进行,因为让他们加入实验更容易。但是他们和关节炎患者的目标人群相差很远,他们主要是年纪更长者。实验室实验常常因为缺乏外部有效性而被人批判。许多这样的实验都是由大学生带领的,这些大学生常常是学习经济学的。这个人群不能代表一般人群。要解决这个问题,研究者必须开始把实验室实验带到实验室之外的领域,设计模仿以计算机为基础的实验室实验的议定书。这样的实验室实验已经在儿童,非洲农民,猎犬收集者等等这样的领域进行。尽管在这些领域进行实验室实验,实验室实验看起来是作假的或谋划的,不是真实的生活状态,从这个意义上说,它常常是“奇怪的”。这导致关于它们的外部有效性的关注:在游戏情形下,人们的反应可能会与生活情形下不同。研究者常常寻求通过变换实验框架来研究这种可能性一一如,一些参与是简洁的短语而有些参与是有内容的。框架效应经常会出现。研究者常常提供给参与者足够大的利益,来引导“严肃”的行为。显然,这个方法在穷人中实行更容易达到目标。随机化领域实验法(fieldexperiment)并不时常会遇到这些问题。但是这样就表示它们的外部有效性就有保证了?不是。实验室实验法几乎总是关注于程式化(stylized)刺激的“纯”人类行为反应,而领域实验法一般是解决政策干预问题的。除了研究者对实验的控制比实验室实验法要少之外,实验对象对给定刺激的特定行为反应也更少具有直接的指示性。干预可以触发多种不同的行为反应,其中一些没有测量或不能测量。考虑到这个问题,确定通过什么样的行为或自然法则(physical)途径来获得参与效应常常是有困难的。没有这些信息,领域实验就不能清楚地告诉我们,在其它情况下参与是怎样影响人的行为的。还有其它影响外部有效性的问题。例如,在没有研究者监督下,干预的质量可能会下降。可能还会出现其它一般均衡效应---如,某个国家可能没有进行大规模的干预,又或者只有小部分人可以从干预中获得收益(如,提供工作受训建议)。如果每个人都受到了同样的干预,干预的效果可能会显著下降。以上的评论主要应用于“简化-形式"(reduced-form)参与效应分析,即研究者对外部变化W对产出Y的效应进行简单的记载。如果扩大干预范围,没有W是如何影响Y的信息,我们就不知道在另一人群里W是怎么影响Y的。因此,如果我们能从领域实验里知道些什么信息,那些信息是不清晰的。在这样的观察背后,存在一个非常普遍的事实,叫做我们预测未来的能力---也就是说,预测Y是如何被还没有发生的干预影响的一最终依赖于我们选取的模型,这些模型具有各种不同的影响产出Y的过程。这个模型可能不明显或就藏在我们的脑袋里。但是只有以模型为基础,我们才可以做预测。模型越好,预测就越准。所以领域实验只有在它能告诉我们隐含在模型之下的信息,帮助我们来重新定义这个模型的时候才有用。因此,那些纯简化形式的领域实验,因为没有告诉我们任何关于人的行为的信息,最终对于做预测和政策建议是无用的。经济学的科学过程,就像其他科学一样,不能在没有理论的支持的情况下进行。(也不需要一定是标准的经济学理论。)难道这就意味着领域实验法没用?不尽然。这只意味着这些具有外部有效性的提供信息的领域实验,最终揭示了一些关于人类行为的有趣的事情。实践中,这意味着这些领域实验是实验室实验和标准领域实验的混合:他们模仿真实生活中的干预,因此不会受到人为造作引起的偏差;但是他们是设计用来检验关于人类行为假说的。这些假说可能来自于标准经济理论,或来自于行为心理学一或两者都有。但是他们都是对刺激和激励的行为反应。在List和Karlan的著作里有这个方法的很好例子。4、估计现在在无关性假定成立的前提下,我们讨论参与效应的评估。通过联合ATE.11和(2.1),我们可以构建一个简单的对应不同X值的ATE(x)的估计。这些估计可以获得ATE和ATT。E(yIx,3)=E(yIx,3)+3[E(yIx,3)-E(yIx,3)]=E(yIx)+3[E(yIx)-E(yIx)=E(yIx)+3ATE(x)O上式可变换为:ATE(x)=E(y1Ix)-E(y0Ix)=E(y1Ix,3=1)—E(y0Ix,3=0)通过计算Y1和丫0的条件均值,我们可以计算出ATE。非参数法如果我们的样本够大,X的值不多,我们可以把数据分为几个部分,计算每一个部分的参与和未参与样本均值,就可以得到每一个ATE(x)一致估计值。得到ATE和ATT就只是加总这些部分的问题了。这个方法的优点是不需要X和Y之间关系的任何假定。如果X的值很多,我们仍然希望对X和Y的关系不做假定一但是我们乐于假定这种关系是连续的,那么我们可以使用核回归(Kernalregression)技术来获得ATE(X)的估计值。令r(x)=E(yIx,①=0)r(x)=E(yIx,①=1)可以用核回归估计每一个部分的值。一致的ATE(x),ATT(x)估计式如下:atE=L寸[r(x)-r(x)N1i0ii=1atT=[1L①[r(x)-r(x)]丫/3『Ii1i0i人ii'i=1 八i=1/我们也可以估计一个x多项式的回归模型,使用它的结果来构建灵活的r(x)和1ir(x)的局部估计(localestimates)。这个方法见下面的内容。0i识别(identification)我们把数据分解为几个部分的时候,我们很容易就碰到识别(identification)问题。假定我们有一个二分的X,例如贫穷(X=1)或不贫穷(X=0)。然后我们假定所有贫穷的人接受参与一如,获得福利项目的收益---然而非穷人只有部分获得参与。这意味着,我们没有E(y|x=1,3=0)的观测值。因此,我们不能计算穷人的参与效应。这是很明显的,但是也很不幸,因为在许多情形下,我们希望估计项目最至关重要的目标受益者的参与效应,但是却不能计算得到。定义的目的是,我们不需要纵向数据-前后估计(before-afterestimator)-或一些X=1个体接受参与,而剩下的没有参与的实验。我们一会还要讨论这些估计法,因为他们都存在自己特定的问题。回归法同质效应如果我们希望对X和Y的关系强加一些安排,我们可以使用回归法估计ATT和人丁旦为了阐明这是如何实现,我们令:y0=日0+%y1=片+1而且E(U0)=E(U1)=。。这可以推出一个开关回归(Switchregression)模型:(4.1)y=从十(从一从)3+U+3(U-(4.1)在无条件模型(没有以X为条件)中,ATE=E(y1-y0)二片-%,因此W的系数就是ATE。上述的OLS回归是否能得到一个一致的ATE估计值,还要看W是否和误差项相关。要确认这个可能性,我们需要最后面的 一项消失,就是说3(1-U。)的均值为0.在这篇文献里,这个条件就意味着,参与和未参与的不可观测的产出分布是相同的。因此就有下面的命题。假定1.(伍德里奇18.11)E(U11x)=E(U01x)命题2.(伍德里奇18.1):如果假定18.11+ATE.1,,成立,那么ATT二ATE这里a=ATE,而且E(U01x)=g0(x)证明:在假定ATE.1吓,E(y1|x,3)=匕+E(匕|x),E(y0|x,3)=N0+E(v0|x)。在假定18.1下,E(yjx,3)-E(y0|x,3)二片-从0,因此通过反复迭代期望:E(y13)-E(y13)二从一从它暗指ATE二ATT。这就证明了第一部分。至于第二部分开关模型(4.1)给定W,X的期望,我们得到:E(y|3,x)=从十(从一从)3+E(v|3,x)+3E(v-v13,x)]=从+ATE3+g(x)+3E(v-v13,x)问题是最后一项是否能够消失。我们有:由假定ATE.1’得E(v1-v013,x)=E(v1-v01x)由假定18.11得=0第二部分得证。命题18.1是说,当给定X时,预期的个人特性的收益为零,E(y13,x)对于W来说是加性可分(isadditiveinW)的,且是X的函数,W的系数是ATE。如果g(X)刃+XP,回归模型归结为以下常见形式:E(y13,x)=y+a3+xP (4.2)这里Y0=%+noxpo代表基于可观测因素的选择。许多研究者应用模型4.2于随机化实验数据。这在概念上是没必要的:因为通过设定X与W正交,加入X控制变量,不会影响a。因为随机化实验法执行成本高,然而他们常常只有小样本。这意味着,在实践中,可能出现不平衡问题。不平衡可能也是随机化实验实施不完美的信号,在这种情形下,我们希望控制X以防万一。虽然这听起来是一个合理的测量,口。凯0口(2009)加入不必要的控制变量,常常导致a的标准差更小----这是一种人工改善结果显著性的“技巧”。Freedman(2008)也注意到,如果a.的参与效应在不同个体中各异,那么模型(4.2)依然成立,W的系数是a.的一致估计,就是「。但是在小样本时,这个估计量有很严重的偏差,偏差形I式为9/,这里n是样本大小:n1 1- —中=一lim_E(a-a)(x-x)2ni ii=1考虑到这个情况,对于随机化实验法来说,它使用以下简单点的形式来进行估计会更好:E(y13,x)=y+aw4.3.2异质效应通过介绍ai在个体中各异的这种可能性,我们已经隐晦的介绍了异质效应。现在我们回想一下。我们首先注意到,如果放松假定18.11,ATE二ATT不再成立。然而回归方程可以用来估计ATE,正如下面的命题:命题3.(伍德里奇18.2):如果假定ATE.1’成立,那么一般情况下ATT丰ATEE(y13,x)=日+a3+g(x)+3[g(x)-g(x)]g0(X)=E(v0|x)g1(x)=E(v1|x)证明:使用开关模型(4.1)的期望;E(yI3,X)=日+(日一日)3+E(VI3,X)+3E(v-vI3,X)]0 1 0 0 1 0二日+ATE3+g(X)+3E(V-VI3,X)这里最后一项没有消失。我们有由假定ATE.1’得3E(匕一v013,X)=3E(匕一v01X)=3[g1(X)-g0(X)]证毕。如果g1(X),g0(X)是线性的,我们令g0(X)=,+XP0,g1(X)=、+X%。因为E(v0)=E(v1)=0,必然可得到:0=E(E(v.Ix))=Q+Bx,i={0,1}叩=-PXi因此我们得到:E(y13,x)=从+a3+xP+3[(q+xP一叩-xP)]=从+a3+XP+3(X—X)(P—P)=从+a3+XP+3(X-X)5 (4.3)这里(4.3)可以由OLS估计得到。18.2和命题18.1的主要区别在于,我们包含了一个参与和(X-X)的交互项。在文献中,这就是异质性参与效应模型。估计方法是:八ATE=丁人ATE(x)=cx+(x-x)5
atT=atT=a+1£3)1'i=1£3(X-XBii=1八伍德里奇指出,ATT的标准差可以使用自举法(Bootstrap)获得。如果我们尽量灵活一而且得到和划分区间一样的结果(见上文),那么我们可以对截然不同的X值设定虚拟变量。这叫做完全饱和模型(fullysaturatedmodel)o然而,像之前指出的那样,对所有的个体我们不能识别交互项的系数,一旦虚拟变量W要么全是参与的,要么全是未参与的。这意味着当我们估计ATE时,只有除去未参与的样本,才可以识别。异质性和预-检验(pre-testing)。随机化实验法常常被称作是科学证据的黄金准则。在这样的实验中,3i是随机赋予的。但X不是随机的。然而许多经济学研究者发表的论文,其中平均参与效应几i乎没有什么分量,感兴趣的多是关于异质性效应的,就是说,参数向量5。我认为这其中大多和这个事实有关:在许多随机化领域实验中,平均参与效应令人提不起兴趣,因为它对人类行为和参与对产出发挥作用的途径,不能提供什么信息。为了解释这些作用途径,研究者典型地转向了异质效应回归。因为这是在数据收集完成之后进行的,这会出现预参与/数据开采(datamining)偏差问题,也即,研究者寻找具有显著的3的Xi的数据,这样就有有趣的事情可以说了。大部分引用最好的领域实验论文都存在这个问题。但是因为这些异质效应不是随机(experimental),因此不满足黄金准则。换句话说,从随机化领域实验得到的令人感兴趣的证据,并不比观察数据得到的证据更强。有没有方法来解决这个困境?一种可能的方法是,研究者承认存在某些异质效应问题。假定承认机制是可信的,那么就可以参与数据挖掘问题。但是如果最后都不显著了怎么办?难道杂志社会承诺出版这些结果?我不这么认为。这意味着除去预检验/数据开采,我们必须想办法让杂志社预先承诺出版这样的研究结果。我们还有很长的路要走。另一种可能的方法是---数据密集而且可能不可靠一随机把样本划为两个相等的部分。一部分用来做所有的数据挖掘,就是或,所有的回归不会在最后的论文里出现。一旦研究者已经识别了一套优先回归,他保留这套回归。然后他再用相同的模型估计另外一部分,报告两部分的结果---一部分是“数据挖掘”的,一部分是剩下的数据。如果结果相似,他就可以下结论,预检验偏差不是问题。我所见的这种方法应用不多,可能是因为很难使编辑和咨询人相信这个过程是真实的,也就是说没有回访(revisit)原始回归。参与数据挖掘问题就是要束手。但是它没有宣布其它潜在的问题,比如第一步我们如何解释异质性效应。个体特性X不是随机指派的,因此它可能和不可观测个体特i性有关。因此、的异质效应可能竟不是'导致的。看起来好像,随机化实验没有消除(经济学)思考的必要性。4.4推理和假说验证到现在为止,我们已经讨论了如何获得ATE和ATT的估计值。下一个问题就是如何获得估计值的标准差,这样我们就可以进行推理和假说的验证。对于以回归法估计的ATE和ATT,最常见的问题一如,异方差,群聚类(groupclustering)及其他类似的问题。对于其他估计法,如简单的t检验,已经有文献指出如何获得正确的标准差。Deaton(2009)提到,关于t检验的文献,对两种人群(参与和未参与)具有不同的方差感到担忧。STATAttest检验命令就有一个这样的选项。我认为在回归内容上,这个问题可能通过“robust”命令得到解决。对于非参数估计的ATE和ATT,事情就有点微妙了。伍德里奇简洁的讨论过这些问题,他注意到,在许多情况下,获得非参数估计法的一致标准差的唯一可信的方法,是自举法。在STATA中实现自举法并不特别困难。这里有一个简单的办法给你开个头。说你有一个一致估计值/,它是N个样本获得的真实a的估计值。你想要检验是否a=a,而且a〉a。下面你要做的是:选取从N个样本中随机选取K个样本代替真实样本。在这个人工选择的样本中,一些原始个体会出现多次;还有一些从来就没出现过。用人工选择的样本估计ak重复这个过程M次,M是个大数字,如,起码是100,最好是1000.这样得出m次估计的ak。m个估计值的分布就是a的真实分布。令m是ak的估计次数,保证ak<a。检验a=a自举法的P值是am/am。这是一般的理论。如果是群/聚类,那么你需要在聚类中选取随机化样本,如,有替换地抽取分块里面的样本。当然,如果你的分块很少,事情就没那么顺利。但是这只是我们预想的。还有许多一般的假说检验技术,如前突变方法( permutationmethod),这个方法在STATA里面也有。McKenzie(2008)讨论了其他有趣问题,叫做,分层法。对于应用领域实验法的研究者来说,对样本进行分层来确保在参与组和控制组之间的可观测特性的平衡性是很平常的事。人们一直知道,样本分层会影响标准差的分布。例如STATA具有一整套系列的SVY命令来参与样本设计,包括分层。一般来说,对于给定的样本容量,分层法在抽取信息方面比纯随机样本更有效。这意味着没有考虑分层计算出来的标准差是被高估了---降低了我们对估计的信心。因此修正的分层法应该改善t值,对于标准回归分析,SVY命令一般应该可以达到目的。5、回归不连续设计回归不连续设计是一种应用于特定类型数据的回归方法。就是说,存在一个干预的合格标准,如,低于特定收入门槛t的人是合格的,其他人不合格,那么我们可以对比略略高于t和略略低于t的个体,使用他们的差别作为在t点的参与效应。回归不连续设计在Lee(pp.57-)有详细的介绍,也就是从他那里我组织了这部分内容;Lee区分了三种类型的回归不连续设计,我也会对他们进行讨论。参数RDDLee使用与我略有不同的标记来方便比较我的观点和他的书的不同。令d标示以收入检测的干预(参与),x为收入。个体x>t则d=0,X<t则~=1。收入x对产出变量y的效应是独立的。如果我们假定这个效应是线性的,而且对于参与者和未参与者是相同的,我们就可以用以下形式的模型估计:y_=P+Pd+P^_+u和(4.2)一样,----Pd=ATE,模型(4.2)是参数RDD。问题是,对x的影响方式这个假定是否公正。要检验它,我们可以简单地绘制X,y坐标系,看看xy坐标里,t点是否是断点,不然它就是线性的。xy坐标上断点跳跃的幅度就是ATE。灵敏非参数RDD如果y和x的关系不是线性的,以致很难建立可信的模型,我们可以求助于非参数方法。这个方法只要求选择是基于可观测因素,局部的---也就是,在t附近。令:y,=Bd+g(X)+U jj={0,1} (5.1)这里g(x)是假定t点连续,但不确知其形式的函数。如先前一样,是否是合格的参与者,要看x和t的大小比较。我们现在要做的关键假定是,选择是局部的基于可观测因素,就是说:limE(u|x)=limE(u|x)Xf 0 Xf 1在这个假定下,通过限制我们的分析是在t的边界附近的样本进行,我们可以识别ATE=pd。一个这种方法的例子是Black(1999)通过对比在毗连的拥有不同质量的学校区域,邻近的房子来估计人们愿意对学校质量支付的多少价格。房屋价格作为愿意为学校质量出价的证据。在Cogneau,他们用相似的方法来比较Coted’Ivoire和它的邻居的宏观政策-,只是通过比较不同国家的相邻地区的健康和教育产出。后者的应用备受推崇,因为它允许应用参与效应的方法论去评估宏观政策。当然,要使用这个方法,样本必须是独立的,在实践中,这也并非必需。(如,如果从一个地区到另一个地区具有外部性)。模糊非参数RDD如果门槛不是灵敏的,我的意思是,有些x>T的人参与了项目,而有些x<T的人却没有参与。我们还能使用RDD吗?直觉上,如果函数g(X)是平滑的,而且产出变量的跳跃在断点附近足够大,尽管是一个模糊的门槛,我们仍然可以识别参与效应。为了解释它的原理,我们把E(dIX)叫做倾向得分(propensityscore)。它度量了具有特性x的个体接受参与d的倾向。现在假设倾向得分在。是个断点。那么ATE的估计可以这样构建:limE(y|x)一limE(y|x)limjE(d|x)一lim个E(d|x)来获要估计上面的值,我们可能要使用单边核回归(one-sidedkernelregressions)来获得上式的四个表达式的近似值。细节参看Lee。问题在于小样本的单边核回归的属性可能不好。另一个可能的估计法是这样运行的。选择是基于接近T的可观测因素暗指:imE[(1一d)u+du]=0意味着u0和u1之间没有差别。(伍德里奇是标注的V0和匕)。使用(5.1)在X2T时x的期望:E(yiIx.)=BE(d|x.)+g(x.),xpt上式得到:y.—E(y.Ix.)=B[d—E(d|x.)]+u,xpt这揭示了一个两步估计法,如下:第一步:非参数法估计在T附近样本的E(yiIxi)和E(di|xi),例如,使用核回归。第二步:用yi-E(yiIxi)对d「E(di|xi)回归,获得Bd的估计量%。
两步都只使用XWX=(T-C,T+C)的样本,这里C标示T的邻域,在这邻域里,TX对Y的影响与d的相关性可以忽略。Lee(p.33)也推荐了一种估计法,它的工作原理如下。定义EN(.1方)是对E(.Ixi)的非参数估计,使用除观察i之外的所有样本(这类似于跨界有效思想(cross-validationidea))。那么ATE就是:E{d-E(dIx)}{y-E(yIx)}1[xwXT]b=_n = d Z{d-E(dIx)}21[xwXt]iNidNNi itiNiiAV(b)=」 v―ard Z{dii5.4前后估计(before-after)E{d-E(dIX)}2[y-E(yIx)NidNNi itiNiiAV(b)=」 v―ard Z{dii5.4前后估计(before-after)—E(dIx)}21[xwX]2Ni it事前事后估计法也可以看作是回归不连续设计。比如说,我们观察到两期的产出yij—参与前时刻,参与后时刻。还有其他随时间变化的因素影响y^。但是如果这些因素影响d的速度很慢,那么我们可以应用RDD来估计参与效应。它最简化的形式:ATE尺(y〃-yi0)i=1一个事前事后的例子是巨大冲击一如,飓风,洪灾,火灾一对人类福利效应的估计。这种数据是自然实验的一个例子,这里“参与”是一种冲击。比如说,比较飓风前后的营养情况,来估计飓风对营养的效应。如果影响营养的其他时变(time-varying)因素在这个之间内没有大变化,那么这个效应是真实的。在实践中,这一点往往不能成立---例如,季节效应,或者如果我们研究的是没有冲击也会随年龄变化很快的小孩的营养。6、匹配法(Matching)现在为止我们的焦点都在于对比可对比组。这就是为什么我们要把X划分为小单元或我们比较非常接近合格门槛T的样本。匹配法进一步推进了这个逻辑。面板数据基于可观测因素选择的思想是控制变量X,X会影响产出和参与的可能性。在许多情况下,X向量可能非常大,而且我们不需要用所有必需的数据。还有,时间不变(time-invariant)个体特性,它不能观察到却被人们认为或料想和参与有关。如果我们有面板数据,我们可能可以控制这些会影响产出和参与的时间不变的不可观察因素。比如说,我们拥有面板数据,同一个体的参与随时间有所变化。这是有可能的,例如,由于参与是随时间分阶段进行的。或者因为参与(如,自然实验)是随时间变化的。假定个体i在t时的产出变量*依赖于时变的可观测因素匕,时变参与3」时间不变个体效应匕(它计算所有时不变个体特性的效应),以及干扰北:y=x0+a3.+yt+u+e=x0+a3+于8D+yt+ei-1这里如果个体是i则Di=1,其它情况则D=0。令x标示(x『Dj...DN)。那么,如果ATE.1,成立,而且x是这个扩展的x,命题18.1和,18.2成立。我们就可以用之前勾画了轮廓的方法来估计ATE和ATT。在回归分析情况下,这典型地牵涉到估计一个固定效应的模型。如前所述,H是我们对ATE的估计值。如果我们只有两期t=0,t=1的数据,模型可以用差分估计:y1-y=(x-x)0+(3.-3.)a+y+(e-e) (6.1)事件研究和差异中的差分(eventstudiesanddif-in-dif)首先假定我们只有参与者的样本。进一步我们假设参与者只在1期接受参与,3=1,3=0;最后,假设■0。i1 i0在这些假定下,方程(6.1)可以通过比较个体事前事后的产出来估计参与效应。这和“事前事后”估计法期望我们控制个体的固定效应是一样的道理。它是通过简单的计算两者的差异进行估计。为了解释它的原理,我们放弃方程(6.1)的以X为条件。我们马上就看到,参与效应a就是所有个体的产出均值之差y〃-yi0。这种差分估计法的缺陷在于,它不允许我们控制住一个平常时间效应(commontimeeffect)Y。换句话说,识别参与效应依赖于严苛的假定Y=0。这个假定可以推出,只能在严格不存在平常时间效应的情况下,才可以用这个方法对参与者的数据进行评估。这就和事前-事后的假定基本相同了,也即,假定环境因素不会随时间有太大改变,所以我们可以合理地认为丫=0。事件研究是这些估计法的很好解释。进行典型的事件研究时,研究者获得特定冲击的值,冲击发生后马上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年家具定制居间售后服务合同3篇
- 二零二五年度奢侈品导购代理合同2篇
- 二零二五年学校后勤保障中心保洁服务招标合同2篇
- 二零二五年度家电产品代工与贴牌生产合同2篇
- 2025版商业空场地租赁合同范本-全面服务保障82篇
- 2025年度物业公司财务内部控制与风险管理合同3篇
- 2025年度生态旅游区委托代建合同法律性质及责任承担解析3篇
- 二零二五年度建筑工地安全文明施工及绿色施工技术合同
- 二零二五年度按揭车抵押借款合同备案协议3篇
- 二零二五年度旅游住宿业短期贷款合同样本2篇
- 退休人员公益活动合作合同
- 四年级数学(四则混合运算带括号)计算题专项练习与答案
- 急诊创伤疼痛护理
- 2022年期货从业资格《期货基础知识》考试题库(含典型题)
- 浙江省湖州市2023-2024学年高二上学期期末调研测试数学试题 含解析
- 浙江省杭州市萧山区2023-2024学年高二上学期1月期末考试物理试题(含答案)
- 江西省九江市2023-2024学年七年级上学期语文期末试卷(含答案)
- 2025年妇产科高级职称考试宝典真题库与详解答案汇编
- 浙江省金华市(2024年-2025年小学五年级语文)人教版期末考试((上下)学期)试卷及答案
- 陆上风电场设备选型技术导则
- 核心素养导向的单元整体教学
评论
0/150
提交评论