版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2200119-90-70-178-18陈强计量及Stata应用
(c)201411高级计量经济学及Stata应用第三讲内生性专题陈强山东大学经济学院qiang2chen2@126.com2019-07-18陈强计量及Stata应用
(c)20142内生性专题IV2SLSGMM随机实验与自然实验双重差分法倾向得分匹配例:农产品市场均衡模型令供给等于需要可得:2019-07-18陈强计量及Stata应用
(c)20143需求函数还是供给函数?2019-07-18陈强计量及Stata应用
(c)20144联立方程偏差求解联立方程可得: 故解释变量与扰动项相关,得不到一致估计,称为“联立方程偏差”(simultaneitybias)或“内生性偏差”(endogenietybias)。2019-07-18陈强计量及Stata应用
(c)201452019-07-18陈强计量及Stata应用
(c)20146内生变量 在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”(endogenousvariables)。 如果我们能够将内生变量分成两部分,一部分与扰动项相关,而另一部分与扰动项不相关,则有希望用与扰动项不相关的那一部分得到一致估计。 对内生变量的这种分离可以借助于另外一个“工具变量”(InstrumentalVariable,IV)来实现。工具变量的思想 假设存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动。此时,可以估计需求曲线。这个使供给曲线移动的变量就是工具变量。2019-07-18陈强计量及Stata应用
(c)20147气温作为工具变量 假设影响供给方程扰动项的因素可以分解为两部分,即可观测的气温x与不可观测的其他因素:气温为前定变量,与两个扰动项都不相关。气温的变化使得供给函数沿着需求函数移动,故可估计出需求函数。2019-07-18陈强计量及Stata应用
(c)201482019-07-18陈强计量及Stata应用
(c)20149工具变量的定义一个有效(valid)的工具变量应满足以下两个条件:相关性:工具变量与内生解释变量相关外生性:工具变量与扰动项不相关。也被称为“排他性约束”(exclusionrestriction),因为外生性意味着,工具变量影响被解释变量的唯一渠道是通过与其相关的内生解释变量,它排除了所有其他的可能影响渠道。2019-07-18陈强计量及Stata应用
(c)201410气温满足工具变量的定义气温满足工具变量的两个条件:相关性:气温影响供给,而供给影响价格(需求方程中的内生解释变量),故气温与价格相关外生性:气温为前定变量,故与扰动项不相关。二阶段最小二乘法 传统的工具变量法通过“二阶段最小二乘法”(TwoStageLeastSquare,简记2SLS或TSLS)来实现。 第一阶段回归:用内生解释变量p对工具变量回归x,得到拟合值 。 第二阶段回归:用被解释变量q对第一阶段回归的拟合值进行回归 。2019-07-18陈强计量及Stata应用
(c)2014112019-07-18陈强计量及Stata应用
(c)2014122SLS的原理 第一阶段回归的拟合值为工具变量的线性函数,故也是外生的(因为工具变量是外生的)。 因此,在第二阶段回归中,第一阶段回归的拟合值与扰动项不相关,故可得到一致估计。 2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生部分,以及与扰动项相关的其余部分。把被解释变量对此外生部分进行回归,即得到一致估计。例:宏观模型中的消费函数 其中,Y,C,I,G分别代表国民收入、总消费、总投资、政府净支出与净出口。第一个方程为消费方程,第二个方程为国民收入恒等式。 可以证明,如果单独对消费方程进行OLS估计,将得到不一致的估计。2019-07-18陈强计量及Stata应用
(c)2014132019-07-18陈强计量及Stata应用
(c)201414多个内生变量与多个工具变量可识别的阶条件(必要条件): 不可识别(unidentified):工具变量个数小于内生解释变量个数恰好识别(justorexactlyidentified):工具变量个数等于内生解释变量个数过度识别(overidentified):工具变量个数大于内生解释变量个数2019-07-18陈强计量及Stata应用
(c)201415弱工具变量 如果工具变量与内生解释变量仅微弱相关,将导致工具变量法估计量的渐近方差变得很大。 由于工具变量中仅包含很少与解释变量有关的信息,利用这部分信息进行的工具变量法估计就很不准确,即使样本容量很大也很难收敛到真实的参数值。这种工具变量称为“弱工具变量”(weakinstruments)。 弱工具变量的后果类似于样本容量过小,会导致的小样本性质变得很差,而的大样本分布也可能离正态分布相去甚远,致使统计推断失效。2019-07-18陈强计量及Stata应用
(c)201416弱工具变量的检验 在第一阶段回归中,检验所有工具变量的联合显著性,得到F统计量。 经验规则:如果F<10,则存在弱工具变量;反之,则不存在弱工具变量。 弱工具变量的解决方法:(1)寻找强工具变量;(2)如果工具变量足够多,可舍弃弱工具变量。(3)使用有限信息最大似然估计(LimitedInformationMaximumLikelihoodEstimation,简记LIML)2019-07-18陈强计量及Stata应用
(c)201417工具变量的外生性 在恰好识别的情况下,无法检验工具变量的外生性。只能进行定性讨论或依赖于专家的意见。 定性讨论:如果工具变量是外生的,则其对被解释变量发生影响的唯一渠道就是通过内生变量,除此以外别无其他渠道。此条件被称为“排他性约束”(exclusionrestriction)。 在实践中,需要找出工具变量影响被解释变量的所有其他可能渠道,然后一一排除,才能比较信服地说明工具变量的外生性。2019-07-18陈强计量及Stata应用
(c)201418过度识别检验 在过度识别的情况下,则可进行“过度识别检验”(overidentificationtest)。 此检验的大前提(maintainedhypothesis)是该模型至少是恰好识别的,即有效工具变量至少与内生解释变量一样多。 在此大前提下,过度识别检验的原假设为“所有工具变量都是外生的”。过度识别检验的步骤 把2SLS的残差对工具变量及外生解释变量进行回归,检验工具变量的系数是否联合为0。记此辅助回归的拟合优度为R2。Sargan统计量:其中,m为工具变量个数,r为内生解释变量个数 如果恰好识别,则m-r=0(自由度为0),义,故无法使用“过度识别检验”。无定2019-07-18陈强计量及Stata应用
(c)2014192019-07-18陈强计量及Stata应用
(c)201420对解释变量内生性的检验究竟该用OLS还是工具变量法? “豪斯曼检验”(Hausmanspecificationtest)的原假设为“所有解释变量均为外生变量”。如果原假设成立,则OLS比工具变量法更有效。此时使用IV,虽然是一致估计量,但“无病用药”,反而增大估计量方差。反之,如果存在内生解释变量,则OLS不一致,而IV是一致的。豪斯曼检验的原理 如果原假设成立,则OLS与IV都一致,即在大样本下 与 都收敛于真实的参数值 ,因此依概率收敛于0。反之,如果不成立,则IV一致而OLS不一致,故不会收敛于0。 如果二者距离很大,则倾向于拒绝原假设。以二次型度量此距离可得:2019-07-18陈强计量及Stata应用
(c)201421矩估计传统的矩估计(MethodofMoments,MM) 假设随机变量 ,其中 为待估参数。因为有两个待估参数,故须使用两个总体矩条件(populationmomentconditions):一阶原点矩:二阶原点矩:2019-07-18陈强计量及Stata应用
(c)201422矩估计的求解 用对应的样本矩(samplemoments)替代总体矩条件可得以下联立方程组,求解可得: 矩估计的缺点:更高阶矩可能也包含有用信息,但被弃而不用。广义矩估计(GMM)可弥补此缺点。2019-07-18陈强计量及Stata应用
(c)201423IV法作为矩估计 假设最后一个解释变量为内生变量,其工具变量为w: 记工具向量为 ,其中外生解释变量为自己的工具变量(符合工具变量的定义)。2019-07-18陈强计量及Stata应用
(c)201424总体与样本矩条件 “总体矩条件”或“正交条件”(orthogonalitycondition):以样本矩代替上总体矩,即得到IV估计量:2019-07-18陈强计量及Stata应用
(c)201425OLS也是IV矩估计 如果所有解释变量都是前定变量,则可以将自己作为自己的工具变量。因此,X=Z。•2019-07-18陈强计量及Stata应用
(c)2014262019-07-18陈强计量及Stata应用
(c)201427IV矩估计的局限性传统的IV矩估计仅适用于恰好识别的情形。在过度识别情况下,则一般使用2SLS。 在球型扰动项(同方差、无自相关)的情况下,2SLS是最有效率的。 如果存在异方差或自相关,则存在更有效率的方法,即广义矩估计。矩条件的再考察与总体矩条件 相对应的样本矩条件为:将上式看成联立方程组,则未知数共有K个,而方程个数为L个(的维度)。如果L<K,为不可识别,有无穷多解。如果L=K,为恰好识别,有唯一解,即 。如果L>K,为过度识别,无解;此时传统的矩估计法行不通。2019-07-18陈强计量及Stata应用
(c)201428广义矩估计的定义脑筋急转弯:虽然无法找到 使得但总可以让向量 尽可能地接近0。定义最小化的目标函数为, 其中,为根据数据估计的“权重矩阵”(weightingmatrix)。所得估计量就是广义矩估计(GeneralizedMethodofMoments,GMM)。2019-07-18陈强计量及Stata应用
(c)2014292019-07-18陈强计量及Stata应用
(c)201430广义矩估计的优点 可选择最优权重矩阵,使得估计量的渐近方差最小;称为“最优GMM”(optimalGMM)。但需要先估计最优权重矩阵。 两步最优GMM:(1)进行2SLS估计(2SLS也是一致估计),得到残差,估计最优权重矩阵;(2)使用此最优权重矩阵进行GMM估计。 迭代GMM:使用GMM残差,估计最优权重矩阵;重复以上步骤,直至收敛。2019-07-18陈强计量及Stata应用
(c)201431GMM与2SLS在同方差情况下,GMM=2SLS。在恰好识别情况下,GMM=2SLS。 在异方差、过度识别情况下,GMM比2SLS更有效率。GMM的过度识别检验 在恰好识别的情况下,GMM的目标函数=0。在过度识别的情况下,如果所有过度识别约束都成立,则目标函数J应该离0不远。如果J大于0很多,则可倾向于认为某些过度识别约束不成立。 在原假设“所有矩条件均成立”的情况下,目标函数本身就是检验统计量:在同方差的情况下,J统计量等于Sargan统计量。2019-07-18陈强计量及Stata应用
(c)2014322019-07-18陈强计量及Stata应用
(c)201433如何获得工具变量寻找工具变量可大致分两步:列出与内生解释变量相关的尽可能多的变量 的清单(这一步较容易);从这一清单中剔除与扰动项相关的变量(使用exclusionrestriction的逻辑)。2019-07-18陈强计量及Stata应用
(c)201434例:滞后变量作为IV 对于时间序列或面板数据,常使用内生变量的滞后变量作为IV。显然,内生变量与其滞后值相关。另一方面,由于滞后变量已经发生,故为“前定”,可能与当期扰动项不相关。 Grovesetal(1994)考察国企改革(员工奖金激励制度)对企业生产率的作用。一般地,奖金占员工中报酬比重越高,则越能促进生产率的提高。但,生产率越高的企业越有能力给员工发奖金,故存在双向因果关系。使用奖金比重的滞后值作为当期奖金比重的工具变量。二者的相关性是显然的。另一方面,当期的生产率不可能影响过去的奖金比重,故奖金比重的滞后值具有外生性。2019-07-18陈强计量及Stata应用
(c)201435例:警察人数与犯罪率 一般认为,警察人数越多,执法力度越大,则犯罪率应该越低。但直接把犯罪率对警察人数进行回归,以此度量警察人数对犯罪率的作用,就会出现内生变量偏差。警察人数是内生变量;某市犯罪率越高,市政府越会增加警察人数。 Levitt(1997)创造性地使用“市长选举的政治周期”作为犯罪率的工具变量。在市长连任时,为了拉选票,会增加警察人数,故满足相关性。另一方面,选举周期以机械方式确定,除了对警察人数有影响外,不会单独地对犯罪率起作用,故满足外生性。2019-07-18陈强计量及Stata应用
(c)201436例:制度对经济增长的影响 好制度能促进增长,但制度变迁也依赖于经济增长。Acemogluetal(2001)使用“殖民者死亡率”(settlermortality)作为制度的工具变量。 近代欧洲殖民者在全世界殖民时,由于各地气候及疾病环境不同,欧洲殖民者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者难以定居,故在当地建立掠夺性制度。而在死亡率低的地方(比如,北美),则建立有利于经济增长的制度(比如,较好的产权保护)。这种初始制度上的差异一直延续到今天。因此,殖民者死亡率与今天的制度相关,满足相关性。另一方面,殖民者死亡率除了对制度有影响外,不再对当前的经济增长有任何直接影响,故满足外生性。2019-07-18陈强计量及Stata应用
(c)201437例:看电视过多引发小儿自闭症? 在美国,电视的普及与小儿自闭症(autism)发生率的攀升几乎同步。Waldmanetal(2006,2008)研究过多观看电视是否引发小儿自闭症。但有自闭倾向的儿童更经常看电视,而不喜户外活动或与人交往;故存在双向因果关系。 Waldmanetal(2006,2008)使用降雨量作为电视观看时间的工具变量。二者存在相关性,即降雨越多的地区,人们呆在室内的时间越长,故看电视时间也越长;而降雨量很可能是外生的。研究结果支持多看电视为小儿自闭症的诱因。2019-07-18陈强计量及Stata应用
(c)201438实例:年轻男子的教育回报率 Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。 针对美国面板调查数据中的年轻男子组群(YoungMen’sCohortoftheNationalLongitudinalSurvey,简记NLS-Y),Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。 BlackburnandNeumark(1992)更新了Griliches(1976)的数据,即本例的数据集“grilic.dta”。2019-07-18陈强计量及Stata应用
(c)201439数据集grilic.dta中的变量 lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledgeoftheWorldofWork”测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。 两期面板数据,初始期为当以上变量有数据的最早年份,结束期为1980年。不带“80”字样的变量名为初始期,带“80”字样的变量名为1980年数据。比如,iq指的是初始期的智商,而lw80指的是1980年的工资对数。数据特征use
grilic.dta,clearsum2019-07-18陈强计量及Stata应用
(c)201440智商与教育年限的相关关系pwcorr
iq
s,sig2019-07-18陈强计量及Stata应用
(c)201441不考虑智商(能力的代理变量)的OLSreg
lw
s
expr
tenure
rns
smsa,r2019-07-18陈强计量及Stata应用
(c)2014422019-07-18陈强计量及Stata应用
(c)201443解读(1) 回归结果显示,教育投资的年回报率为10.26%,而且在1%的水平上显著地不为0。这意味着,多受一年教育,则未来的工资将高出10.26%,这个教育投资回报率似乎太高了。 可能的原因是,由于遗漏变量“能力”与受教育年限正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。引入智商(iq)的OLSreg
lw
s
iq
expr
tenure
rns
smsa,r2019-07-18陈强计量及Stata应用
(c)2014442019-07-18陈强计量及Stata应用
(c)201445解读(2) 加入“能力”的代理变量iq后,教育投资的回报率下降为9.28%,变得更为合理些,但仍然显得过高。 由于用iq来度量能力存在“测量误差”,故iq是内生变量,考虑使用变量(med,kww)作为iq的工具变量,进行2SLS回归,并使用稳健标准误。2SLSivregress
2sls
lw
s
expr
tenure
rns
smsa (iq=med
kww),r
first2019-07-18陈强计量及Stata应用
(c)2014462019-07-18陈强计量及Stata应用
(c)2014472019-07-18陈强计量及Stata应用
(c)201448解读(3) 上表显示,教育投资回报率降为6.08%,比较合理。下面,进行过度识别检验。过度识别检验estat
overid2019-07-18陈强计量及Stata应用
(c)2014492019-07-18陈强计量及Stata应用
(c)201450弱工具变量检验 考察有效工具变量的第二个条件,即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出,工具变量(med,kww)对内生变量iq均有较好的解释力,p值都小于0.05。正式的检验可以通过如下命令进行:estatfirststageF统计量为13.40(超过10),故不存在弱工具变量。2019-07-18陈强计量及Stata应用
(c)2014512019-07-18陈强计量及Stata应用
(c)201452豪斯曼检验 工具变量法的前提是存在内生解释变量。为此须进行豪斯曼检验,其原假设为“所有解释变量均为外生”,即不存在内生变量。quietlyreglwiqsexprtenurernssmsaestimatesstoreolsquietlyivregress2slslwsexprtenurerns smsa(iq=medkww)estimatesstoreivhausmanivols,constantsigmamore 传统的豪斯曼检验建立在同方差的前提下,故在此不使用稳健标准误。2019-07-18陈强计量及Stata应用
(c)201453异方差稳健的DWH检验 (接上页)可在5%水平上拒绝“所有解释变量均为外生”的原假设,即认为iq为内生变量。 由于传统的豪斯曼检验在异方差情形下不成立,下面进行异方差稳健的Durbin-Wu-Hausman检验:estatendogenous2019-07-18陈强计量及Stata应用
(c)2014542019-07-18陈强计量及Stata应用
(c)201455GMM估计 如果存在异方差,则GMM比2SLS更有效率。为此,进行如下最优GMM估计。ivregressgmmlwsexprtenurernssmsa (iq=medkww)两步最优GMM的系数估计值与2SLS很接近。2019-07-18陈强计量及Stata应用
(c)201456过度识别检验estat
overid由于p值为0.70,故认为所有工具变量均为外生。2019-07-18陈强计量及Stata应用
(c)2014572019-07-18陈强计量及Stata应用
(c)201458迭代GMMivregressgmmlwsexprtenurernssmsa (iq=medkww),igmm结果参见下页。容易看出,迭代GMM与两步 GMM的系数估计值相差无几。2019-07-18陈强计量及Stata应用
(c)2014592019-07-18陈强计量及Stata应用
(c)201460存储回归结果quietly
reg
lw
s
expr
tenure
rns
smsa,restimates
store
ols_no_iqquietly
reg
lw
iq
s
expr
tenure
rns
smsa,restimates
store
ols_with_iqquietly
ivregress
2sls
lw
s
expr
tenure
rns smsa
(iq=med
kww),restimates
store
tslsquietly
ivregress
gmm
lw
s
expr
tenure
rns smsa
(iq=med
kww)estimates
store
gmmquietly
ivregress
gmm
lw
s
expr
tenure
rns smsa
(iq=med
kww),igmmestimates
store
igmm2019-07-18陈强计量及Stata应用
(c)201461输出回归结果下载非官方命令estout。ssc
install
estoutesttab
ols_no_iq
ols_with_iq
tsls
gmm
igmm,se r2
mtitle
star(*
0.1
**
0.05
***
0.01)2019-07-18陈强计量及Stata应用
(c)201462实验与因果关系实验方法是研究因果关系的有力工具。假设我们要研究变量是否导致y,以及因果关系的强弱假定包含所有可能影响y
的因素。 不同学科可能依条件的不同而采用不同的实验方法,大致可以分为以下几类。2019-07-18陈强计量及Stata应用
(c)201463实验的类别 (1)控制实验(controlledexperiment):在理想的物理实验中,对除 以外的因素全部控制不变,单独让 变化,然后观察y变化的情况。 (2)随机(控制)实验(randomizedcontrolledexperiment):比如,医学上对新药疗效的实验。由于参加实验者的体质与生活方式不同,不可能完全控制所有其他因素。通常将实验人群随机分为两组,“实验组”或“处理组”(treatmentgroup)服用真药,“控制组”(controlgroup,对照组)服用“安慰药”(placebo)。2019-07-18陈强计量及Stata应用
(c)2014642019-07-18陈强计量及Stata应用
(c)201465实验的类别(续) 例:在农学中将地块随机地分成三组(因为很难找到土壤条件完全一样的地块),分别给予不同的施肥量,然后考察施肥的效果。 (3)自然实验或准实验(naturalexperimentorquasiexperiment):由于某些并非为了实验目的而发生的外部突发事件,使得当事人仿佛被随机地分在了实验组或控制组。比如,一个州通过某法律,但相邻州未通过此法律。两州民众事先不知道哪个州会通过此法,故无法自我选择住在哪个州。可近似认为民众随机选择住在哪个州,或者被随机地分在实验组(通过法律)与控制组(没通过法律)。理想的随机实验 实验组与控制组的成员决定完全随机,比如,通过抛硬币或电脑随机数来决定。因此,个体被分在哪一组或得到多大实验“处理水平”(treatmentlevel),与个体特征或其他因素完全独立。 故解释变量“处理水平”与被遗漏的扰动项不相关,可避免遗漏变量偏差(omittedvariablebias)或内生变量偏差(endogenietybias)。例:由于 完全随机,无论遗漏多少解释变量,OLS都一致2019-07-18陈强计量及Stata应用
(c)201466因果效应 在随机实验中,因果效应(causaleffect)有着清晰的定义。 在理想的随机实验中,X对y的因果效应表现在条件期望的差别。 即 ,也称“处理效应”(treatmenteffect)。2019-07-18陈强计量及Stata应用
(c)201467差分估计量 如果 为虚拟变量,方程的OLS估计量为•为实验组的样本均值, 为控制组的样本均值。在回归方程加入虚拟变量的效果相当于给予实验组与控制组不同的截距项。另一方面,对常数项回归时,系数估计值便是样本均值。故 ,•等于实验组均值与控制组均值之差,故称“差分估计量”(differencesestimator)。2019-07-18陈强计量及Stata应用
(c)2014682019-07-18陈强计量及Stata应用
(c)201469例:班级规模与学习成绩 美国田纳西州进行了为期四年的随机实验(称为ProjectSTAR,即Student-TeacherAchievementRatio),将幼儿园至小学三年级的学生随机分为三组。 第一组为普通班,每班22-25名学生;第二组为小班,每班13-17名学生;第三组也为小班,但配备一名教学助理(teacher’saide)。教师也随机分到这三类班级。 实验结果发现,尽管班级规模对学习成绩的影响在统计上显著,但在经济上并不显著(即此效应本身比较小,普通班与小班的成绩差距类似于男生与女生的成绩差距)。引入更多解释变量 虽然在理想的随机实验条件下,OLS估计量(差分估计量)是一致的,但由于遗漏了较多变量,故的方差可能较大,OLS估计效率可能不高。如果引入某些遗漏变量,可提高估计效率。也提供了检验 是否完全随机的机会。2019-07-18陈强计量及Stata应用
(c)2014702019-07-18陈强计量及Stata应用
(c)201471随机实验执行过程中可能出现的问题内部有效性问题(internal
validity)外部有效性问题(external
validity)2019-07-18陈强计量及Stata应用
(c)201472内部有效性问题未能完全随机分组(failure
to
randomize)未能完全遵从实验设计(partial
compliance)中途退出实验(attrition)实验效应或霍桑效应(experimental
effect或Hawthorne
effect)样本过小2019-07-18陈强计量及Stata应用
(c)201473外部有效性问题样本的代表性不足(non-representative
sample)小型实验的条件与大规模推广时的现实条件不同一般均衡效应(general
equilibrium
effect)自我选择效应2019-07-18陈强计量及Stata应用
(c)201474自然实验 随机实验说服力强,但成本高。自然实验为自然发生(非为实验目的而发生),几乎没有成本,说服力类似于随机实验,为研究者青睐。 自然实验可分为两类。第一类:个体的分组或处理水平完全由自然实验所决定,可直接用OLS估计因果效应。 第二类:个体的分组或处理水平只是部分地由自然实验所决定,此时应以自然实验所带来的随机变动作为工具变量进行估计。2019-07-18陈强计量及Stata应用
(c)201475第一类自然实验的例子最低工资如何影响对低技能工人的需求? CardandKrueger(1994):在1992年,美国新泽西州通过法律将最低工资从每小时$4.25提高到$5.05,但在相邻的宾夕法尼亚州最低工资却保持不变。 这两个州的雇主仿佛被随机地分配到实验组(新泽西州)与控制组(宾夕法尼亚州) 收集了两个州的快餐店在实施新法前后雇佣人数的数据,发现提高最低工资对低技能工人的就业几乎没有影响。2019-07-18陈强计量及Stata应用
(c)201476第二类自然实验的例子服兵役是否影响退役后的长期收入? Angrist(1990)考察越战期间的参军者,当时美国对全国年轻男子以生日抽签的方式进行征兵。尽管抽签结果完全随机,但是否参军还取决于体检,且有些人得到豁免,另一些人未抽中却自愿参军。 个体分组仅部分地由自然实验决定,应使用抽签结果作为参军与否的工具变量进行估计。结果表明,服兵役会减少白人的长期收入,但不影响非白人的长期收入。双重差分法做随机实验或自然实验时,实验效果常需一段时间才显现。考虑两期面板数据(t=1实验前,t=2实验后): 为实验期虚拟变量(实验后=1;实验前=0), 为不可观测的个体特征,政策虚拟变量(policydummy)为 如果实验未能完全随机化(如观测数据),则 可能与被遗漏的个体特征 相关,导致OLS不一致。2019-07-18陈强计量及Stata应用
(c)201477双重差分法(续)对方程进行一阶差分(第二期减第一期),以消掉 :OLS为一致估计。根据与差分估计量同样的推理: 故称为“双重差分估计量”(Difference-in-Differencesestimator,简记DD),即实验组的平均变化与控制组的平均变化之差。2019-07-18陈强计量及Stata应用
(c)201478双重差分估计量示意图2019-07-18陈强计量及Stata应用
(c)201479扩展对于双重差分估计量,也可引入其他解释变量:用OLS估计上式。 以 为被解释变量的双重差分法不适用于多期的数据,需回到以 为被解释变量的面板模型。仍以两期数据为例,并忽略其他解释变量。2019-07-18陈强计量及Stata应用
(c)201480DD的两种形式方程与以下面板模型等价: 为实验组虚拟变量(实验组=1,控制组=0); 为实验期虚拟变量(实验后=1,实验前=0),互动项(实验组在实验期取值为1,反之为0)。 分组虚拟变量 刻画的是实验组与控制组本身的差异(即使不进行实验,也存在此差异),实验期虚拟变量 刻画的是实验前后两期本身的差异(即使不进行实验,也存在此时间趋势),互动项 度量实验组的政策效应。2019-07-18陈强计量及Stata应用
(c)201481推导原方程:t=1时,方程可写为t=2时,方程可写为的系数就是双重差分二者相减: 两方程完全相同,故互动项估计量。2019-07-18陈强计量及Stata应用
(c)201482推广到多期假设共有4期数据:•分别为第2-4期的时间虚拟变量(以捕捉即使没有政策变化也可能存在的时间效应)。政策虚拟变量为 双重差分法的优点在于,同时控制了分组效应(group-specificeffects)与时间效应(time-specificeffects)。2019-07-18陈强计量及Stata应用
(c)201483双重差分的Stata命令sscinstalldiff (下载安装命令diff)diffy,treat(varname)period(varname) cov(z1z2)robustreporttest “y”为结果变量( ),“treat(varname)”指定处理变量( ),“period(varname)”指定实验期虚拟变量( )。 “robust”表示汇报稳健标准误。“cov(z1z2)”指定其他解释变量,“cov”表示协变量(covariate);“report”表示汇报对协变量系数的估计结果。“test”表示检验在基期时,各变量在实验组与控制组的均值是否相等。2019-07-18陈强计量及Stata应用
(c)2014842019-07-18陈强计量及Stata应用
(c)201485例:最低工资的自然实验以数据集cardkrueger1994.dta为例被解释变量:fte(fulltimeemployment人数) 实验组虚拟变量treated(treated=1,快餐店在新泽西;treated=0,快餐店在宾州),实验期虚拟变量t(t=1,1992年11月;t=0,1992年2月)。 其他解释变量:bk(BurgerKing=1),kfc(KentuckyFriedChicken=1),roys(RoyRogers=1),wendys(Wendy’s=1)。手工计算双重差分法use
cardkrueger1994,cleargen
gd=t*treated (定义交叉项gd)reg
fte
gd
treated
t,r处理效应(互动项gd)系数为2.914,p值为0.0942019-07-18陈强计量及Stata应用
(c)2014862019-07-18陈强计量及Stata应用
(c)201487使用命令diffdifffte,t(treated)p(t)robust结果见下页:处理效应的系数估计值为2.914,p值为 0.094,与手工回归的结果完全相同。 表中将“t=0”的时期称为“Baseline”(基期),将“t=1”的时期称为“Follow-up”(跟踪期)。2019-07-18陈强计量及Stata应用
(c)2014882019-07-18陈强计量及Stata应用
(c)201489引入快餐品牌虚拟变量regftegdtreatedtbkkfcroys,r结果见下页:引入其他解释变量(即快餐品牌虚拟变量)后,处理效应的系数估计值增大为2.935,并接近5%的显著性水平(p值为0.058)。difffte,t(treated)p(t)cov(bkkfcroys) robust结果见下页:与手工回归完全一样。2019-07-18陈强计量及Stata应用
(c)2014902019-07-18陈强计量及Stata应用
(c)201491双重差分法的局限性 将双重差分法应用于观测数据时,如果政策虚拟变量 为内生,则依然得不到一致估计。 比如,政府提供的就业培训项目,完全由个人决定是否参与。由于实际处理水平 存在自我选择(selfselection),并非随机分组,导致不一致估计 解决方法之一:倾向得分匹配(propensityscorematching),使实验组与控制组在各方面特征尽可能接近。2019-07-18陈强计量及Stata应用
(c)201492Rubin’s
counterfactual
framework “处理变量”(treatmentvariable)项目(1=参与,0=未参与)。表示个体i是否参与未来收入或其他感兴趣的结果(outcomeofinterest)为个体i的未来收入有两种状态,取决于是否参加项目:为未参加项目的未来收入,为参加项目的未来收入2019-07-18陈强计量及Stata应用
(c)201493处理效应个体i的处理效应(treatmenteffect):平均处理效应(AverageTreatmentEffect,简记ATE): 参与者平均处理效应(AverageTreatmentEffectontheTreated,简记ATT): 非参与者平均处理效应(AverageTreatmentEffectontheUntreated,简记ATU):2019-07-18陈强计量及Stata应用
(c)201494选择难题 个体通常会根据参加项目的预期收益 而自我选择是否参加项目,导致对平均处理效应的估计带来困难,称为“选择难题”(theselectionproblem)。 与样本选择问题(Heckman,1979)的区别:样本选择问题通常不考虑某项目或政策的效应,故个体间的差异不在于是否得到处理,而在于是否能进入样本(即被解释变量是否可观测)随机分组可解决选择难题,但不适用于观测数据。2019-07-18陈强计量及Stata应用
(c)201495依可测变量选择 除 外,还可观测到其他个体特征,比如年龄、性别、培训前收入,记 ,也称“协变量”(covariates)。 如果个体的选择完全取决于可观测的 ,称为“依可测变量选择”(selectiononobservables),则可进行倾向得分匹配。对于“依不可测变量选择”(selectiononunobservables),处理更为困难。2019-07-18陈强计量及Stata应用
(c)201496可忽略性假设RosenbaumandRubin(1983)引入“可忽略性”假设:给定 ,则 独立于 ,记 。 可忽略性也称为“无混淆性”(unconfoundedness),“条件独立假定”(ConditionalIndependenceAssumption,简记CIA),或“依可测变量选择”(selectiononobservables)。 可忽略性是个很强的假定,除非有较丰富的协变量(arichsetofcovariates)。2019-07-18陈强计量及Stata应用
(c)201497匹配估计量的思想 假设个体i属于处理组,找到属于控制组的某个体j,使得个体j与个体i的可测变量取值尽可能相似(匹配),即 基于可忽略性假设,则个体i与个体j进入处理组的概率相近,具有可比性;故可将 作为 的估计量,即将作为对个体i处理效应的度量。 对控制组每位个体也进行匹配,然后对每位个体的处理效应平均,即得到“匹配估计量”(matchingestimators)。2019-07-18陈强计量及Stata应用
(c)201498倾向得分高维匹配不容易,希望用单一指标进行匹配。 RosenbaumandRubin(1983)使用“倾向得分”(propensityscore)来度量 与 距离。 个体i的倾向得分为,在给定组的条件概率,即的情况下,个体i进入处理,简记 使用倾向得分作为距离函数进行匹配,称为“倾向得分匹配”(PropensityScoreMatching,简记PSM)。2019-07-18陈强计量及Stata应用
(c)201499倾向得分定理把高维数据压缩为一维,通常会损失信息。但 倾向得分定理:如果可忽略性假定成立,则只须在给定 的情况下, 就独立于 。2019-07-18陈强计量及Stata应用
(c)2014100重叠假定 为了能够进行匹配,需要在 的每个可能取值上都同时存在处理组与控制组的个体,即“重叠假定”(overlapassumption)或“匹配假定”(matchingassumption)。重叠假定:对于 的任何可能取值,都有 。 重叠假定保证处理组与控制组的倾向得分取值范围有相同部分(commonsupport)。2019-07-18陈强计量及Stata应用
(c)2014101控制组处理组倾向得分共同取值范围(Common
Support)2019-07-18陈强计量及Stata应用
(c)20141022019-07-18陈强计量及Stata应用
(c)2014103倾向得分匹配的步骤(1)选择协变量 。尽量包括可能影响关变量,以满足可忽略性假设。与 的相估计倾向得分,一般使用logit回归。RosenbaumandRubin(1985)建议使用形式灵活的logit模型,比如包括的高次项与互动项。进行倾向得分匹配。匹配的具体方法见下页。根据匹配后样本(matchedsample)计算平均处理效应。2019-07-18陈强计量及Stata应用
(c)2014104k近邻匹配 “k近邻匹配”(k-nearestneighbormatching),即寻找倾向得分最近的k个不同组个体。 如果k=1,则为“一对一匹配”(one-to-onematching)。 缺点:即使“最近邻居”也可能相去甚远,从而失去可比性。2019-07-18陈强计量及Stata应用
(c)2014105卡尺匹配限制倾向得分的绝对距离。一般建议,为倾向得分的样本标准差; 称为“卡尺匹配”(calipermatching)或“半径匹配”(radiusmatching)。2019-07-18陈强计量及Stata应用
(c)2014106卡尺内最近邻匹配 “卡尺内最近邻匹配”(nearest-neighbormatchingwithincaliper),即在给定的卡尺范围寻找最近匹配,此法较为流行。2019-07-18陈强计量及Stata应用
(c)2014107倾向得分匹配的Stata命令sscinstallpsmatch2,replace选择项“replace”表示以最新版命令替代可能的旧命令psmatch2Dx1x2x3,outcome(y)logittiesate commonoddspscore(varname)quietly “D”为处理变量(treatmentvariable),“x1x2x3”为协变量,“outcome(y)”来指定结果变量“y”。选择项“logit”表示使用logit估计倾向得分,默认probit “ties”表示包括倾向得分相同的并列个体,默认按排序选择其中一位个体。2019-07-18陈强计量及Stata应用
(c)2014108倾向得分匹配的Stata命令(续)“ate”表示同时汇报ATE,ATU与ATT,默认仅汇报ATT 选择项“common”表示仅对共同取值范围(commonsupport)内个体进行匹配,默认对所有个体进行匹配。 选择项“odds”表示使用几率比(oddsratio,即)进行匹配;默认使用倾向得分p进行匹配。 选择项“pscore(varname)”用来指定某变量作为倾向得分,默认通过“x1x2x3”来估计倾向得分。选择项“quietly”表示不汇报对倾向得分的估计过程。2019-07-18陈强计量及Stata应用
(c)2014109k近邻匹配的Stata命令psmatch2Dx1x2x3,outcome(y)neighbor(k) noreplacement 选择项“neighbor(k)”表示进行k近邻匹配(k为正整数);默认k=1,即一对一匹配。 选择项“noreplacement”表示无放回匹配,默认为有放回;该选项只能用于一对一匹配。2019-07-18陈强计量及Stata应用
(c)2014110卡尺匹配的Stata命令psmatch2Dx1x2x3,outcome(y)radius caliper(real)选择项“radius”表示进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业部年终总结
- 护士心得体会范文大全(15篇)
- 物流安全生产责任书
- 高考地理二轮复习考前抢分专题识图技能专练图像四统计图表含答案
- 新教材高考地理二轮复习三10个长效热点综合专项训练热点10生活情境中的地理含答案
- 天津市河西区2024-2025学年高二上学期期中质量调查英语试卷(无答案)
- 2024年下学期城南区八年级地理期中试卷
- 欧姆定律(一)基础强化(强化训练)(解析版)-2022年中考物理一轮复习讲义+强化训练
- 音乐常识知识考试题及答案
- 上海地区高考语文五年高考真题汇编-古诗词赏析
- 六年级上册数学课件-3.6 分数连除和乘除混合运算丨苏教版 (共15张PPT)
- 人工血管动静脉内瘘术后护理课件
- 图书公司仓储物流管理制度及流程
- 关爱随班就读残疾儿童活动记录表
- 新三板知识测评答案
- 危险化学品MSDS(氮气)
- 腹腔镜下子宫切除手术的手术配合课件
- 城镇燃气设计规范
- 清远市城市树木修剪技术指引(试行)
- 广东粤人开心版五年级上册英语 Review 1课件
- GB∕T 16762-2020 一般用途钢丝绳吊索特性和技术条件
评论
0/150
提交评论