高级计量经济分析及Stata应用 课件 第7章-处理效应分析_第1页
高级计量经济分析及Stata应用 课件 第7章-处理效应分析_第2页
高级计量经济分析及Stata应用 课件 第7章-处理效应分析_第3页
高级计量经济分析及Stata应用 课件 第7章-处理效应分析_第4页
高级计量经济分析及Stata应用 课件 第7章-处理效应分析_第5页
已阅读5页,还剩164页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目上海师范大学商学院王周伟第7章处理效应分析主要内容7.1处理效应分析基础7.2回归调整估计法7.3逆概率加权估计法7.4增广逆概率加权估计法7.5逆概率加权回归调整估计法 7.6最近邻匹配估计 7.7倾向性得分匹配 7.8双重差分模型与三重差分模型7.9合成控制法 7.10断点回归模型 2025/4/1437.1处理效应分析基础7.1.1处理效应及其分步估计法很多问题可归结于检验某项政策或干预(D)能否达到预期效果(Y)。Y对D的回归只能检验其相关性,回归参数反映了平均预测效应(Averagepredictiveeffects,APE)。但相关并不意味着因果,相关关系是“预测”的基础,但因果关系才是“决策”的基础。因此就需要探索出D对Y的因果效应或处理效应(treatment-effects,TE),才可以把握以改变D来改变Y,这是决策而非预测。2025/4/1447.1处理效应分析基础这就需要使用观察数据来估计接受一种处理(treatment)而不是另一种处理的效果(即处理效应)。在观察数据(observationaldata)中,处理分配不受数据收集者的控制;因此,一些常见变量会影响处理分配和特定处理结果。观察数据有时被称为回顾性数据或非实验性数据,但为了避免混淆,我们将始终使用术语“观察数据”。项目参与者的总体就是“实验组”或“处理组”,没有参与项目的样本为“控制组”或“对照组”。2025/4/1457.1处理效应分析基础

7.1处理效应分析基础

7.1处理效应分析基础选择难题的解决方法之一就是随机分组。如果个体的选择完全取决于可以观测到的个体特征等变量,即“依可观测变量选择”,满足可忽略性和均值可忽略性,就可以使用基于反事实框架的匹配估计量,减少遗漏变量偏差。因此需要把可观测变量作为直接控制变量,引入回归方程,即得到处理效应模型:解决依不可测变量选择问题的方法之一就是遵循样本选择模型的思路,直接对处理变量Di进行结构建模。假设处理方程为:7.1处理效应分析基础

7.1处理效应分析基础7.1.2样本估计方程及其估计方法EE估计法通过求解样本估计方程(EE)来计算估计值。样本估计方程是总体期望方程的样本等价物。每个EE估计法指定了一组相关效应参数的估计方程,以及一组结果模型(OM)或处理模型(TM)中辅助参数的估计方程。下面会详细介绍定义RA、IPW、AIPW和IPWRA估计法的估计方程。EE估计法通过求解方程组来计算估计。标准的稳健估计与估计值方差(VCE)是一致的。所有细节都涉及OM或TM的估值器和函数形式的选择所指定的方程。RAIPWAIPWIPWRA回归调整逆概率加权增广逆概率加权逆概率加权回归调整原理通过回归模型来调整混杂因素影响利用倾向得分(propensityscore)来加权AIPW不仅使用倾向得分来加权,还对潜在的结果进行建模,从而提高了估计的效率和稳健性IPWRA结合了IPW和RA的特点,首先使用IPW对数据进行加权,然后对加权后的数据进行回归分析假设假设潜在的结果和处理变量之间的关系可以通过回归模型来捕捉给每个个体分配一个权重,这个权重是其接受处理的概率的倒数,以此来减少选择偏差如果倾向得分模型或结果模型中的一个模型是正确的,那么AIPW估计量就是无偏的旨在通过加权来减少偏差,然后通过回归调整进一步控制混杂因素优缺点RA方法简单直观,但在模型设定不当时可能会导致偏模拟一个随机对照试验的环境AIPW是IPW的扩展,它结合了回归调整和逆概率加权的优点。双重稳健IPWRA结合了IPW和RA的特点2025/4/1411异同点共同点:所有这些方法都旨在减少或消除由于混杂因素引起的偏差,以估计处理效应。不同点:【1】模型依赖性:RA完全依赖于回归模型的正确性,而IPW和AIPW依赖于倾向得分模型的正确性。AIPW由于其双重稳健性,在模型设定上更为灵活。【2】有效性:AIPW在理论上比IPW更有效,因为它利用了结果模型的信息,而IPWRA结合了IPW和RA,可能在某些情况下提供更稳健的估计。【3】稳健性:AIPW的双重稳健性意味着它在模型错误设定的情况下更为稳健,而RA和IPWRA则分别依赖于它们各自的模型设定。总的来说,AIPW因其双重稳健性而在实践中受到青睐,尤其是在模型设定不确定时。而RA、IPW和IPWRA则在不同情况下根据其特点和假设的合理性被选用。2025/4/14127.1处理效应分析基础

7.1处理效应分析基础

7.1处理效应分析基础对于mlogit,其样本估计函数为:OM的参数可以通过加权QML或加权非线性最小二乘法来估计。用于估计OM参数的估计函数是加权QML估计法的分数方程或加权非线性最小二乘估计的矩条件。因此,对于线性、logit,flogit,probit、fprobit、hetprobit和fhetprobit及poisson等模型,都具有的OM参数有两套样本估计函数。7.1处理效应分析基础在teffects中实施估计使用三个假设,证明用于估计和推断相关影响参数的方程式:1.条件平均独立性(Conditionalmeanindependence,CMI),允许我们根据样本中观察到的结果来估计潜在的结果平均数。2.重叠(Overlap),确保我们拥有每种处理水平中每种类型个体的数据。3.独立观察,确保一个人的结果和处理对任何其他个人的结果或处理没有影响。teffectsra实现了一些回归调整(RA)估计法;teffectsipw实现了一些逆概率加权(IPW)估计;teffectsipwra实现了一些逆概率加权回归调整(IPWRA)估计法;teffectsaipw实现了一些增广逆概率加权(AIPW)估计。所有这些都是作为估计方程(EE)估计法实现的。在CMI、重叠和独立假设下,估计量是一致且渐近正态分布。7.1处理效应分析基础观察数据的处理效应估计命令语法格式为:teffectssubcommand...[,options]子命令(subcommand)选项为:aipw:增广逆概率加权;ipw:逆概率加权;ipwra:逆概率加权回归平差;nnmatch:最近邻匹配;psmatch:倾向评分匹配;ra:回归调整。tefects使用观察数据评估潜在结果平均值(POM)、平均处理效果(ATEs)和受试者的平均处理效果(ATETs)。提供回归调整、逆概率加权和匹配估计,以及结合回归调整和逆概率加权的双稳健方法。结果可以是连续的、二进制的、计数的、分数的或非负的。处理模型可以是二进制的,也可以是多项式的,允许进行多值处理。7.2回归调整估计法

回归调整(RegressionAdjustment,RA)估计法使用特定处理预测结果平均值的对比来估计处理效果。RA估计法采用两步法来估计处理效果:1.在每个处理水平的一组协变量上拟合结果的独立回归模型。2.计算每个受试者和处理水平的预测结果的平均值。这些平均值反映了POM。这些平均值的对比提供了ATE的估计值。通过将平均值的计算限制在处理对象的子集,我们获得了ATETs。只要处理独立于协变量调节后的潜在结果,RA估计值是一致的。事实上,teffectsra使用了一种同时执行这两个步骤的估计技术,这样我们就不需要在第二步中修正标准误差来反映围绕预测结果的不确定性。7.2回归调整估计法

处理效应的RA估计量。RA估计法使用结果的条件平均值的观察水平预测来估计影响参数。处理的条件概率没有模型。RA估计法使用未加权QML估计法来估计条件平均模型的参数。换句话说,RA估计法使用样本估计函数:7.2回归调整估计法

7.2回归调整估计法回归调整实现的命令语法格式为:teffectsra(ovaromvarlist[,omodelnoconstant])(tvar)[if][in][weight][,statoptions]其中,ovar是一个二进制、计数、连续、分数或非负的感兴趣的结果;tvar必须包含代表处理水平的整数值;tmvarlist指定在处理模型中预测处理分配的变量。omodel为结果变量指定模型。其选项有:linear:线性结果模型(默认值);logit:逻辑结果模型;probit:probit结果模型;hetprobit(varlist):异方差概率结果模型;poisson:指数结果模型;flogit:分数逻辑结果模型;fprobit:分数概率结果模型;fhetprobit(varlist):分数异方差probit结果模型。7.2回归调整估计法其菜单操作为:Statistics>Treatmenteffects>Continuousoutcomes>RegressionadjustmentStatistics>Treatmenteffects>Binaryoutcomes>RegressionadjustmentStatistics>Treatmenteffects>Countoutcomes>RegressionadjustmentStatistics>Treatmenteffects>Fractionaloutcomes>RegressionadjustmentStatistics>Treatmenteffects>Nonnegativeoutcomes>Regressionadjustmentteffectsra通过回归调整从观察数据中估计平均处理效果、对受试者的平均处理效果和潜在结果平均值。回归调整估计法使用特定处理预测结果平均值的对比来估计处理效果。teffectsra接受连续、二进制、计数、分数或非阴性结果,并允许多值处理。7.2回归调整估计法例7.1回归调整我们首先使用teffectsra评估吸烟的平均处理效果,控制前三个月的检查状况、婚姻状况、母亲年龄和初生状况。在Stata,我们输入:.*下载数据.clearall.webusecattaneo2(ExcerptfromCattaneo(2010)JournalofEconometrics155:138–154)7.2回归调整估计法.*评估吸烟的平均处理效果,控制妊娠早期检查状况、婚姻状况、母亲年龄和第一胎状况.teffectsra(bweightprenatal1mmarriedmagefbaby)(mbsmoke)如果所有母亲都吸烟,平均出生体重将比没有母亲吸烟的平均出生体重3403克少240克。7.2回归调整估计法.*重新安装上述模型,但获得被处理的平均处理效果,而不是平均处理效果.teffectsra(bweightprenatal1mmarriedmagefbaby)(mbsmoke),atet当所有吸烟的母亲都吸烟时,平均出生体重为223克,而如果这些母亲都不吸烟,则平均出生体重为3361克。7.2回归调整估计法.*重新调整上述模型,但显示已处理和未处理受试者的POM和估计回归系数.teffectsra(bweightprenatal1mmarriedmagefbaby)(mbsmoke),pomeansaequations7.3逆概率加权估计法逆概率加权(Inverse-ProbabilityWeighting,IPW)估计法使用估计的概率权重来纠正由于每个受试者仅在一个潜在结果中观察到而产生的缺失数据问题。IPW估计法使用两步方法来估计处理效果:1.他们估计处理模型的参数,并计算估计的逆概率权重。2.他们使用估计的逆概率权重来计算每个处理水平结果的加权平均值。这些加权平均值的对比提供了ATE的估计值。使用此加权方案可以纠正缺失的潜在结果。这些步骤产生了对效应参数的一致估计,因为假设处理独立于协变量调节后的潜在结果。重叠假设确保预测的逆概率权重不会太大。7.3逆概率加权估计法处理效应的IPW估计量。IPW估计法使用处理的逆概率加权的观察结果来估计效应参数。没有结果模型。IPW估计使用QML估计来估计条件概率模型的参数。估计函数的向量是效应参数的估计函数与条件概率参数的估计函数的串联。IPW估计法使用的样本估计函数如下:所有IPW估计都使用归一化逆概率权重。这些权重与OM方程中使用的权重无关。归一化逆概率权重的函数形式随效应参数POM、ATE和ATET而变化。7.3逆概率加权估计法POM和ATE估计法使用归一化逆概率权重。个体i和处理水平t的非标准化权重为:标准化权重为:ATET估计法使用归一化处理调整的逆概率权重。处理调整的逆概率权重调整获得条件处理et的概率的逆概率权重。非规范化权重为:7.3逆概率加权估计法归一化权重为:POM的IPM样本估计函数为:ATE的IPM样本估计函数为:ATET的IPM样本估计函数为:7.3逆概率加权估计法逆概率加权估计的命令语法格式为:teffectsipw(ovar)(tvartmvarlist[,tmodelnoconstant])[if][in][weight][,statoptions]其中,tmodel指定处理变量的模型。对于多值处理,只有logit可用,使用多项式logit。tmodel选项可以是:logit:logistic处理模型(默认值);probit:probit处理模型;hetprobit(varlist):异方差probit处理模型。stat选项可以是:ate:估计人群中的平均处理效果(默认值);atet:评估处理后患者的平均处理效果;Pomens:估计潜在结果均值。7.3逆概率加权估计法菜单操作为:

Statistics>Treatmenteffects>Continuousoutcomes>Inverse-probabilityweighting(IPW)Statistics>Treatmenteffects>Binaryoutcomes>Inverse-probabilityweighting(IPW)Statistics>Treatmenteffects>Countoutcomes>Inverse-probabilityweighting(IPW)Statistics>Treatmenteffects>Fractionaloutcomes>Inverse-probabilityweighting(IPW)Statistics>Treatmenteffects>Nonnegativeoutcomes>Inverse-probabilityweighting(IPW)teffectsipw通过逆概率加权(ipw)从观察数据中估计平均处理效果、对受试者的平均处理效果和潜在结果平均值。IPW估计法使用估计的概率权重纠正关于潜在结果的缺失数据。teffectsipw接受连续、二进制、计数、分数或非负结果,并允许多值处理。7.3逆概率加权估计法例7.2逆概率加权估计我们首先使用teffectsipw来估计吸烟对出生体重的平均处理效果。我们将使用probit模型预测处理状态,使用prenatal1、mmarried、mage、mage平方和fbaby作为解释变量:*下载数据clearallwebusecattaneo27.3逆概率加权估计法*估计吸烟对出生体重的平均处理效果,使用probit模型预测处理状态

teffectsipw(bweight)(mbsmokemmarriedc.mage##c.magefbabymedu,probit)如果所有母亲都吸烟,平均出生体重将比没有母亲吸烟的平均出生体重3403克少231克。7.3逆概率加权估计法*估计受试者的平均处理效果

teffectsipw(bweight)(mbsmokemmarriedc.mage##c.magefbabymedu,probit),atet当所有吸烟的母亲都吸烟时,平均出生体重比没有吸烟的母亲平均出生体重3363克少225克。7.3逆概率加权估计法*以百分比的形式估计平均处理效果

teffectsipw(bweight)(mbsmokemmarriedc.mage##c.magefbabymedu,probit),coeflegend.nlcom_b[ATE:r1vs0.mbsmoke]/_b[POmean:0.mbsmoke]_nl_1:_b[ATE:r1vs0.mbsmoke]/_b[POmean:0.mbsmoke]与没有母亲吸烟的情况相比,每位母亲吸烟的平均出生体重估计下降了6.8%。我们还获得了减少5.3%至8.3%的95%置信区间。7.4增广逆概率加权估计法AIPW增广逆概率加权(AugmentedInverse-ProbabilityWeighting,AIPW)估计法使用逆概率权重来纠正由于每个受试者仅在一个潜在结果中观察到而产生的缺失数据问题;这些估计法还使用结果模型中的增广项来修正估计法,以防处理模型指定错误。如果正确指定了处理模型,那么在大样本中,增强项将变为零。AIPW估计法计算每个处理水平的增强逆概率加权结果的平均值。这些平均值的对比提供了对处理效果的估计。AIPW估计法使用一个模型来预测处理状态,他们使用另一个模型来预测结果。由于双重鲁棒性,只有正确指定这两个模型中的一个,AIPW估计量才能保持一致。7.4增广逆概率加权估计法AIPWAIPW估计法采用三步法估计处理效果:1.他们估计处理模型的参数并计算逆概率权重。2.他们估计每个处理水平的结果的独立回归模型,并获得每个受试者的处理特异性预测结果。3.他们计算特定处理预测结果的加权平均值,其中权重是步骤1中计算的逆概率权重。这些加权平均值的对比提供了ATE的估计值。7.4增广逆概率加权估计法AIPW

7.4增广逆概率加权估计法AIPW

7.4增广逆概率加权估计法AIPW增广逆概率加权(AIPW)估计的命令语法格式为:teffectsaipw(ovaromvarlist[,omodelnoconstant])(tvartmvarlist[,tmodelnoconstant])[if][in][weight][,statoptions]选项说明同teffectsipwra。teffectsaipw通过增强逆概率加权(AIPW)从观察数据中估计平均处理效果和潜在结果平均值。AIPW估计法结合了回归调整和逆概率加权方法。AIPW估计具有双重鲁棒性。teffectsaipw接受连续、二进制、计数、分数或非阴性结果,并允许多值处理。7.4增广逆概率加权估计法AIPW菜单操作为:Statistics>Treatmenteffects>Continuousoutcomes>Augmentedinverse-probabilityweightingStatistics>Treatmenteffects>Binaryoutcomes>Augmentedinverse-probabilityweightingStatistics>Treatmenteffects>Countoutcomes>Augmentedinverse-probabilityweightingStatistics>Treatmenteffects>Fractionaloutcomes>Augmentedinverse-probabilityweightingStatistics>Treatmenteffects>Nonnegativeoutcomes>Augmentedinverse-probabilityweighting7.4增广逆概率加权估计法AIPW例7.3增强的逆概率加权(AIPW)估计我们首先使用teffectsaipw评估mbsmoke对体重的平均处理效果。我们使用probit模型预测处理状态,作为mmarried、mage和fbaby的函数;为了最大限度地提高该模型的预测能力,我们使用因子变量表示法结合母亲年龄的二次效应,这是我们模型中唯一的连续协变量。我们使用线性回归模型出生体重,使用产前1、mmarried、mage和fbaby作为解释变量。我们录入:*下载数据.clearall.webusecattaneo27.4增广逆概率加权估计法AIPW*使用probit模型预测处理状态,估计mbsmoke对体重的平均处理效果

.teffectsaipw(bweightprenatal1mmarriedmagefbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,probit)如果所有母亲都吸烟,平均出生体重将比没有母亲吸烟的平均出生体重3403克少231克。7.4增广逆概率加权估计法AIPW*使用Pomens和aequations获得两种潜在结果均值的估计值,并查看我们估计值下的所有拟合方程

.teffectsaipw(bweightprenatal1mmarriedmagefbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,probit),pomeansaequations7.4增广逆概率加权估计法AIPW*重新构建上述模型,但使用异方差probit对处理变量进行建模

.teffectsaipw(bweightprenatal1mmarriedfbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,hetprobit(c.mage)),aequations标记为TME1lnsigma的方程表示用于建模方差对数的异方差函数。由于我们指定的单个变量的系数在5%以下显著,我们得出结论,允许异方差确实是必要的。7.4增广逆概率加权估计法AIPW例7.4增强的逆概率加权(AIPW)估计的WNLS拟合*下载数据.clearall.webusecattaneo2*使用WNLS拟合上述结果模型.teffectsaipw(bweightprenatal1mmarriedmagefbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,probit),wnls7.5逆概率加权回归调整估计法IPWRA逆概率加权回归调整(Inverse-ProbabilityWeightedRegressionAdjustment,IPWRA)估计法使用概率权重获得结果回归参数,这些参数解释了由于每个受试者仅在一个潜在结果中观察到一个而产生的缺失数据问题。调整后的结果回归参数用于计算处理水平预测结果。这些平均值的对比提供了对处理效果的估计。IPWRA估计法使用一个模型来预测处理状态,他们使用另一个模型来预测结果。由于IPWRA估计量具有双重鲁棒性,只有正确指定两个模型中的一个,IPWRA估计量才能保持一致。IPWRA估计法使用三步方法来估计处理效果:1.他们估计处理模型的参数并计算逆概率权重。2.使用估计的逆概率权重,他们拟合每个处理水平的结果加权回归模型,并获得每个受试者的特定处理预测结果。7.5逆概率加权回归调整估计法IPWRA他们计算特定处理预测结果的平均值。这些平均值的对比提供了ATE的估计值。通过将平均值的计算限制在处理对象的子集,我们可以获得ATETs。这些步骤产生了对效应参数的一致估计,因为假设处理独立于协变量调节后的潜在结果。重叠假设确保预测的逆概率权重不会太大。逆概率加权回归调整估计的命令语法格式为:teffectsipwra(ovaromvarlist[,omodelnoconstant])(tvartmvarlist[,tmodelnoconstant])[if][in][weight][,statoptions]其中,ovar是一个二进制、计数、连续、分数或非负的感兴趣的结果;omvarlist指定结果模型中的协变量;tvar必须包含代表处理水平的整数值;tmvarlist指定处理分配模型中的协变量。7.5逆概率加权回归调整估计法IPWRAomodel为结果变量指定模型。其选项有:linear:线性结果模型(默认值);logit:逻辑结果模型;probit:probit结果模型;hetprobit(varlist):异方差概率结果模型;poisson:指数结果模型;flogit:分数逻辑结果模型;fprobit:分数概率结果模型;fhetprobit(varlist):分数异方差probit结果模型;tmodel指定处理变量的模型。其选项有:logit:逻辑结果模型;probit:probit结果模型;hetprobit(varlist):异方差概率结果模型。7.5逆概率加权回归调整估计法IPWRAStatistics>Treatmenteffects>Continuousoutcomes>RegressionadjustmentwithIPWStatistics>Treatmenteffects>Binaryoutcomes>RegressionadjustmentwithIPWStatistics>Treatmenteffects>Countoutcomes>RegressionadjustmentwithIPWStatistics>Treatmenteffects>Fractionaloutcomes>RegressionadjustmentwithIPWStatistics>Treatmenteffects>Nonnegativeoutcomes>RegressionadjustmentwithIPWteffectsipwra通过逆概率加权回归调整(IPWRA)从观察数据中估计平均处理效果(ATE)、对受试者的平均处理效果(ATET)和潜在结果平均值(POM)。IPWRA估计法使用加权回归系数计算处理水平预测结果的平均值,其中权重是处理的估计逆概率。这些平均值的对比估计了处理效果。IPWRA估计具有双重鲁棒性。teffectsipwra接受连续、二进制、计数、分数或非负结果,并允许多值处理。7.5逆概率加权回归调整估计法IPWRA例7.5逆概率加权回归调整估计我们使用teffectsipwra评估吸烟对出生体重的平均处理效应。我们将使用probit模型预测处理状态,作为mmarried,mage和fbaby的函数;为了最大限度地提高该模型的预测能力,我们使用因子变量表示法纳入母亲年龄的二次效应,这是我们模型中唯一的连续协变量。我们将使用线性回归(默认)来建模出生体重,使用prenatal1、mmarried、mage和fbaby作为解释变量。我们键入.*下载数据.clearall.webusecattaneo2(ExcerptfromCattaneo(2010)JournalofEconometrics155:138–154)7.5逆概率加权回归调整估计法IPWRA.*估计吸烟对出生体重的平均处理效果,使用probit模型预测处理状态.teffectsipwra(bweightprenatal1mmarriedmagefbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,probit)7.5逆概率加权回归调整估计法IPWRA例7.6带逆概率加权的回归调整估计,显示POM和方程式.*下载数据.clearall.webusecattaneo2(ExcerptfromCattaneo(2010)JournalofEconometrics155:138–154)7.5逆概率加权回归调整估计法IPWRA.*显示POM和方程式.teffectsipwra(bweightprenatal1mmarriedmagefbaby)(mbsmokemmarriedc.mage##c.magefbabymedu,probit),pomeansaequations7.5逆概率加权回归调整估计法IPWRA.*重新构建上述模型,但使用异方差概率对处理变量进行建模.teffectsipwra(bweightprenatal1mmarriedfbabyc.mage)(mbsmokemmarriedc.mage##c.magefbabymedu,hetprobit(c.mage##c.mage)),aequations样本匹配的基本方法最近邻匹配估计法NNM倾向性匹配法PSM差分法DID合成控制法SCM定义选择控制组中倾向性得分最接近的样本作为匹配样本使用倾向得分函数将多维向量的信息压缩到一维,然后根据倾向得分进行匹配通过比较处理组和控制组在政策或干预前后的变化差异来估计因果效应通过选择权重,加权后构造一个合成的控制组,使其在干预前与处理组尽可能相似特点简单直观,但可能受到匹配对的特异性影响较大可以减少观察性研究中的选择偏差,适用于减少混杂因素的影响可以控制不随时间变化的未观测异质性,但要求干预前后两组的变化趋势相同可以提供灵活的权重选择以优化匹配效果适用场景适用于样本量较小或需要精确匹配的情况适用于需要控制多个协变量的情况,以模拟随机对照试验的效果适用于有明确干预前后时间点的政策评估适用于处理组数量较少的情况,或单一单位受到干预的情况2025/4/1457样本匹配基本方法的异同点总结共同点:所有方法都旨在通过控制混杂变量来估计干预或处理的因果效应。不同点:匹配方法:最近邻匹配和倾向性匹配法侧重于在个体层面上进行匹配,而差分法和合成控制法则侧重于在组层面上进行比较。数据要求:差分法要求有干预前后的数据,合成控制法要求有足够的对照组数据来构建合成控制组。适用场景:倾向性匹配法和最近邻匹配法适用于个体层面的匹配,而差分法适用于有明确干预时间点的政策评估,合成控制法适用于单一单位干预的情况。结果解释:差分法和合成控制法的结果更易于解释为因果效应,而匹配方法的结果可能受到匹配质量的影响。2025/4/14587.6最近邻匹配估计

7.6最近邻匹配估计teffectsnnmatch通过使用每个观察的协变量的加权函数来确定“最近的”。默认情况下,使用马氏距离,其中权重基于协变量方差-协方差矩阵的倒数。teffectsnnmatch还允许使用分类协变量的精确匹配。例如,您可能希望强制所有匹配同一性别或种族。NNM是非参数的,因为无论是结果模型还是处理模型都没有明确的函数形式。这种灵活性是有代价的;与采用函数形式的估计法相比,估计法需要更多的数据才能得到真值。更正式地说,当匹配多个连续协变量时,NNM估计量以低于参数率(即样本量的平方根)的速度收敛到真值。teffectsnnmatch使用偏差校正来解决此问题。teffectspsmatch实现了偏差校正的替代方案;该方法匹配单个连续协变量,即估计的处理概率。7.6最近邻匹配估计

7.6最近邻匹配估计由此得到ATE和ATET:7.6最近邻匹配估计最近邻匹配估计的命令语法格式为:teffectsnnmatch(ovaromvarlist)(tvar)[if][in][weight][,statoptions]其中,ovar是一个二进制、计数、连续、分数或非负的感兴趣的结果;omvarlist指定结果模型中的协变量;tvar必须包含代表处理水平的整数值。只允许两种处理水平。teffectsnnmatch通过最近邻匹配从观察数据中估计平均处理效果和对受试者的平均处理效果。最近邻匹配估计法通过使用接受其他处理水平的相似受试者的平均结果来估算每个受试者缺失的潜在结果。受试者之间的相似性基于每次观察的协变量的加权函数。通过计算每个受试者的观察和估算潜在结果之间的差异平均值来计算处理效果。teffectsnnmatch接受连续、二进制、计数、分数或非负结果。7.6最近邻匹配估计菜单操作为:Statistics>Treatmenteffects>Continuousoutcomes>Nearest-neighbormatchingStatistics>Treatmenteffects>Binaryoutcomes>Nearest-neighbormatchingStatistics>Treatmenteffects>Countoutcomes>Nearest-neighbormatchingStatistics>Treatmenteffects>Fractionaloutcomes>Nearest-neighbormatchingStatistics>Treatmenteffects>Nonnegativeoutcomes>Nearest-neighbormatching7.6最近邻匹配估计例7.7最近邻匹配估计我们首先使用teffectsnnmatch评估mbsmoke对体重的平均处理效果。使用mage、prenatal1、mmarried和fbaby协变量定义的马氏距离匹配受试者。.*下载数据.clearall.webusecattaneo2(ExcerptfromCattaneo(2010)JournalofEconometrics155:138–154)7.6最近邻匹配估计.*估计mbsmoke对体重的平均处理效果.teffectsnnmatch(bweightmageprenatal1mmarriedfbaby)(mbsmoke)如果所有母亲都吸烟,平均出生体重将比没有母亲吸烟的平均出生体重少240克。7.6最近邻匹配估计.*重新运行上述模型,但要求二进制变量精确匹配.teffectsnnmatch(bweightmage)(mbsmoke),ematch(prenatal1mmarriedfbaby)metric(euclidean)当对两个或多个连续协变量进行匹配时,最近邻匹配估计量是不一致的。使用变量的线性函数可以用biasadj()指定。7.6最近邻匹配估计.*匹配两个连续变量mage和fage,并使用偏差调整估计法.teffectsnnmatch(bweightmagefage)(mbsmoke),ematch(prenatal1mmarriedfbaby)biasadj(magefage)7.7倾向性得分匹配倾向评分匹配(Propensity-ScoreMatching,PSM)使用相似受试者的平均结果处理水平,以估算每个受试者缺失的潜在结果。ATE的计算公式为取每个受试者的观察结果和潜在结果之间的差异平均值。teffectspsmatch通过使用估计的处理来确定受试者之间的距离概率,被称为倾向分数。这种匹配分数类型称为倾向性匹配(PSM)。PSM不需要偏差校正,因为PSM在单个连续协变量上匹配。相比之下,在teffectsnnmatch中实现的最近邻匹配估计法使用了一个双方向匹配多个连续协变量时的术语。实际上,PSM估计法参数化处理概率模型中的偏差校正项。7.7倾向性得分匹配倾向性得分匹配(PropensityScoreMatching(PSM))估计的命令语法格式为:teffectspsmatch(ovar)(tvartmvarlist[,tmodel])[if][in][weight][,statoptions]其选项说明同上。teffectspsmatch通过倾向评分匹配,根据观察数据估计平均处理效果和对受试者的平均处理效果。倾向评分匹配估计法通过使用接受其他处理水平的类似受试者的平均结果。受试者之间的相似性基于估计的处理概率,即倾向评分。处理效果通过每个受试者的观察结果和潜在结果之间的平均差异计算。teffectspsmatch接受连续、二进制、计数、分数或非负结果。7.7倾向性得分匹配菜单操作为:Statistics>Treatmenteffects>Continuousoutcomes>Propensity-scorematchingStatistics>Treatmenteffects>Binaryoutcomes>Propensity-scorematchingStatistics>Treatmenteffects>Countoutcomes>Propensity-scorematchingStatistics>Treatmenteffects>Fractionaloutcomes>Propensity-scorematchingStatistics>Treatmenteffects>Nonnegativeoutcomes>Propensity-scorematching7.7倾向性得分匹配例7.8倾向性得分匹配我们首先使用teffects-psmatch来估计bweight的mbsmoke的ATE。我们使用logistic模型(默认)预测每个受试者的倾向得分,使用协变量mage、medu、mmarried和fbaby。因为PSM的性能取决于倾向得分,我们将使用因子变量表示法包括mage的线性和二次项,mage是我们模型中唯一的连续变量:.*下载数据.clearall.webusecattaneo2(ExcerptfromCattaneo(2010)JournalofEconometrics155:138–154)7.7倾向性得分匹配.*估计mbsmoke对体重的平均处理效果,使用logistic模型预测每个受试者的倾向得分.teffectspsmatch(bweight)(mbsmokemmarriedc.mage##c.magefbabymedu)如果所有母亲都吸烟,平均出生体重将比没有母亲吸烟的平均出生体重少211克。7.7倾向性得分匹配.*重新调整之前的模型,但仅当倾向性得分的绝对差异小于0.1时,才将一对观察值视为匹配.teffectspsmatch(bweight)(mbsmokemmarriedc.mage##c.magefbabymedu),caliper(0.1)7.8双重差分模型与三重差分模型

7.8双重差分模型与三重差分模型

DID和DDD的异同点总结共同点:DID和DDD都是基于差异的方法,它们都试图通过比较不同组在不同时间点的变化来估计干预的效应。不同点:维度:DID比较两组(处理组和对照组)在两个时间点(干预前后)的差异,而DDD则引入了第三个维度,可能是另一个时间点或另一个处理组,以控制更多的异质性。假设:DDD需要比DID更多的假设来确保估计的一致性,特别是新引入维度的平行趋势假设。适用性:DID适用于处理组和对照组在干预前趋势相同的情况,而DDD适用于这些趋势不同的复杂情况,或者当存在其他未观测到的异质性时。复杂性:DDD的方法论和实施比DID更为复杂,因为它需要额外的数据处理和模型设定。2025/4/1477双重差分法的假设假设:线性关系假设,稳定性假设,平行趋势假设。1)线性关系假设:该假设来自于线性回归,认为因变量(Treatment)与结果变量存在线性关系。(2)稳定性假设:政策干预只影响处理组,不会对控制组产生交互影响,或者政策干预不会产生外溢效应。(3)平行趋势假设:实验组和对照组在没有干预的情况下,结果的趋势是一样的。即在不干预的情况下,前后两个时间点实验组与对照组的差值一致。实证使用DID时,前两个假设通常会被满足、无需专门验证,需要重点验证第三个假设。2025/4/1478平行趋势检验平行趋势检验是因果推断中用于验证处理组和对照组在政策或干预实施之前是否具有相似趋势的一种方法。其核心原理基于以下假设:如果两组在干预前的趋势是平行的,那么干预后两组之间的任何差异更有可能是由干预本身引起的,而不是其他未观测到的因素。以下是平行趋势检验的几个关键点:1.平行趋势假设:在政策实施之前,处理组和对照组的结果变量的时间趋势是相同的。这意味着,如果没有干预,两组的潜在结果趋势将会是平行的。2.图形化检验:通过绘制处理组和对照组在干预前后的结果变量(如销售额、交通流量等)的时间趋势图,直观比较两组的趋势是否平行。如果两组在干预前的趋势线大致相同,这支持了平行趋势的假设。2025/4/14793.回归分析:在统计上,可以通过构建包含时间虚拟变量和处理组虚拟变量交互项的回归模型来检验平行趋势。具体来说,将每一年与干预年的关系做成虚拟变量,并与干预变量做交互,放入回归中,检验干预前年份的回归系数是否有统计学意义。如果干预前的年份系数均不显著,这表明满足平行趋势假设。4.事件研究法:这是一种更为精确的检验方法,通过生成年份虚拟变量与处理组虚拟变量的交互项,加入模型中进行回归,以检验处理组和对照组在干预前后的差异。如果干预前的交互项系数在0轴附近波动,而干预后显著不为0,则支持平行趋势假设

2025/4/1480【CAUSAL】Causal-estat统计检验:在回归分析中,如果干预前的交互项系数不显著,这表明处理组和对照组在干预前的趋势没有显著差异,从而支持平行趋势的假设。这是判断政策效果是否可信的重要步骤。estatptrends命令的原假设是“Lineartrendsareparallel”,即在控制组与处理组均有线性时间趋势的大前提下,进一步检验二者的线性趋势是否相同。这意味着在干预前,处理组和对照组的结果变量趋势应该是平行的。estatptrends命令执行的是一个F检验,其统计量计算基于回归模型,该模型包括处理组与控制组在干预前的时间趋势。具体而言,模型会估计处理组和控制组在干预前每个时间点的斜率是否相同。如果斜率相同,则认为平行趋势假设成立。总之,平行趋势检验的原理是通过比较处理组和对照组在干预前的趋势,来验证干预效果的可信度。如果两组在干预前的趋势是平行的,那么干预后的差异更有可能是由干预引起的,这为因果推断提供了坚实的基础。2025/4/14817.8双重差分模型与三重差分模型双重差分法实现的命令语法格式为:(1)重复横截面数据的DID:

didregress(ovaromvarlist)(tvar[,continuous])[if][in][weight],group(groupvars)[time(timevar)options](2)纵向数据的DID:

xtdidregress(ovaromvarlist)(tvar[,continuous])[if][in][weight],group(groupvars)[time(timevar)options]其中选项说明如下:ovar是研究问题的效果。omvarlist指定结果模型中的协变量,可能包含因子变量。tvar必须是一个二进制变量,表示接受处理的观察结果,或是一个测量处理强度的连续变量。7.8双重差分模型与三重差分模型groupvars是分类变量,表示处理发生的组水平。必须至少指定一个组变量。如果指定了timevar,则最多可以指定两个组变量。如果未指定timevar,则在最多可以指定三个组变量。模型选项为:timevar是一个时间变量。如果groupvar只有一个变量,则必须指定它。*group(groupvars):指定组变量#time(timevar)指定时间变量nointeract:排除组()和时间()交互nogteffects:不包括模型中的组和时间效应aggregate(aggmethod):聚合到交互GroupVar和timevar定义的级别wildbootstrap[(wildopts)]:使用wildbootstrap计算置信区间和p值7.8双重差分模型与三重差分模型菜单操作:(1)didregress:

Statistics>Treatmenteffects>Continuousoutcomes>Differenceindifferences

(2)xtdidregress:

Statistics>Treatmenteffects>Continuousoutcomes>Differenceindifferences(FE)Statistics>Longitudinal/paneldata>Differenceindifferences【1】estattrendplots:生成两个诊断图,用于评估平行趋势假设。需要使用didress或xtdidress对ATET进行一致的估计。【2】estatptrends:在预处理期间对结果变量的线性趋势在对照组和处理组之间是否平行进行了测试。【3】estatgranger:测试确定是否可以在处理前观察到处理效果。【4】estatgrangerplot:通过绘制处理指标变量的领先和滞后系数,绘制出特定时间的处理效果图。【5】estatbdecomp:当存在多个序列时,estat-bdecomp将处理效应(Bacon)分解为所有2乘2的处理效应成分,每个序列具有不同的治疗时间。7.8双重差分模型与三重差分模型didregress根据观察数据,通过差异中的差异(DID)或差异中的差异中的差异(DDD)来估计被处理者的平均处理效果(ATET)。二元或连续处理的ATET通过拟合具有时间和组固定效应的线性模型来估计结果。DID回归进行的DID和DDD估计可应用于包含重复横截面的数据,在这些横截面中观察到不同的个体组每个时间段。xtdidregress回归通过DID或DDD对面板数据的观测数据估计ATET。通过拟合具有时间和面板固定效应的线性模型,估计二元或连续处理对连续结果的ATET。7.8双重差分模型与三重差分模型例7.9DID与DDD一位健康提供者有兴趣研究新的住院程序对患者满意度的影响。医疗机构有从1月到7月的每月患者数据。新的入院程序于4月份由新管理的医院实施。在研究的46家医院中,有18家实施了新程序。健康提供者将使用DID回归分析新入院程序对参与该计划的医院的影响。感兴趣的结果是患者满意度satis,它被记录为对向患者提出的一组四个问题的平均回答。satis的值可能在0到10之间,其中10是最大可能的满意度,0是完全失望。程序变量标记处理后的观察结果;如果接受调查的个人在3月之后使用新程序入院,则为1,否则为0。为获取结果变量satis的ATET,我们键入:7.8双重差分模型与三重差分模型.*下载数据.clearall.webusehospdd(Artificialhospitaladmissionproceduredata).*评估新入院程序对接受新程序的患者满意度的平均处理效果.didregress(satis)(procedure),group(hospital)time(month)7.8双重差分模型与三重差分模型第一个表格提供了有关处理组和对照组以及处理时间的信息。标题组的第一部分告诉我们处理和对照医院的数量:28家医院使用旧程序,18家医院使用新程序。表格的第二部分给出了我们第一次观察对照组医院和第一次观察处理组医院处理(新入院程序)的信息。在本例中,所有采用新程序的医院都是在4月份,即时间段4时这样做的。如果有的话,医院后来采取了这项政策,第一次处理的最短和最长时间会有所不同。ATET为0.85,与没有接受处理的医院实施新程序的情况相比,满意度几乎提高了1个百分点。换言之,如果实施新入院程序的医院没有这样做,他们的满意度平均会下降近一个百分点。7.8双重差分模型与三重差分模型*执行这两项诊断检查

estattrendplots*平行趋势检验

estatptrends7.8双重差分模型与三重差分模型.*使用带Bell和McCaffrey自由度调整的偏差校正聚类稳健标准估计先前模型估计的标准误差.didregress(satis)(procedure),group(hospital)time(month)vce(hc2).*使用wildbootstrap()选项获取置信区间和p值.didregress(satis)(procedure),group(hospital)time(month)wildbootstrap(rseed(111))7.8双重差分模型与三重差分模型如果示例7.9中的结果可能是其他未观察到的变量的结果,而不是新的住院程序的结果,则可能会产生疑问。医疗机构管理人员认为,对调查的回应与个人的医院就诊,患者可能具有未观察到的特征,这些特征会影响他们就诊的频率以及他们对入院程序的感受。换言之,可能有一些未观察到的特征混淆了新入院的影响,程序管理员决定使用DDD模型获取ATET。他们希望评估高频率或极高频率就诊患者的平均处理效果。为此,我们将首先创建一个新变量hightrt作为新的处理标识符。如果个人就诊频率高或非常高(频率=3或4),并且医院在4月份实施了新的入院程序,则观察结果现在标记为已处理(高TRT=1)。7.8双重差分模型与三重差分模型.*DDD模型拟合.generatehightrt=procedure==1&(frequency==3|frequency==4).labeldefinetrt0"Untreated"1"Treated".labelvalueshightrttrt.didregress(satis)(hightrt),group(hospitalfrequency)time(month)7.8双重差分模型与三重差分模型例7.10面板DID与面板DDD模型.*下载数据.clearall.webusehospdd(Artificialhospitaladmissionproceduredata).*声明为面板数据.xtsethospitalPanelvariable:hospital(unbalanced).*评估新入院程序对接受新程序的患者满意度的平均处理效果.xtdidregress(satis)(procedure),group(hospital)time(month)7.8双重差分模型与三重差分模型.*使用带Bell和McCaffrey自由度调整的偏差校正聚类稳健标准估计先前模型估计的标准误差.xtdidregress(satis)(procedure),group(hospital)time(month)vce(hc2).*平行趋势检验.estatptrends2025/4/14947.8双重差分模型与三重差分模型.*格兰杰因果关系检验.estatgranger.*使用wildbootstrap()选项获取置信区间和p值.xtdidregress(satis)(procedure),group(hospital)time(month)wildbootstrap(rseed(111))2025/4/14957.8双重差分模型与三重差分模型.estattrendplots2025/4/14967.8双重差分模型与三重差分模型例7.11面板数据的DID或DDD例如,一家医疗机构有兴趣研究新的入院程序对患者满意度的影响。医疗机构每月都有从1月到7月的患者数据。新的入院程序于4月由新管理的医院实施。在参与研究的46家医院中,有18家实施了新程序。医疗机构将使用DID回归分析新入院程序关于参与该项目的医院的效果。感兴趣的结果是患者满意度,satis是对患者提出的一组四个问题的平均回答。satis的值可能介于0和10之间,其中10是最大可能的满意度水平,0是完全失望。procedure变量标记处理后的观察结果;如果一个被调查的人在3月后使用新程序入院,则取值为1,其他情况为0。为得到结果的ATET,我们输入:didregress(satis)(procedure),group(hospital)time(month)2025/4/14977.8双重差分模型与三重差分模型第一组括号用于指定感兴趣的结果,后面是协变量在模型中。在这种情况下,没有协变量,只有结果,satis。第二套圆括号用于指定二进制变量,该变量表示经过处理的观察结果、过程。group()和time()选项用于在模型中构造包含的group和timefixedeffects。group()中指定的变量也很重要,因为它定义了默认集群的集群水平——稳健的标准误差;在这种情况下,我们聚集在医院层面。此命令及结果如下:1.DIDestimation*清理内存,下载数据集.clear.use/data/r17/hospdd(Artificialhospitaladmissionproceduredata)2025/4/14987.8双重差分模型与三重差分模型*拟合DID.didregress(satis)(procedure),group(hospital)time(month)2025/4/14997.8双重差分模型与三重差分模型*执行这两项诊断检查.estattrendplots*平行趋势假设检验.estatptrends2025/4/141007.8双重差分模型与三重差分模型*2.拟合DDD创建一个新变量hightrt作为我们的新处理标识符。如果一个人的医院就诊频率很高或非常高(频率=3或4),并且医院在4月份实施了新的入院程序,则观察结果现在被标记为已处理(高TRT=1)。.generatehightrt=procedure==1&(frequency==3|frequency==4).labeldefinetrt0"Untreated"1"Treated".labelvalueshightrttrt.didregress(satis)(hightrt),group(hospitalfrequency)time(month)2025/4/141017.8双重差分模型与三重差分模型2025/4/141027.8双重差分模型与三重差分模型*3.面板数据DID*清理内存,下载数据集.clear.use/data/r17/patents.xtsetclassid(Panelvariable:classid(balanced))2025/4/141037.8双重差分模型与三重差分模型*面板DID估计.xtdidregress(uspatentsfpatents)(gotpatent),group(classid)time(year)2025/4/141047.8双重差分模型与三重差分模型*4.绘制DID诊断图表和检验*清理内存,下载数据集.clear.use/data/r17/parallelt.xtsetid1(Panelvariable:id1(unbalanced))2025/4/141057.8双重差分模型与三重差分模型*面板DID估计.xtdidregress(y1c.x1##c.x2)(treated1),group(id1)time(t1)2025/4/141067.8双重差分模型与三重差分模型*以图形方式探索平行趋势的假设.estattrendplots*平行趋势检验.estatptrends2025/4/141077.8双重差分模型与三重差分模型*格兰杰型因果关系模型估计检验.estatgranger*5.诊断和测试是否存在非线性平均结果差异.xtsetid2.xtdidregress(y2c.z1##c.z2)(treated2),group(id2)time(t2)2025/4/141087.8双重差分模型与三重差分模型.estattrendplots.estatptrends.estatgranger2025/4/141097.8双重差分模型与三重差分模型*6.满足平行趋势假设时的诊断和测试.xtsetid3.xtdidregress(y3c.w1##c.w2)(treated3),group(id3)time(t3)2025/4/141107.8双重差分模型与三重差分模型.estattrendplots.estatptrends

.estatgranger2025/4/141117.8双重差分模型与三重差分模型*7.特定时间的处理效应*清理内存,下载数据集

.clear.use/data/r17/hospdd(Artificialhospitaladmissionproceduredata).didregress(satis)(procedure),group(hospital)time(month)2025/4/141127.8双重差分模型与三重差分模型.estatgrangerplot.estatgrangerplot,nodrawverbose2025/4/141137.8双重差分模型与三重差分模型.estatgrangerplot,nodrawverbosenleads(1)nlags(0)2025/4/141147.8双重差分模型与三重差分模型.estatgrangerplot,nodrawverbosepostnlags(0)2025/4/141157.8双重差分模型与三重差分模型.test_lead3_lead2.quietlydidregress(satis)(procedure),group(hospital)time(month).estatgranger2025/4/141167.8双重差分模型与三重差分模型*8.Specifyinga2-by-2DID*清理内存,下载数据集.clear.use/data/r17/hospdd.didregress(satis)(procedure),group(hospital)time(month)*创建处理组指标.bysorthospital:egentreated=max(procedure)*创建处理后指标.generatepost=month>32025/4/141177.8双重差分模型与三重差分模型*拟合DID估计.didregress(satisi.treat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论