倾向值匹配法(PSM)[沐风书苑]_第1页
倾向值匹配法(PSM)[沐风书苑]_第2页
倾向值匹配法(PSM)[沐风书苑]_第3页
倾向值匹配法(PSM)[沐风书苑]_第4页
倾向值匹配法(PSM)[沐风书苑]_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、倾向值匹配法(PSM) 1知识材料 Q:为什么要使用PSM? nA:解决样本选择偏误带来的内生性问题 n例:上北大有助于提高收入吗? n样本选择偏误:考上北大的孩子本身就 很出色(聪明、有毅力、能力强) n解决方法:样本配对 2知识材料 配对方法 n同行业(一维配对) n同行业、规模相当(二维配对) n同行业、规模相当、股权结构相 当、(多维配对)? nPSM:把多个维度的信息浓缩成一个 (降维:多维到一维) 3知识材料 配对过程中的两个核心问题(1) nQ1:哪个样本更好一些? A1:Sample2较好:比较容易满足共 同支撑假设(common support assumption) 4知识

2、材料 配对过程中的两个核心问题(2) nQ2:stu c1,c2,c3三人中,谁是stu PK的 最佳配对对象? nA2:stu c3是最佳配对对象,比较容易 满足平行假设(balancing assumption) 5知识材料 ATT(Average Treatment Effect on the Treated) 平均处理效应的衡量 n运用得分进行样本匹配并比较,估计出 ATT值。 nATT=EY(1)-Y(0) |T=1 Y(1):Stu PK 上北大后的年薪 Y(0): Stu PK 假如不上北大的年薪 可观测数据可观测数据 不可观测数据,不可观测数据, 采用配对者的采用配对者的 收入

3、来代替收入来代替 ATT=12W-9W=3W 6知识材料 实例介绍 7知识材料 实例介绍 n研究问题:培训对工资的效应 n基本思想:分析接受培训行为与不接受 培训行为在工资表现上的差异。但是, 现实可以观测到的可以观测到的是处理组接受培训的 事实,而如果处理组没有接受培训会怎 么样是不可观测的不可观测的,这种状态称为反事 实。匹配法就是为了解决这种不可观测 的事实的方法。 8知识材料 实例介绍 n分组:在倾向值匹配法中,根据处理指示变量 将样本分为两个组。处理组处理组,在本例中就是在 NSW(国家支持工作示范项目)实施后接受培 训的组;控制组控制组,在本例中就是在NSW实施后 不接受培训的组。

4、 n研究目的:通过对处理组和对照组的匹配,在 其他条件完全相同的情况下,通过接受培训的 组(处理组)与不接受培训的组(控制组)在 工资表现上的差异来判断接受培训的行为与工 资之间的因果关系。 9知识材料 变量定义 变量变量定义定义 treat接受培训(处理组)表示接受培训(处理组)表示1,没有接受培训(控制组)表示,没有接受培训(控制组)表示0 age年龄年龄 educ受教育年数受教育年数 black种族虚拟变量,黑人时,种族虚拟变量,黑人时,black=1 hsip民族虚拟变量,西班牙人时,民族虚拟变量,西班牙人时,hsip=1 marr婚姻状况虚拟变量,已婚,婚姻状况虚拟变量,已婚,mar

5、r=1 re741974年实际工资年实际工资 re751975年实际工资年实际工资 10知识材料 变量定义 re781978年实际工资年实际工资 u74当在当在1974年失业,年失业,u74=1 agesqage*age educsqeduc*educ re74sqre74*re74 re75sqre75*re75 u74blcaku74*blcak 11知识材料 倾向打分 12知识材料 OLS回归结果 工资的变化到底是来自个体的异质性工资的变化到底是来自个体的异质性 性还是培训?性还是培训? 13知识材料 倾向打分 n1.设定宏变量 (1)设定宏变量breps表示重复抽样200次 命令:gl

6、obal breps 200 (2)设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 14知识材料 倾向打分 n2.通过logit模型进行倾向打分 命令:pscore treat $x,pscore(mypscore) blockid(myblock) comsup numblo(5) level(0.05)

7、logit 注:$表示引用宏变量 15知识材料 pscore结果 16知识材料 倾向值分布 17知识材料 倾向值分布 18知识材料 block中样本的分布 19知识材料 block中的描述性统计 20知识材料 运用得分进行样本匹配并比较 21知识材料 方法一:最邻近方法方法一:最邻近方法 (nearest neighbor matching) n含义:最邻近匹配法是最常用的一种匹配方法, 它把控制组中找到的与处理组个体倾向得分差 异最小的个体,作为自己的比较对象 。 n优点:按处理个体找控制个体,所有处理个体 都会配对成功,处理组的信息得以充分使用。 n缺点:由于不舍弃任何一个处理组,很可能有

8、 些配对组的倾向得分差距很大,也将其配对, 导致配对质量不高,而处理效应ATT的结果中 也会包含这一差距,使得ATT精确度下降。 22知识材料 方法一:最邻近方法方法一:最邻近方法 (nearest neighbor matching) n命令 nset seed 10101(产生随机数种子) nattnd re78 treat $x,comsup boot reps($breps) dots logit 23知识材料 方法一:最邻近方法方法一:最邻近方法 (nearest neighbor matching) 24知识材料 方法二:半径匹配法方法二:半径匹配法 (radius matchin

9、g) n半径匹配法是事先设定半径,找到所有 设定半径范围内的单位圆中的控制样本, 半径取值为正。随着半径的降低,匹配 的要求越来越严。 25知识材料 方法二:半径匹配法方法二:半径匹配法 (radius matching) n命令 n set seed 10101 n attr re78 treat $x,comsup boot reps($breps) dots logit radius(0.001) 26知识材料 方法二:半径匹配法方法二:半径匹配法 (radius matching) 27知识材料 方法三:分层匹配法方法三:分层匹配法 (stratification matching)

10、n内容:分层匹配法是根据估计的倾向得分将全 部样本分块,使得每块的平均倾向得分在处理 组和控制组中相等。 n优点:Cochrane ,Chambers(1965)指出五 个区就可以消除95%的与协变量相关的偏差。 这个方法考虑到了样本的分层问题或聚类问题。 就是假定:每一层内的个体样本具有相关性, 而各层之间的样本不具有相关性。 n缺点:如果在每个区内找不到对照个体,那么 这类个体的信息,会丢弃不用。总体配对的数 量减少。 28知识材料 方法三:分层匹配法方法三:分层匹配法 (stratification matching) n命令 nset seed 10101 natts re78 tre

11、at,pscore(mypscore) blockid(myblock) comsup boot reps($breps) dots 29知识材料 方法三:分层匹配法方法三:分层匹配法 (stratification matching) 30知识材料 方法四:核匹配法方法四:核匹配法 (kernel matching) n核匹配是构造一个虚拟对象来匹配处理 组,构造的原则是对现有的控制变量做 权重平均,权重的取值与处理组、控制 组PS值差距呈反向相关关系。 31知识材料 方法四:核匹配法方法四:核匹配法 (kernel matching) n命令 nset seed 10101 nattk r

12、e78 treat $x,comsup boot reps($breps) dots logit 32知识材料 方法四:核匹配法方法四:核匹配法 (kernel matching) 33知识材料 psmatch2 34知识材料 匹配变量的筛选 n1.设定宏变量 设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black

13、35知识材料 匹配变量的筛选 n2.初步设定 nlogit treat $x 36知识材料 匹配变量的筛选 n3.逐步回归 nstepwise,pr(0.1):logit treat $x 37知识材料 ps值的计算 npsmatch2 treat $x,out(re78) n倾向得分的含义是,在给定X的情况下, 样本处理的概率值。利用logit模型估计 样本处理的概率值。概率表示如下: nP(x)=PrD=1|X=ED|X 38知识材料 匹配处理组 n最近邻匹配 n命令:psmatch2 treat $x(if soe=1),out(re78) neighbor(2) ate n半径匹配 n

14、命令:psmatch2 treat $x,out(re78) ate radius caliper(0.01) n核匹配 n命令:psmatch2 treat $x,out(re78) ate kernel 39知识材料 匹配处理组 n满足两个假设:A共同支撑假设B平行假 设 40知识材料 ATT(平均处理效应的衡量) 以半径匹配为例:psmatch2 treat $x,out(re78) ate radius caliper(0.01) 1 2 3 1、处理组平均效应(、处理组平均效应(ATT) 2、控制组平均效应(、控制组平均效应(ATU) 3、总体平均效应(、总体平均效应(ATE) 41

15、知识材料 ATT(平均处理效应的衡量) n匹配前后变量的差异对比 n命令:pstest re78 $x(pstest re78 $x,both graph) 42知识材料 匹配前后密度函数图 twoway (kdensity _ps if _treat=1, legend(label(1 Treat) (kdensity _ps if (_wei!=1&_wei!=.), legend(label(2 Control), xtitle(Pscore) title(After Matching) twoway (kdensity _ps if _treat=1, legend(label(1 T

16、reat) (kdensity _ps if _treat=0, legend(label(2 Control),xtitle(Pscore) title(Before Matching)43知识材料 运用bootstrap获得ATT标准误 n命令:bootstrap,reps(#):psmatch2 treat $x,out( re78) n在统计分析中,样本较少,采用bootstrap,可 以减少小样本偏误。 n步骤:首先,从原始样本中可重复地随机抽取 n个观察值,得到经验样本;然后采用PSM计 算改经验样本的平均处理效果ATT;将第一步 和第二步重复进行#次,得出#个ATT值;计算 #个

17、ATT值的标准差。 44知识材料 核匹配的Bootstrap检验 45知识材料 爱是什么? 一个精灵坐在碧绿的枝叶间沉思。 风儿若有若无。 一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。 精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?” “爱。” “为什么?” “它驱赶我的饥饿。” 鸟儿啄完稻谷,轻轻梳理着光润的羽毛。 “现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。 鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。” 精灵摘下一片树叶,里面盛了一汪泉水。 鸟儿喝完泉水,准备振翅飞去。 “请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。 “你要去做什么更重要的事吗?我

18、这里又稻谷也有泉水。” “我要去那片开着风信子的山谷,去看那朵风信子。” “为什么?它能驱赶你的饥饿?” “不能。” “它能滋润你的干渴?” “不能。”爱是什么? 一个精灵坐在碧绿的枝叶间沉思。 风儿若有若无。 一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。 精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?” “爱。” “为什么?” “它驱赶我的饥饿。” 鸟儿啄完稻谷,轻轻梳理着光润的羽毛。 “现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。 鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。” 精灵摘下一片树叶,里面盛了一汪泉水。 鸟儿喝完泉水,准备振翅飞去。 “请再回答我

19、一个问题,”精灵伸出指尖,鸟儿停在上面。 “你要去做什么更重要的事吗?我这里又稻谷也有泉水。” “我要去那片开着风信子的山谷,去看那朵风信子。” “为什么?它能驱赶你的饥饿?” “不能。” “它能滋润你的干渴?” “不能。” 46知识材料 其实,世上最温暖的语言,“ 不是我爱你,而是在一起。” 所以懂得才是最美的相遇!只有彼此以诚相待,彼此尊重, 相互包容,相互懂得,才能走的更远。 相遇是缘,相守是爱。缘是多么的妙不可言,而懂得又是多么的难能可贵。否则就会错过一时,错过一世! 择一人深爱,陪一人到老。一路相扶相持,一路心手相牵,一路笑对风雨。在平凡的世界,不求爱的轰轰烈烈;不求誓 言多么美丽;唯愿简单的相处,真心地付出,平淡地相守,才不负最美的人生;不负善良的自己。 人海茫茫,不求人人都能刻骨铭心,但求对人对己问心无愧,无怨无悔足矣。大千世界,与万千人中遇见,只是相识的 开始,只有彼此真

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论