版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、让“跳跃”更有意义:断点回归设计 (RDD)原创 2016-09-24 张立龙 定量群学在一个高度依赖规则的世界里,有些规则的出现十分随意,这种随意性为我们提供了性质良好的实验 ( Angrist& Pischke , 2009 ) 。 断点回归设计( RegressionDiscontinuity Design )是一种仅次于随机实验的能够有效利用现实约束条件分析变量之间因果关系的实证方法。Lee ( 2008 )认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。断点回归方法首先是由美国西北大学心理学家Campbell 于 1958 年提出
2、的;并与 1960 年,与 Thistlethwaite 正式发表了第一篇关于断点回归的论文,提出断点回归是在非实验的情况下处理处置效应(Treatment Effects )的一种有效的方法,主要应用于心理学和教育学领域。 1963 年, Campbell and Stanley 为断点回归提供了更加清晰化的概念,但由于当时还缺乏严密的统计证明,加之 IV 方法在处理内生性的思路和范式上具有更广阔的适用范围,因此在随后的几十年间,RD 方法一直没有得到经济学者的重视。直到上世纪90 年代末,随着该方法的理论基础得到进一步发展,大量经济学文献才开始使用RD 方法对变量 之间的因果关系进行识别。
3、断点回归可以分为两类,一类是模糊断点回归( Fuzzy RD ) , 另一类是清晰断点回归(SharpRD)。清晰断点回归可以看作是一种基于可观察变量进行的选择( selection-on-observablesstory ),而模糊断点回归则常被视为一种工具变量的方法( instrumental-variables-type )。清晰断点回归(Sharp RD)当处理状态是协变量确定型、不连续函数时,可以使用清晰间断点回归法。对于清晰断点回归,个体在临界值的一边接受处理效应(treatment effect )的概率为0,而在临界值另一边的概率则为1 。 最早使用清晰断点回归方法的典型例子是
4、:获得国家杰出奖学金的学生是不是会更愿意读研究生(Thistlewaithe and Campbell,1960; Campbell, 1969)。清晰断点回归通过比较PSAT 分数刚好高于或低于国家杰出奖学金分数线的那些高中生的研究生入学率来回答这一问题。一般情况下,在 PAST 考试中得分越高的学生,其将来读研究生的概率也就越大。通过回归来拟合研究生院入学率和PSAT 之间的关系,可以控制这一趋势,将分数线附近PSAT 成绩和大学入学率之间的关系中出现的跳跃视为存在处理效应的证据。Imben and Limieux(2008) 认为断点回归的有效性依赖于我们对协变量的外推,或者至少在协变量
5、有不连续的那个领域内外推,因此, 条件期望函数的具体形式的设定很重要。给予具体函数形式得到的断点回归估计值的有效性依赖于多项式模型能否精确的描述条件期望函数。 如果不能,那么看上去由于个体被处理而发生的跳跃可能只不过是条件期望函数的某个点的不连续,在设定期望函数之前我们并没有预计到这种不连续。为了使得这种错误降低到最低,断点回归在实际操作中只去考察在不连续点的领域中的数据,也就是考察区间x0- ,x0+ ,其中为某个很小的正数。换言之,在x0 左侧和右侧一个足够小领域内比较Y1i和 Y0i 的平均值之间的差别,就可估计出处理效应,而这种方法与条件期望函数的具体的形式无关。断点回归估计方法可以分
6、为参数估计和非参数方法的估计。大部分利用断点回归进行的经验研究中,仍然是参数型估计。参数估计方法内涵一个思想是:赋予靠近临界值的数据点更大的权重。随着不连续样本窗口的缩小,断点回归估计值会变得不精确,但是用来模型化函数f( xi )的多项式的阶数也会下降。当以X0 为中心不断调整样本窗口大小时,控制变量会逐渐变少,但Di 的处理效应会保持稳定。非参数方法的应用越来越广泛。使用非参数方法对断点回归进行估计时,需要分别对x0 左侧和右侧领域中的Yi 的平均值做出精确估计,但这至少会遇到两个问题:如果在临界值很小的领域中进行估计,那么可用的数据就相对较少;在有界领域中对条件期望函数的估计是有偏的。针
7、对这一问题,Hahn, Todd and van der Klaauw 在 2001 年提出了使用非参数的局部线性回归,感兴趣的读者可以进一步阅读。清晰断点回归的一个经典例子是关于执政党地位对其再次当选的研究。在美国的议会政治中,执政党被再次高概率当选已经成为美国议会政治中最为引人注目的事实。Lee 在其一文中试图回答的问题是:如果民主党在上次竞选中获胜,那么是否会在本次竞选中获得优势。这项研究可能遇到的问题是:议会会员是否会利用他们的官方身份所带来的权利和资源为他而是在满们自己的党派谋取利益。也就说, 执政党的成功并不必然是反映真正的选举优势,足投票者或者换取选票方面更高明。为了寻求执政党地
8、位所带来的因果效应,Lee 将民主党候选人获胜看作是由Di=1 ( xi=0 )决定,xi 是选举胜利者在边际上的得票份额(民主党和共和党的得票之差)。Di 是 xi 的确定性函数,在xi 之外并无其他变量干扰。Lee 通过将民主党获胜的概率(Y 轴)和在上一次选举中民主党与共和党得票份额之差(X 轴)在坐标抽中绘出,发现民主党在0 点处获胜的概率大幅提高,民主党得多数票,由于这一点跳跃,执政党大约可以将再次当选的概率提高40% 。 Lee 的分析认为以往选举中的获胜率应该与上次选举中的获胜的断点没有关系,这一检验符合了Sharp RD 识别策略的假设。在给定的处理状态下,协变量应该是像在随机
9、实验中一样被处理平衡。然而需要解决的一个问题是,在选举中存在私利的人可能会控制操纵处在临界值附近的xi , 从而使得临界值两边的状况不可比,但Lee 通过计算接近x0 处的 xi 的比例来考察不连续点附近的xi 的分布密度发现,这种情况不太可能出现。作者通过清晰断点回归设计,创造出“近似实验( near-experimental )”方法,验证了执政党的选举优势。模糊断点回归(Fuzzy RD )作为一种工具变量法的模糊断点回归是在给定某个协变量的情况下,处理状态的概率和期望值所发生的不连续变化。与清晰断点回归不同的是,处理状态不再是变量Xi 的确定函数,而是一种概率函数。由于个体被处理的概率
10、会有一个跳跃,不连续性成了针对处理状态的工具变量, 不再和处理状态有确定性的联系。模糊断点回归设计提供了一个简单的工具变量估模糊断点回归方法的第一个例子是关于助学金是否是高校争夺优质生源的有效工具的研究。Van der Klaauw(2002) 的 ,文中关注的是助学金是否是高校争夺优质生源的有效工具?Van der Klaauw 使用了 Fuzz RD 设计估计了大学生资助学金对大学入学率的影响。学生的入学决策受到很多因素的影响,其中一些因素是学校管理者无法观测的。正是由于遗漏变量的存在,当我们评估助学金对入学率的影响时,助学金常常很难被看作是外生变量。为了寻求能够解决内生性问题的办法,作者
11、对决策的规则进行了深入的分析。 学校给予学生的资助金额受到很多客观和主观评价的影响,因此很难用一个简单的公式进行描述。尽管有一些评价因素在学校的数据库中能够找到,如学生的学术能力,民族、父母的收入等。但其他的一些信息如学生的学习目的、已修课程、笔记是否工整、推荐信等在数据库中则不能找到。然而,在很多学校,助学金的评判过程都是客观和公平的。例如,学校 x 通过 SAT 和 GPA 的成绩构建一个综合指数S, 通过这个构建的指数将学生分为不同的等级。依据这一指数,将学生分为四个不同等级。三个切点分别为S1 、 S2 、 S3, S3 其中最高的一个等级。不同等级的学生可以得到不同等级的助学金。尽管
12、助学金的评定并不仅仅看 S 的等级,这使得不同的等级内部的助学金也会存在差异。在给定学生的指数是决定其能否得到助学金主要变量后,因此, 学生得到的助学金是学生成绩的函数,并会在切点处出现跳跃。那些比切点处的综合指数大的得到助学金较大,而比切点处的综合指数小的得到助学金较小。由于学生得到助学金的多少是学生综合指数S 的函数且存在间断点,这其实符合了模糊断点方法的设定原则。因此, 作者利用模糊RD 的方法,通过分析助学金在学生 综合指数的切点处的变化,得出助学金是高校争夺优质生源的有效工具的结论。另外一篇相对更早的使用模糊断点回归设计进行因果效应估计是Angrist & Lavy 在 一文中完成的
13、班级规模对学生成绩影响的准实验分析。在以色列,学校的班级规模方面,存在一个“迈蒙尼德”法则,认为班级规模不能超过 40 人。如果一个年级的学生不足40 人,那么这些学生将被编入一个班级。而如果超过40 人, 如 41 人, 那么这些学生将会被分为两个班,81 名学生时将会被分为3 个班。 Angrist & Lavy 对所选的两个年级的学生的实际班级规模和用迈蒙尼德法则计算班级规模进行对比发现,迈蒙尼德法则并没有很好的预测班级规模,大部分是因为年级人数没有超过40 人,也被分为了两个班;但总体来看, 学生人数为40,80,120 处发生的班级规模的剧降。作者认为可以运用模糊RD 来进行研究设计
14、。当不存在控制变量时,班级规模和考试成绩存在强烈的正相关。当把学校中具有残障或者贫困等不利背景的学生比例作为控制变量加入回归后,班级规模和学生成绩之间的相互关系不在显著。但作者利用模糊断点回归的方法(将利用“迈蒙尼德”法则计算的班级规模作为实际班级规模的工具变量)的估计得出班级规模对考试成绩具有显著影响,这与利用 STAR 实验的相关研究得出的结论一致。参考文献:Lee, David S. (2008):“ Randomized experimentsfrom non-random selection in U.S.House elections ” , Journal of Economet
15、rics,142, 675-697.Thistlethwaiite, D., and D. Campbell (1960):“ Regression-DiscontinuityAnalysis: AnAlternative to the Ex Post Facto Experiment, ” Journal of EducationalPsychology, 51,309 317.Campbell, Donald Thomas (1969):Reforms asExperiments, AmericanPsychologist, 24, 409-429.Campbell, Donald Tho
16、mas, and Julian C. Stanley(1963):“ Experimental andQuasi-experimental Designs for Research ” . RandMcNally, Chicago.Imbens, Guido, and Thomas Lemieux (2008):“ RegressionDiscontinuity Designs: AGuide to Practice ” , Journal of Econometrics, 142,615635Hahn, Jinyong, Petra Todd, and Wilbur van derKlaau
17、w (2001):“ Identification andEstimation of Treatment Effects with aRegression-Discontinuity Design” ,Econometrica, 69, 201-209.Van der Klaauw, Wilbert (2002):“ Estimating theEffect of Financial Aid Offers onCollege Enrollment: ARegression-Discontinuity Approach” , International EconomicReview, 43.Angrist, Joshua D., and Victor La
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024广西玉林市容县冬季赴高校公开招聘教师19人补充笔试备考试题及答案解析
- 电影发行合同范本完整版3篇
- 2024年度医药研发合作合同3篇
- 2024年度大蒜购销:农产品供需协议书
- 二零二四年度玻璃幕墙工程保险合同
- 常见劳动合同范本(04版)
- 二零二四年物联网平台建设与技术合作合同3篇
- 仓库物业转让合同范本2024年度特供
- 拆迁烂尾楼施工合同范本3篇
- 二零二四年度常州仓储物流服务合同范本
- 跑团活动方案
- 2024年实验中学减负工作实施方案
- 疼痛科岗位职责说明(共8篇)
- 大学生发展生涯展示
- 上海复旦附中2024年高三最后一模英语试题含解析
- 社会主义现代化建设教育科技人才战略
- 基督徒价值观课件
- 初中物理-探索宇宙教学设计学情分析教材分析课后反思
- 抗凝药物的使用和注意事项课件
- 《大学生爱国主义》课件
- 水利工程测量的内容和任务
评论
0/150
提交评论