社会经济研究中的选择性样本问题_第1页
社会经济研究中的选择性样本问题_第2页
社会经济研究中的选择性样本问题_第3页
社会经济研究中的选择性样本问题_第4页
社会经济研究中的选择性样本问题_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、社会经济研究中的选择性样本问题探索0.回顾:如何识别社会经济问题中的因果效应?0.1一个现实的例子:去医院能够让人更健康吗?组别样本大小平均健康水平标准差去过医院77743.210.014没去过医院900493.930.003数据来源:2005年NHIS(National Health Interview Survey) =0.72,t=58.9 去医院会使人的健康状况变差? 接受医疗是一个二值变量Di=0,1,考虑Di对健康水平的影响,我们想象去了医院的人如果没有去医院、没有去医院的人如果去了医院将会发生什么?潜在结果= (1)故Yi的潜在结果可用线性组合表示 (2) 可见,就是个体去医院对

2、其健康状况的影响。 (3)0.2捕获因果效应的工具回归分析工具观察(2)式,通常用回归分析识别因果效应: (4)是Y0i的随机部分,根据处理状态(Di取值),取期望值得到: (5)于是: (6)选择性偏误意味着回归误差项与回归元Di之间相关。1.什么是选择性问题(Selection Problem)1.1 Effect of Education on Womens Wages(Sartori,2003) (7):妇女工资水平:妇女教育水平Problem:谁进入我们的样本?在工作的妇女。而不是那些未找到工作的妇女。而这些工作的妇女是不是还存在重要的没有被度量的变量,而这些变量恰恰与未找到工作的妇

3、女存在显著差别。比如说:工作的妇女更加聪明?或者更加勤奋?或者情商更高?等等。选择方程(selection equation): (8)效用函数:有可能影响妇女进入劳动力市场的因素向量。:未被度量的因素,假定服从随机正态分布,同是不可观察的,假如妇女根据这一效用函数做决策,进入劳动力市场或者不进入劳动力市场,我们给一个二元随机变量: (9)选择性偏差(selection bias)来源:(1)教育程度高的妇女更容易找到工作?不会引起方程(1)的偏差。(2)教育程度低的一部分妇女更愿意进入劳动力市场,因为她们觉得就业更“划算”。这时候获得较好收入并不是因为她们受教育程度更高,而是由于一些“没有被

4、度量的因素”。此时这些因素的存在使得方程的残差项变得更大。1.2.Effect of GRE Scores on Graduate in Graduates school (10) (11)结果方程: (12)1.3.忽略变量偏差(Omitted Variable Bias)选择方程中的解释变量和结果方程中的解释变量不相关时,不存在选择性样本问题。Is this true in case2?影响选择方程的“所有”变量都被包含在结果方程中。Is this True?Case1 and Case2,选择方程的误差项和结果方程的误差项存在相关性时,结果方程的误差项不满足均值为0,且与解释变量相关。1

5、.4选择性样本问题的本质与类型非随机样本自选择性。数据缺失数据截断(Truncation Data)或.归并数据(Censored DATA);状态缺失。数据搜集过程中基于因变量的截断:归并数据(Censored DATA)将解释变量在某个区间的样本观察值转化为一个值。内生性残差项与解释变量相关。选择型样本数据例如:研究家庭收入、家庭支出、家庭用于子女教育的支出。1.5判断选择性样本问题经验规则(2012李子奈)第一、对于样本时微观截面个体数据,需要考虑选择性样本问题。对于样本是时间序列的数据,我们不需要考虑。第二、如果样本包含截面的全部个体,则不考虑数据截断问题。样本是按照标准的抽样理论取得

6、的则不需要考虑截断数据问题。如果不是,则需考虑数据截断问题。第三、归并问题根据样本观察值的经济背景。2.模型的处理Heckman Model2.1.Heckman Model2.1 Basic SetupSelection equation (13)Outcome equation: (14) (15)2.2Conditional Mean in the Heckman Model (16)相互独立,此时: (17)Conditional Mean in Heckman Model (18)2.3Marginal Effects (19)2.4EstimationHeckmans Two-St

7、ep Procedure第一步,根据选择方程(probit model)运用MLE得到估计值,计算IMR,和。第二步,根据存在时的y值估计和(OLS)MLE Version(Wooldridge 2002,Berinsky 2004, )软件:STATA,EVIEWs估计标准误,heteroskedsiticity,robust standard error. 3.其它处理方法3.1截断数据(Incidental Truncation in a Bivariate Distrbution)THEOREM 1: Density of a Truncated Random VariableIf a

8、 continuous random variable x has pdf f(x) and a is a constant,then (20)Truncated Normal Distribution,Then: (21)Where ,is the normal distribution cdf. The density of the truncated distribution is then (22)Another Discrete Variable is Poisson Distrbution,then: (23)3.2MOMENTS OF TRUNCATED DISTRIBUTION

9、 (24)THEROEM 2 MOMENTS OF TRUNCATED MORMAL DISTRBUTIONIf and a is a constant, then : (25)Where ,is the normal distribution cdf. (26)And (27)2.3THE TRUNCTED REGRESSION MODELTRADITIONAL MODEL: (28) (29) (30)TRUNCATION MODEL: (31)So that: (32) (33)THE VARIANCE OF Y (34)*3.3Selection bias in Binary Choice ModelBivriate Probit(j=1,2)If,两个方程可独立估计,但是:3.3 政策效应评估DID法4.参考文献1.William H.Greene.Econometric Analysis(7ed).837:9392.Heckman(1976,1997,2000,2003) 3.陈美娇.样本选择问题的统计处理D.20135.小论文要求通过阅读文献,选择一种选择性样本问题的研究方法,研究文献中具体在处理某个社会经

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论