无条件分位数回归的统计文献研究_第1页
无条件分位数回归的统计文献研究_第2页
无条件分位数回归的统计文献研究_第3页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无条件分位数回归的统计文献研究一、引言自从Koenker和Bassett〔1978〕提出分位数回归〔quantileregression,QR〕方法以来,其已发展成为经济学实证研究的常用方法之一。最初,QR方法仅被看作是用来替代最小二乘〔OLS〕估计的一种稳健〔robust〕估计。事实上,经济学家们在如今的实证研究,十分是基于微观数据的研究中喜爱QR方法,并不在于它的稳健特性,而是能够借此方法了解解释变量对于被解释变量在扰动项的不同分位点上的异质性影响。通常,人们在评估一项经济政策对受众群体的影响时,不只希望了解政策对任一参与者的平均影响,更希望知道政策对位于特征分布不同位置〔分布末端或顶端〕人群的异质性作用。例如,教育对于人们收入的影响作用是劳动经济学中极具争议的问题之一。由于人的能力不可直接观测,且普遍被以为与个人的收入水平亲密相关,因而,工资方程的扰动项很大意义上就是用来包括不可观测的个人能力。在这种设定下,通过分位点回归,人们能够了解对于不同能力水平的个人,可观测的个体特征怎样影响他们的收入。从以上例子不难理解,Koenker和Bassett〔1978〕提出的只是条件分位数回归方法。条件分位数〔CQR〕方法的结果实际上只告诉我们对于具有一样观测特征的个人〔例如,具有某一特定年龄,家庭背景的女性〕,不可观测的能力差别对于收入的异质性影响。由于CQR的经济学意义阐释基于太多以至是不需要的个体特征,其结果与政策制订者所关心的问题很有可能并不一致。例如,人们可能只想了解教育年限对于个人收入的一般边际影响,而无论个体的年龄,性别与家庭背景怎样,这就是所谓收入关于教育水平的无条件分位数估计问题。解决这个问题的一个直觉想法是在计算中抛弃除了教育年限外的其他解释变量,直接用收入对教育年限进行分位数回归,但这种做法得到的无条件分位数不是一致估计。这一点类似于在最小二乘法中即便研究者只想了解某一解释变量对被解释变量的偏影响系数,遗漏剩余解释变量仍会导致所有系数估计的不一致性,除非遗失变量与所剩变量是正交的。无条件分位数回归〔unconditionalquantileregression,UQR〕技术恰是对于CQR技术的补充和拓展,在基于微观数据的实证研究中,十分是在劳动经济学与经济政策评估中具有特别主要的意义。在这一前沿领域,国外学者的研究也只是刚刚开始,而且有关无条件分位数回归的理论与方法正在逐步完善之中。本文旨在介绍UQR技术并梳理相关文献。十分地,我们介绍三种主要的无条件分位数回归模型:Firpo、Fortin和Lemieux〔2009〕的再中心化影响函数〔recenteredinfluencefunction,RIF〕回归,Frolich和Melly〔2010〕的无条件分位数处理效应模型与Powell〔2010〕的无条件分位数回归。有关UQR与CQR的差异不同,本文将在第二部分无条件分位数回归的最新进展中具体说明。另外,本文试图用一个研究居民收入分配格局变化对其医疗支出影响的实例说明新方法的应用。该实例将说明居民总体收入分配格局的变化怎样影响其医疗支出的分布,罢了有基于条件分位数回归技术的文献无法对这一问题做出全面的回答。运用新方法的实证结果表示清楚:在控制了疾病严重水平与城乡差别等因素后,由收入引起的居民医疗消费不平等显著存在;居民收入的按量〔byamount〕增加无法改善这种不平等,而收入的按比例〔byproportion〕增加对医疗高消费人群的拉动作用远大于对低消费人群的作用,因此进一步加剧了这种不平等性。二、无条件分位数回归的最新进展〔一〕RIF回归假设已经获得了被解释变量Y以及可能影响Y的k维解释变量X的观测值。我们关心的是X的变动对Y的影响。例如研究者时常关心下面条件分位数偏效应〔conditionalquantilepartialeffects,CQPE〕的估计值:问题1:仅当收入发生微小改变时,引起所有具备特征X=x的个体构成群体的Y分布-条件分位数的变化量①。CQPE虽然能够帮助我们回答以下问题1,但是却无法回答下面虽与问题1亲密相关,但有明显区其余另一问题:问题2:当整个人群的收入分布发生微小变化时,他们的Y分布的-分位数将产生何种变化?问题2与问题1的类似之处在于两者都是关心X的边际变动对Y分布的影响;两者的显著不同是:问题1只是针对整个人群中的某一〔具有特征X=x〕子人群而言,而问题2是针对整个人群整体而言。一般地,我们需要了解X分布的微小变化对于被解释变量Y无条件分布-分位数的影响。这等价于计算下面无条件分位数偏效应〔unconditionalquantilepartialeffects,UQPE〕:来获得UQPE的估计。为应对这一难题,Firpo,Fortin和Lemieux〔FFL,2009〕借用稳健估计〔robustestimation〕中影响函数〔influencefunction〕的基本概念,建立了估计UQPE的一般步骤。该方法的基本思想如下:利用统计学中稳健估计的若干知识,可得下面恒等式:将式〔6〕与式〔5〕右边相减,除以增量x并令x趋向于零,能够得到X的单位平移变换对Y的-无条件分位数的边际影响,即无条件分位数偏效应:最后,FFL建议从式〔7〕出发,通过下面三步获得UQPE的一致估计:来获得UQPE〔〕的一致估计。〔二〕无条件分位数处理效应处理效应模型和普通的回归框架探究变量之间的相关关系不同,它研究的是变量之间的因果关系,允许研究者在特别弱的假定下获得变量之间因果关系的精确估计,因此在微观经济政策评估中占领特别主要的地位。假设D是一个0-1处理变量。D=1表示个体承受了某种政策,D=0表示未承受这种政策。用与分别表示个体在D=1或D=0状况下的结果。平均处理效应〔averagetreatmenteffect〕E〔-〕表示的是该政策对潜在受众对象的平均作用大小。但是,政策的平均影响并不是政策制订者关心的全部内容,通常他们还关心政策对于群体在整个分布不同分位点上的异质性影响,这等价于需要估计如下的分位点处理效应〔quantiletreatmenteffect,QTE〕:FM首先留意到并非所有个体的QTE都能够被辨别出来,而只要那些能够通过变动工具Z来改变他们处理状况D的服从者〔complier〕的QTE能力被辨别出来。其中,服从者当D=1时的分布函数知足能够看出的是,要通过式〔10〕和式〔11〕的逆函数来求解式〔12〕其实特别困难。为克制这一难题使得UQTE便于计算,FM采取了再赋权〔reweighting〕分位点回归的算法,其重要思路如下。定义权重函数其中p〔X〕=E〔D=1|X〕。在以上权重下,能够证明式〔10〕和式〔11〕具有等价表示为计算在特定处的UQTE,令式〔13〕和式〔14〕的等号的左边都等于数值,即得其中〔u〕=u〔-1〔u<0〕〕。基于以上思路,实际计算可分为三步,首先获得得分倾向p〔X〕的非参数估计p〔〕,随后代入W的表达式获得W的一致估计〔三〕无条件分位数回归回首以上两类对UQR的研究,Powell〔2010〕以为,FFL的RIF回归固然具备无条件分位数回归的思想,但是它将所有解释变量都等同于控制变量,即RIF回归无法同时基于一些变量的条件分位数回归时计算另一些变量的无条件分位数回归。另一方面,FM的无条件分位数处理效应无法推广四处理变量取值为连续的一般情形。Powell〔2010〕考虑下面回归方程Y=g〔D,X,ε〕〔17〕其中Y是被解释变量,D是政策变量,X是反映个体特征的一组控制变量,ε是不可观察的扰动项。这里区分政策变量与控制变量的目的重要是为了计算Y关于D是有条件的分位数回归,同时关于X的部分分量是无条件分位数回归。这种部分无条件分位数回归在实际应用中具有极大的灵敏性,由于,人们能够根据研究目的自在地选择自己想要了解哪些解释变量对于被解释变量的异质性作用。例如,当人们想要了解教育对于工资的分位数影响时,能够令D只包括教育变量,而将其他有关个人性别、年龄、家庭背景等因素全部放入控制变量X中。此时部分无条件分位数回归结果回答的问题将完全不同于FFL的RIF回归结果回答的问题,当然也不同于一般条件分位数回归结果回答的问题。为简单起见且能够说明部分无条件分位数回归的基本想法,Powell只考虑当Y关于D的无条件分位函数是线性的情形。在这种情况下,式〔17〕能够进一步写成Y=D+U〔X,ε〕其中E〔P〔U〔X,ε〕0|D,X〕|D〕=〔18〕比较式〔18〕与CQR框架下对应的条件能够帮助我们理解UQR与CQR的主要区别。在CQR中,我们有P〔ε0|D,X〕=〔19〕将式〔19〕与式〔18〕比照,能够发现UQR实际上计算的是D对被解释变量Y在由控制变量X与真正的误差项ε一起构成的扰动项分布不同分位点上的异质性作用。需要指出的是,为了计算Y有条件的关于D同时无条件的关于X的分位数回归,直接用Y对D进行条件分位数回归的做法是有问题的。首先,一般来说X与D是相关的。即便D和X各自与ε独立,也会由于X与D的相关导致D与复合扰动项U〔X,ε〕是相关的。换句话说,即便方程自己不具有内生性问题,也会由于无条件分位数回归的定义导致计算时出现内生性问题。第二,即便X与D不相关,直接用Y对D进行条件分位数回归会导致X中包括的信息未加充足利用而使得估计量是无效的。为了克制这些问题,Powell〔2010〕将UQR框架的基本假设用下面两个矩条件进行了概括:P〔Y-D0|D,X〕=〔20〕与=〔21〕其中矩条件式〔20〕实际上只是一个排除性约束。由于一般来说,式〔20〕的右边应该同时是X与D的函数。在线性假设正确的前提下,假如D是Y有条件的关于D同时无条件的关于X的分位函数,那么Y的分位数中不能由D解释的部分,只可能是X的函数,而不会再与D相关。矩条件〔21〕是矩条件〔20〕的一个附带约束,它说明剩余部分固然可能随X变动,但是均值为,这说明当下估计的是分位点上的无条件分位函数。容易说明式〔20〕和式〔21〕是CQR的一个天然推广。与UQR相比,能够以为CQR中所有的解释变量都在D中,因而X就不再存在。于是式〔20〕的右边就变成常数,这恰是CQR对应的矩条件。结合式〔20〕与式〔21〕,以及它们与CQR的联络,能够得到估计参数的一般方法,即〔〕能够通过最小化下面目的函数得到三、实证例子〔一〕研究背景中国经济三十多年的高速增加见证了人民生活水平的日益提升与健康状态的极大改善。我们国家居民出生时的预期寿命已由1980年的67岁延长到2004年的71岁,跨越平均水平4年;婴儿死亡率则由1980年的49下降到2004年的26。与此同时,国内居民的收入差距也在迅速扩大。据国家统计局的数据显示,自2000年开始,我们国家基尼系数已越过0.4的警戒线,并逐年上升。世界银行估算,2009年中国的基尼系数已攀升至0.47,国内居民收入最高与最低各10%家庭之间的收入差距,已从21倍扩大到55倍。不断扩大的收入差距已成为我们国家经济发展中的一个突出问题,对社会与人民生活的各方面都产生了主要影响。面对同时出现的收入差距扩大与居民健康医疗需求的增加,正确理解收入与健康之间的内在联络,十分是如今收入不均现在状况下居民医疗卫生需求行为的基本特征正成为公共卫生政策制订者与经济学家关心的问题。早期Grossman〔1972〕等人的人力资本模型表示清楚,收入提升有助于改善人们的健康状态。此后国外大量基于微观数据的经历体验证据显示,健康不仅与收入的绝对水平正相关,也与收入的分布特征,即收入不平等的水平有关。Kennedy等人〔1998〕、LeClere等人〔2000〕的研究表示清楚:美国,人们的收入差距和健康水平之间有很强的负相关性。关于收入不平等影响健康的机制,Wilkinson〔1996,2004〕以为,收入差距通过增长低收入人群的挫败感以及压力,使其染上吸烟、酗酒、吸毒等不良的行为习惯或焦虑、抑郁等心理疾病,进而恶化其健康水平。在这一方面,国内学者也做了大量的实证研究。LiZhu〔2006〕使用中国的微观调查数据研究发现,社区的收入不平等水平会显著影响居民自我报告的健康状态,而且这种影响呈现倒U型;同时收入不平等也对居民的健康行为〔如吸烟、饮酒〕有影响。封进等人〔2007〕使用同样的数据,得到了类似的结论。收入不平等影响健康的另一可能途径是收入差距导致的医疗卫生效劳利用的不平等性。医疗卫生体系中的平等是指这样一种状况:同等需要应得到同等保健〔equalneedoughttobetreatedequally〕,即医疗需求不与个体的收入、地域、种族有关而只与其年龄、本身健康状态等变量相关。当医疗效劳利用遭到了收入等非必须类变量的影响,即以为医疗效劳不平等是存在的。张晓波〔2003〕使用不同来源的数据考察了中国的医疗系统中存在的各种不平等现象,并对不平等的成因进行了分析。魏众等人〔2005〕考察了家庭收入和家庭医疗支出的经历体验联络。文章从城乡医疗资源配置的合理性质疑我们国家医疗卫生体制的公平性,并建议国家应该采用办法引导医疗补助流向农村地区,十分是西部地区。齐良书〔2006〕强调了收入分布不均等性以及居民社会经济地位特征的差别对于其健康与医疗支出水平的主要影响;近期,解垩〔2009〕利用中国家庭健康营养调查CHNS数据计算了收入因素对健康不平等、医疗效劳利用不平等的奉献,指出我们国家存在亲富人,亲高收入人群的健康不平等与医疗效劳利用不平等。同样基于CHNS数据,林相森等人〔2009〕通过估计Tobit模型,得到了类似的经历体验证据。以上文献在不同水平上丰富了有关健康公平的研究,在讨论时均强调收入不平等对健康与医疗效劳利用不平等的奉献作用。另一方面,随着整体收入差距的不断上升,中国的收入分配格局实际上处于一个不断变化的经过中。从制订政策的角度,我们更关心这样的问题:居民总体收入分配格局的改变将对当前医疗效劳利用平等性的变化趋势产生何种影响?由于医疗费用直接度量了医疗资源的利用,因而,本文将直接研究居民总体收入分配格局的变化对其医疗支出分布的影响。从计量分析的角度来讲,这是一个研究解释变量分布的变化对于被解释变量分布边际影响的问题。能够说明的是,常见的均值回归或CQR技术,均无法对这一问题作出完好的回答。为此,本文借助于近来发展起来的UQR技术,基于中国家庭健康营养调查CHNS2006数据,重点考察了居民整体收入分布的两种边际变动,即按量变动,对应于收入分布的平移变换〔locationshift〕与按比例变动,对应于收入分布的标准变换〔scaleshift〕,对于人群医疗消费分布的影响。〔二〕数据本文使用的数据来自中国健康和营养调查〔CHNS〕数据集。该调查始于1989年,覆盖了国内9个省〔辽宁、黑龙江、山东、江苏、河南、湖北、湖南、广西、贵州〕的城镇和农村。相比于其他年份的数据,2006年的调盘问卷调整了与医疗支出相关的部分问题,进而使得调查数据的质量有很大提升。因而,本文将采取2006年数据进行研究。我们选取2006年调查中的患病成年人作为研究样本,他们在调查之前的4周内均出现过不同水平的疾病症状。这样的样本包含2015个成年人,占所有9788个成年人中的20.6%。考虑到收入这一变量在本文研究中的主要地位,我们留意到这2015个成年人中有相当一部分,十分是农村老年人的收入记录大多为零。虽然这些年老体弱者的收入特别微薄以至为零,但他们医疗需求却是极其强烈的。此时,无论是将这些人的收入变量不加处理直接作为零放入模型进行估计或简单地将他们从样本中删除都是不恰当的。一个适宜的做法是:考虑到低收入老年人的医疗支出通常是由家庭中有经济能力的其他成员,例如后代承当,因而本文用家庭人均收入代替个人的收入。同时CHNS数据内容确实包括个人附属家庭编号的信息,因而这种做法在技术上也是可行的〔同时对CHNS数据采取这种做法的文献有解垩〔2009〕〕。本文把各个家庭成员的工资、奖金、补助以及农业收入按家庭求和,再除以家庭人口得出人均收入。在这些处理之后,仍然有一些个人的家庭人均收入结果为零③。随后我们又把这些家庭人均收入为零的个体从样本中剔除,最后的样本包括1365个成年人,年龄分布在21岁至80岁之间。〔三〕计量方法在运用UQR方法分析收入分布变动对居民医疗需求分布的影响时,我们发现实际研究经过出现的几个问题需要我们对已有的理论方法进行一定的拓展。需要指出的是,下面拓展不只适用于本文研究的问题,对其他应用该方法的实证研究也同样适用。能够得到分量的单位标准变换对Y的-无条件分位数的边际影响,即仅第1个分量标准变换下的无条件分位数偏效应计算公式:〔四〕变量定义本文采取个人医疗支出〔hcexp〕作为被解释变量,把各个家庭成员的工资、奖金、补助以及农业收入按家庭求和,再除以家庭人口得出人均收入作为个人收入〔inc〕,其他的控制变量还有:〔1〕疾病严重水平〔分为1-3等,数字越大疾病严重水平越高〕;〔2〕户籍〔城镇户口用1表示,农村户口用0表示〕;〔3〕性别〔男性用1表示,女性用0表示〕;〔4〕能否加入了医疗保险〔加入了用1表示,没有加入用0表示〕;〔5〕年龄〔21岁至80岁〕;〔6〕教育水平〔分为1-5等,数字从小到大分别表示:小学或其下面学历,初中或其下面学历,高中、职校或其下面学历,大学本科或其下面学历,研究生或其下面学历〕。以上各变量的描绘叙述性统计量见表1。除此以外,为了对本文重要关心的医疗支出与收入变量的分布特征有一个粗略地了解,我们还能够用核密度估计的方法绘制它们的密度函数图〔图略〕。〔五〕实证结果为了与下面的无条件分位数回归结果作比照,我们首先用条件分位点回归方法估计如下的Tobit模型:算法估计模型〔25〕中的系数。在实际计算中,我们采取R软件中的quantreg程序包对模型进行估计,并将其他系数的分位点估值及其t统计量总结在表2〔见下页〕。从表2能够看出除收入以外的其他因素对个人医疗支出的影响。例如,疾病严重水平对医疗支出的奉献随分位点的上升而不断提升,这表示清楚严重的疾病是引发医疗消费高的主要原因之一,超常的巨额医疗支出更有可能是由于疾病严重水平自己而导致的。同样,户籍属性对个人医疗支出的差别性也有显著奉献;医疗支出水平越高,城镇户口相对于农村户口在获得医疗效劳方面的优势越突出。但是,并非所有的因素对医疗支出的影响都呈现这种单向的走势:性别对个人医疗支出的奉献虽然存在,但是随分位点的变化波动不太剧烈,显得比较平稳。总的来说,收入对于医疗支出的影响仍然呈现单调上升的变化趋势:医疗支出的水平越高,收入对医疗支出差别的奉献也越大。这表示清楚收入差距导致的医疗效劳利用不平等显著存在。这也是诸多检验医疗效劳平等性文献所得到的共鸣。根据前述关于CQR与UQR方法在经济学问题阐释方面的区别,以上结果无法告诉我们当整个人群的特征分布,例如收入分布产生变化时,对医疗支出分布的边际影响。这使得我们转

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论