分位数回归模型及其应用研究_第1页
分位数回归模型及其应用研究_第2页
分位数回归模型及其应用研究_第3页
分位数回归模型及其应用研究_第4页
分位数回归模型及其应用研究_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2008年中国数量经济学会年会论文0 第一组计量经济学理论与方法分位数回归模型及其应用研究王桂胜1(首都经济贸易大学,北京,100026)摘要:本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANELDATA模型中的应用作了深入分析,并对不同回归估计方法在PANELDATA模型中的估计效果进行了比较分析。在此基础上,通过分别采取一般最小平方法和分位数回归法对中国15省区的人均消费和人均收入的回归方程估计的统计结果比较,发现分位数回归方法在进行某些特殊的PANELDATA模型估计时具有一定的优势。关键词:分位数回归、面板数据模型、惩罚分位数回归估计一、分位数回

2、归研究介绍自Koenker和Bassett(1978)提出线性分位数回归理论以来,分位数回归(QR)即成为近几十年来发展较快、应用广泛的回归模型方法,它不仅深化了对传统回归模型的理解,而且也推广了回归模型的类型和应用,使得回归模型拟合有关统计数据更加准确细致。分位数回归模型是在稳健估计模型基础上发展形成。稳健估计(RobustEstimation)理论包括基于一般凸损失函数的M估计理论、基于样本秩统计量的R估计理论和基于样本次序统计量的L估计理论等。分位数回归强调以解释变量的分位数来估计推断因变量的分位数,通过建立分位数估计方程,并运用线性规划方法或非参数估计等方法来估计相应于不同分位数的解释

3、变量系数或未知参数。分位数回归是中位数回归和均值回归的推广。分位数回归模型具体又分为四分位数回归、十分位数回归、百分位数回归、LOGIT分位数回归、审查分位数回归等模型。关于分位数回归研究的最近发展,主要表现在分位数回归技术方法和方法应用等两方面的研究上。具体包括Koenker和ZhjieXiao(2000)解决分位数回归过程中存在的特定推断问题;Kim和Muller(2000)关于双步分位数回归的渐进特性的研究;Tasche(2001)对最小分位数回归的无偏性研究;Chernozhukov和HanHong(2002)提出对审查分位数回归的三步评估法;吴建南、Bret-schneider等(2

4、002)用蒙特卡罗(MonteCarlo)方法产生100个随机数据集合来比较显著权重分析方法与分位数回归的优劣;Kottas和Krnjajic提出分位数回归中的贝叶斯非参数模型;Koenker(2004)将分位数回归方法运用于PANELDATA模型估计中,并提出了PQR估计技术及相关理论证明,在此基础上CARLOSLAMARCHE(2006)对PQR估计方法进一步深入探讨并结合实际数据进行实证分析等等。此外是对分位数回归方法的应用研究。在这一方面,Barnes和W.Hughes(2002)利用分位数回归对跨部门公债市场的回收进行了分析;Buhai(2004)在1王桂胜:男,1970年生,首都经

5、济贸易大学劳动经济学院副教授,清华大学经管学院博士生。分析介绍了分位数回归方法的基础上,研究了它在持续时期模型和循环结构等式模型中的应用;Leggett和Craighead利用分位数回归确定了时间分布和特定风险驱动的影响。国内也有很多学者将分位数回归估计方法运用于医学卫生事业研究、公共管理事业等具有极值分布特点的统计数据研究中。具体如教育收益率估计分析、劳工歧视因素分析等等。本文将在系统介绍分位数回归模型的含义和基本原理的基础上,重点分析将分位数回归方法与PANELDATA模型结合分析的主要形式和估计原理以及相关结果。第二节讨论分位数回归方法的一般原理以及PQR估计原理,在此基础上提出关于PA

6、NELDATA的分位数回归模型的PQR估计方法;第三节分析分位数回归方法在PANELDATA模型中的应用以及数据模拟;第四节对本文的分析结果进行总结。二、分位数回归模型原理(一)分位数回归的基本原理一般线性回归模型可设定如下:y二a+ax+axHFax+u,u为随机扰动项.01122kk在满足高斯-马尔可夫假设前提下,可表示如下E(y|x)=a+ax+axFFax01122kk其中,a,a,,a为待估解释变量系数。01k上述模型即均值回归模型表达式,是对等式两边取数学期望的结果。类似于(y|x)FM(u)均值回归模型,也可设定中位数回归模型如下:=a+ax+axFFax01122kk其中,M(

7、y|x)为关于x的条件中位数,M(u)为随机扰动项的中位数。以及分(c位数回归模型如下:FQ(c)u|x)=a+ax+axFFax01122kk对于均值回归模型,可采取最小平方法(OLS)估计未知参数;对于中位数回归模型,可采取最小一乘法(或称最小绝对偏差法LAD);而对于分位数回归模型,则可采取线性规划法(LP)估计其最小加权绝对偏差,从而得到解释变量的回归系数。分别可表示如下:OLS法:minE(y-aoaxkk求解得:(y|x)LAD法:minE|y一axkk求解得:M(yx丿=a+ax+axFFax01122kkQR法:minEp(y一a一ax一ax一T01122axkk求解得:=a+

8、ax+axhfax01122kk其中,p(t)=t(X-1(t0),te(0,1).。T(二)PANELDATA模型与分位数回归方法考虑一般PANELDATA模型,表达式如下:y=x卩+a+u,i二1,2,N.t二1,2,,T.ititiit其中,i代表不同的样本个体,t代表不同的样本观察时点,u表示随机误差项,P表示解释变量的系数向量,ai表示第i个样本的不可观察随机效应。xit=G,x,x,,xit1it2itp关于0的估计有两种情形,即固定效应情形和随机效应情形,相应的有两种估计方法。将上述PANELDATA模型写成如下矩阵形式:yXJ3+Za+u固定效应情形下,0的估计量为min|y-

9、XP-Za|2a,卩0(XMX)-1XMy,MIP,PZ(ZZ丄1Z随机效应情形下,0的估计量为假设uN(0,R),aN(0,W),v=Za+u。则有E(vV)=(ZWZ+R)=V。可以对此情形PANELDATA模型采取GLS估计法、也可采取反映个体影响的惩罚最小二乘法(PLS)估计回归系数0,分别表述如下:GLS法:miniyX0II20V-1PLS法:min|yX0|2+|a|2a,0R1W1二者的共同解为:0=(XV-1XLXV-1yox,a)x0(T)+aitiitji对于上述PANELDATA模型也可采取分位数回归法进行参数估计。为此。建立以下条件分位数方程:QCyitj上述分位数方

10、程假设个体效应是固定的。对此方程,KOENKER(2004)提出了惩罚分位数回归(PQR)方法进行估计。具体如下:,九),a(九)卜/argmina)+九Qa|jj-1口a,0j=1t=1i=1jTjji=12008年中国数量经济学会年会论文2008年中国数量经济学会年会论文 其中,w为相应于各分位数的权数,入为调节系数。如果A=0,则为固定效应分位数回归估计量(FEQR);如果入0,则为惩罚分位数回归估计量(PQR)。此外,KOENKER还对分位数回归和惩罚分位数回归估计量的渐进特性进行了详细的考察。在此基础上,运用蒙特卡罗模拟法在小样本设定下比较分析了不同回归估计方法的效果,如下表所示:表

11、1最小平方法与分位数回归法的估计效果比较误差项分布LSPLSLSFEQRPQRQRFE正态分布偏差0.00310.00480.00560.00480.00670.0047均方误差平方根0.08470.06040.06680.09770.07810.0815T分布偏差-0.0062-0.0054-0.0051-0.0063-0.0101-0.0082均方误差平方根0.13770.10310.11430.12740.08810.0921卡方分布偏差-0.00680.00020.0032-0.00520.00630.0072均方误差平方根0.21550.15030.16500.23620.15060

12、.1513由上表可见,对于某些非正态分布,分位数回归估计效果相对较好一些(如表1中的T分布)。三、分位数回归方法的应用分位数回归方法对于具有某些非高斯分布的随机误差项和随机效应的回归方程的系数估计具有较好的效果,这已在理论上得到了论证。本文将运用实际经济数据对比最小平方法与分位数回归方法在PANELDATA模型中的估计效果。所用数据来自中国1996-2002年东北、华北和华东15个省、市、自治区的居民人均消费(CP,不变价格)和人均收入(IP,不变价格)2。建立关于人均消费与人均收入关系的PANELDATA模型,分别采取最小平方法和分位数回归法进行估计,由于样本资料原因,本文仅考虑合并数据下和

13、固定效应下的两种估计方法的估计结果,并进行比较分析。1、合并数据下最小平方法估计运用EVIEWS软件对样本数据进行处理,结果如下:CP=129.63+0.76IPitit其中,判定系数为0.98,常数项T统计量值为2.0,回归系数T统计量值为79.7。2、固定效应下最小平方法估计对15个省区设计15个虚拟变量D1,D2,D15。其定义为:D=J1,当属于第i个个体,i=1,2,.,15.i=0,其他运用EVIEWS软件,对样本数据进行处理,得到如下结果:2注:本数据资料来自张晓峒著EVIEWS使用指南与案例机械工业出版社,2007年,第261页。CP=479.3+1053.D+714.2D+0

14、.70IPit215it其中,判定系数为0.99,常数项T统计量值为1.6,回归系数T统计量值为55。3、合并数据下分位数回归法估计将15个省区的数据当作一个个体的数据进行分位数回归估计,运用STATA软件运行后,得到如下结果:表2各分位数下合并数据分位数回归估计结果分位数IP常数项判定系数(R2)系数T统计量系数T统计量0.20.724648.63187.25272.730.84440.50.742258.85205.25913.090.87430.750.779229.60139.57041.140.89300.80.798931.3275.44620.620.89684、固定效应下分位数

15、回归法估计与2中固定效应回归一样,可设计15个虚拟变量DI,D2,,D15,并运用STATA软件进行分析可得如下结果:表3各分位数下固定效应分位数回归估计结果分位数IP常数项判定系数(R2)系数T统计量系数T统计量0.20.679936.28490.54115.560.90960.50.671519.91597.55093.270.92120.750.732825.23351.14422.220.93290.80.740824.76309.19151.900.9359比较分析上述两种回归方法的统计结果,发现在固定效应情形下两种方法回归效果均比合并数据情形下更好;在同一情形下做回归分析,显然分位

16、数回归分析结果更加稳定,各系数估计显著程度更高。因而,分位数回归估计在PANELDATA模型中可以发挥重要作用。四、结论本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANELDATA模型中的应用作了深入分析,并对不同回归估计方法在PANELDATA模型中的估计效果进行了比较分析。一般而言,分位数估计方法在估计具有非正态分布的误差项或不可观察的随机效应时具有一定优势。本文在理论分析之后,提供了一个应用案例分析,通过对我国人均收入和人均消费的各种回归分析,充分证明了分位数回归的较好效果。当然,由于样本数据的不足,缺乏对在随机效应情形下两种回归方法估计的效果比较

17、,以及在不同调节系数下对惩罚分位数回归估计效果的考察。这将在分位数回归方法的应用分析中进一步开展深入探讨。参考文献1EmanuelParzen,QuantileProbabilityandStatisticalDataModeling,J.StatisticalScience,Vol.19,No.4,(Nov.,2004),pp.652-662.2RogerKoenkerandZhijieXiao,InferenceontheQuantileRegressionProcess,J.Econometrica,Vol.70,No.4,(Jul.,2002),pp.1583-1612.3Keming

18、Yu,ZudiLu,JulianStander,QuantileRegression:ApplicationsandCurrentResearchAreas,J.TheStatistician,Vol.52,No.3,(2003),pp.331-350.4.RogerKoenkerandJoseA.F.Machado,GoodnessofFitandRelatedInferenceProcessesforQuantileRegression,J.JournaloftheAmericanStatisticalAssociation,Vol.94,No.448,(Dec.,1999),pp.129

19、6-1310.KemingYuandM.C.Jones,LocalLinearQuantileRegression,J.JournaloftheAmericanStatisticalAssociation,Vol.93,No.441,(Mar.,1998),pp.228-237.JamesW.TaylorandDerekW.Bunn,AQuantileRegressionApproachtoGeneratingPredictionIntervals,J.ManagementScience,Vol.45,No.2,(Feb.,1999),pp.225-237.ReneGelinas,AlainM

20、artel,PierreLefrancois,SOS:AQuantileEstimationProcedureforDynamicLot-SizingProblems,J.TheJournaloftheOperationalResearchSociety,Vol.46,No.11,(Nov.,1995),pp.1337-1351.P.K.BhattacharyaandAshisK.Gangopadhyay,KernelandNearest-NeighborEstimationofaConditionalQuantile,J.TheAnnalsofStatistics,Vol.18,No.3,(

21、Sep.,1990),pp.1400-1415.PORTNOYS.KOENKERR.,TheGaussianHareandtheLaplacianTortoise:ComputabilityofSquared-errorVersusAbsolute-errorEstimatorsJ.StatisticalScience,1997(12):279-300.Koenker,R.andBassett,G.1978.“RegressionQuantiles.”J.Econometrica.Vol.46,pp.33-50.Koenker,R.(2004):“QuantileRegressionforLongitudinalData,”J,JournalofMultivariateAnalysis,91,7489.12.吴建南、马伟,估计极端行为模型:分位数回归方法及其实现与应用,J数理统计与管理,2006、9月,第25卷第5期,536-543。ResearchonQuantileRegressionModelingandItsAp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论