




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分位数回归模型在R环境下的实现中国人民大学统计学院 左辰 潘岚锋大纲引言分位回归模型的基本结构回归系数的渐进分布参数估计残差形态的检验一个实例一、引言传统回归模型的缺陷:1 只反映均值变化2 Gauss-Markov假设条件太强分位回归模型1 拟合在不同分位数水平下的估计值,可以反映更多的信息2 对残差分布放松假设R package:quantreg by Roger Koenker二、模型的构造其中:因变量 相互独立自变量残差项回归系数 表示分位数水平 的回归系数中位数回归和均值回归的差异均值回归受到离群点影响稳健性的试验目的:比较均值回归、中位数回归系数的稳定性方法:1 计算原模型的预测值
2、、残差2 从残差中抽样加入到预测值中,重新作均值回归和中位数回归3 统计两种回归系数的分布三、回归系数的渐进分布考虑独立同分布的场合模型:残差分布:双尾指数(Laplace)随机生成1000次,统计在0.1,0.2,0.9水平上的分位回归系数:rq(yx,tau=seq(0.1,0.9,length=9)此外,可以观察回归系数的误差在不同分位数水平上的变化四、参数估计给出一个分位回归模型fit=rq(yx)后,命令summary(fit,se=)可以查看参数估计的结果se选项用于选择参数估计的不同方法,主要有1 se=ker:核函数估计法2 se=boot:Bootstrap方法3 se=ra
3、nk:秩检验1 核函数估计法因为残差分布未知,无法直接求出Powell给出如下估计方法:2 秩检验秩检验是R中进行参数估计的默认方法。该方法绕开了对未知变量的非参数估计,Jurekova, Guttenbrunner(1992)通过对偶规划问题的解,构造出一组秩统计量,渐进服从T分布 summary(fit,se=nid)结果:Call: rq(formula = foodexp income)tau: 1 0.5Coefficients: Value Std. Error t value Pr(|t|)(Intercept) 81.48225 19.25066 4.23270 0.00003
4、income 0.56018 0.02828 19.81032 0.000003 Bootstrap通过放回抽样的Monte-Carlo试验,得到回归系数的均值和标准差运用T统计量的方法,构造置信区间 summary(fit,se=boot,bsmethod=xy)结果:Call: rq(formula = foodexp income)tau: 1 0.5Coefficients: Value Std. Error t value Pr(|t|)(Intercept) 81.48225 26.62421 3.06046 0.00247income 0.56018 0.03399 16.482
5、63 0.00000五、残差形态的检验分位数回归模型的一个重要应用就是对两种残差分布的如下两种形态作检验:1 位置漂移模型(location shift model)2 位置-尺度漂移模型(location-scale shift model)对分位数回归过程(regression quantile process)作图分位数回归过程:对一簇分位数水平作回归得到的一组模型例子rqpr=rq(yx,tau=1:99/100)plot(summary(rqpr)位置-尺度漂移模型由表达式可以看出,向量 的各分量随 变化的规律是一致的模拟实例:x1-seq(1,10,length=1000)x2=r
6、norm(1000,mean=0,sd=10)x3=rexp(1000,rate=0.1)u=runif(1000,min=-2,max=2)y=x1+2*x2-x3+u*(-2*x1+x2-x3)rqpr=rq(yx1+x2+x3,tau=10:90/100)plot(summary(rqpr)回归系数的变化情况基本一致,是位置-尺度漂移模型的典型特征检验方法Khmaladze检验Koenker&肖志杰(2002)引入Khmaladze鞅变换技术,计算统计量R:KhmaladzeTest(yx1+x2+x3,nullH=location/location-scale)#nullH:零假设(n
7、ull hypothesis),默认为location,表示位置漂移模型六、一个例子:barro该数据记录了世界各国GDP的增长率和相关因子,共有161个观测;其中前71个观测在1965年1975年取得;后90个观测是19851987年间取得。因子包括::GDP年增长率lgdp2:人均GDPmse2:男性高中教育情况fse2:女性高中教育情况fhe2:女性高等教育情况mhe2:男性高等教育情况lexp2:人均期望寿命lintr2:人均资本占有gedy2:教育投入占GDP的比重Iy2:投资占GDP的比例gcony2:公共设施建设占GDP的比例lblakp2:黑市借贷佣金率pol2:政治稳定性指数
8、ttrad2贸易增长率。 1、中位数回归library(quantreg)data(barro)attach(barro62:161,)rqm=rq(lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2)summary(rqm,se=nid)红色区域:最小二乘回归的参数图中看出各参数显著性3 剔除自变量的影响rrs.test(lgdp2+lexp2+lblakp2+mse2+fse2,pol2+fhe2+mhe2+lintr2+gedy2+Iy2+gcony2+ttrad2,)结果:$sn ,11
9、, 4.66242$ranks 1 0.335536739 0.326554008 0.295262752 0.303839348 0.398400879待检验的自变量个数为8个查表知, ,可见剔除这些自变量对模型无显著影响 4 残差分布形态的检验位置漂移模型:KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2)位置-尺度漂移模型:KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2,nullH=location-scale)变量位置漂移模型位置-尺度漂移lgdp21.2290.636*lexp21.7440.309*lblakp20.631*1.080mse21.0180.895*fse20.9100.763*总计3.0932.532*查表可知,在0.1的显著性水平下,两种模型都不能被拒绝但从统计量数值看,位置尺度漂移模型相对更合理八、总结线性分位数回归模型中的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省乐山市重点中学2025年高考化学三模试卷含解析
- 湖南名师联盟2025年高三第二次模拟考试化学试卷含解析
- 幼儿教育实训大厅
- 关注安全珍惜生命
- 河北省张家口市尚义县第一中学2025届高三考前热身化学试卷含解析
- 学前教育专业绘本故事的重要性与应用
- 福建省泉州市20023年第29届WMO竞赛四年级数学下学期竞赛试卷
- 2024-2025学年河南省创新发展联盟3月天一大联考高一下学期阶段性测试(三)数学试卷(含答案)
- 2025届安徽省黄山市屯溪第二中学高三3月份第一次模拟考试化学试卷含解析
- 成人肺部感染的监测与护理
- 2025年河南经贸职业学院单招职业技能测试题库及答案一套
- 电动自行车质量安全培训
- 2025年浙江余姚首创水务有限公司招聘笔试参考题库含答案解析
- 《自动驾驶技术》课件
- 环氧乙烷可行性研究报告
- DB3303T 059-2023 政务信息化项目软件开发费用测算规范
- 2024年淄博市第一医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 2025年陕西巴拉素煤业公司招聘笔试参考题库含答案解析
- 我最爱的书米小圈上学记课件
- 2024-2030年中国预应力锚具行业发展现状及竞争趋势分析报告
- CHB-系列温控仪表说明书
评论
0/150
提交评论