版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Ratio and Regression Estimator 引例:1802年,拉普拉斯想要估计法国的人口数目。他获得了一个遍布全国范围的 30个社区(commung的样本,截至1802年9月23日总共有2037615居民。在包括 1802年9月23日以前的三年中,215599个新生儿在30个commune拉普拉斯认为 30个commune的每年注册的新生儿数为215599/3=71866.33。把2037615按照 71866.33来分,拉普拉斯估计每年每28.35人里有一个注册新生儿。具有众多人口 的乡镇也就可能有同样众多的注册新生儿,通过用28.35乘以全法国年度新生儿总 数来估计得出法
2、国人口总数。调查中都有辅助信息,抽样框也通常有每个单元额外 的信息,这些信息能被用来提高我们的估计精度。 一、为什么要使用比率估计/回归估计 利用总体的辅助信息提高估计的精度。辅助指标的选择:第一,辅助指标应该与 调查指标有较好的正的相关关系。第二,的抽样分布较 丄的抽样分布变动性要小 xXu 得多。第三,辅助指标的总体总量或总体均值已知。比率估计、回归估计需要有足 够的样本量才能保证估计的有效。有偏估计:当样本量足够大时,估计的偏倚趋于0。 简单地想要估计一个比率:假定总体由面积不同农业用地构成,Vi i地谷物的 产量,人i地的面积,亩谷物的平均产量。 想要估计一个总体总数,但总体大小N是未
3、知的。但是我们知道,于是可以通过 ? nV来估计N,由此我们可以使用不同于总数 n的方法而是采用辅助变量来进行 测量。 要估计渔网中长度长于12c m的鱼的总数,抽取一个鱼的随机样本,估计长度长 于12cm的鱼所占的比例,用鱼的总数N乘以这个比例即可得到,但如果N未知不能 使用。能称量渔网中鱼的总重量。鱼的长度与其重量相关。 ? V乞 x 调整来自样本的估计量以便它们反映人口统计学的总量。 在一所具有4000名学 生的大学提取一个400个学生的简单随机样本,此样本可能包含 240个女性,160 个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。 以教学为职业的总量估计:40
4、00 1241240 400 调整后的总量估计:卫4 2700二0 1300 1270 240160 比率估计量被用来对无回答进行调整。设抽取一个行业的样本:令yi为i行业花 费在健康保险上的金额,Xi为i行业的雇员数。假定对总体中的每个行业Xi均已知. 我们希望一个行业花费在健康保险上的金额与雇员数相关。某些行业在调查中可能 涉及不到。估计保险费用的总花销时调整无回答的方法之一是用总体数X乘以比率 y _ O X 二、Ratio Estimator 在SRS条件下,辅助指标x,其总体均值(总量)已知,则有: Y XXy -X x X NyR x (Y RXi)2 v(R) E(yR) 1 1
5、5 V(yR) 15 i i 1 15 yRi 17.686 ; 1 15 E(y) 15 i1 yi 18 yRi 15 i 1 E(yR)Y 1 15 I 2.82 ; V(y)yi E(y) 97.87 15 i 1 0.31356 (偏倚程度);MSE(yR) V(yR) B2(yR) 2 E(yR) 2.92 B(Yr) 评价:简单估计是无偏的,而比估计是有偏的。简单估计量的方差远远大于比估计 量的方差,比估计的偏差不大,其均方误差也比简单估计的小得多。因此对这个总 体,比估计比简单估计的效率高 三、比率估计的性质 1 f nX2 N 1 例1,对以下假设总体(N=6 ,用简单随机抽
6、样抽取的样本,比较简单随机抽样比估 计及简单估计的性质。 序号 1 2 3 4 5 6 平均值 Xi 0 1 3 5 8 10 4.5 Yi 1 3 11 18 29 46 18 样本 y y1 x x1 简单估计 比率估计 1 1,2 1 : 3 : 0 1 2 18 2 1,3 1 11 0 3 6 18 3 1,4 1 18 0 5 9.5 17.1 4 1,5 1 29: 0 8 15 16.875 5 1,6 1 46 0 10 23.5 21.15 6 2,3 3 11 1 3 7 15.75 7 2,4 3 1 18 1 1 5 10.5 15.75 8 2,5 3 29 1 8
7、 16 16 9 2,6 3 46 1 10 24.5 20.04545 10 3,4 11 18 3 5 14.5 16.3125 11 3,5 11 29 3 8 20 16.36364 12 3,6 11 46 3 10 28.5 19.73077 13 4,5 18 29 5 8 23.5 16.26923 14 4,6 18 : 46 : 5 10 32 19.2 15 5,6 29 46 8 10 37.5 18.75 15个样本,简单估计为: yRi 总共抽取c; 护。 T yi,比率估计: 1 E(r R)牙(SxSy RS:) nX 偏倚量会小,如果:样本量 系数R接近于1。
8、 n很大;抽样比n N很大;X很大;Sx很小;相关 比率估计的近似方差:v(yR)v(XR) X2v(R)v(YR)n2X2v(i?) Vi(R) e(R r)2 秒E(y rx)2 X 1 f 1 nX2 N 1 (Y i 1 RXi)2 w(R) 1 f 1 nX2 n 1 (Yi i 1 Rk)2 V2(R) y(s; 2RSxy R2S;);V2(R) 马(sY 2RSxy R2si) nXnx 四、比率估计的效率 1、与简单估计的比较 简单估计量无偏,而比率估计量渐近无偏。因此这里只比较当n比较大的情形 1 f 2 V(y) - -Sy n IT。I T 9O O V(Yr)(SYR
9、2S;2RSyx)(SjR2S;2R SySx) nn 比率估计量优于简单估计量的条件是: (R2Sj 2R SySx) 01 Sx X(正高度相关) 2 Sy Y 2Cy 2、比率估计成为最优线性无偏估计的条件 (1) yi与Xi的关系是过原点的直线。 yi对这条直线的方差与Xi成比例。则比率估 计是最优线性无偏估计(BLUE)。 例2,某县在对船舶调查月完成的货运量进行调查时, 对运管部门登记的船舶台帐进 行整理后获得注册船舶2860艘,载重吨位154626吨,从2860艘船舶中抽取了一 个的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如下表 (单位:吨),要推算该县船舶调
10、查月完成的货运量 i Yi Xi i Yi Xi 1 780 100 6 2170 120 2 1500 50 7 1823 150 3 1005 50 8 1450 80 4: 376 10 9 158 P 20 5 600 20 10 1370 50 该县船舶在调查月完成货运量的比率估计为 ? y1123.2 YRX154626 2671937 x65 2 V(YR) N-(1 (sY F?2s: 2Rsyx)2.10617 1011 ; s(YR) vv(YR)458930 11 用简单估计对货运量进行估计: Y? Ny 2860 1123.23212352 2 .v(Y?)585921
11、 ? N2(1 f) 211? v(Y?) sy3.43303 1011 ; s(Y?) n defl? -(YR)0.6135 v(Y) (注!实际中对于样本量较小的情形,使用比率估计量时不能忽视其偏倚。) 四、分层随机抽样下的比率估计 ,将各层加权汇 1、 separate ratio estimator 如果各层的样本量不小的话,则可以采用各层分别进行比率估计 总得到总体指标的估计,这种方式称为分别比率估计量。 y1 y2 r yL rr (h 1,2,.L) r1 , r2 ,rL X1 X2 Xl yRSWhyRh WhXh; yRs NyRsXh Xh Xh 2.Comb ined
12、 Ratio estimator YRh 分别比率估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的 偏倚可能比较大,这时使用联合比率估计量。 yRC ystX Xst RcX ; YRcyst X NyRcRcX Xst 方差的比较: v(YRs) n2 咗(S2h nh RfsXh 2Rh Syxh) v(YRc) N2 Wh2 (S2 (Syh nh RcSXh 2RCSyxh) 如果每一层样本量都比较大,各层 R相差较大,则分别比率估计量的方差小于联合 比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠 些,因为这时分别比率估计量的偏倚很大,从而使总的均
13、方误差增大。 五、Regressi on Estimator yLr y (X X) y (X X)Yt NyLr 0, YLr y (srs) R, YLr y Z(X X) Yr (比估计) X 回归估计应用的两种情况: 1、事先确定 设 的确定值为0 ,0是一常数,贝U: VLr y0(X X)( 1) 2 -(Yi N 1 i 1 因为 E(yj E(y) E(X 后者的总体均值为Y故(2) 1 - (YLr) n V(yLr)- n 2 1 Y) o(Xi X)2- n x) Y而yk又可以表示为y 式成立,其样本估计量: ,2 2 2 (Sy0 Sx 2 0 Syx ) (sy o
14、Sx2 oSyx)( 2) o(X xj的样本均值, (3) 性质: A: yLr是Y的无偏估计;B: Syx S (yLr)是V(yLr)的无偏估计; C: 0的最佳值是0 (总体回归系数) 1 Vmin ( y Lr ) 2、 2 Sy(1 n 由样本估计 2) (yiy)(xi x) (Xi x)2 此时: (大样本条件下) yLr y b(x x) V(yLr) S2(1 2) (yLr) n(n 2) n (yi y) b(Xix)2 1 n (n苍 3、分层抽样中的回归估计 (1)分别回归估计 L Wn yLrh 残差方差: se (yi y) b(xi x)2 SE(九);(1
15、NJ yLrs Whyhh(Xh xh) Y?rs NyLrs NhVh h (X h xh ) h可以事先确定时,yLrs与YL都是无偏的,且 V(VLrs) 2 Wh(1fh) nh (S;h 2 h Syxh 2 2 hSxh) h ll(h也.丄)时达到极小值,Vmi皿) Wh2(1fh) nh S:h(1 2) h不能事先确定,bh V(VLrs) nh (yhiyh)(xhixh) nh (XhiXh)2 h) 当nh较大时, (%s) Wh2(1fh) nh( nh 2) (yhi %)2 bh(XhiXh)2 Wh2(1fh) nh(nh2) (nh 1)S:h(1 rh2)
16、(2)联合回归估计 ystWhYh,Xst WhXh YLrc Yst (X Xst) 事先设定时, V(yLrc) Y?Lrc Wh2(1 nh NYLrcY?t(X 叫sYh 2 Syxh 心) 2s2h)(无偏) 无法事先设定时,(渐近无偏) (VLrc ) Wh2(1fh) 其中,九 八(Yhi Yh)be (Xhixh)2 nh( nh1) 2 Wh (1f h) nh(nh1) Wh2(1fh) nh( nh 1) (Yhi Yh)(Xhi Xh) (XhiXh)2 Wh2(1fh) (Syh2bcSyxhbc Sxh ) 例3,某市对中央直属单位和市属单位专业技术人员总数进行了分层随机调查,已有 98年各层人员总数,135个中央直属单位有75650专业技术人员,1228个市属单位 有315612专业技术人员。分别在两层中调查了15、20家单位,调查数据如下,试 估计99年全市专业技术人员总数。 (1)按分别比率估计量估计 2 YRsRhXh 415524 h 1 2 N:(1 fh) v(YRs) h 1nh (2)按联合比率估计量估计 YRc 孳 X 415433 刃st 2 (sYh 2RsyxhRfsi);v(YRs)1607 v(YRc) Nh(1 fh)r)1 2 Sy (1 n (Sy RSx)20( 2) R)20 n MSE(y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年节能、高效干燥设备项目提案报告模板
- 草坪机相关行业投资规划报告范本
- 河北环境工程学院《装饰图案设计》2022-2023学年第一学期期末试卷
- 河北环境工程学院《生态环境保护基础(二)》2022-2023学年第一学期期末试卷
- 河北环境工程学院《计算机设计(矢量绘图2)》2022-2023学年第一学期期末试卷
- 河北环境工程学院《高尔夫球测量学》2021-2022学年第一学期期末试卷
- 小学留守儿童帮扶措施
- 药品贮存与管理流程制度
- 2019年大学“清廉教育”推广方案
- 长期个人住房租赁合同示例
- 国内外智慧护理服务模式的研究进展
- 安全生产法律法规注册安全工程师考试(初级)试卷与参考答案
- 深圳2020-2024年中考英语真题专题03 阅读理解之记叙文(解析版)
- 数据安全风险评估
- 【初中历史】秦汉时期的科技与文化课件 2024-2025学年统编版七年级历史上册
- 教育研究方法课程设计
- 国家职业技术技能标准 5-02-03-02 野生植物保护员 人社厅发201512号
- 医务人员职业暴露预防及处理课件(完整版)
- 2024秋期国家开放大学专科《EXCEL在财务中的应用》一平台在线形考(形考作业一至四)试题及答案
- 整本书阅读《平凡的世界》中职语文高教版(2023-2024)基础模块上册
- 搬运装卸服务外包投标方案(技术标)
评论
0/150
提交评论