多阶段抽样和二重抽样_第1页
多阶段抽样和二重抽样_第2页
多阶段抽样和二重抽样_第3页
多阶段抽样和二重抽样_第4页
多阶段抽样和二重抽样_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多阶段抽样和二重抽样第一页,共五十一页,2022年,8月28日二.多阶抽样特点1.抽样框构造相对容易2.节省人力、物力3.保持了整群抽样相对集中的优点,又克服了群内同质性强的弱点4.误差与阶段多少有关第二页,共五十一页,2022年,8月28日三.符号总体初级单元数:N第一阶段样本量(初级单元数):n第i个初级单元中基本单元数:第i个初级单元中第二阶样本量:第i个初级单元中第j个二级单元观测值:样本中第i个初级单元第j个二级单元的观测值:第一阶段和第二阶段的抽样比:,第三页,共五十一页,2022年,8月28日二阶单元个数:,指标总和:,第i个初级单元指标总和:,第i个初级单元均值:,第四页,共五十一页,2022年,8月28日总体均值:,初级单元间的方差:,初级单元内的方差:第五页,共五十一页,2022年,8月28日第i个初级单元内的方差:是所有的平均值,即:同理有:第六页,共五十一页,2022年,8月28日四.推断原理

证明:第七页,共五十一页,2022年,8月28日第二节初级单元相等的情况以此说明多阶抽样原理,,,…,相等,相等,直接用表示一.估计量均值的无偏估计为:

其方差为:(1)第八页,共五十一页,2022年,8月28日假定n=1,第二阶段抽取m个单位用估计,误差大小取决于和m,即其次,用推断时,推断误差大小取决于和n,当n=1时,,这时,若以n个的均值推断,其方差为

再考虑fpc,则(1)式成立。第九页,共五十一页,2022年,8月28日

的无偏估计为:

证明:(2)

但不是的无偏估计计算时,不受二阶抽样影响,用计算则不然。第十页,共五十一页,2022年,8月28日即所以的无偏估计为(3)第十一页,共五十一页,2022年,8月28日结合(2)、(3)式,得到

类似地,可以得到三阶抽样的估计方差第十二页,共五十一页,2022年,8月28日总量Y的估计

比例P的估计

为第i个初级单元中具有所研究特征的二级单元数

第十三页,共五十一页,2022年,8月28日二.样本的最优分配即n和m的关系,最优分配指,费用一定方差最小,或方差一定费用最省设费用函数:(4)第十四页,共五十一页,2022年,8月28日使上式达到极小的充要条件是:从而满足其中,。由上式看出,m与,成正比,与,成反比求出m后,利用(4)式,即可求出n第十五页,共五十一页,2022年,8月28日第三节初级单元不等的情况对初级单元进行分层,使层内初级单元规模相仿按初级单元规模不等处理加权处理不等概抽样一、等概抽样,加权估计简单随机抽样抽初级单元,估计使用加权思想第十六页,共五十一页,2022年,8月28日⒈简单平均估计,

此时没有考虑权数,估计量有偏遗憾的是,现实中这种情况常出现第十七页,共五十一页,2022年,8月28日⒉加权估计初级单元的平均规模:总体均值的估计为:

该估计量无偏证明:第十八页,共五十一页,2022年,8月28日估计量的方差为:

第十九页,共五十一页,2022年,8月28日加权的总量估计

第二十页,共五十一页,2022年,8月28日3.比率估计该估计量是有偏的,

第二十一页,共五十一页,2022年,8月28日总量估计

该估计量是有偏的,当样本量较大时

第二十二页,共五十一页,2022年,8月28日二.按不等概抽初级单元

1.按PPS抽取初级单元第i个单元被选中概率,()以总量估计为例,利用Hansen-Hurwitz估计量Y的估计:

可以证明是Y的无偏估计第二十三页,共五十一页,2022年,8月28日估计量方差

的无偏估计为:=

证明:对两个分量分别估计第二十四页,共五十一页,2022年,8月28日第二阶段方差分量的无偏估计为第一阶段方差分量的无偏估计为故

=+=第二十五页,共五十一页,2022年,8月28日

满足自加权条件的情形自加权含义:各最终单元入选样本的概率相同,如果一个估计量可以表达为样本观测值的常倍数,则称这种估计量是自加权的。对汉森—赫维茨估计量而言第二十六页,共五十一页,2022年,8月28日由,变形得到:成为自加权的条件是为一常数,即:,显然也是常数第二十七页,共五十一页,2022年,8月28日这里为总体中任意一个二级单元被抽中的概率,即总的抽样比。

当时,若大,则小,最终每个单元入样概率一样。由此可得出自加权条件是第一阶段PPS,第二阶段第二十八页,共五十一页,2022年,8月28日若是自加权样本,总体总量Y的估计为:

方差估计为:

可见非常简单第二十九页,共五十一页,2022年,8月28日2.按PS抽取初级单元估计量比较复杂初级单元的包含概率为和,采用Horvitz–Thompson(霍维茨—汤普森)估计总量的估计为:

它是无偏估计,且它的方差为:第三十页,共五十一页,2022年,8月28日实践中的处理(1)按PPS抽取上一级单元,如重复抽中,下级单元加倍;这是规范做法(2)按PS抽样,按PPS估计依据,两者差异不大,近似计算第三十一页,共五十一页,2022年,8月28日三.关于比例估计1、初级单元规模不等情况下两阶段均采用等概率抽样从初级单元数N中等概抽取n个单元;在第i个中选初级单元的个次级单元中,等概抽选个单元第三十二页,共五十一页,2022年,8月28日估计量本质上这是一个比率估计

第三十三页,共五十一页,2022年,8月28日2、第一阶段PPS,第二阶段等概率抽样采用自加权抽样设计第三十四页,共五十一页,2022年,8月28日第四节二阶抽样的扩展一、分层二阶抽样将初级单元分层,然后在每层中采用二阶段抽样从抽样方法看,有等概抽样,PPS抽样;从估计方法看,加权估计,比率估计等前面讲过均值、总量估计原理可以运用第三十五页,共五十一页,2022年,8月28日基本原理:

其中:,与分层估计类似第三十六页,共五十一页,2022年,8月28日估计量的方差

其中,,。第三十七页,共五十一页,2022年,8月28日自加权设计若:各层二阶段单元的联合抽样比相同,样本是自加权的此时,估计简化为:

第三十八页,共五十一页,2022年,8月28日二.多阶抽样问题以三阶为例,抽样过程:前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶段样本量对不同单元都等于常数,则所得样本是自加权的。此时有:第三十九页,共五十一页,2022年,8月28日第四十页,共五十一页,2022年,8月28日第九章二重抽样(DoubleSampling)一.基本问题1.什么是二重抽样第四十一页,共五十一页,2022年,8月28日2.作用从总体中筛选主调查对象搜集辅助信息,提高估计效率降低无回答偏倚处理连续性抽样中的样本轮换问题第四十二页,共五十一页,2022年,8月28日3.与二阶抽样的区别抽样框不同使用目的不同估计方法也不完全相同第四十三页,共五十一页,2022年,8月28日4.一般公式设,是对第一步求均值与方差;,是对第二步求均值与方差;

原理类似二阶抽样,具体内容有异第四十四页,共五十一页,2022年,8月28日二.为分层的二重抽样1.抽样步骤(1)采用简单随机抽样,抽取为第一重样本,进行分层;,是的一个无偏估计;(2)采用分层随机抽样,第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论