z-CH9多阶段抽样-第1、2节ppt课件_第1页
z-CH9多阶段抽样-第1、2节ppt课件_第2页
z-CH9多阶段抽样-第1、2节ppt课件_第3页
z-CH9多阶段抽样-第1、2节ppt课件_第4页
z-CH9多阶段抽样-第1、2节ppt课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、CH9 多阶段抽样MS:Multi-stage Sampling(4-5课时).MSMS在抽选样本单元时不是一次直接从总体中抽取总体根本单元BU,而是分两个或两个以上的阶段来抽样比如,城市住户调查中全国范围内调查市县住户(2S)全国范围内调查市县街道办事处居委会住户(MS)一阶/初级单元Primary unit根本单元Base unit二阶单元三阶单元等Secondary unit.MS方法的意义实际中,大规模的抽样调查工程往往都采用MSMS由CL开展而来(CL是单阶段抽样向多阶段抽样的过渡)MS可以看作对样本群内的单元实施再抽样的一种方法与CL类似:当某阶单元大小(群规模)相等时,那么该阶的

2、抽样采用等概抽样但是,实际中,大多数情况单元大小不等,此时,可以:等概抽样,加权估计不等概抽样,HH估计构造自加权样本,到达简化估计量及其方差方式的目的,此时估计精度也很不错.MS中自加权样本的构造方式第1阶第2阶第n阶各阶单元大小相等等概抽样各阶单元大小不等PPS抽样等概抽样自加权样本各阶样本量相等前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开场,各阶单元的下层样本量都一样.CH9内容体系9.1 抽样方式引见MS的根本概念、优点及抽样推断原理9.2 PU大小相等的2S抽样均值和比例估计量及其性质两个阶段都实施等概抽样srs9.3 PU大小不等的2S抽样均值估计量及

3、其性质等概抽样,加权估计不等概抽样,HH估计自加权样本的构造9.4 进一步讨论的问题2S条件下样本容量确实定和最优配置三阶段抽样估计,尤其是如何构造自加权样本.9.1 抽样方式MS抽样的根本概念MS抽样的优点MS抽样估计推断原理.一、MS的根本概念MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进展比如,城市住户调查中全国范围内调查市县住户(2S)全国范围内调查市县街道办事处居委会住户(MS)一阶单元Primary unit根本单元Base unit二阶单元三阶单元等Secondary unit阶段的多少视详细情况确定.二、MS的优点MS来自于对CL的校正,所以

4、MS具备CL的优点,同时也防止了CL的缺陷(?)CL的优点:样本比较集中,便于组织抽样和调查、节约费用等;对于特殊构造的总体,CL往往效果好CL的缺陷:由于群内单元的类似性,CL的误差通常较大;另外,假设群规模较大,群内实施全面调查难以表达抽样调查的优势MS的优点:坚持了CL样本比较集中,便于调查、节约费用等优点,同时又防止了对小单元过多调查呵斥的浪费,从而充分发扬抽样调查的优点MS不需求编制一切BU的抽样框,从而可以简化抽样框的编制任务.MS的优点 (P189)1、简化抽样框的编制任务,便于组织抽样对范围较大、分布较广、单元数多的目的总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽

5、样单元,从而简化抽样框的编制任务,便于样本单元的抽取2、可以使抽样方式更加灵敏和多样MS中,各阶段可根据详细情况分别设计和采用不同的抽样组织方式(MS经常与st、cl、sy、PPS等相结合),从而充分发扬各种抽样方式的优势同时,各阶段也可以自行采用不同的估计方法.MS的优点(续)3、可以提高估计精度与CL相比,一样的n,MS的样本在总体中的分布更广,因此也更具代表性同时,MS可以经过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度4、可以提高抽样的经济效益与CL相比,MS虽然看起来抽样过程更为复杂,但实践上操作起来非常简便(可操作性强),组织管理和实测调查的任

6、务量也不大,因此MS的费用将更节省,经济效益更高5、可以为各级机构提供相应的信息MS可以满足各阶段(不同层次)的需求,这与st有些类似比如,中国城镇居民住户调查.三、MS抽样推断原理(延展性内容)从实际上分析MS条件下估计量的期望和方差的根本公式本章各种方式的估计量的无偏性的证明和方差方式的推导都是根据的这个原理1、2S (P191-194)其中E2、V2固定PU时对第二阶抽样求均值和方差E1、V1对第一阶抽样求均值和方差.两个阶段抽取的一切能够样本估计量的期望对某一固定的第一阶段样本中,一切能够抽出的二阶样本的估计量的期望一切能够抽出的第一阶样本的估计量的期望.举例阐明总体包含3个PU,每个

7、PU包含2个BU现:第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU 比如,总体分3个学习小组,每个学习小组包括2名同窗。如今先srs抽2个学习小组,再从抽中的学习小组中抽1名同窗,进展某项成果测试一切能够的样本共 C32C21C21=12个求这12个样本的估计量的数学期望.能够的抽样结果PUABCBU(a,b)(c,d)(e,f)2个1个PU(A,B)(B,C)(A,C)(a,c)(a,d)(b,c)(b,d)BU(c,e)(c,f)(d,e)(d,f)(a,e)(a,f)(b,e)(b,f)总体.定性了解:两个阶段的随机抽样均能够带来抽样误差2S的方差由两部分构成:

8、一部分是第一阶段的方差V1;另一部分是第二阶段方差的均值.阐明这不仅是2S抽样的估计推断原理,而是一切两步抽样的估计推断原理,比如,二重抽样、再抽样等方法都遵照这一原理.2、MS以上关于2S的估计推断原理可以推行至MS比如,3S.9.1的重点掌握:MS的根本概念MS的优点了解:2S与st和CL的关系2S的估计推断原理的了解.2S与CL和st的关系(开辟思绪)共同特点:都是首先将总体分为假设干的群(或初级单位)区别抽样方式不同抽样误差的来源不同.2S与CL和st的关系(续)2S来源于对CL的校正在CL中,假设抽中群所含的次级单元数很多,此时对群内一切单元一一进展调查难度较大;尤其当群内单元标志值

9、差别不大时,没必要这样做。这时,从中选群包含的BU中抽部分进展调查,就构成了2SCL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:群间方差st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:层内方差MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差.三种抽样方法的比较组织形式PUBU精度(n相同时)提高精度的办法st抽全部抽部分高于srs缩小层内差异,扩大层间差异CL抽部分抽全部低于srs缩小群间差异,扩大群内差异增加群数2S抽部分抽部分介于CL和srs间减少PU间的差异尽量多抽PU9.1终了.

10、9.2 PU大小相等的二阶段抽样一、符号阐明二、均值估计量及其性质三、比例估计量及其性质.意义PU大小相等指的是:总体中一切的PU中包含的二级单元数(BU数)都相等PU大小严厉相等的情况实际中很少见,但是对它的讨论是MS的根底,同时也具有现实意义,主要表达在:1、有时,PU规模差别不明显,可近似为PU大小相等2、有时,对于PU大小不等的情况,可经过分层,将大小近似的PU分到一层,那么层内的2S就可以按PU大小相等的情况讨论所以,本节的讨论很有实际和实际意义.讨论的前提A个PUsrsa个PUM个BUM个BUM个BUsrsm个BUm个BUm个BU每个PU相互独立地抽取等容量的BU数总体单元数=AM

11、,样本单元数=am.一、符号阐明两个抽样比两个层次的均值两个方差.根本符号 (Yij,i=1,2,A; j=1,2,M) (yij ,i=1,2,a; j=1,2,m)含义总体样本第i个PU的个体均值总的个体均值PU间方差PU内方差.二、均值估计量及其性质.均值估计量及其性质的根本结论是无偏估计第一阶抽样误差,是误差的主要组成部分am一定时,提高a而减少m会有效提高估计的精度.无偏性的证明对称性论证法.方差方式的证明(P192 9.4-9.10)看作一个变量.方差方式的证明对称性论证法各PU独立抽取.方差的无偏估计的证明 (P193 9.11-9.18)两个关键的结论:.例9.1阐明 (P19

12、4,典型例题)根据题意判别其抽样方法PU大小相等的2S解题的根本思绪:区间估计的三要素总体总值的估计.留意1、方差估计式中,第一项为哪一项主要的,第二项要小很多,这是由于第二项的分母是第一项的m倍,而且分子上还要乘以小于1的f1。所以,在am一定时,提高a而减少m会有效地提高估计的精度2、假设第一阶的抽样比f1可以忽略,那么可以简化方差的估计式.这个结果在实际中可作为参考,由于第二阶抽样采用Sy或其他复杂抽样方法时,很难得到S22的无偏估计,假设f1可以忽略,只需求PU的样本均值就可得到方差的近似估计但从另一方面说,f1可忽略,意味着总体中PU数A很大,而抽选出的a却很小(am一定的情况下相当

13、于m比较大),结果是样本分布相对集中,势必增大抽样误差(类似于CL)这是一对矛盾,应权衡处置.补例研讨目的:某省有100个县,每县有200个村,现欲经过两阶段抽样估计粮食平均亩产抽样方法及样本结果:第一阶段抽取4个县(A,B,C,D)。第二阶段从每县中抽取5个村(1,2,3,4,5),一共是20个样本村,经过调查获得粮食平均亩产资料如下表.表 20个村平均粮食亩产资料 单位:斤 ABCD15705905706002460550480660338062047058045106005206305480580500650要求:用样本资料推断全省粮食平均亩产及其置信区间(置信度为95%)。 .三、总体比例的2S估计量及其性质掌握的关键:比例P与均值的对应关系,尤其是字母符号的对应关系.比例估计和均值估计之间字母符号的对应关系设Ti总体第i个PU中具有某特征的BU数ti样本第i个PU中具有某特征的BU数Pi总体第i个PU的比例pi样本第i个PU的比例.很重要的一个关系.比例估计量及其无偏性 (P196 9.21)是无偏估计也是无偏估计.比例估计量的方差(P196 9.22-9.24).方差的无偏估计 (P196 9.25)Aa,Mm,P p,Qq,第二项再乘以f1.P196例9.2阐明 (典型例题).补例研讨目的:某林场有160块地,每块地有9棵树,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论