z-CH9多阶段抽样-第12节_第1页
z-CH9多阶段抽样-第12节_第2页
z-CH9多阶段抽样-第12节_第3页
z-CH9多阶段抽样-第12节_第4页
z-CH9多阶段抽样-第12节_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CH9多阶段抽样MS:Multi-stageSampling(4-5课时)6/30/20241统计学专业必修课3学分MSMS在抽选样本单元时不是一次直接从总体中抽取总体基本单元BU,而是分两个或两个以上的阶段来抽样比如,城市住户调查中全国范围内→调查市县→住户(2S)全国范围内→调查市县→街道办事处→居委会→住户(MS)一阶/初级单元Primaryunit基本单元Baseunit二阶单元三阶单元等Secondaryunit6/30/20242统计学专业必修课3学分MS方法的意义实践中,大规模的抽样调查项目往往都采用MSMS由CL发展而来(CL是单阶段抽样向多阶段抽样的过渡)MS可以看作对样本群内的单元实施再抽样的一种方法与CL类似:当某阶单元大小(群规模)相等时,则该阶的抽样采用等概抽样但是,实践中,大多数情况单元大小不等,此时,可以:等概抽样,加权估计不等概抽样,HH估计构造自加权样本,达到简化估计量及其方差形式的目的,此时估计精度也很不错6/30/20243统计学专业必修课3学分MS中自加权样本的构造模式……第1阶第2阶第n阶各阶单元大小相等等概抽样各阶单元大小不等PPS抽样等概抽样自加权样本各阶样本量相等前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开始,各阶单元的下层样本量都相同6/30/20244统计学专业必修课3学分CH9内容体系§9.1抽样方式介绍MS的基本概念、优点及抽样推断原理§9.2PU大小相等的2S抽样均值和比例估计量及其性质两个阶段都实施等概抽样srs§9.3PU大小不等的2S抽样均值估计量及其性质等概抽样,加权估计不等概抽样,HH估计自加权样本的构造§9.4进一步讨论的问题2S条件下样本容量的确定和最优配置三阶段抽样估计,尤其是如何构造自加权样本6/30/20245统计学专业必修课3学分§9.1抽样方式MS抽样的基本概念MS抽样的优点MS抽样估计推断原理6/30/20246统计学专业必修课3学分一、MS的基本概念MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进行比如,城市住户调查中全国范围内→调查市县→住户(2S)全国范围内→调查市县→街道办事处→居委会→住户(MS)一阶单元Primaryunit基本单元Baseunit二阶单元三阶单元等Secondaryunit阶段的多少视具体情况确定6/30/20247统计学专业必修课3学分二、MS的优点MS来自于对CL的校正,所以MS具备CL的优点,同时也避免了CL的缺点(?)CL的优点:样本比较集中,便于组织抽样和调查、节约费用等;对于特殊结构的总体,CL往往效果好CL的缺陷:由于群内单元的相似性,CL的误差通常较大;另外,若群规模较大,群内实施全面调查难以体现抽样调查的优势MS的优点:保持了CL样本比较集中,便于调查、节约费用等优点,同时又避免了对小单元过多调查造成的浪费,从而充分发挥抽样调查的优点MS不需要编制所有BU的抽样框,从而可以简化抽样框的编制工作6/30/20248统计学专业必修课3学分MS的优点(P189)1、简化抽样框的编制工作,便于组织抽样对范围较大、分布较广、单元数多的目标总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽样单元,从而简化抽样框的编制工作,便于样本单元的抽取2、可以使抽样方式更加灵活和多样MS中,各阶段可根据具体情况分别设计和采用不同的抽样组织方式(MS经常与st、cl、sy、PPS等相结合),从而充分发挥各种抽样方式的优势同时,各阶段也可以自行采用不同的估计方法6/30/20249统计学专业必修课3学分MS的优点(续)3、能够提高估计精度与CL相比,相同的n,MS的样本在总体中的分布更广,因而也更具代表性同时,MS可以通过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度4、可以提高抽样的经济效益与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操作起来非常简便(可操作性强),组织管理和实测调查的工作量也不大,因此MS的费用将更节省,经济效益更高5、可以为各级机构提供相应的信息MS可以满足各阶段(不同层次)的需要,这与st有些类似比如,中国城镇居民住户调查6/30/202410统计学专业必修课3学分三、MS抽样推断原理(延展性内容)从理论上分析MS条件下估计量的期望和方差的基本公式本章各种形式的估计量的无偏性的证明和方差形式的推导都是依据的这个原理1、2S(P191-194)其中E2、V2——固定PU时对第二阶抽样求均值和方差E1、V1——对第一阶抽样求均值和方差6/30/202411统计学专业必修课3学分两个阶段抽取的所有可能样本估计量的期望对某一固定的第一阶段样本中,所有可能抽出的二阶样本的估计量的期望所有可能抽出的第一阶样本的估计量的期望6/30/202412统计学专业必修课3学分举例说明总体包含3个PU,每个PU包含2个BU现:第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU比如,总体分3个学习小组,每个学习小组包括2名同学。现在先srs抽2个学习小组,再从抽中的学习小组中抽1名同学,进行某项成绩测试所有可能的样本共——C32×C21×C21=12个求这12个样本的估计量的数学期望6/30/202413统计学专业必修课3学分可能的抽样结果PUABCBU(a,b)(c,d)(e,f)2个1个PU(A,B)(B,C)(A,C)(a,c)(a,d)(b,c)(b,d)BU(c,e)(c,f)(d,e)(d,f)(a,e)(a,f)(b,e)(b,f)总体6/30/202414统计学专业必修课3学分定性理解:两个阶段的随机抽样均可能带来抽样误差∴2S的方差由两部分构成:一部分是第一阶段的方差V1;另一部分是第二阶段方差的均值6/30/202415统计学专业必修课3学分说明这不仅是2S抽样的估计推断原理,而是所有两步抽样的估计推断原理,比如,二重抽样、再抽样等方法都遵循这一原理6/30/202416统计学专业必修课3学分2、MS以上关于2S的估计推断原理可以推广至MS比如,3S6/30/202417统计学专业必修课3学分§9.1的重点掌握:MS的基本概念MS的优点理解:2S与st和CL的关系2S的估计推断原理的理解6/30/202418统计学专业必修课3学分2S与CL和st的关系(开拓思路)共同特点:都是首先将总体分为若干的群(或初级单位)区别抽样方式不同抽样误差的来源不同6/30/202419统计学专业必修课3学分2S与CL和st的关系(续)①2S来源于对CL的校正在CL中,如果抽中群所含的次级单元数很多,此时对群内所有单元一一进行调查难度较大;尤其当群内单元标志值差别不大时,没必要这样做。这时,从中选群包含的BU中抽部分进行调查,就形成了2S②CL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:群间方差③st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:层内方差④MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差6/30/202420统计学专业必修课3学分三种抽样方法的比较组织形式PUBU精度(n相同时)提高精度的办法st抽全部抽部分高于srs缩小层内差异,扩大层间差异CL抽部分抽全部低于srs缩小群间差异,扩大群内差异增加群数2S抽部分抽部分介于CL和srs间减少PU间的差异尽量多抽PU§9.1结束6/30/202421统计学专业必修课3学分§9.2PU大小相等的二阶段抽样一、符号说明二、均值估计量及其性质三、比例估计量及其性质6/30/202422统计学专业必修课3学分意义PU大小相等指的是:总体中所有的PU中包含的二级单元数(BU数)都相等PU大小严格相等的情况实践中很少见,但是对它的讨论是MS的基础,同时也具有现实意义,主要体现在:1、有时,PU规模差异不明显,可近似为PU大小相等2、有时,对于PU大小不等的情况,可通过分层,将大小近似的PU分到一层,则层内的2S就可以按PU大小相等的情况讨论所以,本节的讨论很有理论和实践意义6/30/202423统计学专业必修课3学分讨论的前提A个PUsrsa个PUM个BUM个BUM个BU……srsm个BUm个BUm个BU……每个PU相互独立地抽取等容量的BU数总体单元数=AM,样本单元数=am6/30/202424统计学专业必修课3学分一、符号说明两个抽样比两个层次的均值两个方差6/30/202425统计学专业必修课3学分基本符号(Yij,i=1,2,…,A;j=1,2,…,M)

(yij,i=1,2,…,a;j=1,2,…,m)含义总体样本第i个PU的个体均值总的个体均值PU间方差PU内方差6/30/202426统计学专业必修课3学分二、均值估计量及其性质6/30/202427统计学专业必修课3学分均值估计量及其性质的基本结论是无偏估计第一阶抽样误差,是误差的主要组成部分am一定时,提高a而减少m会有效提高估计的精度6/30/202428统计学专业必修课3学分无偏性的证明对称性论证法6/30/202429统计学专业必修课3学分方差形式的证明(P1929.4-9.10)看作一个变量6/30/202430统计学专业必修课3学分方差形式的证明对称性论证法各PU独立抽取6/30/202431统计学专业必修课3学分方差的无偏估计的证明

(P1939.11-9.18)两个关键的结论:6/30/202432统计学专业必修课3学分[例9.1]说明(P194,典型例题)根据题意判断其抽样方法——PU大小相等的2S解题的基本思路:区间估计的三要素总体总值的估计6/30/202433统计学专业必修课3学分注意1、方差估计式中,第一项是主要的,第二项要小很多,这是因为第二项的分母是第一项的m倍,而且分子上还要乘以小于1的f1。所以,在am一定时,提高a而减少m会有效地提高估计的精度2、如果第一阶的抽样比f1可以忽略,则可以简化方差的估计式6/30/202434统计学专业必修课3学分这个结果在实践中可作为参考,因为第二阶抽样采用Sy或其他复杂抽样方法时,很难得到S22的无偏估计,如果f1可以忽略,只需要PU的样本均值就可得到方差的近似估计但从另一方面说,f1可忽略,意味着总体中PU数A很大,而抽选出的a却很小(am一定的情况下相当于m比较大),结果是样本分布相对集中,势必增大抽样误差(类似于CL)这是一对矛盾,应权衡处理6/30/202435统计学专业必修课3学分补例研究目的:某省有100个县,每县有200个村,现欲通过两阶段抽样估计粮食平均亩产抽样方法及样本结果:第一阶段抽取4个县(A,B,C,D)。第二阶段从每县中抽取5个村(1,2,3,4,5),一共是20个样本村,通过调查取得粮食平均亩产资料如下表6/30/202436统计学专业必修课3学分表20个村平均粮食亩产资料

单位:斤

ABCD15705905706002460550480660338062047058045106005206305480580500650要求:用样本资料推断全省粮食平均亩产及其置信区间(置信度为95%)。6/30/202437统计学专业必修课3学分三、总体比例的2S估计量及其性质掌握的关键:比例P与均值的对应关系,尤其是字母符号的对应关系6/30/202438统计学专业必修课3学分比例估计和均值估计之间字母符号的对应关系设Ti——总体第i个PU中具有某特征的BU数ti——样本第i个PU中具有某特征的BU数Pi——总体第i个PU的比例pi——样本第i个PU的比例6/30/202439统计学专业必修课3学分很重要的一个关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论