第四章(整群抽样)._第1页
第四章(整群抽样)._第2页
第四章(整群抽样)._第3页
第四章(整群抽样)._第4页
第四章(整群抽样)._第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1抽样调查课抽样调查课-整群抽样整群抽样单位: 浙江财经学院数统学院课程: 抽样调查课教师: 张锐2整群抽样整群抽样一、整群抽样的基本概念二、群规模相等条件下的估计三、 群规模不相等条件下的估计3一、整群抽样的基本概念一、整群抽样的基本概念 问题的提出 整群抽样的定义 整群抽样的特点 群的划分 群规模简介4 一个新建的居民区由近百幢居民楼组成,其中住户总数达数千户。欲用抽样调查方法估计该居民区现有的电话拥有率。 a.一种是用简单随机抽样,抽取一定样本量的,譬如说共抽取n=250户进行调查,然后用简单估计方法对全居民区的电话拥有率进行估计。 b.另一种方法是按一定方法抽取一定数量的,譬如说15幢

2、或20幢楼,然后对这些楼中的每个住户都进行调查,根据调查结果来估计整个居民区的电话拥有率。 实际问题的提出:实际问题的提出:5 这两种方法的根本差别根本差别是:抽样单元不同抽样单元不同。前者以为抽样单元,后者则以为抽样单元。后一种抽样方法称为整群抽样整群抽样。 6 Def.1 一般地说,如果总体中所有较小的基本单元可以以某种形式组成数量较少但规模较大的单元;或反过来说,每个“大”单元都由若干“小”单元组成,称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元(secondary sampling unit). Def.2 在总体中,按

3、一定方式抽取n个初级单元,调查每个被抽中的初级单元中所包含的全部次级单元,这种抽样方法称为整群抽样(cluster sampling),也称集团抽样。7定义:定义:整群抽样是将总体划分为若干群,然后以群为抽样整群抽样是将总体划分为若干群,然后以群为抽样单元,从样本中随机抽取一部分群,对选中的群的所单元,从样本中随机抽取一部分群,对选中的群的所有基本单元进行调查的一种抽样技术。有基本单元进行调查的一种抽样技术。 这里的群这里的群(cluster)就是指初级单元,整群抽样就是指将总体中的小就是指初级单元,整群抽样就是指将总体中的小单元整群整群地进行抽群。在前面的例子中,居民楼就是群(初级单元整群整

4、群地进行抽群。在前面的例子中,居民楼就是群(初级单元),而住户则是次级单元,对居民楼的抽样就是一种对住户的单元),而住户则是次级单元,对居民楼的抽样就是一种对住户的整群抽样。整群抽样。 整群抽样的定义整群抽样的定义8整群抽样的特点整群抽样的特点1) 抽样框的编制简单抽样框的编制简单2) 实施便利,节省费用实施便利,节省费用3) 抽样误差相对比较大些抽样误差相对比较大些发挥整群抽样的优势,因为其省时省力,每个单元的平均调查费用比较少,故可通过增大样本量增大样本量的方法弥补精度的损失。9 划分群的标准划分群的标准总体方差总体方差=群间方差群间方差+群内方差群内方差群内方差群内方差群间方差群间方差

5、整群抽样是对被抽中的群的群内的每个单元进行抽样,因此群内方差的影响很小,主要的误差是由群间方差影响的。分群的标准:分群的标准:使同一群内各单元之间的差异大使同一群内各单元之间的差异大一些即群内方差大些,群与群的差异尽可能的一些即群内方差大些,群与群的差异尽可能的小些,即群间方差小些。小些,即群间方差小些。10群的规模群的规模u 群的规模指组成群的单元的数量。u 群的规模比较灵活,可大可小,规模大些,估计的精度差些,但是费用省。规模小的,估计的精度可以提高但是费用大。费用与精度根据实际需要而定。费用与精度根据实际需要而定。11一、群规模相等简介 二、符号说明三、总体均值的估计及性质四、估计量方差

6、的估计五、设计效应12 总体中的总体中的N个初级单元即群的大小(群内次级单元数)个初级单元即群的大小(群内次级单元数)都相等的情形。也就是,若总体有都相等的情形。也就是,若总体有N个群时,每个群中个群时,每个群中所包含的单元数为所包含的单元数为M相等时,则称群规模相等,在实际相等时,则称群规模相等,在实际问题中,只要群的规模接近时,也称为群规模相等。这问题中,只要群的规模接近时,也称为群规模相等。这时,对群的抽取一般采用简单随机抽样(无放回)。时,对群的抽取一般采用简单随机抽样(无放回)。 一、群规模相等简介一、群规模相等简介13二二、符号说明符号说明120111ijijNNiiMiijjMi

7、ijjNnijYijyiMMMMMMNMiYYiyy总体群数:样本群数:总体第 群中的第 个单元的指标值:样本第 群中的第 个单元的观测值:第 群中的单元数:当各群规模相等时总体中的单元总数:总体中第 群中的群总值:样本中第 群中的群总值:14211212221121)() 1(1)(1)(11iNiMjijwNiibNiMjijNiiiiYYMNSYYNMSYYNMSMYYNYYMYYi群内方差群间方差方差个体均值群均值群的个体均值第122112212211/1()1()11()(1)iiniinMijijnbiinMwijiijyyMyy nyyMsyynMMsyynsyyn M总总 体体

8、样样 本本15三、总体均值的估计及性质三、总体均值的估计及性质总体平均值 的估计为:Y111nMijijyynM性质性质 1) 的无偏估计 yY是建立如下盒子模型 证明:证明:1611Y111,MYY212,MYY1,NNMYY2YNY2N 在这个新的盒子中有N个小盒子,每个小盒子中含元素(Yij,j=1,2,M),它们的平均数是 ,iY11MiijjYYM而全体 的平均数恰好构成盒子的平均数 。iYY1712我们的模型是从这N个小盒子中随机无放回地抽取n个,这n个小盒子相应的平均数为MjijiyMy11而这n个的平均数 恰好构成样本平均数 ,iyy总体均值 ,样本均值 ,故样本均值 是总体均

9、值 的无偏估计。(为什么?) yYyYn111,MYY212,MYY1y2ynynMnYY,11821211V( )()11NiibfyYYnNfSnM? 四、估计量方差的估计四、估计量方差的估计19 根据 , 的一个无偏估计是: 2111V( )()1NiifyYYnNV( )y( )v y221111()1nibiffyysnnnM在实际问题中,具有某种特性的次级单元在总体中所占的比例P的估计常用整群抽样,不仅方便而且效率高,在各群大小相等的情况下,利用前面对 的讨论,推导出对P的估计量及其方差。Y20五、设计效应五、设计效应 我们已经研究了简单随机抽样和较复杂的分层抽样、不等概率抽样、整

10、群抽样,抽样方法的不同会引起估计量精度的不同。之所以采用比较复杂的抽样手段,目的无非是提高估计的效果。因此,看一个抽样方案的效果究竟如何,一个比较好的办法是将它与简单随机抽样在相同的样本容量之下对精度作比较这就是基什(Kish)在1965年提出的设计效应设计效应(design effect, 简记为deff):21 设计效应值愈大,表明它的效率愈低。若deff1,表明所考虑的抽样设计的效率不如简单随机抽样;若deff1,表明该抽样设计的效率比简单随机抽样高。 在整群抽样中,我们在前面已经指出:如何划分群以及群的大小如何控制对于估计的精度都有影响,这就涉及到设计效应。根据设计效应的定义,考察在拥

11、有NM个次级单元的总体中抽取容量为nM的简单随机样本,样本均值 的方差为: yV( )rany21fSnM22因此,群大小相等的整群抽样的设计效应为:V( )deffV( )ranyy1 (1)cM 上面结果意味着:按同样的样本量(以次级单元计)整群抽样的方差约为简单随机抽样的方差的 倍。换句话说,为了获得同样的精度,整群抽样的样本量必须是简单随机抽样的样本量的 倍。 1 (1)cM1 (1)cM23群内相关系数群内相关系数222221) 1() 1)(1()(2wbwbNiMkjikijsMsssSNMMYYYY24例例6.1 在一次对某寄宿中学在校生零花钱的调查中,以宿舍为群进行整群抽样。

12、每个宿舍有8名学生。用简单随机抽样在全部510间宿舍中抽取n=12间宿舍。全部96个学生上周每人零花钱及相关数据如下。 1) 试估计生平均零花钱,并 给出其95%的置信区间; 2) 试估计群内相关系数与设计效应。3) 如果是简单随机抽样,需要多少样本?25i1 240,187,162,185,206,197,154,173 188.00 27.192 210,192,184,148,186,175,169,180 180.50 17.983 149,168,145,130,170,144,125,167 149.75 17.324 202,187,166,232,205,263,198,210

13、 207.88 29.175 210,285,308,198,264,275,183,231 244.25 45.206 394,256,192,280,267,334,216,289 278.50 63.877 192,121,172,165,152,224,195,241 182.75 38.778 230,205,187,176,212,253,189,240 211.50 27.489 274,208,195,307,264,258,210,309 253.13 44.5210 232,187,150,182,175,212,169,222 191.13 28.2911 342,294

14、,267,309,258,198,244,286 274.75 43.7012 228,294,182,312,267,254,232,298 258.38 43.52 iyisijy26(1)解:已知N510,n12,M8,fn/N=0.0235故18.14186)38.21838.258()38.218188(1128)(1)(38.2181238.2585 .1801881221221niibniiyynMsyny元27于是 的置信度为95的置信区间为也即013.123 .144)()(3 .14418.141868120235. 011)(2yvyssnMfyvb元元,93.24183

15、.194)013.12(96. 138.218Y28(2)计算群内相关系数与设计效应解:由前已算出样本群间方差 而群内方差为18.141862bs68.1431)52.4398.1719.27(121)(1)(111)() 1(1222112211122见表最后一列MjniiiijniniMjiijwsnyyMnyyMns29527. 068.1431) 18(18.1418668.143118.14186) 1(2222wbwbsMsss689. 4527. 0) 18(1) 1(1Mdeff30(3) 若 令为简单随机抽样的样本量则即可达到整群抽样96户样本量相同的估计精度srsn)(20

16、7 . 4128户deffMnnsrs31一、等概抽样,简单估计 二、等概抽样,加权估计三、等概抽样,比率估计四、例子32对总体均值 的估计为可以看出, 的方差估计为YniMjijiniiiyMnynyY111)1(11y1)(1)(12nyynfyvnii等概抽样,简单估计等概抽样,简单估计33 此法特点1.估计量 是有偏有偏的2.操作简便,易于掌握和使用3.适用条件,群之间的规模差异不大时 y34思路:以群规模Mi为权数,得到群总和yi, 进而求得群总和均值 ,再除以群 平均规模yNMMNi等概抽样,加权估计等概抽样,加权估计35估计公式为:若 未知,可用样本群平均规模代替niiMnm11

17、0111MYNMNyMyyMnMnyMyniiniiiM36总体总量Y的估计为总量估计的另一公式为yMY0yNynNYnii137估计量的方差为它的无偏估计为均值估计 的方差为NiiYYNnfNYV122)(11)1 ()(niiyynnfNYv122)(11)1 ()(yNiiYYNnMfNYVMyV1220220)(11)1 ()(1)(38总体均值估计为这里辅助变量不是Xi而是群规模Mi总体总量估计为niiniiMyy11niiniiMyMyMY1100等概抽样,比率估计等概抽样,比率估计39估计量的方差分别是1)(11)(1)(1222122NYYMMnfNMYYMnfyVNiiiNi

18、ii1)()1 ()()()(1222220NMYYnfNyVMNyVMYVNiii40 与 的样本估计分别是)2(111)(111)(1112222122niiininiiiniiiyMyMyynmnfMyynmnfyv)(yV)(YV41 )2(11)1 ()(11)1 ()(1112222122niiininiiiniiiyMyMyynnfNMyynnfNYv42背景:某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。 调查资料如下:案例分析案例分析 43样本乡编号村庄数 Mi作物总产(乡) yi(万公斤)种植面积(乡) xi(亩)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合计 209 257.1 8940

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论