![抽样技术6二阶及多阶抽样_第1页](http://file4.renrendoc.com/view/2bce509764c1175478e81fd81e658b4b/2bce509764c1175478e81fd81e658b4b1.gif)
![抽样技术6二阶及多阶抽样_第2页](http://file4.renrendoc.com/view/2bce509764c1175478e81fd81e658b4b/2bce509764c1175478e81fd81e658b4b2.gif)
![抽样技术6二阶及多阶抽样_第3页](http://file4.renrendoc.com/view/2bce509764c1175478e81fd81e658b4b/2bce509764c1175478e81fd81e658b4b3.gif)
![抽样技术6二阶及多阶抽样_第4页](http://file4.renrendoc.com/view/2bce509764c1175478e81fd81e658b4b/2bce509764c1175478e81fd81e658b4b4.gif)
![抽样技术6二阶及多阶抽样_第5页](http://file4.renrendoc.com/view/2bce509764c1175478e81fd81e658b4b/2bce509764c1175478e81fd81e658b4b5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 二阶及多阶抽样初级单元大小相等时的二阶抽样初级单元大小不等时的二阶抽样样本量的确定和多阶段抽样的问题18.1 概述 一.什么是多阶段抽样 1.概念:设总体由N个初级单元组成,每个初级单元又由若干次级单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干次级单元进行调查,这种抽样称为二阶抽样,或二级抽样(two-stage sampling)。 一些记号: 初级单元(PSU)-Primary Sampling Unit 二级单元 (SSU)-Second-stage Sampling Unit 三级单元(TSU)-Third-stage Sampling Uni
2、t 最终单元 (USU)-Ultimate Sampling Unit22.实施步骤:(1)从总体中抽初级单元,称为第一阶抽样;(2)从每个被抽中的初级单元中抽二级单元,称为第二阶抽样,以此类推。3.与其他几种抽样方法的关系: 整群抽样可以看成是二阶抽样的特殊情形,即最后一阶抽样是100%的抽样; 分层抽样也可看作是多阶抽样的特例,每个初级单元即是层,第一阶抽样是100%抽样,而层内抽样则是第二阶抽样。34.抽样方法:多阶抽样中每一个阶段的抽样可以相同,也可以不同,它通常与分层抽样、整群抽样、系统抽样结合使用。一般来说,当初级单元大小相同时,第一阶段的抽样采用简单随机抽样;当初级单元大小不同时
3、,第一阶段的抽样采用不等概抽样。4二、多阶段抽样特点1. 构造抽样框相对容易。分级准备抽样框,即每次只需要对被抽中的单元准备下一级抽样单元的抽样框;2. 节省人力、物力。3. 行政上便于组织。4. 可用于散料的抽样。所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆土,一车水泥和粮食等。对于散料,抽样单元可以人为划分,也可以取其自然的单位。进行散料抽样时,例: 对土壤中有机磷的测定,一级单元是自然或人为划分的分装(例如10份土样),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。 5. 划分阶段不宜过多。5例:某个新开发区拥有相同户型的15个单元的楼盘,居民已经陆
4、续搬入新居,每个单元住有12户居民,为调查家庭装潢情况,准备利用二阶段抽样法,从180户居民户抽取20户进行调查。 初级单位有15个,每个初级单元拥有的二级单元为12个,先从初级单元简单随机抽5个单元,然后在每个单元中简单随机抽取4户。 (属于等概抽样?)6编号单元房号1*A座12 *3 *4 *5678910 *11122B座1234567891011123C座1234567891011124D座1234567891011125E座1234567891011126 *F座1 *23456 *789 *1011 *127G座1234567891011128H座1234567891011129
5、*I座12345 *67 *8 *910 *111210J座12345678910111211K座12345678910111212 *L座12345 *67 *8 *91011 *1213 *M座1234 *56 *7 *891011 *1214N座12345678910111215H座1234567891011127 初级单元大小相等时的二阶抽样一、总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元,简称初级单元规模相等的两阶段抽样。否则称为初级单元规模不相等的两阶段抽样。 现对第一种情况:从N个初级单元中按简单随机抽样抽取n个初级单元, 再从每个被抽中的初级单
6、元中按简单随机抽样抽取m个次级单元。 8二、常用符号9性质l:对于两阶抽样,有式中,E2,V2为在固定初级单元时对第二阶抽样求均值和方差;E1,V1为对第一阶抽样求均值和方差。两阶段抽样估计量的均值和方差10推导 过程11三、估计量及其性质(一)总体均值的估计:对于初级单元大小相等的二阶抽样,如果两个阶段都是简单随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值 的无偏估计为:其方差为:的无偏估计为:12类似的,可以构造三阶抽样的估计方差13证明:14例:某部门欲研究某农药在叶面上 的残留量,第一步先从一块棉田1000株里简单随机抽取4株,然后从每株上简单随机抽取4片叶子(假
7、定每株共200片叶子),数据如下表,试估计每片叶子农药的平均残留量,并计算抽样误差。15例:欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这三天的流水帐。调查结果如下: 16 要求根据这些数据推算100家企业该指标的总量,并给出估计的95%的置信区间。解: 利用二阶抽样,首先将企业作为初级单元,将每一天看作二级单元,每个企业在调查月内都拥有30天(即拥有30个二级单元)。在这个问题中,调查人员首先在初级单
8、元中抽取了一个n=5 的简单随机样本,然后对每个样本单元的二级单元分别独立抽取了一个m=3 的简单随机样本,这就是初级单元大小相等的二阶抽样问题。 17方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的m倍,而且它还要乘以小于1 的f1。影响精度的主要是初级单元,所以抽样设计的原则:在经费一定时,多抽一些初级单元,少抽一些二级单元比较好。 如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果:这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元指标按次级单元的平均值就可以得到方差
9、的估计。 说明:182、总体比例的估计, , 19无偏估计为:例:欲调查某个新小区居民户家庭装修聘请专业公司的比例 。在15个单元中随机抽取了5个单元,在每个单元都是12户,从中分别抽取4户,对这20户的调查结果如下:样本单元第一户第二户第三户第四户1栋 A座YYNN2栋 C座NYNN3栋 C座NNNY4栋 C座NNNN5栋 B座YNNN20根据上面的信息推算居民家庭装潢聘请专业装潢公司的比例。解:记请专业装潢公司的居民记为“1”,否则记为“0”,这里 N=15, M=12, n=5, m=4, f1=5/15, f2=4/12因此,聘请专业装潢公司的比例为:21例:某林场有一块苗圃,划分为1
10、60块面积相等的小地块,每块中有9棵树苗,现苗圃发现了某种病害,欲用抽样的方法迅速估计已发生病害的苗木占总苗木的比例。方法:从160块地中简单随机抽取了40块地,每块地中又随机抽取3棵树苗; 检查结果为:这40块样本地中,有22块抽取的3棵无病害,11块地中有1棵病害,4块地有2棵苗病害,3块样地中3棵苗都有病.试估计已有病害的树苗的比例及其估计标准误。解:样本中病树的比例及频率如下: f221143pi01/32/3122 树苗有病的比例为:23.2%23一、初级单元大小相等时,最优样本量m与n的确定:1.m的确定: 线性费用函数: 样本量的确定24例(续前例)若c1/c2=10,=15,试
11、确定最优m,n解:首先计算mopt,由上例已知 25进一步计算nopt因此26 在实际工作中,对于各级单元大小不相等时的多阶抽样,通常的做法是:除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS( sampling with probabilities proportional to sizes,简称PPS抽样)抽样, 具体放在不等概部分讲解。 27初级单元大小不等时的二阶抽样 在实际的抽样中,初级单元的大小很少是相同的,针对大小不同的初级单元,在抽样方法上有等概率抽样和不等概率抽样,在估计方法上有简单估计和比估计。 1、等概抽样实现:设总体中初级单元数为N,从中等概抽取n
12、个单元,其大小为Mi(i=1,2,n), 第二阶段在抽中的初级单元中等比例抽取基本单元,即抽样比相同: f2i=mi/Mi=f2 2、也可采用不等概抽样(以后再讲) 28一、简单估计第一阶抽样按简单随机抽样从N个初级单元中抽取n个,第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取mi,i=1n,个2级单元。(1)简单估计:29例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,
13、并给出估计的标准差。30解:采用简单估计31 由此看出,二阶抽样抽样误差主要是由第一项决定,抽样时尽量多抽一些初级单元,少抽一些次级单元比较好。32(2)比估计:33例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,并给出估计的标准差。34 设 表示第i个一阶单元的二阶样本单元中具有某特性的单元占的比例,则总体中具有该特性的单元占的比例的估计量在估计 的公式中,令3、比例的估计353
14、6例:某省卫生部欲对城市饮食业的卫生状况做一次抽样调查,在全省32个城市中随机抽选了4个城市,在抽选的城市中抽25%的饮食店进行检查,在检查的各项指标的基础上进行卫生状况是否合格的评估,其评估结果如下,试估计这32个城市中饮食店卫生不合格店占总店数的比例,若样本比例近似正态分布,计算其95%的置信区间。样本城市饮食店数( Mi)样本数(mi)卫生不合格数比例1521340.308220510.200336940.444432820.25037解:卫生不合格店占总店数的比例为:38再计算:39三、三阶抽样 设总体中含有N个一阶单元,每个一阶单元又含M个二阶单元,而每个二阶单元中又含有K个三阶单元
15、,各阶样本大小分别为n,m和k。令yiju(u=1,2,,K)为第i个一阶单元的第j个二阶单元中,第u个三阶单元的观测值,则40 若三阶抽样中,每阶抽样都是简单随机的,则总体均值 的无偏估计量为 41其方差为 方差的无偏估计量为 其中 42分层二阶抽样设总体分成L层,第h层有Nh个一阶单元,每个一阶单元均含Mh个二阶单元。在第h层随机抽了nh个一阶单元,又从每个被抽中的一阶单元中随机抽了mh个二阶单元。则均值的估计量为 其中 43是按二阶单元的层权; 为第h层的样本均值。其方差为44方差估计量为 45其中 上式乘以 则得 的方差及其估计量。 在分层二阶抽样中,若46即总体中每个二阶单元入样的概率都相等,则样本是自加权的。 47例:某县电视台欲对本台所制做的节目在本县的收视率情况进行调查,调查中分为城镇和农村两层,各进行二阶
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度新型起重机专利许可及销售代理合同
- 合作房地产开发协议(28篇)
- 师傅和徒弟作文
- 2025年兼职工劳务合同格式
- 2025年企业合作投资与合资合同
- 2025年信用卡预借现金协议书范本
- 2025年中尺度自动气象站系统项目立项申请报告
- 2025年区域饮品代理合作协议范本
- 2025年式多功能打印机销售合同规范
- 2025年企业电力安全使用标准协议书
- 压力容器考试审核考试题库(容标委-气体协会联合)
- 超前小导管施工作业指导书
- 中国律师学完整版课件全套教学ppt教程
- 守纪律讲卫生懂礼仪
- 脑控受害者解救方法
- 滁州市城市规划管理技术规定
- 保理业务解决方案
- 图纸会审答疑
- PCCP安装与水压试验
- 景观生态学教学大纲(共10页)
- 招标工作手册
评论
0/150
提交评论