多阶段抽样新_第1页
多阶段抽样新_第2页
多阶段抽样新_第3页
多阶段抽样新_第4页
多阶段抽样新_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多阶段抽样新第1页,课件共33页,创作于2023年2月2本章要点

本章介绍多阶段抽样的方式、优点和初级单位大小相等或不等时的两阶段抽样的估计量及其性质,并对相关一些问题进行讨论。具体要求:①正确理解多阶段抽样的科学涵义,对多阶段抽样的性质及优点有初步的认识;②掌握初级单位大小相等时两阶段抽样的估计量及其性质和初级单位大小不等时两阶段抽样的估计量及其性质;③了解有关多阶段抽样的其它相关问题。

第2页,课件共33页,创作于2023年2月3第一节抽样方式第3页,课件共33页,创作于2023年2月4

假设总体中的每个单位本身就很大,我们可以先在总体各单位(初级单位)中抽取样本单位,在抽中的初级单位中再抽取若干个第二级单位(SecondarySamplingUnits),在抽中的第二级单位中再抽取若干个第三级单位(TertiarySamplingUnits)……,直至从最后一级单位中抽取所要调查的基本单位的抽样组织形式,就叫做多阶段抽样。因此,对于一个阶段数为L(L=1,2,3……)的多阶段抽样,最终可以抽出L级样本单位,实际调查也是落在这第L阶段也即最末阶段的抽样单位上。这种抽样的过程,相当于从一棵树的主干到树叶的过程,其中树叶就是所要调查的基本单位,各条粗粗细细的杆、枝就是各级抽样单位。一、多阶段抽样的概念第4页,课件共33页,创作于2023年2月5多阶段抽样中最简单的是两阶段抽样,即在整群抽样的基础上,对抽中的群不是全面调查,而是只抽取部分单位进行调查。也即总体抽群,群抽单位。较复杂些的则是三阶段抽样、四阶段抽样甚至五阶段抽样、六阶段抽样等。例如,我国1984年不颁发的农产量抽样调查方案实行的是五阶段抽样方式,即为:省抽县,县抽乡,乡抽村,村抽地块,地块中抽实测样本,即定义全国的省为初级单位,县为二阶单位,乡镇为三级单位,自然村为四级单位,地块为五级单位。第5页,课件共33页,创作于2023年2月6二、多阶段抽样的优点

(一)便于组织抽样。(二)可以使抽样方式更加灵活和多样化。(三)能够提高估计精度。(四)可以提高抽样的经济效益。(五)可以为各级机构提供相应的信息。

两阶段抽样的研究,是多阶段抽样研究的基础和出发点。多阶段抽样的性质和特点,在二阶段抽样中都已经体现出来。本书中主要研究二阶段抽样问题,对于三阶段以上的多阶段抽样,只做一般的介绍。第6页,课件共33页,创作于2023年2月7第二节初级单位大小相等的两阶段抽样第7页,课件共33页,创作于2023年2月8

设总体划分为A个初级单位,每个初级单位含有M个二阶单位。为总体第i个初级单位中第j个二阶单位的标志值。为总体i个初级单位中各二阶单位的标志总量。为总体第i个初级单位中各二阶单位的均值。为总体均值。一、问题的基本提法

第8页,课件共33页,创作于2023年2月9

从A个初级单位中等概率地抽取a个初级单位,称为初级样本单位,并由每个初级样本单位中抽取m个二阶单位(称为二阶样本单位)组成样本。

第i个初级样本单位中的第j个二阶样本单位的标志值。为第i个初级样本单位中各二阶样本单位的标志总量。为第i个初级样本单位中各二阶样本单位的均值。为二阶段抽样的样本均值。第9页,课件共33页,创作于2023年2月10二、估计量及其性质(一)总体均值的估计在初级单位大小相等的两阶段抽样中,总体均值的无偏估计量就是二级段抽样的样本均值,即:第10页,课件共33页,创作于2023年2月11(二)样本均值的方差为初级单位间的方差。为初级单位内的方差。根据方差的性质和两阶段抽样的特点,有:其中

所以又因为

第11页,课件共33页,创作于2023年2月12式中:故如果令

则第12页,课件共33页,创作于2023年2月13(三)估计量方差的样本估计

两阶段抽样条件下样本均值方差的样本估计量为:可以证明:是的无偏估计。

由此可得两阶段抽样的抽样标准误的估计为:

第13页,课件共33页,创作于2023年2月14【例9.1】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每月填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如表9.1所示。表9.1对5家企业的调查结果样本企业第一日第二日

第三日15759642384150351606344853495625554要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间。第14页,课件共33页,创作于2023年2月15

解:对这个问题,我们可以利用两阶段的思路解决。首先将企业作为初级单位,将每一天看作二级单位,每个企业在调查月内都拥有30天(即拥有30个二级单位)。在这个问题中,调查人员首先在初级单位中抽取了一个n=5的简单随机样本,然后对每个样本的二级单位分别独立抽取了一个m=3的简单随机样本,这就是初级单位大小相等的两阶段问题。

由题意,A=100,M=30,a=5,m=3第15页,课件共33页,创作于2023年2月16

在置信度95%的条件下,对应的t=1.96,因此,置信区间为:60800±9216.0078,或者说在142736.6~178863.4之间。第16页,课件共33页,创作于2023年2月17三、总体比例及其估计量方差

初级单位大小相等的两阶段抽样的总体比例及其方差问题在均值估计的基础上是比较容易理解的。

为总体第i个初级单位中具有某种属性的二级单位数为总体第i个初级单位中各二级单位的比例则总体比例为:

而二阶段抽样的样本比例为:显然,样本比例p是总体比例P的无偏估计。

第17页,课件共33页,创作于2023年2月18样本比例的方差为:其中:

同理,样本比例方差的样本估计为:样本比例的抽样标准误的估计为:第18页,课件共33页,创作于2023年2月19第三节初级单位大小不等的两阶段抽样第19页,课件共33页,创作于2023年2月20

在两阶段抽样中,总体各初级单位所包含的二阶段单位数,有相等和不相等这两种情况。严格地说,前者在实际抽样调查中一般是不存在的,因而它主要具有理论上的意义。这里本书来讨论其具有普遍意义的后者。

初级单位大小不等的两阶段抽样估计,较之与初级单位大小相等的两阶段抽样估计要复杂得多。首先,在抽样时就要考虑采用等概率还是不等概率抽样;其次,在抽取初级样本单位内时各二阶样本时,要考虑各二阶样本得样本容量的分配问题;最后,在等概率抽样条件下,样本指标和抽样方差的估计,又有简单估计、加权估算等方法的不同。这样就构成了许多种不同得抽样估计方法。在这些方法中,有些是有偏的估计,有些是无偏的估计。这里,我们只介绍其中两种无偏估计方法。第20页,课件共33页,创作于2023年2月21一、等概率抽样的加权估计方法

设总体划分为A个初级单位,各初级单位中所包含得二阶段单位数为:(i=1,2,…,A)。

为总体所包含得二阶段单位总数。为各初级单位中所包含的二阶单位数的均值。

为二阶段抽样的总体均值。

类似于不等群体等概率整群抽样的加权估计,二阶段抽样的样本均值为:第21页,课件共33页,创作于2023年2月22可以证明,这个估计是无偏的,即:估计量的方差为:

估计量方差的样本估计为:

第22页,课件共33页,创作于2023年2月23对于初级单位大小不等的两阶段抽样,其总体比例为

:初级单位大小不等的两阶段抽样的样本比例为:

可以证明:

第23页,课件共33页,创作于2023年2月24估计量p的方差为:估计量方差的样本估计为

:第24页,课件共33页,创作于2023年2月25二、不等概率抽样的加权估计方法

不等概率的两阶段抽样方法在用不等概率方法抽取初级样本单位时,与整群抽样完全相同,但两阶段抽样在被抽中的那些初级单位即初级样本单位中,还要抽取二阶样本。对此,按所选择的确定不等概率的标志不同,其抽样估计方法有所差异,关于用以确定不等概率的标志不同,最常用且较为简单的是以各初级单位所包含的二阶单位数在总体全部二阶单位数中所占的比重来确定的。第25页,课件共33页,创作于2023年2月26全部二级单位的总体均值的无偏估计量为:

该估计量的方差为

估计量方差的无偏样本估计为:

第26页,课件共33页,创作于2023年2月27第四节进一步讨论的问题第27页,课件共33页,创作于2023年2月28

三阶段抽样估计的原理和两阶段抽样估计相同,只是第三阶段的抽样是对被抽中的二级单位中的三阶单位再抽样,从中抽出样本三阶段(接受调查的最终单位)。三阶段的估计量的方差可由两阶段抽样估计直接推广。(其余的多阶段抽样均可类推)设总体可划分为A个初级单位,并作第一阶段抽样,采用重复或不重复、等概率或不等概率的方法,抽取其中的a个初级单位或称初级样本单位;在第二阶段抽样中,本文将个初级单位可划分为M个二阶单位,并从第初级段所抽取的各初级单位中,采用重复或不重复、等概率或不等概率的方法,抽取其中的m个二阶单位或称二阶样本单位;再设各二阶单位可继续划分为G个三阶单位,并进行第三阶段的抽样,即采用重复或不重复、等概率或不等概率的方法,分别从各三阶样本单位中,抽取其中的g个单位作为三阶样本单位。一、三阶段抽样第28页,课件共33页,创作于2023年2月29为从总体第i个初级单位第j个二阶单位内所抽出的第u个三阶段单位。为二级单位内的均值

。为初级单位内的均值

为总体均值

在简单随机抽样下,单位大小相同的三阶段抽样的总体均值的无偏估计量为:第29页,课件共33页,创作于2023年2月30三阶段抽样的总体均值估计量的方差公式为

:估计量方差的无偏样本估计为

:第30页,课件共33页,创作于2023年2月31二、多阶段抽样中各级样本量的分配

在设计二阶段抽样方案时,第一、第二阶段的抽样数目n、m应如何确定,才能使抽样误差最小,这就是二阶段抽样法的最佳分配问题。

设全部费用为C,如各单位之间的旅费忽略不计,已被证明较为合适的一种费用函数为:利用拉格朗日求极

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论