分层随机抽样概论_第1页
分层随机抽样概论_第2页
分层随机抽样概论_第3页
分层随机抽样概论_第4页
分层随机抽样概论_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022/10/161第三章 分层随机抽样 第一节 分层随机抽样的定义、使用场合以及符号第二节 估计量及其性质第三节 样本量的分配原则第四节 样本量的确定第五节 分层抽样的若干问题2020-01-172第一节引引言言一、定义义在抽样之之前,先先将总体体N个单元划划分成L个互不重重复的子子总体,每个子子总体称称为层,它们的的大小分分别为,这这个层合合起来就就是整个个总体,然然后,在在每个层层中分别别独立地进行抽样样,这种种抽样就就是分层层抽样,所得到到的样本本称为分分层样本本。如果每层层都是独独立按照照简单随随机抽样样进行,则称为为分层随随机抽样样不重不漏漏2020-01-173作用分层抽样样的

2、抽样样效率较较高,也也就是说说分层抽抽样的估估计精度度较高。这是因因为分层层抽样估估计量的的方差只只和层内内方差有有关,和和层间方方差无关关。分层抽样样不仅能能对总体体指标进进行推算算,而且且能对各各层指标标进行推推算。层内抽样样方法可可以不同同,而且且便于抽抽样工作作的组织织。2020-01-174二、分层层原则:总体中的的每一个个单元一一定属于于并且只只属于某某一个层层,而不不可能同同时属于于两个层层或不属属于任何何一个层层。1.估计:层层内单元元具有相相同性质质,通常常按调查查对象的的不同类类型进行行划分。2.精度:尽尽可能使使层内单单元的指指标值相相近,层层间单元元的差异异尽可能能大,

3、从从而达到到提高抽抽样估计计精度的的目的。3.估计和精精度:既既按类型型、又按按层内单单元指标标值相近近的原则则进行多多重分层层,同时时达到实实现估计计类值以以及提高高估计精精度的目目的。4.实施:抽抽样组织织实施的的方便,通常按按行政管管理机构构设置进进行分层层。2020-01-175例题例如,对对全国范范围汽车车运输的的抽样调调查,调调查目的的不仅要要推算全全国货运运汽车完完成的运运量,还还要推算算不同经经济成分分(国有有、集体体、个体体)汽车车完成的的运量。为组织的的方便,首先将将货运汽汽车总体体按省分分层,由由各省运运输管理理部门负负责省内内的调查查工作。各省再将将省内拥拥有的汽汽车按

4、经经济成分分分层。为提高抽抽样效率率,再对对汽车按按吨位分分层。例如,某某高校对对学生在在宿舍使使用电脑脑的情况况进行调调查,根根据经验验,本科科生和研研究生拥拥有电脑脑的状况况差异较较大。因此,在在抽样前前对学生生按本科科生和研研究生进进行分层层是有必必要的。2020-01-176三、符号号说明(关于第h层的记号号)层号 单元总数样本单元数第 个单元的值层权抽样比总体均值样本均值总体方差样本方差2020-01-177第二节估估计计量量一、对总总体均值值的估计计分层样本本,总体均值值的估计分层随机机样本,总体均值值的简单估估计2020-01-178估计量的的性质性质1:对于一一般的分分层抽样样

5、,如果果是是的的无偏偏估计(),则是是的的无无偏估计计。的的方方差为:只要对各各层估计计无偏,则总体体估计也也无偏。各层可以以采用不不同的抽抽样方法法,只要要相应的的估计量量是无偏偏的,则则对总体体的推算算也是无无偏的。2020-01-179证明性质质1由于对每每一层有有因此,估计量的的方差由于各层层是独立立抽取的的,因此此上式第第二项中中的协方方差全为为0,从而有有2020-01-1710性质2:对于分分层随机机抽样,是是的无偏估估计,的的方差为为:2020-01-1711证明性质质2:对于分层层随机抽抽样,各各层独立立进行简简单随机机抽样,对每一一层有因此,由由性质1,有由第二章章性质2,

6、得因此2020-01-1712性质3:对于分分层随机机抽样,的的一一个无偏偏估计为为:2020-01-1713证明性质质3:对于分层层随机抽抽样,各各层独立立进行简简单随机机抽样,由第二二章性质质3,得的的无偏估估计为:因此,的的一个无无偏估计计为:2020-01-1714二、对总总体总量量的估计计总体总量量的估计为为:如果得到到的是分分层随机机样本,则总体体总量的的简单估估计为:2020-01-17152.估计量的的性质性质4:对于一一般的分分层抽样样,如果果是的的无无偏估计计,则是是的的无偏偏估计。的的方差为为:2020-01-1716性质5:对于分分层随机机抽样,的的方差差为:2020-

7、01-1717性质6:对于分分层随机机抽样,的的一一个无偏偏估计为为:2020-01-1718例3.1调查某地地区的居居民奶制制品年消消费支出出,以居居民户为为抽样单单元,根根据经济济及收入入水平将将居民户户划分为为4层,每层层按简单单随机抽抽样抽取取10户,调查查获得如如下数据据(单位位:元),要估估计该地地区居民民奶制品品年消费费总支出出及估计计的标准准差。层居民户总数样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050

8、351502030251030252020-01-17192020-01-17202020-01-1721三、对总总体比例例的估计计总体比例例P的估计为为:估计量的的性质性质7:对于一般般的分层层抽样,如果是是的的无无偏估计计(),则是是的的无无偏估计计。的的方差为为:2020-01-1722性质8:对于分分层随机机抽样,是是的的无偏偏估计,因而的的方差为为:2020-01-1723性质9:对于分层层随机抽抽样,的的一个个无偏估估计为:2020-01-1724例3.2在例3.1的调查中中,同时时调查了了居民户户拥有家家庭电脑脑的情况况,获得得如下数数据(单单位:台台),要要估计该该地区居居民拥

9、有有家庭电电脑的比比例及估估计的标标准差。层居民户总数样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002020-01-1725解:由上表可可得,根据前面面对各层层层权及及抽样样比的的计算结结果,可可得各层层估计量量的方差差:因此,该该地区居居民拥有有家庭电电脑比例例的估计计为:估计量的的方差为为:估计量的的标准差差为:2020-01-1726第三节样样本本量在各各层的分分配确定样本本量:总总的样本本量,各各层样本本量估计量的的方差不不仅与各各层的方方差有关关,还和和各层所所分配的的样本

10、量量有关。实际工作作中有不不同的分分配方法法,可以以按各层层单元数数占总体体单元数数的比例例分配,也可以以采用使使估计量量总方差差达到最最小、费费用最小小。2020-01-1727【例3.1】调查某地地区的居居民奶制制品年消消费支出出,以居居民户为为抽样单单元,根根据经济济及收入入水平将将居民户户划分为为4层,每层层按简单单随机抽抽样抽取取10户,调查查获得如如下数据据(单位位:元),要估估计该地地区居民民奶制品品年消费费总支出出及估计计的标准准差。2020-01-1728层居民户总数权数方差常数分配与权数成比例与正比12000.07103324000.1446.5106737500.2690

11、.6101123415000.5313.91020740.32020-01-1729层居民户总数权数标准差常数分配与权数成比例与方差成比例与正比120000.220100604940230000.3301009011090350000.534100150141170估计方差3.863.093.1132020-01-1730一、比例例分配按各层单单元数占占总体单单元数的的比例,也就是是按各层层的层权权进行分分配.对于分层层随机抽抽样,这这时总体体均值的的估计是是自加权2020-01-1731总体中的的任一个个单元,不管它它在哪一一个层,都以同同样的概概率入样样,因此此按比例例分配的的分层随随机样

12、本本,估计计量的形形式特别别简单。这种样样本也称称为自加加权的样样本。总体比例例的估计计是2020-01-1732二、最优优分配(一)最最优分配配在分层随随机抽样样中,如如何将样样本量分分配到各各层,使使得总费费用给定定的条件件下,估估计量的的方差达达到最小小,或给给定估计计量方差差的条件件下,使使总费用用最小,能满足足这个条条件的样样本量分分配就是是最优分分配。2020-01-1733对所有层层成立时时,达达到到极小常数2020-01-1734简单线性性费用函函数,总总费用由此得出出下面的的行为准准则,如如果某一一层单元数较较多内部差异异较大费用比较较省则对这一一层的样样本量要要多分配配一些

13、。2020-01-1735(二)Neyman(内曼)分配如果每层层抽样的的费用相相同,最最优分配配可简化化为这种分配配称为Neyman分配。这这时,达到最小小。2020-01-17362020-01-1737例3.3(续例3.1),如果果样本量量仍为40,则按比比例分配配和Neyman分配时,各层的的样本量量应为多多少?按比例分分配时,各层的的样本量量为:2020-01-1738对于Neyman分配,2020-01-1739某些层要要求大于于100%抽样时的的修正按最优分分配时,有时抽样比f较大,某某个层的的又又比较较大,则可能出出现按最最优分配配计算的的这个层层的样本本量超超过的的情情况。实

14、际工作作中,如如果第k层出现这这种情况况,最优优分配是是对这个个层进行行100%的抽样,即取,然后后,将剩剩下的样样本量按按最最优分配配分到各各层。2020-01-1740第四节样样本本量的确确定令当方差给给定时时2020-01-1741当按比例例分配时时,实际工作作中,n的计算可可以分为为两步,先计算算:然后进行行修正:2020-01-1742当按Neyman分配时,2020-01-1743例3.4(续例3.1),如果果要求在在95%置信度下下,相对对误差不不超过10%,则按比比例分配配和Neyman分配时,总样本本量分别别为多少少?=2679.222020-01-1744当按Neyman分配时:2020-01-1745二、最优优分配需需要考虑虑费用时时给定V时2020-01-1746给

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论