抽样技术分层抽样_第1页
抽样技术分层抽样_第2页
抽样技术分层抽样_第3页
抽样技术分层抽样_第4页
抽样技术分层抽样_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/1/71第三章分层随机抽样

第一节分层随机抽样的定义、使用场合以及符号第二节估计量及其性质第三节样本量的分配原则第四节样本量的确定第五节分层抽样的若干问题2023/1/72第一节引言一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这个层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是独立按照简单随机抽样进行,则称为分层随机抽样

不重不漏2023/1/73作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。层内抽样方法可以不同,而且便于抽样工作的组织。2023/1/74二、分层原则:

总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。2023/1/75例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门负责省内的调查工作。各省再将省内拥有的汽车按经济成分分层。为提高抽样效率,再对汽车按吨位分层。例如,某高校对学生在宿舍使用电脑的情况进行调查,根据经验,本科生和研究生拥有电脑的状况差异较大。因此,在抽样前对学生按本科生和研究生进行分层是有必要的。2023/1/76三、符号说明(关于第h层的记号

)层号

单元总数样本单元数第个单元的值层权抽样比总体均值样本均值总体方差样本方差2023/1/77第二节估计量一、对总体均值的估计分层样本,总体均值

的估计分层随机样本,总体均值

的简单估计

2023/1/78估计量的性质

性质1:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:只要对各层估计无偏,则总体估计也无偏。各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。2023/1/79证明性质1

由于对每一层有

因此,

估计量的方差

由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有

2022/12/2910性质2:对于分分层随机机抽样,,是是的无偏估估计,的的方差为为:2022/12/2911证明性质质2:对于分层层随机抽抽样,各各层独立立进行简简单随机机抽样,,对每一一层有因此,由由性质1,有由第二章章性质2,得因此2022/12/2912性质3:对于分层随随机抽样,的的一一个无偏估计计为:2022/12/2913证明性质3:对于分层随机机抽样,各层层独立进行简简单随机抽样样,由第二章章性质3,得的的无偏估计计为:因此,的的一一个无偏估计计为:2022/12/2914二、对总体总总量的估计总体总量的估计为:如果得到的是是分层随机样样本,则总体体总量的简单单估计为:2022/12/29152.估计量的性性质性质4:对于一般般的分层抽抽样,如果果是的的无偏估估计,则是是的的无无偏估计。。的方方差为:2022/12/2916性质5:对于分层层随机抽样样,的的方差为为:2022/12/2917性质质6:对对于于分分层层随随机机抽抽样样,,的的一一个个无无偏偏估估计计为为::2022/12/2918例3.1调查查某某地地区区的的居居民民奶奶制制品品年年消消费费支支出出,,以以居居民民户户为为抽抽样样单单元元,,根根据据经经济济及及收收入入水水平平将将居居民民户户划划分分为为4层,,每每层层按按简简单单随随机机抽抽样样抽抽取取10户,,调调查查获获得得如如下下数数据据((单单位位::元元)),,要要估估计计该该地地区区居居民民奶奶制制品品年年消消费费总总支支出出及及估估计计的的标标准准差差。。层居民户总数样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252022/12/29192022/12/29202022/12/2921三、对总总体比例例的估计计总体比例例P的估计为为:估计量的的性质性质7:对于一般般的分层层抽样,,如果是是的的无无偏估计计()),,则是是的的无无偏估计计。的的方差为为:2022/12/2922性质8:对于分分层随机机抽样,,是是的的无偏偏估计,,因而的的方差为为:2022/12/2923性质9:对于分层层随机抽抽样,的的一个个无偏估估计为::2022/12/2924例3.2在例3.1的调查查中,,同时时调查查了居居民户户拥有有家庭庭电脑脑的情情况,,获得得如下下数据据(单单位::台)),要要估计计该地地区居居民拥拥有家家庭电电脑的的比例例及估估计的的标准准差。。层居民户总数样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002022/12/2925解:由上表表可得得,根据前前面对对各层层层权权及及抽抽样比比的的计计算结结果,,可得得各层层估计计量的的方差差:因此,,该地地区居居民拥拥有家家庭电电脑比比例的的估计计为::估计量量的方方差为为:估计量量的标标准差差为::2022/12/2926第三节节样样本本量在在各层层的分分配确定样样本量量:总总的样样本量量,各各层样样本量量估计量量的方方差不不仅与与各层层的方方差有有关,,还和和各层层所分分配的的样本本量有有关。。实际工工作中中有不不同的的分配配方法法,可可以按按各层层单元元数占占总体体单元元数的的比例例分配配,也也可以以采用用使估估计量量总方方差达达到最最小、、费用用最小小。2022/12/2927【例3.1】调查某某地区区的居居民奶奶制品品年消消费支支出,,以居居民户户为抽抽样单单元,,根据据经济济及收收入水水平将将居民民户划划分为为4层,每每层按按简单单随机机抽样样抽取取10户,调调查获获得如如下数数据((单位位:元元),,要估估计该该地区区居民民奶制制品年年消费费总支支出及及估计计的标标准差差。2022/12/2928层居民户总数

权数

方差常数分配与权数成比例

与正比

12000.07

103

3

24000.14

46.5106

7

37500.26

90.61011

23

415000.53

13.91020

7

40.32022/12/2929层居民户总数

权数

标准差常数分配与权数成比例与方差成比例与正比

120000.2

20100604940

230000.3

301009011090

350000.5

34100150141170

估计方差

3.863.093.113

2022/12/2930一、比例分分配按各层单元元数占总体体单元数的的比例,也也就是按各各层的层权权进行分配配.对于分层随随机抽样,,这时总体体均值的估估计是自加权2022/12/2931总体体中中的的任任一一个个单单元元,,不不管管它它在在哪哪一一个个层层,,都都以以同同样样的的概概率率入入样样,,因因此此按按比比例例分分配配的的分分层层随随机机样样本本,,估估计计量量的的形形式式特特别别简简单单。。这这种种样样本本也也称称为为自自加加权权的的样样本本。。总体体比比例例的的估估计计是是2022/12/2932二、、最最优优分分配配(一一))最最优优分分配配在分分层层随随机机抽抽样样中中,,如如何何将将样样本本量量分分配配到到各各层层,,使使得得总总费费用用给给定定的的条条件件下下,,估估计计量量的的方方差差达达到到最最小小,,或或给给定定估估计计量量方方差差的的条条件件下下,,使使总总费费用用最最小小,,能能满满足足这这个个条条件件的的样样本本量量分分配配就就是是最最优优分分配配。。2022/12/2933对所所有有层层成成立立时时,,达达到到极极小小常数2022/12/2934简单线性费用用函数,总费费用由此得出下面面的行为准则则,如果某一一层·单元数较多·内部差异较大大·费用比较省则对这一层的的样本量要多多分配一些。。2022/12/2935(二)Neyman(内曼)分配配如果每层抽样样的费用相同同,最优分配配可简化为这种分配称为为Neyman分配。这时,,达到最小。2022/12/29362022/12/2937例3.3(续例例3.1),如如果样样本量量仍为为40,则按按比例例分配配和Neyman分配时时,各各层的的样本本量应应为多多少??按比例例分配配时,,各层层的样样本量量为::2022/12/2938对于于Neyman分配配,,2022/12/2939某些些层层要要求求大大于于100%抽样样时时的的修修正正按最最优优分分配配时时,,有有时时抽样样比比f较大大,,某某个个层层的的又又比比较较大大,,则可可能能出出现现按按最最优优分分配配计计算算的的这这个个层层的的样样本本量量超超过过的的情情况况。。实际际工工作作中中,,如如果果第第k层出出现现这这种种情情况况,,最最优优分分配配是是对对这这个个层层进进行行100%的抽抽样样,,即即取取,,然然后后,,将将剩剩下下的的样样本本量量按按最最优优分分配配分分到到各各层层。。2022/12/2940第四节样样本本量的确确定令当方差给给定时时2022/12/2941当按比例例分配时时,实际工作作中,n的计算可可以分为为两步,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论