第四章分层随机抽样_第1页
第四章分层随机抽样_第2页
第四章分层随机抽样_第3页
第四章分层随机抽样_第4页
第四章分层随机抽样_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章分层随机抽样4.1概述

4.1.1分层抽样(stratifiedsampling)、分层随机抽样(stratifiedrandomsampling):分层抽样:将容量为N的总体分成L个不相重叠的子总体,子总体的大小分别为N1、N2、…

NL,皆已知,且

每个子总体就称为层。从每层中独立地进行抽样,这样的抽样方法称为分层抽样。分层随机抽样:在分层抽样中,如果每层中的抽样都是简单随机抽样,则这样的分层抽样称为分层随机抽样。4.1.2分层抽样的适用场合:(1)不仅需要估计总体参数,也需要估计各层参数。(2)便于管理,按现成的地理分布或行政划分来分层。(3)希望样本中能包含各个部分,以增加代表性。(4)把一个内部差异很大的总体分成几个内部比较相似的子总体(层)进行分层抽样,可以提高估计量的精度。如果有极端值,也可以把它们分离出来形成一层。即“层间方差大,层内方差小”。4.2简单估计量及其性质对总体均值或总值的估计:一、分层抽样中例4.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出层居民户总数样本户奶制品年消费支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025解:(3)该该地地区区居居民民奶奶制制品品年年消消费费总总支支出出的的置置信信度度为为95%的置置信信区区间间为为例4.3:某某市市进进行行家家庭庭收收入入调调查查,,分分城城镇镇居居民民及及农农村村居居民民两两部部分分抽抽样样,,在在全全部部城城镇镇居居民民23560户中中随随机机抽抽取取300户,,在在全全部部农农村村居居民民148420户中中随随机机抽抽取取250户,,调调查查结结果果是是城城镇镇年年平平均均户户收收入入为为15180元,,标标准准差差为为2972元;;农农村村年年平平均均户户收收入入为为9856元,,标标准准差差为为2546元。。求求全全市市年年平平均均户户收收入入的的置置信信度度为为90%的置置信信区区间间。。解::3、分分层层随随机机抽抽样样中中,,总总体体比比例例P的简简单单估估计计估计计的的性性质质(1)(2)例::在在某某行行业业技技术术人人员员中中,,按按年年龄龄分分层层,,调调查查会会使使用用计计算算机机者者所所占占的的比比例例。。数数据据如如下下::试估估计计总总体体中中会会计计算算机机者者占占的的比比例例。。层人数入样人数样本中会使用计算机的人数30岁以下7781712430~35岁7497681236~40岁9779892241~45岁4627421145岁以上5366504总计35050320解::4.3各层层样样本本量量的的分分配配在分分层层随随机机抽抽样样中中,,假假设设样样本本量量n固定定1.比例例分分配配::指指按按各各层层层层权权((各各层层单单元元数数占占总总体体单单元元数数的的比比例例))进进行行分分配配。。例::假假设设某某公公司司欲欲估估计计某某类类产产品品的的用用户户的的每每年年平平均均支支出出。。企企划划人人员员拟拟就就整整个个潜潜在在用用户户的的名名单单,,共共8000户。。采用用分分层层随随机机抽抽样样抽抽取取样样本本200户,,求求按按比比例例分分配配时时各各层层样样本本量量。。层每层中的潜在用户少用2000中等4000多用2000总和N=8000例.某电电视视台台要要在在某某地地区区的的住住户户中中,调查查该该台台的的晚晚间间新新闻闻的的收收视视率率。。该该地地区区包包括括3个县县,共有有67401家住住户户。。假假定定该该电电视视台台采采用用分分层层随随机机抽抽样样分分别别从从三三个个县县抽抽取取住住户户,,样样本本量量为为1500。每个县的总总户数以及抽抽样数据列表表如下:求该地区新闻闻收视率的95%的置信区间。。县h每个县的户数Nh每个县被抽出的户数nh

每个县的样本收视率

ph1234810712419687510712761530.270.180.17合计N=67401n=1500解:分层随机机抽样时,收收视率P的估计为:收视率P的置信度为95%的近似置信区区间为:即有95%的把握可以认认为,该地区区的新闻收视视率在22.1%~26.5%之间。2.最优分配:例.在例4.3中,样本量仍仍为n=550。城镇居民23560户,农村居民民148420户。城镇居民与农农村居民的年年收入的标准准差分别为S1=3000元,S2=2500元。对城镇居民与与农村居民抽抽样平均每户户的费用比为为1:2,试求城镇与农农村两层比例例分配与最优优分配的样本本量。又若不考虑费费用因素,那那么最优分配配的结果如何何?例3.2:调查某地地区的居民奶奶制品年消费费支出,以居居民户为抽样样单元,根据据经济及收入入水平将居民民户分为4层层,每层按简简单随机抽样样抽取10户户,调查数据据如下,估计计该地区居民民奶制品年消消费总支出及及估计的标准准差。表:样本户奶奶制品年消费费支出层居民户总数样本户奶制品年消费支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025解:按比例分分配时,对于Neyman分配,4.4样本总量的确确定1.在分层随机抽抽样中,影响响样本总量n的因素:(1)只讨论对总总体参数的精精度要求;(2)样本量的分分配形式。2.在估计总体均均值时,若精度要求给给定,样本总量n的确定公式::证明:*例:某地区采采用按比例分分层随机抽样样对养猪场的的调查,根据据养猪场的规规模大小分为为大、中、小小三层。已知知上次调查的的资料如下::某地区采用用按比例分层层随机抽样对对养猪场的调调查,根据养养猪场的规模模大小分为大大、中、小三三层。已知上上次调查的资资料如下:估计该地区生生猪存栏总数数的精度要求求为以95%的置信度,相相对误差为10%,试确定这次次调查的总样样本量以及各各层样本量。。层(h)Nh第h层样本均值第h层样本方差12343254632243.226.513170.1169.9220.23总计1300解:例:某流水线线生产了1500件产品,为估估计产品的合合格率,将产产品按早、中中、晚班分成成三层。各班班产量分别为为:早班550件,中班500件,晚班450件。根据以往往的情况,每每班合格率均均在95%左右。若要求求以95%的把握使估计计量的绝对误误差不超过2%,分别确定按按比例配置和和按Neyman配置时总样本本量和各层样样本量。解:例:(续例例3.2)如果要求在在置信度95%下,相对误差差不超过10%,则按比例分配和Neyman分配时,总样样本量分别为为多少?解:3.在估计总体均均值时,若总费用给定定,精度最高时时,样本总量量n的确定公式::4.5分层时的若干干问题1.抽样效果分析析:(1)分层随机抽抽样与简单随随机抽样的比比较:在相同的样本本量下,比较较二者的估计计量的方差的的大小。分层层随机抽样以以比例分配为为代表。(2)最优分配((以Neyman为例)与比例例分配在精度度上的比较::理论上讲,最最优分配的精精度应高于相相同样本量的的任何其他分分配。当然,也高于于比例分配的的精度。但最优分配在在精度上的改改进有多大呢呢?*最优分配对于于估计总体比比例P的情形较少使使用。(除非P特别别小或特别大大)2.层的划分:(1)层的划划分原则:a.一种原则是仅仅为满足估计计部分(即子子总体)参数数的需要或为为了组织实施施的便利。b.另一种原则是是尽可能提高高抽样精度,,减少估计量量的方差。需需要选择恰当当的变量变量量作为分层标标志。分层标志的选选择:可以是是调查指标的的前期值可以是与调查查指标有较大大线性相关的的指标。例如如交通运输量量的调查中,,车辆的吨位位是与其两个个主要指标::运量与周转转量密切相关关的。(2)层权对估计计量的影响::(3)最优分层如如何确定各层层的分点:下面介绍一种种确定层界的的快速近似法法——累积平方根法法。它是由Dalenius和Hodges提出的。其做法:将分分层变量的分分布的累积平平方根进行等等分来获得最最优分层,所所以成为累积平方根法法。例:某地区电电信部门在对对利用电话上上网的居民家家庭安装ADSL意愿进行调查查时,以辖区区内最近三个个月有电话上上网支出的居居民用户为总总体(上网电电话费为0.02元/分钟),并准准备按上网电电话费支出((记为x)进行分层,,试确定各层层的分点。居民家庭上网网电话费支出出分布范围x频数f累积0~565328255.5934255.59345~1089240298.7306554.324110~1536128190.0737744.397715~2077525278.43311022.83120~2562407249.81391272.64525~3024591156.81521429.4630~4024586221.74761651.20840~509582138.43411789.64250~6015761177.54441967.18660~708099127.27142094.45770~805676106.54582201.00380~90345383.102352284.10690~100425692.26052376.366100~1501246111.62442487.99150~20080089.442722577.433200~25036560.415232637.848250~30090302667.848300~3503518.708292686.557350~40057.0710682693.628400~4501210.954452704.582﹥

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论