




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 不等概抽样 第一节不不等概概抽样例OBrienetal.(1995)对Philadelphia地区的病病人进行行抽样,目的是是了解病病人对于于医疗服服务的偏偏好。目目标总体体是这一一区域的的所有注注册的医医院的病病人。总总共有有294家医院,27652个床位(抽样以以前,研研究人员员只知道道床位数数,不知知道病人人数)。等概率的的抽取样样本医院院的缺点点?首先,可可能医院院中愿意意接受CPR治疗的病病人数量量会正比比与医院院床位的的数量,采用等等概简单单估计量量可能会会有大的的方差。其次,自自加权的的等概率率样本可可能难于于管理。可能仅仅仅为了了调查一一两个病病人就需需要去一一家医院院
2、,并且且合理分分配调查查人员的的工作负负担也是是比较困困难的。第三,调调查成本本在调查查开始的的时候是是未知的的-一个40个医院的的样本可可能包括括了主要要的大的的医院,这会导导致比预预计更大大的成本本。其他办法法?调查人员员还可以以采用与与医院病病床数量量成比例例的方法法抽取57个医院,然后从从每个样样本医院院中抽取取30个简单随随机样本本床位。如果病人人数等于于床位数数,并且且医院实实际的床床位数和和抽样时时依据的的病床数数据一致致,每个个病人是是否有相相同的入入样概率率?而且成本本在调查查实施前前是已知知的,因因为每个个访员在在每个医医院访问问的病人人数量是相同的的。而且,总总体总量量的
3、方差差可能更更小第一节不不等概概抽样分层抽样样:抽样样选择概概率小的的单位会会有较高高的权数数。采用不等等概率抽抽样来减减少抽样样方差而而不采用用清晰的的分层。采用不不同的概概率来选选择初级级样本单单元,并并且在估估计中采采用不同同的权数数来进行行弥补。抽样的关关键是每每个样本本的选择择概率是是已知的的。场合:总总体单元元差异比比较大时时;抽样审计计;多阶段的的PSU.入样概率率不同是是否导致致估计偏偏差?例如“水水野法”抽样使使得比估估计为无无偏估计计量不等概的的必要性性1、提高估估计精度度2、方回的的PPS抽样简化化方差计计算应用条件件:通常需要要知道一一个辅助助变量,用以确确定其入入样概
4、率率第一节不不等概概抽样1.放回不等等概抽样样每次在总总体中对对每个单单元按入入样概率率进行抽抽样,抽抽取出来来的样本本单元放放回总体体,然后后进行下下一步抽抽烟。这这样,每每次抽样样过程都都是从同同一个总总体独立立进行的的,这种种不等概概抽样称称为(有有)放回回不等概概抽样第一节不不等概概抽样第一节不不等概概抽样这种不等等概抽样样称作放放回的与与规模大大小成比比例的概概率抽样样(probabilityproportional),简称PPS抽样。实实际问题题中总体体单元大大小的度度量往往往不止一一个,比比如企业业员工数数量、产产值、销销售量、利润等等都可以以度量企企业规模模的大小小。PPS的实
5、施主主要有两两种方法法:代码法与拉希里(Lahiri)法累计代码10.66616214.5145151715131.515166152166413.713730316730357.87838130438161515053138253171010063153263183.6366676326679660727668727101.111738728738738738第一节不不等概概抽样2拉希里方方法不需要累累计,两两次随机机数决定定抽中的的单位。第一次:1-N之间的随随机数i第二次: 1-maxM之间的随随机数m如果Mi m,第i个单位被被抽中第一节不不等概概抽样2.不放回不不等概抽样对于不放回抽
6、抽样,对对总体参参数的估估计及其其方差估估计比较较简单,但样本本单元中中可能有有单元被被抽中多多次,直直观上看看,没有有必要对对同一单单元调查查多次,因此可可以考虑虑放回不不等概抽抽样,即即每次在在总体中中对每个个单元按按入样概概率进行行抽样,抽取出出来的样样本单元元不再放放回总体体,对总总体中剩下的单单元进行行下一次次抽样。第一节不不等概概抽样对于不放放回不等等概抽样样,样本本的抽取取可以有有以下几几种方法法(1)逐个抽取取(2)重抽法(3)全样本抽抽取;样样本量随随机(4)系统抽样样法第二节放放回不不等概抽抽样一只抽取一个个样本单单元(n=1)的不等等概抽样样为了演示示不等概概抽样的的思想
7、,先看一一个例子子。一个城市有有4个超市,营业面面积从100平米到1000平米。我我们的目目标是通通过抽取取一家超超市来估估计4个超市上上个月的的总销售量因为我们们只抽取取一个超超市,所所以超市市第一次次被抽中中的概率率等于超市市进入样样本(入入样)的的概率。这个例例子中,入样概概率正比比于超市市营业面积第一节不不等概概抽样因为超市市A占四个超超市营业业面积的的1/16,所以它它的入样样概率为为1/16。假设我我们知道道所有超超市的销销售额超市营业面积(万元)A1001/1611B2002/1620C3003/1624D100010/16245Total16001300第二节放放回不不等概抽抽
8、样在估计中中,可以以使用选选择概率率来弥补补不等概概率抽样样。如果果超市的的营业面面积近似似正比于于超市的的销售额额,那么么超市A的销售额额就占所所有超市市销售额额的1/16,因此超超市A的销售额额乘16可以近似似的估计计所有超超市的销销售额。因此,样本量量为1的不等概概率抽样样的总体体总量估估计量为为第二节放放回不不等概抽抽样样本ZiyiA1/161117615375B2/162016019600C3/162412829584D10/162453928464四个n=1的可能的的不等概概抽样第二节放放回不不等概抽抽样第二节放放回不不等概抽抽样例如样本A1/4114465536B1/420804
9、8400C1/4249641616D1/4245980462400第二节放放回不不等概抽抽样二 有放放回不等等概抽样样对于放回回不等概概抽样,对总体体总量的的估计是是汉森-赫维茨茨(Hansen-hurwitz)估计例如:估估计超市市销售额额,m:员工人数数解释公式式意义第二节放放回不不等概抽抽样可以证明明例5.2某部门要要了解所所属8500家家生产企企业当月月完成的的利润,该部门门手头已已有一份份去年各各企业完完成产量量的报告告,将其其汇总得得到所属属企业去去年完成成的产量量为3676万万吨。考考虑到时时间紧,准备采采用抽样样调查来来推算当当月完成成的利润润。根据据经验,企业的的产量和和利润
10、相相关性比比较强,且企业业的特点点是规模模和管理理水平差差异比较较大,通通常大企企业的管管理水平平较高些些,因此此采用以以与去年年产量成成比例的的PPS抽样,从从所属企企业中抽抽出一个个样本量量为30的样本本,第二节放放回不不等概抽抽样1*38.2310926106.501900191.5010213.7010241115.00864208.008030.7513127.00172128.421367242.85301316.00104522*9.01384552.0011021412.30220230.7548065.00600153.864600246.00311710.802901615
11、.8023702528.43928482.00430179.00940269.9784298.8199218*21.00640276.20510第二节放放回不不等概抽抽样765404174454=45%相对误差差达到20时时所需样样本量对误差达达到20时所所需样本本量nnnnnnnn=150第二节放放回不不等概抽抽样第二节放放回不不等概抽抽样第三节多多阶段段有放回回不等概概抽样第三节多多阶段段有放回回不等概概抽样第三节多多阶段段有放回回不等概概抽样第三节多多阶段段有放回回不等概概抽样第三节多多阶段段有放回回不等概概抽样二 多阶阶段有放放回不等等概抽样样以三阶段段抽样为为例第三节多多阶段段有放回
12、回不等概概抽样实际工作作中,通通常做法法是前二阶采用用PPS,最后一一阶按等等概率抽抽取最终终单元,且各阶段样本量对对不同单单元都等等于常数数,则所所得样本本是自加加权的。此时有:第三节多多阶段段有放回回不等概概抽样第三节多多阶段段有放回回不等概概抽样例【5-5】某调查公公司接受受了一项项关于全全国城市市成年居居民人均均奶制品品消费支支出及每每天至少少喝一杯杯鲜奶的的人数的的比例情情况的调调查。第三节多多阶段段有放回回不等概概抽样确定抽样样范围为为全国地地级及以以上城市市中的成成年居民民。成年年居民指指年满18周岁以上上的居民民。第一步:确定抽抽样方法法调查公司司决定采采用多阶阶段抽样样方法进
13、进行方案案设计,调查的的最小单单元为成成年居民民。确定定调查的的各个阶阶段为城城市、街街道、居居委会、居民户户,在居居民户中中利用二二维随机机表(Kish随机表的的简化)抽取成年居居民。第三节多多阶段段有放回回不等概概抽样第二步:确定样样本量及及各阶段段样本量量的配置置第三节多多阶段段有放回回不等概概抽样初级单元元:20个城市;二级单元元:80个街道,每个样样本行政政区内抽抽4个街道;三级单元:160个居委会会,每个个样本街街道内抽抽2个居委会会;四级单元元:1600个居民户户,每个个样本居居委会内内抽10户居民户户。在样本居民民户内,利用二二维随机机表抽1名成年居居民。第三步:抽样方方法第一
14、阶段段,在全全国城市市中按与与人口数数成比例例的放回回的不等等概抽样样,即PPS抽样。第二和第第三阶段段分别按按与人口口数成比比例的不不等概系系统抽样样。以第二阶阶段为例例,在某某个被抽抽中的样样本城市市中,将将其所属属的街道道编号,搜集各各街道的的人口数数,赋予予每个街街道与其其人口相相同的代代码数;根据该该市总人人口数除除以样本本量4,确定抽抽样间距距;然后后对代码码进行随随机起点点的等距距抽样,则被抽抽中代码码所在的的街道为为样本街街道。第四阶段段,分别别在每个个样本居居委会中中,按等等距抽样样抽出10个居民户户。即根根据居委委会拥有有的居民民户数除除以样本本量10得到抽样样间距,然后随随机起点点的等距距抽样。第四步:推算方方法第四节不不放放回不等等概抽样样第四节不不放放回不等等概抽样样第四节不不放放回不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业设计中的创新方法论探讨
- 工业遗产旅游的规划与开发策略
- 工业领域的环保技术创新
- 工作生活中的压力管理与自我调适
- 工业设计创新与发展趋势
- 工作分析、职务设计与组织发展研究
- 工程心理学在人机交互中的应用
- 工程机芯结构性能及材料应用分析
- 工程机械的远程诊断与维护服务介绍
- 工厂防尘防毒管理
- 2025年江西省中考数学试卷真题(含标准答案)
- 保洁学校管理制度
- 2025春季学期国开电大本科《人文英语4》一平台机考真题及答案(第六套)
- 2025年中国铁路济南局集团招聘笔试冲刺题(带答案解析)
- 2025年河北省万唯中考定心卷地理(二)
- 2025年全国高考一卷英语真题(解析版)
- 湖南省长沙市2025年七年级下学期语文期末试卷(附参考答案)
- 农机停放场管理制度
- 2025年浙江省嘉兴市南湖区中考二模英语试题(含答案无听力原文及音频)
- T/SHPTA 071.1-2023高压电缆附件用橡胶材料第1部分:绝缘橡胶材料
- 生产基层管理培训课程
评论
0/150
提交评论