




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章分层随机抽样
第一节分层随机抽样的定义、使用场合以及符号第二节估计量及其性质第三节样本量的分配原则第四节样本量的确定第五节分层抽样的若干问题12/27/20221第三章分层随机抽样第一节分层随机抽样的定义、使用场合以第一节引言一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这个层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是独立按照简单随机抽样进行,则称为分层随机抽样
不重不漏12/27/20222第一节引言一、定义不重不漏12/21/20222作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。层内抽样方法可以不同,而且便于抽样工作的组织。12/27/20223作用12/21/20223二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。12/27/20224二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门负责省内的调查工作。各省再将省内拥有的汽车按经济成分分层。为提高抽样效率,再对汽车按吨位分层。例如,某高校对学生在宿舍使用电脑的情况进行调查,根据经验,本科生和研究生拥有电脑的状况差异较大。因此,在抽样前对学生按本科生和研究生进行分层是有必要的。12/27/20225例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全三、符号说明(关于第h层的记号)层号
单元总数样本单元数第个单元的值层权抽样比总体均值样本均值总体方差样本方差12/27/20226三、符号说明(关于第h层的记号)层号单元总数样本单元数第二节估计量一、对总体均值的估计分层样本,总体均值
的估计分层随机样本,总体均值
的简单估计
12/27/20227第二节估计量一、对总体均值的估计12/21/2022估计量的性质
性质1:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:只要对各层估计无偏,则总体估计也无偏。各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。12/27/20228估计量的性质性质1:对于一般的分层抽样,如果是的证明性质1
由于对每一层有
因此,
估计量的方差
由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有
12/27/20229证明性质1由于对每一层有12/21/20229
性质2:对于分层随机抽样,是的无偏估计,的方差为:
12/27/202210性质2:对于分层随机抽样,是12/21/证明性质2:
对于分层随机抽样,各层独立进行简单随机抽样,对每一层有
因此,由性质1,有
由第二章性质2,得
因此
12/27/202211证明性质2:对于分层随机抽样,各层独立进行简单随机抽样,
性质3:对于分层随机抽样,的一个无偏估计为:
12/27/202212性质3:对于分层随机抽样,的一个无偏估计为:12/证明性质3:
对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质3,得的无偏估计为:
因此,的一个无偏估计为:
12/27/202213证明性质3:对于分层随机抽样,各层独立进行简单随机抽样,二、对总体总量的估计
总体总量
的估计为:
如果得到的是分层随机样本,则总体总量的简单估计为:
12/27/202214二、对总体总量的估计总体总量的估计为:12/21/2.估计量的性质性质4:对于一般的分层抽样,如果是的无偏估计,则是的无偏估计。的方差为:12/27/2022152.估计量的性质性质4:对于一般的分层抽样,如果12/21/性质5:对于分层随机抽样,的方差为:12/27/202216性质5:对于分层随机抽样,的方差为:12/21/202性质6:对于分层随机抽样,的一个无偏估计为:
12/27/202217性质6:对于分层随机抽样,的一个无偏估计为:12/例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。层居民户总数样本户奶制品年消费支出123456789101200104001101510408090024005013060801005516085160170375018026011001406020018030022041500503515020302510302512/27/202218例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单12/27/20221912/21/20221912/27/20222012/21/202220三、对总体比例的估计
总体比例P的估计为:
估计量的性质
性质7:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:12/27/202221三、对总体比例的估计总体比例P的估计为:性质7:对于性质8:对于分层随机抽样,是的无偏估计,因而的方差为:
12/27/202222性质8:对于分层随机抽样,是的无偏估计
性质9:对于分层随机抽样,的一个无偏估计为:12/27/202223性质9:对于分层随机抽样,的一个无偏估计为:例3.2
在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及估计的标准差。层居民户总数样本户拥有家庭电脑情况1234567891012000001000100240001000000103750110000101041500100000000012/27/202224例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的解:由上表可得,
根据前面对各层层权及抽样比的计算结果,可得各层估计量的方差:
因此,该地区居民拥有家庭电脑比例的估计为:
估计量的方差为:
估计量的标准差为:
12/27/202225解:由上表可得,12/21/202225第三节样本量在各层的分配
确定样本量:总的样本量,各层样本量估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。
12/27/202226第三节样本量在各层的分配确定样本量:总的样本量,各层【例3.1】调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。12/27/202227【例3.1】调查某地区的居民奶制品年消费支出,以居民户为抽样层居民户总数
权数
方差常数分配与权数成比例
与正比
12000.07
1624103
3
24000.14
2166106
7
37500.26
82051011
23
415000.53
1931020
7
12/27/202228层居民户总数
权数
方差常数分配与权数成比例
与
120层居民户总数
权数
标准差常数分配与权数成比例与方差成比例与正比
120000.2
20100604940
230000.3
301009011090
350000.5
34100150141170
估计方差
3.863.093.113
12/27/202229层居民户总数
权数
标准差常数分配与权数成比例与方差成比例与一、比例分配
按各层单元数占总体单元数的比例,也就是按各层的层权进行分配.对于分层随机抽样,这时总体均值的估计是自加权12/27/202230一、比例分配按各层单元数占总体单元数的比例,也就是按各层的总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的形式特别简单。这种样本也称为自加权的样本。总体比例的估计是
12/27/202231总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因二、最优分配
(一)最优分配在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。12/27/202232二、最优分配(一)最优分配12/21/202232对所有层成立时,达到极小
常数12/27/202233对所有层成立时,达到极小常数12/21/202233简单线性费用函数,总费用由此得出下面的行为准则,如果某一层·单元数较多·内部差异较大·费用比较省则对这一层的样本量要多分配一些。12/27/202234简单线性费用函数,总费用12/21/202234(二)Neyman(内曼)分配如果每层抽样的费用相同,最优分配可简化为这种分配称为Neyman分配。这时,达到最小。
12/27/202235(二)Neyman(内曼)分配如果每层抽样的费用相同,最优分12/27/20223612/21/202236例3.3
(续例3.1),如果样本量仍为40,则按比例分配和Neyman分配时,各层的样本量应为多少?按比例分配时,各层的样本量为:
12/27/202237例3.3(续例3.1),如果样本量仍为40,则按比例分配和对于Neyman分配,
12/27/202238对于Neyman分配,12/21/20223某些层要求大于100%抽样时的修正
按最优分配时,有时抽样比f较大,某个层的又比较大,则可能出现按最优分配计算的这个层的样本量超过的情况。实际工作中,如果第k层出现这种情况,最优分配是对这个层进行100%的抽样,即取,然后,将剩下的样本量按最优分配分到各层。
12/27/202239某些层要求大于100%抽样时的修正按最优分配时,有时抽样第四节样本量的确定
令当方差给定时
12/27/202240第四节样本量的确定令当方差当按比例分配时,
实际工作中,n的计算可以分为两步,先计算:然后进行修正:
12/27/202241当按比例分配时,12/21/202241当按Neyman分配时,
12/27/202242当按Neyman分配时,12/21/202242例3.4
(续例3.1),如果要求在95%置信度下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少?
=267
12/27/202243例3.4(续例3.1),如果要求在95%置信度下,相对误差当按Neyman分配时:
12/27/202244当按Neyman分配时:12/21/202244二、最优分配需要考虑费用时给定V时12/27/202245二、最优分配需要考虑费用时给定V时12/21/202245给定C时12/27/202246给定C时12/21/202246三、总体参数为P的情形
当方差给定时,如果都比较大,使得,则总样本量为
(一)按比例分配12/27/202247三、总体参数为P的情形当方差给定时,如果都比较大(二)Neyman分配计算样本量之前,需要对作预估计。12/27/202248(二)Neyman分配12/21/202248例3.5
(续例3.2),如果要求在95%置信度下,绝对误差不超过5%,则按比例分配和Neyman分配时,总样本量分别为多少?按比例分配时:12/27/202249例3.5(续例3.2),如果要求在95%置信度下,绝对误差Neyman分配时:12/27/202250Neyman分配时:12/21/202250第五节分层时的若干问题
一、抽样效果分析通常分层抽样比简单随机抽样的精度要高.对于固定样本量的情况,如果相对1可以忽略如果各层均值差异越大,则采用按比例分配的方式较好;而当各层的标准差相差很大时,则最优分配更好。在调查多个目标变量时,按比例分配的分层抽样可能更好些。12/27/202251第五节分层时的若干问题一、抽样效果分析12/21/212/27/20225212/21/202252二、层的划分(一)最优分层按调查目标量进行分层当然是最好的,但我们在调查之前并不知道的值,因此,分层只能是通过与高度相关的辅助指标来进行。累积平方根法:戴伦纽斯(Dalenius)与霍捷斯(Hodges)提出的,它的做法是将分层变量(例如)分布的累积平方根进行等分来获得最优分层,
12/27/202253二、层的划分(一)最优分层12/21/202253例3.6
某地区电信部门在对利用电话上网的居民家庭安装ADSL意愿进行调查时,以辖区内最近三个月有电话上网支出的居民用户为总体(上网电话费为0.02元/分钟),并准备按上网电话费支出(记为)进行分层,试确定各层的分点。12/27/202254例3.6某地区电信部门在对利用电话上网的居民家庭安装ADS范围频数累计0~565328255.5934255.59345~1089240298.7306554.324110~1536128190.0737744.397715~2077525278.43311022.83120~2562407249.81391272.64525~3024591156.81521429.4630~4024586221.74761651.20840~509582138.43411789.64250~6015761177.54441967.18660~708099127.27142094.45770~805676106.54582201.00380~90345383.102352284.10690~100425692.26052376.366100~1501246111.62442487.99150~20080089.442722577.433200~25036560.415232637.848250~30090302667.848300~3503518.708292686.557350~40057.0710682693.628400~4501210.954452704.582>45078.36662712.949不等距6781356203412/27/202255范围频数累计0~565328255.5934255.5934最终累计频数是2712.949,如果取层数为4,则应每隔2712.949/4=678.237分一层,因此分点应该使得累计最接近678.237、1357.474、2034.712,即较合理的分层是<15、[15,30]、[30,70]以及>70。12/27/202256最终累计频数是2712.949,如果取层数为4,则应每隔27(二)层数的确定因为要保证每个层有样本单元,因此层数不能超过样本量n,如果要给出估计量方差的无偏估计,则每层至少两个样本单元,那么层数不能超过n/2。12/27/202257(二)层数的确定因为要保证每个层有样本单元,因此层数不能超过层数的增加确实能提高估计精度
以最简单的情形为例,是区间上的均匀分布,则总体方差,样本量为的简单随机抽样简单估计量的方差为。将总体分成大小相同的层,并按比例分配样本量,即则
12/27/202258层数的增加确实能提高估计精度以最简单的情形为例,是区间除非与的相关系数,层数一般不超过6为宜。12/27/202259除非与的相关系数,层数一般不超三、事后分层
实际工作中没有层的抽样框总体特别大来不及事先分层几个变量都适合于分层,要进行事先的交叉分层比较困难,并且我们并不需要交叉分层后每个子层的估计,如需要按年龄分层的结果,还需要按受教育程度分层的结果,但并不需要这两个指标的交叉结果。
出现离群值提高估计精度12/27/202260三、事后分层实际工作中12/21/202260使用事后分层技术时,还应注意事后层不宜太多。简单随机样本n,事后分层落到第h层的样本量nhnh固定并都大于0的条件下n足够大时,为无偏估计12/27/202261使用事后分层技术时,还应注意事后层不宜太多。nh固定并都大于第一项就是按比例分配分层抽样估计量的方差,第二项表示因事后分层而非事先按比例分配分层引起的方差增加量。只要样本量足够大,事后分层的精度与按比例分配事先分层的精度相当。
12/27/20226212/21/202262
如果样本是按某一个辅助指标分层后抽取的,只要这个事先分层抽样是严格按比例分配进行的,则这个样本是自加权的,总体中每个单元被抽中的概率相同,我们可以将这个样本看作简单随机样本,分别对其它指标进行事后分层估计。
12/27/202263如果样本是按某一个辅助指标分层后抽取的,只要这个事先分层抽例3.7
某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8000名学生中抽出了一个200人的简单随机样本,根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出(元)的结果如下:12/27/202264例3.7某高校欲了解在校学生用于课外进修(如各种考证辅导班试估计全校学生用于课外进修的平均开支。层层权样本量样本均值样本标准差本科生0.7120253.4231.00研究生0.380329.4367.00合计1200283.8294.5712/27/202265试估计全校学生用于课外进修的平均开支。层层权样本量样本均值样解:全校学生用于课外进修的平均开支为:(元)估计的方差为:
=381.83估计的标准差为:19.54(元)如果采用简单估计,则估计的方差为:
估计的标准差为:20.57(元)12/27/202266解:全校学生用于课外进修的平均开支为:12/21/2022第三章分层随机抽样
第一节分层随机抽样的定义、使用场合以及符号第二节估计量及其性质第三节样本量的分配原则第四节样本量的确定第五节分层抽样的若干问题12/27/202267第三章分层随机抽样第一节分层随机抽样的定义、使用场合以第一节引言一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这个层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是独立按照简单随机抽样进行,则称为分层随机抽样
不重不漏12/27/202268第一节引言一、定义不重不漏12/21/20222作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。层内抽样方法可以不同,而且便于抽样工作的组织。12/27/202269作用12/21/20223二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。12/27/202270二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货运汽车完成的运量,还要推算不同经济成分(国有、集体、个体)汽车完成的运量。为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门负责省内的调查工作。各省再将省内拥有的汽车按经济成分分层。为提高抽样效率,再对汽车按吨位分层。例如,某高校对学生在宿舍使用电脑的情况进行调查,根据经验,本科生和研究生拥有电脑的状况差异较大。因此,在抽样前对学生按本科生和研究生进行分层是有必要的。12/27/202271例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全三、符号说明(关于第h层的记号)层号
单元总数样本单元数第个单元的值层权抽样比总体均值样本均值总体方差样本方差12/27/202272三、符号说明(关于第h层的记号)层号单元总数样本单元数第二节估计量一、对总体均值的估计分层样本,总体均值
的估计分层随机样本,总体均值
的简单估计
12/27/202273第二节估计量一、对总体均值的估计12/21/2022估计量的性质
性质1:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:只要对各层估计无偏,则总体估计也无偏。各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。12/27/202274估计量的性质性质1:对于一般的分层抽样,如果是的证明性质1
由于对每一层有
因此,
估计量的方差
由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有
12/27/202275证明性质1由于对每一层有12/21/20229
性质2:对于分层随机抽样,是的无偏估计,的方差为:
12/27/202276性质2:对于分层随机抽样,是12/21/证明性质2:
对于分层随机抽样,各层独立进行简单随机抽样,对每一层有
因此,由性质1,有
由第二章性质2,得
因此
12/27/202277证明性质2:对于分层随机抽样,各层独立进行简单随机抽样,
性质3:对于分层随机抽样,的一个无偏估计为:
12/27/202278性质3:对于分层随机抽样,的一个无偏估计为:12/证明性质3:
对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质3,得的无偏估计为:
因此,的一个无偏估计为:
12/27/202279证明性质3:对于分层随机抽样,各层独立进行简单随机抽样,二、对总体总量的估计
总体总量
的估计为:
如果得到的是分层随机样本,则总体总量的简单估计为:
12/27/202280二、对总体总量的估计总体总量的估计为:12/21/2.估计量的性质性质4:对于一般的分层抽样,如果是的无偏估计,则是的无偏估计。的方差为:12/27/2022812.估计量的性质性质4:对于一般的分层抽样,如果12/21/性质5:对于分层随机抽样,的方差为:12/27/202282性质5:对于分层随机抽样,的方差为:12/21/202性质6:对于分层随机抽样,的一个无偏估计为:
12/27/202283性质6:对于分层随机抽样,的一个无偏估计为:12/例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。层居民户总数样本户奶制品年消费支出123456789101200104001101510408090024005013060801005516085160170375018026011001406020018030022041500503515020302510302512/27/202284例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单12/27/20228512/21/20221912/27/20228612/21/202220三、对总体比例的估计
总体比例P的估计为:
估计量的性质
性质7:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:12/27/202287三、对总体比例的估计总体比例P的估计为:性质7:对于性质8:对于分层随机抽样,是的无偏估计,因而的方差为:
12/27/202288性质8:对于分层随机抽样,是的无偏估计
性质9:对于分层随机抽样,的一个无偏估计为:12/27/202289性质9:对于分层随机抽样,的一个无偏估计为:例3.2
在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及估计的标准差。层居民户总数样本户拥有家庭电脑情况1234567891012000001000100240001000000103750110000101041500100000000012/27/202290例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的解:由上表可得,
根据前面对各层层权及抽样比的计算结果,可得各层估计量的方差:
因此,该地区居民拥有家庭电脑比例的估计为:
估计量的方差为:
估计量的标准差为:
12/27/202291解:由上表可得,12/21/202225第三节样本量在各层的分配
确定样本量:总的样本量,各层样本量估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。
12/27/202292第三节样本量在各层的分配确定样本量:总的样本量,各层【例3.1】调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及估计的标准差。12/27/202293【例3.1】调查某地区的居民奶制品年消费支出,以居民户为抽样层居民户总数
权数
方差常数分配与权数成比例
与正比
12000.07
1624103
3
24000.14
2166106
7
37500.26
82051011
23
415000.53
1931020
7
12/27/202294层居民户总数
权数
方差常数分配与权数成比例
与
120层居民户总数
权数
标准差常数分配与权数成比例与方差成比例与正比
120000.2
20100604940
230000.3
301009011090
350000.5
34100150141170
估计方差
3.863.093.113
12/27/202295层居民户总数
权数
标准差常数分配与权数成比例与方差成比例与一、比例分配
按各层单元数占总体单元数的比例,也就是按各层的层权进行分配.对于分层随机抽样,这时总体均值的估计是自加权12/27/202296一、比例分配按各层单元数占总体单元数的比例,也就是按各层的总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的形式特别简单。这种样本也称为自加权的样本。总体比例的估计是
12/27/202297总体中的任一个单元,不管它在哪一个层,都以同样的概率入样,因二、最优分配
(一)最优分配在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。12/27/202298二、最优分配(一)最优分配12/21/202232对所有层成立时,达到极小
常数12/27/202299对所有层成立时,达到极小常数12/21/202233简单线性费用函数,总费用由此得出下面的行为准则,如果某一层·单元数较多·内部差异较大·费用比较省则对这一层的样本量要多分配一些。12/27/2022100简单线性费用函数,总费用12/21/202234(二)Neyman(内曼)分配如果每层抽样的费用相同,最优分配可简化为这种分配称为Neyman分配。这时,达到最小。
12/27/2022101(二)Neyman(内曼)分配如果每层抽样的费用相同,最优分12/27/202210212/21/202236例3.3
(续例3.1),如果样本量仍为40,则按比例分配和Neyman分配时,各层的样本量应为多少?按比例分配时,各层的样本量为:
12/27/2022103例3.3(续例3.1),如果样本量仍为40,则按比例分配和对于Neyman分配,
12/27/2022104对于Neyman分配,12/21/20223某些层要求大于100%抽样时的修正
按最优分配时,有时抽样比f较大,某个层的又比较大,则可能出现按最优分配计算的这个层的样本量超过的情况。实际工作中,如果第k层出现这种情况,最优分配是对这个层进行100%的抽样,即取,然后,将剩下的样本量按最优分配分到各层。
12/27/2022105某些层要求大于100%抽样时的修正按最优分配时,有时抽样第四节样本量的确定
令当方差给定时
12/27/2022106第四节样本量的确定令当方差当按比例分配时,
实际工作中,n的计算可以分为两步,先计算:然后进行修正:
12/27/2022107当按比例分配时,12/21/202241当按Neyman分配时,
12/27/2022108当按Neyman分配时,12/21/202242例3.4
(续例3.1),如果要求在95%置信度下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少?
=267
12/27/2022109例3.4(续例3.1),如果要求在95%置信度下,相对误差当按Neyman分配时:
12/27/2022110当按Neyman分配时:12/21/202244二、最优分配需要考虑费用时给定V时12/27/2022111二、最优分配需要考虑费用时给定V时12/21/202245给定C时12/27/2022112给定C时12/21/202246三、总体参数为P的情形
当方差给定时,如果都比较大,使得,则总样本量为
(一)按比例分配12/27/2022113三、总体参数为P的情形当方差给定时,如果都比较大(二)Neyman分配计算样本量之前,需要对作预估计。12/27/2022114(二)Neyman分配12/21/202248例3.5
(续例3.2),如果要求在95%置信度下,绝对误差不超过5%,则按比例分配和Neyman分配时,总样本量分别为多少?按比例分配时:12/27/2022115例3.5(续例3.2),如果要求在95%置信度下,绝对误差Neyman分配时:12/27/2022116Neyman分配时:12/21/202250第五节分层时的若干问题
一、抽样效果分析通常分层抽样比简单随机抽样的精度要高.对于固定样本量的情况,如果相对1可以忽略如果各层均值差异越大,则采用按比例分配的方式较好;而当各层的标准差相差很大时,则最优分配更好。在调查多个目标变量时,按比例分配的分层抽样可能更好些。12/27/2022117第五节分层时的若干问题一、抽样效果分析12/21/212/27/202211812/21/202252二、层的划分(一)最优分层按调查目标量进行分层当然是最好的,但我们在调查之前并不知道的值,因此,分层只能是通过与高度相关的辅助指标来进行。累积平方根法:戴伦纽斯(Dalenius)与霍捷斯(Hodges)提出的,它的做法是将分层变量(例如)分布的累积平方根进行等分来获得最优分层,
12/27/2022119二、层的划分(一)最优分层12/21/202253例3.6
某地区电信部门在对利用电话上网的居民家庭安装ADSL意愿进行调查时,以辖区内最近三个月有电话上网支出的居民用户为总体(上网电话费为0.02元/分钟),并准备按上网电话费支出(记为)进行分层,试确定各层的分点。12/27/2022120例3.6某地区电信部门在对利用电话上网的居民家庭安装ADS范围频数累计0~565328255.5934255.59345~1089240298.7306554.324110~1536128190.0737744.397715~2077525278.43311022.83120~2562407249.81391272.64525~3024591156.81521429.4630~4024586221.74761651.20840~509582138.43411789.64250~6015761177.54441967.18660~708099127.27142094.45770~805676106.54582201.00380~90345383.102352284.10690~100425692.26052376.366100~1501246111.62442487.99150~20080089.442722577.433200~25036560.415232637.848250~300903
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信阳涉外职业技术学院《职业生涯规划指导与创新创业(四)》2023-2024学年第一学期期末试卷
- 2025-2030年中国IC卡行业运行态势及发展规划研究报告
- 2025-2030年中国ABS行业市场规模分析及投资建议研究报告
- 甘肃省武威市凉州区洪祥镇重点名校2023-2024学年中考试题猜想数学试卷含解析
- 2025新员工入职安全培训考试试题加答案解析
- 2024-2025车间安全培训考试试题7A
- 2025年公司厂级员工安全培训考试试题及答案 完整
- 2025管理人员安全培训考试试题答案研优卷
- 2024-2025员工安全培训考试试题答案基础题
- 2024-2025企业员工岗前安全培训考试试题附参考答案(B卷)
- 钢框架计算书
- 管理体系文件编号规则
- 员工租房补贴申请表
- 《重大疾病保险的疾病定义使用规范》全文
- 膀胱冲洗技术操作考核评分标准
- 四年级语文教案 囊萤夜读-公开课比赛一等奖
- 日周月安全检查记录表
- 氯化石蜡安全安全技术说明书
- 用户思维课件
- 拔牙术拔牙的禁忌症与适应症ppt课件
- 100以内两位数进退位加减法测试习题(1200道)
评论
0/150
提交评论