版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章不等概率抽样1第七章不等概率抽样27.1 7.1 概述概述7.2 7.2 放回不等概率抽样放回不等概率抽样7.3 7.3 不放回不等概率抽样不放回不等概率抽样* *第七章不等概率抽样3一、不等概率抽样的提出与含义二、不等概率抽样的使用和优点三、不等概率抽样的分类第七章不等概率抽样4一、不等概率抽样的提出与含义一、不等概率抽样的提出与含义 前述概率抽样方式,具有前述概率抽样方式,具有“等概率等概率” 的特点。的特点。 简单随机抽样下总体中每一个单元的入样概率均相等简单随机抽样下总体中每一个单元的入样概率均相等 分层随机抽样下,层内每一个单元的入样概率均相等分层随机抽样下,层内每一个单元的入
2、样概率均相等 特别地特别地,按比例分配的分层随机抽样对于总体中每一个单元,按比例分配的分层随机抽样对于总体中每一个单元的入样概率均相等的入样概率均相等 等概率抽样的基本出发点是将总体(或层)中的每一个单元看等概率抽样的基本出发点是将总体(或层)中的每一个单元看作是平等的,不作是平等的,不“偏向偏向”也不也不“疏远疏远”某些特定的单元某些特定的单元 如果总体单元差异不大,这种方式既简单也合理如果总体单元差异不大,这种方式既简单也合理第七章不等概率抽样5 但是如果总体单元相差较大,等概率抽样效果不一定好但是如果总体单元相差较大,等概率抽样效果不一定好 例如估计昆明市商业零售总额,大型商场、中型超市
3、和小型例如估计昆明市商业零售总额,大型商场、中型超市和小型商店的差别非常明显,平等对待显然不合理商店的差别非常明显,平等对待显然不合理 对这一情况,处理方式有多种:对这一情况,处理方式有多种: 分层抽样:按规模分层,大型抽样比高、小型抽样比低分层抽样:按规模分层,大型抽样比高、小型抽样比低 目录抽样:少数大单元普查而大多数小单元进行抽样目录抽样:少数大单元普查而大多数小单元进行抽样 不等概率抽样不等概率抽样第七章不等概率抽样6 不等概率抽样不等概率抽样(sampling with unequal probability)是指在抽)是指在抽取样本之前给总体中的每一个单元赋予取样本之前给总体中的每
4、一个单元赋予一定一定的的入样概率入样概率,从而,从而保证大的(重要的)单元抽到的概率大,而小的(不重要的)保证大的(重要的)单元抽到的概率大,而小的(不重要的)的单元抽到的概率小。这里每个单元被赋予的入样概率通常与的单元抽到的概率小。这里每个单元被赋予的入样概率通常与某个辅助变量有关(比如单元规模等)某个辅助变量有关(比如单元规模等) 不等概率抽样是抽样理论发展的产物。不等概率抽样是抽样理论发展的产物。 代表性抽样:主观、有意识的抽样代表性抽样:主观、有意识的抽样 等概率的随机抽样:每个单元平等等概率的随机抽样:每个单元平等 分层抽样:不同层不等概率,但层内等概率分层抽样:不同层不等概率,但层
5、内等概率 不等概率抽样:单元具有不等地位不等概率抽样:单元具有不等地位第七章不等概率抽样7二、不等概率抽样的使用和优点二、不等概率抽样的使用和优点 不等概率抽样通常用于以下三种情况:不等概率抽样通常用于以下三种情况: 需要估计总体总量但总体单元规模相差很大的情况需要估计总体总量但总体单元规模相差很大的情况 抽样审计抽样审计 在不能直接对基本的较小单元抽样的情形下,与其它抽样结在不能直接对基本的较小单元抽样的情形下,与其它抽样结合,完成对大的单元的抽样合,完成对大的单元的抽样 在上述情形下,不等概率抽样的主要在上述情形下,不等概率抽样的主要优点优点是可以大大提高估计是可以大大提高估计的精度,较少
6、抽样误差。的精度,较少抽样误差。 一个一个必要的约束条件必要的约束条件是对总体的每一个单元,都要已知一个辅是对总体的每一个单元,都要已知一个辅助变量用于确定其入样概率或两个单元同时入样的概率助变量用于确定其入样概率或两个单元同时入样的概率第七章不等概率抽样8三、不等概率抽样的分类三、不等概率抽样的分类 不等概率抽样有很多,布鲁尔与哈尼夫在不等概率抽样有很多,布鲁尔与哈尼夫在1983年专著年专著不等概不等概率抽样率抽样中曾列举了中曾列举了50多种方法。不过真正常用的在多种方法。不过真正常用的在10种左右种左右 这些方法按其实施方法或特性可以分成许多不同的类型这些方法按其实施方法或特性可以分成许多
7、不同的类型按抽样过程中被抽到的单元是否被放回总体而分为放回抽样和按抽样过程中被抽到的单元是否被放回总体而分为放回抽样和不放回抽样。常用的是放回抽样。不放回抽样。常用的是放回抽样。按单元的入样概率是否严格地与单元大小成比例,还有最终杨按单元的入样概率是否严格地与单元大小成比例,还有最终杨本量本量n是固定还是随机的。是固定还是随机的。不放回的抽样,按样本单元抽取方式还可以分为逐个抽取法、不放回的抽样,按样本单元抽取方式还可以分为逐个抽取法、重抽法、系统抽取法等等。重抽法、系统抽取法等等。第七章不等概率抽样9一、多项抽样与pps抽样二、pps抽样的实施三、pps抽样的估计第七章不等概率抽样10一、多
8、项抽样与一、多项抽样与pps抽样抽样 设总体包含设总体包含n个单元,对其进行放回抽样。设在每次抽样中,个单元,对其进行放回抽样。设在每次抽样中, 抽到第抽到第i个单元的概率为个单元的概率为zi(i=1,2,n),),11niiz 独立进行独立进行n次这种抽样,共抽到次这种抽样,共抽到n个单元(有可能重复),则称个单元(有可能重复),则称这种不等概率抽样为多项抽样(这种不等概率抽样为多项抽样(multinominal sampling) 特别地,当总体中每个单元具有一个说明其特别地,当总体中每个单元具有一个说明其“大小大小”或或“规模规模”的度量的度量mi时,则可将每个单元的入样概率取为:时,则
9、可将每个单元的入样概率取为:010,()niiiimzmmm 此时每个单元在每次抽样中的入样概率与单元大小成比例,称此时每个单元在每次抽样中的入样概率与单元大小成比例,称这种特殊的多项抽样为与大小成比例的概率抽样(这种特殊的多项抽样为与大小成比例的概率抽样(sampling with probability proportional to size),简称),简称pps抽样。抽样。第七章不等概率抽样11二、二、pps抽样的实施抽样的实施1、代码法(累积总和法,汉森赫维茨法,、代码法(累积总和法,汉森赫维茨法,1943) 设总体有设总体有n个单元,其规模度量为个单元,其规模度量为mi,不妨设,不
10、妨设mi为整数(否则为整数(否则可以乘以一个常数使其成为整数)。记可以乘以一个常数使其成为整数)。记mi之和为之和为m0,则可以设,则可以设置置m0个代码,其中第个代码,其中第i个单元相应的有个单元相应的有mi个代码。其代码的具个代码。其代码的具体范围可以采用累积方法获得。具体而言:第体范围可以采用累积方法获得。具体而言:第1个单元拥有代码个单元拥有代码1m1,第,第2个单元拥有代码个单元拥有代码m1+1m1+m2,第,第i个单元个单元拥有代码:拥有代码:1111iijjjjmm 每次抽样时在整数每次抽样时在整数1m0之间产生一个随机数之间产生一个随机数m,则代码,则代码m所所属的单元即为抽中
11、单元,如此重复属的单元即为抽中单元,如此重复n次即可获得次即可获得n个样本单元。个样本单元。若有的随机数相同或属于同一单元,则该单元被重复抽中若有的随机数相同或属于同一单元,则该单元被重复抽中第七章不等概率抽样122、拉希里法(二次抽取法,、拉希里法(二次抽取法,lahiri,印度),印度) 设总体单元数为设总体单元数为n,单元规模为,单元规模为mi,记:,记:*max()imm 在在1n范围内产生一个随机数,设为范围内产生一个随机数,设为j; 在在1m*范围内的随机数范围内的随机数m 如果如果mmj,则第,则第j个单元未被抽中。个单元未被抽中。 此时需要重复上述步骤,另行抽取一组此时需要重复
12、上述步骤,另行抽取一组【j,m】。直到抽满。直到抽满n个样本单元为止。个样本单元为止。第七章不等概率抽样13三、三、pps抽样的估计抽样的估计 对于放回不等概率抽样,对于对于放回不等概率抽样,对于总体总量总体总量y,汉森赫维茨提出,汉森赫维茨提出如下估计量(如下估计量(hansenhurwitz,1943):): 11nihhiiyynz 特别地,对特别地,对pps抽样:抽样: 0iimzm 有:有:01nihhiimyynm 第七章不等概率抽样14 意义:将意义:将y理解为商店销售额,度量理解为商店销售额,度量m理解为商店人数,则:理解为商店人数,则:第第i个样本商店的人均销售额。个样本商店
13、的人均销售额。/iiym1(/)iiymn 所有样本商店的人均销售额的平均。所有样本商店的人均销售额的平均。0*ma所有商店的销售总额所有商店的销售总额第七章不等概率抽样15 估计量的性质估计量的性质 汉森赫维茨估计量是总体总和的无偏估计:汉森赫维茨估计量是总体总和的无偏估计:()hhe yy 汉森赫维茨估计量的方差为:汉森赫维茨估计量的方差为:211()()nihhiiiyv yzynz 当当n1时,这一方差的无偏估计为:时,这一方差的无偏估计为:211()()(1)nihhhhiiyv yyn nz 第七章不等概率抽样16证明:设随机变量证明:设随机变量,(1,2,.,)iiyinz i
14、i具具有有n n 取取值值且:且:()iiipyzz 则:则:211( ),( )()nniiiiiiiiyyezy vzyzz11nhhiiyn 是是n次独立观测值次独立观测值yi/zi的样本平均数的样本平均数则由数理统计(放回简单随机抽样),有:则由数理统计(放回简单随机抽样),有:21()( );11()( )()hhnihhiiie yeyyv yvzynnz 第七章不等概率抽样17而样本方差:而样本方差:211( )()1nihhiiyvynm 是是( )v 的无偏估计的无偏估计从而:从而:2111()( )()(1)nihhhhiiyv yvynn nz 【例例5.4,p169;
15、例例5.5,p171】第七章不等概率抽样18总体均值的估计总体均值的估计 基于汉森赫维茨总和估计量基础上的总体均值的估计量为:基于汉森赫维茨总和估计量基础上的总体均值的估计量为:11nihhhhiiyyynnnz 方差估计:方差估计:2211 1()()nihhiiiyv yzynnz 2211()()(1)nihhhhiiyv yyn n nz 方差:方差:第七章不等概率抽样19一、包含概率与ps抽样二、ps抽样的估计三、ps抽样的实施第七章不等概率抽样20一、包含概率与一、包含概率与ps抽样抽样 放回不等概率抽样中,每个单元的入样概率放回不等概率抽样中,每个单元的入样概率zi是关键是关键
16、不放回不等概率抽样中,每个单元被包含到样本的概率不放回不等概率抽样中,每个单元被包含到样本的概率i i及及任意两个单元都包含到样本的概率任意两个单元都包含到样本的概率ijij都起着重要的作用,它都起着重要的作用,它们统称为们统称为包含概率包含概率(inclusion probabilityinclusion probability)设总体容量为设总体容量为n,样本量,样本量n(固定固定),包含概率具有以下性质:),包含概率具有以下性质:1niin 所有所有n个单元的入样概率之和为个单元的入样概率之和为n,即:,即: 如此可以保证在一次抽样中可以同时抽出容如此可以保证在一次抽样中可以同时抽出容量
17、为量为n的一个样本的一个样本第七章不等概率抽样21pr( | )(1);nnijiij ij ij in1111(,(1)(1)1:(1)2nnnnnijijiij iij iinnijij iinn nthatisn n 固固定定) 固定第固定第i个单元后,剩余的任意一个单元与其同时出现的概率个单元后,剩余的任意一个单元与其同时出现的概率之和为:之和为: 总体中任意两个不同单元同时入样的概率之和为:总体中任意两个不同单元同时入样的概率之和为:第七章不等概率抽样22 与放回的与放回的pps抽样类似,对于不放回不等概率抽样,最感兴趣抽样类似,对于不放回不等概率抽样,最感兴趣的仍然是的仍然是i i
18、与单元大小与单元大小m mi i成比例的情形,即:成比例的情形,即:i ik k* * mi mi。 记单元大小的一个相对度量为:记单元大小的一个相对度量为:z zi im mi i/m/m0 0(注意(注意zizi在此处仅表在此处仅表示一个相对度量,不具有第示一个相对度量,不具有第2 2节节“入样概率入样概率”的含义)。则有:的含义)。则有:iinz 即:即:只要保证第只要保证第i个单元的入样概率是其相对规模度量的个单元的入样概率是其相对规模度量的n倍倍, 则在不放回的情形下,这一抽样就是一个与单元大小成比例的则在不放回的情形下,这一抽样就是一个与单元大小成比例的不等概率抽样。不等概率抽样。
19、 称这种不放回的与单元大小成比例的概率抽样为称这种不放回的与单元大小成比例的概率抽样为psps抽样抽样第七章不等概率抽样23二、二、ps抽样的估计抽样的估计 对于不放回不等概率抽样,对于总体总量,霍维茨汤普森对于不放回不等概率抽样,对于总体总量,霍维茨汤普森(horvitzthompson)提出如下估计量:)提出如下估计量:1nihtiiyy 特别地,对于特别地,对于psps抽样:抽样:iinz 有:有:0111nniihtiiiiymyynznm 这里这里yi不可重复不可重复第七章不等概率抽样24 估计量的性质估计量的性质 霍维茨汤普森估计量是总体总和的无偏估计:霍维茨汤普森估计量是总体总和
20、的无偏估计:()hte yy 霍维茨汤普森估计量的方差为:霍维茨汤普森估计量的方差为:2111()2nnnijijihtiijiij iiijv yyyy 当当n固定时,这一方差为:固定时,这一方差为:21()()()nnjihtijijij iijyyv y 第七章不等概率抽样25 霍维茨汤普森估计量方差的无偏估计为:霍维茨汤普森估计量方差的无偏估计为:22111()2nnnijijihtiijiij iiijijv yyy y 当当n固定时,有耶茨格伦迪森估计固定时,有耶茨格伦迪森估计(yatesgrundysen)也是上述方差的无偏估计:)也是上述方差的无偏估计:21()()()nnij
21、ijjiygshtij iijijyyvy 上述证明参见上述证明参见抽样调查抽样调查(倪加勋)(倪加勋)p176-177;抽样调抽样调查理论与方法查理论与方法(冯士雍)(冯士雍)p195196第七章不等概率抽样26二、二、ps抽样的实施抽样的实施 不放回不等概率抽样的实施非常复杂,严格的不放回不等概率抽样的实施非常复杂,严格的ps抽样抽样仅讨论仅讨论了了n n2 2的情形,的情形,n2n2时则多数属于非严格的时则多数属于非严格的ps抽样。抽样。 实际应用中,实际应用中,n2并不是一个十分严重的限制。事实上,并不是一个十分严重的限制。事实上, ps抽样常用于对总体分层,在每层中抽取两个样本单元的
22、情况。抽样常用于对总体分层,在每层中抽取两个样本单元的情况。 注意前述证明中已经指出,只要保证每个单元的入样概率注意前述证明中已经指出,只要保证每个单元的入样概率i与与其相对规模度量其相对规模度量zi成样本容量成样本容量n倍,则抽样属于严格的倍,则抽样属于严格的ps抽样抽样第七章不等概率抽样271、布鲁尔方法(、布鲁尔方法(brewer) 要求:要求:n2,每个单元的规模大小比例,每个单元的规模大小比例zi1/2,即总体中最大,即总体中最大的单元规模必须小于全部单元规模的的单元规模必须小于全部单元规模的1/2。 抽样方法抽样方法:(逐个抽取法):(逐个抽取法) 第一个单元按与第一个单元按与(1)12iiizzz 成比例的概率抽取成比例的概率抽取 第二个单元在剩余第二个单元在剩余n1个单元中,按与个单元中,按与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于情绪的范文
- 2023届高考化学人教版一轮复习课时作业-11.3 晶体结构与性质
- 2024年度合作经营权益共享协议
- 齐鲁工业大学《Linux编程基础》2021-2022学年期末试卷
- 二手房买卖协议格式(2024简化)
- 南京信息工程大学《中国当代文学史Ⅰ》2022-2023学年第一学期期末试卷
- 光伏投资合作框架协议书
- 2024政府指定布草清洁服务协议
- HAZOP分析培训课件:2024年实操技巧
- 2024-2025年交通运输驽驶安全及公路收费标准知识试题与答案
- 2024全新物业服务培训
- 山东省日照地区2024-2025学年八年级上学期期中考试数学试题(含答案)
- 《地产公司图纸管理办法》的通知
- 中华民族共同体概论学习通超星期末考试答案章节答案2024年
- 世界慢阻肺日
- GB/T 37356-2019色漆和清漆涂层目视评定的光照条件和方法
- GB/T 25744-2010钢件渗碳淬火回火金相检验
- 新版(七步法案例)PFMEA
- 华东师大版八年级上册12. 5 因式分解——提公因式法分解因式(16张PPT)
- [宝典]国际梅协唱议书
- 集体户口卡翻译英文版
评论
0/150
提交评论