




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、政府抽样改革的新亮点政府抽样改革的新亮点永久随机数法抽样技术永久随机数法抽样技术山东经济学院 栾文英引 言 毋庸置疑,抽样调查在政府统计中占有举足轻重的地位。我国政府统计部门正是充分意识到这一点,才对政府抽样调查制度的改革予以充分的重视。近年来,我国政府抽样调查得到了突飞猛进的发展,其中标志之一,便是在调查体系中引入了永久随机数法抽样技术。 永久随机数法(Permanent Random Numbers,简写PRNs)抽样技术近年来在各国调查实践中有着广泛的应用,主要集中在农业、能源、商业、价格指数调查等方面。我国在规模以下工业抽样调查、农村抽样调查等等抽样调查领域也开始引入该抽样技术,这为抽
2、样调查中的与规模成比例的不等概率调查问题、多目标调查问题、多层次调查问题、样本轮换问题等的解决奠定了基础。 第1节 永久随机数法抽样技术的基本抽样方法第2节 多目标与规模成比例抽样方法研究第3节 永久随机数法抽样技术的多层次调查问题研究第4节 永久随机数法样本轮换问题研究一、永久随机数法抽样技术简介1. 永久随机数法抽样技术: 抽样框的每个单元都被赋予从区间0,1产生的随机数,并保留下来,不再改变。随机数具有某一特征的单元将入样。因为随机数被保存下来,因此称为永久随机数(PRNs),记作ri。2. 作用 永久随机数法抽样技术强调调查单元与永久随机数的唯一确定性,因此可以有效的控制相似或重叠调查
3、总体的样本重叠率。 第第1节节 永久随机数法抽样技术的基本抽样方法永久随机数法抽样技术的基本抽样方法二、等概率永久随机数法抽样技术二、等概率永久随机数法抽样技术1. 序贯简单随机抽样方法(序贯srswor) 将抽样框中的所有调查单元按永久随机数排序,抽取永久随机数最小的个单元构成样本(假定样本量为n)。Ohlsson(1995)曾详细证明这一过程是随机抽样。基本操作如图1所示。 0 1 样本 图1 序贯简单随机抽样的基本原理序贯简单随机抽样的基本原理 更一般的,抽样起点可以是0,1区间的任何一点a,按顺序向右抽取n个单元构成样本,如图2所示。当抽样的起点右边的单元不足以构成样本时,需要从0处开
4、始继续抽取单元以补足样本。 0 1 a 样本 0 1 a 样本图2 从任意起点抽取样本 序贯srswor抽样方法评价:(1)操作简单;(2)有确定的样本量;(3)需要对总体进行排序,工作量大。2. Bernoulli抽样方法 Bernoulli抽样方法是抽取永久随机数小于抽样比的单元构成样本,即如果rif,则单元i入样。如果将所有单元的入样概率都看作是抽样比的话,Bernoulli抽样实际上是Poisson抽样的等概率特例。 Bernoulli抽样原理见图3。 0 f 1 样本图3 Bernoulli抽样的原理序贯srswor与Bernoulli抽样的比较 0 f 1 Bernoulli 抽样
5、 序贯srswor图4 Bernoulli抽样和序贯srswor抽样 Bernoulli抽样方法评价:(1)操作简单;(2)随机样本量样本量;(3)不需要对总体进行排序,工作量小。三、不等概率抽样技术三、不等概率抽样技术1. Poisson抽样方法. (1)基本原理令pi为相对规模,即单元i的规模占总体规模总量的比重。如果 (1.1)则抽样过程是严格的与规模成比例的概率抽样。Poisson抽样是抽取满足 的单元,如图5所示。 1 0 1 r 图5 Poisson抽样的基本原理iinpsi)Pr(iir(2) 一般形式对于每个单元i,在0,1选择一个起点,当且仅当 (1.2)时,单元入样。当 时
6、,进行循环调整,即抽取满足 或者 的单元。写成区间的形式,即抽取 。于是Poisson抽样能有效地实现与规模成比例不等概率抽样。(3)Poisson抽样的特例:Bernoulli抽样Bernoulli抽样是Poisson抽样的等概率抽样的特例,即总体中所有的单元都赋予相同的入样概率 (1.3)iiara1ia1ira10iiar),iiaarNnfi(4)Poisson 抽样的估计方法。1)对于总体总量指标Y采用HT估计量进行估计 (1.4)可以证明该估计量是Y的无偏估计量,估计量方差 (1.5)2)比估计量 (1.6)估计量方差 (1.7)siiiHTpynY1NiiiiiHTppynpnY
7、Var12)(1 (1)(siiiRpymY1NiiiiiRpYpynpnYVar12)(1 (1)((5)Poisson抽样方法的特点1)Poisson抽样方法的优点主要表现在四个方面:第一, Poisson抽样是与规模成比例不等概率抽样。第二,Poisson 抽样既可以看作是不放回的与规模成比例的不等概率抽样,即 抽样,也可以看作是不放回的与规模成比例的不等概率抽样,即PPS抽样。第三,Poisson抽样非常适合用于需要样本兼容的调查。第四,Poisson抽样可以有效实现多目标调查奠定了基础。2)Poisson抽样的弱点主要表现在以下两个方面。第一,Poisson抽样实现的样本量是随机样本
8、量。因此实施Poisson抽样的条件是取得空样本的概率可以忽略。取得空样本的概率第二,Poisson抽样忽略了规模小的单元,尤其是在高度偏斜的总体中,规模小的单元很难进入样本。psNiNiNnnpm)1 ()1 ()0Pr(12. 序贯Poisson抽样方法(1)序贯Poisson抽样的基本原理1)构造排序变量 (1.8)2)将抽样框中所有的单元按照 进行排序,抽取最初的n个单元构成的样本,该抽样方法被称作序贯Poisson抽样。Poisson 抽样与序贯Poisson 抽样原理的比较如图6、7所示。 0 n 图6 使用排序变量进行Poisson抽样 0 图7 序贯Poisson抽样的原理ii
9、ipri(2)序贯Poisson抽样的特点1)序贯Poisson抽样是有固定样本量的、近似的与规模成比例的不等概率抽样方法;2)序贯Poisson抽样过程中可以顺序消除目标总体外单元。3. 永久随机数法抽样技术的新发展PoMix抽样方法(1)PoMix抽样方法的基本原理1)定义并计算PoMix抽样的入样概率: (1.9)其中B为Bernoulli宽度( ), 。2)根据Poisson抽样的规则,如果 ,则单元入样。抽样原理见图8。由图8不难看出,当 时,单元全部入样;当 时,满足 的单元入样。 A 1 0 B 1 r图8 PoMix抽样方法的基本原理iiAQBSi)1 ()Pr(fBoiinp
10、A iiiAQBr)1 ( Bri1irBQBrAii13)将(9)式的入样概率进行线性转化,不难得到 (10)由(10)式不难看出,1)PoMix抽样的入样概率是Bernoulli抽样和Poisson抽样的入样概率的线性组合,PoMix抽样因此而得名;2)Poisson 抽样和Bernoulli抽样分别可以看作是PoMix抽样的特例。iiAQQf)1 ( (2)PoMix抽样的特点1)PoMix抽样兼顾了Bernoulli抽样和Poisson抽样的特征,相对提高了规模很小的单元的入样的可能性,相对降低了规模很大的单元的入样的可能性,因此更适用于高度偏斜总体的调查;2)由于入样概率的设定,Po
11、Mix抽样不再是严格的与规模成比例的不等概率抽样;3)PoMix抽样有利于改进估计量;4)PoMix抽样不影响Poisson抽样的优势的发挥。第第2节节 多目标与规模成比例概率抽样方法研究多目标与规模成比例概率抽样方法研究一、多目标调查的意义和当前主要成果1. 意义(1)多目标调查是统计认识社会经济现象的数量表现和规律要求;(2)多目标调查是提高统计调查经济效益的要求;(3)多目标调查是提高统计调查时效性的要求。2. 主要成果(1)多目标分层抽样法。(2)多目标平衡抽样方法。(3)多目标双重抽样方法。(4)多目标调查在估计方法的成果。(5)多目标调查的抽样技术的其他成果。三、与MBS抽样方法相
12、结合的Poisson抽样 当前关于多目标调查的绝大多数研究成果主要集中在等概率抽样中。随着抽样调查的不断发展以及应用领域的不断拓宽,调查单元的规模有较大差异或者调查单元在总体中所占的地位不一致的情况经常存在,简单的等概率抽样越来越不能满足调查的要求,美国农业部农业统计署(NASS)的专家Jeffrey T.Bailey 和Phillip Kott (1997)年首先提出多变量与规模成比例的不等概率抽样方法,在国内通常称其为MPPS抽样。MPPS抽样是与Poisson抽样相结合的MBS抽样方法,即采用MBS方法确定单元的入样概率,之后采用Poisson抽样抽取样本。 1. MPPS抽样过程 (1
13、)给调查单元赋予永久随机数。 永久随机数法抽样技术强调永久随机数的唯一确定性,在同一次调查中,同一调查单元只能有唯一的永久随机数,尤其是在经常性调查中,如我国的规模以下工业企业调查、农村抽样调查等,永久随机数与调查单元有终生唯一确定性。这一特点对于实现多目标抽样、多层次调查以及样本轮换有重要意义。(2)计算调查单元的入样概率MPPS抽样采用MBS抽样的方法确定入样概率: (2.1) 取3/4次幂是因为通常抽样框资料用的是上一年度的相关数据,这种处理的目的是不希望多目标中某个指标规模大的单元有过大的入样概率,这样在“取大取小”的过程中可以减少这种大规模单元抽中的概率。 如果多目标中单元最大的入样
14、概率大于1,则取其入样概率为1,此时该单元为必选单元,或者称为规模单元。,max, 1min43434314311UiMiMMUiiixxnxxn(3)抽选样本 MPPS抽样是采用Poisson抽样的方法抽取样本,即抽取永久随机数小于入样概率的单元构成样本。 因为MPPS抽样具有Poisson抽样可以选择随机起点的特征,MPPS抽样也可以方便的实现样本轮换和有效的实现多层次调查。(4)MPPS抽样的估计方法 MPPS抽样是在Poisson抽样的基础上发展而来的,由于其入样概率的选取的需要兼顾多个调查目标,不再与单个调查变量的规模严格成比例,因此MPPS抽样不再是严格的Poisson抽样,如果对
15、MPPS抽样的样本采用的Horvitz-Thompson估计量,则该估计量不再是无偏估计量。 为了减小对总体估计的偏倚,可以考虑采取辅助变量修正估计量 (2.2)niiminiimiNjmjmyxxY111总体总量估计值的方差如下: (2.3)nimiiiniimiNjmjmyxxYv1222121)1 ()(2. MPPS抽样方法的优点(1)MPPS抽样采用MBS方法确定调查单元的入样概率,兼顾了多个调查主题;(2) MPPS抽样采用Poisson抽样的方法抽取样本,体现了与规模成比例的思想;(3)MPPS抽样可以找到与之相适应的估计方法,如广义线性回归估计量、校准估计量、弃一组Jackkn
16、ife方差估计量等。3. MPPS抽样的弱点及改进思路(1)由于MPPS抽样的入样概率的选取的需要兼顾多个主题,不再与单个主体的规模严格成比例关系,即最终确定的单元的入样概率 ,于是 不再严格成立, 不再是期望样本量。因此MPPS概率抽样不再是严格的Poisson抽样,这里采用的Horvitz-Thompson估计量不再是无偏估计量。Ugimgimmixxn), 1(MmnmUimn改进思路:进一步调整调查单元的入样概率,使所有单元的入样概率之和为期望样本量n。令 (2.3)进一步调整调查单元的入样概率(2.4)则 (2.5)此时在采用HT估计量将是无偏估计量。), 1)(max(MmnmmU
17、iiimnnmmnmnmnUiUiui(2)MPPS抽样既是Poisson抽样的拓展,那么就不能克服Poisson抽样自身的缺点,即样本量是以期望样本量为期望的随机变量,也就是说MPPS抽样也有抽到空样本的可能性。改进思路:引入序贯抽样的思想,使样本量确定下来。第3节 永久随机数法抽样技术的多层次调查问题研究 为了满足本级管理的需要,国家、省、地、县、乡镇各级分别要搜集信息,而抽样调查是搜集信息的主要渠道之一。如果各级分别独立进行抽样调查,那么统计调查部门的工作量将非常庞大,相应的调查成本很高而工作效率很很低。因此在多层次调查中如何尽可能多地实现样本的兼容,满足分级管理的需要是近年来抽样专家普
18、遍关注的问题。这里提到的样本兼容,是指尽可能的使上一级的样本单元包含在下一级样本中,如使省级的样本单元包含在地级样本中,地级样本单元包含在县级样本中(这里仅以省级与地级为例进行说明,其他上下级样本兼容的处理方法相同)。一、研究现状当前实现样本兼容的思路主要有两种。1采用自下而上的思路,即市级先抽样本,在市级抽中的样本单元中抽取省级样本单元。当前采用这种思路的主要方法是县县抽样和ABC三级一套样本设计。自下而上的抽样思路主要有如下弱点。第一,由于所有的县都进行抽样,所需的调查经费非常庞大,这有悖于抽样调查的经济性的优势。第二,由于抽样调查涉及到所有的县,因此抽样调查和估计推断的结果直接受到所有县
19、的制约,这有悖于抽样调查时效性的优势。第三,由于抽样调查涉及到所有的县,而各个县的调查和估计很难统一,抽样调查准确性难以得到保证。2采用自上而下,即使上一级的样本单元分布在下一级样本中,下一级的样本是上一级样本单元的基础上适当追加单元,以构成本级调查所需的样本。当前采用这种思路的是由冯士雍(2001)提出的样本追加策略。样本追加策略的优势主要表现在三个方面。第一,样本追加策略很好的实现了多级样本兼容。第二,样本追加策略有很好的灵活性,避免了自下而上的调查思路中所有的县都进行抽样的要求,只要求有估计需求的地区追加样本。第三,利用样本追加策略,可以监测和提高上级目标量的估计精度。样本追加策略的技术
20、难点在于如何使追加的样本单元的数量和分布更好的满足本级管理的需要,如何进行目标量估计以及如何测定精度等等。二、应用序贯简单随机抽样实现多层次调查二、应用序贯简单随机抽样实现多层次调查 序贯srswor是指抽取抽样框中永久随机数最小的n个单元构成样本。在我国的多层次调查中,如果上下两级调查都采用序贯srswor的方法抽取样本,只要上一级调查分配在下一级调查中的样本量小于下一级调查为了满足本级管理需要而确定的样本量,那么上一级样本单元将完全落入到下一级样本中。 我们以省级样本为上一级样本,以市级样本为下一级样本进行说明。 假定某省共有三个市,A、B、C,A共有14个调查单元,B共有20个调查单元,
21、C共有16个调查单元。给所有的调查单元赋予永久随机数,并将永久随机数按大小排队,如表3.1所示。 如果各市抽取30%的单元构成样本,则A市应抽取前5个单元;B市应抽取前6个单元;C市应抽取前5个单元,如红字所示。省级样本单元全部省级抽取永久随机数最小的10个单元构成省级样本,如斜体并下划线所示。 由表3.1不难看出,省样本落入市级分别是A市的前2个单元;B市的前5个单元;C市前3个单元,如阴影所示。于是,省级的样本完全落入世纪样本中。表3.1 应用序贯srswor实现多层次调查的样本兼容 12345678910A0.4630.5010.5140.5580.6420.6440.7870.8470
22、.873B0.3060.4430.5740.580.6150.6840.7170.7240.7550.790.8220.8450.9050.973C0.2880.3490.3540.4280.4790.6690.670.7470.7690.9130.929所有单元0.2140.2250.2520.2650.2880.3060.3460.3490.3540.40.4280.4430.4630.4790.5010.5140.5580.5740.580.6150.6420.6440.6690.670.6840.7170.7240.7470.7550.7690.7870.790.8220.8450.8
23、470.8730.9050.9130.9290.973四、 永久随机数法抽样技术实现多层次调查方法述评1采用永久随机数法抽样技术实现多层次调查,加强了各层次样本的随机性;2永久随机数法抽样技术的多种抽样方法都可以实现多层次调查的样本兼容;3科学性强,有完善的理论背景;4采用自上而下的设计思路;5操作简便,上下级调查统一。第4节 永久随机数法样本轮换问题研究 对于经常性的抽样调查(如我国的城市住户调查、农村抽样调查、全国的电视收视率调查、规模以下工业抽样调查等),样本的合理更新是保证调查效率、提高估计精度的重要问题,样本轮换是样本更新最为合理的方法,它是指在定期抽样调查中,将上期样本的一部分单位
24、抛除,同时用过去未被抽中的一部分单位代替它们,与上期样本中保留下来的单位拼配成现期样本进行调查估计。样本轮换可以解决固定样本容易产生的“老化”问题,同时兼顾调查资料的连续性和可比性。 一、等概率抽样中的样本轮换 对于等概率抽样,Brewer et al.(1972)给出了利用PRNs进行样本轮换的常数平移法,只要在抽样的过程中将起点和终点移动一个特定距离即可。要注意的是,对同一项调查,年度间平移的距离必需为一个常数,否则会破坏样本轮换的一致性。 表4.1 序贯简单随机抽样的样本轮换样本单位12345678910永久随机数0.040.090.140.190.240.290.340.390.440.49第一年第二年第三年样本单位111213141
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宅基地水沟协议书(2篇)
- 电力合同三方协议模板
- 独门商铺出租合同协议
- 电商供货公司合同协议
- 皮具商务合同协议版
- 珠宝精修外包合同协议
- 电焊机采购合同协议
- 甲方围挡采购合同协议
- 电厂啤酒配送合同协议
- 番茄达人中心申请入驻合同协议
- 预防狂犬病病知识
- 2025年初中语文名著阅读《林海雪原》知识点总结及练习
- 西部计划考试考题及答案
- 教师专业发展制度教师专业发展的保障制度
- 学校德育管理体系
- XX文化产业投资公司二零二五年度股东退股及文化创意协议
- 青年博物馆文创产品消费研究:一个社会实践分析视角
- 2025版学校学生食堂餐具清洗消毒服务合同2篇
- 跟着电影去旅游知到智慧树章节测试课后答案2024年秋山东大学(威海)
- 《有机硅乳液防水剂》文本及编制说明
- 学校基金会的资金筹集与运用策略
评论
0/150
提交评论