平衡半样本法_第1页
平衡半样本法_第2页
平衡半样本法_第3页
平衡半样本法_第4页
平衡半样本法_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复杂样本的方差估计——平衡半样本法平衡半样本法在实际抽样调查中,为了提高效率,常采用每层只抽两个单元的分层抽样。这时如果要采用前面介绍的随机组方差估计,则因为仅仅只有两个没有共同单元的随机组,将使得方差估计不够稳定。也就是说,由于这两个随机组的取法的偶然性,将会使得方差的估计值起伏比较大。本节将介绍解决这个问题的平衡半样本方法(balancedhalf-samplemethod)。半样本假设对总体

,采用分层随机抽样,每层有放回地简单随机抽取2个单元,设yh1和yh2是第h层的样本观测值(h=1,2,...,L),则总体均值

的无偏估计为:式中,

为层权;的方差

的标准估计量为:式中,使用随机组方法,因每层只抽取2个单元,所以只有2个独立的随机组(y11,y21,…,yt-1)和(y12,y22,…,yt-2)。此

时的随机组估计为:式中,这个估计量计算简单。但由于仅有一个自由度,其稳定性比标准估计量

差。为了既保留随机组估计

的简单性,又能保持标准估计量

的稳定性,我们引入半样本方法,即从每层抽取一个单元形成半样本,总共可能出现

个半样本。由于不同半样本中包含某些共同的单元,所以半样本之间是彼此相关的。在这一点上,半样本方法与随机组方法存在本质上的不同。平衡半样本估计个统计量

的平均,即

的无偏估计。然而,当层数L较大时,这个估计量的计算是不可行的。为了简化计算,一个很自然的想法是选择一个小的半样本子集,希望这个半样本子集尽量保留所有的信息,这样即可达到简化计算的目的,又能保证足够的精度。假设这个半样本子集包含k个半样本,可以推算出下式:因此,如果所选择的k个半样本对所有

(=1,2,…,L)都满足以下条件:那么,

就正好等于

因此,我们说这k个半样本完全保留了

个半样本所包含的关于

的信息。满足条件式的k组半样本成为平衡半样本。(1)如何确定平衡半样本呢?PlackettandBurman(1946)给出了k*k阶政教矩阵(k为4的倍数,为Hadamard矩阵)的方法。下表给出了4*4阶矩阵,其中列表示层,行表示半样本;在a行第h列的位置+1表示层h的第一个单元被选入第a个半样本,-1表示层h的第二个单元被选入第a个半样本。按这种方式定义的半样本即为平衡半样本。完全正交平衡半样本:k的选择应该是大于L的4的最小整数倍半样本层12341+1+1+1-12-1+1-1-13-1-1+1-14+1-1-1-1表具有以下性质,即除了最后一列外,每列之和均为零。也就是说,当L<k时(k=4or8),有对一般的k的情形也是如此,即用PlackettandBurman方法构造的正交矩阵在L<k时都满足上式。因此在k>L的条件下,我们有从而(2)这与将所有的

进行平均所得的结果完全一样。我们称同时满足式(1)和式(2)两个条件的半样本为完全正交平衡(fullorthogonalbalance)半样本。

在复杂分层抽样方案中,层数L经常很大,即使平衡半样本方法已经减少了半样本数,但由于k大于等于L的要求,所需计算量仍然庞大。这时可以设计k组部分平衡半样本,具体方法如下。假设有L层,采用k组半样本,k<L。假设L可以被k整除,L/k=G,于是L层可分为G群。为叙述方便,假设L=4,按照平衡半样本方法,必须k>=4。但这里我们取k=2,则4层分为2群,对包含第1层和第2层的第一群利用2阶Hadamard矩阵构造正交列,对包含第三层和第四层的第二群用同样方法,见下表。部分平衡半样本部分平衡半样本

半样本层12341+1+1+1+12+1-1+1-1部分平衡半样本的方差估计量虽然不如完全平衡半样本精确,但也是无偏的。BRR用于多阶段分层抽样

假设总体分为H个层,并且从每层中有放回的以不等概率抽取两个初级抽样单元。利用向量

定义半样本r:如果

则所有在该层的初级抽样单元1的观测值属于半样本r;如果

则所有在该层的初级抽样单元2的观测值属于半样本r。对于半样本r创造一个新的权重列向量:

现在使用

代替w求半样本r的估计量。对于全样本,总体总量y的估计为;对于半样本r,总体总量y的估计量为

如果,则,并且有

。由所学知识我们知道可以使用权重计算经验分布函数,这里我们使用半样本计算经验分布函数。

如果

是总体中位数,则

可能定义为当

时y的最小值,这时

可能定义为当

时y的最小值。

对于任意统计量,我们定义

BBR也能够用于估计统计量的协方差:如果

是目标量,则

BRR用于非线性估计对于非线性估计量,一般和是不等的,但多数调查实践中两者非常接近

优点:对于总体总量和分位数的平滑函数的方差估计,BRR给出的方差估计近似等于由线性化方法得到的方差估计。与刀切法和自助法相比,BRR的计算量更少。缺点:正如前面所定义的一样,BRR要求每层只有两个初级抽样单元的设计。实际上,其经常通过使用更复杂的平衡项扩展到其他抽样设计中。当每层总体数和各层基本抽样单元数较小时,BRR在有放回抽样情况下所得到的方差估计和刀切法、自助法一样偏大。例题:拒答率调查为研究被调查者拒答情况,实施一项调查。抽样方式为分层随机抽样,从三个城区中各自随机抽取两个居委会,假设各层权重相同,调查结果见下表。试利用平衡半样本法估计拒答率

的方差。城区居委会(s1)居委会(s2)拒答户数(y1)合格调查户数(x1)拒答户数(y2)合格调查户数(x2)141150371492401493014833814538150总计119444105447解:由于各权重相同,拒答率的估计为:用完全平衡半样本法估计拒答率

的方差,抽取层数L=3,因为要求

,因此取k=4,平衡比一般的确定见表2.取各区第一个居委会形成第一个半样本,该半样本基期余集的拒答率的估计为:取第一区的第二个居委会,第二区的第一个居委会以及第三区的第二个居委会形成第二个半样本,该半样本及其余集的拒答率的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论