bootstrap方法对总体均值区间估计_第1页
bootstrap方法对总体均值区间估计_第2页
bootstrap方法对总体均值区间估计_第3页
bootstrap方法对总体均值区间估计_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1统计研究的目的和意义一般来说,涉及到对总体的均值进行区间估计,通常的方法是根据抽得的样本量大小来选择合适的统计屋,进而套用相应的公式来进行区间估计。通常进行区间估计时,总是把总体假设为止态分布,在此基础上利用相关理论和统计表进行推断。Bootstrap方法是一种在抽样的统计方法,也叫做自助法。该方法只依赖于给定的观测信息,不需要其他的假设,不需要增加新的观测。它借助计算机对原始样本资料进行重复抽样以产生一系列新”的样本,可以用于研究一组数据某统计量的分布特征,特别适用于那些难以用常规方法导出的对参数的区间估计、假设检验等问题。Bootstrap方法的基本思想是:在原始数据的范围内作有放回的再

2、抽样,对参数0进行估计,样本含量仍为n,原始数据中每个观察值每次被抽到的概率相等,为1/n,所得样本为Bootstrap样本,这样重复B次,就可以得到B个Bootstrap样本,然后进行统计分析。此方法可以提高小样本下对总体均值区间估计的精度。2数据的背景和结构数据来自某厂某种灯泡的寿命,已知其服从止态分布。先从一批灯泡中随机抽取16个,测得其寿命为:1510,1450,1480,1460,1520,1480,1490,1460,1480,1510,1530,1470,1500,1520,1510,1470o数据只有16个,属于小样本。常规方法对小样本进行总体均值区间估计误差可能会比较大。常规

3、的方法可以得到区间估计的结果为(X-ta/2(16-l)s/n,x+td/2(i6-l)s/n).另外将用三种Bootstrap方法对均值进行区间估计。S.Bootstrap方法区间估计的三种类型对置信区间进行估计主要采用标准Bootstiap,百分位数Bootstrap,t百分位数Bootstrap三种方法。标准Bootstrap方法假设从服从某分布的总体X中独立随机地抽取容量为n的样本xl,x2,x3,.,xno刘原始样本就行重复的又放回抽样,共有门力个可能的Bootstrap样本。対于每一个子样本求出的均值,都是总体均值的一个估计值。同时,样本均值与总体均值的分布相同。但是实际抽取中,n

4、F个样本对计算机的运行速度是一个非常大的挑战,在实际操作中,一班B取3000即可。但是考虑到后面的方法以来bootstrap样本的近似分布要求样本量尽量大,我将在最后的模拟中取B=10000oAA令X作为X的估计值,x(D表示第I个bootstrap样本得到的均值。A15AA|BAA则工)样本方差为Var(x)=工x(-讦,bt=l5JX=1AAAA由此得到总体均值的(1,)%置信区间为:XjjxVaiTXx+UirxvaiTX).其中i-a/2是标准正态分布的l-a/2百分位数。(2)百分位数Bootstrap方法利用Bootstrap经验分布的第a/2和第1-a/2分位点是(1-a)置信水

5、平之下统计量的置信区间的上下限。具体如下:通过Bootstrap抽样,可以得到B个Bootstrap样本,将每个样本得到的样本均值按照从小到大的顺序排列,可以得到一组顺序TOC o 1-5 h zA统计量X:),则第a/2和第l-a/2分位点分别是1-a置信水平下统计量X的置信区间的上下AA限,即X:,x*3。(紳(1岭)B)(3)t百分位数Bootstrap方法是在对百分位数Bootstrap方法进行改进得到的。通常此方法比百分位数bootstrap方法得到更精确的置信区间。进行bootstrap抽样,针对每个bootstrap样本计算t统计量:TOC o 1-5 h zAAXg)-XJ问(

6、X)将结果从小到大排列,得到顺序统计量t:),当显著性水平为a时,第a/2和第1-a/2分位点分别为t:和t*.G可(1气)可A匚At*,厂则总体均值的置信区间为:X-勺可*庐而,X-心飞句*Jgr(x)。4模拟试验研究(1)使用常规方法,按照公式(X_td/2(6_i)s/n,x+切2(i&i)s/n)得到总体均值的置信区间为1477,1503,区间长度为26(2)使用标准bootstrap方法,该方法思路很清晰,可以使用matlab实现,取a=0.05,程序如下:functionyl,y2=bfunl(x,b)fori=lbfor尸k=randint(l丄16),xl(j)=x(k),en

7、dx2(i)=mean(xl),endx0=mean(x2),fori=l:bendp=sqit(sum(a)/(b-1),yl=x0-1.96*p,y2=xO+1.96*p,令抽样进行一万次,输入命令y1,y2=bfunl(x,10000),得到结果为:1476.3,1503.7,区间长度为264,较普通方法相比,精度没有提高。使用百分位数bootstrap方法,matlab程序如下:functionyl,y2=bfun2(x,b)fori=l:bforj=l:12k=randint(l,1,1,16),xlQK(k);endx2(i)=mean(xl),endx3=soit(x2),yl=

8、x3(0.025*b);y2=x3(0.975*b);运行一万次,输入命令yl,y2=bftin2(x,10000),得到结果为14767,1503.3,区间长度为26.6,相比以上两种方法,区间长度没有缩短反而稍微更长。使用t百分位数bootstrap方法,matlab程序如下:functionyl,y2=bfun3(x,b)fori=l:bforj=l:12k=randint(l,1,1,16),xlQK(k);endx2(i)=mean(xl),endx0=mean(x2),fori=l:bendp=sqit(sum(a)/(b-1),fori=l:bt(i(x2(i)-x0)/p,endq=soit(t),yl=x0-q(0O25*b)*pfy2=x0-q(0.975*b)*p;输入命令yl,y2=bfun3(x,10000),1到结呆为:14768,15035,区间长度为267.由此观之,最后一种优化过的bootstrap方法对区间估计的精度没有任何提高,反而精度有下降的趋势。反思:经过模拟试验,得到的结果不是文章中表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论