非参数假设检验_第1页
非参数假设检验_第2页
非参数假设检验_第3页
非参数假设检验_第4页
非参数假设检验_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上 非参数假设检验上节讨论了母体分布类型为已知时的参数假设检验问题.一般在进行参数假设检验之前,需要对母体的分布进行推断.本节将讨论母体分布的假设检验问题.因为所用的方法适用于任何分布或者仅有微弱假定分布,实质上是不依赖于分布的.在数理统计学中不依赖于分布的统计方法统称为非参数统计方法.这里所讨论的问题就是非参数假设检验问题.这里所研究的检验是如何用子样去似全母体分布,所以又称为分布拟合扰度检验,一般有两种:一是拟合母体的分布函数;另一是拟合母体分布的概率函数.这里我们只介绍三种检验方法:概率图纸法. -拟合优度检验和柯尔莫哥洛夫斯米尔诺夫检验.一, 概率图纸法这是一种

2、比较直观和简便的检验方法.它适合于在现场使用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布和威布尔分布概率图纸等.这里我们只介绍正态概率图纸,关于其它分布的概率图纸的构造原理和使用方法都是类似的1. 正态概率图纸的构造原理设母体有分布函数F(x),N(,)表示正态分布族.需要检验假设这里和均为未知常数.在原假设为真时,通过中心化变换即服从正态N(0,1).函数u(x)是x的线性函数. (7.13)在(x,u(x)直角坐标平面上是一条直线.这条直线过(,0),且斜率为.2. 检验步骤.事实上,我们知道的不是母体取出的一组子样观察值由格里汶科定理知道子样的经验分布函数依概率收剑于母体分布

3、函数F(x).所以在检验母分体布函数F(x)是否属于正态分布族时,我们以大子样的经验分布函数作为母体分布的近似.若:F(x) N(,)为真,那末点在正态概率图纸上应该在一条直线上.所以根据上述经验分布函数是母体分布函数F(x)很好的近似,点在正态概率图纸上也应该近似地在一条直线附近.倘若点列不是近似地在一条直线附近,那末只能说明F(x)不属于正态分布族.根据上述想法,用正态概率图纸去检验假设的具体步骤如下.(1) 整理数据(2) 描点(3) 目测这些点的位置,3. 未知参数与的估计.若通过概率图纸检验已经知道母体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点的一条直线l,因为服从正态N(

4、0,1),所以当,即x=时对应的概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线.这条直线与直线l的交点的横坐标就可以作为参数为的估计.又由(x)=1时所对应的概率F=0.8413的水平直线,这条直线与直线l的交点的横坐标为.这个显然满足即因此可以用差估计.例 7.8 (略)见P338二, 的似体检验法前面介绍了直观而简便的概率图纸法,它不需要很多计算就能对母体分布族作出一个统计推断,并且还能对分布所含的参数作出估计.但是这种方法因人而异,且精度不高,又不能控制犯错误的概率.这里介绍-拟合检验法,它能够像各种显著性检验一样控制犯第一类错误的概率.设母体的分布函数为具有明确表达式

5、的F(x),.我们把随机变量的值域R分成k个互不相容的区间这些区间不一定有相同的长度.设是容量为n的子样的一组观测值.为子样观测值中落入的频数.在这n次事件出现的频率为.我们现在检验原假设.设在原假设成立下,母体落入区间的概率为,即 (7.14)此时n个观察值中,恰有个值落入内,的观察值落入内,个观察值落入内的概率为这是一个多项分布.按大数定理,在为真时,频率与概率的差异不应太大.根据这个思想构造一个统计量= (7.15)称做-统计量.往后可以看到,用表示这一统计量不是没有原因的.因为它的极限分布就是自由度为k-1的-分布.为了能够把-统计量用来作检验的统计量,我们必须知道它的抽样分布.我们先

6、k=2的简单情形.在成立下,其中这时,频数我们考察 (7.16)令 (7.17)显然 (7.18)由此可见与不是线性独立,且.于是 (7.19)根据德莫弗-拉普拉斯极限定理,当n充分大时,随机变量的分布是接近于正态的,从而推得k=2情形的分布,当n充分大时,是接近于自由度为1的-分布.对于一般情形有如下的定理.定理 7.1 当为真时,即为母体的真实概率时,由(7.15)式所定义的统计量的渐近分布是自由度为k-1的-分布,即密度函数为 (7.20)证 因为在n个观测值中恰有个观测值落入内, 的观察值落入内,个观察值落入内的概率为这里.其特征函数 (7.21)令 (7.22)于是有 (7.23)和

7、=0 (7.24)由此式看出,诸随机变量不是线性独立的.()的联合分布的特征函数具有形状 (7.25)两边取对数得 (7.26)利用指数数函和对数函在处的泰勒展开:和于是当时 即 (7.26)作一正交变换: (7.27)其中应该满足和由 (7.28)得到 (7.29)由(7.26)知,当时,()的特征函数.这意味着的分布弱收剑于相互独立的正态N(0,1)分布,而依概率收剑于0.因此的渐近分布是自由度为k-1的-分布.如果原假设只确定母体分布类型,而分布中还含有未知参数则我们还不能用定理7.1来作为检验的理论依据.费歇证明了如下定理.从而解决了含未知参数情形的分布检验问题.定理 7.2 设F(x

8、; )为母体的真实分布,其中为m个未知参数.在F(x; )中用的极大似然估计代替并且以F(x; )取代(7.4)中的F(x)得到 (7.30)则将(7.30)代入(7.15)所得的统计量 (7.31)当时有自由度为k-m-1的-分布.例 7.9 (略)见P345由例子来总结一下利用-检验分布假设的步骤:(1) 把母体的值域划分为k个互不相交的区间其中可以分别取;(2) 在成立下,用极大似然估计法估计分布所含的未知参数;(3) 在成立下,计算理论概率并且算出理论频数;(4) 按照子样观察值落在区间中的个数,即实际频数和(3)中算出的理论频数,计算的值;(5) 按照所给出的显著性水平,查自由度k-

9、m-1的-分布表得,其中m是未知参数的个数;(6) 若,则拒绝原假设,若,则认为原假设成立.三 柯尔莫哥洛夫似合检验-检验-似合检验是比较子样频率与母体的概率的.尽管它对于离散型和连续型母体分布都适用.但它是依赖于区间的划分的.因为即使原假设不成立,在某种划分下还是可能有从而不影响(7.5)中的值,也就是有可能把不真的原假设接受过来.由此看到,用-检验实际上只是检验了是否为真,而并未真正地检验母体分布F(x)是否为.柯尔莫哥洛夫对连续母体的分布提出了一种方法.一般称做柯尔莫哥洛夫检验或-检验.这个检验比较子样经验分布函数和母体分布函数F(x)的.它不是在划分的区间上考虑与原假设的分布函数之间的

10、偏差.而是在每一点上考虑它们之间的偏差.这就克服了-检验的依赖于区间划分的缺点.但母体分布必须假定为连续.根据格里汶科定理,我们可以把子样经验分布函数看作实际母体分布函的缩影.如果原假设成立,它与F(x)的差距一般不应太大.由此柯尔莫哥洛夫提出一个统计量 (7.32)并且得到这统计量的精确分布和极限分布K().它们都不依赖于母体的分布.这里我们不加证明地引入柯尔莫哥洛夫定理.定理 7.3 设母体有连续分布函数F(x),从中抽取容量为n的字样,并设经验分布函数为,则 的分布函数= (7.33)其中在时有极限分布函 (7.34)在应用柯尔莫哥洛夫检验时,应该注意的是,原假设的分布的参数值原则上应是

11、已知的.但在参数为未知时,近年来有人对某些母体分布如正态分布和指数分布用下列两种方法估计.()可用另一个大容量子样来估计未知参数,(2)如果原来子样容量很大,也可用来估计未知参数.不过此-检验是近似的.在检验时以取.较大的显著性水平为宜,一般取=0.10-0.12.-检验检验母体有连续分布函数F(x)这个假设的步骤如下:(1) 从母体抽取容量为n的子样,并把子样观察值按由小到大的次序排列;才 (2) 算出经验分布函(3) 在原假设下,计算观测值处的理论分布函数F(x)的值;(4) 对每一个算出经验分布函数与理论分布函数的差的绝对值|(5) 由(4)算出统计量的值(6) 给出显著性水平,由柯尔莫哥洛夫检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论