似然比检验与分布拟合检验_第1页
似然比检验与分布拟合检验_第2页
似然比检验与分布拟合检验_第3页
似然比检验与分布拟合检验_第4页
似然比检验与分布拟合检验_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验

§7.1假设检验的根本思想与概念§7.2正态总体参数假设检验§7.3其它分布参数的假设检验§7.4似然比检验与分布拟合检验§7.5正态性检验§7.4似然比检验与分布拟合检验7.4.1似然比检验设是来自密度函数〔或分布率〕为的总体的简单样本,考虑检验问题:一个比较直观且自然方法是考虑似然比当较大时,拒绝原假设,这种检验方法称为似然比检验。例1对正态总体,方差,检验问题似然比为否那么,接受,令那么因为均且,拒绝域为的单调增函数,故由等式所以是可得。这样检验统计量可取为这是通常的单边检验。对一般的假设检验问题检验的拒绝域为定义似然比检验统计量为其中临界值可由确定。下面也通过例子说明其具体应用。似然比对正态总体,方差未知,检验问题这里当未知时,其极大似然估计分别为当时,极大似然估计为所以似然比为假设令,那么当成立时,~且是单调增函数,因此由可得临界值为这样检验统计量为拒绝域为当成立时,~且是单调增函数,因此由当然也可令,那么这是通常的双边检验。拒绝域为这样检验统计量也可以为可得临界值为可以证明这时的检验和检验是等价的。从上述两个例子可得求似然比检验的一般步骤:〔1〕在内求的极大似然估计,在内求的极大似然估计增函数时,由求临界值〔2〕计算并化简使成形式,满足两个要求,是的单调增函数或单调减函数;当成立时,的分布完全。〔3〕减函数时,由求临界值〔4〕检验统计量取为增函数时,拒绝域为减函数时,拒绝域为其一:其二:注:〔1〕正态总体下参数的检验根本都是似然比检验〔2〕似然比检验可用于检验样本来自两个不同类型分布之一,样本来自正态总体族样本来自双参数指数分布族其中如〔3〕似然比检验适应面广,〔4〕一般情形下,难获得,总体均可以构造,且构造的检验常具有一些优良性质,如在某种意义下具有最有性。因此临界值的求法有两种。其一,利用Monte-Carlo模拟计算;其二,当样本容量很大时,利用似然比统计量的极限分布近似给出。正态总体和非正态似然比统计量的精确分布很先考虑总体分布只取有限个值的情况

设总体X可以分成k类,记为

,现对该总体作了n次观测,k个类出现的频数分别为:检验如下假设:n1,…,nk,且其中诸且7.4.2分布拟合检验一总体分布离散情况

在之前的比例问题的假设检验中,对于大样本的数据1、诸pi均时

对于比例问题:P(X=1)=p,P(X=0)=1–p

假设检验:H0:p=p0;H1:p

p0。 样本统计:1的频数为k,0的频数为n–k。我们有从二项分布〔0-1数据〕的情形入手与之对应地,我们有如下等价的检验统计量注意到即也可以写成:总体分类A1(X=1)A2(X=0)合计理论频数E1=np0E2=n(1–p0)n观测频数O1=kO2=n–kn该检验的检验统计量及其分布:再考虑更一般的情形对于多项分布问题:假设检验:数据结构:总体分类A1(X=1)……Ak(X=k)合计理论频数E1=np10……Ek=npk0n观测频数O1……Osn英国统计学家K.Pearson提出如下检验统计量:在近似计算方面,尽可能要求所有观测频数Oi≥5,容许个别为3或4;否那么,对某些类进行合并。(7.4.2)并证明在H0成立时对充分大的n,(7.4.2)

给出的检验统计量近似服从自由度为k-1的分布。如果H0成立,那么对每一类Ai,其频率ni/n与概率pi应较接近。即观测频数ni与理论频数npi应相差不大。反之,假设观测频数ni与理论频数npi相差较大,那么应拒绝原假设。据此,我们可以得到如下的拒绝域形式拒绝域为:例7.4.1为募集社会福利基金,某地方政府发行福利彩票,中彩者用摇大转盘的方法确定最后中奖金额。大转盘均分为20份,其中金额为5万、10万、20万、30万、50万、100万的分别占2份、4份、6份、4份、2份、2份。假定大转盘是均匀的,那么每一点朝下是等可能的,于是摇出各个奖项的概率如下:概率0.10.20.30.20.10.1额度5万10万20万30万50万100万现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是有人疑心大转盘是不均匀的,那么该疑心是否成立呢?这就需要对转盘的均匀性作检验。解:这是一个典型的分布拟合优度检验,总体共有6类,其发生概率分别为0.1、0.2、0.3、

0.2、0.1和0.1,选用如下卡方检验统计量检验拒绝域为:这里k=6,由本例数据可以算出假设取=0.05,那么查附表3知=由于未落入拒绝域,故接受原假设,没有理由认为转盘不均匀。本例中,以T记服从

的随机变量,则使用统计软件可以算出这个p值就反映了数据与假设的分布拟合程度的上下,p值越大,拟合越好。在分布拟合检验中使用p值也是方便的。2、诸pi不完全时假设诸由r(r<k)个未知参数确定,即首先给出

的极大似然估计然后给出诸

的极大似然估计

Fisher证明了

在H0成立时近似服从自由度为k-r-1的

分布,于是检验拒绝域为例7.4.2

卢瑟福在2608个等时间间隔内观测一枚放射性物质放射的粒子数X,表7.4.1是观测结果的汇总,其中ni表示2608次观测中放射粒子数为i的次数。

ni572033835255324082731394527106i012345678910

11试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。

解:本例中,要检验总体是否服从泊松分布。

观测到0,1,…,11共12个不同取值,这相当于把总体分成k=12类。这里有一个未知参数

,采用极大似然估计,

=将

代入可以估计出诸

。选用检验统计量列表如下。012345678910115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.01207.66730.16580.12580.0158合计26081.00002068=12.8967i假设取=0.05,那么本例中

=12.8967<18.307,故接受原假设。拒绝域为使用统计软件可以计算出此处检验的p值是0.2295。

自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次,统计如下:二、连续情形的离散化我们通过一个例子来看怎么利用卡方拟合检验处理连续总体的情形例7.4.3(X表示相继两次地震间隔天数,Y表示出现的频数)试检验相继两次地震间隔天数X服从指数分布.由最大似然估计法得因X为连续型随机变量,将

X的可能取值区间分为k=9个互不重叠的子区间如下的概率密度

:0XH解:=163.5633503126171086680.27880.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.97188.32685.79964.01769.201655.351927.013227.327016.79808.35307.68606.207314.826913.2192例3的拟合检验计算表在H0

为真的前提下,X

的分布函数的估计为故在水平0.05下接受H0,认为样本服从指数分布.有估计概率)(

iiAPp=Kolmogorov的D检验当我们需要检验一组观测值是否来自某一总体时,我们常采用所谓kolmogorov的D检验法。假设检验:这里为一事先给定的完全已知的连续分布函数检验统计量:1933年kolmogorov证明了当成立时,有该极限与无关。该检验方法与连续情形的卡方检验方法相比要好,灵敏度较高。该检验方法只适用于总体理论分布完全已知的情形若总体理论分布含有未知参数,即为的情形,虽然我们也可以采用的估计量类似于前面作替换,但此时的kolmogorov的检验方法就不如卡方拟合检验了。列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。例如,对随机抽取的1000人按性别〔男或女〕及色觉(正常或色盲)两个属性分类,得到如下二维列联表,又称2×2表或四格表。7.4.2

列联表的独立性检验男53565女38218性别视觉正常色盲一般,若总体中的个体可按两个属性A与B分类,A有r个类,B有c个类从总体中抽取大小为n的样本,设其中有个个体既属于类又属于类,称为频数,将r

c个排列为一个r行c列的二维列联表,简称r

c表(表7.4.3)。表7.4.3r

c列联表列联表分析的基本问题是:考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在r

c表中,若以

分别表示总体中的个体仅属于

,仅属于

和同时属于

的概率,可得一个二维离散分布表(表7.4.4),则“A、B两属性独立”的假设可以表述为表7.4.4

二维离散分布表这就变为上一小节中诸

不完全已知时的分布拟合检验。这里诸

共有rc个参数,在原假设H0成立时,这rc个参数

由r+c个参数

决定。在这r+c后个参数中存在两个约束条件:

所以,此时

实际上由r+c-2个独立参数所确定。据此,检验统计量为

在H0成立时,上式服从自由度为rc-(r+c-2)-1的

分布。其中诸

是在H0成立下得到的

的极大似然估计,其表达式为

对给定的显著性水平

,检验的拒绝域为:例7.4.3为研究儿童智力开展与营养的关系,某研究机构调查了1436名儿童,得到如表7.4.5的数据,试在显著性水平0.05下判断智力开展与营养有无关系。表7.4.5儿童智力与营养的调查数据营养良好营

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论