第7章假设检验(数应)_第1页
第7章假设检验(数应)_第2页
第7章假设检验(数应)_第3页
第7章假设检验(数应)_第4页
第7章假设检验(数应)_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验假设检验的基本思想和概念参数假设检验正态母体参数的置信区间非参数假设检验了解检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两种错误。了解单个与两个正态总体的均值与方差的假设检验了解总体分布假设的检验法,-检验法,-检验法学习目的重点假设检验的基本步骤,检验法单个正态总体的均值与方差的假设检验难点非参数的假设检验正态母体总数的置信区间。柯尔莫歌洛夫拟合检验假设检验参数假设检验总体分布已知,检验关于未知参数的某个假设非参数假设检验总体分布未知时的假设检验问题这类问题称作假设检验问题.在本讲中,我们将讨论不同于参数估计的另一类重要的统计推断问题.这就是根据样本的信息检验关于总体的某个假设是否正确.把每一罐都打开倒入量杯,看看容量是否合于标准.这样做显然不行!生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?例1罐装可乐的容量按标准应在350毫升和360毫升之间.7.1假设检验的基本思想和概念如每隔1小时,抽查5罐,得5个容量的值x1,…,x5,根据这些值来判断生产是否正常.每隔一定时间,抽查若干罐.如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.通常的办法是进行抽样检查.很明显,不能由5罐容量的数据,在把握不大的情况下就判断生产不正常,因为停产的损失是很大的.当然也不能总认为正常,有了问题不能及时发现,这也要造成损失.如何处理这两者的关系,假设检验面对的就是这种矛盾.在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动.这些因素中没有哪一个占有特殊重要的地位.因此,根据中心极限定理,假定每罐容量服从正态分布是合理的.罐装可乐的容量按标准应在350毫升和360毫升之间.称H0为原假设(或零假设,解消假设);称H1为备选假设(或对立假设).在实际工作中,往往把不轻易否定的命题作为原假设.它的对立假设是:H1:这样,我们可以认为

是取自正态总体的样本,当生产比较稳定时,是一个常数.现在要检验的假设是:较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?那么,如何判断原假设H0是否成立呢?由于是正态分布的期望值,它的估计量是样本均值,因此可以根据与的差距来判断H0是否成立.较小时,可以认为H0是成立的;当生产已不正常.当较大时,应认为H0不成立,即问题归结为对差异作定量的分析,以确定其性质.差异可能是由抽样的随机性引起的,称为“抽样误差”或随机误差.这种误差反映偶然、非本质的因素所引起的随机波动.然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了.必须认为这个差异反映了事物的本质差别,即反映了生产已不正常.这种差异称作“系统误差”.问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?即差异是“抽样误差”还是“系统误差”所引起的?这里需要给出一个量的界限.问题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验中基本上不会发生.小概率事件在一次试验中基本上不会发生.下面我们用一例说明这个原则.这里有两个盒子,各装有100个球.99个白球一个红球…99个…99个99个红球一个白球现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?小概率事件在一次试验中基本上不会发生.现在我们从中随机摸出一个球,发现是此时你如何判断这个假设是否成立呢?小概率事件在一次试验中基本上不会发生.我们不妨先假设:这个盒子里有99个白球.…99个假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.这个例子中所使用的推理方法,可以称为小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.带概率性质的反证法不妨称为概率反证法.小概率事件在一次试验中基本上不会发生.…99个概率反证法它不同于一般的反证法概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设.一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设.现在回到我们前面罐装可乐的例中:在提出原假设H0后,如何作出接受和拒绝H0的结论呢?在假设检验中,我们称这个小概率为显著性水平,用表示.的选择要根据实际情况而定.常取罐装可乐的容量按标准应在350毫升和360毫升之间.一批可乐出厂前应进行抽样检查,现抽查了n罐,测得容量为x1,…,xn,问这一批可乐的容量是否合格?提出假设H0:

=355H1:≠355由于已知,选检验统计量它能衡量差异大小且分布已知.如果由样本值算得该统计量的实测值落入区域W,则拒绝H0;否则,不能拒绝H0.对给定的显著性水平

,可以在N(0,1)表中查到分位点的值,使故我们可以取拒绝域为:也就是说,是一个小概率事件.W:这里所依据的逻辑是:如果H0是对的,那么衡量差异大小的某个统计量落入区域W(拒绝域)是个小概率事件.如果该统计量的实测值落入W,也就是说,H0成立下的小概率事件发生了,那么就认为H0不可信而否定它.否则我们就不能否定H0(只好接受它).

不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度.所以假设检验又叫“显著性检验”如果显著性水平

取得很小,则拒绝域也会比较小.其产生的后果是:

H0难于被拒绝.如果在很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.基于这个理由,人们常把时拒绝H0称为是显著的,而把在时拒绝H0称为是高度显著的.参数假设检验①原假设:第一个假设(陈述的否定)②备择假设:第二个假设(陈述本身)非参数假设检验统计假设

例2某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品,其长度X假定服从正态分布未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格?…下面,我们结合另一个例子,进一步说明假设检验的一般步骤.提出原假设和备择假设第一步:第二步:能衡量差异大小且分布已知取一检验统计量,在H0成立下求出它的分布已知未知分析:这批产品(螺钉长度)的全体组成问题的总体

.现在要检验

是否为32.5.第三步:对给定的显著性水平,查表确定临界值即

是一个小概率事件.,使得否定域(拒绝域)W:|t|>4.0322故不能拒绝H0.第四步:将样本值代入,算出统计量t的实测值,|t|=2.997<4.0322没有落入拒绝域假设检验会不会犯错误呢?由于作出结论的依据是小概率原理:小概率事件在一次试验中基本上不会发生.不是一定不发生如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误.如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误.假设检验的两类错误H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误P{拒绝H0|H0为真}=,P{接受H0|H0不真}=.犯两类错误的概率:显著性水平为犯第一类错误的概率.两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.要同时降低两类错误的概率,或者要在不变的条件下降低,或者需要增加样本容量.7.2参数假设检验7.2.1U-检验设取自正态母体的一个样本,为已知常数双边检验(1)检验假设(2)构造U统计量(3)给定显著性水平,查正态分布表,使即记成则寻找上侧分位点,使确定拒绝域(4)计算子样的值,判断其是否落入拒绝域.设取自正态母体的一个样本,为已知常数单边检验(1)检验假设为小概率事件查正态分布表,拒绝域即确定拒绝域,分两种情况:(2)假设检验(a)拒绝域(b)对于任何样本观测有:即因此,在给定条件下,使由于事件对假设H0而言,拒绝域仍为W所以(3)检验假设拒绝域(4)检验假设拒绝域解:提出假设:例3某织物强力指标

的均值公斤.改进工艺后生产一批织物,今从中取30件,测得公斤.假设强力指标服从正态分布且已知公斤,问在显著性水平下,新生产织物比过去的织物强力是否有提高?代入,并由样本值计算得统计量U的实测值U=2.51>2.33故拒绝原假设H0.落入否定域此时可能犯第一类错误,犯错误的概率不超过0.01.取统计量否定域为W:

是一小概率事件双正态总体U-检验(1)检验假设(2)构造U统计量设和分别为取自正态母体和的样本,在方差已知的条件下查正态分布表,拒绝域

(3)给定显著性水平,确定拒绝域(4)求子样观测值的u-值,判断与否7.2.2t-检验设取自正态母体的一个样本,为未知数双边检验(1)检验假设(2)构造t统计量其中(3)给定显著性水平,确定拒绝域由查t-分布表,自由度取n-1,确定分位点拒绝域单边检验(1)检验假设拒绝域(2)检验假设拒绝域(3)检验假设拒绝域(4)检验假设拒绝域双正态总体t-检验(1)检验假设(2)构造t统计量设和分别为取自正态母体和的样本,在方差的条件下其中特别时,可以推广至检验此时将t统计量分子换成查t-分布表拒绝域

(3)给定显著性水平,确定拒绝域(4)求子样观测值的t-值,判断与否7.2.3单个正态总体方差假设检验-检验(1)检验假设(2)构造统计量设取自正态母体的一个样本,为已知常数双边检验(3)给定显著性水平,确定拒绝域,使拒绝域为了计算方便,取查-分布表知,上侧分位点使分位点使单边检验(1)检验假设拒绝域(2)检验假设拒绝域7.2.3'单个正态总体方差假设检验-检验(1)检验假设(2)构造统计量设取自正态母体的一个样本,未知双边检验(3)给定显著性水平,确定拒绝域,使拒绝域为了计算方便,取查-分布表知,上侧分位点使分位点使单边检验(1)检验假设拒绝域(2)检验假设拒绝域7.2.4两个正态总体方差假设检验-检验(1)检验假设(2)构造F统计量设和分别为取自正态母体和的样本,在方差

已知的条件下(3)给定显著性水平,确定拒绝域注意:7.2.4'两个正态总体方差假设检验-检验(1)检验假设(2)构造F统计量设和分别为取自正态母体和的样本,在方差

未知的条件下(3)给定显著性水平,确定拒绝域例4为比较两台自动机床的精度,分别取容量为10和8的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果:在时,问这两台机床是否有同样的精度?车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38解:设两台自动机床的方差分别为在下检验假设:取统计量否定域为W:或由样本值可计算得F的实测值为:F=1.51查表得由于0.304<1.51<3.68,故接受H0.这时可能犯第二类错误.

提出假设根据统计调查的目的,提出原假设H0和备选假设H1作出决策抽取样本检验假设对差异进行定量的分析,确定其性质(是随机误差还是系统误差.为给出两者界限,找一检验统计量T,在H0成立下其分布已知.)拒绝还是不能拒绝H0显著性水平-----犯第一类错误的概率,W为拒绝域总结F检验用F分布一般说来,按照检验所用的统计量的分布,分为U检验——用正态分布t检验用t分布检验用分布在大样本的条件下,若能求得检验统计量的极限分布,依据它去决定临界值C.按照对立假设的提法,分为单侧检验,它的拒绝域取在左侧或右侧.双侧检验,它的拒绝域取在两侧;第六章,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.7.3正态总体参数的置信区间

譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为1000条.若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.实际上,N的真值可能大于1000条,也可能小于1000条.也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作,这里是一个很小的正数.置信水平的大小是根据实际需要选定的.例如,通常可取置信水平等.根据一个实际样本,由给定的置信水平,我们求出一个尽可能小的区间,使称区间为的置信水平为的置信区间.寻找置信区间的方法,一般是从确定误差限入手.使得称

为与

之间的误差限.我们选取未知参数的某个估计量,根据置信水平,可以找到一个正数

,只要知道的概率分布,确定误差限并不难.由不等式可以解出:这个不等式就是我们所求的置信区间.在求置信区间时,要查表求分位数.设,对随机变量X,称满足的点为X的概率分布的上分位数.例如:设,对随机变量X,称满足的点为X的概率分布的上分位数.标准正态分布的上分位数例如:分布的上分位数自由度为n的F分布的上分位数自由度为n1,n2的置信区间定义设总体具有概率函数为未知参数,为取自的该总体的样本,若对于,存在两个统计量使则称区间为参数的置信度为的置信区间,称为置信下限,称为置信上限.注:①置信区间是一个随机区间,它的两端点是不依赖于的统计量.②其意义指在重复抽样下,许多不同的置信区间中大约的区间包含未知参数即包含的区间类的置信度,不能认为不等式成立的概率为

置信区间的求法选的点估计为解:寻找未知参数的一个良好估计.寻找一个待估参数和估计量的函数,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.求参数的置信度为的置信区间.

例5设

是取自的样本,对给定的置信水平查正态分布表得对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.使为什么这样取?对给定的置信水平查正态分布表得使也可简记为于是所求的置信区间为从上例解题的过程,我们归纳出求置信区间的一般步骤如下:1.明确问题,是求什么参数的置信区间?置信水平

是多少?称

为枢轴量.3.寻找一个待估参数和估计量T的函数且其分布为已知.2.寻找参数的一个良好的点估计

4.对于给定的置信水平

,根据

的分布,确定常数a,b,使得

5.对“

”作等价变形,得到如下形式:则就是的的置信区间.这里,我们主要讨论总体分布为正态的情形.若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计.可见,确定区间估计很关键的是要寻找一个待估参数和估计量T的函数

,且

的分布为已知,不依赖于任何未知参数而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.正态总体均值的区间估计(1)已知,则的置信水平的置信区间是正态总体均值的区间估计(2)未知,则的置信水平的置信区间是正态总体方差的区间估计(1)已知,则的置信水平的置信区间是正态总体方差的区间估计(2)未知,则的置信水平的置信区间是例6已知某地区新生婴儿的体重随机抽查100个婴儿…得100个体重数据的区间估计求和(置信水平为

).解:这是单总体均值和方差的估计已知先求均值的区间估计.因方差未知,取对给定的置信度

,确定分位数使即即为均值的置信水平为的区间估计.从中解得取枢轴量再求方差的置信水平为的区间估计.从中解得于是即为所求.需要指出的是,给定样本,给定置信水平,置信区间也不是唯一的.对同一个参数,我们可以构造许多置信区间.取枢轴量

例7设

是取自的样本,求参数的置信水平为的置信区间.由标准正态分布表,对任意a、b,我们可以求得P(a<U<b).例如,由P(-1.96≤U≤1.96)=0.95我们得到均值的置信水平为的置信区间由P(-1.75≤U≤2.33)=0.95这个区间比前面一个要长一些.我们得到均值的置信水平为的置信区间在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.

类似地,对任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间.a=-b即使在概率密度不对称的情形,如分布,F分布,习惯上仍取对称的百分位点来计算未知参数的置信区间.我们可以得到未知参数的的任何置信水平小于1的置信区间,并且置信水平越高,相应的置信区间平均长度越长.双正态总体均值差的区间估计已知,则的置信水平的置信区间是双正态总体方差比的区间估计已知,则的置信水平的置信区间是假设检验和置信区间的关系双侧检验问题的接受域可以定出正态均值

的置信区间单侧检验问题的接受域可以定出正态均值的置信上限单侧检验问题的接受域可以定出正态均值的置信上限问该厂生产的钟的误差是否服从正态分布?例某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.7.4非参数假设检验为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.再如,某工厂制造一批骰子,声称它是均匀的.也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6.问题是:得到的数据能否说明“骰子均匀”的假设是可信的?非参数假设检验研究的检验是如何用子样去拟合总体分布,所以又称分布拟合优度检验.包括拟合总体的分布函数和拟合总体分布的概率函数.

检验方法有:概率图纸法、拟合优度检验、柯尔莫戈洛夫-斯米尔洛夫检验.7.4.1概率图纸法使用概率纸可以很快判断总体分布的类型又能粗略地估计总体的参数,是检验总体分布的一种简单工具.正态概率纸是一张刻有直角坐标的图纸,它的横坐标轴的刻度是均匀的,表示观察值,纵坐标轴的刻度是不均匀的,表示概率,具体的刻度是通过函数换算出来的,即在普通的直角坐标xot的纵坐标轴(t轴)上原坐标为t的点刻度为正态概率纸是一张刻有直角坐标的图纸,它的横坐标轴的刻度是均匀的,表示观察值,纵坐标轴的刻度是不均匀的,表示概率,具体的刻度是通过函数换算出来的,即在普通的直角坐标xot的纵坐标轴(t轴)上原坐标为t的点刻度为例如纵轴上,原坐标为1处的刻度为,原坐标为2处的刻度为,原坐标为-1处的刻度为但习惯上,在正态概率纸上的纵坐标轴上标明的数字是换算出的刻度的100倍,又由于是在取值,概率不可能为0,也不可能为1,故一般概率纸的纵轴的刻度都是从0.01~99.99.下面我们以正态概率图纸为例介绍,其步骤如下:1.首先把样本观察值按从小到大的次序排列2.对每一个

,计算修正的频率3.将点逐一点在正态概率纸上4.判断若诸点在一条直线附近,则认为该样本来自正态总体;若诸点明显不在一条直线附近,则认为该样本不是来自正态分布总体.7.4.2拟合优度检验

检验法是在总体的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法.然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.使用

检验法对总体分布进行检验时,我们先提出原假设:

H0:总体

的分布函数为F(x)在用

检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.分布拟合的的基本原理和步骤如下:1.将总体的取值范围分成k个互不重迭的小区间,记作A1,A2,…,Ak.2.把落入第i个小区间Ai的样本值的个数记作fi,称为实测频数.所有实测频数之和f1+f2+…+fk等于样本容量n.3.根据所假设的理论分布,可以算出总体的值落入每个Ai的概率pi,于是npi就是落入Ai的样本值的理论频数.标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:统计量的分布是什么?在理论分布已知的条件下,npi是常量实测频数理论频数皮尔逊证明了如下定理:若原假设中的理论分布F(x)已经完全给定,那么当时,统计量的分布渐近(k-1)个自由度的分布.如果理论分布F(x)中有r个未知参数需用相应的估计量来代替,那么当时,统计量的分布渐近(k-r-1)个自由度的分布.这些变量之间存在着一个制约关系:故统计量渐近(k-1)个自由度的分布.在理论分布F(x)完全给定的情况下,每个pi

都是确定的常数.由棣莫佛-拉普拉斯中心极限定理,当n充分大时,实测频数fi

渐近正态,是k个近似正态的变量的平方和.因此在F(x)尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个.若有r个未知参数需用相应的估计量来代替,自由度就减少r个.此时统计量渐近(k-r-1)个自由度的分布.查分布表可得临界值,使得根据这个定理,对给定的显著性水平,得拒绝域:(不需估计参数)(估计r个参数)皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n要足够大,以及npi

不太小这两个条件.根据计算实践,要求n不小于50,以及npi都不小于5.否则应适当合并区间,使npi满足这个要求.如果根据所给的样本值算得统计量的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设.从以上卡方分布拟合检验的思想及步骤我们可知泊松分布,指数分布,正态分布等都可以进行拟合检验,下面我们举一个例子

例在数的前800位小数中,数字0,1,…9出现的次数如下:数字0

1

2

3

4

5

6

7

8

9频数

74

92837980737775

76

91 利用卡方检验法,检验这些数字是否服从均匀分布()解此均匀是离散型的均匀分布,讨论的共十个数,各个数落在同一位置上的概率为0.1,共计800个位置,理论频数为,没有未知参数.0123456789749283798073777576910.10.10.10.10.10.10.10.10.10.180808080808080808080-6123-10-7-3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论