版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章
假设检验
上章介绍的点估计理论,是利用样本构造适当的统计量对总体的未知参数进行估计。
在实际应用中,有另一类问题是对总体参数或总体分布提出一个命题,然后根据样本对该命题的真假性作出判断。如判断有关早稻的平均亩产量的某一命题是否为真;如判断某种产品的次品率是否符合要求;再如判断某种建筑材料的抗断强度指标Y是否服从正态分布等。
例4.1生产流水线上的袋装糖果的重量服从正态分布,按规定袋装糖果的重量的均值应为0.5(千克)。一批袋装糖果出厂前进行抽样检查,抽查了5袋,质量分别为:0.497,0.506,0.518,0.498,0.511。问这一批袋装糖果是否合格?
可该例关心的问题归结为一个理论问题:总体分布N(,2),参数未知。要根据抽得的样本值对命题∶袋装糖果是否合格,即=
0=0.5,记作H0,作出“是”或“否”的判断。
H0称为一个统计假设,具体的判断规则称为该假设的一个检验。
例4.2.
某厂有一大批产品,按规定次品率不得超过3%才能出厂,今从中随机地抽取50件。发现有4件次品。问这批产品能否出厂?
本例关心的问题是:如何根据抽样所得的次品频率fA/n=4/50,来推断整批产品的次品率是否超过了3%。即要检验假设H0:次品率p3%,是否成立。
例4.3.在一实验中,每隔一定时间间隔观察一次计数器上记录的某种铀放射出的粒子的个数X,独立观察100次的数据如下:
i0,1,2,3,4,5,6,7,8,9,10,11fi1,5,16,17,26,11,9,9,2,1,2,1其中fi
是观察到有i个粒子的个数。试问X是否服从泊松分布。
该例题要检验的假设H0是:总体X服从“泊松分布”是否成立?
假设检验可分为两种:如例4.1例4.2是关于参数的假设检验,即是总体分布的类型已知,但含有有限个未知参数,这样关于总体分布的假设检验问题就可转化为关于分布中未知参数的假设检验了。另一种是非参数假设检验。即是关于总体分布的假设检验不能转化成分布中未知参数的假设检验。如例4.3是非参数假设检验是有关总体分布的假设检验。一.假设检验的基本思想方法
1.假设检验推理的理论根据是:“实际统计推断原理”(小概率原理)-----即认为概率很小的事件在一次实验中几乎(一般)是不会发生的。在概率论中介绍了伯努利大数定律,即对任意>0,
该定律说明当独立重复试验次数n充分大时,某事件A发生的频率fA
/n与事件A发生的概率p非常接近。p很小,如p=0.01,大约100次试验A可能发生一次,显然一次试验n=1中,A发生的可能性几乎是0。
小概率原理是在长期大量实践中总结出来的原理,是人们在实践中广泛采用的一个原理,也叫实际统计推断原理。
概率小到什么程度才叫小概率事件呢?在假设检验中,一般把概率不超过0.10,0.05,0.025,0.005或0.001等的事件,称为小概率事件。
2.假设检验的基本思想方法是基于具有概率性质的反证法。类似于纯粹数学中的反证法,我们可先假定要检验的假设H0正确,并在此前提下,构造一个适当的小概率事件。根据实际推断原理,概率很小的事件在一次试验中一般是不发生的。因此,在H0正确的基础上,如果得到的数据表明这个小概率事件发生了,它与小概率原理相矛盾,说明H0正确的假定很可能是错误的,应拒绝该假设;如果没有发生,则无法拒绝H0,此时,一般是接受该假设,也可根据问题作进一步研究。
例4.4:设有一大批产品,要检验这批产品的次品率p是否是0.1?从这批产品中随机地取出5件产品检查,有4件次品,1件正品,依此样本如何判断p是否是0.1.
解:先做假设,记
H0:p=0.1。在H0为真的条件下计算P(5件产品中有4件次品1件正品)
但是事件A发生了,这与“小概率原理”矛盾。在H0为真的条件下上述计算是正确的,所以矛盾的产生认为是由H0造成的,故应否定,认为p0.1。
由上述讨论看出:为了检验H0是否成立,先假定H0
成立,再由抽样所提供的信息,看是否有不合理的事情发生。如果在H0
为真的条件下,计算都是正确的,但小概率事件发生了,产生了不合理现象,这说明假设不正确,这时要拒绝H0
或否定H0
。如果小概率事件没有发生,没有产生不合理的现象,就没有充分的理由否定H0
,就不能拒绝H0
,这时称H0
相容,可以认为H0
成立。这就是假设检验的基本思想。
下面先通过一个例子来说明假设检验以及如何进行假设检验
例4.5
某餐厅每天的营业额服从正态分布,按照以往的老菜单营业,营业额的均值为8000,标准差为640。目前,该餐厅试用一新菜单。经过九天的运营,发现平均每天的营业额为8300,经理想知道这个差别是否是由于新菜单而引起的。(假定按照新菜单营业,营业额的标准依然差为640)。假设按照新菜单营业,营业额X~N(,
2),
2=6402X1,…,X9为九天的营业额,即来自总体X的样本假设检验的做法分以下几步来叙述(1)建立假设——即提出一个关于总体X分布的命题如:按照新老菜单运营,平均营业额没有差别——记该命题为H0:=8000称其为原假设当我们能确认H0为假时,这时我们面临如下三个命题的选择按照新菜单运营的平均营业额比按照老菜单运营的平均营业额高:>8000
按照新菜单运营的平均营业额比按照老菜单运营的平均营业额低:<8000
按照新老菜单运营的平均营业额有显著差别:8000
我们从中选择一个命题作为抛弃H0后可供选择的命题,记为H1
,如:H1:
8000,称其为备择假设在该例中,我们采用如下两个命题H0:=0=8000
——原假设H1:0=8000
——备择假设(2)
我们的做法是:先假定H0为成立,然后用样本(X1,…,Xn)去判断其真伪。
由于样本(X1,…,Xn)所含信息较分散,因此需要构造一个统计量T(X1,…,Xn)来做判断,称该统计量为检验统计量。——假设检验的任务是判断H0是否为真。
寻找检验统计量T(X1,…,Xn)
在本例中,我们用样本均值作为检验统计量。
检验法则:当T(x1,…,xn)
C时拒绝H0,否则接受H0令W={(x1,…,xn):T(x1,…,xn)
C},称其为检验的拒绝域,它的边界点称为检验的临界点令A={(x1,…,xn):T(x1,…,xn)
C},称其为检验的接受域
在本例中,当假定H0
为真时,即H0:=8000时,的观测值应该围绕在8000附近。如果远离8000,那么就有理由怀疑H0不真。如今8300离8000算近还是算远?或者,与8000差别多远,才能拒绝H0
?这就需要一个界限,记为c:
在本例中,当假定H0
为真时,即H0:=8000时,的观测值应该围绕在8000附近。如果远离8000,那么就有理由怀疑H0不真。如今8300离8000算近还是算远?或者,离8000差别多远,才能拒绝H0
?这就需要一个界限,记为c:当|8000|c时,拒绝
H0
;当|8000|<c时,接受
H0
;
这里c
是检验的临界值,拒绝域为W={(x1,…,xn):|8000|c},接受域为
A={(x1,…,xn):|8000|<c}
在假设检验中,人们总是关心拒绝域,这是因为如今我们手中只有一个样本,用一个样本去证明一个命题是正确的,在逻辑上是不充分的;但用一个反例(如样本)去推翻一个命题,理由是充足的。当不能否定原假设H0时,只能将原假设H0当作为真保留下来。(3)显著水平与临界值
由于是依据一个样本对H0真假与否作出判断的,当实际
H0为真时仍有可能作出拒绝H0的判断,这是一种错误。我们无法排除犯这类错误的可能性,因此自然希望将犯这类错误的概率控制在一定的限度内,即给出一个较小的数(0<<1),使P(拒绝H0|
H0为真
)称为检验的显著水平根据上式确定检验的临界点在本例中,要使P(拒绝H0|
H0为真
)=我们看其中的含义:这里“H0:=0=8000”为真,即指样本X1,…,X9
实际来自总体N(8000,6402),此时根据检验法则:P(拒绝H0|
H0为真)本例检验法则:当|8000|c时,拒绝
H0
“H0:=0=8000”为真,由分位数的定义,有:P(拒绝H0|
H0为真)即于是本例的拒绝域为由于若取=0.05,则在H0为真时,事件
为小概率事件。通常在一次试验中,小概率事件是难以发生的。倘若该小概率事件在一次试验中发生了,人们就有理由怀疑不是一个小概率事件。这一矛盾导致人们不相信原假设H0为真,从而否定原假设。于是本例的检验法则为:------当|8000|(640/3)u1-/2
时,拒绝
H0
;------当|8000|<(640/3)u1-/2
时,接受
H0
;具体地,计算9天的平均营业额,查表,u1-0.05/2=u0.975=1.96。由于所以接受H0,认为新菜单对平均每天的营业额没有显著影响。假设检验中的基本概念(1)假设:关于总体分布的某个命题(2)原假设:把需要检验的假设称为原假设,记为H0(3)备择假设:在拒绝原假设后,可供选择的一个命题称为备择假设,它可以是原假设对立面的全体,或其中的一部分,记为H1(4)检验统计量:用于判断原假设成立与否的统计量称为检验统计量。(5)拒绝域:使原假设H0被拒绝的样本观测值所组成的区域称为检验的拒绝域
接受域:保留原假设H0的样本观测值所组成的区域称为检验的接受域(6)显著水平:控制P(拒绝H0|
H0为真
)中的
称为检验的显著水平
两类错误
第一类错误:原假设H0为真,但由于样本的随机性,使样本观测值落入拒绝域,从而作出拒绝H0的结论,这类错误称第一类错误,它发生的概率称为犯第一类错误的概率,也称为“拒真概率”。——不大于显著水平P(拒绝H0|
H0为真
)=P{T(x1,…,xn)
C|
H0为真}=P{(x1,…,xn)
W|
H0为真}
第二类错误:原假设H0为假,但由于样本的随机性,使样本观测值落入接受域,从而作出保留H0的结论,这类错误称第二类错误,它发生的概率称为犯第二类错误的概率,也称为“取伪概率”。P(接受H0|
H0为假
)=P{接受H0
|
H1为真}
在一般情形,当样本容量固定时,减小一类错误概率会导致另一类错误概率的增加.
要同时降低两类错误的概率,或者要在第一类的错误概率不变的条件下降低第二类的错误概率,需要增加样本容量.
一般来说,我们总是控制犯第一类错误的概率,使它不大于。再在这一限制下使第二类的错误发生的概率尽可能地小
——控制第一类错误的原则
二、正态总体均值参数的假设检验
设总体X~,X1,X2,…,Xn为来自总体X的样本1.2已知,关于均值的假设检验从的点估计出发构造拒绝域拒绝域为控制第一类错误,即此时需要寻找的一个与未知参数无关的一个单调函数,当H0成立时,其分布是已知的。因为,当H0成立时,X1,…,Xn~N(0,2),此时有~N(0,1)按照控制第一类错误的原则,有~N(0,1)由此u1-/2-u1-/2拒绝域为查表u1-/2,计算若其大于u1-/2,拒绝原假设。否则,接受原假设。
例4.6
某鸡场用某种饲料饲养肉鸡3个月,平均体重2.6kg,标准差为0.5kg。现改为复合饲料饲养肉鸡64只,3个月平均体重2.5kg。若假设用复合饲料饲养3个月后肉鸡体重服从正态分布N(,0.52).问是否可以认为复合饲料同样利于肉鸡生长?(=0.05)H0:
=0=2.6解:H1:≠0=2.6H0成立时~N(0,1)H0成立时~N(0,1)H0:
=0=2.6
H1:≠0=2.6拒绝域为查表得u0.975=1.96,计算得接受原假设,认为复合饲料与原饲料对肉鸡生长无显著差异。
前面的检验,拒绝域取在两侧,称为双边检验.下面看关于均值(2已知)的单边检验.(2)(2已知)利用统计量构造拒绝域控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,X1,…,Xn~N(,2),且控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,由于当H0成立时,所以要求当H0成立时,故而要使只要要求拒绝域为所以,假设H0的拒绝域为(3)(2已知)利用统计量构造拒绝域控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,X1,…,Xn~N(,2),且控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,由于当H0成立时,所以要求当H0成立时,故而要使只要要求拒绝域为所以,假设H0的拒绝域为2.关于均值的假设检验,2未知利用统计量构造拒绝域控制第一类错误,即2已知时,检验统计量(1)
拒绝域为因为当H0成立时,X1,…,Xn~N(0,2),所以控制第一类错误,~t(n-1)由此要求所以拒绝域为查表t/2(n-1),计算若其大于t1-/2(n-1)
,拒绝原假设。否则,接受原假设例4.7
某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品,其长度X假定服从正态分布N(,2)
,2未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格?解:当H0成立时,X1,…,X6~N(0,2),因此当H0成立时,X1,…,X6~N(0,2),拒绝域为对给定的显著性水平=0.01,查表确定临界值将样本值代入算出故不能拒绝H0.下面看关于均值(2未知)的单边检验.(2)(2未知)利用统计量构造拒绝域控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,X1,…,Xn~N(,2),且控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,由于当H0成立时,所以要求当H0成立时,故而要使只要要求拒绝域为所以,假设H0的拒绝域为例4.8
按规定,某种织物强力指标X的均值应大于21公斤.今从一批该种织物中取30件,经测量和计算得
=21.55公斤.=1.1812
。假设强力指标服从正态分布N(,2).问在显著性水平
=0.01下,该批种织物是否符合要求?解:
拒绝域为当H0成立时,查表得,t0.99(29)=2.462,由样本值计算故拒绝原假设H0.落入否定域(3)(2未知)利用统计量构造拒绝域控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,X1,…,Xn~N(,2),且控制第一类错误,我们看H0成立时,相关事件的概率当H0成立时,由于当H0成立时,所以要求当H0成立时,故而要使只要要求拒绝域为所以,假设H0的拒绝域为二.检验的p-值
一个假设检验问题的结论是简单的,在给定的显著性水平下,不是拒绝原假设H0,就是保留原假设H0。然而有可能发生如下情况:在显著性水平
=0.05下拒绝原假设H0,可是在显著性水平
=0.01下保留原假没。因为降低显著性水平
会导致拒绝域缩小,这样原来落在=0.05的拒绝域中的检验统计量的观测值就有可能落在=0.01的接受域中,假如这时一个人主张选显著性水平=0.05,而另一个人主张选=0.01,那么前一个人的结论是拒绝H0,而后一个人的结论是保留H0,两个人的结论就完全相反。我们该如何对待这一问题呢?
例4.9.一支香烟中的尼古丁含量X服从正态分布N(,1),合格标准规定
不能超过1.5mg。为对一批香烟的尼古丁含量是否合格作判断,则可建立如下假设H0:0=1.5,H1:>0=1.5这是在方差已知情况下对正态分布的均值作单边检验,所用的检验统计量为拒绝域是现随机抽取一盒(20支)香烟,测得平均每支香烟的尼古丁含量为
下表对四个不同的显著性水平分别列出相应的拒绝域和所下的结论:,则可求得检验统计量的值为
表4.1例3.10下不同的
的拒绝域与结论显著水平拒绝域u=2.10时的结论0.050.0250.010.005{u>1.645}{u>1.96}{u>2.33}{u>2.58}拒绝H0拒绝H0接受H0接受H0
从上表可看出,当相对大一些时,U的临界值就小,从而2.10超过了临界值,故应拒绝H0;而当减小时,临界值便增大,2.10就可能不超过了临界值,这时便接受H0。
现在,我们换一个角度来看这一问题。用
=0=1.5时检验统计量U的分布
N(0,1)可求得这一概率便是图4.2(a)中标准正态分布右边尾部阴影区域的面积,当选定的显著水平>0.0179时,阴影区域扩大(见图4.2(b)),临界值向左移,从而2.10落入拒绝域;若<0.0179,则阴影区域缩小(见图4.2(c),临界值向右移,从而2.10落在接受域中。
从这里可以看出,0.0179是这个问题中拒绝H0的最小的显著性水平,比它稍大一点便会导致保留H0,这种“拒绝H0的最小的显著性水平”就称为p值。在一个检验问题中附带给出p值对人们作决策是有好处的
定义4.1
在一个假设检验问题中,拒绝假设H0的最小显著性水平称为p值。p值也可看作是样本与原假设H0相容程度的度量.p值越大,相容程度越高;反之,p值越小,相容程度越低。p值小到一定程度则认为二者不相容了,即应拒绝H0。当p值小于时认为二者不相容,这时拒绝H0,由此引起错误的概率不超过。仍来看一下例4.9,如果指定显著性水平为,则拒绝域为{u>u1},现在由样本求得u=2.10。在
=0=1.5下,P{u>2.10}=0.0179=p,如果此时=P{U>u1}P{U>u}=p,则uu1,从而u落在拒绝域中,故结论是水平下拒绝;如果=P{U>u1}<P{U>u}=p,则u<u1,即u未落在拒绝域中,故在水平下应保留H0(见图4.3)。对任意指定的显著性水平,在与p值比较后可以得到如下结论:
结论一:如果
p值,则在显著性水平
下拒绝H0
结论二:如果
<p值,则在显著性水平
下保留H0三.假设检验的计算机命令(1)关于U检验命令:ztest函数;功能:给定方差条件下进行正态总体均值的检验;语法:h=ztest(x,mu,sigm),
h=ztest(x,mu,sigm,alpha),[h,sig,ci]=ztest(x,mu,sigm,alpha,tail)。h=1,拒绝原假设,h=0,接收原假设;描述:ztest(x,mu,sigm)在0.05水平下进行U
检验,以确定服从正态分布的样本均值是否为mu,sigm为给定的标准差;h=ztest(x,mu,sigm,alpha),描述类似前者,并且给出显著水平alpha;[h,sig,ci]=ztest(x,mu,sigm,alpha,tail)指定单侧检验还是双侧检验。tail=0(为默认设置)指定备择假设
0,属双边检验;tail=1指定备择假设
>0,属单边检验;tail=-1指定备择假设,tail=1指定备择假设
<0,属单边检验;sig为与U统计量相关的p值;ci为均值真值的1-alpha置信区间。例某批矿砂的5个样品中的镍含量,经测定为(%)
3.253.273.243.263.24设测定值总体服从正态分布,标准差为0.04,问在0.01水平上能否接受假设:这批镍含量的均值为3.25。matlab命令如下:x=[3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重点措施目标对专业的认知六大模块基本知识的认知
- 商场商户管理培训
- 2024年陕西省中考化学真题(A卷)【附答案】
- 宠物打扫培训课件
- 中风的自我治疗方案
- 《纹绣分为哪几种》课件
- 《全文获取途径》课件
- 办公室软件培训活动
- 保安管理规定
- 华为AI盘古大模型研究报告:研究框架
- 个人生涯发展展示
- 消防工程中常见质量问题及预防措施
- 12月ACCAF9考试真题答案(优推内容)
- led背光源BLU学习资料ppt课件
- 乌兰察布城规划管理技术规定
- 初中人教版七年级上册音乐1.5学吹竖笛(29张)ppt课件
- 飞行模拟器视景显示系统的设计
- 基于NFC移动支付技术在地铁自动售检票系统中运用分析
- 肺炎PPTPPT课件
- 新生儿访视技术规范
- 浅谈如何在生物教学中渗透健康教育
评论
0/150
提交评论