




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
参数假设检验5.1假设检验的基本概念5.2正态总体参数的假设检验
假设检验5.3非正态总体参数的假设检验5.4假设检验与区间估计
参数估计和假设检验是数理统计的两个主要内容.在第三章和第四章已经探讨了关于参数估计的主要方法,包括点估计和区间估计.
在现实中,除去估计问题外,还有涉及到判断假设是否正确的问题.
假设检验问题通过从有关总体中抽取一定量的样本,利用样本去检验总体分布是否具有某种特征.
在统计学中,假设检验主要分为以下两类:
参数假设检验:总体的分布类型已知,对总体分布中的未知参数提出某种假设,然后利用样本(即数据)对假设进行检验,最后根据检验的结果对所提出的假设做出成立与否的判断.
非参数假设检验:总体的分布类型未知,利用样本对总体的分布、分布的特性或总体的数字特征提出假设,并进行检验.5.1假设检验的基本概念为了说明假设检验问题,首先看几个具体例子.例5.1.1某车间生产的钢管直径X服从正态分布N(µ,0.52),其中µ未知.按照规定,为确保该批钢管能够与其它零件匹配,生产的钢管平均直径应为100mm.现从一批钢管中随机抽取10根,测得其直径的平均值为100.15mm
.目的:如何根据抽样的结果判断钢管的平均直径是否为μ=100问题:该批生产的钢管是否符合规定?证据:钢管直径的平均值为100.15mm.
例5.1.2假设电视节目的收视服从伯努利分布.有人断言某电视节目的收视率p
超过30%.为判断该断言正确与否,通过调查问卷的方式随机调查了50人,调查结果显示有10人观看过该节目.目的:如何根据抽样的结果判断电视节目的收视率p
超过30%.问题:该断言是否合适?证据:随机调查了50人,调查结果显示有10人观看过该节目.例5.1.3根据以往经验,某建筑材料的抗断强度指标X服从正态分布,现在改变了该材料的生产配方并进行新的生产流程,从新材料中随机抽取100件测其抗断强度.目的:如何根据抽样的结果判断新材料的抗断强度指标Y
是否仍服从正态分布?问题:新材料的抗断强度指标Y
是否仍服从正态分布?证据:从新材料中随机抽取100件测其抗断强度..假设检验的基本任务通过从有关总体中抽取一定数量的样本,利用样本对未知总体分布的某些方面(如总体均值、总体方差、总体分布本身等等)的假设作出合理的判断.
例5.1.1和例5.1.2都是需要对总体分布的参数做出检验,因此它们是参数假设检验.
例5.1.3是对总体分布的检验,是非参数假设检验.
结合这几个例子,在本节中,我们将介绍假设检验的基本概念,并给出求解假设检验的步骤.5.1.1检验问题的提出例5.1.1某车间生产的钢管直径X服从正态分布N(µ,0.52),其中µ未知.按照规定,为确保该批钢管能够与其它零件匹配,生产的钢管平均直径应为100mm.现从一批钢管中随机抽取10根,测得其直径的平均值为100.15mm
.根据题意:X~N(µ,0.52),记µ0=100.由于这种假设是人为加上的,不一定成立.当H0不成立时,另一种推断为该批钢管的均值已经不再是100mm,记作H1
:μ
100H0
:μ=100因此钢管是否符合要求是指平均直径是µ
=µ0
还是µ
µ0
.若相等就表示符合要求,否则就要进行停产检查.根据以往经验,我们可先假设该批钢管符合要求,即µ
=100,记作第一步:我们提出一个假设它叫做原假设或零假设.另一个可能是叫做备择假设或对立假设.该问题化为接受H0,还是接受H1.在数学上我们记为H1
:μ
100H0
:μ=100H0
:μ=100;H1
:μ
100设有参数分布族,其中Θ为参数空间.设X1,X
2,…,Xn是从上述分布族中的某总体抽取的样本.在参数假设检验问题中,感兴趣的是参数θ是否属于参数空间Θ的某个非空真子集Θ0,则H0:θ∈Θ0称为原假设或零假设.确切含义是:检验是否存在一个θ0∈Θ0使得X的分布为f(x,θ0)
.
记Θ1
Θ
-
Θ0,则命题H1:θ∈Θ1称为H0的对立假设或备择假设.注意:这个提法中将原假设H0放在中心位置,H0和H1的地位不一样,位置不可更换.原因:我们关心的是θ∈Θ0是否成立.在假设检验问题中,我们需要利用样本提供的信息(即数据)来检验原假设H0成立还是备择假设H1成立.原假设H0写在左边,作为中心位置;备择假设H1写在右边,作为陪衬地位.例5.1.1中,Θ0
取为{100},Θ1取为R-{100},H0是简单假设,H1是复合假设;例5.1.2中,原假设中取Θ0
=[0.3,1],
备择假设中取Θ1=[0,0.3),H0是复合假设,H1是复合假设;若Θ0或Θ1中只包含参数空间Θ中一个点,则称为简单假设;否则称为复合假设.例如样本抽自正态总体N(μ,σ2),其中σ2已知.参数空间如果则H0为简单原假设,H1为复合备择假设如果此时H0为复合原假设,H1为复合备择假设.说明:原假设和备择假设都是总体分布族的子分布族.5.1.2拒绝域、检验函数和随机化检验继续讨论例5.1.1.例5.1.1
设X1,X
2,…,Xn为从正态总体N(μ,σ2)中抽取的样本,其中σ2已知.考虑检验问题其中μ0为给定的常数.问题:接受H0还是接受H1?求μ的一个良好的点估计:是μ的UMVUE.若较大,认为样本与原假设H0有差异,倾向于拒绝H0.若较小,认为样本与原假设H0相近,倾向于接受H0.具体的说,确定一个常数,由X1,X
2,…,Xn算出样本均值,若时,拒绝H0.若时,接受H0.统计量称为检验统计量,它衡量数据(样本)与原假设之间的差异程度,可以看成数据与原假设之间的一种距离.第二步:构造检验统计量称为否定域,或叫做拒绝域.拒绝域是由样本空间χ
中一切使的那些样本X1,X
2,…,Xn构成.有了拒绝域,等价于将样本空间χ分成不相交的两部分D和.一旦有了样本(X1,X
2,…,Xn
),当(X1,X
2,…,Xn
)∈D
时,拒绝H0;当
时,接受H0;称
为接受域.第三步:确定拒绝域的形式.T
给出了一种法则,一旦有了样本,就可以在拒绝H0或接受H0这两个结论中选择一个.称这样一种法则T为检验问题一个检验.称用于分割出D
和的数值为假设检验的临界值.只要临界值
定下来,拒绝域(即否定域)也就确定了.因此,此问题中的检验可视为如下一种法则为了数学处理方便.引入检验函数
φ(x)的概念,φ(x)与检验T
是一一对应,在例5.1.1中由式给出的检验函数
φ(x)是定义在样本空间χ上,取值于[0,1]上的函数.由定义可见,若φ(x)=1,则以概率1拒绝H0;若φ(x)=0,则以概率0拒绝H0.若φ(x)只取0和1这两个值,称这种检验为非随机化检验.拒绝域可用检验函数表示如下若存在样本点x,有0<φ(x)<1,则称φ(x)为随机化检验.随机化检验在可靠性统计中常涉及.在例5.1.1中,如果样本正好落在拒绝域与接受域的边界上,而买方以此为由拒绝购买该批钢管,此时厂方被拒绝的可能性大了,厂方觉得吃亏;如果厂方认为该批钢管没有问题,则买方收到不合格产品的可能性大了,买方觉得吃亏.以下讨论假定φ(x)皆为非随机化的检验函数,
除非特别声明,不认为φ(x)为随机化检验函数.此时,可以事先规定一个概率,使得该批钢管以概率p0被接受.当概率p0给定后,可以借助装着小球的盒子或者不均匀的骰子等来确定是否接受该批产品.此时检验函数为在确定拒绝域和检验函数后,我们需要确定临界值.临界值的确定基于以下原则:第四步:确定临界值.由于在未获得外部信息的情况下,我们通常更愿意相信原假设继续成立,即状态并未发生变化.当在原假设成立的情况下小概率事件频繁出现时,我们才会倾向于相信原假设已经不成立,状态发生了改变.基本思想:实际推断原理,也称小概率原理.5.1.3两类错误和功效函数统计推断是以样本为依据,由于样本的随机性,不能保证统计推断方法的绝对正确性,而只能以一定的概率去保证这种推断的可靠性.在假设检验问题中可能犯两类错误.(1)当原假设H0成立时拒绝原假设,称这类错误为第一类错误(或弃真错误),其发生的概率称为犯第一类错误的概率(或弃真概率);(2)原假设H0本来不正确,但却接受了H0,称这类错误为第二类错误(或取伪错误),其发生的概率称为犯第二类错误的概率(或取伪概率)假设检验的两类错误真实情况所作判断接受
H0拒绝
H0H0
为真H0
为假正确正确第一类错误
(弃真错误)第二类错误
(取伪错误)犯第一类错误的概率=P{第一类错误}
=P{当H0为真时拒绝
H0}犯第二类错误的概率=P{第二类错误}
=P{当H0不真时接受
H0
}在确定了两类错误的概念后,我们希望进一步用函数来刻画这两种概率.为此,需要引进功效函数的概念.设φ(x)是的一个检验函数,则函数称为φ的功效函数,也称为效函数或势函数.若检验函数φ(x)为非随机化检验,拒绝域为D,则此时功效函数表示当参数为θ时,拒绝原假设H0的概率.定义5.1.1(功效函数)利用功效函数计算两类错误的概率.以和分别表示犯第一和第二类错误的概率,则犯第一类错误的概率为犯第二类错误的概率为说明1.当样本容量确定后,犯两类错误的概率不可能同时减少.2.假设检验的指导思想是控制犯第一类错误的概率不超过α,然后,尽可能的减少第二类错误的发生.这里就能看出假设检验原假设与备择假设地位是不可互换的.一个好的检验φ(x),犯两类错误的概率都应该较小.即:功效函数γφ(θ)
在Θ0中应该尽可能的小,
功效函数γφ(θ)在Θ1中应该尽可能的大.犯两类错误的概率完全由功效函数决定,因此如果两个检验有同一功效函数,则该检验在性质上也完全相同.Neyman—Pearson提出以下原则控制犯第一类错误概率的原则,即在保证犯第一类错误的概率不超过指定数值α(
0<α<1,通常取较小的数)的检验中,寻找犯第二类错误的概率尽可能小的检验.5.1.4显著性检验若记:Sα表示由所有犯第一类错误的概率都不超过α的检验函数构成的类.只考虑Sα中的检验,在Sα中挑选“犯第二类错误的概率尽可能小的检验”.这种法则称为控制犯第一类错误概率的法则.关于原假设与备择假设的选取根据Neyman—Pearson原则,在原假设H0为真时,作出错误决定(即拒绝H0)的概率受到了控制.在控制犯第一类错误的概率α的原则下,使得采取拒绝H0
的决策变得较慎重,即H0得到特别的保护,不轻易被拒绝.因而,通常把有把握的、有经验、不能轻易否定的命题作为原假设,或者尽可能使后果严重的错误成为第一类错误.把没把握的、不能轻易肯定的命题作为备择假设.原假设H0与H1地位不平等.既然我们不能同时控制一个检验的两类错误,那么我们不妨先考虑一个简单些的问题,仅仅去限制第一类错误:设φ(x)是检验问题的一个检验函数,而0≤α≤1.如果检验φ(x)犯第一类错误的概率总不超过α或者等价的:检验φ满足γφ(θ)≤α,一切θ∈Θ0.则称α是检验φ(x)的一个水平,而φ(x)称为显著性水平为α的检验,简称水平为α的检验.定义5.1.2(显著性检验):按照上述定义,检验的水平不唯一.若α为检验φ(x)的水平,而α<α’<1,则α’也是检验φ(x)的水平.为避免这一问题,有时称一个检验的最小水平为其真实水平,即检验φ的真实水平.习惯上把水平α取得比较小且标准化如α=0.01,0.05,0.10等.标准化是为了查表方便.水平的选取,对检验的性质有很大影响.若水平选的低,那么容许犯第一类错误概率很小.而为了达到这一点势必大大缩小拒绝域,使接受域扩大,从而增加了犯第二类错误的概率.反之,若水平选的高,那么容许犯第一类错误概率很大.而为了达到这一点势必扩大拒绝域,使接受域缩小,从而犯第二类错误的概率相应降低.当一个检验涉及双方利益时,水平的选定常常是双方协
议的结果.2犯两种错误的后果一般在性质上有很大不同.如果犯第一类错误的后果在性质上很严重,就力求在合理的范围内尽量减少犯这种错误的可能性,此时相应的水平取得更低一些.一般来说,试验者在试验前对问题的情况总不是一无所知.他对问题的了解使他对原假设是否能成立就有了一定的看法,这种看法可能影响他对水平的选择.若水平α很小,原假设H0不会轻易被否定,如果样本落入拒绝域,作出“拒绝原假设”的结论比较可靠.反之,当水平α很小时,如果样本落入接受域,作出“接受原假设”的结论未必可靠.说明:在所选定的水平下没有充分根据拒绝H0,但是,绝不意味着有充分根据说明它正确.(此时会犯第二类错误,其概率很大)说明:1.显著性检验中拒绝原假设H0是在概率意义下进行严格推理得到的结论,因此拒绝原假设意味着有充分的证据表明原假设H0不成立;2.接受原假设H0并不意味着H0充分成立,只能说明在当前的样本下没有充分的证据拒绝H0的成立.当原假设
H0
成立时,回到例5.1.1:确定C.拒绝域为原假设H0
:μ=100;备择假设H1
:μ
100进一步,有对于给定显著性水平α,由标准正态分布分位数的定义,有即当原假设H0成立时,是概率为α的小概率事件,小概率事件在一次试验中几乎不可能发生.若在一次试验中出现了,则有充分的证据表明“原假设H0成立”是错误的,因而拒绝H0;反之,若在一次抽样中,有,就没有充分的理由拒绝原假设H0,从而承认H0成立.借助显著性水平的概念,由样本观察值计算得的观察值时,可以将判断准则T
改写为第五步:根据样本观察值作出是否拒绝H0的判断.例5.1.1中,根据题目条件得到由于0.95<1.96,因此不能拒绝原假设,可以认为该批生产的钢管符合要求.且有对于给定显著性水平α=0.05,查表得到在假设检验中,原假设是处于被保护的地位.这种保护是符合实际需求的.这是因为检查钢管直径是否符合要求将会产生多余的成本.如果没有充分的理由来支持钢管直径不符合要求,我们倾向于认为这批钢管是符合要求的.鉴于原假设H0的特殊地位,在建立假设检验问题时,我们通常选择有把握的、不能轻易改变的或存在已久的状态作为原假设.除去该准则外,另一个选取原假设H0的准则是选取违反该条件后将产生严重后果的准则作为原假设,从而可以将出现重大错误的可能性控制在较小的范围内.在实际问题中,情况将更为复杂.因此,关于如何选取原假设和备择假设没有一个绝对的标准,只能在实践工作中积累经验,根据实际情况去判断如何选取.第一步:建立假设检验问题5.1.5假设检验的基本步骤根据实际问题的要求和已知信息提出原假设H0和备择假设H1例5.1.1中:H0:µ=100;H1:µ
100第二步:构造检验统计量设密度函数f(x,
)的表达式已知,通常是基于参数
的极大似然估计构造一个检验统计量T=T(X1,X2,
…,Xn),并在原假设H0成立下,确定
T的精确分布或渐近分布.例5.1.1中:检验统计量为第三步:确定拒绝域的形式根据原假设H0和备择假设H1的形式,分析并提出拒绝域的形式,以及待定的临界值k.例5.1.1中:拒绝域的形式为其中k为临界值,是一个待定的值.第四步:给定显著性水平α
的值,确定临界值k.例5.1.1中:临界值为k=uα/2
,因此拒绝域为利用检验统计量的分布,由P{当H0为真时拒绝H0}
=
或≤
出发确定临界值,从而确定拒绝域.若样本观察值(x1,x2,
…,xn)落入拒绝域,即(x1,x2,
…,xn)
D,则拒绝H0;否则无法拒绝H0.第五步:根据样本观察值作出是否拒绝H0的判断.判断的基本原理是:实际推断原理即小概率原理.小概率事件在一次试验中几乎不可能发生.提出假设抽取样本检验假设作出决策显著性水平α根据统计调查的目的,提出原假设H0和备择假设H1.拒绝还是不能拒绝H0
作业:习题5.1:5,7,8正态分布是概率统计中最常用的分布,关于它的两个参数的假设检验在实际中经常遇到.例如:要考察某食品包装生产线工作是否正常时,需要检查包装食品的平均重量是否达到标准要求,同时也要检查生产食品的生产线工作状态是否稳定.前者是均值的检验问题,而后者是方差的检验问题.5.2正态总体参数的显著性检验设X1,X
2,…,Xn
是来自正态总体N(μ,σ2)的样本,给定显著性水平α,求下列三类检验问题:(1)(2)(3)检验问题(1)称为双边检验检验问题(2)和(3)称为单边检验其中μ0
为已知常数.5.2.1单个正态总体均值的检验一单个正态总体方差已知,均值的假设检验首先:讨论检验问题(1)(例5.1.1已经讨论)
第一步:建立假设检验问题H0:
=
0
H1:
≠
0第二步:构造检验统计量第三步:确定拒绝域的形式.第四步:确定临界值.利用检验统计量的分布,由P{当H0为真时拒绝H0}
=
或≤
出发确定临界值A,从而确定拒绝域.例5.1.1中:临界值为k=uα/2
,拒绝域为u
/2−u
/2第五步:根据样本观察值作出是否拒绝H0的判断.若样本观察值(x1,x2,
…,xn)落入拒绝域,即(x1,x2,
…,xn)
D,则拒绝H0;否则无法拒绝H0.判断的基本原理是:实际推断原理即小概率原理.小概率事件在一次试验中几乎不可能发生.其中A
为常数,待定.由于是μ
的无偏估计,当原假设H0为真,并考虑备择假设H1,检验的拒绝域可取为如下形式讨论检验问题(2)第一步:建立假设检验问题H0:
≤
0
H1:
>
0取作为检验统计量.检验拒绝域的形式可取为其中k
为常数,待定.第二步:构造检验统计量第三步:确定拒绝域的形式.得到由于在原假设H0:
≤
0成立下,有第四步:确定临界值.在原假设H0:
≤
0成立下,是一个小概率事件(概率不超过α),所以得到检验问题II的拒绝域为因此第五步:根据样本观察值作出是否拒绝H0的判断.若,则拒绝原假设H0;若,则不拒绝原假设H0
.u
α右边检验类似检验问题(2)的讨论可得到检验问题(3)的拒绝域为讨论检验问题(3)H0:
≥
0
H1:
<
0单个正态总体均值的假设检验中,当方差已知时,无论是双边检验还是单边检验,所选检验统计量的分布都与标准正态分布有关,上述假设检验方法称为U
检验法.左边检验−u
α检验参数条件原假设H0备择假设H1检验统计量拒绝域μ方差已知μ=μ0μ≠
μ0|U|≥
uα/2μ≥μ0μ<
μ0U≤
-uαμ≤μ0μ>
μ0U≥
uα注意:拒绝域{U≤-u
α}的不等号“≤”的方向和备择假设“H1:μ<
μ0”的不等号“<”的方向一致;拒绝域{U≥
uα}的不等号“≥”的方向和备择假设“H1:μ>
μ0”的不等号“>”的方向一致.正态总体方差已知,关于总体均值的检验例5.2.1一台方差是0.8克2的自动包装机在流水线上包装袋装白糖,假定包装机包装的袋装白糖的重量X~N(
2).按规定袋装白糖重量的均值应为500克.随机抽取了9袋,测得平均净重为499.41克.在显著性水平α=0.05下,问包装机包装的袋装白糖是否符合规定?将包装机包装的袋装白糖的重量视为总体X,则X~N(μ,σ2),其中σ2=0.8已知,μ
未知.提出假设检验统计量拒绝域为解:本例中,如果取α=0.05
.查表得计算得即抽样数据落入了拒绝域中,于是拒绝原假设H0.即认为包装机包装的袋装白糖不符合规定.在本例中,如果取显著性水平α=0.04,则uα/2=2.054,这时|u|=1.98<2.054,说明样本观测值没有落入拒绝域,因此,不能拒绝H0.这说明在不同的检验水平下可以得到不同的检验结果.这是因为降低犯第一类错误的概率,就会使得拒绝域减小,从而拒绝H0的机会变小,接受H0的机会变大.例5.2.2某织物强力指标X的均值21公斤.改进工艺后生产一批织物,今从中取30件,测得均值为21.55公斤.假设强力指标服从正态分布N(
,
2),且已知
=1.2公斤.问在显著性水平
=0.01下,新生产织物比过去的织物强力是否有提高?解:因为21.55>21,我们怀疑新生产织物比过去的织物强力提高,即µ>21的正确性,希望通过数据信息进行严格推理证实,因此对织物强力提出假设提出假设检验统计量拒绝域为由样本值计算表明,样本观测值落入拒绝域,故拒绝原假设H0.即,认为新生产织物比过去的织物强力有提高.例5.2.3设某种元件的寿命X服从正态分布N(
,1002),要求该种元件的平均寿命不得低于1000小时.生产者从一批该种元件中随机抽取25件,测得平均寿命为950小时.在显著性水平
=0.05下,判断这批元件是否合格?解:因为950<1000,利用数据信息进行推理提出假设检验统计量拒绝域为由样本值计算由于2.5<1.645,因此拒绝原假设,在显著性水平
=0.05下,判断这批元件不合格.实际问题中,方差
2已知的情形比较少见,一般只知X~N(μ,
2),而其中
2未知.当
2未知时,对给定的显著性水平α,关于正态总体均值
的常见假设检验问题仍提出如下三种.(3)H0:
≥
0
H1:
<
0
(1)
H0:
=
0
H1:≠0
(2)H0:
≤
0
H1:
>
0双边检验右边检验左边检验其中C
为常数,待定.由于是μ
的无偏估计,当原假设H0为真,并考虑备择假设H1,检验的拒绝域可取为如下形式讨论检验问题(3)第一步:建立假设检验问题H0:
≥
0
H1:
<
0此时不能作为检验统计量.第二步:构造检验统计量因为
σ2未知,上面拒绝域确定的检验,其犯第一类的概率不能被控制.自然的想法是用样本方差S2代替总体方差σ2取作为检验统计量.由于检验拒绝域的形式可取为其中k
为常数,待定.第三步:确定拒绝域的形式.得到由于在原假设H0:
≥
0成立下,有第四步:确定临界值.在原假设H0:
≥
0成立下,是一个小概率事件(概率不超过α
),所以得到检验问题III的拒绝域为因此第五步:根据样本观察值作出是否拒绝H0的判断.若,则拒绝原假设H0;若,则不拒绝原假设H0
.左边检验−t
α检验参数条件原假设H0备择假设H1检验统计量拒绝域μ方差未知μ=μ0μ≠
μ0μ≤μ0μ>
μ0μ≥μ0μ<
μ0正态总体方差未知,关于总体均值的检验单个正态总体均值的假设检验中,当方差未知时,无论是双边检验还是单边检验,所选检验统计量的分布都与t分布有关,上述假设检验方法称为t
检验法.例5.2.4某工厂生产的一种螺丝钉的长度X服从正态分布N(
,
2),
2未知,规定其长度的均值是32.5毫米.现从该厂生产的一批产品中抽取6件,得平均长度为31.13毫米,标准差为1.12毫米.在显著性水平α=0.01,问该工厂生产的这批螺丝钉的长度是否合格?解:(1)
提出假设H0:
=32.5
H1:
≠32.5(2)检验统计量为(4)查表得计算得(5)故不能拒绝原假设H0,认为工厂生产的这批螺丝钉的长度合格.(3)拒绝域为例5.2.5设某车间生产的钢管直径X服从正态分布N(
,
2),现从一批钢管中随机抽取10根,测得其平均直径为100.15毫米,方差为0.5783毫米2.给定显著性水平α=0.05,检验假设
H0:
=100
H1:
>100解:
(1)
检验统计量为(3)查表得计算得(4)故不能拒绝原假设H0,认为H0:
=100成立.(2)拒绝域为例5.2.6.某厂生产小型马达,其说明书上写着:这种小型马达在正常负载下平均消耗电流不会超过0.8安培.现随机抽取16台马达试验,算得平均消耗电流为0.92安培,消耗电流的标准差为0.32安培.假设马达所消耗的电流服从正态分布N(μ,σ2),σ2未知,在显著性水平α=0.05下,对下面的假设进行检验.(1)H0:平均电流不超过0.8H1:平均电流超过0.8(2)H0:平均电流不低于0.8H1:平均电流低于0.8解:(1)
假设H0:μ≤
μ0=0.8H1:μ>μ0=0.8检验统计量为拒绝域为因此不能拒绝原假设,即不能否定厂方断言,认为平均电流不超过0.8安培.查表得
tα(n−1)=t0.05(15)=1.7531拒绝域为计算得(2)H0:
0.8H1:
<0.8
因此不能拒绝原假设,即否定厂方断言,认为平均电流不低于0.8安培.查表得−tα
(n-1)=−
t0.05(15)=−1.7531选用统计量拒绝域为计算得第二种原假设的设置方法是不轻易相信厂方的结论,属于把厂方的断言反过来设为原假设,属于从消费者的角度即把平均电流不小于0.8设为原假设,此时厂方说的是假的而被拒绝的概率很小(不超过0.05).第一种原假设的设置方法是不轻易否定厂方的结论,属于从厂方角度即把平均电流不超过0.8设为原假设,此时厂方说的是真的被拒绝这种错误的概率很小(不超过0.05);对问题的提法不同(把哪个假设作为原假设),统计检验的结果也会不同.由于假设检验是控制犯第一类错误的概率,因此拒绝原假设H0的决策是有道理的.而接受原假设H0只是因为没有找到矛盾,根据目前的数据没有理由拒绝原假设,只能接受原假设.例5.2.4,例5.2.5和例5.2.6都没有拒绝原假设,用当前的数据信息无法证实我们的怀疑,但这时仍不能轻易接受,因为犯第二类错误的概率会很大.通常在实际问题中,我们需要通过增加样本容量的方法继续收集数据信息来进一步检验,此时犯第二类错误的概率会减小.设X1,X
2,…,Xn
为从正态总体N(μ,σ2)中抽取的样本,给定检验水平α,求下列三类检验问题:(1)(2)(3)双边检验右边检验其中为已知常数.5.2.2单个正态总体方差的检验左边检验单个正态总体均值未知时的检验问题要比均值已知情况更常见,首先讨论均值未知情形下,方差的假设检验问题.第一步:建立假设检验问题第二步:构造检验统计量均值µ未知,样本方差是总体方差σ2的无偏估计且具有良好性质(是UMVUE).分析:S2的观察值s2应该与
2比较接近.因此,当H0成立时,s2/
02的值应该在1附近摆动.s2/
2的值应该在1附近摆动.s2/
02过分小于1或过分大于1都是相差较大.当H0成立时,s2/
02与1相差较大是小概率事件.拒绝域的形式为:当原假设H0:σ2=σ02成立时,有故取检验统计量为检验拒绝域的形式为其中k1,k2
为常数,待定.第三步:确定拒绝域的形式.第四步:确定临界值.对于给定显著性水平α,有为方便,取因此有于是,拒绝域为第五步:根据样本观察值作出是否拒绝H0的判断.若,则拒绝原假设H0;若,则不拒绝原假设H0
.假设检验中选取的检验统计量服从χ2分布的检验方法称为χ2检验法.考虑均值未知情形下,方差的单边假设检验问题.第一步:建立假设检验问题第二步:构造检验统计量由于均值µ未知,样本方差是总体方差σ2的无偏估计且具有良好性质(是UMVUE).当H0成立时并考虑到备择假设,S2的观察值s2与σ02的比值s2/σ02应当偏大.于是,检验拒绝域的形式为其中k
为常数,待定.取作为检验统计量.第三步:确定拒绝域的形式.其中k
为常数,待定.注:
并不服从卡方分布,但是第一类错误仍可以被控制所以当H0:σ2≤σ02成立时故第四步:确定临界值k故而要使只要由抽样分布定理知所以,检验的拒绝域为第五步:根据样本观察值x1,x2,···,xn,计算统计量的观察值,并与比较,作出判断.若,则拒绝原假设;若,则不拒绝(接受)原假设.这是单边χ2
检验.单边检验(左边检验)拒绝域为正态总体均值未知,关于总体方差σ2
的检验原假设H0备择假设H1检验统计量拒绝域(μ未知)假设检验中选取的检验统计量的分布都与χ2分布有关,上述假设检验方法称为称为χ2检验法.例5.2.7某纺织车间生产的细纱支数服从正态分布,规定标准差是1.2.从某日生产的细纱中随机抽取16根,测量其支数,得其标准差为2.1.给定显著性水平
=0.05,问细纱的均匀度是否符合规定?解:提出假设检验统计量确定拒绝域:查表得拒绝域为经计算得由于45.94>27.488,因此在显著性水平
=0.05下拒绝原假设,认为细纱的均匀度不符合规定.例5.2.8某种零件的长度服从正态分布,按规定其方差不得超过0.016.现从一批零件中随机抽取25件测量其长度,得样本方差为0.025.问能否由此判断这批零件合格?(取显著性水平
=0.01,
=0.05)解:提出假设检验统计量确定拒绝域:查表得拒绝域为经计算得由于37.5<42.98,因此在显著性水平
=0.01下,不能拒绝原假设,可以认为这批零件合格.当
=0.05时,查表得拒绝域为由于37.5>36.415,因此在显著性水平
=0.05下拒绝原假设,认为这批零件不合格.例5.2.8说明:对原假设作出的判断,在不同的显著性水平下可以得到不同的检验结果.这是因为降低犯第一类错误的概率,就会使得拒绝域减小,从而拒绝H0的机会变小,接受H0的机会变大.因此对原假设H0所作的判断,与所取显著性水平
的大小有关,
越小越不容易拒绝原假设H0.例5.2.9
某汽车配件厂在新工艺下对加工好的25个活塞的直径进行测量,得样本方差S2=0.00066.已知老工艺生产的活塞直径的方差为0.00040.问进一步改革的方向应如何?解:一般进行工艺改革时,若指标的方差显著增大,则改革需朝相反方向进行以减少方差;若方差变化不显著,则需试行别的改革方案.设测量值X~
N(μ,σ2)需考察改革后活塞直径的方差是否不大于改革前的方差?故待检验假设可设为:取检验统计量拒绝域D:落在D内,故拒绝H0.即改革后的方差显著大于改革前的方差,因此下一步的改革应朝相反方向进行.当
未知时,检验统计量为该统计量服从χ2(n)分布,在
=
0已知下关于方差的假设检验见表.当
=
0已知时,
自然用
0替换
得检验统计量正态总体均值已知,关于总体方差σ2
的检验原假设H0备择假设H1检验统计量拒绝域(μ已知)5.2.3两个正态总体均值差的检验设X1,X
2,…,Xm是来自正态总体N(μ1,σ12)的样本,
Y1,Y
2,…,Yn是来自正态总体N(μ2,σ22)的样本,且样本X1,X
2,…,Xm
和Y1,Y
2,…,Yn相互独立,分别表示两个样本的样本均值和样本方差(1)(2)(3)双边检验单边检验给定显著性水平α,讨论下列三类检验问题:分几种情况讨论一
方差已知条件下,两个正态总体均值差的检验首先考虑双边检验问题(1)因分别为μ1,μ2的无偏估计,又由的独立性及得的无偏估计(UMVUE)
.检验的拒绝域可取为如下形式其中C
为常数,待定.且当成立时因此取作为检验统计量.检验拒绝域的等价形式可取为其中k
为常数,待定.给定显著性水平为α,有得到.
因此检验的拒绝域为因此,在给定显著性水平α下,检验问题I的检验为若,则拒绝原假设;若,则不拒绝(接受)原假设.两样本U
检验原假设H0备择假设H1检验统计量拒绝域(σ12,σ22已知)两正态总体方差均已知,关于总体均值差的检验其中因此取T作为检验统计量.两样本t
检验原假设H0备择假设H1检验统计量拒绝域(σ12=σ22未知)两正态总体方差均未知但相等,关于均值差的检验例5.2.10
设甲乙两厂生产同样的灯泡,其寿命分别服从正态分布N(μ1,902)与N(μ2,962),现从两厂生产的灯泡中随机的各取60只,测得平均寿命甲厂为1150小时,乙厂为1100小时,在显著性水平
=0.05下,能否认为两厂生产的灯泡寿命无显著差异?检验统计量为解:提出假设H0:μ1=μ2
H1:μ1
≠μ2
一般来说,两个正态总体均值差的显著性检验,其实际意义是一种选优的统计方法.拒绝域为查表得计算得由于2.94>1.96,因此拒绝原假设,即在显著性水平α=0.05下,认为两厂生产的灯泡寿命有显著差异.例5.2.11
为研究正常成年男女血液红细胞平均数的差别,检验某地正常成年男子156人,女子74人,计算男女红细胞的平均数和样本标准差分别为男:女:假定正常成年男女红细胞数分别服从正态分布N(μ1,σ2)与N(μ2,
σ2),且相互独立,在显著性水平α=0.01下,检验正常成年人红细胞数是否与性别有关.解:检验问题为检验统计量为检验的拒绝域为其中查表得计算得到因此拒绝H0,即在显著性水平α=0.01下,认为正常成年人的红细胞数与性别有关.例5.2.12某物质在处理前和处理后分别抽样分析其含脂率如下:处理前:(X)0.19,0.18,0.21,0.30,0.41,0.12,0.27处理后:(Y)0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12假定处理前后的含脂率都服从正态分布,且方差相同,相互独立,在显著性水平α=0.05下,处理前后的含脂率的平均值是否有显著变化?.检验统计量为代入T中,得T的观测值t为故在显著水平0.05下拒绝H0,即认为处理前后含脂率的平均值有显著变化.解:检验问题为记,则且Z1,Z
2,…,Zn独立同分布,因此Z1,Z
2,…,Zn可视为从总体抽取的样本,且于是对于如下配对的问题,换个角度思考:三
方差均未知,但样本容量m=n时,总体均值差的检验因此可以利用单个正态总体均值的t
检验方法,检验问题为用于配对试验!!检验的拒绝域为成对比较问题原假设H0备择假设H1检验统计量拒绝域(σ12
,σ22未知,m=n)两正态总体方差均未知,但m=n,关于均值差的检验一般来说,两个正态总体均值差的显著性检验,其实际意义是一种选优的统计方法,至于多个正态总体均值之间差异的显著性检验,在方差分析以及正交试验设计内容中会进一步介绍.5.2.4两个正态总体方差比的检验设X1,X
2,…,Xm
是来自正态总体N(μ1,σ12)的样本,
Y1,Y
2,…,Yn
是来自正态总体N(μ2,σ22)的样本,且样本X1,X
2,…,Xm
和Y1,Y
2,…,Yn独立,分别表示两个样本的样本均值和样本方差给定显著性水平α,讨论下列三类检验问题:(1)(2)(3)双边检验单边检验首先考虑双边检验问题(1)主要讨论μ1,μ2未知时,方差比的检验.由于和
分别是和的无偏估计,并具有优良性质(UMVUE).接近1(H0下)检验的拒绝域可取为如下形式其中c1
和
c2
为常数,待定.在成立条件下检验统计量检验的拒绝域为原假设H0备择假设H1检验统计量拒绝域F
≥
Fα/2(m-1,n-1)或F
≤
F1-α/2(m-1,n-1)
F
≤
F1-α
(m-1,n-1)
F
≥
Fα/
(m-1,n-1)两正态总体均值未知,关于总体方差比的检验(μ1
μ2未知)假设检验中选取的检验统计量的分布都与F分布有关,这种检验方法称为F
检验法.原假设H0备择假设H1检验统计量拒绝域F*≥
Fα/2(m,n)或F*≤
F1-α/2(m,n)
F*≤
F1-α
(m,n)
F*≥
Fα/
(m,n)两正态总体均值已知,关于总体方差比的检验(μ1
μ2已知)例5.2.14甲乙两台机器加工同种零件,分别从两台机器加工的零件中随机抽取8个和9个测量其直径,得样本均值分别为,样本方差分别为
假定零件直径分别服从正态分布
,(1)在显著性水平
=0.1下,问方差是否相等?(2)在显著性水平
=0.1下,问均值是否相等?解:(1)提出假设检验统计量为由于0.27<0.92<3.50查表得计算得拒绝域为因此不能拒绝原假设,在显著性水平α=0.1下,可以认为两台机器生产的零件直径的方差相等。(2)提出假设
H0:μ1=μ2H1:μ1≠μ2
根据(1)得到两台机器生产的零件直径的方差相等,故取检验统计量为拒绝域为拒绝域为查表得计算得由于1.71<1.7531因此不能拒绝原假设,在显著性水平α=0.1下,可以认为两台机器生产的零件直径的均值相等.例5.2.15分别用国产测量仪器和进口同类测量仪器测量某物体11次,分别得11个数据.计算得两组数据的样本方差分别为
,假定国产和进口测量仪器的测量值分别服从正态分布
.在显著性水平
=0.05下,问国产测量仪器是否比进口的同类测量仪器好?解:提出假设检验统计量为拒绝域为查表得计算得由于0.295<0.336拒绝域为因此拒绝原假设,即在显著性水平α=0.05下,认为国产测量仪器比进口的同类测量仪器好.作业:习题5.2:5,7,9,12,15,
17,21
在上一节中,我们已经介绍了正态总体参数假设检验问题的有关方法.然而,现实中许多分布并非正态分布,因此需要借助其它分布下的假设检验问题来进行判断.
本节我们将讲解非正态总体分布的参数假设检验问题.5.3非正态总体参数的假设检验设总体X服从指数分布,其密度函数为5.3.1小样本方法一指数分布参数的假设检验其中,λ>0为未知参数,X1,X2,···,Xn是来自总体X的样本.其中λ0
为已知常数.对参数λ提出如下几种假设检验问题.(1)(2)(3)双边检验单边检验由于是1/λ的无偏估计,因此应当接近1当原假设成立时,接近1,既不太大也不太小,于是检验拒绝域的形式为首先:讨论检验问题(1)其中A1为适当小的正数,A2为适当大的正数,且A1<A2,均由显著性水平α
确定.拒绝域的等价形式为其中C1
和
C2
为常数,待定.由于,因此当成立时对于给定的显著性水平α通常取由此有因此检验问题I的拒绝域为于是,检验问题(1)的检验法为若,则拒绝原假设H0;若,则不拒绝原假设H0
.由于是1/λ的无偏估计,因此应当接近1当原假设成立并考虑备择假设,偏大于是检验拒绝域的形式为拒绝域的等价形式为其中C
为常数,由显著性水平α
确定.讨论检验问题(2)且由此有因此检验问题(2)的拒绝域为当H0
:λ
≤
λ0
成立时检验问题(2)的拒绝域为检验问题(3)的拒绝域为前面讨论的小样本情况下的假设检验问题,利用有关分布的特性构造了各种检验统计量,并利用与检验统计量有关随机变量的精确分布,求出了具有指定水平的检验.然而,检验总体参数的统计量的精确分布,通常很难找到或者很复杂不便于使用.此时,往往借助于样本容量n
充分大时统计量的极限分布对总体参数做近似检验,而这种检验所用的样本必须是大样本.但是没有一个标准可用来决定样本容量多大就算是大样本,因为这与所采用的统计量趋于它的极限分布的速度快慢有关,没有一个标准的答案.一般的,n越大近似检验就越好,而且使用上至少要求n不小于30最好大于50或者100.本章开始曾以电视节目收视率的问题引入了假设检验的基本概念.事实上此类问题是关于两点分布和二项分布中参数p的假设检验问题.当样本容量增大时,可以通过极限分布来对样本进行检验.在本节中我们以二项分布为例来介绍大样本情况下利用中心极限定理进行假设检验的方法.5.3.2大样本方法设总体X服从两点分布,即X~
B(1,p),0<p<1,
X1,X
2,…,Xn
是来自总体X的样本,对给定的显著性水平α,检验假设(1)(2)(3)其中p0是已知常数,且0<p0<1.(1)由于,根据中心极限定理当原假设成立时,统计量的极限分布为标准正态分布N(0,1),即当n趋于∞时于是当H0
成立且n
充分大时,有若,则拒绝原假设;若,则不拒绝(接受)原假设.(2)(3)若,则拒绝原假设;若,则不拒绝(接受)原假设.若,则拒绝原假设;若,则不拒绝(接受)原假设.例5.3.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 旅游行业虚拟现实与增强现实旅游体验方案
- 超市财务工作总结
- 乡村绿化与景观设计方案
- 产品设计与开发手册
- 防火防溺水安全知识进农村
- 隔离病房终末消毒流程
- 游戏行业防沉迷系统设计预案
- 静脉治疗在临床中的应用
- 初中地理模拟考试2025年:地理环境与可持续发展教育理念解读试题集
- 2025年婚姻家庭咨询师职业技能鉴定试卷(亲子教育方向)案例分析
- 餐厅饭店顾客意见反馈表格模板(可修改)
- 脑梗死后遗症 护理查房课件
- 会员体系深度运营
- 王阳明:心学的力量
- 如何制定护理教学计划课件
- GB/T 15622-2023液压缸试验方法
- 110kV升压站构支架组立施工方案
- CONSORT2010流程图(FlowDiagram)【模板】文档
- 2014年林产化工松香深加工行业分析报告
- 武汉东湖学院学术汇报毕业答辩PPT模板
- 伊金霍洛旗净菜加工项目实施方案
评论
0/150
提交评论