数理统计课件:假设检验的基本概念_第1页
数理统计课件:假设检验的基本概念_第2页
数理统计课件:假设检验的基本概念_第3页
数理统计课件:假设检验的基本概念_第4页
数理统计课件:假设检验的基本概念_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验的基本概念为了说明假设检验问题,首先看几个具体例子.例5.1.1某车间生产的钢管直径X服从正态分布N(µ,0.52),其中µ未知.按照规定,为确保该批钢管能够与其它零件匹配,生产的钢管平均直径应为100mm.现从一批钢管中随机抽取10根,测得其直径的平均值为100.15mm

.目的:如何根据抽样的结果判断钢管的平均直径是否为μ=100问题:该批生产的钢管是否符合规定?证据:钢管直径的平均值为100.15mm.

例5.1.2假设电视节目的收视服从伯努利分布.有人断言某电视节目的收视率p

超过30%.为判断该断言正确与否,通过调查问卷的方式随机调查了50人,调查结果显示有10人观看过该节目.目的:如何根据抽样的结果判断电视节目的收视率p

超过30%.问题:该断言是否合适?证据:随机调查了50人,调查结果显示有10人观看过该节目.例5.1.3根据以往经验,某建筑材料的抗断强度指标X服从正态分布,现在改变了该材料的生产配方并进行新的生产流程,从新材料中随机抽取100件测其抗断强度.目的:如何根据抽样的结果判断新材料的抗断强度指标Y

是否仍服从正态分布?问题:新材料的抗断强度指标Y

是否仍服从正态分布?证据:从新材料中随机抽取100件测其抗断强度..假设检验的基本任务通过从有关总体中抽取一定数量的样本,利用样本对未知总体分布的某些方面(如总体均值、总体方差、总体分布本身等等)的假设作出合理的判断.

例5.1.1和例5.1.2都是需要对总体分布的参数做出检验,因此它们是参数假设检验.

例5.1.3是对总体分布的检验,是非参数假设检验.

结合这几个例子,在本节中,我们将介绍假设检验的基本概念,并给出求解假设检验的步骤.5.1.1检验问题的提出例5.1.1某车间生产的钢管直径X服从正态分布N(µ,0.52),其中µ未知.按照规定,为确保该批钢管能够与其它零件匹配,生产的钢管平均直径应为100mm.现从一批钢管中随机抽取10根,测得其直径的平均值为100.15mm

.根据题意:X~N(µ,0.52),记µ0=100.由于这种假设是人为加上的,不一定成立.当H0不成立时,另一种推断为该批钢管的均值已经不再是100mm,记作H1

:μ

100H0

:μ=100因此钢管是否符合要求是指平均直径是µ

=µ0

还是µ

µ0

.若相等就表示符合要求,否则就要进行停产检查.根据以往经验,我们可先假设该批钢管符合要求,即µ

=100,记作第一步:我们提出一个假设它叫做原假设或零假设.另一个可能是叫做备择假设或对立假设.该问题化为接受H0,还是接受H1.在数学上我们记为H1

:μ

100H0

:μ=100H0

:μ=100;H1

:μ

100设有参数分布族,其中Θ为参数空间.设X1,X

2,…,Xn是从上述分布族中的某总体抽取的样本.在参数假设检验问题中,感兴趣的是参数θ是否属于参数空间Θ的某个非空真子集Θ0,则H0:θ∈Θ0称为原假设或零假设.确切含义是:检验是否存在一个θ0∈Θ0使得X的分布为f(x,θ0)

.

记Θ1

Θ

-

Θ0,则命题H1:θ∈Θ1称为H0的对立假设或备择假设.注意:这个提法中将原假设H0放在中心位置,H0和H1的地位不一样,位置不可更换.原因:我们关心的是θ∈Θ0是否成立.在假设检验问题中,我们需要利用样本提供的信息(即数据)来检验原假设H0成立还是备择假设H1成立.原假设H0写在左边,作为中心位置;备择假设H1写在右边,作为陪衬地位.例5.1.1中,Θ0

取为{100},Θ1取为R-{100},H0是简单假设,H1是复合假设;例5.1.2中,原假设中取Θ0

=[0.3,1],

备择假设中取Θ1=[0,0.3),H0是复合假设,H1是复合假设;若Θ0或Θ1中只包含参数空间Θ中一个点,则称为简单假设;否则称为复合假设.例如样本抽自正态总体N(μ,σ2),其中σ2已知.参数空间如果则H0为简单原假设,H1为复合备择假设如果此时H0为复合原假设,H1为复合备择假设.说明:原假设和备择假设都是总体分布族的子分布族.5.1.2拒绝域、检验函数和随机化检验继续讨论例5.1.1.例5.1.1

设X1,X

2,…,Xn为从正态总体N(μ,σ2)中抽取的样本,其中σ2已知.考虑检验问题其中μ0为给定的常数.问题:接受H0还是接受H1?求μ的一个良好的点估计:是μ的UMVUE.若较大,认为样本与原假设H0有差异,倾向于拒绝H0.若较小,认为样本与原假设H0相近,倾向于接受H0.具体的说,确定一个常数,由X1,X

2,…,Xn算出样本均值,若时,拒绝H0.若时,接受H0.统计量称为检验统计量,它衡量数据(样本)与原假设之间的差异程度,可以看成数据与原假设之间的一种距离.第二步:构造检验统计量称为否定域,或叫做拒绝域.拒绝域是由样本空间χ

中一切使的那些样本X1,X

2,…,Xn构成.有了拒绝域,等价于将样本空间χ分成不相交的两部分D和.一旦有了样本(X1,X

2,…,Xn

),当(X1,X

2,…,Xn

)∈D

时,拒绝H0;当

时,接受H0;称

为接受域.第三步:确定拒绝域的形式.T

给出了一种法则,一旦有了样本,就可以在拒绝H0或接受H0这两个结论中选择一个.称这样一种法则T为检验问题一个检验.称用于分割出D

和的数值为假设检验的临界值.只要临界值

定下来,拒绝域(即否定域)也就确定了.因此,此问题中的检验可视为如下一种法则为了数学处理方便.引入检验函数

φ(x)的概念,φ(x)与检验T

是一一对应,在例5.1.1中由式给出的检验函数

φ(x)是定义在样本空间χ上,取值于[0,1]上的函数.由定义可见,若φ(x)=1,则以概率1拒绝H0;若φ(x)=0,则以概率0拒绝H0.若φ(x)只取0和1这两个值,称这种检验为非随机化检验.拒绝域可用检验函数表示如下若存在样本点x,有0<φ(x)<1,则称φ(x)为随机化检验.随机化检验在可靠性统计中常涉及.在例5.1.1中,如果样本正好落在拒绝域与接受域的边界上,而买方以此为由拒绝购买该批钢管,此时厂方被拒绝的可能性大了,厂方觉得吃亏;如果厂方认为该批钢管没有问题,则买方收到不合格产品的可能性大了,买方觉得吃亏.以下讨论假定φ(x)皆为非随机化的检验函数,

除非特别声明,不认为φ(x)为随机化检验函数.此时,可以事先规定一个概率,使得该批钢管以概率p0被接受.当概率p0给定后,可以借助装着小球的盒子或者不均匀的骰子等来确定是否接受该批产品.此时检验函数为在确定拒绝域和检验函数后,我们需要确定临界值.临界值的确定基于以下原则:第四步:确定临界值.由于在未获得外部信息的情况下,我们通常更愿意相信原假设继续成立,即状态并未发生变化.当在原假设成立的情况下小概率事件频繁出现时,我们才会倾向于相信原假设已经不成立,状态发生了改变.基本思想:实际推断原理,也称小概率原理.5.1.3两类错误和功效函数统计推断是以样本为依据,由于样本的随机性,不能保证统计推断方法的绝对正确性,而只能以一定的概率去保证这种推断的可靠性.在假设检验问题中可能犯两类错误.(1)当原假设H0成立时拒绝原假设,称这类错误为第一类错误(或弃真错误),其发生的概率称为犯第一类错误的概率(或弃真概率);(2)原假设H0本来不正确,但却接受了H0,称这类错误为第二类错误(或取伪错误),其发生的概率称为犯第二类错误的概率(或取伪概率)假设检验的两类错误真实情况所作判断接受

H0拒绝

H0H0

为真H0

为假正确正确第一类错误

(弃真错误)第二类错误

(取伪错误)犯第一类错误的概率=P{第一类错误}

=P{当H0为真时拒绝

H0}犯第二类错误的概率=P{第二类错误}

=P{当H0不真时接受

H0

}在确定了两类错误的概念后,我们希望进一步用函数来刻画这两种概率.为此,需要引进功效函数的概念.设φ(x)是的一个检验函数,则函数称为φ的功效函数,也称为效函数或势函数.若检验函数φ(x)为非随机化检验,拒绝域为D,则此时功效函数表示当参数为θ时,拒绝原假设H0的概率.定义5.1.1(功效函数)利用功效函数计算两类错误的概率.以和分别表示犯第一和第二类错误的概率,则犯第一类错误的概率为犯第二类错误的概率为说明1.当样本容量确定后,犯两类错误的概率不可能同时减少.2.假设检验的指导思想是控制犯第一类错误的概率不超过α,然后,尽可能的减少第二类错误的发生.这里就能看出假设检验原假设与备择假设地位是不可互换的.一个好的检验φ(x),犯两类错误的概率都应该较小.即:功效函数γφ(θ)

在Θ0中应该尽可能的小,

功效函数γφ(θ)在Θ1中应该尽可能的大.犯两类错误的概率完全由功效函数决定,因此如果两个检验有同一功效函数,则该检验在性质上也完全相同.Neyman—Pearson提出以下原则控制犯第一类错误概率的原则,即在保证犯第一类错误的概率不超过指定数值α(

0<α<1,通常取较小的数)的检验中,寻找犯第二类错误的概率尽可能小的检验.5.1.4显著性检验若记:Sα表示由所有犯第一类错误的概率都不超过α的检验函数构成的类.只考虑Sα中的检验,在Sα中挑选“犯第二类错误的概率尽可能小的检验”.这种法则称为控制犯第一类错误概率的法则.关于原假设与备择假设的选取根据Neyman—Pearson原则,在原假设H0为真时,作出错误决定(即拒绝H0)的概率受到了控制.在控制犯第一类错误的概率α的原则下,使得采取拒绝H0

的决策变得较慎重,即H0得到特别的保护,不轻易被拒绝.因而,通常把有把握的、有经验、不能轻易否定的命题作为原假设,或者尽可能使后果严重的错误成为第一类错误.把没把握的、不能轻易肯定的命题作为备择假设.原假设H0与H1地位不平等.既然我们不能同时控制一个检验的两类错误,那么我们不妨先考虑一个简单些的问题,仅仅去限制第一类错误:设φ(x)是检验问题的一个检验函数,而0≤α≤1.如果检验φ(x)犯第一类错误的概率总不超过α或者等价的:检验φ满足γφ(θ)≤α,一切θ∈Θ0.则称α是检验φ(x)的一个水平,而φ(x)称为显著性水平为α的检验,简称水平为α的检验.定义5.1.2(显著性检验):按照上述定义,检验的水平不唯一.若α为检验φ(x)的水平,而α<α’<1,则α’也是检验φ(x)的水平.为避免这一问题,有时称一个检验的最小水平为其真实水平,即检验φ的真实水平.习惯上把水平α取得比较小且标准化如α=0.01,0.05,0.10等.标准化是为了查表方便.水平的选取,对检验的性质有很大影响.若水平选的低,那么容许犯第一类错误概率很小.而为了达到这一点势必大大缩小拒绝域,使接受域扩大,从而增加了犯第二类错误的概率.反之,若水平选的高,那么容许犯第一类错误概率很大.而为了达到这一点势必扩大拒绝域,使接受域缩小,从而犯第二类错误的概率相应降低.当一个检验涉及双方利益时,水平的选定常常是双方协

议的结果.2犯两种错误的后果一般在性质上有很大不同.如果犯第一类错误的后果在性质上很严重,就力求在合理的范围内尽量减少犯这种错误的可能性,此时相应的水平取得更低一些.一般来说,试验者在试验前对问题的情况总不是一无所知.他对问题的了解使他对原假设是否能成立就有了一定的看法,这种看法可能影响他对水平的选择.若水平α很小,原假设H0不会轻易被否定,如果样本落入拒绝域,作出“拒绝原假设”的结论比较可靠.反之,当水平α很小时,如果样本落入接受域,作出“接受原假设”的结论未必可靠.说明:在所选定的水平下没有充分根据拒绝H0,但是,绝不意味着有充分根据说明它正确.(此时会犯第二类错误,其概率很大)说明:1.显著性检验中拒绝原假设H0是在概率意义下进行严格推理得到的结论,因此拒绝原假设意味着有充分的证据表明原假设H0不成立;2.接受原假设H0并不意味着H0充分成立,只能说明在当前的样本下没有充分的证据拒绝H0的成立.当原假设

H0

成立时,回到例5.1.1:确定C.拒绝域为原假设H0

:μ=100;备择假设H1

:μ

100进一步,有对于给定显著性水平α,由标准正态分布分位数的定义,有即当原假设H0成立时,是概率为α的小概率事件,小概率事件在一次试验中几乎不可能发生.若在一次试验中出现了,则有充分的证据表明“原假设H0成立”是错误的,因而拒绝H0;反之,若在一次抽样中,有,就没有充分的理由拒绝原假设H0,从而承认H0成立.借助显著性水平的概念,由样本观察值计算得的观察值时,可以将判断准则T

改写为第五步:根据样本观察值作出是否拒绝H0的判断.例5.1.1中,根据题目条件得到由于0.95<1.96,因此不能拒绝原假设,可以认为该批生产的钢管符合要求.且有对于给定显著性水平α=0.05,查表得到在假设检验中,原假设是处于被保护的地位.这种保护是符合实际需求的.这是因为检查钢管直径是否符合要求将会产生多余的成本.如果没有充分的理由来支持钢管直径不符合要求,我们倾向于认为这批钢管是符合要求的.鉴于原假设H0的特殊地位,在建立假设检验问题时,我们通常选择有把握的、不能轻易改变的或存在已久的状态作为原假设.除去该准则外,另一个选取原假设H0的准则是选取违反该条件后将产生严重后果的准则作为原假设,从而可以将出现重大错误的可能性控制在较小的范围内.在实际问题中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论