应用统计学第六章参数假设检验_第1页
应用统计学第六章参数假设检验_第2页
应用统计学第六章参数假设检验_第3页
应用统计学第六章参数假设检验_第4页
应用统计学第六章参数假设检验_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学第六章参数假设检验第1页,共126页,2023年,2月20日,星期六假设检验假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。参数假设是对总体参数的一种看法。总体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。参数假设检验是通过样本信息对关于总体参数的某种假设合理与否进行检验的过程。即先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如果不成立就放弃这个假设。我认为该企业生产的零件的平均长度为4厘米!第2页,共126页,2023年,2月20日,星期六第3页,共126页,2023年,2月20日,星期六一、假设检验问题的提出二、假设检验的一般步骤第6.1节假设检验的基本概念第4页,共126页,2023年,2月20日,星期六一、假设检验问题的提出引例(女士品茶问题)一种饮料由牛奶与茶按一定比例混合而成,可以先倒茶后倒牛奶(记为TM)或反过来(MT)。某女士声称,她可以鉴别是TM还是MT。设计如下试验,来检验她的说法是否可信。准备8杯饮料,TM和MT各半,把它们随机的排成一列让该女士品尝,并告诉她TM和MT各有4杯,然后请她指出哪4杯是TM。结果她都说对了。请你判断该女士是否有鉴别力!若该女士只说对了3杯,又会得到怎样的结论?第5页,共126页,2023年,2月20日,星期六参数假设检验举例例1:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。这是一个关于总体均值的假设检验问题。第6页,共126页,2023年,2月20日,星期六参数假设检验举例例2:某公司进口一批钢筋,根据要求,钢筋的平均拉力强度不能低于2000克,而供货商强调其产品的平均拉力强度已达到了这一要求,这时需要进口商对供货商的说法是否真实作出判断。进口商可以先假设该批钢筋的平均拉力强度不低于2000克,然后用样本的平均拉力强度来检验假设是否正确。这也是一个关于总体均值的假设检验问题。第7页,共126页,2023年,2月20日,星期六参数假设检验举例例3:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于250克。若规定食品不符合标准的比例达到5%就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过5%,然后用样本不合格率来检验假设是否正确。这是一个关于总体比例的假设检验问题。第8页,共126页,2023年,2月20日,星期六假设检验的思想:1、有一个明确的命题或假设H;2、当H

成立时,考虑某一变量X

的性质,在女士品茶问题中,考虑X

为该女士说对的杯数,注意此时X

的分布已知;3、以x

表示X

的观测值,考虑P(X=x)=px,px越小,试验结果越不利于H;4、根据规定的小概率事件,做出最后的决策。第9页,共126页,2023年,2月20日,星期六假设检验的基本原理假设检验所依据的基本原理是小概率原理。什么是小概率?概率是0~1之间的一个数,因此小概率就是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第10页,共126页,2023年,2月20日,星期六什么是小概率原理?小概率原理——发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。第11页,共126页,2023年,2月20日,星期六如果假设这批产品的次品率P≤4%,则可计算事件“抽10件产品有4件次品”的出现概率为:

小概率原理举例:某工厂质检部门规定该厂产品次品率不超过4%方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?

可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P≤4%,因而认为假设次品率P≤4%是不能成立的,故按质检部门的规定,这批产品不能出厂。第12页,共126页,2023年,2月20日,星期六注意:在假设检验中“拒绝”和“接受”反映了决策者在所面对的样本证据下,对该命题所采取的一种态度、倾向性,而不是在逻辑上“证明”该命题正确与否!第13页,共126页,2023年,2月20日,星期六假设检验的思想企图肯定什么事情很困难,而否定却相对容易得多!概率论中的反证法!(依据小概率事件原理)第14页,共126页,2023年,2月20日,星期六分析:例1、某厂生产的合金强度服从正态分布N(θ,16),其中θ的设计值为不低于110(Pa).为保证质量,该厂每天都要对生产情况例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa).某天从生产中随机抽取25块合金,测得强度值为x1,….,x25,其平均值为=108(Pa),问当日生产是否正常?1、本题要求根据样本的信息对命题“合金的平均强度不低于110(Pa)”作出判断.因此是假设检验问题.

第15页,共126页,2023年,2月20日,星期六2、命题“合金的平均强度不低于110(Pa)”正确与否仅涉及参数θ,因此该命题是否正确将涉及如下两个参数集合:命题成立对应于“θΘ0”,命题不成立对应于“θΘ1”。称这两个非空参数集合为(统计)假设。第16页,共126页,2023年,2月20日,星期六“假设不正确”——拒绝该假设;

“假设正确”——不拒绝该假设

。3、目的是利用所给总体N(θ,16)和样本均值=108(Pa)来判断假设“θΘ0”是否成立。“判断”在统计学中称为检验或检验准则。此准则是在解决问题时首先要确定的,有了它,检验结果有两种:第17页,共126页,2023年,2月20日,星期六例1、某厂生产的合金强度服从正态分布N(θ,16),其中θ的设计值为不低于110(Pa).为保证质量,该厂每天都要对生产情况例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa).某天从生产中随机抽取25块合金,测得强度值为x1,….,x25,其平均值为=108(Pa),问当日生产是否正常?二、假设检验的一般步骤第18页,共126页,2023年,2月20日,星期六1建立假设在假设检验中,把被检验的假设称为原假设,记为也称零假设,通常将不应轻易加以否定的假设作为原假设。当H0

被拒绝时而接受的假设称为备择假设。记为也称为对立假设。例如:例1的统计假设分别为表示H0对H1的假设检验问题.简记为第19页,共126页,2023年,2月20日,星期六2检验法则---选择检验统计量,给出拒绝域形式

由样本对原假设进行判断需要通过一个统计量来完成,称之为检验统计量。

使原假设被拒绝的样本观测值所在的区域称为拒绝域(或否定域、临界域).它是样本空间的一个子集,记为W。

如例1中,要检验的假设是正态总体的均值,在方差已知时,样本均值是个很好的检验统计量。第20页,共126页,2023年,2月20日,星期六

当拒绝域确定后,检验准则依之确定:若(x1,…,xn)W,则认为H0不成立.若(x1,.,xn),则认为H0成立;

称为接受域.

如例1中,若110

与样本均值的差过分地大,

即则应拒绝H0.因此在样本均值的取值中存在一个临界值c(待定),

拒绝域应为第21页,共126页,2023年,2月20日,星期六原假设H0在客观上只有两种可能:真、假。即有下面四种情况:(1)、假设检验的两类错误3选择显著性水平样本值(x1,…,xn)也只有两种可能性:属于拒绝域W、不属于W。1)H0真,而(x1,…,xn)W;——拒绝H02)H0真,而(x1,…,xn)W;——接受H03)H0假,而(x1,…,xn)W;——拒绝H04)H0假,而(x1,…,xn)W;——接受H0第一类错误(拒真错误)第二类错误(受伪错误)第22页,共126页,2023年,2月20日,星期六记犯第一类错误的概率为α,即记犯第二类错误的概率为β,即

α=P{拒绝H0|H0为真}=Pθ(XW),θΘ0

β=P{接受H0|H1为真}=Pθ(XW),θΘ1第23页,共126页,2023年,2月20日,星期六

假设检验的两类错误H0为真实际情况决定(观测数据情况)接受H0H0不真犯第一类错误正确(不犯第二类错误)正确(不犯第一类错误)犯第二类错误P{拒绝H0|H0为真}=,P{接受H0|H1为真}=.

犯两类错误的概率:拒绝H0第24页,共126页,2023年,2月20日,星期六(2)显著性水平

则称该检验是显著性水平为α的显著性检验,简称水平为α的检验。如果一个检验满足犯第一类错误的概率≤α,

定义:设检验问题第25页,共126页,2023年,2月20日,星期六注:水平为α的检验就是要求犯第一类错误的概率不超过α.

一般地取α=0.05、α=0.10或α=0.01。即:犯第一类错误的概率是个小概率事件,小概率事件在一次随机试验中几乎不发生.若H0

真,也即,H0

成立下的小概率事件发生了,那么就认为H0不可信而拒绝它.否则就不能否定H0

(只好接受它).这就是假设检验的基本思想。第26页,共126页,2023年,2月20日,星期六4给出拒绝域在规定了检验的显著性水平α后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。对于正态总体,总体均值的假设检验可有如下图示:第27页,共126页,2023年,2月20日,星期六正态总体,总体均值假设检验图示:

(1)双侧检验设H0:X=X0,H1:X≠X0,有两个临界值,两个拒绝域,每个拒绝域的面积为α/2。也称双尾检验。双侧检验示意图X0第28页,共126页,2023年,2月20日,星期六双侧检验示意图

(显著性水平与拒绝域)

抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-置信水平第29页,共126页,2023年,2月20日,星期六双侧检验示意图

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平观察到的样本统计量第30页,共126页,2023年,2月20日,星期六双侧检验示意图

(显著性水平与拒绝域)

H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平观察到的样本统计量第31页,共126页,2023年,2月20日,星期六双侧检验示意图

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平观察到的样本统计量第32页,共126页,2023年,2月20日,星期六(2)单侧检验

有一个临界值,一个拒绝域,拒绝域的面积为α。分为左侧检验和右侧检验两种情况。

单侧检验示意图(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平第33页,共126页,2023年,2月20日,星期六左侧检验设H0:X≥X0,H1:X<X0;临界值和拒绝域均在左侧。也称下限检验。X0第34页,共126页,2023年,2月20日,星期六左侧检验示意图

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第35页,共126页,2023年,2月20日,星期六左侧检验示意图

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第36页,共126页,2023年,2月20日,星期六右侧检验设H0:X≤X0,H1:X>X0;临界值和拒绝域均在右侧。也称上限检验。X0第37页,共126页,2023年,2月20日,星期六右侧检验示意图

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第38页,共126页,2023年,2月20日,星期六右侧检验示意图

(显著性水平与拒绝域)

H0值临界值a样本统计量接受域抽样分布1-置信水平拒绝域观察到的样本统计量第39页,共126页,2023年,2月20日,星期六4给出拒绝域在确定显著性水平后,可以确定检验的拒绝域W.

如在上面例1中,

取α=0.05,要使对任意的θ≥110有由于g(θ)为θ的减函数。只要又标准正态分布的0.05分位数,所以即检验的拒绝域或令,则即θ∈Θ0P155第40页,共126页,2023年,2月20日,星期六注:考虑若θ的真实值为108时,对应犯第二类错误的概率为原假设被特别保护起来,如果没有充分的理由,不能轻易拒绝!第41页,共126页,2023年,2月20日,星期六注:确定H0与H1的一般原则:①若问题只提出一个假设,且检验的目的仅仅是为了判别这个假设是否成立,并不同时研究其它假设,则直接取该假设作为原假设H0即可.②在实际问题中,若是问新方法(新材料、新工艺、新配方之类)是否比原方法好,通常将原方法取为“原假设H0”,而将新方法取为“备择假设H1”.且在处理H0时总是偏于保守的,在没有证据时不轻易拒绝H0.③还要考虑数学上的处理方便来设定H0与H1.第42页,共126页,2023年,2月20日,星期六5作出判断有了明确的拒绝域W

后,由样本观测值可以做出判断:第43页,共126页,2023年,2月20日,星期六假设检验的步骤1、提出假设,建立H0与H13、根据给定显著性水平,

查临界值并确定拒绝域4、作出判断,接受或拒绝原假设.2、确定检验统计量及其分布,并由给定的样本值计算统计量的值

假设统计量查表判断第44页,共126页,2023年,2月20日,星期六第45页,共126页,2023年,2月20日,星期六第46页,共126页,2023年,2月20日,星期六第47页,共126页,2023年,2月20日,星期六第48页,共126页,2023年,2月20日,星期六第49页,共126页,2023年,2月20日,星期六设X~N(2),2已知,需检验:1.H0:0;H1:02.构造统计量

给定显著性水平与样本值(x1,x2,…,xn)小结:关于的检验(2已知)第50页,共126页,2023年,2月20日,星期六4.判断,若则拒绝原假设,接受对立假设,认为0

3.根据,

查临界值。第51页,共126页,2023年,2月20日,星期六第52页,共126页,2023年,2月20日,星期六

已知,故应选择检验统计量由题中条件和计算得:第53页,共126页,2023年,2月20日,星期六第54页,共126页,2023年,2月20日,星期六第55页,共126页,2023年,2月20日,星期六第56页,共126页,2023年,2月20日,星期六第57页,共126页,2023年,2月20日,星期六设X~N(2),2未知,需检验:1.H0:0;H1:02.构造统计量~t(n-1)

给定显著性水平与样本值(x1,x2,…,xn)小结:关于的检验(2未知)第58页,共126页,2023年,2月20日,星期六4.判断,若则拒绝原假设,接受对立假设,认为0

3.根据,

查临界值。第59页,共126页,2023年,2月20日,星期六练习:

已知某公司生产某种灯管,公司经理称,他们的产品平均使用寿命为三年,为检验他的说法,随机抽取5个灯管。测得寿命数据为1.3,4.1,4.8,3.4,2.9(单位:年),已知灯管使用寿命服从正态分布,请检验经理的说法是否正确?显著水平为0.05.第60页,共126页,2023年,2月20日,星期六第61页,共126页,2023年,2月20日,星期六µ>µ0第62页,共126页,2023年,2月20日,星期六注意:P180第63页,共126页,2023年,2月20日,星期六改第64页,共126页,2023年,2月20日,星期六第65页,共126页,2023年,2月20日,星期六第66页,共126页,2023年,2月20日,星期六第67页,共126页,2023年,2月20日,星期六第68页,共126页,2023年,2月20日,星期六第69页,共126页,2023年,2月20日,星期六第70页,共126页,2023年,2月20日,星期六第71页,共126页,2023年,2月20日,星期六设X~N(2),需检验2

:1.H0:

H1:2.构造统计量给定显著性水平与样本值(x1,x2,…,xn)小结:关于2

的检验,未知2=02202第72页,共126页,2023年,2月20日,星期六4.判断,若则拒绝原假设,接受对立假设,认为2023.根据,

查临界值。第73页,共126页,2023年,2月20日,星期六练习:某种溶液的成分(%)服从正态分布,现由10个样本观测值计算平均值为0.452,s=0.037,请检验是否成立?(=0.10)(1)(2)第74页,共126页,2023年,2月20日,星期六(4)(3)第75页,共126页,2023年,2月20日,星期六接下去,自己完成。2.未知均值µ,检验假设:总体方差σ2>σ02是否成立第76页,共126页,2023年,2月20日,星期六6.2.4区间估计与假设检验的关系抽样估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的先验假设是否成立。㈠区间估计与假设检验的主要区别1.区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;2.区间估计立足于大概率,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。第77页,共126页,2023年,2月20日,星期六㈡区间估计与假设检验的联系1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。第78页,共126页,2023年,2月20日,星期六用置信区间进行检验

(例题分析)【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(α=0.05)双侧检验!香脆蛋卷第79页,共126页,2023年,2月20日,星期六用置信区间进行检验(例题分析)解:提出假设:

H0:X

=1000H1:X

1000已知:n=16,σ=50,=0.05双侧检验/2=0.025

临界值:Z0.025=±1.96置信区间为决策:结论:

X

=1000

在置信区间内,不拒绝H0可以认为这批产品的包装重量合格Z01.96-1.960.025拒绝H0拒绝H00.025第80页,共126页,2023年,2月20日,星期六第81页,共126页,2023年,2月20日,星期六第82页,共126页,2023年,2月20日,星期六第83页,共126页,2023年,2月20日,星期六第84页,共126页,2023年,2月20日,星期六第85页,共126页,2023年,2月20日,星期六第86页,共126页,2023年,2月20日,星期六第87页,共126页,2023年,2月20日,星期六第88页,共126页,2023年,2月20日,星期六第89页,共126页,2023年,2月20日,星期六第90页,共126页,2023年,2月2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论