




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验参数估计与假设检验的关系参数估计和假设检验是推断统计方法的两个重要组成部分。
◆共同点:都是利用样本信息对总体数量特征进行推断。
◆不同点:推断的角度不同。参数估计——是用样本统计量估计总体参数,总体参数在估计前是未知的。假设检验——是先对总体参数的值提出一个原假设,然后利用样本信息来检验和判断这个原假设是否成立(即判断样本信息与原假设之间是否存在显著差异)。若成立,我们就接受原假设;不成立,就拒绝原假设。
【例1】某牙膏厂用自动包装机装牙膏,正常情况下,每支牙膏内装入的牙膏量(单位:g)X~N(50,1.22),某日从生产中随机地抽取16支牙膏,测得平均每支牙膏的净重为50.72g,问这天包装机是否正常?
【分析】如果包装机工作正常,那么牙膏量X~N(50,1.22),现在问包装机工作是否正常,在假定方差不变的情况下,实际上就是要通过样本均值来检验总体均值50是否正确。这就是一个假设检验问题。
【例2】某种装袋食品,按规定每袋重量不得少于250g。从一批产品中随机抽取50袋,发现有6袋重量低于250g。若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂?
【分析】对于该批食品的不合格率我们事先并不知道,要根据样本的不合格率估计该批食品的不合格率,然后与规定的不合格率标准5%进行比较,作出该批食品能否出厂的决策。也就是说,我们先假设该批食品的合格率不超过5%,然后用样本不合格率来检验假设是否正确?这也是一个假设检验问题。4.1假设检验的基本问题一、假设检验的概念什么是假设检验?
假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;
◆包括参数检验和非参数检验;
◆逻辑上运用的是概率反证法;
◆统计依据为小概率原理。小概率原理小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。严格说来,小概率事件并非不可能事件,但是小概率事件在一次试验中几乎是不可能发生的,实践中可以将其看作是不可能事件。小概率原理是假设检验的灵魂。任何假设检验都是根据这一基本原理、基本思想为基础的。
总体假设检验的过程抽取随机样本均值
x
=20我认为人口的平均年龄是50岁提出假设
拒绝假设别无选择!
作出决策二、原假设与备择假设什么是假设?
对总体参数的具体数值所作的陈述总体参数包括总体均值、总体比率、总体方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!原假设原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为
H0。总是有符号
、或,例如,H0:
10cm
H0
:
10cm
H0:
10cm备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为H1。总是有符号
、或例如,H1:10cm
H1:<10cm
H1:10cm备择假设
一种零件的生产标准是直径应为15mm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于15mm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设例1【解】研究者想收集证据予以证明的假设应该是生产过程不正常。因此,建立的原假设和备择假设为
H0:μ=15mm
H1:μ≠15mm
某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。500g提出假设例2【解】研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。因此,建立的原假设和备择假设为
H0:μ≥500
H1:μ<500
一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设例3【解】研究者想收集证据予以支持的假设是该城市中家庭拥有汽车的比率超过30%。因此,建立的原假设和备择假设为
H0:μ≤30%
H1:μ>30%
◆原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立;
◆先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定;
◆等号“=”总是放在原假设上;
◆因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。
◆假设检验主要是搜集证据来推翻和拒绝原假设。结论与建议三、双侧检验与单侧检验双侧检验——是指备择假设没有特定的方向性,并含有符号的假设检验,又称为双尾检验。单侧检验——是指备择假设具有特定的方向性,并含有符号>或<的假设检验,又称为单尾检验。
◆备择假设的方向为<,称为左侧检验
◆备择假设的方向为>,称为右侧检验
概念假设的形式假设双侧检验单侧检验左侧检验右侧检验原假设H0:m
=m0H0:m
m0H0:m
m0备择假设H1:m
≠m0H1:m
<m0H1:m
>m0四、两类错误与显著性水平假设检验的目的是要根据样本信息作出最终决策。研究者总想作出正确的决策,但由于决策是建立在样本信息的基础之上的,而样本又是随机的,因而就有可能犯错误。经常犯的错误有以下两种:
◆当原假设正确时,拒绝它;
◆当原假设错误时,没有拒绝它。概念第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设。第Ⅰ类错误的概率记为α,又被称为显著性水平。第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设。第Ⅱ类错误的概率记为β。
和
的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小
◆理想地,只有增加样本容量,能同时减小犯两类错误的概率,但增加样本容量又受到很多因素的限制;
◆通常,只能在两类错误的发生概率之间进行平衡,发生哪一类错误的后果更为严重,就首要控制哪类错误发生的概率;
◆在假设检验中,一般先控制第Ⅰ类错误的发生概率。因为犯第Ⅰ类错误的概率是可以由研究者控制的。第Ⅰ类错误
◆又称为显著性水平,常被用于检验结论的可靠性度量;
◆既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值);
◆常用的
值有0.01,0.05,0.10;
◆由研究者事先确定。第Ⅱ类错误确定了显著性水平就等于控制了第Ⅰ类错误的概率,但犯第Ⅱ类错误概率的具体数值却很难确定,其受影响因素包括:◆随假设总体参数的减少而增大;
◆当
减少时增大;
◆当
增大时增大;
◆当
n减少时增大。五、检验统计量与拒绝域检验统计量——是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。检验统计量实际上是总体参数的点估计量,只有将其标准化后,才能用于度量它与原假设的参数之间的差异程度。
标准化的检验统计量可表示为:检验统计量拒绝域——是指能够拒绝原假设的统计量的所有可能取值构成的集合。
◆大小等于显著性水平。
◆位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。临界值——根据给定的显著性水平确定的拒绝域的边界值。拒绝域与临界值双侧检验图示0临界值临界值a/2a/2
拒绝域拒绝域1-置信水平左侧检验图示0临界值a拒绝域1-置信水平右侧检验图示0临界值a拒绝域1-a置信水平决策步骤①给定显著性水平,查表得出相应的临界值z或z/2,t或t/2
②将计算出的检验统计量的值与临界值比较
③作出决策双侧检验:|统计量|>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0六、利用p值进行决策显著性水平α是在检验之前确定的,这也就意味着事先确定了拒绝域。这样,不论检验统计量的值是大是小,只要它落入拒绝域就拒绝原假设,否则就不拒绝原假设。这种固定的显著性水平对检验结果可靠性的度量有两个不足之处:
◆它只是一个大致的范围;
◆对不同的检验,当α相同时,所有结论的可靠性都一样。要想得出观测数据与原假设之间不一致程度的精确度量,就需要计算p值。关于p值
p值——又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。
◆α是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;
◆p值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。◆不论是单侧检验还是双侧检验,用p值进行决策的规则:若p值<,拒绝
H0若p值>,不拒绝
H0◆p值反映实际观测到的数据与原假设H0之间不一致的程度的一个概率值。
p值越小,说明实际观测到的数据与原假设H0之间不一致的程度就越大,检验的结果也就越显著。双侧检验/
2/
2Z0临界值计算出的统计量计算出的统计量临界值1/2p值1/2p值左侧检验0临界值a1-置信水平计算出的统计量p值右侧检验0临界值a1-置信水平计算出的统计量p值假设检验步骤1、提出原假设和备择假设;2、确定一个适当的检验统计量,并利用样本数据算出其具体数值;3、根据显著性水平,计算出其临界值,指定拒绝域;4、将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用p值作出决策4.2一个正态总体的检验一个正态总体参数的检验z检验
t检验z
检验
2检验均值一个总体比例方差一、总体均值的检验总体均值的检验(作出判断)样本容量大小未知总体方差是否已知已知无论样本容量大小小t检验z检验
大z检验1、总体方差已知的检验根据抽样分布的知识,对于正态总体,当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z检验统计量。
【例1】某厂生产铜丝,其主要质量指标为折断力X,根据历史资料统计,可假定X∼N(570,82)。今新换材料生产,抽取30个样本值为:577、578、579、569、565、577、568、587、578、572、570、568、572、581、582、569、570、570、572、596、584,598、588、563、577、587、567、587欲检验新材料生产的铜丝的折断力X有无明显变化。假定方差σ2=82保持不变,α=0.05
【解】此题为正态总体均值的假设检验
H0:µ=570
H1:µ≠570由于铜丝折断力X为大样本且总体方差已知,故可以采用Z检验法。依题意,样本均值为:检验统计量α=0.05,查表得Zα/2=1.96检验统计量|Z|=21.64>Zα/2=1.96所以应拒绝H0,表明新材料生产的铜丝的折断力X有明显的变化。双侧检验01.96-1.960.025
0.025
拒绝H0拒绝H00.95置信水平
【练习1】完成生产线上某件工作所需的平均时间不少于15.5分钟,标准差为3分钟,对随机抽选的36名职工讲授一种新方法,训练期结束后这36名职工完成此项工作所需的平均时间为13.5分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设α=0.05,并假定完成这件工作的时间服从正态分布。H0:µ≥15.5H1:µ<15.5
由于大样本且总体方差已知,故采用Z检验法。依题意已知:检验统计量α=0.05,临界值Zα=1.645Z=-4<-Zα=-1.645,所以拒绝原假设H0,表明有充分的证据说明用新方法所需的时间更短。左侧检验0-1.6450.05拒绝H00.95置信水平【练习2】设香烟的尼古丁含量服从正态分布,按规定香烟的尼古丁平均含量不得超过18.3毫克,标准差为5毫克,现从产品中抽得容量为30的样本,测得其尼古丁含量分别为:20、17、21、22、15、13、24、19、15、23、18、20、17、21、19、22、21、20、16、14、19、22、15、17、24、21、16、18、13、25。(其均值为18.9)试检验尼古丁含量是否增加了(α=0.05)?所检验的假设可以归结为:H0:µ≤18.3H1:µ>18.3由于大样本且总体方差已知,故可用Z检验法依题意样本均值检验统计量为:当α=0.05时,查表得Zα=1.645因为Z=0.659<Zα=1.645所以不拒绝原假设H0,即没有充分的理由相信尼古丁含量增加了。右侧检验01.6450.05拒绝H00.95置信水平总体方差已知,检验方法的总结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:
mm0H0:mm0H1:m<m0H0:
m
m0
H1:
m>m0统计量无论样本容量大小拒绝域P值决策拒绝H02、总体方差未知的检验根据抽样分布知识,当总体服从正态分布,但总体方差未知时,样本容量的大小决定了所用的检验统计量,大样本小样本
【例2】某车床加工一种零件,要求其长度为150mm,现从一批加工后的这种零件中随机抽取9个,测得其长度为:147、150、149、154、152、153、148、151、155如果零件长度服从正态分布,问这批零件是否合格?(α=0.05)
【解】所要检验的假设为:H0:μ=150H1:μ≠150根据题中数据,计算样本均值和样本标准差分别为:又知n=9<30,属于小样本,故应采用t检验法当α=0.05时,查表得因为:
所以不拒绝原假设H0,可以认为该批零件是合格的。双侧检验02.306-2.3060.025
0.025
拒绝H0拒绝H00.95接受域【练习3】某公司年度报表指出其应收账款的平均计算误差不超过50元,审计师从该公司年度应收账款账户中随机抽取16笔进行调查,测得应收账款的平均计算误差为56元,标准差为8元。假定应收账款的平均计算误差服从正态分布。问:当检验水平α=0.01时,该公司应收账款的平均计算误差是否超过50元?所要检验的假设为:H0:µ≤50H1:µ>50
依题意:
又知总体服从正态分布,总体方差σ²未知,且n=16<30属于小样本,故采用t检验法。
检验统计量当α=0.01时,查t分布表得因为:所以应拒绝H0,可以认为该公司应收账款的平均计算误差超过50元。右侧检验02.60250.010.99置信水平拒绝H0
【练习4】某番茄罐头中,维生素C的含量X服从正态分布,按规定标准,维生素C的含量不得少于21mg。现从一批罐头中随机抽取49罐,测得样本均值为23mg,样本标准差为3.98,试问该批罐头中维生素C的含量是否合乎标准?(α=0.05)
【解】此题属于正态总体、总体方差未知且大样本(n=49>30),故采用Z检验法。
所要检验的假设为:H0:µ≥21H1:µ<21检验统计量Z的计算如下:当α=0.05时,查Z分布表得出临界值为:因为:所以不拒绝H0,可以认为该批罐头中维生素C的含量合乎标准。左侧检验0-1.6450.05拒绝H00.95置信水平样本统计量总体方差未知检验方法小结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:
mm0H0:mm0H1:
m<m0H0:
mm0
H1:
m>m0统计量大样本小样本拒绝域P值决策拒绝H0二、总体比率的检验我们只研究在大样本情况下的总体比例的检验。根据抽样分布知识,在大样本情况下,总体比例可用正态分布来近似。检验可用z统计量【例3】某公司经理希望估计一下其所在城市居民参加财产保险的比例。业务科长认为大约有80%的居民参加了财产保险,而统计科统计人员随机调查了150户居民了解到有70%的居民参加了财产保险。经理希望在α=0.05的显著性水平下检验一下业务科长的说法是否可信?依题意,可建立如下假设H0:π=0.8H1:π≠0.8
又知样本比例p=0.7,n=105>30,属于大样本,故采用Z检验法。检验统计量为:α=0.05,查表得出临界值因为所以应拒绝H0,由此可以判定业务科长的说法不可信,即参加保险的户数不足80%。【练习5】某生产商向供应商购一批西红柿,双方规定若优质西红柿的比例在40%及以上按一般市场价格收购,否则按低于市场价格收购。现随机抽取了100个西红柿,只有34个为优质品。于是,生产商欲按低于市场价格收购,而供应商则认为样本比例不足40%是由随机因素引起的。请用α=0.05进行检验并加以说明。依题意,可建立如下假设H0:P≥0.4H1:P<0.4
又知样本比例p=0.7,n=150>30,属于大样本,故采用Z检验法。检验统计量为:当α=0.05时,查表得出左侧检验临界值:因为:所以不拒绝原假设H0,即根据样本数据还不能认为优质西红柿的比例显著地低于40%,故而生产商仍应按一般市场价格收购。大样本总体比例的检验小结假设双侧检验左侧检验右侧检验假设形式H0:=0H1:
0H0:0H1:
<0H0
:
0
H1:
>0统计量拒绝域P值决策拒绝H0三、总体方差的检验根据抽样分布知识,检验一个总体的方差或标准差,通常假设总体近似服从正态分布,使用2分布。其检验统计量为:【例4】已知某种零件的尺寸服从N(23.02,1.52)现从这批零件中任取7件进行测量,测得尺寸数据(单位:mm)如下:21.0022.0422.3224.0124.6825.0221.63能否认为该批零件的方差是否和以往一样?(α=0.05)依题意可归结为以下假设:
H0:σ²=1.52H1:σ²≠1.52,由于总体服从正态分布,采用χ²检验。又知检验统计量为:α=0.05,查χ²分布表得:χ²α/2(n-1)=14.449χ²1-α/2(n-1)=1.237因为χ²1-α/2=1.237<χ²=6.7549<χ²α/2=16.013所以不拒绝原假设H0,可以认为该批零件的方差和以往是一样的。【练习6】某车间生产的金属丝,质量一贯稳定,折断力服从正态分布,方差σ²=64,今从一批金属铜丝中随机抽取10根作折断力试验,结果为:578、572、570、568、572、570、596、584、570、572。(样本均值约为575)问:这批金属丝折断力的方差为64是否可信?(α=0.05)待检验假设为:H0:σ²=64H1:σ²≠64
由于总体服从正态分布,故采用χ²检验。
又知检验统计量为:当α=0.05,查χ²分布表得:χ²α/2(n-1)=χ²0.025(9)=19.023χ²1-α/2(n-1)=χ²0.975(9)=2.700因为:χ²1-α/2=2.700<χ2=10.65<χ²α/2=19.023所以不拒绝H0,可以认为这批金属铜丝的折断力的方差为64可信。单个正态总体方差的检验小结假设双侧检验左侧检验右侧检验假设形式H0:2=02H1:
202H0:202H1:2<02H0:
202H1:2>02统计量拒绝域或P值决策拒绝H04.3两个正态总体参数的检验两个总体参数的检验两个总体参数的检验z检验(大样本)t检验(小样本)t检验(小样本)z检验F检验独立样本成对样本均值之差比例之差方差之比一、两个正态总体均值差的检验
1、两个独立总体,方差都已知两个样本是独立的随机样本,且两个正态总体的方差均已知时,其检验统计量【例1】某公司对男女职员的平均小时工资进行了调查,独立抽取了男女职员的两个随机样本,并记录两个样本的均值、容量如下表。在显著性水平为0.05的条件下,能否认为男职员与女职员的平均小时工资存在显著差异?已知两总体服从正态分布,且方差分别为64和42.25男性职员女性职员n1=44n1=32x1=75x2=70H0:1-2=0H1:1-20=0.05n1=44,n2=32临界值(c):检验统计量:决策:拒绝H0结论:该公司男女职员的平均小时工资之间存在显著异
z01.96-1.960.025拒绝H0拒绝H00.025【练习1】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径分别服从正态分布,且有12=40,22=28。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持两台机床加工的零件直径不一致的看法?两台机床加工零件的样本数据
(cm)甲2019172421201918乙21191520241620H0:-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业课件背景音乐设置
- 企业课件文件查找指南
- 考试宝典电气工程师资格证书考试试题及答案
- 2024年设计师职业发展试题及答案
- 酒店经营决策与财务分析基本技能试题及答案
- 质量工程师考试考生的心理素质要求试题及答案
- 酒店线上销售渠道相关试题及答案
- 如何备考商务礼仪师考试试题及答案
- 质量提升案例分析技巧试题及答案
- 智能控制器检修-智能控制器检修(热工装置)
- CJT 306-2009 建设事业非接触式CPU卡芯片技术要求
- 二年级下册口算题大全(全册可直接打印)
- 情绪调节的认知神经机制
- 供货方案及供货计划(2篇)
- 离散数学(下)智慧树知到期末考试答案章节答案2024年桂林电子科技大学
- CATIA创成式曲面设计经典收藏
- QC/T 922-2023 汽车用空气滤清器滤芯 (正式版)
- 2024年高考政治必修二 《经济与社会》(思维导图+核心考点+易混易错)
- 个人借车免责协议书完整版
- 中华人民共和国突发事件应对法课件
- 新能源业务开发培训课件
评论
0/150
提交评论