第七章假设检验_第1页
第七章假设检验_第2页
第七章假设检验_第3页
第七章假设检验_第4页
第七章假设检验_第5页
已阅读5页,还剩128页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验第一页,共一百三十三页,编辑于2023年,星期四第七章假设检验第一节假设检验的一般问题第二节一个正态总体的参数检验第三节两个正态总体的参数检验第四节假设检验中的其他问题第二页,共一百三十三页,编辑于2023年,星期四假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第三页,共一百三十三页,编辑于2023年,星期四学习目标了解假设检验的基本思想掌握假设检验的步骤能对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验第四页,共一百三十三页,编辑于2023年,星期四第一节假设检验的一般问题假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双侧检验和单侧检验第五页,共一百三十三页,编辑于2023年,星期四假设检验的概念与思想第六页,共一百三十三页,编辑于2023年,星期四什么是假设?对总体参数的一种看法总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该企业生产的零件的平均长度为4厘米!第七页,共一百三十三页,编辑于2023年,星期四什么是假设检验?概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理第八页,共一百三十三页,编辑于2023年,星期四假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m

=50抽样分布H0这个值不像我们应该得到的样本均值...20第九页,共一百三十三页,编辑于2023年,星期四总体假设检验的过程

(提出假设→抽取样本→作出决策)抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设拒绝假设!

别无选择.作出决策第十页,共一百三十三页,编辑于2023年,星期四假设检验的步骤提出原假设和备择假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策第十一页,共一百三十三页,编辑于2023年,星期四提出原假设和备择假设什么是原假设?(NullHypothesis)1. 待检验的假设,又称“0假设”2. 如果错误地作出决策会导致一系列后果3. 总是有等号,或4. 表示为H0H0:

某一数值指定为=号,即或例如,H0:

3190(克)为什么叫0假设第十二页,共一百三十三页,编辑于2023年,星期四为什么叫0假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第十三页,共一百三十三页,编辑于2023年,星期四什么是备择假设?(AlternativeHypothesis)1. 与原假设对立的假设2. 总是有不等号:

,

或3. 表示为H1H1:

<某一数值,或某一数值例如,H1:

<3910(克),或3910(克)提出原假设和备择假设第十四页,共一百三十三页,编辑于2023年,星期四什么检验统计量?1. 用于假设检验问题的统计量2. 选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量第十五页,共一百三十三页,编辑于2023年,星期四规定显著性水平什么显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为(alpha)常用的值有0.01,0.05,0.104. 由研究者事先确定第十六页,共一百三十三页,编辑于2023年,星期四作出统计决策计算检验的统计量根据给定的显著性水平,查表得出相应的临界值Z或Z/2将检验统计量的值与水平的临界值进行比较得出接受或拒绝原假设的结论第十七页,共一百三十三页,编辑于2023年,星期四假设检验中的小概率原理第十八页,共一百三十三页,编辑于2023年,星期四假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定什么是小概率?第十九页,共一百三十三页,编辑于2023年,星期四什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第二十页,共一百三十三页,编辑于2023年,星期四假设检验中的两类错误(决策风险)第二十一页,共一百三十三页,编辑于2023年,星期四假设检验中的两类错误1. 第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2. 第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)第二十二页,共一百三十三页,编辑于2023年,星期四H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)拒绝H0第一类错误(a)功效(1-b)假设检验就好像一场审判过程统计检验过程第二十三页,共一百三十三页,编辑于2023年,星期四错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小第二十四页,共一百三十三页,编辑于2023年,星期四影响

错误的因素1. 总体参数的真值随着假设的总体参数的减少而增大2. 显著性水平

当减少时增大3. 总体标准差当增大时增大4. 样本容量n当n减少时增大第二十五页,共一百三十三页,编辑于2023年,星期四双侧检验和单侧检验第二十六页,共一百三十三页,编辑于2023年,星期四双侧检验与单侧检验

(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0第二十七页,共一百三十三页,编辑于2023年,星期四双侧检验

(原假设与备择假设的确定)双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格建立的原假设与备择假设应为

H0:

=10H1:

10第二十八页,共一百三十三页,编辑于2023年,星期四双侧检验

(确定假设的步骤)1.例如问题为:检验该企业生产的零件平均长度为4厘米2. 步骤从统计角度陈述问题(=4)从统计角度提出相反的问题(4)必需互斥和穷尽提出原假设(=4)提出备择假设(

4)有符号第二十九页,共一百三十三页,编辑于2023年,星期四提出原假设:H0:=4提出备择假设:H1:

4

该企业生产的零件平均长度是4厘米吗?

(属于决策中的假设)双侧检验

(例子)第三十页,共一百三十三页,编辑于2023年,星期四双侧检验

(显著性水平与拒绝域)

抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域1-置信水平第三十一页,共一百三十三页,编辑于2023年,星期四双侧检验

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平第三十二页,共一百三十三页,编辑于2023年,星期四双侧检验

(显著性水平与拒绝域)

H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平第三十三页,共一百三十三页,编辑于2023年,星期四双侧检验

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平第三十四页,共一百三十三页,编辑于2023年,星期四单侧检验

(原假设与备择假设的确定)检验研究中的假设将所研究的假设作为备择假设H1将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设先确立备择假设H1第三十五页,共一百三十三页,编辑于2023年,星期四单侧检验

(原假设与备择假设的确定)例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为

H0:

1500H1:

1500例如,改进生产工艺后,会使产品的废品率降低到2%以下属于研究中的假设建立的原假设与备择假设应为

H0:2%H1:

<2%第三十六页,共一百三十三页,编辑于2023年,星期四单侧检验

(原假设与备择假设的确定)检验某项声明的有效性将所作出的说明(声明)作为原假设对该说明的质疑作为备择假设先确立原假设H0除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的第三十七页,共一百三十三页,编辑于2023年,星期四单侧检验

(原假设与备择假设的确定)例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为

H0:

1000H1:

<1000第三十八页,共一百三十三页,编辑于2023年,星期四提出原假设:H0:

1000选择备择假设:H1:

<1000

该批产品的平均使用寿命超过1000小时吗?(属于检验声明的有效性,先提出原假设)单侧检验

(例子)第三十九页,共一百三十三页,编辑于2023年,星期四提出原假设:H0:

25选择备择假设:H1::

25

学生中经常上网的人数超过25%吗?

(属于研究中的假设,先提出备择假设)单侧检验

(例子)第四十页,共一百三十三页,编辑于2023年,星期四单侧检验

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平第四十一页,共一百三十三页,编辑于2023年,星期四左侧检验

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第四十二页,共一百三十三页,编辑于2023年,星期四左侧检验

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平第四十三页,共一百三十三页,编辑于2023年,星期四右侧检验

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第四十四页,共一百三十三页,编辑于2023年,星期四右侧检验

(显著性水平与拒绝域)

H0值临界值a样本统计量接受域抽样分布1-置信水平拒绝域第四十五页,共一百三十三页,编辑于2023年,星期四第二节一个正态总体的参数检验一.总体方差已知时的均值检验二.总体方差未知时的均值检验三.总体比例的假设检验第四十六页,共一百三十三页,编辑于2023年,星期四一个总体的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差第四十七页,共一百三十三页,编辑于2023年,星期四检验的步骤

陈述原假设H0陈述备择假设H1

选择显著性水平

选择检验统计量

选择n

给出临界值

搜集数据

计算检验统计量

进行统计决策

表述决策结果第四十八页,共一百三十三页,编辑于2023年,星期四总体方差已知时的均值检验

(双尾Z

检验)第四十九页,共一百三十三页,编辑于2023年,星期四一个总体的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

c2检验(单尾和双尾)均值一个总体比例方差第五十页,共一百三十三页,编辑于2023年,星期四均值的双尾Z

检验

(2

已知)1. 假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2. 原假设为:H0:=0;备择假设为:H1:0使用z-统计量第五十一页,共一百三十三页,编辑于2023年,星期四均值的双尾Z

检验

(实例)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025

。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)属于决策中的假设!第五十二页,共一百三十三页,编辑于2023年,星期四均值的双尾Z检验

(计算结果)H0:

=0.081H1:

0.081

=

0.05n

=

200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异第五十三页,共一百三十三页,编辑于2023年,星期四总体方差已知时的均值检验

(单尾Z检验)第五十四页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(2

已知)假定条件总体服从正态分布若不服从正态分布,可以用正态分布来近似(n30)2. 备择假设有<或>符号3. 使用z-统计量第五十五页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(提出假设)左侧:H0:0H1:<0必须是显著地低于0,大的值满足H0,不能拒绝Z0拒绝H0右侧:H0:0H1:>0必须显著地大于0,小的值满足H0,不能拒绝Z0拒绝H0第五十六页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(实例)【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(=0.05)属于检验声明的有效性!第五十七页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(计算结果)H0:1000H1:<1000

=

0.05n=

100临界值(s):检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命低于1000小时决策:结论:-1.645Z0拒绝域第五十八页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(实例)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)属于研究中的假设!第五十九页,共一百三十三页,编辑于2023年,星期四均值的单尾Z检验

(计算结果)H0:

1020H1:>1020

=

0.05n

=

16临界值(s):检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645第六十页,共一百三十三页,编辑于2023年,星期四总体方差未知时的均值检验

(双尾t

检验)第六十一页,共一百三十三页,编辑于2023年,星期四一个总体的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

c2检验(单尾和双尾)均值一个总体比例方差第六十二页,共一百三十三页,编辑于2023年,星期四均值的双尾t检验

(2

未知)1. 假定条件总体为正态分布如果不是正态分布,只有轻微偏斜和大样本(n

30)条件下2. 使用t

统计量第六十三页,共一百三十三页,编辑于2023年,星期四均值的双尾t检验

(实例)【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?属于决策中的假设!第六十四页,共一百三十三页,编辑于2023年,星期四均值的双尾t检验

(计算结果)H0:=1000H1:

1000

=0.05df=9-1=8临界值(s):检验统计量:在

=0.05的水平上接受H0有证据表明这天自动包装机工作正常决策:结论:t02.306-2.306.025拒绝H0拒绝H0.025第六十五页,共一百三十三页,编辑于2023年,星期四总体方差未知时的均值检验

(单尾t检验)第六十六页,共一百三十三页,编辑于2023年,星期四均值的单尾t检验

(实例)

【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)属于检验声明有效性的假设!第六十七页,共一百三十三页,编辑于2023年,星期四均值的单尾t检验

(计算结果)H0:

40000H1:

<40000

=0.05df=20-1=19临界值(s):检验统计量:在

=0.05的水平上接受H0有证据表明轮胎使用寿命显著地大于40000公里决策:

结论:

-1.7291t0拒绝域.05第六十八页,共一百三十三页,编辑于2023年,星期四总体比例的假设检验

(Z

检验)第六十九页,共一百三十三页,编辑于2023年,星期四适用的数据类型离散数据

连续数据数值型数据数据品质数据第七十页,共一百三十三页,编辑于2023年,星期四一个总体的检验Z

检验(单尾和双尾)

t检验(单尾和双尾)Z

检验(单尾和双尾)

c2检验(单尾和双尾)均值一个总体比例方差第七十一页,共一百三十三页,编辑于2023年,星期四一个总体比例的Z检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的z统计量P0为假设的总体比例第七十二页,共一百三十三页,编辑于2023年,星期四一个总体比例的Z检验

(实例)【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05)属于决策中的假设!第七十三页,共一百三十三页,编辑于2023年,星期四一个样本比例的Z检验

(结果)H0:

p=0.3H1:p

0.3

=0.05n

=200临界值(s):检验统计量:在

=0.05的水平上接受H0有证据表明研究者的估计可信决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025第七十四页,共一百三十三页,编辑于2023年,星期四总体方差的检验

(2检验)第七十五页,共一百三十三页,编辑于2023年,星期四一个总体的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

c2检验(单尾和双尾)均值一个总体比例方差第七十六页,共一百三十三页,编辑于2023年,星期四方差的卡方(2)检验1. 检验一个总体的方差或标准差2. 假设总体近似服从正态分布3. 原假设为H0:2=024. 检验统计量样本方差假设的总体方差第七十七页,共一百三十三页,编辑于2023年,星期四卡方(2)检验

实例【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(=0.05)属于决策中的假设!第七十八页,共一百三十三页,编辑于2023年,星期四卡方(2)检验

计算结果H0:

2=0.0025H1:

2

0.0025

=0.05df=

20-1=19临界值(s):统计量:在

=0.05的水平上接受H0有证据表明该日纤度的波动比平时没有显著差异2032.8528.907

/2=.05决策:结论:第七十九页,共一百三十三页,编辑于2023年,星期四第三节两个正态总体的参数检验一.两个总体参数之差的抽样分布两个总体均值之差的检验假设检验中相关样本的利用两个总体比例之差的检验第八十页,共一百三十三页,编辑于2023年,星期四两个正态总体的参数检验两个总体的检验Z

检验(大样本)t

检验(小样本)t

检验(小样本)Z检验F

检验独立样本配对样本均值比例方差第八十一页,共一百三十三页,编辑于2023年,星期四两个独立样本的均值检验第八十二页,共一百三十三页,编辑于2023年,星期四两个独立样本之差的抽样分布

m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布第八十三页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的Z检验

(12、22

已知)1. 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)原假设:H0:1-

2

=0;备择假设:H1:1-

2

0检验统计量为第八十四页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的Z检验

(假设的形式)假设研究的问题没有差异有差异均值1均值2均值1<均值2均值1均值2均值1>均值2H0H1μ–μ≠0μ–μ=0μ–μ≥0μ–μ<0μ–μ

>0μ–μ≤0第八十五页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的Z检验

(例子)

属于决策中的假设!【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)第八十六页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的Z检验

(计算结果)H0:

1-2=0H1:1-2

0

=

0.05n1

=32,n2

=40临界值(s):检验统计量:决策:结论:拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025第八十七页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的t检验

(12、22未知)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量其中:第八十八页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的t

检验

(例子)属于研究中的假设!

【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12=s22

。试问能否认为用第二种方法组装比用第一中方法组装更好?(=0.05)第八十九页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的t

检验

(计算结果)H0:1-2

0H1:

1-2>0

=0.05n1

=10,n2

=

8临界值(s):检验统计量:决策:结论:接受H0没有证据表明用第二种方法组装更好t0拒绝域0.051.7459第九十页,共一百三十三页,编辑于2023年,星期四两个相关(配对或匹配)样本的均值检验假设检验中相关样本的利用第九十一页,共一百三十三页,编辑于2023年,星期四两个总体均值之差的检验

(配对样本的t

检验)1. 检验两个相关总体的均值配对或匹配重复测量(前/后)2. 利用相关样本可消除项目间的方差3. 假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1

30,n230)第九十二页,共一百三十三页,编辑于2023年,星期四配对样本的t

检验

(假设的形式)假设研究的问题没有差异有差异总体1总体2总体1<总体2总体1总体2总体1>总体2H0mD=0mD0mD0H1mD0mD<0mD>0注:Di=X1i-X2i

,对第i对观察值第九十三页,共一百三十三页,编辑于2023年,星期四配对样本的t

检验

(数据形式)观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n第九十四页,共一百三十三页,编辑于2023年,星期四配对样本的t

检验

(检验统计量)样本均值样本标准差自由度df=nD-1统计量第九十五页,共一百三十三页,编辑于2023年,星期四【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:配对样本的t

检验

(例子)在

=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102属于检验某项声明的假设!第九十六页,共一百三十三页,编辑于2023年,星期四样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t

检验

(计算表)第九十七页,共一百三十三页,编辑于2023年,星期四配对样本的t

检验

(计算结果)样本均值样本标准差第九十八页,共一百三十三页,编辑于2023年,星期四H0:

m1–m2

8.5H1:m1–m2

<8.5a

=0.05df=

10-1=9临界值(s):检验统计量:决策:结论:接受H0有证据表明该俱乐部的宣称是可信的配对样本的t

检验

(计算结果)-1.833t0拒绝域.05第九十九页,共一百三十三页,编辑于2023年,星期四两个总体比例之差的检验

(Z

检验)经济、管理类基础课程统计学第一百页,共一百三十三页,编辑于2023年,星期四1. 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量两个总体比例之差的Z检验第一百零一页,共一百三十三页,编辑于2023年,星期四两个总体比例之差的检验

(假设的形式)假设研究的问题没有差异有差异比例1≥比例2比例1<比例2总体1≤比例2总体1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0第一百零二页,共一百三十三页,编辑于2023年,星期四两个总体比例之差的Z检验

(例子)属于研究中的假设!

【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(=0.05)第一百零三页,共一百三十三页,编辑于2023年,星期四两个总体比例之差的Z检验

(计算结果)H0:

P1-P2

0H1:

P1-P2<0

=

0.05n1

=60,n2=40临界值(s):检验统计量:决策:结论:接受H0没有证据表明乙厂工人参加技术培训的人数比例高于甲厂-1.645Z0拒绝域第一百零四页,共一百三十三页,编辑于2023年,星期四第四节假设检验中的其他问题一.用置信区间进行检验利用P-值进行检验第一百零五页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验第一百零六页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验

(双侧检验)求出双侧检验均值的置信区间2已知时:2未知时:若总体的假设值0在置信区间外,拒绝H0第一百零七页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验

(左侧检验)求出单边置信下限若总体的假设值0小于单边置信下限,拒绝H0第一百零八页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验

(右侧检验)求出单边置信上限若总体的假设值0大于单边置信上限,拒绝H0第一百零九页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验

(例子)

【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)属于决策的假设!香脆蛋卷第一百一十页,共一百三十三页,编辑于2023年,星期四利用置信区间进行假设检验

(计算结果)H0:

=1000H1:

1000

=

0.05n

=49临界值(s):置信区间为决策:结论:假设的0=1000在置信区间内,接受H0表明这批产品的包装重量合格Z01.96-1.96.025拒绝H0拒绝H0.025第一百一十一页,共一百三十三页,编辑于2023年,星期四利用P-值进行假设检验观察到的显著性水平

P-值第一百一十二页,共一百三十三页,编辑于2023年,星期四什么是P值?

(P-Value)是一个概率值如果我们假设原假设为真,P-值是观测到的样本均值不同于(<或>实测值的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0

能被拒绝的的最小值第一百一十三页,共一百三十三页,编辑于2023年,星期四利用P值进行决策单侧检验若p-值

,不能拒绝H0若p-值<,拒绝H0双侧检验若p-值

/2,不能拒绝H0若p-值</2,拒绝H0第一百一十四页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算实例)

【例】欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x=372.5克。企业规定每盒重量的标准差为15克。确定P-值。368克欣欣儿童食品厂第一百一十五页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算结果)样本统计量的Z值(观察到的)计算的检验统计量为:01.50-1.50Z第一百一十六页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算结果)p-值为P(Z-1.50或Z1.50)样本统计量的Z值(观察到的)01.50-1.50Z第一百一十七页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算结果)p-值为P(Z-1.50或Z1.50)样本统计量的Z值(观察到的)01.50-1.50Z1/2p-值1/2p-值第一百一十八页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算结果)p-值为P(Z-1.50或Z1.50)从Z分布表查找1.50样本统计量的Z值(观察到的)注:0.9332-0.5

=0.433201.50-1.50Z1/2p-值1/2p-值.4332第一百一十九页,共一百三十三页,编辑于2023年,星期四双尾Z检验

(P-值计算结果)p-值为P(Z-1.50或Z1.50)从Z分布表查找1.50样本统计量的Z值(观察到的)0.5000-0.4332

=0.066801.50-1.50Z1/2p-值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论