第5章假设检验_第1页
第5章假设检验_第2页
第5章假设检验_第3页
第5章假设检验_第4页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章假设检验本章教学目标了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;掌握运用Excel的“数据分析”及其统计函数功能求解假设检验问题。

1本章主要内容§5.1案例介绍§5.2假设检验的基本原理§5.3单个正态总体均值的检验§5.4单个正态总体方差的检验§5.5两个独立正态总体均值的检验§5.6成对样本试验的均值检验§5.7两个正态总体方差的检验§5.5总体比例的检验本章重点:假设检验中不可避免的两类错误及其应用

Excel“数据分析”功能的使用及其运行输出结果分析。难点:假设检验中不可避免的两类错误及其应用。

2§5.1案例介绍【案例1】新工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为10560(kg/cm2)。现采用新工艺生产了一种新钢丝,随机抽取10根,测得抗拉强度为:

10512,10623,10668,10554,1077610707,10557,10581,10666,10670求得新钢丝的平均抗拉强度为10631.4(kg/cm2)。是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?

3某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过0.02mm。检验人员从加工的缸套中随机抽取9个,测得外径的样本标准差为S=0.03mm。问:该机床的加工精度是否符合要求?【案例2】机床加工精度是否符合要求?4新车的平均首次故障里程数是汽车的一个主要可靠性指标。现测得甲、乙两种品牌轿车的首次故障里程数数据如下:甲品牌X1:1200,1400,1580,1700,1900乙品牌X2:1100,1300,1800,1800,2000,2400

其中【案例3】两种轿车的质量有无差异?问:能否据此判定乙品牌轿车的平均首次故障里程高于甲品牌?

=1733=1556,5为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下:两种安眠药延长睡眠时间对比试验(小时)(1)哪种安眠药的疗效好?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结论如何?

【案例4】哪种安眠药的疗效好?6【案例5】某一系列电视剧是否获得成功如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25%,则可以断定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。现在要判断这部电视剧是否获得了成功。7【案例6】女企业家对成功的理解是否不同对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在10万~50万元的在一组,少于10万元的在另一组。要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?8§5.2假设检验的原理一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。9三、基本原理和步骤例1:统计资料表明,某电子元件的寿命X~N(0,

2),其中0已知,

2未知。现采用了新工艺生产,测得新工艺生产的n个元件寿命为x1,x2,···,xn。问:新工艺生产的元件期望寿命是否比原工艺的元件期望寿命0有显著提高?此问题要推断的是:是否>0?这可用假设检验的方法解决,步骤如下:

.§5.2假设检验的原理101.提出一个希望推翻的假设,本例中

H0:

=02.按希望出现的结果提出一个与原假设对立的假设,称为备择假设,记为H1。

本例中

H1:

>03.构造一个能用来检验原假设H0的统计量~t(n-1)

本例中,要检验的是总体均值,当H0为真时,估计,故应使用来构造检验

的统计量。统计量称为原假设,记为H0114.给定一个小概率,称为显著性水平显著性水平

是当H0为真时,拒绝H0的概率(即犯“弃真”错误的概率)。也即当检验结果拒绝H0时,不犯错误的概率为1-,从而可以有1-

的可信度接受备择假设H1。5.确定要拒绝H0时统计量的取值范围,称为拒绝域,拒绝域的边界点称为临界值。本例中,由于H1:>0而当H0为真时,有

P{t≤t(n-1)

}=1-可知当统计量t>t(n-1)时,就可以有1-

的把握判定H0不真

(犯错误的概率仅为

),故此时应拒绝H0。从而拒绝域为t>t(n-1),临界值为t(n-1)。

(右边检验),126.计算统计量t

的值,

t(n-1)0f(x)x右边检验的拒绝域本例中,若计算结果为t>t(n-1),并作出检验结论则拒绝H0,接受H1,即在水平

下,认为

显著高于0。若t<t(n-1),就不能拒绝H0,即认为并不显著高于0。当拒绝H0时,说明在给定的水平

下,和0间存在显著差异。这就是称

为显著性水平的原因。

13设t

为检验原假设H0所用的统计量,t(n-1)为检验的临界值,由显著性水平

的定义(右边检验)

P{t>t(n-1)|H0为真}=可知检验中可能出现以下两类判断错误:二.检验中可能犯的两类错误第一类错误——当H0为真时拒绝H0的错误,即“弃真”错误,犯此类错误的概率为。第二类错误——当H0不真时接受H0的错误,即“取伪”错误,记犯该类错误的概率为,即P{t≤t(n-1)|H0不真}=由于H0不真时与H0为真时,统计量t的分布是不同的,故β≠1-。

14H0:无辜法官判决假设检验实际情况实际情况判决无辜有罪决策H0真H0假无辜CorrectError没有拒绝H01-aTypeIIError(b)有罪ErrorCorrect拒绝H0TypeIError(a)Power(1-b)ResultPossibilities结果的各种可能性RelationshipBetweena&ba&b

间的联系ab两个错误有反向的关系两类错误的关系由图可知,减少会增大,反之也然。在样本容量n不变时,不可能同时减小犯两类错误的概率。应着重控制犯哪类错误的概率,这应由问题的实际背景决定。当第一类错误造成的损失大时,就应控制犯第一类错误的概率

(通常取0.05,0.01等);反之,当第二类错误造成的损失大时,就应控制犯第二类错误的概率。要同时减小须犯两类错误的概率,必须增大样本容量n。

x0H0:μ=μ0t(n-1)H1:μ=μ1β17~t(n-1)

/2/2t/2(n-1)-

t/2(n-1)0f(x)x1-§5.3单个总体均值的检验

设X~N(

,

2),

2未知,X1,X2,···,Xn

为总体X的样本,给定水平,原假设为H0:=0(0为某一给定值)当H0为真时,统计量1.H1:≠0(双边检验)当H0为真时,由

P{-t/2(n-1)≤t≤t/2(n-1)}=1-可得:若|t|>t/2(n-1)

就拒绝H0,接受H1;否则接受H0。

18当

H0为真时,由

P{t≤t(n-1)}=1-可得:若

t>t

(n-1)

就拒绝H0,接受H1;否则就认为并不显著高于0

。3.

H1:

<0(左边检验)

由P{t≥-t(n-1)

}=1-可得:若

t<-t(n-1)

就拒绝H0,接受H1;否则就认为并不显著小于0

-t(n-1)f(x)x左边检验的拒绝域1-2.H1:>0

(右边检验)19案例1.检验新工艺的效果某厂生产的一种钢丝抗拉强度服从均值为10560(kg/cm2)的正态分布,现采用新工艺生产了一种新钢丝,随机抽取10根测得抗拉强度为:

10512,10623,10668,10554,1077610707,10557,10581,10666,10670问在显著性水平=0.05下,新钢丝的平均抗拉强度比原钢丝是否有显著提高?

20案例1解答:说明新工艺对提高钢丝绳的抗拉强度是有显著效果的。

本案例为右边检验问题,设新钢丝的平均抗拉强度为,

2未知,故使用t检验。由题意,H0:=0,H1:>0由所给样本数据,可求得:S=81,n=10,=0.05,t0.05(9)=1.8331∵t=2.7875故拒绝H0,即在水平=0.05下,

显著高于0。

>t(n-1)=

t0.05(9)=1.833121在案例1中,若取

=0.01,问结论如何?【解】∵t0.01(9)=2.8214,

t=2.7875<t0.01(9)=2.8214故不能拒绝H0。即在水平=0.01下,新钢丝平均抗拉强度并无显著提高。通常,在

=0.05下拒绝H0,则称检验结果为一般显著的;若在=0.01下拒绝H0,则称检验结果为高度显著的;若在=0.001下拒绝H0,则称检验结果为极高度显著的。

22课堂练习3一台自动包装奶粉的包装机,其额定标准为每袋净重0.5kg。某天开工时,随机抽取了10袋产品,称得其净重为:0.497,0.506,0.509,0.508,0.4970.510,0.506,0.495,0.502,0.507(1)在水平

=0.20下,检验该天包装机的重量设定是否正确?(,S=0.00554)

(2)在本题的检验问题中,为什么要将

取得较大?23§5.4大样本单个总体比例的检验设总体成数为P,则当nP

和n

(1-P)都大于5时,样本成数p

近似服从均值为P,方差为P

(1-P)/n的正态分布。从而当原假设H0:P=P0

为真时,统计量与前面分析完全类似地,可得如下检验方法:P≠P0

P>P0

P<P0

24【案例5】某一系列电视剧是否获得成功

如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25%,则可以断定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。在=0.01

的显著性水平下,检验这部。

系列电视剧是否获得了成功。解:由题意,H0:P=P0=25%,H1:P>25%,

样本比例p=112/400=0.2825设H0:

2=02(02为某一给定值)则当H0为真时,统计量

与前面分析完全类似地,可得如下检验方法:§5.5.单个总体方差的检验

2≠02

2>02

2<02

(

2检验)26f(x)x0/2/21-双边检验f(x)x01-左边检验f(x)x01-右边检验卡方检验的拒绝域27某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过0.02mm,现从所生产的缸套中随机抽取了9个,测得外径的样本标准差为S=0.03mm。问:在水平=0.05下,该机床加工精度是否符合要求?

解:由题意,0=0.02,

H0:

2=02,H1:

2>02

∵故拒绝H0,即该机床加工精度已显著下降。应立即停工检修,否则废品率会大大增加。

【案例2】机床加工精度问题28课堂练习4一台奶粉自动包装的包装精度指标为

标准差

=0.005(kg)

某天开工时,随机抽检了10袋产品,测得其样本标准差为

S=0.00554(kg)(1)在水平=0.25下,检验该天包装机的包装精度是否符合要求。

(2)在本检验问题中,为什么要将

取得较大?29统计意义上的显著和实际的显著

有时,由于非常大的样本容量,你很有可能会得出统计意义上的显著性但实际中的显著性却很小。比如,假设在全国性的关于高档次的商业电视市场推广活动之前,你知道人们对你的品牌认知度是0.3。在活动结束之后,根据对20,000人的调查显示有6,168人认识你的品牌。单边检验希望能证明现在的认知比例是大于0.3,而p-值结果为0.0047,正确的统计结论是品牌名字消费者的比例现在取得了显著性改变,而在实际上这个增长重要吗?总体比例现在的估计值在6,168/2,0000=0.3084,或是30.84%。这个增长量只比假设检验值30%多了1%。在市场推广活动中的高额费用产生的结果是否对品牌认知度有意义呢?现实中的低于1%的市场认知度的微小增长与高成本的市场活动费用相比,你应该认为这次市场活动是不成功的。如果品牌知名度提高了20%,你就能得出活动是非常成功的。30§5.6.两个总体均值的检验设总体X1~N(1,12),

X2~N(2,22),且X1和X2相互独立。和S12,S22分别是它们的样本的均值和样本方差,样本容量分别为

n1和n2。原假设为H0:1=2

31可以证明,当H0为真时,统计量其中:完全类似地,可以得到如下检验方法:~

t(n1+n2-2)称为合并方差。1.12=22=

2,

2未知(t

检验

)32测得甲,乙两种品牌轿车的首次故障里程数数据如下:甲品牌X1:1200,1400,1580,1700,1900乙品牌X2:1100,1300,1800,1800,2000,2400设X1和X2的方差相同。问在水平

=0.05下,(1)两种轿车的平均首次故障里程数之间有无显著差异?(2)乙品牌轿车的平均首次故障里程是否比甲品牌有显著提高?

【案例3】轿车质量差异的检验33解:⑴双边检验问题S12=269.62,S22=471.9212=22=2未知,n1=5,H0:1=2H1:1≠2。由所给数据,可求得∵|t|=0.74<t/2(n1+n2-2)=t0.025(9)故两种轿车的平均首次故障里程间无显著差异,即两种轿车的该项质量指标是处于同一水平的。

n2=6,

=2.262234(2)左边检验

∵t=-0.74>-t(n1+n2-2)=-t0.05(9)=-1.833故乙品牌轿车平均首次故障里程并不显著高于甲品牌。显然,对给定的水平,若单边检验不显著,则双边检验肯定不显著。但反之却不然,即若双边检验不显著,单边检验则有可能是显著的。

H1:1<235用Excel检验两总体均值可用Excel的【工具】→“数据分析”→“

t检验:双样本等方差假设”,检验12=22=2,但2未知时两个总体的均值。

在Excel的输出结果中:

“P(T<=t)单尾”

t(统计量)0f(t)“P(T<=t)单尾”的值(概率)—单边检验达到的临界显著性水平;

“P(T<=t)双尾”—双边检验达到的临界显著性水平。

由图可知:P(T<=t)双尾=2×P(T<=t)单尾

“P(T<=t)单尾”和“P(T<=t)双尾”统称为“p

值”。36“P(T<=t)单尾”与“P(T<=t)双尾”的使用从而,若“P(T<=t)单尾”或“P(T<=t)双尾”>0.05,则结果为不显著;“P(T<=t)单尾”或“P(T<=t)双尾”<0.05,则一般显著;“P(T<=t)单尾”或“P(T<=t)双尾”<0.01,则高度显著;“P(T<=t)单尾”或“P(T<=t)双尾”<0.001,则极高度显著。本例中:∵

“P(T<=t)单尾”=0.2387>0.05;

“P(T<=t)双尾”=0.4773>0.05,故无论单边还是双边检验结果都不显著。

tt“P(T<=t)单尾”由图可知:

t>t

等价于“P(T<=t)单尾”<

t>t/2

等价于“P(T<=t)双尾”<37此时,可用Excel

的【工具】→“数据分析”→“t

检验:双样本异方差假设”检验12≠22且都未知时两个正态总体的均值。2.12≠22且未知38为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下:两种安眠药延长睡眠时间对比试验(小时)(1)两种安眠药的疗效有无显著差异?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时两种安眠药的疗效间有无差异?【案例5】哪种安眠药的疗效好?39

(1)设服用甲、乙两种安眠药的延长睡眠时间分别为X1,X2,

故不能拒绝H0,两种安眠药的疗效间无显著差异。

用Excel求解本案例S22=1.7892S12=2.0022,案例5解答X1~N(1,

2),X2~N(2,

2),

n1=n2=10。

由试验方法知X1,X2独立。

H0:1=2,H1:1≠2由表中所给数据,可求得:40故两种安眠药疗效间的差异是高度显著的!

=4.0621§5.7.成对样本试验

由于此时X1,X2为同一组病人分别服用两种安眠药的疗效,因此X1,X2不独立,属于成对样本试验。对于这类“成对样本试验”的均值检验,应当化为单个正态总体的均值检验。方法如下:设X=X1-X2(服用甲、乙两种安眠药延长睡眠时间之差),则X~N(,

2)。H0:=0,H1:≠0由表中所给数据,可求得S=1.23,n=10

>t

0.005(9)=3.2498

—案例5⑵解答41可用Excel的【工具】→“数据分析”→“t检验:平均值的成对二样本分析”进行成对样本试验的均值检验。用Excel求解∵本例中“P(T<=t)双尾”=0.0028<0.01,故两种安眠药的疗效间存在高度显著差异。

42§5.8.两总体方差的检验1.F

分布设X~2(n1),Y~

2(n2),且X和Y相互独立,则随机变量服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)n1为第一(分子的)自由度,

n2为第二(分母的)自由度。

43F分布密度函数的图形xf(x)0n1=20,n2=10n1=20,n2=25n1=20,n2=100

44F分布的右侧分位点F(n1,n2)

F分布的右侧

分位点为满足

P{F>F(n1,n2)}=

的数值F(n1,n2)。F(n1,n2)f(x)x0F

(n1,n2)有以下性质:

F1-

(n1,n2)=1/F(n2,n1)利用上式可求得F分布表中未给出的

值的百分位点。如F0.95(10,15)=1/F0.05(15,10)

45可用Excel的统计函数FINV返回F(n1,n2)。语法规则如下:格式:FINV(,n1,n2

)功能:返回F(n1,n2)的值。用Excel

求F(n1,n2)462.两总体方差的检验(F检验)原假设为H0:12=22。完全类似地,可以得到如下检验方法:~F(n1-1,n2-1)当H0为真时,统计量

47【例2】在=0.20下,检验【案例3】中两个正态总体的方差是否存在显著差异。

解:由题意,H0:12=22,H1:12≠22,n1=5,n2=6由例5的计算结果,S12=269.62,S22=471.92=0.326

F/2(n1-1,n2-1)

=F0.1(4,5)=3.52F1-/2(n1-1,n2-1)

=F1-0.1(4,5)=1/F0.1(5,4)=1/4.05=0.247∵F=0.326<

F1-0.1(4,5)=0.247<F0.1(4,5)=3.52故在水平

=0.20下,12与22间无显著差异。可知案例4中关于12=22的假定是合理的。思考题:本例中为什么要将取得较大?

48可用Excel的【工具】→“数据分析”→“F检验:双样本方差”检验两个正态总体是否是同方差的。在

Excel的输出结果中

“P(F<=f)单尾”与“P(T<=t)单尾”的含义是相同的,即p

值。用Excel求解

∵本例中“P(F<=f)单尾”的值为0.1503,故其双边检验所达到的显著性水平为

2×0.1503=0.3006>0.20故在在水平=0.20下,12与22间无显著差异。

49§5.9.大样本两个总体比例的检验设P1,P2分别是两个独立总体的总体比例,原假设为

H0:P1=P2设p1,p2分别是它们的样本比例,n1,n2分别是它们的样本容量。则在大样本的条件下,统计量由此,可以得到如下检验方法:

50【案例6】女企业家对成功的理解是否不同对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在100万~500万元的为一组,少于100万元的为另一组,要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?假定我们以总销售额对女企业家进行定位。我们采访了100名总销售额低于100万元的女企业家,她们中有24个将销

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论