第4章-统计假设检验与参数估计0916_第1页
第4章-统计假设检验与参数估计0916_第2页
第4章-统计假设检验与参数估计0916_第3页
第4章-统计假设检验与参数估计0916_第4页
第4章-统计假设检验与参数估计0916_第5页
已阅读5页,还剩179页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验又叫显著性检验(testofsignificance)。显著性检验的方法很多,常用的有u检验、t检验、F检验和

2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计有点估计(pointestimation)和区间估计(intervalestimation)。下一张

主页

退出

上一张

第1页/共184页例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为μ0=9.75%,其标准差为σ=5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为=11.99%。试问,能否由这30个醋样的平均数判断新曲种好于原曲种?1统计假设检验概述

下一张

主页

退出

上一张

1.1统计假设检验的意义和基本原理1.1.1统计假设检验的意义食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?样本平均数总体平均数第2页/共184页

以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是由于随机误差引起的。

样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差的存在),样本平均数与总体平均数之间往往有偏差。因此,仅由表面效应是不能判断它们之间是否有显著差异。其根本原因在于试验误差(或抽样误差)的不可避免性。第3页/共184页

通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值由两部分组成,即

=+

总体平均数反映了总体特征,表示试验误差。若样本含量为n,则可得到n

个观测值:,,,。于是样本平均数下一张

主页

退出

上一张

可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。第4页/共184页试验表面效应为

上式表明,试验的表面效应由两部分构成:一部分是试验的处理效应(即两总体平均数的差异);另一部分是试验误差。因此,仅凭表面效应来判断两总体平均数是否相同是不可靠的。

如果处理效应不存在(即,则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应是否存在是假设检验的关健。第5页/共184页

同理,对于接受不同处理的两个样本来说,则有:

=+,=+

这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。下一张

主页

退出

上一张

第6页/共184页

也就是说样本平均数之差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有通过显著性检验才能从(-)中提取结论。对(-)进行显著性检验就是要分析:

试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。下一张

主页

退出

上一张

第7页/共184页

处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。下一张

主页

退出

上一张

第8页/共184页下一张

主页

退出

上一张

小概率事件实际不可能性原理1.1.2统计假设检验的基本思想小概率事件在一次试验中被认为是不可能发生的。

小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。

0.050.010.001称之为小概率事件。

第9页/共184页2023/10/25假设检验的基本思路(1)对总体参数作某种假设(2)根据样本得到的信息,考虑接受假设是否会导致不合理的结果;如结果合理就接受假设,结果不合理就拒绝假设。

如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。第10页/共184页

下一张

主页

退出

上一张

举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止1个黑球。第11页/共184页下一张

主页

退出

上一张

1.1.3统计假设检验的基本原理

1.根据研究目的,对研究总体提出假设

原假设、无效假设、零假设(nullhypothesis)

是被检验的假设,通过检验可能被接受,也可能被否定。与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。备择假设(alternativehypothesis)第12页/共184页

如前例,原假设H0:,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。

对应的备择假设为,即表明采用新曲种酿造食醋能够改变醋酸含量,试验的处理效应存在。第13页/共184页

对于来自两个总体的两个样本,原假设H0:,即两个总体的平均数相等,处理效应为零,试验表面效应仅由误差引起,处理效应不存在。

对应的备择假设是:≠,即假设两个总体的平均数不相等,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。第14页/共184页2.在无效假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。下一张

主页

退出

上一张

当无效假设H0成立时,表明试验表面效应纯属试验误差引起,处理效应不存在。此时,可根据题意构造适当统计量,计算样本统计量值。第15页/共184页

对前例分析,无效假设H0:成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的看成是从总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,

~N(μ0,σ2/n)。构造统计量:~N(0,1)(4-1)第16页/共184页

由样本值计算统计量u值,由正态分布双侧分位数(uа)可知第17页/共184页

本例计算出的统计量u=2.315,1.96<<2.58,所以可推知其概率0.01<<0.05

本试验的表面效应=0.0224完全由试验误差造成的概率在0.01-0.05之间。第18页/共184页

在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设成立的可能性大,不能被否定,因而也就不能接受备择假设。下一张

主页

退出

上一张

3.根据“小概率事件实际不可能性原理”否定或接受无效假设第19页/共184页2023/10/25例:随机抽测两各品牌的蜜饯产品各10包的净重(g),资料如下:

A品牌:11,11,9,12,10,13,13,8,10,13B品牌:8,11,12,10,9,8,8,9,10,7

经计算,A品牌10包蜜饯产品净重平均数=11g,标准差S1=1.76g;B品牌10包蜜饯产品净重平均数=9.2g,标准差S2=1.549g。第20页/共184页

叫做均数差异标准误;

n1、n2为两样本的含量。

对于来自两个总体的样本,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:下一张

主页

退出

上一张

其中

所得的统计量t服从自由度

df=(n1-1)+(n2-1)的t分布。~t(df)第21页/共184页

根据两个样本的数据,计算得:-=11-9.2=1.8;下一张

主页

退出

上一张

第22页/共184页

进一步估计|t|≥2.426的两尾概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=18时,两尾概率为0.05的临界值:两尾概率为0.01的临界t值:下一张

主页

退出

上一张

=2.101,=2.878,即:

P(|t|>2.101)=P(t>2.101)

+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)

+P(t<-2.878)=0.01

第23页/共184页

由两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:

t0.05<2.426<t0.01

所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。如图所示,|t|≥2.426的两尾概率,说明无效假设成立的可能性,即试验的表面效应为试验误差引起的可能性在0.01─0.05之间。下一张

主页

退出

上一张

第24页/共184页第25页/共184页

按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,从而接受:≠。可以认为两个总体平均数和不相同。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。下一张

主页

退出

上一张

第26页/共184页

在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。在试验研究中常取α=0.05或α=0.01。下一张

主页

退出

上一张

1.1.4统计假设检验的显著水平第27页/共184页2023/10/25显著性水平:是一个概率值,表示为

是当原假设为正确时人们却把它拒绝了的概率或风险。是由人们事先确定的,当

取0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为95%。如新技术取代传统工艺的研究中,希望拒绝H0,那么越小,检验的标准就越高第28页/共184页

假设检验时选用的显著水平,除α=0.05和0.01为常用外,也可选α=0.10或α=0.001等等。到底选哪个显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。显著水平α对假设检验的结论是有直接影响的,所以在试验开始前应给以确定。下一张

主页

退出

上一张

第29页/共184页

若|t|<t0.05

,则说明试验的表面效应属于试验误差引起的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“ns”或不做任何标记;下一张

主页

退出

上一张

统计假设检验结果说明(两个样本):第30页/共184页

若t0.05≤|t|<t0.01,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P≤0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;下一张

主页

退出

上一张

第31页/共184页

若|t|≥t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。下一张

主页

退出

上一张

第32页/共184页1.2统计假设检验的步骤建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平α。常用的显著水平α=0.05和α=0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断(或由概率大小做出判断)。第33页/共184页2023/10/25总体

假设检验的过程

(提出假设→抽取样本→作出决策)抽取随机样本均值

X=11.9

我认为新工艺的平均醋酸也是9.7%提出假设

拒绝假设!

别无选择.作出决策第34页/共184页2023/10/25原假设:待检验的假设,又称“0假设”备择假设:与原假设对立的假设如:新工艺的醋酸含量平均值等于老工艺。原假设备择假设1、提出原假设和备择假设第35页/共184页2023/10/25检验统计量:用于假设检验问题的统计量选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为2、确定适当的检验统计量第36页/共184页2023/10/25显著性水平:是一个概率值,表示为

是当原假设为正确时人们却把它拒绝了的概率或风险。是由人们事先确定的,当

取0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为95%。如新技术取代传统工艺的研究中,希望拒绝H0,那么越小,检验的标准就越高3、规定显著性水平

第37页/共184页2023/10/25

4、作出统计决策

计算检验的统计量根据给定的显著性水平

,查表得出相应的临界值U

或U/2

将检验统计量的值与

水平的临界值进行比较得出接受或拒绝原假设的结论第38页/共184页2023/10/25抽样分布

U

统计量第39页/共184页1.3统计假设检验的几何意义与两类错误1.3.1统计假设检验的几何意义

统计假设检验从本质上来说,就是根据显著水平а将统计量(数)的分布划分为接受区和否定区两部分。前者为接受原假设H0的区间,后者为否定H0,而接受HA的区间。当试验结果落入接受区,就接受H0;反之,否定H0,而接受HA。否定区的概率为α

,接受区的概率为1-а

。第40页/共184页

是否否定无效假设或,用实际计算出的统计量u或t的绝对值与显著水平α对应的临界值ua

或ta比较。若|u|≥ua

或|t|≥ta,则在α水平上否定;若|u|<ua或

|t|<ta,则不能在α水平上否定。区间和或称为α水平上的否定域,而区间()则称为α水平上的接受域。下一张

主页

退出

上一张

第41页/共184页图4-1双侧检验时H0的接受域和否定域第42页/共184页对前例分析:所以在a=0.05水平上的接受域为(0.0785<<0.1165)否定域为≤0.0785,≥0.1165

试验结果=0.1199,落入否定区间,所以否定,接受结论:采用新曲种酿造食醋,其醋酸含量有显著改变。第43页/共184页引例2某厂生产的小包装糖果,其标准含糖量为68克/包,而实际生产的小包装糖果X服从

N(

,3.62).若

E(X)=

=68,则认为这批小包装糖果符合要求,否则认为不符合要求.为此提出如下假设:H0:

=68称为原假设或零假设

原假设的对立面:H1:

68称为备择假设现从该厂生产的糖果中抽取容量为36的样本,其样本均值为

,问原假设是否正确?第44页/共184页若原假设正确,则故

取较大值是小概率事件因而

,即偏离68不应该太远,是小概率事件,偏离较远由于第45页/共184页规定

为小概率事件的概率大小,通常取

=0.05,0.01,…例如,取

=0.05,则因此,可以确定一个常数c,使得第46页/共184页由称的取值区间

(66.824,69.18)为检验的接受域

(实际上没理由拒绝),现落入接受域,则接受原假设

H0:

=68(,66.824)与(69.18,+

)为检验的拒绝域而区间第47页/共184页

由引例2可见,在给定的前提下,接受还是拒绝原假设完全取决于样本值,因此所作检验可能导致以下两类错误的产生:第一类错误弃真错误第二类错误取伪错误第48页/共184页H0

为真H0

为假真实情况所作判断接受H0拒绝H0正确正确第一类错误

(弃真)第二类错误

(取伪)假设检验的两类错误犯第一类错误的概率通常记为

犯第二类错误的概率通常记为

表第49页/共184页2023/10/25犯第一类错误的概率通常记为的意义:如果原假设H0成立,重复抽样100次,检验结论中平均有100

次拒绝H0犯第二类错误的概率通常记为

如果原假设H0成立,重复抽样100次,检验结论中平均有100

次接受H0第50页/共184页

希望所用的检验方法尽量少犯错误,但不能完全排除犯错误的可能性.理想的检验方法应使犯两类错误的概率都很小,但在样本的容量给定的情形下,不可能使两者都很小,降低一个,往往使另一个增大.

假设检验的指导思想是控制犯第一类错误的概率不超过

,然后,若有必要,通过增大样本容量的方法来减少

.

第51页/共184页

犯第一类错误的概率

=P(拒绝H0|H0为真)若H0为真,则

所以,拒绝H0的概率为

,又称为显著性水平,

越大,犯第一类错误的概率越大.引例2中第52页/共184页H0不真,即

68,

可能小于68,也可能大于68,

的大小取决于

的真值的大小.下面计算犯第二类错误的概率

=66,n=36,

=P(接受

H0|H0不真

)第53页/共184页若

=69,n=36,取伪的概率较大.第54页/共184页

/2

/2

H0

真H0

不真图66.826869.180.020.040.060.080.10.126869.18700.020.040.060.080.10.1268犯第一类错误的概率通常记为的意义:如果原假设H0成立,重复抽样100次,检验结论中平均有100

次拒绝H0犯第二类错误的概率通常记为

如果原假设H0成立,重复抽样100次,检验结论中平均有100

次接受H0接受域第55页/共184页2023/10/25第56页/共184页仍取

=0.05,则由可以确定拒绝域为(,67.118)与(68.882,+

)因此,接受域为(67.118,68.882)现增大样本容量,取n=64,

=66,则第57页/共184页第58页/共184页

一般,作假设检验时,先控制犯第一类错误的概率

,在保证

的条件下使

尽量地小.要降低

一般要增大样本容量.当H0不真时,参数值越接近真值,

越大.

备择假设可以是单侧,也可以是双侧的.注1º注2º引例2中的备择假设是双侧的.如果根据以往的生产情况,

0=68.现采用了新工艺,关心的是新工艺能否提高含糖量,

越大越好.第59页/共184页关于零假设与备择假设的选取H0与H1地位应平等,但在控制犯第一类错误的概率

的原则下,使得采取拒绝H0的决策变得较慎重,即H0

得到特别的保护.因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.注3º第60页/共184页在上述显著性检验中,对应于无效假设的备择假设为。它包含了或两种可能。因而有两个否定域,分别为于分布曲线的两尾。这个假设检验的目的在于判断μ与μ0有无差异,而不考虑谁大谁小。下一张

主页

退出

上一张

1.4双侧检验与单侧检验

双侧检验第61页/共184页这样,在α水平上否定域有两个和,对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如图4-3所示。这种利用两尾概率进行的检验叫双侧检验(two-sidedtest),也叫双尾检验(two-tailedtest),为双侧检验的临界u值。下一张

主页

退出

上一张

第62页/共184页

但在有些情况下,双侧检验不一定符合实际情况。如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在12%以上(μ0),如果进行抽样检验,样本平均数,该批醋为合格产品,但如果时,可能是一批不合格产品。对这样的问题,我们关心的是所在总体平均数μ是否小于已知总体平均数数μ0(即产品是否不合格)。此时,无效假设应为(产品合格),备择假设则应为HA

:(产品不合格)。这样,只有一个否定域,并且位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧的概率为α

。下一张

主页

退出

上一张

单侧检验第63页/共184页

若无效假设H0为,备择假设HA为μ>μ0

,此时H0的否定域在u分布曲线的右尾,右尾检验。在α水平上否定域为,右侧的概率为α。右尾检验如图4-3A所示。例如,国家规定酿造白酒中的甲醇含量不得超过0.1%。在抽样检验中,若样本平均数小于0.1%,产品合格,而当平均数0.1%,产品为不合格。这样的问题,H0:,HA:μ>μ0

。下一张

主页

退出

上一张

第64页/共184页

利用一尾概率进行的检验叫单侧检验(one-sidedtest),也叫单尾检验(one-tailedtest)。此时uα为单侧检验的临界u值。单侧检验的uα=双侧检验的u2α。下一张

主页

退出

上一张

图4-3一尾检验

H0:μ≥μ0HA:μ<μ0

H0:μ≤μ0HA:μ>μ0临界值u2α或t2αα第65页/共184页2样本平均数的假设检验

在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。即检验无效假设H0:μ=μ0,备择假设HA:μ≠μ0或μ>μ0(μ<μ0)的问题。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。下一张

主页

退出

上一张

2.1单个样本平均数的假设检验实质是样本所在总体平均数与已知总体平均数差异显著性检验。第66页/共184页2.1.1单个样本平均数的u检验

u检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Test)。由抽样分布理论可知,有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;总体方差虽然未知,但样本平均数来自于大样本(n≥30)。下边举例说明检验过程:第67页/共184页2023/10/25(1)关于

的检验检验样本所在总体的均值μ是否等于已知总体的均值

0

正态总体的参数检验设X~N(

2),

2已知,需检验:H0:

0;HA:

0构造统计量

给定显著性水平

与样本值(x1,x2,…,xn)一个正态总体的参数检验第68页/共184页2023/10/25

0

0

0

0

<

0

>

0u检验法(

2已知)原假设

H0备择假设

HA检验统计量及其H0为真时的分布拒绝域第69页/共184页【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?

由题意知,样本服从正态分布,总体方差σ2=64,符合u检验应用条件。由于当日装罐机的每罐平均净重可能高于或低于正常工作状态下的标准净重,故需作两尾检验。其方法如下:(1)提出假设。无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。第70页/共184页(2)确定显著水平。α=0.05(两尾概率)(3)构造统计量,并计算样本统计量值。均数标准误:样本平均数:统计量u值:第71页/共184页(4)统计推断。由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明,试验表面效应仅由误差引起的概率P>0.05,故不能否定H0

,所以,当日装罐机工作正常。第72页/共184页下一张

主页

退出

上一张

2.1.2单个样本平均数的t检验

t检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n<30)。

其中,为样本平均数,S为样本标准差,n为样本容量。第73页/共184页2023/10/25第74页/共184页2023/10/25第75页/共184页例4-2用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为=520g,标准差S=12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?本例总体方差未知,又是小样本,采用双侧t检验。(1)提出无效假设与备择假设,即新老工艺没有差异。

,新老工艺有差异。下一张

主页

退出

上一张

SAMPLE第76页/共184页

(2)确定显著水平α=0.01

(3)计算t值=520g,S=12g所以第77页/共184页(4)查临界t值,作出统计推断由=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|>t0.01,P<0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记**)下一张

主页

退出

上一张

第78页/共184页【例4-3】某名优绿茶含水量标准为不超过5.5%。现有一批该绿茶,从中随机抽出8个样品测定其含水量,平均含水量=5.6%,标准差S=0.3%。问该批绿茶的含水量是否超标?符合t检验条件,为单尾检验。(1)提出无效假设与备择假设

H0:≤=5.5%,HA:>(2)计算t

下一张

主页

退出

上一张

第79页/共184页

(3)查临界t值,作出统计推断

单侧=双侧=1.895,t=1.000<单侧t0.05(7),P>0.05,不能否定H0

:≤

=5.5%,可以认为该批绿茶的含水量符合规定要求。下一张

主页

退出

上一张

第80页/共184页【例】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,问此产品是否符合规定要求?下一张

主页

退出

上一张

第81页/共184页

按题意,此例应采用单侧检验。(1)提出无效假设与备择假设

H0:≤

246,HA:>246

(2)计算t

值经计算得:=114.5,S=1.581下一张

主页

退出

上一张

第82页/共184页所以

===2.281

第83页/共184页

3、查临界t值,作出统计推断

因为单侧=双侧=1.796,t=2.281>单侧t0.05(11),P<0.05,否定H0

:≤

246,接受HA

:>246,可以认为该批饲料维生素C含量符合规定要求。下一张

主页

退出

上一张

第84页/共184页2023/10/25第85页/共184页

在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计或调查取样不同,一般可分为两种情况。下一张

主页

退出

上一张

2.2两个样本平均数的差异显著性检验第86页/共184页2023/10/25设X~N(

1

1

2),Y~

N(

2

2

2),两样本X,Y相互独立,(成组检验)样本(X1,X2,…,Xn),(Y1,Y2,…,Ym)

样本值

(x1,x2,…,xn),(y1,y2,…,ym),显著性水平

两个正态总体的参数检验第87页/共184页2.2.1成组资料平均数的假设检验非配对设计两样本平均数的差异显著性检验成组设计:当一个试验只有两个处理的时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k=2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见表4-1。下一张

主页

退出

上一张

第88页/共184页

表4-1成组设计(非配对设计)资料的一般形式下一张

主页

退出

上一张

成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等第89页/共184页1u

检验如果两个样本所在总体为正态分布,且总体方差和已知;或者总体方差未知,但两个样本都是大样本(n1,n2≥30),可采用u检验来分析。由两均数差抽样分布理论可知,在上述条件下,两个样本平均数之差服从正态分布,即~参数关系:第90页/共184页~N(0,1)那么在H0:μ1=μ2下,正态离差u值为差数标准误为根据4-2,4-3即可对两样本均数的差异做出检验(4-2)(4-3)第91页/共184页如果总体方差未知,但两个样本为大样本,可由样本方差S12、S22分别估计总体方差σ12、

σ22

,平均数差数的标准误可由下列公式估计:其中,S12、S22分别是样本含量为n1、n2的两个样本方差。第92页/共184页2023/10/25

1–

2

=

(

12,

22

已知)(1)关于均值差

1–

2

的检验(常检验=0的情况)

1–

2

1–

2

1–

2

<

1–

2>

1–

2

原假设

H0备择假设

HA检验统计量及其在H0为真时的分布拒绝域第93页/共184页例4-4在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。甲生产线(x1)乙生产线(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557表4-2甲乙两条生产线日产量记录第94页/共184页(1)建立假设。即两条生产线的平均日产量无差异。(2)确定显著水平α=0.01(3)计算故:第95页/共184页(4)统计推断。由α=0.01查附表2,得u0.01=2.58

实际|u|=3.28>u0.01=2.58,故P<0.01,应否定H0,接受HA。说明两个生产线的日平均产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。第96页/共184页

当两个样本所在总体方差未知,又是小样本,但假定时,有下一张

主页

退出

上一张

2t

检验~t()(4-4)由4-4式可作两样本平均数差异的t检验。第97页/共184页当样本含量相等时()自由度df=2(n-1)例4-5海关抽检出口罐头质量,发现有胀听现象,随机抽取了6个样品,同时随机抽取6个正常罐头样品测定其SO2含量,测定结果见表4-3。试分析两种罐头的SO2含量有无差异。正常罐头(x1)100.094.298.599.296.4102.5异常罐头(x2)130.2131.3130.5135.2135.2133.5表4-3正常罐头与异常罐头SO2含量测定结果第98页/共184页(1)提出无效假设与备择假设

两种罐头SO2含量没有差异;(2)确定显著水平α=0.01(两尾概率)

(3)计算

第99页/共184页(4)统计推断由df=10,α=0.01查附表3得t0.01(10)=3.169。实得

|t|=22.735>t0.01(10)=3.169,P<0.01,故应否定无效假设H0,即两种罐头的SO2含量有高度显著差异,该批罐头质量不合格。第100页/共184页2023/10/25

1–

2

=

1–

2

1–

2

1–

2

<

1–

2>

1–

2

其中

12,

22未知

12=

22原假设

H0备择假设

H1检验统计量及其在H0为真时的分布拒绝域第101页/共184页【例4-6】现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表4-4。问两种工艺的粗提物中茶多糖含量有无差异?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.00表4-4两种工艺粗提物中茶多糖含量测定结果第102页/共184页(1)建立假设,提出无效假设与备择假设

,两种工艺的粗提物中茶多糖含量无差异;(2)确定显著水平α=0.05(两尾概率)

(3)计算

第103页/共184页因两个样本的容量不等,所以第104页/共184页下一张

主页

退出

上一张

(4)查临界t值,作出统计推断

当df=9时,查临界值得:t0.05(9)=2.262,|t|=1.381<t0.05(9),所以P>0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。第105页/共184页

在成组设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样本含量相等比两样本含量不等有较高检验效率,因为此时使最小,从而使t的绝对值最大。所以在进行成组设计时,两样本含量以相等为好。下一张

主页

退出

上一张

第106页/共184页

下一张

主页

退出

上一张

强调:不论样本大小,当总体方差未知时,但方差相等,都可用t检验方法进行假设检验,前提条件是样本所在总体应服从正态分布。3近似t检验-t’检验

两样本所在总体方差未知,而且两个方差不等,此时只能作近似t检验。检验原理、过程同t检验,只是计算上有区别。第107页/共184页均数差数标准误:t’不再准确地服从自由度为的t分布,而只是近似地服从t分布,此时,应采用近似t检验法。此法在作统计推断时,所用临界值不是由附表直接查得的,而须进行矫正。第108页/共184页(4-6)实例见例4-7,P82第109页/共184页

非配对设计要求试验单元尽可能一致。如果试验单元变异较大,如试验果品品种、成熟度相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。下一张

主页

退出

上一张

2.2.2成对资料平均数的假设检验配对设计两样本平均数的差异显著性检验第110页/共184页

配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。下一张

主页

退出

上一张

第111页/共184页自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测紫外线对饮料色泽的变化的影响;观测用两种不同加热方法对产品中营养成分的测定结果变化等。同一食品在贮藏前后的变化。下一张

主页

退出

上一张

第112页/共184页同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。

成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见表4-5。下一张

主页

退出

上一张

第113页/共184页

表4-5配对设计试验资料的一般形式下一张

主页

退出

上一张

两个处理的观测值一一配对,即(X11,X21),(X12,X22),(X13,X23),…,(X1n,X2n)。

那么,每对观测值之间的差数为di=X1i-X2i(i=1,2,3,…,n)第114页/共184页差数d1,d2,d3,…,dn组成容量为n的差数样本,差数样本的平均数为(i=1,2,3,…,n)差数均数标准误(4-7)第115页/共184页下一张

主页

退出

上一张

(4-8)根据(4-7)式和(4-8)式即可对成对资料平均数的差异性进行检验第116页/共184页【例4-8】为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?

本例因每个品种实施了一对处理,试验资料为成对资料。品种编号12345678910电渗处理X1/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照X2/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=X1-X2)4.193.103.615.003.081.995.921.712.444.14表4-5电渗处理对草莓钙离子含量的影响第117页/共184页

,即电渗处理后草莓钙离子含量与对照钙离子含量无差异,也就是说电渗处理对草莓钙离子含量无影响。下一张

主页

退出

上一张

(1)建立假设

(2)确定显著水平α=0.01

(3)计算第118页/共184页第119页/共184页将计算所得t值的绝对值与临界值比较,(4)查临界t值,作出统计推断根据df=n-1=9,查临界t值:t0.01(9)=3.250因为|t|=8.358>t0.01(9),P<0.01,否定H0,接受HA

,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。第120页/共184页【例】用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表。设体温服从正态分布,问注射前后体温有无显著差异?(自身配对)下一张

主页

退出

上一张

表10只家兔注射前后的体温第121页/共184页(1)提出无效假设与备择假设,即假定注射前后体温无差异,即假定注射前后体温有差异

(2)计算t值经过计算得故且=10-1=9下一张

主页

退出

上一张

第122页/共184页

(3)查临界t值,作出统计推断

由df=9,查t值表得:t0.01(9)=3.250,因为|t|>t0.01(9),P<0.01,否定,接受,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。

下一张

主页

退出

上一张

第123页/共184页

一般说来,相对于成组设计,配对设计能够提高试验的精确性。配对内的误差是相同的且是随机的;配对间的误差不同,但它们是独立的,可分离出来,为系统误差。在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设HA的建立和临界值的查取就行了,具体计算与双侧检验相同。下一张

主页

退出

上一张

第124页/共184页成对检验的优点(1)由于加强了试验控制,成对观测值的可比性提高,因而随机误差将减小,可以发现较小的真实差异。(2)成对比较不受两个样本总体方差σ12≠σ22的干扰,不需考虑两者是否相等。第125页/共184页3二项百分率的假设检验

在食品科研中,有许多试验结果以百分率表示,例如产品合格率、食品贮藏变质率、一级出品率等等。这些百分数资料是服从二项分布的,故称为二项百分率。它们与一般百分数不同(如食品中各种营养成分的含量)。对二项百分率的检验,从理论上讲,应按二项分布进行。这样的检验方法虽然比较准确,但计算较麻烦,所以常用正态近似法来代替。下一张

主页

退出

上一张

第126页/共184页当样本含量n较大,p不是很小,且np和nq均大于5时,二项分布接近于正态分布。所以,对于服从二项分布的百分率资料,当n足够大时,可以近似地用u检验法,进行差异显著性检验。适用于正态近似法的二项样本条件见表4-6。下一张

主页

退出

上一张

第127页/共184页表4-6适用于正态近似法的二项样本条件下一张

主页

退出

上一张

<<<<<<≥≥≥≥≥≥≥≥≥≥≥≥第128页/共184页

需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,其目的在于检验一个样本百分率所在二项总体百分率p是否与已知二项总体百分率p0相同。下一张

主页

退出

上一张

3.1单个样本百分率的假设检验一个样本百分率与已知总体百分率的差异显著性检验第129页/共184页由第3章可知,二项百分率的总体均值,方差,标准差分别为:在n≥30,np、nq>5时,第130页/共184页标准化后有在下u

统计量百分率标准误利用这样两个公式即可进行单个样本百分率检验。(4-9)(4-10)第131页/共184页【例4-9】某微生物制品的企业标准规定有害微生物不准超过1%(p0),现从一批产品中抽取500件(n),发现有害微生物超标的产品有7件(x)。问该批产品是否合格?本例关心的是产品有害微生物是否超标,属于一尾检验。(1)提出假设下一张

主页

退出

上一张

即该批产品合格;第132页/共184页

由一尾概率α=0.05查附表,得一尾临界值u0.05=1.64,实际计算,p>0.05,表明该批产品达到了企业标准,为合格产品。(2)计算所以

(3)作出统计推断第133页/共184页

检验服从二项分布的两个样本百分率差异是否显著。其目的在于检验两个样本百分率、所在的两个二项总体百分率P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用u检验法进行检验。两样本百分率之差近似服从正态分布。下一张

主页

退出

上一张

3.2两个样本百分率的差异显著性检验第134页/共184页所以在下,则(4-13)可借助正态分布作两样本百分率的差异检验。第135页/共184页样本百分率的差数标准误为:在下由于总体百分率p未知,只能由样本百分率来估计。这里用两个样本百分率的加权平均数来估计共同的总体百分率p:第136页/共184页由样本获得的两样本百分率的差数标准误为:【例4-10】葡萄贮藏试验。装入塑料袋不放保鲜片的葡萄385粒(n1),一个月后发现有25粒(x1)葡萄腐烂;装入塑料袋放保鲜片的葡萄598粒(n2),一个月后发现有20粒(x2)葡萄腐烂。问加保鲜片与不加保鲜片的两种葡萄的腐烂率是否有显著差异?第137页/共184页(1)提出假设两种贮藏葡萄的腐烂率没有差异,即保鲜效果一致。(2)计算第138页/共184页第139页/共184页

由α=0.05和α=0.01查附表得,临界值u0.05=1.96,u0.01=2.58。由于实际计算1.96<<2.58,所以0.05<p<0.01,应否定H0,接受HA,表明两种贮藏葡萄的腐烂率有显著差异,加保鲜片贮藏葡萄有利于葡萄保鲜。下一张

主页

退出

上一张

(3)作出统计推断

第140页/共184页3.3二项样本百分率假设检验时的连续性矫正

样本容量n<25,且np<5时,假设检验需连续矫正。在np和(或)nq小于或等于30时,需作连续性矫正。第141页/共184页例1:已知蔗糖自动打包机的核定方差为C=2,若该日抽取10包进行检测,其S2=2.5,问该打包机的变异程度是否与核定标准有显著差异?例2:某厂生产的保健饮料中的游离氨基酸含量(mg/100ml)在正常情况下服从正态分布N(200,252)。某生产日抽测了6个样品。得数据为205,170,185,210,230,190。试问这一天生产的产品游离氨基酸含量的总体方差是否正常?第142页/共184页2023/10/25关于假设检验的问题讨论第143页/共184页2023/10/25

在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。在试验研究中常取α=0.05或α=0.01。下一张

主页

退出

上一张

1关于显著水平第144页/共184页2023/10/25显著性水平:是一个概率值,表示为

是当原假设为正确时人们却把它拒绝了的概率或风险。是由人们事先确定的,当

取0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为95%。如新技术取代传统工艺的研究中,希望拒绝H0,那么越小,检验的标准就越高第145页/共184页2023/10/25

若|t|<t0.05

,则说明试验的表面效应属于试验误差引起的概率P>

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论