第四章药学实验设计_第1页
第四章药学实验设计_第2页
第四章药学实验设计_第3页
第四章药学实验设计_第4页
第四章药学实验设计_第5页
已阅读5页,还剩188页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计假设检验与参数估计统计推断是根据样本分布规律和概率理论,由样本结果去推断总体特征。它主要包括假设检验(testofhypothesis)和参数估计(parametricestimation)两部分内容。下一张

主页

退出

上一张

假设检验又叫显著性检验(testofsignificance)。显著性检验的方法很多,常用的有u检验、t检验、F检验和

2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。

参数估计有点估计(pointestimation)和区间估计(intervalestimation)。下一张

主页

退出

上一张

例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为μ0=9.75%,其标准差为σ=5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为=11.99%。试问,能否由这30个醋样的平均数判断新曲种好于原曲种?1统计假设检验概述

下一张

主页

退出

上一张

1.1统计假设检验的意义和基本原理1.1.1统计假设检验的意义食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?例2:A,B两种肥料,在相同条件下各施用于5个小区的水稻上,水稻产量平均分别为,二者相差20kg,那么20kg差异究竟是由于两种肥料的不同而造成的还是由试验的随机误差造成的?例3:小麦良种的千粒重x~N(33.5,1.62),现由外地引进一高产品种,在8个小区种植,得千粒重(g):35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,平均数为,试问新引进的品种千粒重与当地品种有无显著差异?如果有显著差异,是否显著高于当地品种?以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是由于随机误差引起的。样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差的存在),样本平均数与总体平均数之间往往有偏差。因此,仅由表面效应是不能判断它们之间是否有显著差异。其根本原因在于试验误差(或抽样误差)的不可避免性。通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值由两部分组成,即=+总体平均数反映了总体特征,表示试验误差。若样本含量为n,则可得到n个观测值:,,,。于是样本平均数下一张

主页

退出

上一张

可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。试验表面效应为上式表明,试验的表面效应由两部分构成:一部分是试验的处理效应(即两总体平均数的差异);另一部分是试验误差。因此,仅凭表面效应来判断两总体平均数是否相同是不可靠的。如果处理效应不存在即,则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应是否存在是假设检验的关健。同理,对于接受不同处理的两个样本来说,则有:=+,=+这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。下一张

主页

退出

上一张

也就是说样本平均数之差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有通过显著性检验才能从(-)中提取结论。对(-)进行显著性检验就是要分析:

试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。下一张

主页

退出

上一张

处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。下一张

主页

退出

上一张

下一张

主页

退出

上一张

小概率事件实际不可能性原理1.1.2统计假设检验的基本思想小概率事件在一次试验中被认为是不可能发生的。

小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。

0.050.010.001称之为小概率事件。

下一张

主页

退出

上一张

举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止1个黑球。下一张

主页

退出

上一张

1.1.3统计假设检验的基本原理

1.根据研究目的,对研究总体提出假设

原假设、无效假设、零假设(nullhypothesis)

是被检验的假设,通过检验可能被接受,也可能被否定。与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。备择假设(alternativehypothesis)如前例,原假设H0:,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。对应的备择假设为,即表明采用新曲种酿造食醋能够改变醋酸含量,试验的处理效应存在。对于来自两个总体的两个样本,原假设H0:,即两个总体的平均数相等,处理效应为零,试验表面效应仅由误差引起,处理效应不存在。对应的备择假设是:≠,即假设两个总体的平均数不相等,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。2.在无效假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。下一张

主页

退出

上一张

当无效假设H0成立时,表明试验表面效应纯属试验误差引起,处理效应不存在。此时,可根据题意构造适当统计量,计算样本统计量值。对前例分析,无效假设H0:成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的看成是从总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,

~N(μ0,σ2/n)。构造统计量:~N(0,1)(4-1)由样本值计算统计量u值,由正态分布双侧分位数(uа)可知本例计算出的统计量u=2.315,1.96<<2.58,所以可推知其概率0.01<<0.05本试验的表面效应=0.0224完全由试验误差造成的概率在0.01-0.05之间。

在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设成立的可能性大,不能被否定,因而也就不能接受备择假设。下一张

主页

退出

上一张

3.根据“小概率事件实际不可能性原理”否定或接受无效假设叫做均数差异标准误;n1、n2为两样本的含量。

对于来自两个总体的样本,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:下一张

主页

退出

上一张

其中所得的统计量t服从自由度

df=(n1-1)+(n2-1)的t分布。~t(df)

根据两个样本的数据,计算得:-=11-9.2=1.8;下一张

主页

退出

上一张

进一步估计|t|≥2.426的两尾概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=18时,两尾概率为0.05的临界值:两尾概率为0.01的临界t值:下一张

主页

退出

上一张

=2.101,=2.878,即:P(|t|>2.101)=P(t>2.101)+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)+P(t<-2.878)=0.01

由两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.05<2.426<t0.01所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。如图所示,|t|≥2.426的两尾概率,说明无效假设成立的可能性,即试验的表面效应为试验误差引起的可能性在0.01─0.05之间。下一张

主页

退出

上一张

按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,从而接受:≠。可以认为两个总体平均数和不相同。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。下一张

主页

退出

上一张

在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。在试验研究中常取α=0.05或α=0.01。下一张

主页

退出

上一张

1.1.4统计假设检验的显著水平假设检验时选用的显著水平,除α=0.05和0.01为常用外,也可选α=0.10或α=0.001等等。到底选哪个显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。显著水平α对假设检验的结论是有直接影响的,所以在试验开始前应给以确定。下一张

主页

退出

上一张

若|t|<t0.05

,则说明试验的表面效应属于试验误差引起的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“ns”或不做任何标记;下一张

主页

退出

上一张

统计假设检验结果说明(两个样本):若t0.05≤|t|<t0.01,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P≤0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;下一张

主页

退出

上一张

若|t|≥t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。下一张

主页

退出

上一张

1.2统计假设检验的步骤建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平α。常用的显著水平α=0.05和α=0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断(或由概率大小做出判断)。1.3统计假设检验的几何意义与两类错误1.3.1统计假设检验的几何意义统计假设检验从本质上来说,就是根据显著水平а将统计量(数)的分布划分为接受区和否定区两部分。前者为接受原假设H0的区间,后者为否定H0,而接受HA的区间。当试验结果落入接受区,就接受H0;反之,否定H0,而接受HA。否定区的概率为α

,接受区的概率为1-а

。是否否定无效假设或,用实际计算出的统计量u或t的绝对值与显著水平α对应的临界值ua

或ta比较。若|u|≥ua

或|t|≥ta,则在α水平上否定;若|u|<ua或|t|<ta,则不能在α水平上否定。区间和或称为α水平上的否定域,而区间()则称为α水平上的接受域。下一张

主页

退出

上一张

图4-1双侧检验时H0的接受域和否定域对前例分析:所以在a=0.05水平上的接受域为(0.0785<<0.1165)否定域为≤0.0785,≥0.1165试验结果=0.1199,落入否定区间,所以否定,接受结论:采用新曲种酿造食醋,其醋酸含量有显著改变。统计假设检验的是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验无效假设时可能犯两类错误。第一类错误:H0本身是成立,但通过检验却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)、а错误。Ⅰ型错误,就是把非真实差异错判为真实差异,即为真,却接受了。下一张

主页

退出

上一张

1.3.2统计假设检验的两类错误第二类错误:H0本身不成立,但通过检验却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)、β错误。Ⅱ型错误,就是把真实差异错判为非真实差异,即为真,却未能否定。统计检验是基于“小概率事件实际不可能性原理”来否定H0,但在一次试验中小概率事件并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0对应的抽样总体,但计算所得的统计量却落入了否定域中,因而否定了H0,于是犯了Ⅰ型错误。犯Ⅰ这类错误的概率不会超过a。下一张

主页

退出

上一张

Ⅱ型错误发生的原因可以用图4-2来说明。图中左边曲线是为真时,(-)的分布密度曲线;右边曲线是为真时,(-)的分布密度曲线(>),它们构成的抽样分布相叠加。有时我们从抽样总体抽取一个(-)恰恰在成立时的接受域内(如图中横线阴影部分),这样,实际是从总体抽的样本,经显著性检验却不能否定,因而犯了Ⅱ型错误。犯Ⅱ型错误的概率用表示。下一张

主页

退出

上一张

图4-2两类错误示意图Ⅱ型错误概率值的大小较难确切估计,它只有与特定的结合起来才有意义。一般与显著水平α、原总体的标准差σ、样本含量n、以及相互比较的两样本所属总体平均数之差-等因素有关。在其它因素确定时,α值越小,值越大;反之,α值越大,值越小;样本含量及-越大、均数标准误σ越小,值越小。下一张

主页

退出

上一张

由于值的大小与α值的大小有关,所以在选用检验的显著水平时应考虑到犯Ⅰ、Ⅱ型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复,那么α值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将α值放宽到0.1,甚至放宽到0.25。下一张

主页

退出

上一张

在提高显著水平,即减小α值时,为了减小犯Ⅱ型错误的概率,可适当增大样本含量。因为增大样本含量可使()分布的方差σ2(1/n1+1/n2)变小,使图4-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即值变小。由于在具体问题中往往不是主观能够改变的客观存在,所以通过严密的试验设计、严格的试验操作和增大样本容量n来降低均数标准误,从而降低。下一张

主页

退出

上一张

注意:在上述显著性检验中,对应于无效假设的备择假设为。它包含了或两种可能。因而有两个否定域,分别为于分布曲线的两尾。这个假设检验的目的在于判断μ与μ0有无差异,而不考虑谁大谁小。下一张

主页

退出

上一张

1.4双侧检验与单侧检验双侧检验这样,在α水平上否定域有两个和,对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如图4-3所示。这种利用两尾概率进行的检验叫双侧检验(two-sidedtest),也叫双尾检验(two-tailedtest),为双侧检验的临界u值。下一张

主页

退出

上一张

但在有些情况下,双侧检验不一定符合实际情况。如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在12%以上(μ0),如果进行抽样检验,样本平均数,该批醋为合格产品,但如果时,可能是一批不合格产品。对这样的问题,我们关心的是所在总体平均数μ是否小于已知总体平均数数μ0(即产品是否不合格)。此时,无效假设应为(产品合格),备择假设则应为HA:(产品不合格)。这样,只有一个否定域,并且位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧的概率为α。下一张

主页

退出

上一张

单侧检验若无效假设H0为,备择假设HA为μ>μ0,此时H0的否定域在u分布曲线的右尾,右尾检验。在α水平上否定域为,右侧的概率为α。右尾检验如图4-3A所示。例如,国家规定酿造白酒中的甲醇含量不得超过0.1%。在抽样检验中,若样本平均数小于0.1%,产品合格,而当平均数0.1%,产品为不合格。这样的问题,H0:,HA:μ>μ0。下一张

主页

退出

上一张

利用一尾概率进行的检验叫单侧检验(one-sidedtest),也叫单尾检验(one-tailedtest)。此时uα为单侧检验的临界u值。

单侧检验的uα=双侧检验的u2α。下一张

主页

退出

上一张

图4-3一尾检验

H0:μ≥μ0HA:μ<μ0

H0:μ≤μ0HA:μ>μ0临界值u2α或t2αα2样本平均数的假设检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。即检验无效假设H0:μ=μ0,备择假设HA:μ≠μ0或μ>μ0(μ<μ0)的问题。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。下一张

主页

退出

上一张

2.1单个样本平均数的假设检验实质是样本所在总体平均数与已知总体平均数差异显著性检验。2.1.1单个样本平均数的u检验

u检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。由抽样分布理论可知,有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;总体方差虽然未知,但样本平均数来自于大样本(n≥30)。下边举例说明检验过程:【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?由题意知,样本服从正态分布,总体方差σ2=64,符合u检验应用条件。由于当日装罐机的每罐平均净重可能高于或低于正常工作状态下的标准净重,故需作两尾检验。其方法如下:(1)提出假设。无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。(2)确定显著水平。α=0.05(两尾概率)(3)构造统计量,并计算样本统计量值。均数标准误:样本平均数:统计量u值:(4)统计推断。由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明,试验表面效应仅由误差引起的概率P>0.05,故不能否定H0,所以,当日装罐机工作正常。下一张

主页

退出

上一张

2.1.2单个样本平均数的t检验

t检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n<30)。其中,为样本平均数,S为样本标准差,n为样本容量。例4-2用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为=520g,标准差S=12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?本例总体方差未知,又是小样本,采用双侧t检验。

(1)提出无效假设与备择假设,即新老工艺没有差异。

,新老工艺有差异。下一张

主页

退出

上一张

(2)确定显著水平α=0.01

(3)计算t值=520g,S=12g所以(4)查临界t值,作出统计推断由=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|>t0.01,P<0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记**)下一张

主页

退出

上一张

【例4-3】某名优绿茶含水量标准为不超过5.5%。现有一批该绿茶,从中随机抽出8个样品测定其含水量,平均含水量=5.6%,标准差S=0.3%。问该批绿茶的含水量是否超标?符合t检验条件,为单尾检验。(1)提出无效假设与备择假设

H0:≤=5.5%,HA:>(2)计算t值

下一张

主页

退出

上一张

(3)查临界t值,作出统计推断

单侧=双侧=1.895,t=1.000<单侧t0.05(7),P>0.05,不能否定H0:≤=5.5%,可以认为该批绿茶的含水量符合规定要求。下一张

主页

退出

上一张

【例】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,问此产品是否符合规定要求?下一张

主页

退出

上一张

按题意,此例应采用单侧检验。(1)提出无效假设与备择假设

H0:≤246,HA:>246(2)计算t值经计算得:=114.5,S=1.581下一张

主页

退出

上一张

所以===2.281

3、查临界t值,作出统计推断

因为单侧=双侧=1.796,t=2.281>单侧t0.05(11),P<0.05,否定H0:≤246,接受HA

:>246,可以认为该批饲料维生素C含量符合规定要求。下一张

主页

退出

上一张

在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计或调查取样不同,一般可分为两种情况。下一张

主页

退出

上一张

2.2两个样本平均数的差异显著性检验2.2.1成组资料平均数的假设检验非配对设计两样本平均数的差异显著性检验

成组设计:当一个试验只有两个处理的时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k=2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见表4-1。下一张

主页

退出

上一张

表4-1成组设计(非配对设计)资料的一般形式下一张

主页

退出

上一张

成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等1u检验如果两个样本所在总体为正态分布,且总体方差和已知;或者总体方差未知,但两个样本都是大样本(n1,n2≥30),可采用u检验来分析。由两均数差抽样分布理论可知,在上述条件下,两个样本平均数之差服从正态分布,即~参数关系:~N(0,1)那么在H0:μ1=μ2下,正态离差u值为差数标准误为根据4-2,4-3即可对两样本均数的差异做出检验(4-2)(4-3)如果总体方差未知,但两个样本为大样本,可由样本方差S12、S22分别估计总体方差σ12、

σ22,平均数差数的标准误可由下列公式估计:其中,S12、S22分别是样本含量为n1、n2的两个样本方差。例4-4在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。甲生产线(x1)乙生产线(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557表4-2甲乙两条生产线日产量记录(1)建立假设。即两条生产线的平均日产量无差异。(2)确定显著水平α=0.01(3)计算故:(4)统计推断。由α=0.01查附表2,得u0.01=2.58实际|u|=3.28>u0.01=2.58,故P<0.01,应否定H0,接受HA。说明两个生产线的日平均产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。当两个样本所在总体方差未知,又是小样本,但假定时,有下一张

主页

退出

上一张

2t检验~t()(4-4)由4-4式可作两样本平均数差异的t检验。当样本含量相等时()自由度df=2(n-1)例4-5海关抽检出口罐头质量,发现有胀听现象,随机抽取了6个样品,同时随机抽取6个正常罐头样品测定其SO2含量,测定结果见表4-3。试分析两种罐头的SO2含量有无差异。正常罐头(x1)100.094.298.599.296.4102.5异常罐头(x2)130.2131.3130.5135.2135.2133.5表4-3正常罐头与异常罐头SO2含量测定结果(1)提出无效假设与备择假设两种罐头SO2含量没有差异;(2)确定显著水平α=0.01(两尾概率)

(3)计算

(4)统计推断由df=10,α=0.01查附表3得t0.01(10)=3.169。实得|t|=22.735>t0.01(10)=3.169,P<0.01,故应否定无效假设H0,即两种罐头的SO2含量有高度显著差异,该批罐头质量不合格。【例4-6】现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表4-4。问两种工艺的粗提物中茶多糖含量有无差异?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.00表4-4两种工艺粗提物中茶多糖含量测定结果(1)建立假设,提出无效假设与备择假设,两种工艺的粗提物中茶多糖含量无差异;(2)确定显著水平α=0.05(两尾概率)

(3)计算因两个样本的容量不等,所以下一张

主页

退出

上一张

(4)查临界t值,作出统计推断当df=9时,查临界值得:t0.05(9)=2.262,|t|=1.381<t0.05(9),所以P>0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。在成组设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样本含量相等比两样本含量不等有较高检验效率,因为此时使最小,从而使t的绝对值最大。所以在进行成组设计时,两样本含量以相等为好。下一张

主页

退出

上一张

下一张

主页

退出

上一张

强调:不论样本大小,当总体方差未知时,但方差相等,都可用t检验方法进行假设检验,前提条件是样本所在总体应服从正态分布。3近似t检验-t’检验两样本所在总体方差未知,而且两个方差不等,此时只能作近似t检验。检验原理、过程同t检验,只是计算上有区别。均数差数标准误:t’不再准确地服从自由度为的t分布,而只是近似地服从t分布,此时,应采用近似t检验法。此法在作统计推断时,所用临界值不是由附表直接查得的,而须进行矫正。(4-6)实例见例4-7,P82

非配对设计要求试验单元尽可能一致。如果试验单元变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。下一张

主页

退出

上一张

2.2.2成对资料平均数的假设检验配对设计两样本平均数的差异显著性检验

配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。下一张

主页

退出

上一张

自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。同一食品在贮藏前后的变化。下一张

主页

退出

上一张

同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。

成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见表4-5。下一张

主页

退出

上一张

表4-5配对设计试验资料的一般形式下一张

主页

退出

上一张

两个处理的观测值一一配对,即(X11,X21),(X12,X22),(X13,X23),…,(X1n,X2n)。那么,每对观测值之间的差数为di=X1i-X2i(i=1,2,3,…,n)差数d1,d2,d3,…,dn组成容量为n的差数样本,差数样本的平均数为(i=1,2,3,…,n)差数均数标准误(4-7)下一张

主页

退出

上一张

(4-8)根据(4-7)式和(4-8)式即可对成对资料平均数的差异性进行检验【例4-8】为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?本例因每个品种实施了一对处理,试验资料为成对资料。品种编号12345678910电渗处理X1/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照X2/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=X1-X2)4.193.103.615.003.081.995.921.712.444.14表4-5电渗处理对草莓钙离子含量的影响,即电渗处理后草莓钙离子含量与对照钙离子含量无差异,也就是说电渗处理对草莓钙离子含量无影响。下一张

主页

退出

上一张

(1)建立假设

(2)确定显著水平α=0.01

(3)计算将计算所得t值的绝对值与临界值比较,(4)查临界t值,作出统计推断根据df=n-1=9,查临界t值:t0.01(9)=3.250因为|t|=8.358>t0.01(9),P<0.01,否定H0,接受HA,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。【例】用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表。设体温服从正态分布,问注射前后体温有无显著差异?(自身配对)下一张

主页

退出

上一张

表10只家兔注射前后的体温(1)提出无效假设与备择假设,即假定注射前后体温无差异,即假定注射前后体温有差异

(2)计算t值经过计算得故且=10-1=9下一张

主页

退出

上一张

(3)查临界t值,作出统计推断

由df=9,查t值表得:t0.01(9)=3.250,因为|t|>t0.01(9),P<0.01,否定,接受,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。【例】现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表。问两种饲料喂饲仔猪增重有无显著差异?(同源配对)

下一张

主页

退出

上一张

一般说来,相对于成组设计,配对设计能够提高试验的精确性。配对内的误差是相同的且是随机的;配对间的误差不同,但它们是独立的,可分离出来,为系统误差。在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设HA的建立和临界值的查取就行了,具体计算与双侧检验相同。下一张

主页

退出

上一张

成对检验的优点(1)由于加强了试验控制,成对观测值的可比性提高,因而随机误差将减小,可以发现较小的真实差异。(2)成对比较不受两个样本总体方差σ12≠σ22的干扰,不需考虑两者是否相等。3二项百分率的假设检验

在食品科研中,有许多试验结果以百分率表示,例如产品合格率、食品贮藏变质率、一级出品率等等。这些百分数资料是服从二项分布的,故称为二项百分率。它们与一般百分数不同(如食品中各种营养成分的含量)。对二项百分率的检验,从理论上讲,应按二项分布进行。这样的检验方法虽然比较准确,但计算较麻烦,所以常用正态近似法来代替。下一张

主页

退出

上一张

当样本含量n较大,p不是很小,且np和nq均大于5时,二项分布接近于正态分布。所以,对于服从二项分布的百分率资料,当n足够大时,可以近似地用u检验法,进行差异显著性检验。适用于正态近似法的二项样本条件见表4-6。下一张

主页

退出

上一张

表4-6适用于正态近似法的二项样本条件下一张

主页

退出

上一张

<<<<<<≥≥≥≥≥≥≥≥≥≥≥≥需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,其目的在于检验一个样本百分率所在二项总体百分率p是否与已知二项总体百分率p0相同。下一张

主页

退出

上一张

3.1单个样本百分率的假设检验一个样本百分率与已知总体百分率的差异显著性检验由第3章可知,二项百分率的总体均值,方差,标准差分别为:在n≥30,np、nq>5时,标准化后有在下u统计量百分率标准误利用这样两个公式即可进行单个样本百分率检验。(4-9)(4-10)【例4-9】某微生物制品的企业标准规定有害微生物不准超过1%(p0),现从一批产品中抽取500件(n),发现有害微生物超标的产品有7件(x)。问该批产品是否合格?本例关心的是产品有害微生物是否超标,属于一尾检验。(1)提出假设下一张

主页

退出

上一张

即该批产品合格;由一尾概率α=0.05查附表,得一尾临界值u0.05=1.64,实际计算,p>0.05,表明该批产品达到了企业标准,为合格产品。(2)计算所以(3)作出统计推断

检验服从二项分布的两个样本百分率差异是否显著。其目的在于检验两个样本百分率、所在的两个二项总体百分率P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用u检验法进行检验。两样本百分率之差近似服从正态分布。下一张

主页

退出

上一张

3.2两个样本百分率的差异显著性检验所以在下,则(4-13)可借助正态分布作两样本百分率的差异检验。样本百分率的差数标准误为:在下由于总体百分率p未知,只能由样本百分率来估计。这里用两个样本百分率的加权平均数来估计共同的总体百分率p:由样本获得的两样本百分率的差数标准误为:【例4-10】葡萄贮藏试验。装入塑料袋不放保鲜片的葡萄385粒(n1),一个月后发现有25粒(x1)葡萄腐烂;装入塑料袋放保鲜片的葡萄598粒(n2),一个月后发现有20粒(x2)葡萄腐烂。问加保鲜片与不加保鲜片的两种葡萄的腐烂率是否有显著差异?(1)提出假设两种贮藏葡萄的腐烂率没有差异,即保鲜效果一致。(2)计算由α=0.05和α=0.01查附表得,临界值u0.05=1.96,u0.01=2.58。由于实际计算1.96<<2.58,所以0.05<p<0.01,应否定H0,接受HA,表明两种贮藏葡萄的腐烂率有显著差异,加保鲜片贮藏葡萄有利于葡萄保鲜。下一张

主页

退出

上一张

(3)作出统计推断3.3二项样本百分率假设检验时的连续性矫正样本容量n<25,且np<5时,假设检验需连续矫正。在np和(或)nq小于或等于30时,需作连续性矫正。检验两个来自正态总体的独立样本的方差S12和S22所属总体方差σ12和σ22是否有显著差异。由抽样分布知:~F(n1-1,n2-1)注意附表F值是右尾概率α的临界值,记作Fα

,直接适用于检验H0:σ12≤σ22

;如果要检验H0:σ12

=σ22

,则显著所需的F值是Fα/2;而检验时则将大方差作分子,小方差作分母计算F值,这样,F>Fα/2时,实得F在α水平上显著。用F检验。样本方差的假设检验例某人研究了两种浸提条件下山楂中可溶性固形物的浸提率,试验结果见表试问这两种浸提条件下山楂可溶性固形物提取率有无显著差异(α=0.05)要考虑方差是否相等?浸提条件可溶性固形物提取率(%)条件142.541.343.741.041.844.0条件247.648.246.347.946.049.0表可溶性固形物提取率比较建立假设

H0:σ12=σ22HA:σ12≠σ22

确定显著水平α=0.05

双尾检验,临界值Fα(f1,f2)=F0.05(5,5)=5.05Fα/2(f1,f2)

=F0.025(5,5)=7.15计算F统计量统计推断实得F<F0.05<F0.025,两总体方差相等。(1)提出假设两种浸提条件的提取率没有差异;(2)确定显著水平α=0.05(两尾概率)

(3)计算

在方差相等的条件下作成组资料平均数差异显著性检验。(4)统计推断由df=10,α=0.05查附表3得t0.05(10)=2.228。实得|t|=7.36>t0.05(10)=2.228,P<0.05,故应否定无效假设H0,即两种浸提条件的提取率有显著差异。

Χ2检验读作卡方检验,是一种用途广泛的统计方法,主要用于:检验两个(或多个)总体率或构成比之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。χ2检验的用途

检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的,也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。χ2检验的基本思想基本计算公式式中,A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency)back例8.1为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1。问:该药治疗原发性高血压是否有效?1、建立检验假设并确定检验水准H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.052、计算检验统计量用基本公式计算卡方值:四格表卡方检验的专用公式:3、查界值表,确定P值,做出推断结论自由度=1,Χ20.05(1)=3.84,Χ2>Χ20.05(1),所以,P<0.05,在α=0.05的检验水准下,拒绝H0,差异有统计学意义,也就是试验组与对照组的总体有效率不等.推倒过程卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定P值时可能存在误差。四格表资料中,当n≥40,有理论频数1≤T<5时,因为理论值太小,会导致χ2值变大,易出现假阳性结论。四格表χ2值的连续性校正连续性校正公式四格表资料χ2公式的正确选择

1)当n≥40,所有T≥

5时,用专用公式或普通公式;2)当n≥40,但有理论频数1≤T<5时,用校正公式;3)n<40或有T<1,或P≈α时,用确切概率法。

连续性校正仅用于的四格表资料,当时,一般不作校正。

例8.2某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?年级近视非近视合计近视率(%)四年级226287.14五年级591435.71合计7354216.67表8-2两个年级大学生的近视眼患病率比较1、建立检验假设并确定检验水准H0:π1=π2,即四年级与五年级学生的近视眼患病率相同H1:π1≠π2,即四年级与五年级学生的近视眼患病率不同α=0.052、计算检验统计量3、查界值表,确定P值,做出推断结论自由度=1,Χ20.05(1)=3.84,Χ2<Χ20.05(1),所以,P>0.05,在α=0.05的检验水准下,不拒绝H0,说明四年级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。若不采用校正公式:在α=0.05水准下,χ2>χ2

0.05(1),则P<0.05。back甲种属性乙种属性+-合计+aba+c-cdc+d合计a+cb+dn=a+b+c+d注意:a、b、c、d代表对子数!表8-16配对四格表基本结构的甲种属性乙种属性++a+-b-+c--d甲属性的阳性率:(a+b)/n乙属性的阳性率:(a+c)/n若H0成立,则有(a+b)/n-(a+c)/n=0,即(b-c)/n=0可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。若H0成立,两种属性不一致的两个格子理论频数都应该是(b+c)/2配对检验公式推导:式中,a,d为两法观察结果一致的两种情况,

b,c为两法观察结果不一致的两种情况。配对卡方检验公式使用条件:例8.4现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果如下表,A培养基的阳性培养率为36.36%,B培养基的阳性培养率为34.34%,试问A、B两种培养基的阳性培养率是否相等?B培养基A培养基+-合计+482472-20106126合计68130198表8-5两种培养基的培养结果A培养基B培养基结果统计痰标本A培养基B培养基1++2++3+-4++5+-6+-7-+8++9--10--11++12++13+-14--痰标本A培养基B培养基15++16++17+-18++19+-20+-21--22+-23--24--25++26+-27++28--1、建立检验假设并确定检验水平H0:π1=π2,即两种培养基的阳性培养率相等H1:π1≠π2,即两种培养基的阳性培养率不相等α=0.052、计算检验统计量3、查界值表,确定P值,做出推断结论查χ2界值表,υ=1,χ20.05(1)=3.84,χ2<χ20.05(1),则P>0.05,在α=0.05的检验水准下,不拒绝H0,尚不能认为两种培养基的培养率不同。back一、行×列表χ2检验行或列超过两组时称为行×列表,或称R×C表。例8.5某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较3种疗法的有效率是否一样。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西医结合组59157479.73合09表8-33种方案治疗肝炎的疗效1.建立检验假设并确定检验水准H0:三种治疗方案的有效率相同H1:三种治疗方案的有效率不全相同α=0.052.计算检验统计量3.查χ2界值表,确定P值,做出推断结论υ=2,χ20.05(2)=5.99,χ2>χ20.05(2),则P<0.05,在α=0.05的水准下,拒绝H0,可以认为三种治疗方案的有效率有差别。例8.6某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见下表,其目的是研究不同地区的人群血型分类构成比是否一样。地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592表8-1三个不同地区血型样本的频数分布图8-1三个不同地区血型样本构成情况代如基本公式:代如通用公式:1、建立检验假设确定检验水准H0:不同地区的人群血型分布总体构成比相同H1:不同地区的人群血型分布总体构成比不全相同α=0.052、计算检验统计量3、查界值表,确定P值,做出推断结论查χ2界值表,υ=6,χ20.05(6)=12.59,χ2>χ20.05(1),则P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区的人群血型分布总体构成比有差别。二、多个样本率间多重比较行×列表χ2检验的结果说明差异有统计学意义,需作两两比较时,先调整α值,再进行率的两两比较。检验水准α=0.05,做多次比较时,按概率理论,两两比较均正确的概率为(1-0.05)(1-0.05)(1-0.05)…(1-0.05),将使Ⅰ类错误α扩大,因此,必须重新规定检验水准。1.多个实验组间的两两比较α’=α/NN为要进行两两比较的次数,k为参加检验的组数。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75合计869418047.781、建立检验假设并确定检验水准H0:西药与中药治疗肝炎的有效率相同;H1:西药与中药治疗肝炎的有效率的有效率不同;α’=0.05/3=0.017表8-4西药与中药治疗肝炎疗效的比较3、查χ2界值表,确定P值,做出推断结论υ=1,χ20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论