差异显著性检验_第1页
差异显著性检验_第2页
差异显著性检验_第3页
差异显著性检验_第4页
差异显著性检验_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

差异显著性检验第一页,共一百三十五页,编辑于2023年,星期六统计方法描述统计推断统计参数估计假设检验第五章差异显著性检验第二页,共一百三十五页,编辑于2023年,星期六第一节统计推断的意义和原理一、统计推断的意义和内容统计推断(statisticalinference):就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。统计推断假设检验(hypothesistest)参数估计(parametricestimate)第三页,共一百三十五页,编辑于2023年,星期六第一节统计推断的意义和原理统计假设检验又称显著性检验(significancetest),它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种,即与要比较的总体参数间存在显著差异和不存在显著差异两种。第四页,共一百三十五页,编辑于2023年,星期六第一节统计推断的意义和原理参数估计包括两个方面:一是参数的点估计(pointestimation)直接用样本的统计量数值估计相应总体的参数;二是参数的区间估计(intervalestimation)在一定的概率保证下(一般为95%或99%),由样本统计量的分布,计算出总体参数可能出现的数值范围或区间,用该区间来估计总体参数所在位置。第五页,共一百三十五页,编辑于2023年,星期六学习目标了解假设检验的基本思想掌握假设检验的步骤能对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验第六页,共一百三十五页,编辑于2023年,星期六第一节假设检验的一般问题假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双侧检验和单侧检验第七页,共一百三十五页,编辑于2023年,星期六假设检验的概念与思想什么是假设?对总体参数的一种看法总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该企业生产的零件的平均长度为4厘米!第八页,共一百三十五页,编辑于2023年,星期六概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理假设检验的概念与思想第九页,共一百三十五页,编辑于2023年,星期六假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20第十页,共一百三十五页,编辑于2023年,星期六总体假设检验的过程

(提出假设→抽取样本→作出决策)抽取随机样本均值

X=20我认为人口的平均年龄是50岁

提出假设

拒绝假设!

别无选择.作出决策第十一页,共一百三十五页,编辑于2023年,星期六问题的提出例:某猪场称该场的猪在体重为100kg时的平均背膘厚度为9mm。问题:此说法是否正确?有4种可能性(假设)

1)正确:=92)不正确:9(|

-9|>0)

3)不正确:

<94)不正确:

>9三对假设:

=9vs

9,=9vs

<9,=9vs

>9假设检验的概念与思想第十二页,共一百三十五页,编辑于2023年,星期六假设检验的基本原理

如何回答随机抽取一个样本计算该样本的平均数比较样本平均数与9mm

难题存在抽样误差当样本平均数与9mm之差达到多大时可否定=9第十三页,共一百三十五页,编辑于2023年,星期六假设检验的基本原理解决的思路针对要回答的问题提出一对对立的假设,并对其中的一个进行检验找到一个样本统计量,它与提出的假设有关,其抽样分布已知根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断这个过程称为假设检验(hypothesistesting)第十四页,共一百三十五页,编辑于2023年,星期六提出无效假设和备择假设什么是无效假设?(NullHypothesis)1. 待检验的假设,又称“0假设”2. 如果错误地作出决策会导致一系列后果3. 总是有等号,或4. 表示为H0H0:

某一数值指定为=号,即或例如,H0:

3190(克)第十五页,共一百三十五页,编辑于2023年,星期六什么是备择假设?(AlternativeHypothesis)1. 与原假设对立的假设2. 总是有不等号:

,

或3. 表示为H1H1:

<某一数值,或某一数值例如,H1:

<3910(克),或3910(克)提出无效假设和备择假设第十六页,共一百三十五页,编辑于2023年,星期六什么检验统计量?1. 用于假设检验问题的统计量2. 选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量第十七页,共一百三十五页,编辑于2023年,星期六规定显著性水平什么显著性水平?1. 是一个概率值2. 无效假设为真时,拒绝无效假设的概率被称为抽样分布的拒绝域3. 表示为(alpha)常用的值有0.01,0.05,0.104. 由研究者事先确定第十八页,共一百三十五页,编辑于2023年,星期六作出统计决策计算检验的统计量根据给定的显著性水平,查表得出相应的临界值t或t/2将检验统计量的值与水平的临界值进行比较得出接受或拒绝原假设的结论第十九页,共一百三十五页,编辑于2023年,星期六假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定第二十页,共一百三十五页,编辑于2023年,星期六第一节统计推断的意义和原理某猪场10头长白猪和10头大白猪经产母猪的产仔数

平均数=11头,标准差S1=1.76头长白猪10头经产母猪产仔

长白111191213101313810大白11891012898710平均数=9.2头,标准差S1=1.55头大白猪10头经产母猪产仔

能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?例第二十一页,共一百三十五页,编辑于2023年,星期六造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。第一节统计推断的意义和原理第二十二页,共一百三十五页,编辑于2023年,星期六两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。另一种方法,即研究样本,通过样本研究其所代表的总体。设长白猪经产母猪产仔数的总体平均数为大白猪经产母猪产仔数的总体平均数为试验研究的目的,就是要给、是否相同做出推断。以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象

第一节统计推断的意义和原理第二十三页,共一百三十五页,编辑于2023年,星期六

由于抽样的原因,两样本平均数之差(),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分。第一节统计推断的意义和原理无偏估计:如果一个统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计值;否则,就是有偏估计值如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的有效估计量第二十四页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

通过试验测定得到的每个观测值每个观测值决定于:被测个体所属总体的特征个体差异和诸多无法控制的随机因素。所以观测值可以看作由两部分组成,即

为总体平均数,反映了总体特征表示误差第二十五页,共一百三十五页,编辑于2023年,星期六

若样本含量为n,则可得到n个观测,,,…,样本平均数说明样本平均数并非等于总体平均数,它还包含试验误差的成分第二节显著性检验的基本原理第二十六页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理上例中两个品种猪的产子数的样本均值分别可表示为:长白猪样本均值大白猪样本均值处理效应试验误差表面效应第二十七页,共一百三十五页,编辑于2023年,星期六对显著性检验:就是分析试验的表面效应主要由处理效应引起的,还是主要由试验误差所造成。第二节显著性检验的基本原理显著性检验的意义上式表明:试验的表面效应包括处理效应与误差效应。因此,仅凭样本均值间的表面差异就对总体平均数间的差异作出判断(有差异或者没有差异)是不可靠的。只有通过显著性检验,才能从作出科学的结论。第二十八页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

虽然处理效应未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。第二十九页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理二、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设(二)在无效假设成立的前提下,构造并计算合适的统计量(三)给定小概率值(风险水分、显著平准),根据自由度查表获取理论临界值(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。第三十页,共一百三十五页,编辑于2023年,星期六

这里假设或,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:头是试验误差,处理无效,这种假设称为无效假设,简记作:或

第二节显著性检验的基本原理(一)首先对试验样本所在的总体作假设第三十一页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理(一)首先对试验样本所在的总体作假设无效假设是被检验的假设,通过检验可能被接受,也可能被否定提出无效假设的同时,相应地提出一对应相反假设,称为备择假设,简记备择假设是在无效假设被否定时准备接受的假设第三十二页,共一百三十五页,编辑于2023年,星期六上面例子的备择假设是:即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数不相等或两个均值之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。第二节显著性检验的基本原理(一)首先对试验样本所在的总体作假设或第三十三页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理(二)在无效假设成立的前提下,构造并计算合适的统计量计算得到一个t

统计量:其中:均数差异标准误两样本的含量第三十四页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理(二)在无效假设成立的前提下,构造并计算合适的统计量所得的统计量t

服从自由度df=(n1-1)+(n2-1)的t分布。根据两个样本的数据,计算得:第三十五页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理(三)给定小概率值(风险水分、显著平准),根据自由度查表获取理论临界值设定风险水平(显著水平)

,其值通常取为0.01与0.05计算自由度df,上例中,df=(n1-1)+(n2-1)=9+9=18查附表X,得两尾临界概率值:第三十六页,共一百三十五页,编辑于2023年,星期六第一节显著性检验的基本原理

如果:则接受无效假设HO(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。

如果:则接受备择假设HA

如果:则接受备择假设HA两样本均值所代表的总体均值间差异不显著两样本均值所代表的总体均值间差异显著两样本均值所代表的总体均值间差异极显著第三十七页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理(四)依据样本计算得到的统计量与理论临界值的比较,对相关检验作出判断。第三十八页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理若t0.05(df)

≤|t|<t0.01(df)

,则说明试验的表面效应属于试验误差的概率P在0.01~0.05之间,即0.01<P≤0.05,表明:表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设。统计学上把这一检验结果表述为:“两个总体平均数之间差异显著”,在计算所得的t值的右上方标记“*”即t

*。

第三十九页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理若|t|≥t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定无效假设,接受备择假设。统计学上把这一检验结果表述为:“两个总体平均数之间差异极显著”,在计算所得的t值的右上方标记“*

*”即t**。第四十页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理前面的实例中

如果:则接受备择假设HA第四十一页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理统计推断结果的理解小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设HO,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设HO

成立的可能性大,不能被否定,因而也就不能接受备择假设HA

。第四十二页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理统计推断结果的理解

综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。第四十三页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平,记作α。在生物学研究中常取α=0.05或α=0.01。第四十四页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理三、显著水平与两种类型的错误区间和称为α水平上的否定域,

区间则称为α水平上的接受域。

第四十五页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

实际应用中到底选如何选取显著水平?应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。显著水平α对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。第四十六页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验无效假设时可能犯两类错误,即Ⅰ型错误和Ⅱ型错误。第四十七页,共一百三十五页,编辑于2023年,星期六假设检验中的两类错误1. 第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为α被称为显著性水平2. 第二类错误(纳伪错误)原假设为假时接受原假设第二类错误的概率为β(Beta)第四十八页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理Ⅰ型错误也叫第一类错误,是真实情况为H0成立,通过假设检验,却否定了它,犯了“弃真”错误,就是把非真实差异错判为真实差异,即H0为真,却接受了HAⅡ型错误也叫第二类错误,是H0不成立,却接受了它,犯了“纳伪”错误,就是把真实差异错判为非真实差异,即HA为真,却接受了H0第四十九页,共一百三十五页,编辑于2023年,星期六H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)拒绝H0第一类错误(a)功效(1-b)假设检验就好像一场审判过程统计检验过程第五十页,共一百三十五页,编辑于2023年,星期六

错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小第五十一页,共一百三十五页,编辑于2023年,星期六

错误和错误的关系mZ

接受H0拒绝H0αβ第五十二页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

基于“小概率事件实际不可能性原理”来否定H0,但在一次试验中小概率事件并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0

对应的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了H0,于是犯了Ⅰ型错误。但犯这类错误的概率不会超过a。第五十三页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理Ⅱ型错误值的大小较难确切估计,它只有与特定的备择假设结合起来才有意义。一般与显著水平α、原总体的标准差σ、样本含量n、以及相互比较的两样本所属总体平均数之差大小等因素有关。在其它因素确定时,Ⅰ型错误值越小,Ⅱ型错误值越大;反之,Ⅰ型错误值越大,Ⅱ型错误值越小;样本含量及样本均数差异越大,Ⅰ型错误与Ⅱ型错误值越小。第五十四页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理

由于Ⅱ型错误值的大小与Ⅰ型错误值的大小有关,所以在选用检验的显著水平时应考虑到犯Ⅰ、Ⅱ型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。

第五十五页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理若一个试验耗费大,可靠性要求高,不允许反复,那么Ⅰ型错误值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,Ⅰ型错误值亦应取小些;对于一些试验条件不易控制,试验误差较大的试验,可将Ⅰ型错误值放宽到0.1,甚至放宽到0.25第五十六页,共一百三十五页,编辑于2023年,星期六

在上述显著性检验中,无效假设H0:

备择假设HA:

此时,备择假设中包括了或两种可能。这个假设的目的在于判断有无差异,而不考虑谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。第二节显著性检验的基本原理四、双侧检验与单侧检验第五十七页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理四、双侧检验与单侧检验

在α水平上否定域为和,对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2,这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验。第五十八页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理H0的否定域在t分布曲线的右尾。在α水平上否定域为,右侧的概率为α这种利用一尾概率进行的检验叫单侧检验,也叫单尾检验双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著第五十九页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理抽样分布H0值临界值临界值a/2

a/2样本统计量拒绝域拒绝域接受域1-置信水平显著性水平与拒绝域第六十页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。此时,若进行新技术与常规技术的比较试验,则无效假设应为,即假设新技术与常规技术产蛋量是相同的,备择假设应为,即新配套技术的实施使产蛋量有所提高。第六十一页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理显著性水平与拒绝域H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平第六十二页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理显著性水平与拒绝域H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量第六十三页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题

(一)、为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。第六十四页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题

(二)、选用的显著性检验方法应符合其应用条件。上面我们所举的例子属于“非配对设计两样本平均数差异显著性检验”。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。第六十五页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题

(三)、要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为“差异显著”。第六十六页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99%,而在0.05水平下否定无效假设的可靠程度为95%。第六十七页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题“差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。“差异不显著”客观上存在两种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。第六十八页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题(四)合理建立统计假设,正确计算检验统计量。第六十九页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题

(五)、结论不能绝对化。经过显著性检验最终是否否定无效假设则由被研究事物有无本质差异、试验误差的大小及选用显著水平的高低决定的。同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。否定H0时可能犯Ⅰ型错误,接受H0时可能犯Ⅱ型错误。尤其在P接近α时,下结论应慎重,有时应用重复试验来证明。总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。第七十页,共一百三十五页,编辑于2023年,星期六第二节显著性检验的基本原理五、显著性检验中应注意的问题

此外,报告结论时应列出,由样本算得的检验统计量值(如t值),注明是单侧检验还是双侧检验,并写出P值的确切范围,如0.01<P<0.05,以便读者结合有关资料进行对比分析。第七十一页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验

在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,如畜禽正常生理指标、怀孕期、家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。第七十二页,共一百三十五页,编辑于2023年,星期六

检验的基本步骤是:

第一步:提出无效假设与备择假设设,第二步:计算t统计量值,计算公式为:

第三步:给出显著平准,并根据自由度查临界t值,第四步:作出统计推断

第三节样本平均数与总体平均数差异显著性检验第七十三页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验

实例母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。

第七十四页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验第一步:提出无效假设与备择假设,即无效假设认为样本所在总体与已知总体间没有差异,备择假设认为样本所在总体与已知总体间没有差异。如果用表示样本所在总体的均值。用表示已知总体的均值,在无效假设与备择假设可以简单表示为:第七十五页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验第二步,计算t值

经计算得:第七十六页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验第三步,给出显著平准,自由度,查表得到理论临界值

给出显著平准0.05与0.01

本题的自由度为df=n-1=10-1=9第七十七页,共一百三十五页,编辑于2023年,星期六

第三节样本平均数与总体平均数差异显著性检验第四步,对样本统计量值与理论临界值进行比较

如果:则接受无效假设HOt=1.000<t0.05(9)样本所在总体与已知总体间没有差异第七十八页,共一百三十五页,编辑于2023年,星期六一、总体方差已知时单个平均数的假设检验当总体方差已知时,根据样本平均数分布的性质,无论样本容量是大是小,均可用u分布计算实得差异由抽样误差造成的概率,所以称u检验。【例4-1】测定了某品种37头犊牛100g血液中总蛋白的含量,其平均数为4.263g;该品种成年母牛100g血液中总蛋白含量为7.570g,标准差为1.001。问该品种犊牛和成年母牛血液中总蛋白含量是否存在显著差异?本例总体方差已知,可采用u检验。第三节单个平均数的假设检验第七十九页,共一百三十五页,编辑于2023年,星期六犊牛和成年母牛间血液中总蛋白含量无显著差异;犊牛和成年母牛间血液中总蛋白含量存在显著差异。

vs

统计假设检验否定,接受,可以得出结论:犊牛和成年母牛间血液中总蛋白含量存在极显著差异。第三节单个平均数的假设检验第八十页,共一百三十五页,编辑于2023年,星期六二、总体方差未知时单个平均数的假设检验当总体方差未知时,应用t分布计算实得差异由抽样误差造成的概率。

【例4-2】

某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平均体重为100kg,现随机抽测10头猪进行称重,得体重数据如下:115,98,105,95,90,110,104,108,92,118(kg),试检验此收购人员的估计是否正确?第三节单个平均数的假设检验t02.262-2.2620.025拒绝H0拒绝H00.025第八十一页,共一百三十五页,编辑于2023年,星期六本例总体方差未知,且样本很小,用t检验。

vs接受,该收购人员的估计基本正确。第三节单个平均数的假设检验第八十二页,共一百三十五页,编辑于2023年,星期六

【例4-3】正常情况下成年男子的脉搏数为72次/min,现随机检查25名慢性胃炎所至脾虚男病人的平均脉搏数为75.2次/min,标准差为6.54次/min,问此类脾虚男病人脉搏数是否显著地高于正常情况下测定的成年男子脉搏数?第三节单个平均数的假设检验t0拒绝域0.051.711第八十三页,共一百三十五页,编辑于2023年,星期六否定即此类脾虚男病人的脉搏数已属异常。第三节单个平均数的假设检验第八十四页,共一百三十五页,编辑于2023年,星期六第四节成组资料的两个平均数的假设检验

该类型的比较其实质是检验两独立样本所属总体平均数间是否存在显著差异。即检验第一个样本的平均值和其总体平均值与第二个样本的平均值和其总体平均值间差异是否显著。它经常用于生物学研究中比较两种不同处理其效应的差异显著性。第八十五页,共一百三十五页,编辑于2023年,星期六一、总体方查已知时两平均值u检验

当两样本所属总体方差和为已知,或和虽未知,但两样本均为大样本时,平均数差数的分布呈正态分布,因而可采用u检验法检验两组平均值的差异显著性。适用条件分别如下:当和已知时,u检验的u值计算如下:第四节成组资料的两个平均数的假设检验第八十六页,共一百三十五页,编辑于2023年,星期六

当和未知,但、均较大时,可以用、近似代替和,计算,来代替

因为统计假设检验均是在假设成立的前提下进行的,故u值计算公式可简化成:第四节成组资料的两个平均数的假设检验第八十七页,共一百三十五页,编辑于2023年,星期六【例4-4】发酵法生产兽用青霉素的两个工厂,其产品收率的方差分别为、,测得甲工厂25个数据,g/L,乙工厂30个数据,g/L。问这两个工厂兽用青霉素的收率是否有显著差异?接受。

实得差异由抽样误差造成,应认为两工厂兽用青霉素的收率无显著差异。第四节成组资料的两个平均数的假设检验第八十八页,共一百三十五页,编辑于2023年,星期六【例4-5】测定了31头犊牛和48头成年母牛血液中血糖的含量,得犊牛的平均血糖含量为81.23,标准差为15.64。成年母牛的平均血糖含量为70.43,标准差为12.07。犊牛和成年母牛间血糖含量有无显著差异?否定,接受。犊牛和成年母牛血液中血糖含量存在极显著差异。第四节成组资料的两个平均数的假设检验第八十九页,共一百三十五页,编辑于2023年,星期六二、方差未知但相等()时两平均数的t检验

在实际研究中u检验的情况较少见,一般情况是总体方差和未知。当两样本所属总体虽未知但方差相等,且两样本为小样本时,两样本平均值差异显著性检验可用t检验法。

当两样本容量均较小时,应将要比较的两样本合并,增大样本容量,以增加对总体变异程度(误差)估计的准确性,从而增加估计的准确性。合并的前提是成立,即两独立随机样本来自同一个总体。第四节成组资料的两个平均数的假设检验第九十页,共一百三十五页,编辑于2023年,星期六

两样本合并后计算得到的方差叫合并均方,用表示。它是用两个样本的方差和以各自的自由度为权计算得到的两均方的加权平均值。计算公式如下:由以上公式可知,合并均方的分子、分母仍然是平方和与自由度,其分子是两样本离均差平方和之和,分母是自由度之和。这一原则适用于多个样本的合并。第四节成组资料的两个平均数的假设检验第九十一页,共一百三十五页,编辑于2023年,星期六样本平均值差数标准误计算公式中,用估计总体方差准确性更高的合并均方替代和当时,公式为:

第四节成组资料的两个平均数的假设检验第九十二页,共一百三十五页,编辑于2023年,星期六t检验t值计算公式如下:

t分布的自由度:第四节成组资料的两个平均数的假设检验第九十三页,共一百三十五页,编辑于2023年,星期六【例4-6】

研究两种不同中药添加剂饲料对香猪生长的影响,随机选择了12头香猪并随机分成两组,一组喂甲种饲料,另一组喂乙种饲料。饲养6周后增重(kg)结果如下:甲种饲料:6.65,6.35,7.05,7.90,8.04,4.45;乙种饲料:5.34,7.00,7.89,7.05,6.74,7.28。设两样本所属总体服从正态分布,且方差相等,试比较两种不同饲料对香猪生长的影响是否有显著差异。

本例总体方差未知,但,两样本含量相等且均较小,用合并均方计算t值。第四节成组资料的两个平均数的假设检验第九十四页,共一百三十五页,编辑于2023年,星期六,接受。

两种不同的饲料对香猪生长的影响无显著差异。第四节成组资料的两个平均数的假设检验第九十五页,共一百三十五页,编辑于2023年,星期六【例4-7】

测定金华猪与长白猪肌内脂肪含量(%),金华猪共10头,平均值为3.93,标准差为0.4;长白猪4头,其平均值为2.56,标准差为0.4。试检验两品种猪的肌内脂肪含量是否存在显著差异。=第四节成组资料的两个平均数的假设检验第九十六页,共一百三十五页,编辑于2023年,星期六根据查t的临界值,得两品种猪的肌内脂肪含量存在极显著差异。

第四节成组资料的两个平均数的假设检验第九十七页,共一百三十五页,编辑于2023年,星期六三、两总体方差不齐()时两平均值的t检验

1.总体方差齐性检验两样本平均值的t检验主要适用于小样本,且总体方差同质的资料,当两样本所属总体方差不相等时,其平均值的显著性检验方法和上述方法有所不同。抽自正态总体的两独立样本的方差和的比率服从F分布,所以两样本所属总体方差是否有显著差异用F检验。

检验步骤如下:第四节成组资料的两个平均数的假设检验第九十八页,共一百三十五页,编辑于2023年,星期六(的自由度为,的自由度为)

这里为较大的样本均方,为较小的样本均方,因此,F值是大均方为分子,小均方为分母,F值恒大于1。

推断:查附表得,如,则否定,接受,即。

方差不齐时,两样本平均数比较是一种近似检验,一般只有在显著水平上被否定时才采用。另外在试验设计时,尽量使,这样可减少误差。第四节成组资料的两个平均数的假设检验第九十九页,共一百三十五页,编辑于2023年,星期六2.两总体方差不齐时两平均值差异显著性检验

和t值用以下公式计算:

所得t值是否显著,在时,用的或临界值作判断标准,则,否定,接受;在时,用Cochran-cox检验法,Cochran曾提出在水平上显著的临界值需由下式计算:第四节成组资料的两个平均数的假设检验第一百页,共一百三十五页,编辑于2023年,星期六

式中是的值,是的值。若,则否定;否则接受。由于的取值在间,故只有在实得值在之间时才需要计算。第四节成组资料的两个平均数的假设检验第一百零一页,共一百三十五页,编辑于2023年,星期六【例4-8】

某猪场随机抽测了甲、乙两品种猪血液中白细胞的密度,测得甲品种13头猪白细胞数的平均值为10.73×103/mm3,标准差为1.28×103/mm3,乙品种15头猪白细胞数的平均值为16.40×103/mm3,标准差为3.44×103/mm3。两品种猪的白细胞数是否有显著的差异。第四节成组资料的两个平均数的假设检验第一百零二页,共一百三十五页,编辑于2023年,星期六已知:甲品种:

乙品种:

因两品种方差悬殊,甲品种为,乙品种为,故先进行方差齐性检验.方法如下:

,由于,故否定接受,即两样本所属总体方差存在极显著差异。第四节成组资料的两个平均数的假设检验第一百零三页,共一百三十五页,编辑于2023年,星期六

因为本例,故用Cochran-cox检验法,在时,查t临界值表得,t检验的临界值为:第四节成组资料的两个平均数的假设检验第一百零四页,共一百三十五页,编辑于2023年,星期六=2.1497

,,故否定,接受。两品种猪的白细胞数有显著差异。第四节成组资料的两个平均数的假设检验第一百零五页,共一百三十五页,编辑于2023年,星期六第五节配对资料两平均值检验

两个样本所属总体均值的统计假设检验叫成组比较,要求两个样本是相互独立的,或者说样本是完全随机分组后随机施加处理得到的,它只适用于试验单元(一般为试验动物个体)较为一致的情况。由于试验单元相对一致,误差小,误差估计准确,所以容易鉴别处理效应。但如果试验单元变异较大,如试验动物的年龄、性别、体重等相差较大,若仍采用上述设计方法,就可能增大试验误差的估计值,从而夸大或缩小了试验处理的效应。为了排除试验单元的不一致对试验结果的影响,准确地估计试验处理效应,降低试验误差,提高试验的准确性和精确度,应采用配对试验设计。第一百零六页,共一百三十五页,编辑于2023年,星期六一、配对试验设计的设计方法

配对试验设计,是先将试验条件尽可能相同的试验单元配成一对,然后将每一个对内的两个试验单元独立随机地接受两个处理中的一种。

配对设计的要求是:

配成对子的两个试验单元的初始条件应尽可能一致;不同试验对间的初始条件允许存在差异每一对就是试验的一次重复。这种将试验单元配成对的方式就叫配对试验设计。

配对的目的是为了把同一重复内二个试验单位的初始条件的差异减至最低限度,使试验处理效应不致被试验单位间的差异所掩盖。第五节配对资料两平均值检验第一百零七页,共一百三十五页,编辑于2023年,星期六

配对的方式有以下几种:

1.同源配对可以将同窝或有一定亲缘关系的同性别、体重接近的两头动物配成一对,若干对这样的动物组成的配对叫同源配对,又称亲缘配对。

2.条件配对实际工作中,如达不到亲缘配对要求,也可将具有相近条件的试验单位配成对,若干对这样的动物组成的配对叫条件配对。如动物可按同种属、同性别、同年龄、同体重进行配对。

3.自身配对自身配对是指同一试验单位接受试验处理前后的两次测定值构成的配对;也可以是同一个动物个体对称的两个器官、组织、部位等构成的配对;同一份样品分成两半,一份接受一种处理,另一份接受另一种处理构成的配对。第五节配对资料两平均值检验第一百零八页,共一百三十五页,编辑于2023年,星期六二、配对设计资料的假设检验配对数据统计假设检验方法为取每对测定值的差为统计对象,即由每一配对数据差组成的单个样本所属总体的均值是否为0的统计假设检验。即:

令,,。然后对作单个总体均值检验,检验的为。

处理配对观测值样本容量样本平均数

1

2表4-1成对比较数据模式第五节配对资料两平均值检验第一百零九页,共一百三十五页,编辑于2023年,星期六差数平均数的标准误为:

我们的任务是判定是由抽样误差造成的,还是由两个不同处理的效应差异造成的。如果是由抽样误差造成的,则成立,处理间无显著差异,如果不是由抽样误差造成,则处理间的确存在效应差别,此时成立。由于的分布在总体方差未知时服从t分布,故可以采用条件下的t检验考察是否成立。因此,t值计算如下:第五节配对资料两平均值检验第一百一十页,共一百三十五页,编辑于2023年,星期六

此t服从自由度为的t分布。【例4-9】

在研究日粮含量与肝中储量的关系时,随机选择8窝试验用小白鼠,每窝选择性别、体重相近的两只小白鼠进行配对,每对小白鼠中的一只随机接受正常饲料,另一只接受缺乏饲料。经过一段时间后,测定小白鼠肝中的储量,结果如下表,试检验不同含量的日粮对肝中的储量是否有显著的影响。第五节配对资料两平均值检验第一百一十一页,共一百三十五页,编辑于2023年,星期六配对动物编号12345678

合计正常饲料组3550200030003950380037503450305026550VE缺乏组2450240018003200325027002500175020050差数d1100-4001200750550105095013006500表4-2不同VE含量的饲料肝小白鼠中VA含量(IU·g-1)本例是配对试验资料,根据专业知识我们并不知道正常供给与否是增加还是减少肝中的储量,故应用两尾检验。第五节配对资料两平均值检验第一百一十二页,共一百三十五页,编辑于2023年,星期六说明两种不同日粮对试验动物肝中的储量存在极显著差异。用正常日粮饲养的小白鼠肝中的含量极显著地高于缺乏日粮小白鼠肝中的含量。第五节配对资料两平均值检验第一百一十三页,共一百三十五页,编辑于2023年,星期六第六节率的假设检验

一、率的抽样误差

在实际工作中,我们所得到的率一般都是样本率,如死亡率、治愈率、阳性率等,而样本率与总体率间总存在着一定的差异。这种差异我们称之为抽样误差。率的抽样误差一般用率的标准误来表示,即:σp为率的标准误,p为总体率,n为样本容量第一百一十四页,共一百三十五页,编辑于2023年,星期六

对率进行抽样,其研究的目的是希望用样本率来估计总体率,从而对于样本所在总体的情况作出推断,而总体率一般为未知。因此,可用样本率来代替总体率,从而计算出率的标准误的估计值,即:

其中:为样本率的标准误,为样本率,n为样本含量,。

率的标准误大小说明了用样本率估计总体率的准确性的好坏。

第六节率的假设检验第一百一十五页,共一百三十五页,编辑于2023年,星期六

二、率的假设检验率服从二项分布,当试验次数n较大时,二项分布接近正态分布,所以可以将服从二项分布的百分率资料近似地用正态分布来处理,即采用u检验,即时的t检验。适于u检验所需的二项分布样本容量与值见表4-3。

样本百分率

较小组次数样本含量n0.515300.420500.324800.2402000.1606000.05701400表4-3适于u检验的二项分布的n与np值第六节率的假设检验第一百一十六页,共一百三十五页,编辑于2023年,星期六1.样本率与总体率的比较验证某个样本率与一个已知的总体率间是否存在差异,即这个样本率是否来自这一总体。采用的公式为:【例4-10】

某地乳牛的隐性乳房炎患病率为,该地某牛场对560头乳牛进行检测,其中148头牛检测结果为阳性,问该牛场的隐性乳房炎是否与该地平均患病率相同。第六节率的假设检验第一百一十七页,共一百三十五页,编辑于2023年,星期六仅需比较该牛场与本地的平均患病率间有无差异。因此:接受。即该牛场的乳牛隐性乳房炎患病率与该地的平均患病率间无显著差异。第六节率的假设检验第一百一十八页,共一百三十五页,编辑于2023年,星期六2.两个样本率的比较设有两个样本,一个样本率为,事件总次数为,另一个样本率为,事件总次数为,我们希望知道这两个样本所来自的总体率间有否差异,也可以这样理解,这两个样本率是否来自同一个总体率。

假设这两个样本各自的总体率分别为和。则这两个样本率差的标准误为:式中分别为两个样本的总次数。

第六节率的假设检验第一百一十九页,共一百三十五页,编辑于2023年,星期六当两总体率相等,即时,上式可写为:

这是在两总体率已知的情况下两样本率差的标准误,在很多情况下,总体率为未知,这时我们可以假设两样本率所在的两总体率相等,即。则可以用两样本率的加权平均率来估计两总体率。即:称为样本合并百分率。第六节率的假设检验第一百二十页,共一百三十五页,编辑于2023年,星期六此时两样本率差的标准误为:在假设的情况下:

~N(0,1)

在两样本与很大时,可用u检验来检验两样本所在总体率的差异。第六节率的假设检验第一百二十一页,共一百三十五页,编辑于2023年,星期六【例4-11】

检验鸡痢疾菌苗对鸡白痢的免疫效果。试验组接种了345羽鸡,结果有51羽发生鸡白痢,对照组(未注射鸡痢疾菌苗组)420羽鸡有79羽发生了鸡白痢。问痢疾菌苗对鸡白痢是否有免疫效果?由于本例样本较大,因此用u检验,计算u值。

免疫组鸡发生鸡白痢的发病率为:未接种痢疾菌苗的对照组发病率为:第六节率的假设检验第一百二十二页,共一百三十五页,编辑于2023年,星期六两样本合并发病率为:

接受。即用痢疾菌苗免疫鸡白痢,其免疫效果与对照组无显著差异。我们有95%的把握认为痢疾菌苗对鸡白痢无显著免疫效果。第六节率的假设检验第一百二十三页,共一百三十五页,编辑于2023年,星期六3.小样本率假设检验的连续性较正当计算率的样本较大,或所得率的资料满足表4-3的要求时,我们可以用服从正态分布的u检验来完成假设检验,因为虽然我们的资料是服从二项分布的,但由于样本较大时,二项分布趋向于正态分布。但当样本较小,或不符合表4-3的要求时,两种分布间会有较大的差异。此时,如仍采用普通的u检验就有可能增大犯Ⅰ型错误的概率。因此,为了进行正确的统计推断,在进行率的假设检验时应进行连续性校正,当时,这种校正是必须的。

第六节率的假设检验第一百二十四页,共一百三十五页,编辑于2023年,星期六(1)单个小样本假设检验的连续性校正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论