单因素方差分析课件_第1页
单因素方差分析课件_第2页
单因素方差分析课件_第3页
单因素方差分析课件_第4页
单因素方差分析课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。引言在工农业生产和科研活动中,我们经常遇到这样的问题:影1基本概念试验指标——试验结果。可控因素——在影响试验结果的众多因素中,可人为控制的因素。水平——可控因素所处的各种不同的状态。每个水平又称为试验的一个处理。单因素试验——如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为单因素试验。因素——影响一个试验的指标变化的原因。基本概念试验指标——试验结果。可控因素——在影响试2例1为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装箱中各随机选取6个进行最大抗压试验,得到数据如下表显示,假设集装箱的抗压程度服从正态分布。问:不同种类的海运集装箱的抗压强度是否有显著差别?若有差异,哪一种抗压程度高?集装箱类型最大抗压强度平均抗压强度1655.5788.3734.3721.6679.4699.4713.082789.2772.5786.9686.1732.1774.8756.933737.1639.0696.3671.7712.2727.1697.234535.1628.7542.4559.0586.9520.0562.02例1为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装箱3集装箱的最大抗压程度——试验指标

集装箱类型——试验因素(唯一的一个)四种类型集装箱(1,2,3,4)——四个水平

因此,本例是一个四水平的单因素试验。引例用X1,X2,X3,X4分别表示四种集装箱的最大抗压程度,即为四个总体。假设X1,X2,X3,X4相互独立,且服从方差相同的正态分布,即Xi~N(i,2)(i=1,2,3,4)本例问题归结为检验假设H0:1=2=3=4是否成立

集装箱的最大抗压程度——试验指标集装箱类型——试验因素(唯4我们的目的是通过试验数据来判断因素A的不同水平对试验指标是否有影响。设A表示欲考察的因素,它的个不同水平,对应的指标视作个总体每个水平下,我们作若干次重复试验,同一水平的个结果,就是这个总体的一个样本:单因素等重复试验的方差分析因此,相互独立,且与同分布。我们的目的是通过试验数据来判断因素A的不5单因素试验资料表水平重复1...r(水平组内平均值)(总平均值)试验结果单因素试验资料表水平重复1(水平组内平均值)(总平均值)试6纵向个体间的差异称为随机误差(组内差异),由试验造成;横向个体间的差异称为系统误差(组间差异),由因素的不同水平造成。品种重复123例:五个水稻品种单位产量的观测值纵向个体间的差异称为随机误差(组内差异),由7由于同一水平下重复试验的个体差异是随机误差,所以设:其中为试验误差,相互独立且服从正态分布线性统计模型单因素试验的方差分析的数学模型具有方差齐性。相互独立,从而各子样也相互独立。首先,我们作如下假设:即由于同一水平下重复试验的个体差异是随机误差,所以设:8则线性统计模型变成于是检验假设:等价于检验假设:整个试验的均值称为因素A的第个水平的效应。令称其为因素A的总体平均值。则线性统计模型变成于是检验假设:等价于检验9考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方和)反映的是各水平平均值偏离总平均值的偏离程度。如果H0成立,则SSA较小。若H0成立,则总离差平方和见书P251考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方10组内平方和误差平方和反映的是重复试验中随机误差的大小。组内平方和反映的是重复试验中随机误差的大小。11若假设成立,则由抽样分布定理5.2及基本假设可推得:将的自由度分别记作则(各子样同分布),称该关系式为自由度分解公式若假设12则(记,称作均方和)对给定的检验水平,由得H0的拒绝域为:F单侧检验

结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。则(记13(1)若,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作标记;约定(2)若,则称因素的差异显著(差异有统计意义),或称因素A的影响显著,作标记;(3)若,则称因素A有一定影响,作标记();(4)若,则称因素A无显著影响(差异无统计意义)。注意:在方差分析表中,习惯于作如下规定:(1)若,则称因素的差异极显著14单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F值F值临界值简便计算公式:其中同一水平下观测值之和所有观测值之和单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F15例2

在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:试比较三种饲料对鸡的增肥作用是否相同。例2在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A16表8.1.1鸡饲料试验数据

饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048表8.1.1鸡饲料试验数据饲料A鸡重(克)A11017将原始数据减去1000,列表给出计算过程

表8.1.2例2的计算表水平数据(原始数据-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363将原始数据减去1000,列表给出计算过程水平数据(原始数据-18利用计算公式,可算得各偏差平方和为:把上述诸平方和及其自由度填入方差分析表利用计算公式,可算得各偏差平方和为:19表8.1.3例8.1.2的方差分析表

来源平方和自由度均方和F比因子9660.083324830.04173.5948

误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95

(2

,21)=3.47,由于F=3.5948>3.47,故认为因子A(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别。

表8.1.3例8.1.2的方差分析表来源平方和自由度20

例2以A、B、C三种饲料喂猪,得一个月后每猪所增体重(单位:500g)为下表,试作方差分析。饲料ABC增重514043482325262328解:例2以A、B、C三种饲料喂猪,得一个月21解:解:22不同的饲料对猪的体重的影响极有统计意义。方差分析表方差来源组间组内总和平方和自由度均方和F值F值临界值不同的饲料对猪的体重的影响极有统计意义。方差分析表方差来源组23方差分析的基本步骤小结:将资料总变异的自由度和平方和分解为各变异因素的自由度和平方和。计算均方。计算均方比,做出F测验,以明确各个变异因素的重要程度。对各个平均数进行多重比较。方差分析的基本步骤小结:24定理在单因素方差分析模型中,有如果H0不成立,则所以,即H0不成立时,有大于1的趋势。所以H0为真时的小概率事件应取在F值较大的一侧。定理在单因素方差分析模型中,有如果H0不成立,则25

四、多重比较

F值显著或极显著,否定无效假设HO,表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。四、多重比较26有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。

统计学上把多个平均数两两间的相互比较称为多重比较。多重比较的方法很多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)

有必要进行两两处理平均数间的比较,以具体判断两27

此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较:(一)最小显著差数法(LSD法)此法的基本作法是:在F检验显著的前提下28若>LSDα,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由下式计算:

式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差数标准误,

若>LSDα,则29其中为F检验中的误差均方,n为各处理的重复数。当显著水平α=0.05和0.01时,从t值表中查出和,得:

利用LSD法进行多重比较时,可按如下步骤进行:

其中为F检验中的误差均方,n为各处理30(2)计算最小显著差数和;(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。

(1)列出平均数多重比较表比较表中各处理按其平均数从大到小自上而下排列;

(2)计算最小显著差数31

(二)最小显著极差法(LSR法)

LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差(LSR)。(二)最小显著极差法(LSR法)32

因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。常用的LSR法有q检验法和新复极差法两种。

1、q

检验法

此法是以统计量q的概率分布为基础的。q值由下式求得:

因为LSR法是一种极差检验法,所以当一个平均数33上式中,w为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将算出的q值与临界q值比较,而是将极差与比较,从而作出统计推断。为α水平上的最小显著极差:上式中,w为极差,34

(1)列出平均数多重比较表;(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k;(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,作出统计推断。

(1)列出平均数多重比较表;35

2、SSR法此法是由邓肯(Duncan)于1955年提出,又称为Duncan法,或新复极差法。新复极差法与q法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表9)而不是查q值表。最小显著极差计算公式为:

2、SSR法36以上介绍的三种多重比较方法,其检验尺度有如下关系:

LSD法≤SSR法≤q法当秩次距k=2时,取等号;秩次距k≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。以上介绍的三种多重比较方法,其检验尺度有如下关系:37

生物试验中,由于试验误差较大,常采用SSR法;F检验显著后,为了简便,也可采用LSD法。单因素方差分析课件38

此法是将多重比较结果直接标记在平均数多重比较表上,如表8.8所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。

1、三角形法(三)多重比较结果的表示方法此法是将多重比较结果直接标记在平均数多重比较39

2、标记字母法

先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母a,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母a,直到某一与其差异显著的平均数标记字母b为止;再以标有字母b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标b,直至显著为止;2、标记字母法40再以标记有字母b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c为止;……;如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平α=0.05,用大写拉丁字母表示显著水平α=0.01。

再以标记有字母b的最大平均数为标准,与下面各未标记字41

在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。

在利用字母标记法表示多重比较结果时,常在三角42方差分析的基本步骤:

(一)计算各项平方和与自由度;(二)列出方差分析表,进行F检验;(三)若F检验显著,进行多重比较。

多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q法和SSR法)。表示多重比较结果的方法有三角形法和标记字母法。方差分析的基本步骤:43在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。引言在工农业生产和科研活动中,我们经常遇到这样的问题:影44基本概念试验指标——试验结果。可控因素——在影响试验结果的众多因素中,可人为控制的因素。水平——可控因素所处的各种不同的状态。每个水平又称为试验的一个处理。单因素试验——如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为单因素试验。因素——影响一个试验的指标变化的原因。基本概念试验指标——试验结果。可控因素——在影响试45例1为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装箱中各随机选取6个进行最大抗压试验,得到数据如下表显示,假设集装箱的抗压程度服从正态分布。问:不同种类的海运集装箱的抗压强度是否有显著差别?若有差异,哪一种抗压程度高?集装箱类型最大抗压强度平均抗压强度1655.5788.3734.3721.6679.4699.4713.082789.2772.5786.9686.1732.1774.8756.933737.1639.0696.3671.7712.2727.1697.234535.1628.7542.4559.0586.9520.0562.02例1为了比较4种单层皱纹海运集装箱的抗压程度,从每种集装箱46集装箱的最大抗压程度——试验指标

集装箱类型——试验因素(唯一的一个)四种类型集装箱(1,2,3,4)——四个水平

因此,本例是一个四水平的单因素试验。引例用X1,X2,X3,X4分别表示四种集装箱的最大抗压程度,即为四个总体。假设X1,X2,X3,X4相互独立,且服从方差相同的正态分布,即Xi~N(i,2)(i=1,2,3,4)本例问题归结为检验假设H0:1=2=3=4是否成立

集装箱的最大抗压程度——试验指标集装箱类型——试验因素(唯47我们的目的是通过试验数据来判断因素A的不同水平对试验指标是否有影响。设A表示欲考察的因素,它的个不同水平,对应的指标视作个总体每个水平下,我们作若干次重复试验,同一水平的个结果,就是这个总体的一个样本:单因素等重复试验的方差分析因此,相互独立,且与同分布。我们的目的是通过试验数据来判断因素A的不48单因素试验资料表水平重复1...r(水平组内平均值)(总平均值)试验结果单因素试验资料表水平重复1(水平组内平均值)(总平均值)试49纵向个体间的差异称为随机误差(组内差异),由试验造成;横向个体间的差异称为系统误差(组间差异),由因素的不同水平造成。品种重复123例:五个水稻品种单位产量的观测值纵向个体间的差异称为随机误差(组内差异),由50由于同一水平下重复试验的个体差异是随机误差,所以设:其中为试验误差,相互独立且服从正态分布线性统计模型单因素试验的方差分析的数学模型具有方差齐性。相互独立,从而各子样也相互独立。首先,我们作如下假设:即由于同一水平下重复试验的个体差异是随机误差,所以设:51则线性统计模型变成于是检验假设:等价于检验假设:整个试验的均值称为因素A的第个水平的效应。令称其为因素A的总体平均值。则线性统计模型变成于是检验假设:等价于检验52考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方和)反映的是各水平平均值偏离总平均值的偏离程度。如果H0成立,则SSA较小。若H0成立,则总离差平方和见书P251考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方53组内平方和误差平方和反映的是重复试验中随机误差的大小。组内平方和反映的是重复试验中随机误差的大小。54若假设成立,则由抽样分布定理5.2及基本假设可推得:将的自由度分别记作则(各子样同分布),称该关系式为自由度分解公式若假设55则(记,称作均方和)对给定的检验水平,由得H0的拒绝域为:F单侧检验

结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。则(记56(1)若,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作标记;约定(2)若,则称因素的差异显著(差异有统计意义),或称因素A的影响显著,作标记;(3)若,则称因素A有一定影响,作标记();(4)若,则称因素A无显著影响(差异无统计意义)。注意:在方差分析表中,习惯于作如下规定:(1)若,则称因素的差异极显著57单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F值F值临界值简便计算公式:其中同一水平下观测值之和所有观测值之和单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F58例2

在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:试比较三种饲料对鸡的增肥作用是否相同。例2在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A59表8.1.1鸡饲料试验数据

饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048表8.1.1鸡饲料试验数据饲料A鸡重(克)A11060将原始数据减去1000,列表给出计算过程

表8.1.2例2的计算表水平数据(原始数据-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363将原始数据减去1000,列表给出计算过程水平数据(原始数据-61利用计算公式,可算得各偏差平方和为:把上述诸平方和及其自由度填入方差分析表利用计算公式,可算得各偏差平方和为:62表8.1.3例8.1.2的方差分析表

来源平方和自由度均方和F比因子9660.083324830.04173.5948

误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95

(2

,21)=3.47,由于F=3.5948>3.47,故认为因子A(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别。

表8.1.3例8.1.2的方差分析表来源平方和自由度63

例2以A、B、C三种饲料喂猪,得一个月后每猪所增体重(单位:500g)为下表,试作方差分析。饲料ABC增重514043482325262328解:例2以A、B、C三种饲料喂猪,得一个月64解:解:65不同的饲料对猪的体重的影响极有统计意义。方差分析表方差来源组间组内总和平方和自由度均方和F值F值临界值不同的饲料对猪的体重的影响极有统计意义。方差分析表方差来源组66方差分析的基本步骤小结:将资料总变异的自由度和平方和分解为各变异因素的自由度和平方和。计算均方。计算均方比,做出F测验,以明确各个变异因素的重要程度。对各个平均数进行多重比较。方差分析的基本步骤小结:67定理在单因素方差分析模型中,有如果H0不成立,则所以,即H0不成立时,有大于1的趋势。所以H0为真时的小概率事件应取在F值较大的一侧。定理在单因素方差分析模型中,有如果H0不成立,则68

四、多重比较

F值显著或极显著,否定无效假设HO,表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。四、多重比较69有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。

统计学上把多个平均数两两间的相互比较称为多重比较。多重比较的方法很多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)

有必要进行两两处理平均数间的比较,以具体判断两70

此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较:(一)最小显著差数法(LSD法)此法的基本作法是:在F检验显著的前提下71若>LSDα,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由下式计算:

式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差数标准误,

若>LSDα,则72其中为F检验中的误差均方,n为各处理的重复数。当显著水平α=0.05和0.01时,从t值表中查出和,得:

利用LSD法进行多重比较时,可按如下步骤进行:

其中为F检验中的误差均方,n为各处理73(2)计算最小显著差数和;(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。

(1)列出平均数多重比较表比较表中各处理按其平均数从大到小自上而下排列;

(2)计算最小显著差数74

(二)最小显著极差法(LSR法)

LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差(LSR)。(二)最小显著极差法(LSR法)75

因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。常用的LSR法有q检验法和新复极差法两种。

1、q

检验法

此法是以统计量q的概率分布为基础的。q值由下式求得:

因为LSR法是一种极差检验法,所以当一个平均数76上式中,w为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将算出的q值与临界q值比较,而是将极差与比较,从而作出统计推断。为α水平上的最小显著极差:上式中,w为极差,77

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论