第六章 方差分析-1_第1页
第六章 方差分析-1_第2页
第六章 方差分析-1_第3页
第六章 方差分析-1_第4页
第六章 方差分析-1_第5页
已阅读5页,还剩160页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学生命科学学院2023/6/161提问9u测验?t测验?统计测验的根本步骤?二项样本假设测验的连续性矫正?区间估计与假设测验?2023/6/162一、为什么要学习方差分析?前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。对于多个平均数间差异显著性测验,如仍采用上章学习的方法,就会表现出如下一些问题:

2023/6/163假设进行5个样本平均数的差异显著性比较,那么需进行10次两两均数差异显著性测验,H0:μ1=μ2,μ1=μ3,μ1=μ4,μ1=μ5;μ2=μ3,μ2=μ4,μ2=μ5;μ3=μ4,μ3=μ5;μ4=μ5.因此当样本平均数的个数k≥3时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。1.计算麻烦2023/6/164假设对5个处理采用t测验进行比较,犯第一类错误的概率为:1-(1-α)10=1-0.9510=1-0.5987=0.4013.2.推断的可靠性降低,犯错误的概率增大两个样本平均数比较采用t测验,α=0.05时犯第一类错误的概率为0.05,推断的可靠性为1-α=0.95。2023/6/165

采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。3.误差估计的精确性和检验的灵敏性降低自由度越小,标准差越大,灵敏度低;自由度越大,标准差越小,灵敏度高。2023/6/166

因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用一种新的统计方法——方差分析法。2023/6/167第六章方差分析第一节方差分析的根本原理第二节多重比较第三节方差分析的线性模型与期望均方第四节单向分组资料的方差分析第五节两向分组资料的方差分析第六节方差分析的根本假定和数据转换2023/6/168第一节方差分析的根本原理所谓方差分析(analysisofvariance),是关于k(k≥3)个样本平均数的假设测验方法,是将总变异剖分为各个变异来源的相应局部,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。采用方差来度量试验处理产生的变异和误差引起的变异。方差是平方和除以自由度的商。2023/6/169一、自由度和平方和的分解将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将自由度和总平方分解为各个变异来源的相应局部。因此,自由度和平方和的分解是方差分析的第一步。设有k组数据,每组皆具n个观察值,那么该资料共有nk个观察值,其数据分组如表6.1。2023/6/1610表6.1

每组具n个观察值的k组数据的符号表2023/6/1611在表6.1中,总变异是nk个观察值的变异,故其自由度v=nk-1,而其离均差的平方和SST那么为:其中的C称为矫正数:对于第

i

组的变异,有2023/6/1612从而总变异(6·1)可以剖分为:即离均差的总平方和=组内〔误差〕平方和+处理平方和组间变异由k个的变异引起,故其自由度v

=k-1

,组间平方和SSt为:2023/6/1613组内变异为各组内观察值与组平均数的变异,故每组具有自由度v=n-1和平方和;而资料共有k组,故组内自由度

v

=k(n-1)

,组内平方和SSe

为:2023/6/1614因此,表6.1类型资料的自由度分解式为:总自由度DFT=组间自由度DFt+组内自由度DFe

求得各变异来源的自由度和平方和后,进而可得:12023/6/1615【例6.1】以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果如表6.2,试分解其自由度和平方和。表6.2

水稻不同药剂处理的苗高(cm)1、进行总自由度的剖分:总变异自由度DFT=(nk-1)=(44)-1=15药剂间自由度DFt=(k-1)=4-1=3药剂内自由度DFe=k(n-1)=4(4-1)=122023/6/16162、根据(6·3)进行总平方和的剖分:或2023/6/1617或药剂A内:

药剂B内:药剂C内:药剂D内:所以进而可得均方:2023/6/1618二、F分布与F测验在一个平均数为、方差为的正态总体中,随机抽取两个独立样本,分别求得其均方〔方差〕s12和s22,将s12和s22的比值定义为F:此F值具有s12

的自由度

v1

和s22的自由度v2。所谓F分布,就是在给定的

v1

和v2下按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个分布。2023/6/1619具有平均数=1取值区间为[0,∞];某一特定曲线的形状那么仅决定于参数v1和v2。在v1=1或v1=2时,F分布曲线是严重倾斜成反向J型;当v1≥3时,曲线转为偏态。图6.1F分布曲线〔随v1和v2的不同而不同〕F分布曲线特征:2023/6/1620故F分布只有一尾概率〔即右尾概率〕,进行的F测验仅为一尾测验。附表5(p361)的数值设计是专供测验s12

的总体方差

是否显著大于s22的总体方差

而设计的。H0:

对HA:

。这时,

。F≥F0.05或≥F0.01,那么H0发生的概率小于等于0.05或0.01,差异显著,应该在=0.05或=0.01水平上否认H0,接受HA;F<F0.05或F<F0.01,那么H0发生的概率大于0.05或0.01,差异不显著,应接受H0。2023/6/1621F测验需具备条件:(1)变数y遵循正态分布N(,),(2)s12和s22彼此独立。另外,在F测验中,如果作分子的均方小于作分母的均方,那么F<1;此时不必查F表即可确定P>0.05,应接受H0。2023/6/1622【例6.2】测定东方红3号小麦的蛋白质含量10次,得均方s12=1.621;测定农大139小麦的蛋白质含量5次,得均方s22=0.135。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。假设H0:东方红小麦总体蛋白质含量的变异和农大139一样,即

,对

。显著水平=0.05,v1=9,v2=4时,F0.05=6.00。测验计算:F=1.621/0.135=12.01,此F>F0.05,即P<0.05。推断:否认H0,接受HA,即东方红3号小麦蛋白质含量的变异大于农大139。2023/6/1623【例6.3】在例6.1算得药剂间均方st2=168.00,药剂内均方se2=8.17,具自由度v1=3,v2=12。试测验药剂间变异是否显著大于药剂内变异?假设

显著水平=0.05,

F0.05=3.49。测验计算:F=168.00/8.17=20.56

查附表5(p361)

v1

=3,v2=12时

F0.05

=3.49,F0.01=5.95,实得F>F0.01>F0.05,P<0.01。推断:否认,接受;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。2023/6/1624例6.1和例6.3的分析结果可以归纳在一起,列出方差分析表,如表6.3所示。表6.3

水稻药剂处理苗高方差分析表2023/6/1625由前面的分析可知,总变异又可分为处理间变异和处理内变异。各处理平均数之间有不同程度的差异,引起差异的原因有二:其一是处理的不同;其二是不同处理受偶然因素影响的程度不同。各个处理内的随机变异之和就构成了整个资料的误差项变异。2023/6/1626利用这种关系,将处理间变异与处理内变异的比值定义为F值。

方差用来表示样本的变异程度,在数学分析上有许多优点,所以通常采用方差的比值作为变异的度量值。如何判断是否超过了用误差解释的范围?必须借助F测验。2023/6/1627F测验测验某项变异因素的效应是否真实存在。假设各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异;假设各处理的均数不等且差异显著,可以推断处理间有真实差异。

2023/6/1628在计算F值时,通常将被测验的那一项变异因素的方差作分子,而以另一项变异因素的方差作分母。2023/6/1629F测验的步骤:第一:提出假设第二:计算F值

第三:查附表5(p361),由dft,

dfe可查得临界值2023/6/1630第四:比较F与作出统计推断1.假设F≥F0.05,那么P≤0.05否认H0,接受HA,记为“*〞F≥F0.01,那么P≤0.01否认H0,接受HA,记为“**〞2.假设F<F0.05,那么P>0.05接受H0,否认HA2023/6/1631提问10何为F值?F分布的特征?F测验的根本步骤?表6.1类型资料自由度和平方和的分解?2023/6/1632第二节多重比较所谓多重比较〔multiplecomparisons〕是指一个试验中k个处理平均数间可能有k(k-1)/2个比较,亦称为复式比较。多重比较有多种方法,本节将介绍常用的三种:1、最小显著差数法2、复极差法〔q法〕3、Duncan氏新复极差法2023/6/1633一、最小显著差数法最小显著差数法〔leastsignificantdifference,简称LSD法〕,法实质上是第五章的t测验。其程序是:1、在处理间的F测验为显著的前提下,计算出显著水平为的最小显著差数;2、任何两个平均数的差数〔〕,如其绝对值≥,即为在水平上差异显著;反之,那么为在水平上差异不显著。

2023/6/16341、:2、假设|t|≥,即为在水平上显著。3、因此,最小显著差数为:4、当两样本的容量n相等时,5、在方差分析中,上式的se2有了更精确的数值〔因为此自由度增大〕,因此的为:2023/6/1635【例6.4】试以LSD法测验表6.2资料各种药剂处理的苗高平均数间的差异显著性。表6.2

水稻不同药剂处理的苗高(cm)1、进行总自由度的剖分:总变异自由度DFT=(nk-1)=(44)-1=15药剂间自由度DFt=(k-1)=4-1=3药剂内自由度DFe=k(n-1)=4(4-1)=122023/6/1636由〔例6.3〕计算得F=20.56为显著,MSe=8.17,DFe=12,故由附表4(p360),v=k(n-1)=12时,t0.05=2.179,t0.01=3.055故

LSD0.05=2.179×2.02=4.40(cm)

LSD0.01=3.055×2.02=6.17(cm)然后将各种药剂处理的苗高与对照苗高相比,差数大于4.40cm为差异显著;大于6.17cm为差异极显著。2023/6/1637二、q法

q测验是Student-Newman-Keul基于极差的抽样分布理论提出来的,或称复极差测验,有时又称SNK测验或NK测验。q法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值的。q测验因是根据极差抽样分布原理的,其各个比较都可保证同一个显著水平。2023/6/1638

q测验尺度值构成为:2≤p≤k,p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数〔称为秩次距〕。SE为平均数的标准误,在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。2023/6/1639【例6.5】试对表6.2资料的各平均数作q测验。查附表7(368)q值表,当DF=12时,p=2,3,4的值,并由〔6·11〕计算出尺度值,列于表6.4。表6.4

表6.2资料值的计算(q测验)2023/6/1640由表6.2可知,=29cm,=23cm,=18cm,

=14cm。:由此可得到2023/6/1641三、新复极差法新复极差法是D.B.Duncan(1955)提出的,又称最短显著极差法(shortestsignificantranges,SSR)。该法与q法相似,其区别在于计算最小显著极差

时不是查q表而是查SSR表,所得最小显著极差值随着k增大通常比q测验时的减小。查得后〔P371,附表8〕,有2023/6/1642【例6.6】试对表6.2资料的各平均数作新复极差测验。=29cm,=23cm,=18cm,=14cm,MSe=8.17,查附表8,得值,算得在p=2,3,4时的LSRᵅ值,即为测验不同p时的平均数间极差显著性的尺度值。表6.5表6.2资料LSR值的计算〔新复极差测验〕2023/6/1643当p=2时,=6(cm)5%水平显著;

=5(cm)5%水平显著;

=4(cm)不显著。当p=3时,

=11(cm)1%水平上显著;

=9(cm)1%水平上显著。当p=4时,

=15(cm)

1%水平上显著。结论:表6.2资料的4个处理的苗高,除处理A与C差异不显著外,其余处理间均达显著差异,本例结果与上面介绍的q测验法相同,但q法的要比新复极差法的大。2023/6/1644四、多重比较结果的表示方法〔一〕列梯形表法〔二〕划线法〔三〕标记字母法2023/6/1645将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡到达=0.05水平的差数在右上角标一个“*〞号。凡到达=0.01水平的差数在右上角标两个“*〞号。凡未到达=0.05水平的差数那么不予标记。假设以列梯形表法表示,那么成表6.6。〔一〕列梯形表法2023/6/1646表6.6表6.2资料的差异显著性〔新复极差测验〕优点:十分直观,缺点:占篇幅较大,特别是处理平均数较多时。2023/6/1647〔二〕划线法将平均数按大小顺序排列,以第1个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第2,…,k-1个平均数为标准按上述方法进行。这种方法称划线法。下面就是表6.2资料用划线法标出0.01水平下平均数差异显著性结果(q法)。

优点:直观、简单方便,所占篇幅也较少。2023/6/1648〔三〕标记字母法:将全部平均数从大到小依次排列。在最大的平均数上标上字母a;将该平均数与以下各平均数相比,相差不显著的,都标上字母a,直至某一个与之相差显著的平均数那么标以字母b〔向下过程〕;再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母b〔向上过程〕;再以该标有b的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数那么标以字母c。……2023/6/1649如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止;这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,可以小写字母表示

=0.05显著水平,大写字母表示

=0.01显著水平。2023/6/1650〔1〕在表6.7上先将各平均数按大小顺序排列,并在行上标a。〔2〕由于与呈显著差异,故上标b。〔3〕然后以为标准与相比呈显著差异,故标c。〔4〕以为标准与比,无显著差异,仍标c。同理,可进行4个在1%水平上的显著性测验。【例6.7】试对例6.6测验结果作出字母标记。2023/6/1651表6.7表6.2资料的差异显著性(新复极差测验)该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性到达=0.05水平。处理B与A、D与B、A与C无极显著差异;D与A、C,B与C呈极显著差异。2023/6/1652五、多重比较方法的选择多重比较方法选用原那么:1、试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;2、根据否认一个正确的H0和接受一个不正确的H0的相对重要性来决定。q法显著尺度最高。3、一般试验采用SSR测验。2023/6/1653方差分析的根本步骤将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并进而算得其均方;计算均方比,作出F测验,以明了各变异因素的重要程度;对各平均数进行多重比较。2023/6/1654提问10何为多重比较?多重比较的三种方法?多重比较结果的表示方法?标记字母法的步骤?F测验的步骤?2023/6/1655第三节方差分析的线性模型与期望均方一、方差分析的线性数学模型方差分析的理论依据:线性可加模型,即总体每一个变量可以按其变异的原因分解成假设干个线性组成局部。例如表6.1数据的线性模型可表示为:其中,为总体平均数,为试验处理效应,为随机误差具有分布N(0,)。象表6.1类型的资料,其每一观测值都由这三个局部相加而成。2023/6/1656在以样本符号表示时,样本的线性组成为:是μ的无偏估计值2023/6/1657对于ti局部,每一样本的平方和是,故k个样本的平方和是,而处理间方差st2为:2023/6/1658这一局部,因试验模型的不同而有所区别。因为:故估计了或或写为→2023/6/1659二、期望均方在线性可加模型中,关于局部的假定,由于对有不同的解释产生了固定模型和随机模型。

固定模型是指各个处理的平均效应是固定的一个常量,且满足(或),但常数未知;主要是研究并估计处理效应;固定模型中所得的结论仅在于推断关于特定的处理;〔一〕固定模型〔fixedmodel〕2023/6/1660【例6.8】以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型。表6.85个水稻品种产量的方差分析和期望均方表2023/6/1661〔二〕随机模型〔randommodel〕随机模型是指各个处理效应不是一个常量,而是从平均数为零、方差为的正态总体中得到的一个随机变量,即~N(0,)。主要是研究并估计总体变异即方差。而随机模型中试验结论那么将用于推断处理的总体。2023/6/1662【例6.9】研究籼粳稻杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重〔g/株〕。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。表6.9

籼粳杂种F5代干草重的方差分析和期望均方

2023/6/1663形式的区别:固定效应用κτ

表示随机效应用στ表示

模型的不同仅与F测验分母项的选择和统计推断有关,而方差分析过程中DF、SS、MS的分解和计算都是一致的。2023/6/1664第四节单向分组资料的方差分析单向分组资料是指观察值仅按一个方向分组的资料示。所用的试验设计为完全随机试验设计。一、组内观察值数目相等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析三、组内又分亚组的单向分组资料的方差分析2023/6/1665一、组内观察值数目相等的单向分组资料的方差分析这是在k组处理中,每处理皆含有n个供试单位的资料如表6.1。在作方差分析时,其任一观察值的线性模型皆由表示,方差分析如下表。表6.10

组内观察值数目相等的单向分组资料的方差分析

2023/6/1666【例6.10】作一水稻施肥的盆栽试验,设5个处理,A和B系分别施用两种不同工艺流程的氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理4盆〔施肥处理的施肥量每盆皆为折合纯氮1.2克〕,共5×4=20盆,随机放置于同一网室中,其稻谷产量〔克/盆〕列于表6.11,试测验各处理平均数的差异显著性。表6.11

水稻施肥盆栽试验的产量结果2023/6/16671、总变异自由度DFT=nk-1=5×4-1=192、处理间自由度DFt=k-1=5-1=43、误差〔处理内〕自由度DFe=k(n-1)=5×(4-1)=15矫正数分析步骤自由度和平方和的分解2023/6/1668

F测验将上述结果录入表6.12表6.12

表6.11资料的方差分析2023/6/1669假设H0:,HA:不全相等。为了测验H0,计算处理间均方对误差均方的比率,算得F=75.3/6.73=11.19查F表5当v1=4,v2=15时,F0.01=4.89,现实得F=11.19>F0.01,P<0.01,故否认H0,推断这个试验的处理平均数间是有极显著差异的。2023/6/1670

得出结论将上述结果录入表6.12表6.12

表6.11资料的方差分析F测验显著,处理间差异极显著2023/6/1671各处理平均数的比较(多重比较)1、算得单个平均数的标准误2、根据=15,查SSR表〔附表8〕得p=2,3,4,5时的SSR0.05与SSR0.01值,将值分别乘以SE值,即得值,列于表6.13。进而进行多重比较。表6.13多重比较时的值计算2023/6/1672表6.14

施肥效果的显著性(SSR测验)推断:根据表6.14多重比较结果可知,施用氮肥(A、B、C和D)与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢铵与氨水1、氨水1与氨水2处理间均无显著差异。2023/6/1673二、组内观察值数目不等的单向分组资料的方差分析假设k个处理中的观察值数目不等,分别为n1,n2,…,nk,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:2023/6/1674自由度和平方和的分解2023/6/1675多重比较平均数的标准误为:上式的nA和nB系两个相比较的平均数的样本容量。但亦可先算得各ni的平均数n0。然后有:或2023/6/1676【例6.11】某病虫测报站,调查四种不同类型的水稻田28块,每块田所得稻纵卷叶螟的百丛虫口密度列于表6.15,试问不同类型稻田的虫口密度有否显著差异?表6.15

不同类型稻田纵卷叶螟的虫口密度

2023/6/1677该资料=7+6+8+7=28故1、总变异自由度DFT=-1=28-1=272、稻田类型间自由度DFt=k-1=4-1=33、

误差自由度DFe=-k=28-4=24求得:分析步骤自由度和平方和的分解2023/6/1678表6.16

表6.15资料的方差分析所得F=5.91>F0.01,因而应否认H0:即4块麦田的虫口密度间有极显著差异。

F测验将上述结果录入表6.162023/6/1679需进一步计算n0,并求得SE(LSR测验〕或(LSD测验)。F测验显著,再作平均数间的比较。2023/6/1680提问111、方差分析的线性可加模型?2、单项分组资料的方差分析?1)组内观察值相等;2)组内观察值不等。2023/6/1681三、组内又分亚组的单向分组资料的方差分析单向分组资料,如果每组又分假设干个亚组,而每个亚组内又有假设干个观察值,那么为组内分亚组的单向分组资料,或称系统分组资料。系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,……,如此一环套一环地分下去。这种试验称为巢式试验(nestedexperiment〕。2023/6/1682设一系统分组资料共有l组,每组内又分m个亚组,每一亚组内有n观察值,那么该资料共有lmn个观察值,其资料类型如表6.17。2023/6/1683表6.17二级系统分组资料个观察值的数据结构

(i=1,2,…,l;j=1,2,…,m;k=1,2,…,n)

表6.17中每一观察值的线性可加模型为:其中为总体平均;为同一亚组中各观察值的随机变异,具有N(0,)。

为组效应或处理效应固定模型()随机模型~N(0,)为同组中各亚组的效应固定模型()随机模型~N(0,)2023/6/1685表6.17的任一观察值的总变异可分解为3种来源的变异:〔1〕组间(或处理间)变异;〔2〕同一组内亚组间变异;〔3〕同一亚组内各重复观察值间的变异。其自由度和平方和的估计如下:(1)总变异的自由度2023/6/1686(2)

组间(处理间)变异(6·29)(3)

同一组内亚组间的变异(6·30)

(4)亚组内的变异(6·31)2023/6/1687表6.18

二级系统分组资料的方差分析2023/6/1688为测验各亚组间有无不同效应,即测验假设H0:那么为测验各组间有无不同效应,测验假设H0:,或H0:,即H0:,那么在进行组间平均数的多重比较时,单个平均数的标准误为:假设进行组内亚组间平均数的多重比较,那么单个平均数标准误为:2023/6/1689【例6.12】在温室内以4种培养液(l=4)培养某作物,每种3盆(m=3),每盆4株(n=4),一个月后测定其株高生长量(mm),得结果于表6.19,试作方差分析。表6.194种培养液下的株高增长量(mm)1、自由度和平方和的分解总变异自由度:DFT=lmn-1=(434)-1=47培养液间自由度:DFt=l-1=4-1=3培养液内盆间自由度:DFe1=l(m-1)=4(3-1)=8盆内株间自由度:DFe2=lm(n-1)=43(4-1)=362023/6/1691〔1〕总变异平方和〔2〕培养液间平方和〔3〕培养液内盆间平方和〔4〕盆内株间平方和1720252023/6/16922、

F测验表6.20

表6.19资料的方差分析2023/6/1693盆间差异的F测验,假设H0:,求得:查表得,

v1=8,v2=36时,F0.05=2.22>F,故接受H0:

对培养液间有无不同效应作F测验,假设H0:,求得:查表得,v1=3,v2=8时,F0.01=7.59<F,故否认H0:,接受HA:≠0.推断:该试验同一培养液内各盆间的生长量无显著差异;而不同培养液间的生长量有极显著的差异。故前者不需再作多重比较,后者那么需进一步测验各平均数间的差异显著性。2023/6/16943、各培养液平均数间的比较根据期望均方,培养液平均数间的比较应用MSe1,求得:按v=8,由附表7查得p=2,3,4时的SSR0.05和SSR0.01值,并算得各LSR值列于表6.21。由LSR值对4种培养液植株生长量进行差异显著性测验的结果列于表6.22。2023/6/1695表6.214种培养液的LSR值(新复极差测验)表6.224种培养液植株生长量(mm)的差异显著性由表6.22可见,4种培养液对生长量的效应,除C与D、B与A差异不显著外,其余比照均有显著或极显著差异。2023/6/1696提问12组内又分亚组的单向分组资料的方差分析?自由度的分解?平方和的分解?2023/6/1697二级系统分组资料的方差分析总变异亚组内组内亚组间组间FMSSSDF变异来源2023/6/1698第五节两向分组资料的方差分析两因素试验中假设因素A的每个水平与因素B的每个水平均衡相遇〔或称正交〕,那么所得试验数据按两个因素交叉分组称为两向分组资料。一、组合内只有单个观察值的两向分组资料的方差分析二、随机区组试验设计的统计分析三、组合内有重复观察值的两向分组资料的方差分析2023/6/1699设有A和B两个因素,A因素有a个水平,B因素有b个水平,每一处理组合仅有1个观察值,那么全试验共有ab个观察值。一、组合内只有单个观察值的两向分组资料的方差分析2023/6/16100表6.23完全随机设计的二因素试验每处理组合只有一个观察值的数据结构〔i=1,2,…,a;j=1,2,…,b〕2023/6/16101表6.23中观察值的线性模型为:上式的为总体平均;和分别为A和B的效应,可以是固定模型(,)或随机模型[~N(0,),~N(0,)];相互独立的随机误差服从正态总体N(0,)。说明表6.23类型资料的总变异()可分解为A因素第i水平效应、B因素第j水平效应和试验误差三个局部。2023/6/16102表6.24

表6.23类型资料自由度和平方和的分解及方差分析表6.24中F测验所作假设为H0:;H0:。2023/6/16103【例6.13】采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4株,每组为6盆,每盆一个处理,试验共有4组24盆,并按组排于温室中,使同组各盆的环境条件一致。当各盆见第一朵花时记录4株豌豆的总节间数,结果列于表6.25,试作方差分析。2023/6/16104表6.25

生长素处理豌豆的试验结果2023/6/16105自由度和平方和的分解2023/6/16106表6.26

表6.25资料的方差分析2023/6/16107F测验1、上表对组间有无不同效应作F测验,假设H0:,得:2、对处理间有无不同效应作F测验有H0:得:3、推断:组间环境条件无显著差异,不同生长素处理间有显著差异。2023/6/16108处理间比较1、此例有预先指定的对照,故用LSD法。求得:2、查表4得

=15时,t0.05=2.131,t0.01=2.947,故:

LSD0.05=1.202×2.131=2.56

LSD0.01=1.202×2.947=3.542023/6/161093、表6.27豌豆生长素处理后始花时的节间数4、结果赤霉素的效应最强,吲哚乙酸次之,其余处理皆与对照无显著差异。2023/6/16110二、随机区组试验结果的分析例如随机区组试验结果的统计分析,可应用第六章所述两向分组单个观察值资料的方差分析法。这里可将处理看作A因素,区组看作B因素,其剩余局部那么为试验误差。设试验有n个处理,k个区组,那么其自由度和平方和的分解式如下:P227-p231页:留作自学2023/6/16111总自由度=区组自由度+处理自由度+误差自由度2023/6/16112总平方和=区组平方和+处理平方和+试验误差平方和y表示各小区产量(或其他性状),表示区组平均数,表示处理平均数,表示全试验平均数。2023/6/16113【例12.3】有一小麦品比试验,共有A、B、C、D、E、F、G、H8个品种〔k=8〕,其中A是标准品种,采用随机区组设计,重复3次〔n=3〕,小区计产面积25m2,其产量结果列于表12.3,试作分析。2023/6/16114表12.3小麦品比试验(随机区组)的产量结果〔kg〕2023/6/16115(1)自由度和平方和的分解①自由度的分解:总区组品种误差②平方和的分解:矫正数2023/6/16116总区组品种误差=84.61-27.56-34.08=22.972023/6/16117(2)F测验将上述计算结果列入表12.4,算得各变异来源的MS值。表12.4表12.3结果的方差分析2023/6/16118对区组间MS作F测验,在此有H0:,HA:、、不全相等〔、、分别代表区组Ⅰ、Ⅱ、Ⅲ的总体平均数〕,得F=13.78/1.64=8.40>F0.05,所以H0应予否认,说明3个区组间的土壤肥力有显著差异。在这个试验中,区组作为局部控制的一项手段,对于减少误差是相当有效的(一般区组间的F测验可以不必进行,因为试验目的不是研究区组效应)。2023/6/16119对品种间MS作F测验,有H0:,HA:、、…、不全相等〔、、…、分别代表品种A、B、…、H的总体平均数〕,得F=4.87/1.64=2.97>F0.05,所以H0应予否认,说明8个供试品种的总体平均数有显著差异。需进一步作多重比较。(3)品种间平均数的多重比较①最小显著差数法(LSD法)本例目的是要测验各供试品种是否与标准品种A有显著差异,宜应用LSD2023/6/16120法。首先应算得品种间平均数或总和数差数的标准误。在以各品种的小区平均产量作比较时,差数标准误为:从而如果以各品种的小区总产量作比较,那么因总产量大n倍,故差数标准误为:2023/6/16121(12·4)—(12·7)中,为方差分析表中的误差项均方MS;t值的,即误差项自由度。凡品种与对照的差异到达或超过者为显著,到达或超过者为极显著。如果试验结果需以亩产量表示,只要将总产量和总产量的LSD皆乘以cf即可。(12·6)并有:(12·7)2023/6/16122在此,如以各品种的小区平均产量〔即表12.3的〕进行比较,那么由于时,=2.145,=2.977,故(kg),(kg)如对各品种的三个小区总产量(表12.3的)进行比较,那么(kg)2023/6/16123

如以亩产量表示试验结果,那么可算得化各品种总产量为亩产量的改算系数:因此,品种A的亩产量=(kg)(kg)(kg)(kg)

2023/6/16124

如以亩产量表示试验结果,那么可算得化各品种总产量为亩产量的改算系数:因此,品种A的亩产量=(kg)(kg)(kg)(kg)

2023/6/16125表12.5表12.3资料各品种产量和对照相比的差异显著性2023/6/16126②新复极差测验(LSR法)如果我们不仅要测验各品种和对照相比的差异显著性,而且要测验各品种相互比较的差异显著性,那么宜应用LSR法。首先,应算得品种的标准误SE。在小区平均数的比较时为(12·8)

在小区总数的比较时为(12·9)

2023/6/16127在亩产量的比较时为然后,查附表8当时,自2至的SSR0.05和SSR0.01值,进而算得LSR0.05和LSR0.01值。本例如以小区平均数为比较标准,那么有查附表8,得到自由度、不同显著水平和秩次距p下的SSR值,进而算得LSR值(表12.6)。品种平均数差(12·10)

(kg)

2023/6/16128异显著性结果见表12.7。表12.6表12.3资料新复极差测验的最小显著极差2023/6/16129表12.7表12.3资料的新复极差测验结果2023/6/16130结果说明:E品种与H、C、F、A、D5个品种有5%水平上的差异显著性,E品种与D品种有1%水平上的差异显著性,其余各品种之间都没有显著差异。以上是以各品种的小区平均产量为比较标准。如以各品种总产量或亩产量为比较标准,那么只要应用由(12·9)或(12·10)算出的SE值即可,方法类同,不再赘述。用时,仅需选择上述3种比较的任一种。2023/6/16131二、组合内有重复观察值的两向分组资料的方差分析设有A、B两个试验因素,A因素有a个水平,B因素有b个水平,共有ab个处理组合,每一组合有n个观察值,那么该资料有abn个观察值。如果试验按完全随机设计,那么其资料类型如表6.28。表6.28完全随机设计的二因素试验,每处理组合有重复观察值的数据结构

(i=1,2,…,a;j=1,2,…,b;k=1,2,…,n)2023/6/161322023/6/16133完全随机设计的二因素试验,每处理组合有重复观察值的数据结构2023/6/16134表6.28中观察值的线性模型为:上式的为总体平均;和分别为因素A和B的效应;为A×B互作;为随机误差,遵循分布N(0,)。表6.28类型资料的总变异()可分解为A因素效应、B因素效应、A×B互作和试验误差四个局部。2023/6/16135表6.29表6.28类型资料自由度和平方和的分解〔C=T2/abn〕

2023/6/16136线性模型的假定条件可有三种模型。

1、固定模型时:,,

2、随机模型时:

和都是相互独立的随机变数,遵循正态分布。

3、混合模型。2023/6/16137表6.30

表6.28类型资料各变异来源的期望均方2023/6/16138在上述测验中,互作的分析非常重要。通常首先应由测验互作的显著性2023/6/16139【例6.14】施用A1、A2、A3

3种肥料于B1、B2、B3

3种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)于表6.31。试作方差分析。2023/6/16140表6.313种肥料施于3种土壤的小麦产量〔g〕(a=3,b=3,n=3,abn=27)2023/6/16141自由度和平方和的分解2023/6/16142表6.32

表6.31资料的方差分析整理成表2023/6/16143F测验以固定模型作F测验。假设H0:,求得F=4.81/0.928=5.18>F0.01;假设H0:,求得F=89.69/0.928=96.65>F0.01;假设H0:,求得F=1.98/0.928=2.13<F0.05。所以该试验肥类×土类的互作和肥类的效应间差异都是极显著的,而土类间无显著差异。2023/6/16144①各处理组合平均数的比较:肥类×土类的互

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论