第七章方差分析1_第1页
第七章方差分析1_第2页
第七章方差分析1_第3页
第七章方差分析1_第4页
第七章方差分析1_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章第七章 方差分析方差分析生物统计与田间试验生物统计与田间试验7.1 7.1 方差分析的意义方差分析的意义 我们学过的我们学过的t t测验或测验或u u测验是比较测验是比较两个两个样本平样本平均数间差异显著性。均数间差异显著性。 但在农业科学试验中,研究但在农业科学试验中,研究多个多个样本样本( (处理处理) )之间的差异更为常见。之间的差异更为常见。 对多个平均数间的差异显著性测验,若还是对多个平均数间的差异显著性测验,若还是采用采用t t测验或测验或u u测验,则存在着以下几个方面的测验,则存在着以下几个方面的缺陷。缺陷。 缺陷:缺陷:1025c时,统计工作量将加大到无法承受。时,统计

2、工作量将加大到无法承受。当样本较大当样本较大 其一,统计工作量加大。其一,统计工作量加大。 如对如对5 5个样本平均数进行两两比较,所有个样本平均数进行两两比较,所有可可能的平均数差值为能的平均数差值为个,个, 其二,其二,从统计上夸大了样本间的差异,使犯第从统计上夸大了样本间的差异,使犯第一类错误的概率加大。一类错误的概率加大。 若对每两个样本测验的显著水平都取若对每两个样本测验的显著水平都取=0.05=0.05,而实际上整个试验的显著水平已不是而实际上整个试验的显著水平已不是 = 0.05= 0.05,而是而是0.050.05。 = = l-0.95l-0.951010=0.4013=0.

3、4013对于一个均数差值时对于一个均数差值时= 1-0.95= 1-0.95=0.050.05;两个均数差值时两个均数差值时= = 1-0.951-0.952 2=0.0975=0.09751010个均数差值时个均数差值时 对于同一试验的多个处理平均数进行比较时,对于同一试验的多个处理平均数进行比较时,应有统一的应有统一的试验误差估计值试验误差估计值。 若用若用t t测验两两比较,由于每次比较需计算一测验两两比较,由于每次比较需计算一个个其三,无统一精度的试验误差估计。其三,无统一精度的试验误差估计。 21xxs, ,故使得各次比较误差的估计值不统一。故使得各次比较误差的估计值不统一。 同时,

4、没有充分利用全部资料信息而使同时,没有充分利用全部资料信息而使误差误差自由度的损失自由度的损失并影响对误差估计的精度。并影响对误差估计的精度。 误差自由度怎样损失呢?误差自由度怎样损失呢? 因此,对多样本平均数的假设测验,需采用一因此,对多样本平均数的假设测验,需采用一种更为合适的统计方法种更为合适的统计方法 例如,试验有例如,试验有4 4个处理个处理,每个处理重复,每个处理重复5 5次次,共,共有有2020个个观察值。观察值。 进行进行t t测验时,每次只能利用测验时,每次只能利用2 2个处理共个处理共1010个观个观察值估计试验误差,察值估计试验误差,误差自由度为误差自由度为5+5-25+

5、5-28 8;若;若利用整个试验的利用整个试验的2020个观察值估计试验误差,显然个观察值估计试验误差,显然估计的精确性高,且误差自由度为估计的精确性高,且误差自由度为4 4(5-1)(5-1)1616。方差分析方法。方差分析方法。英国英国统计学家统计学家 r ra afisher fisher 19231923年年 “ “ 方差分析法是一种在若干能相互比较方差分析法是一种在若干能相互比较的资料组中,把的资料组中,把产生变异的原因产生变异的原因加以区分加以区分开来的方法与技术开来的方法与技术”。 方差分析方差分析实质上实质上是关于观测值变异原因是关于观测值变异原因的数量分析。的数量分析。7.2

6、 7.2 方差分析的步骤方差分析的步骤 一、平方和与自由度的分解一、平方和与自由度的分解 方差是方差是平方和除以自由度平方和除以自由度的商。的商。 要将一个试验资料的要将一个试验资料的总变异总变异分裂成各个变分裂成各个变异来源的相应变异,首先必须将异来源的相应变异,首先必须将总平方和总平方和与与自由度自由度分解为各个变异来源的相应部分。分解为各个变异来源的相应部分。 现以具有现以具有k k个处理个处理,每个处理含有,每个处理含有n n个个重复重复观观察值察值的完全随机试验资料为例来说明。的完全随机试验资料为例来说明。 这种类型的资料常来自于完全随机田间调查这种类型的资料常来自于完全随机田间调查

7、或完全随机盆栽试验,其数据结构与资料整理或完全随机盆栽试验,其数据结构与资料整理见表见表7.17.1。 处理处理1 1i ik k总和总和重复观察值重复观察值. it. ix. 1t it kt. 1x. ix. kx t x11x1 ix1kxjx1nx1ijxinxkjxknx表表7.1 7.1 各处理重复观察值数目相等的完全随机试验数据符号表各处理重复观察值数目相等的完全随机试验数据符号表i表表7.17.1资料的线性模型可表达为:资料的线性模型可表达为:ijiijx 为在假设全部数据都随机抽自同一正态分为在假设全部数据都随机抽自同一正态分 布总体时的总体平均数;布总体时的总体平均数;为第

8、为第i i处理对处理对 的效应;的效应; 为为 的随机误差;的随机误差; ijijxijxi以上各参数的样本估计值分别为:以上各参数的样本估计值分别为:.)(xxiij.xiijxxijiijx iijiijxxxxxx例例 7.17.1 在肥力均匀的试验地上种植在肥力均匀的试验地上种植4 4个小麦品种,采个小麦品种,采用一致的栽培管理措施用一致的栽培管理措施 ,测产时以一米行长为,测产时以一米行长为取样单位,各品种随机抽取取样单位,各品种随机抽取6 6个取样单位,测产个取样单位,测产结果列于表结果列于表7.27.2。表表7.2 7.2 中各观察值的变异来源构成如下:中各观察值的变异来源构成如

9、下: iijiijxxxxxx)(7.37.3 iijiijxxxxxxa a品种的观察值:品种的观察值:6464 7373 + +(72-7372-73)+ +(64-7264-72)=73=73+(-1)+(-8)+(-1)+(-8)7878 73+73+(85-7385-73)+ +(78-8578-85)=73+(12)+(-7)=73+(12)+(-7)b b品种的观察值:品种的观察值: 余此类推。余此类推。 它表明任一观察值它表明任一观察值 与总体平均数与总体平均数 之差都之差都可分解为可分解为处理效应处理效应和和误差效应误差效应两部分。两部分。 iijiijxxxxxx)(ijx

10、 x21112211 kinjiijkiikinjijxxxxnxxijx x 若我们用表示数据变异程度大小的统计量若我们用表示数据变异程度大小的统计量离均离均差平方和差平方和来表示这些变异,则得:来表示这些变异,则得:211 kinjijxx211kinjiijxx kiixxn12上式中:上式中:总变异平方和,用总变异平方和,用sssst t表示表示 处理平方和,用处理平方和,用sssst t表示表示 误差平方和,用误差平方和,用sssse e表示表示 即即sssse e sssst t+ +sssst t = = 同理,总变异自由度也可分解为两部分,即同理,总变异自由度也可分解为两部分,

11、即总变异自由度处理间自由度总变异自由度处理间自由度+ +误差自由度。误差自由度。 总变异自由度总变异自由度( ) 处理间自由度处理间自由度( ) 误差自由度误差自由度 ( ) 由于计算平方和时,要受到由于计算平方和时,要受到 0 0所以总自由度为所以总自由度为 kinjijxx11tte1 nkt 由于用由于用 计算处理间平方和时,计算处理间平方和时, 要受要受到到 0 0条件的约束,所以处理条件的约束,所以处理间自由度为:间自由度为:1 kt kiixxn1 ix ix 由于计算处理内(误差)平方和时,由于计算处理内(误差)平方和时, 要受要受到到 0 k0 k个条件得约束,所以个条件得约束

12、,所以误误差自由度为:差自由度为:kinjiijxx11) 1( nkknke方差:各变异来源的平方和除以相应的自由度方差:各变异来源的平方和除以相应的自由度12112 nkxxssskinjijttt12112nkxxssskinjiijeee1122 kxxnssskiittt 用方差用方差值的大小值的大小表示各变表示各变异原因所异原因所引起的变引起的变异程度的异程度的大小。大小。总变异:总变异:211 kinjijtxxss1 nkt kinjkinjijijtnkxxss112112nktxsst22 矫正数矫正数 c c1 nkt= 4= 46-1= 236-1= 23c=c= 17

13、5217522 2/ / (4(46)6)= 127896127896sssst t= = 64642 2+72+722 2+ + + 65652 2-c-c =4118=4118处理间平方和处理间平方和 sssst t 实际应用公式为:实际应用公式为:cntsskiit121 kt210012789663544565104322222tss误差平方和误差平方和 sssse e 实际应用公式为:实际应用公式为: sssse e=ss=sst t-ss-sst t因此,例因此,例7.17.1的各变异来源的方差为:的各变异来源的方差为:04.1792341182ts00.700321002ts90

14、.1002020182es 各部分方差值的大小,表示各变异原因所引起各部分方差值的大小,表示各变异原因所引起的变异程度的大小。的变异程度的大小。 在方差分析体系中,在方差分析体系中, f f测验是用于测验某项测验是用于测验某项变异因素的效应或方差是否真实存在,所以在变异因素的效应或方差是否真实存在,所以在计算计算f f 值时,总是将要测验的那一项值时,总是将要测验的那一项变异因素变异因素的方差的方差作作分子分子而以另一项变异因素(如试验误而以另一项变异因素(如试验误差)的方差作分母。差)的方差作分母。二、方差的显著性测验二、方差的显著性测验f f测验测验 如例如例7.17.1类型资料来说有类型

15、资料来说有处理间处理间方差和方差和误差误差方方差,若要测验差,若要测验处理间是否有本质的差异处理间是否有本质的差异,也即测,也即测验处理间方差是否大于误差方差时,验处理间方差是否大于误差方差时,f f值为值为22etssf 变异来源变异来源品种间品种间误误 差差 总变异总变异dfdfssssmsmsf ff f0.050.05f f0.010.01表表7.3 7.3 例例7.17.1小麦品种比较试验方差分析小麦品种比较试验方差分析3 320202323210021002018201841184118700700100.9100.96.946.94* * *3.103.104.944.94三、多

16、重比较三、多重比较 f f测验测验是一个整体概念,是一个整体概念,f f测验结果显著或测验结果显著或不显著仅表明各处理间存在显著差异,但不显著仅表明各处理间存在显著差异,但无无法具体说明哪些处理间差异达到显著或极显法具体说明哪些处理间差异达到显著或极显著,哪些处理间差异不显著著,哪些处理间差异不显著。 为解决这一问题,要进行对处理平均数间作两为解决这一问题,要进行对处理平均数间作两两比较的假设测验两比较的假设测验多重比较多重比较。 如例如例7.17.1,f f测验结果达到极显著,仅说明测验结果达到极显著,仅说明4 4个个小麦品种产量的差异极显著,但在这小麦品种产量的差异极显著,但在这4 4个品

17、种之个品种之间,间,究竟哪两个比较,差异显著或极显著究竟哪两个比较,差异显著或极显著, 哪哪两个差异不显著,两个差异不显著, f f测验没提供任何信息。测验没提供任何信息。 在试验中若设有对照,则参试处理就有一个共在试验中若设有对照,则参试处理就有一个共同的比较标准。同的比较标准。 lsdlsd法法方法中,任一处理平均数都与对照平均方法中,任一处理平均数都与对照平均数相比较,其临界值为数相比较,其临界值为jixxstlsd (7.197.19) 1 1最小显著差数测验法最小显著差数测验法(lsd(lsd法法) )nssexxji22t为两尾显著临界值为两尾显著临界值( (附表附表7)7),查表

18、时参照,查表时参照和处理数和处理数 k(k(不包括对照不包括对照) ), (7.207.20)jixxstlsdtv误差项自由度误差项自由度当各处理观察值数目相等时当各处理观察值数目相等时 gnssexxji799. 569 .10022231. 3,57. 201. 005. 0tt glsdglsd19.19799. 531. 390.14799. 557. 201. 005. 0以例以例7.17.1为例,设为例,设d d品种为对照,则有品种为对照,则有3,20kve在误差项自由度在误差项自由度时,查附表时,查附表7 7,进而得到,进而得到 凡是与对照比较的差数的绝对值大于凡是与对照比较的

19、差数的绝对值大于14.9014.90(g g)而而小于小于19.1919.19(g g)的为差异的为差异显著显著; 如如大于大于19.19g19.19g为为差异差异极显著极显著; 如如小于等于小于等于14.90g14.90g为为差异不显著差异不显著。 例例7.17.1的的dlsddlsd法多重比较结果列于表法多重比较结果列于表7.57.5。表表7.5 7.5 例例7.17.1资料品种的资料品种的lsdlsd法多重比较法多重比较品种品种小区平均产量小区平均产量与与ckck比较的差数比较的差数及显著性及显著性b bc ca ad(ck)d(ck)85857676727259592626171713

20、13-* * * * 结论:结论:b b品种产量极显著高于对照;品种产量极显著高于对照;c c品种显著品种显著高于对照,高于对照,a a品种与对照比较差异不显著。品种与对照比较差异不显著。 该法又称为该法又称为最小显著极差法最小显著极差法。 这一方法是这一方法是d db bduncanduncan于于19551955年提出的。年提出的。其最小显著极差其最小显著极差临界值临界值为为ssrselsr (7.217.21)2.duncane2.duncane新复极差法新复极差法(ssr(ssr法法) )ssrselsrnssee22esssrev称之为称之为平均数标准误平均数标准误;为为误差项方差误

21、差项方差;为为误差自由度误差自由度为在为在误差自由度下误差自由度下对于不同对于不同p p值的值的ssrssr值值。 p p为被比较的两个平均数间在为被比较的两个平均数间在顺序排列的平均顺序排列的平均数序列中数序列中所涵盖的平均数个数。所涵盖的平均数个数。)(10. 469 .1002gnssee20ev01.0ssr 下面用下面用ssrssr法对例法对例7.17.1作多重比较:作多重比较: 在误差自由度在误差自由度 下,查下,查p=2p=2,3 3,4 4的的值,并进一步计算值,并进一步计算lsrlsr0.050.05和和平均数标准误平均数标准误 05.0ssrlsrlsr0.010.01值值

22、( (见表见表7.6a)7.6a)。 表表7.6a 7.6a 例例7.1 lsr7.1 lsr测验的测验的lsrlsr值值pssr0.05ssr0.01lsr0.05lsr0.012342.952.953.103.103.183.184.024.024.324.324.224.2212.1012.1012.7112.7113.0413.0416.4816.4817.3017.3017.7517.752.952.954.14.1值后,用字母标记法将各处理值后,用字母标记法将各处理 lsr计算出计算出平均数间的差异显著性表示出来。平均数间的差异显著性表示出来。具体作法:具体作法:* *将全部平均数按大到小依次排序;将全部平均数按大到小依次排序; * *在在=0.05=0.05显著水平显著水平比较时,先在最大的平均比较时,先在最大的平均数后面标上字母数后面标上字母a a,并将该平均数与以下各平均,并将该平均数与以下各平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论