试验统计方法 6.第六章方差分析学习资料_第1页
试验统计方法 6.第六章方差分析学习资料_第2页
试验统计方法 6.第六章方差分析学习资料_第3页
试验统计方法 6.第六章方差分析学习资料_第4页
试验统计方法 6.第六章方差分析学习资料_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析基本原理多重比较线性模型和期望均方单向分组资料的方差分析两向分组资料的方差分析基本假定和数据转换

方差分析(analysisofvariance,简称ANOVA)由英国统计学家R.A.Fisher于1923年提出。这种方法是将

k

个样本的观测值作为一个整体,把观测值总变异的平方和和自由度分解为不同变异来源的平方和及自由度,进而获得不同变异来源方差的估计值;通过对这些方差的估计值进行比较,就能测验各样本所属总体平均数是否相等。从总变异中扣除了各种原因所引起的变异后,剩余变异做为试验误差的无偏估计量。第一节方差分析的基本原理本节结合单因素试验结果的方差分析介绍方差分析的原理。

一、自由度和平方和的分解假设某单因素试验有

k

个处理,每个处理有

n

次重复,则共有

nk

个观测值。这类试验资料的数据模式如表6-1所示。表6-1每组有n个观测值的k个处理的数据模式xij表示第i个处理的第j个观测值(i=1,2,…,k;j=1,2,…,n)Ti表示第i个处理n个观测值的和;T表示全部观测值的总和;xi.表示第i个处理的平均数;x..表示全部观测值的总平均数;(一)总平方和的分解

全部观测值总变异的平方和是各观测值xij与总平均数的离均差平方和,记为SST。即C

称矫正数因为=0所以

上式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了容量为n的样本间的变异,即处理间变异,称为处理间平方和,记为SSt,即上式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即于是有SST=SSt+SSe

平方和的计算三个平方和的计算公式

(二)总自由度的分解

总自由度记为dfT,dfT=nk-1。处理间自由度dft,dft=k-1处理内自由度dfe,dfe=K(n-1)自由度分解式为

nk-1=(k-1)+k(n-1)各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSt(或)和MSe(或)。即

【例题1】以A、B、C、D四种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果见下表,试分解其平方和与自由度。这是一个单因素试验,处理数k=4,重复数n=4。各项平方和及自由度计算如下:矫正数

C=T2/nk=3362/(4×4)=7056总平方和dfT=nk-1=

4×4-1=15处理间平方和处理内平方和dft=k-1=4-1=3dfe=K(n-1)=4×(4-1)=12进而得各项变异的均方总变异均方

MST=SST/dfT=602/15=40.13处理均方

MSt=SSt/dft=504/3=168.00误差均方

Mse=SSe/dfe=98/12=8.17二、F分布与F测验

(一)F

分布

在一正态总体N(μ,σ2)中随机抽取样本容量为n1

和n2

的两个样本分别求得其均方s12和s22,统计学上把两个均方之比值称为F值。即

F=s12/

s22

给定n1和n2

时,按上述方法进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布。

F分布曲线是随自由度υ1(n1–1)、υ2(n2–1)而变化的一组偏态曲线,其形态随着υ1、υ2的增大逐渐趋于对称。F

分布的取值范围是(0,+∞),

=1

(二)F测验

用F值出现概率的大小推断两个总体方差是否相等的方法称为F测验(F-test)。(1)(2)

F测验目的在于检验某项变异因素的效应或方差是否真实存在。因此,总是以被测验的那一项变异因素的方差作分子,以另一项变异(如试验误差)的均方作分母。F值越大,因素的效应或方差越有可能真实存在。当F大于临界Fɑ时,认为效应或方差在显著或极显著水平下真实存在。附表4(P340-344)右尾临界F0.05和F0.01值

(1)F<,则P>0.05,接受H0,认为处理效应/方差不存在。(2)≤F<,则0.01<P≤0.05,在ɑ=0.05水平上否定H0,即在0.05水平上处理效应/方差显著存在,在F值的右上方标记“*”。(3)F≥,则P≤0.01,在ɑ=0.01水平上否定H0,即在0.01上处理效应/方差极显著存在,在F值的右上方标记“**”。【例题1】不同药剂处理水稻观察苗高的试验中,测验药剂间变异是否显著大于药剂内变异?已算出:MSt=168.00,df1=3

MSe=8.17,df2=12则:F=MSt/MSe=168.00/8.17=20.56**根据df1=3,df2=12查附表5,得F0.05(3,12)=3.49,F0.01(3,12)=5.95因为F>F0.01(3,16),P<0.01推断:药剂间的变异显著大于药剂内变异。

在方差分析中,通常将变异来源、平方和、自由度、均方和F值汇总在方差分析表。第二节、多重比较

F

值显著或极显著,否定了无效假设HO,表明处理效应存在。有时,需要进行处理平均数间的比较,以明确平均数间的差异显著性。

统计上把多个平均数间的相互比较称为多重比较(multiplecomparisons)。多重比较的方法甚多,常用的有最小显著差数法(LSD法)和新复极差法(LSR法)。

一、最小显著差数法(LSD法)

(leastsignificantdifference)LSD法的实质是两个平均数相比较的t测验法。因此,显著水平为α时的最小显著差数LSDα

然后用任两个平均数的差与LSDα比较,如果则这两个平均数在α水平上显著。反之,差异不显著。方差分析的多重比较中

为平均数差数的标准误。当两样本容量相等时,

其中为F检验中的误差均方,n为各处理的重复数。为显著水平为α、自由度为F

测验中误差自由度的临界t值。当显著水平α=0.05和0.01时,从t值表中查出和,得:试对例题资料进行多重比较四种药剂处理水稻后对苗高的影响LSD法多重比较的步骤:(1)列出平均数的多重比较表:各处理按其平均数从大到小排列,

计算任两个平均数的差;(2)计算最小显著差数LSD0.05和LSD0.01;(3)将任两个平均数的差数与LSD0.05和LSD0.01比较,作出统计推断。

当df=12时,t0.05=2.179,t0.01=3.055

LSD0.05=t0.05

×

=4.40(cm)

LSD0.01=t0.01

×

=6.18(cm)

例如:不同药剂处理对水稻苗高影响的多重比较结果:药剂D与A、D与C、及B与C平均数间差异达极显著水平,D与B、B与A处理平均数间达显著水平,药剂A与C处理平均数差异不显著。二、新复极差法(LSR法)

LSD法的理论基础是两个样本平均数差数的抽样分布,但多重比较是多个平均数的比较。

当随机抽取k(k>2)个样本时,随机极差与k=2是不同的。将平均数间的差值看成是平均数的极差,根据极差的抽样分布理论、极差范围内平均数个数不同,确定最小显著极差(Leastsignificantranges,LSR)LSRα,可以克服LSD法的不足。

为平均数的标准误,

α为显著性水平

dfe

为F测验误差自由度

p为所有平均数按从大到小排列两极差范围内所包含的平均数个数。

邓肯(Duncan)于1955年提出了新复极差法,又称最短显著极差法

(shortestsignificantranges简称SSR法),又称邓肯(Duncan)法。

例题:用SSR法对不同药剂处理对水稻苗高影响进行多重比较。

查SSR表,当df=12时,p=2,3,4的SSRα值。并计算出尺度值LSRα

三、多重比较方法的选择:检验尺度有如下关系:LSD法≤SSR法当只含两个平均数时,即k=2时,取等号;当k≥3时,取小于号。在多重比较中,LSD法比SSR法的尺度小。同一资料用LSD法测验差数显著,用SSR法测验未必显著。1、事先有比较的标准,且都与一个对照处理相比时,可以采用LSD法。若处理之间相互比较应该采用新复极差法。2、在农业田间试验中,由于试验误差较大,常采用SSR法。四、多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有:

1、梯形表法:

将平均数按从大到小顺序排列,然后算出各平均数间的差数,凡达到0.05显著水平的,在差数右上角标一个“*”号,凡达到0.01显著水平的,在差数右上角标两个“**”号。我们上面举例中应用的即是梯形表法。多重比较的梯形表示法2、字母标注法各平均数间只要有一个相同字母,即为差异不显著,无相同字母的为差异显著。用小写字母表示显著水平α=0.05,用大写字母表示显著水平α=0.01。此法的优点是占篇幅小,在科技文献中常见。品种平均产量差异显著性5%E14.2B12.4G11.9H11.4

C10.8

F10.1

A9.8

D9.0

多重比较(LSD法)假定:LSD0.05=2.35aaabbbcccccddddbbd标记字母法的步骤将各处理平均数由大到小自上而下排列;在最大平均数后标记字母a,并将该平均数与以下各平均数依次相比,凡差异不显著的,标记同一字母a,直到某一个与其差异显著的平均数,将之标记字母b;以标有字母b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标b,直至显著为止。再以标记有字母b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数,标记c。如此重复

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论