单因素方差分析_第1页
单因素方差分析_第2页
单因素方差分析_第3页
单因素方差分析_第4页
单因素方差分析_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单因素方差分析第1页,共62页,2023年,2月20日,星期三用6种培养液培养红苜蓿,每一种培养液做5次重复,测定5盆苜蓿的含氮量,结果如下表(单位:mg).问用6种不同培养液培养的红苜蓿含氮量差异是否显著?盆号培养方法ⅠⅡⅢⅣⅤⅥ1234519.432.627.032.133.017.724.827.925.224.317.019.49.111.915.820.721.020.518.818.614.314.411.811.614.217.319.419.116.920.8第2页,共62页,2023年,2月20日,星期三方差分析(analysisofvariance-ANOVA)

是由英国统计学家R.A.Fisher于1923年提出的。方差分析是一种特殊的假设检验,是用来判断多组数据之间平均数差异显著性的.

它不同于t检验之处在于:它把所有数据放在一起,一次比较就对所有各组间是否有差异做出判断,如果没有显著性差异,则认为各组平均数相同;如果发现有差异,再进一步比较是哪组数据与其它数据不同.第3页,共62页,2023年,2月20日,星期三在多组数据的平均数之间做比较时,可以在平均数的所有对之间做t检验,但这样做会提高犯I型错误的概率,因而是不可取的。方差分析可以防止该问题的出现。如对5个平均数进行检验,若做t检验,则需做10次,假设每一次检验接受零假设的概率为0.95,那么10次都接受零假设的概率为(0.95)10=0.60,(至少有1次)拒绝零假设的概率为0.40,犯I型错误的概率明显平加第4页,共62页,2023年,2月20日,星期三方差分析中常用基本概念(一)试验指标(experimentalindex)

为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。(二)试验因素

(experimentalfactor)

试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;

若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。按是否可控制因素可分为:固定因素和随机因素.第5页,共62页,2023年,2月20日,星期三

固定因素:可准确控制且其水平固定后效应也固定,比如:温度、化学药物浓度等.随机因素:因素水平不能严格控制或者说即使其水平可控制但其效应也不固定.比如:动物的窝别、农家肥的效果等.试验因素常用大写字母A、B、C、…等表示。(三)因素水平(leveloffactor)试验因素所处的某些特定状态或数量等级称为因素水平,简称水平。比如:不同的温度;溶液不同浓度等.(四)重复

(repeat)

在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。第6页,共62页,2023年,2月20日,星期三第一节单因素方差分析的基本原理一、线性模型二、固定线性模型三、随机线性模型四、多重比较五、基本假定第7页,共62页,2023年,2月20日,星期三(一)线性模型

假设某单因素试验有a个处理,每个处理有n次重复,共有na个观测值。这类试验资料的数据模式如表7-1所示。一、线性模型第8页,共62页,2023年,2月20日,星期三表7-1单因素方差分析的典型数据模式

X1X2X3…

Xi…

Xa

合计1

χ11χ21χ31χi1χa1

2χ12χ22χ32χi2χa23χ13χ23χ33χi3χa3…

…jχ1jχ2jχ3jχij

χajnχ1nχ2nχ3nχinχan合计平均数总体均数处理效应第9页,共62页,2023年,2月20日,星期三符号文字表述

an因素水平数每一水平的重复数第i水平的第j次观察值第i水平所有观察值的和第i水平均值全部观察值的和总平均值第i水平上的子样方差各处理总和、平均数、大总和、总平均数是计算的一级数据,在本章我们采用了黑点符号体系法表示,要注意熟悉和掌握。第10页,共62页,2023年,2月20日,星期三可以分解为

表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,

其中μ表示全试验观测值的总体平均数(overallmean),是第i个处理的效应(treatmenteffect),表示处理i对试验结果产生的影响。是试验误差,相互独立,且服从正态分布N(0,σ2)。第11页,共62页,2023年,2月20日,星期三上式就称为单因素试验的线性统计模型(linearstatisticalmodel)亦称数学模型。

方差分析的目的就是要检验处理效应的大小和有无。(二)方差分析的基本思路

将总的变差分解为构成总变差的各个部分。即将a个处理的观测值作为一个整体看待,把观察值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源的总体方差估计值;通过这些估计值的适当比值,就能检验各样本所属总体均值是否相等。

方差分析实质上是关于观测值变异原因的数量分析。第12页,共62页,2023年,2月20日,星期三二固定模型fixedmodel:

因素固定、效应也固定反应到线性模型中即为常数.可要求1.假设

固定模型的零假设为:备择假设为:

第13页,共62页,2023年,2月20日,星期三故an个观察值的总变异可分解为处理间的变异和处理内的变异两部分。全部观察值的总变异可以用总均方来度量,处理间变异和处理内变异分别用处理间均方和处理内均方来度量。

2.平方和与自由度的剖分第14页,共62页,2023年,2月20日,星期三总均方的拆分是通过将总均方的分子──称为总离均差平方和,简称为总平方和(totalsumofsquares,SST)

,剖分成处理间平方和(sumofsquaresbetweentreatments,SSA)与处理内平方和(sumofsquareswithintreatment,SSe)两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。处理间均方(处理均方,MSA

)处理内均方(误差均方,MSe

)第15页,共62页,2023年,2月20日,星期三总平方和的拆分第16页,共62页,2023年,2月20日,星期三第17页,共62页,2023年,2月20日,星期三三种平方和的简便计算公式如下:①等重复时:②不等重复时:第18页,共62页,2023年,2月20日,星期三在计算总平方和时,资料中的各个观察值要受这一条件约束,总自由度等于资料中观察值的总个数减1,即an-1。总自由度记为dfT,则

dfT=an-1

。在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即a-1。处理间自由度记为dfA,则dfA=a-1。总自由度的拆分第19页,共62页,2023年,2月20日,星期三在计算处理内平方和时,要受a个条件的约束,即,i=1,2,...a。故处理内自由度为资料中观察值的总个数减a,即an-a。处理内自由度记为dfe,则dfe=an-a=a(n-1)。因为

na-1=(a-1)+(na-a)=(a-1)+a(n-1)

所以dfT=dfA+dfe综合以上各式得:第20页,共62页,2023年,2月20日,星期三各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方(误差均方),分别记为:

MST(或ST2)、MSA(或SA2)和MSe(或Se2),即

MST=ST2=SST/dfT;MSt=St2=SSt/dft;MSe=Se2=SSe/dfe

注意:在方差分析中不涉及总均方的数值,所以一般不必计算;总均方一般不等于处理间均方加处理内均方。第21页,共62页,2023年,2月20日,星期三3.期望均方(expectedmeansquares

EMS)若A是B的无偏估计,则称B是A的数学期望。处理内均方MSe是误差方差2的无偏估计值,即2称为MSe

的数学期望。第22页,共62页,2023年,2月20日,星期三4.统计量当零假设成立时,处理效应的方差为零,亦即各处理观察值总体均数i(i=1,2,…,a)

相等时,处理间均方MSA与处理内均方一样,也是误差方差2的估计值。

方差分析就是通过MSA与MSe的比较来推断各处理平均数间差异的大小.

F=MSA/MSeF具有两个自由度:df1=dfA=a-1;df2=dfe=a(n-1)。第23页,共62页,2023年,2月20日,星期三查附表7:若F<,即P>0.05,不能否定H0,可认为各处理间差异不显著;若≤F<,即0.01<P≤0.05,否定H0,接受HA,认为各处理间差异显著,标记“*”

;若F≥

,即P≤0.01,否定H0,接受HA,认为各处理间差异极显著,标记“**”。第24页,共62页,2023年,2月20日,星期三【例10.2】

某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为两个不同的用中药组,A4、A5为两个不同的西药组。各组小白鼠的存活天数如表7—2所示。表10—2

用不同药物治疗腹水癌小白鼠的结果药物各小鼠存活天数(xij)合计xi.平均A11516151718816561

1319A2454250383921445796

9254A3303529313516025600

5152A4312820253013417956

3670A5403531323016828224

5710合计x..=75712413725105第25页,共62页,2023年,2月20日,星期三这是一个单因素试验,处理数a=5,重复数n=5。第一步:计算一级数据(见表);第二步:计算SSe、SSA、dfe

、dfA

矫正项C=x2../an总平方和处理间平方和

=248274-2291.96=1905.44处理内平方和SSe=SST-SSA=2183.04-1905.44=277.60第26页,共62页,2023年,2月20日,星期三总自由度dfT=an-1=25-1=24处理间自由度dfA=a-1=5-1=4处理内自由度dfe=dfT-dfA=24-4=20

处理间均方MSA=SSt/dfA=1905.44

/4=476.36

处理内均方MSe=SSe/dfe=

277.60

/20=13.88

第三步:提出假设零假设为:H0:各处理组小鼠存活天数差异不显著备择假设为:HA:各处理组小鼠存活天数差异显著第27页,共62页,2023年,2月20日,星期三第四步:计算统计量

F=MSA/MSe=476.36/13.88=34.32**第五步:查表根据df1=dft=4,df2=dfe=20查附表7,得F0.01(4,20)=4.43第六步:做出推断及生物学解释:

F>F0.01(4,20)=4.43,P<0.01。说明五个处理小白鼠存活天数差异极显著,用不同药物治疗小白鼠腹水癌的疗效是不同的。第28页,共62页,2023年,2月20日,星期三在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表。表10—3

例10.2资料的方差分析表变异来源平方和自由度均方F值处理间SSA

1905.44dfA

4MSA

476.3634.22**处理内SSe

277.60dfe

20MSe

13.88总变异SST2183.04

dfT

24F值应与相应的被检验因素齐行;在表的左下方注出显著水平α。第29页,共62页,2023年,2月20日,星期三应用举例:例4

调查了5个不同小麦品系的株高,结果见下表,问该5个小麦品系株高间的差异是否显著?株号品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5平均数65.364.467.370.868.6第30页,共62页,2023年,2月20日,星期三为了简化计算,将每一个原始数据均减去65,列成下表

株号品系IIIIIIIVV1-0.4-0.52.86.84.220.30.31.37.13.23-0.2-0.42.15.04.841.0-1.31.84.13.350.8-1.13.56.02.5总和xi·1.5-3.011.529.018.057.0xi·22.259.00132.25841.00324.001308.5Σxij21.933.429.43174.4668.06277.28第31页,共62页,2023年,2月20日,星期三1.提出假设:H0:HA:2.计算检验统计量F:

=147.32=131.74SSe

=SST-SSA

=15.58MSA=SSA/(a-1)=32.72MSe=SSe/(an-a)=0.78F=MSA/MSe=41.953.查附表3得:F4,20,0.05=2.87,F4,20,0.01=4.43。F>F4,20,0.01,拒绝H0,说明5个不同小麦品系的株高差异极显著。第32页,共62页,2023年,2月20日,星期三将以上结果列为方差分析表:

变差来源平方和自由度均方F处理间131.74432.7241.95**误差15.58200.78总和147.3224第33页,共62页,2023年,2月20日,星期三三、随机模型Randommodel:因素随机、效应不固定

是试验误差,相互独立,且服从正态分布不再为常数,且服从正态分布1.假设

随机模型的零假设为:备择假设为:

第34页,共62页,2023年,2月20日,星期三2.总平方和与总自由度的剖分:同固定模型3.数学期望:4.统计量F:注意:在做生物学解释时,固定模型中的结论只适用于检查的那几个因素水平;随机模型中的结论可推广到这一因素的各个水平第35页,共62页,2023年,2月20日,星期三四、多重比较(multiplecomparisons)(一)为什么要进行多重比较?

F值显著或极显著,否定了无效假Ho,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些没有显著差异。因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。第36页,共62页,2023年,2月20日,星期三(二)概念统计上把多个平均数两两间的相互比较称为多重比较。(三)常用的多重比较方法

多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。

1、最小显著差数法(LSD法,Leastsignificantdifference)

此法的基本原理是:在处理间F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其比较,作出结论。第37页,共62页,2023年,2月20日,星期三最小显著差数由下式计算:式中为在F检验中误差自由度下,显著水平为α的临界t值,均数差异标准误则下式算得。其中MSe为F检验中的误差均方,n为各处理内的重复数。第38页,共62页,2023年,2月20日,星期三显著水平取0.05和0.01时,从t值表查出代入,即可求得LSD0.05和LSD0.01利用LSD法进行多重比较时,步骤如下:列出平数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;计算最小显著差数LSD0.05和LSD0.01;将平均数多重比较表中两两平均数的差数与计算出的LSD0.05

、LSD0.01

比较,作出统计推断。第39页,共62页,2023年,2月20日,星期三

【例10.2】dfe=20,n=5,MSe=13.88查t值表得t0.05(dfe)=t0.05(20)=2.086,t0.01(dfe)=t0.01(20)=2.845

所以显著水平为0.05与0.01的最小的显著差数为:

表10-4五个处理小鼠平均存活天数多重比较表(LSD法))处理平均数

-16.2

-26.8

-32.0

-33.6A542.826.6**16.0**10.8**9.2**A433.617.4**6.8**1.6A332.015.8**5.2*A226.810.6**A116.2第40页,共62页,2023年,2月20日,星期三将表10—4中的10个差数与LSD0.05

、LSD0.01比较:小于LSD0.05者不显著;介于LSD0.05与LSD0.01之间者显著,标记“*”;大于LSD0.01者极显著,标记“**”。检验结果除差数1.6不显著、5.2显著外,其余各差数极显著。表明所用的药物不论中西药对小白鼠腹水癌都有一定疗效,除中药A3与西药A4的疗效差异不显著外,其余药物间的疗效都有显著或极显著差异。第41页,共62页,2023年,2月20日,星期三说明:

LSD实质上就是t检验法:它是将t检验中由所求得的t的绝对值与临界值的比较转化为将各对均数差值的绝对值与最小显著差数的比较,从而做出统计推断的.第42页,共62页,2023年,2月20日,星期三2、最小显著极差法(LSR法,Leastsignificantranges)LSR

法的特点:把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差。因此,若有k个平均数相互比较,就有k-1种秩次距(k,k-1,k-2,…,2),因而需求得k-1

个最小显著极差R(α,k

),以作为判断各秩次距(k)平均数的极差是否显著的标准。第43页,共62页,2023年,2月20日,星期三常用的LSR法为Duncan法。检验步骤:列出平均数多重比较表;由自由度dfe、秩次距k查“多重比较中的Duncan表”(附表7),计算最小显著极差R0.05,k

和R0.01,k

;将平均数多重比较表中的各极差与相应的最小显著极差R0.05,k

和R0.01,k比较,作出统计推断。第44页,共62页,2023年,2月20日,星期三对于【例10.1】,已算出=1.67,依dfe=20,k=2,3,4,5,由附表6查临界r0.05(20,k)和r0.01(20,k)值,乘以,求得各最小显著极差。所得结果列于表10—5。表10—5r值与R值dfe秩次距kr0.05r0.01R0.05R0.012022.954.024.96.733.104.225.27.043.184.335.37.253.254.405.47.3第45页,共62页,2023年,2月20日,星期三处理平均数-16.2

-26.8

-32.0

-33.6A542.826.0**16.0**10.8**9.2**A433.617.4**6.8*1.6nsA332.015.8**5.2*A226.810.6**A116.2

表10-6五个处理小鼠平均存活天数多重比较表(Duncan

法))第46页,共62页,2023年,2月20日,星期三五、基本假定①效应的可加性(additivity)②分布的正态性(normality)③方差的同质性(homogeneity)第47页,共62页,2023年,2月20日,星期三方差分析的基本步骤1.计算各项平方和与自由度。2.列出方差分析表,进行F检验。3.若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法)。第二节单因素方差分析的基本步骤第48页,共62页,2023年,2月20日,星期三一、各处理重复数相等的方差分析【例10.2】

为了研究小白鼠患白血病后脾组织中DNA含量的变化,测定四组,每组各8只(即a=4,n=8)小白鼠脾组织中DNA的含量;第1组为正常脾,第2组为患自发性白血病的脾;第3组为患移植性白血病AK4的脾;第4组为患移植性白血病9421的脾。测定结果见表10—7。试检验各组DNA含量差异是否显著。第49页,共62页,2023年,2月20日,星期三表10—7四组小白鼠脾组织中DNA含量1.

计算各项平方和与自由度

C=x2../an=398.12/(4×8)=4952.61组别DNA含量(mg/g)xi.xi.2112.313.213.715.215.816.917.315.4119.814.981815.9614352.04210.811.612.312.713.513.514.813.6102.812.851332.2810567.843

9.310.311.111.711.712.012.312.490.811.351038.628244.644

9.510.310.510.510.510.911.011.584.710.59899.157174.09合计x..=398.1

5086.0140338.61第50页,共62页,2023年,2月20日,星期三

SSe=SST–SSA=133.40-89.72=43.68dfT=an-1=4×8-1=31dfA=a-1=4-1=3dfe=dfT-dfA=31-3=28

2.

列出方差分析表,进行F检验,见表(10—8)。表10—8

四组小白鼠脾中DNA含量方差分析表变异来源平方和自由度均方F值组间89.72329.9119.17**组内43.68281.56总变异133.4031第51页,共62页,2023年,2月20日,星期三根据df1=dfA=3,df2=dfe=28查临界F值得:

F0.05(3,28)=2.95,F0.01(3,28)=4.57

因为F>F0.01(3,28),即P<0.01,表明处理间DNA含量的差异达到1%显著水平。3.

多重比较采用Duncan法。各处理平均数多重比较表,见表10—9。因为MSe=1.56,n=8,所以根据dfe=28,秩次距k=2,3,4由附表9查出α=0.05和α=0.01的各临界r值,各r值乘以,即得各最小显著极差。所得结果列于表10—9。第52页,共62页,2023年,2月20日,星期三

表10—9

r值及LSR值表10—10

各组DNA含量平均数多重比较表(Duncun法)dfe秩次距kr0.05r0.01R0.05R0.012822.903.911.2821.72833.044.081.34421.80343.134.181.38331.848组别平均数

-10.59

-11.35

-12.85114.984.39**3.63**2.13**212.852.26**1.50*311.350.76410.59第53页,共62页,2023年,2月20日,星期三检验结果表明:

正常脾中DNA含量极显著高于患有各类白血病脾中DNA含量;患自发性白血病脾中DNA含量极显著高于患移植性白血病9421,显著高于患移植性白血病AK4;第三组第四组之间差异不显著。四组中以正常脾DNA含量最高,第二组次之,第三、四组最低。也就是说各类白血病都将导致小白鼠脾中DNA含量明显降低。组别平均数

4

3

2114.984.39**3.63**2.13**212.852.26**1.50*311.350.76410.59第54页,共62页,2023年,2月20日,星期三二、各处理重复数不相等的方差分析这种情况下方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。设处理数为a;各处理重复数为n1,n2,…,na

;试验观察值总数为N=Σni。则第55页,共62页,2023年,2月20日,星期三【例10.3】五个不同品种猪的育肥试验,30天后增重(kg)如表10—11所示。试比较品种间增重有无差异。表10—11五个品种猪30天增重品种增重(kg)nixi.xi.2/niB121.519.520.022.018.020.06121.02440.1720.22450.5B216.018.517.015.520.016.06103.01768.1717.21783.5B319.017.520.018.017.059

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论