第10章-单因素方差分析_第1页
第10章-单因素方差分析_第2页
第10章-单因素方差分析_第3页
第10章-单因素方差分析_第4页
第10章-单因素方差分析_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章单因素方差分析One-factoranalysisofvariance用6种培养液培养红苜蓿,每一种培养液做5次重复,测定5盆苜蓿的含氮量,结果如下表(单位:mg).问用6种不同培养液培养的红苜蓿含氮量差异是否显著?盆号培养方法ⅠⅡⅢⅣⅤⅥ1234519.432.627.032.133.017.724.827.925.224.317.019.49.111.915.820.721.020.518.818.614.314.411.811.614.217.319.419.116.920.8方差分析(analysisofvariance-ANOVA)

是由英国统计学家R.A.Fisher于1923年提出的。方差分析是一种特殊的假设检验,是用来判断多组数据之间平均数差异显著性的.

它不同于t检验之处在于:它把所有数据放在一起,一次比较就对所有各组间是否有差异做出判断,如果没有显著性差异,则认为各组平均数相同;如果发现有差异,再进一步比较是哪组数据与其它数据不同.在多组数据的平均数之间做比较时,可以在平均数的所有对之间做t检验,但这样做会提高犯I型错误的概率,因而是不可取的。方差分析可以防止该问题的出现。如对5个平均数进行检验,若做t检验,则需做10次,假设每一次检验接受零假设的概率为0.95,那么10次都接受零假设的概率为(0.95)10=0.60,(至少有1次)拒绝零假设的概率为0.40,犯I型错误的概率明显平加方差分析中常用基本概念(一)试验指标(experimentalindex)

为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。(二)试验因素

(experimentalfactor)

试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;

若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。按是否可控制因素可分为:固定因素和随机因素.

固定因素:可准确控制且其水平固定后效应也固定,比如:温度、化学药物浓度等.随机因素:因素水平不能严格控制或者说即使其水平可控制但其效应也不固定.比如:动物的窝别、农家肥的效果等.试验因素常用大写字母A、B、C、…等表示。(三)因素水平(leveloffactor)试验因素所处的某些特定状态或数量等级称为因素水平,简称水平。比如:不同的温度;溶液不同浓度等.(四)重复

(repeat)

在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。第一节单因素方差分析的基本原理一、线性模型二、固定线性模型三、随机线性模型四、多重比较五、基本假定(一)线性模型

假设某单因素试验有a个处理,每个处理有n次重复,共有na个观测值。这类试验资料的数据模式如表7-1所示。一、线性模型表7-1单因素方差分析的典型数据模式X1X2X3…

Xi…

Xa合计1χ11χ21χ31χi1χa12χ12χ22χ32χi2χa23χ13χ23χ33χi3χa3………………jχ1jχ2jχ3jχij

χajnχ1nχ2nχ3nχinχan合计平均数总体均数处理效应符号文字表述an因素水平数每一水平的重复数第i水平的第j次观察值第i水平所有观察值的和第i水平均值全部观察值的和总平均值第i水平上的子样方差各处理总和、平均数、大总和、总平均数是计算的一级数据,在本章我们采用了黑点符号体系法表示,要注意熟悉和掌握。可以分解为

表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,

其中μ表示全试验观测值的总体平均数(overallmean),是第i个处理的效应(treatmenteffect),表示处理i对试验结果产生的影响。是试验误差,相互独立,且服从正态分布N(0,σ2)。上式就称为单因素试验的线性统计模型(linearstatisticalmodel)亦称数学模型。

方差分析的目的就是要检验处理效应的大小和有无。(二)方差分析的基本思路

将总的变差分解为构成总变差的各个部分。即将a个处理的观测值作为一个整体看待,把观察值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源的总体方差估计值;通过这些估计值的适当比值,就能检验各样本所属总体均值是否相等。

方差分析实质上是关于观测值变异原因的数量分析。二固定模型fixedmodel:

因素固定、效应也固定反应到线性模型中即为常数.可要求1.假设

固定模型的零假设为:备择假设为:

故an个观察值的总变异可分解为处理间的变异和处理内的变异两部分。全部观察值的总变异可以用总均方来度量,处理间变异和处理内变异分别用处理间均方和处理内均方来度量。

2.平方和与自由度的剖分总均方的拆分是通过将总均方的分子──称为总离均差平方和,简称为总平方和(totalsumofsquares,SST),剖分成处理间平方和(sumofsquaresbetweentreatments,SSA)与处理内平方和(sumofsquareswithintreatment,SSe)两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。处理间均方(处理均方,MSA)处理内均方(误差均方,MSe)总平方和的拆分三种平方和的简便计算公式如下:①等重复时:②不等重复时:

在计算总平方和时,资料中的各个观察值要受这一条件约束,总自由度等于资料中观察值的总个数减1,即an-1。总自由度记为dfT,则

dfT=an-1。

在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即a-1。处理间自由度记为dfA,则dfA=a-1。总自由度的拆分

在计算处理内平方和时,要受a个条件的约束,即,i=1,2,...a。故处理内自由度为资料中观察值的总个数减a,即an-a。处理内自由度记为dfe,则dfe=an-a=a(n-1)。因为na-1=(a-1)+(na-a)=(a-1)+a(n-1)所以dfT=dfA+dfe综合以上各式得:各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方(误差均方),分别记为:MST(或ST2)、MSA(或SA2)和MSe(或Se2),即

MST=ST2=SST/dfT;MSt=St2=SSt/dft;MSe=Se2=SSe/dfe

注意:

在方差分析中不涉及总均方的数值,所以一般不必计算;

总均方一般不等于处理间均方加处理内均方。3.期望均方(expectedmeansquares

EMS)若A是B的无偏估计,则称B是A的数学期望。处理内均方MSe是误差方差

2的无偏估计值,即

2称为MSe的数学期望。4.统计量当零假设成立时,处理效应的方差为零,亦即各处理观察值总体均数

i(i=1,2,…,a)相等时,处理间均方MSA与处理内均方一样,也是误差方差

2的估计值。

方差分析就是通过MSA与MSe的比较来推断各处理平均数间差异的大小.F=MSA/MSeF具有两个自由度:df1=dfA=a-1;df2=dfe=a(n-1)。查附表7:

若F<,即P>0.05,不能否定H0,可认为各处理间差异不显著;

若≤F<,即0.01<P≤0.05,否定H0,接受HA,认为各处理间差异显著,标记“*”;

若F≥,即P≤0.01,否定H0,接受HA,认为各处理间差异极显著,标记“**”。【例10.2】某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为两个不同的用中药组,A4、A5为两个不同的西药组。各组小白鼠的存活天数如表7—2所示。表10—2用不同药物治疗腹水癌小白鼠的结果药物各小鼠存活天数(xij)合计xi.平均A11516151718816561

1319A24542503839214457969254A33035293135160256005152A43128202530134179563670A54035313230168282245710合计x..=75712413725105这是一个单因素试验,处理数a=5,重复数n=5。第一步:计算一级数据(见表);第二步:计算SSe、SSA、dfe

、dfA矫正项C=x2../an总平方和处理间平方和=248274-2291.96=1905.44处理内平方和SSe=SST-SSA=2183.04-1905.44=277.60总自由度dfT=an-1=25-1=24处理间自由度dfA=a-1=5-1=4处理内自由度dfe=dfT-dfA=24-4=20

处理间均方MSA=SSt/dfA=1905.44

/4=476.36

处理内均方MSe=SSe/dfe=

277.60

/20=13.88

第三步:提出假设零假设为:H0:各处理组小鼠存活天数差异不显著备择假设为:HA:各处理组小鼠存活天数差异显著第四步:计算统计量

F=MSA/MSe=476.36/13.88=34.32**第五步:查表根据df1=dft=4,df2=dfe=20查附表7,得F0.01(4,20)=4.43第六步:做出推断及生物学解释:F>F0.01(4,20)=4.43,P<0.01。说明五个处理小白鼠存活天数差异极显著,用不同药物治疗小白鼠腹水癌的疗效是不同的。在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表。表10—3例10.2资料的方差分析表变异来源平方和自由度均方F值处理间SSA

1905.44dfA

4MSA

476.3634.22**处理内SSe

277.60dfe

20MSe

13.88总变异SST2183.04

dfT

24F值应与相应的被检验因素齐行;在表的左下方注出显著水平α。应用举例:例4调查了5个不同小麦品系的株高,结果见下表,问该5个小麦品系株高间的差异是否显著?株号品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5平均数65.364.467.370.868.6为了简化计算,将每一个原始数据均减去65,列成下表

株号品系IIIIIIIVV1-0.4-0.52.86.84.220.30.31.37.13.23-0.2-0.42.15.04.841.0-1.31.84.13.350.8-1.13.56.02.5总和xi·1.5-3.011.529.018.057.0xi·22.259.00132.25841.00324.001308.5Σxij21.933.429.43174.4668.06277.281.提出假设:H0:HA:2.计算检验统计量F:=147.32=131.74SSe=SST-SSA=15.58MSA=SSA/(a-1)=32.72MSe=SSe/(an-a)=0.78F=MSA/MSe=41.953.查附表3得:F4,20,0.05=2.87,F4,20,0.01=4.43。F>F4,20,0.01,拒绝H0,说明5个不同小麦品系的株高差异极显著。将以上结果列为方差分析表:

变差来源平方和自由度均方F处理间131.74432.7241.95**误差15.58200.78总和147.3224三、随机模型Randommodel:因素随机、效应不固定

是试验误差,相互独立,且服从正态分布不再为常数,且服从正态分布1.假设

随机模型的零假设为:备择假设为:

2.总平方和与总自由度的剖分:同固定模型3.数学期望:4.统计量F:注意:在做生物学解释时,固定模型中的结论只适用于检查的那几个因素水平;随机模型中的结论可推广到这一因素的各个水平四、多重比较(multiplecomparisons)(一)为什么要进行多重比较?

F值显著或极显著,否定了无效假Ho,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些没有显著差异。因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。(二)概念统计上把多个平均数两两间的相互比较称为多重比较。(三)常用的多重比较方法

多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。

1、最小显著差数法(LSD法,Leastsignificantdifference)

此法的基本原理是:在处理间F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其比较,作出结论。最小显著差数由下式计算:式中为在F检验中误差自由度下,显著水平为α的临界t值,均数差异标准误则下式算得。其中MSe为F检验中的误差均方,n为各处理内的重复数。显著水平取0.05和0.01时,从t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论