第2章方差分析_第1页
第2章方差分析_第2页
第2章方差分析_第3页
第2章方差分析_第4页
第2章方差分析_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 方差分析2.1 概述方差分析(analysis of variance)是数理统计的基本方法之一,是分析试验数据的一种有效工具。方差分析是在20世纪20年代初由英国统计学家费歇尔(R.A.Fisher)所创,最早用于生物学和农业实验,后在工业生产和科学研究中的许多领域广泛应用,取得良好的效果。一、方差分析的必要性在第1章中,我们已经讨论了两个正态总体均值相等的假设检验问题。但在实际生产中,经常遇到检验多个正态总体均值是否相等的问题。例2-1 以淀粉为原料生产葡萄糖的过程中,残留有许多糖蜜,可作为生产酱色的原料。在生产酱色之前应尽可能彻底除杂,以保证酱色质量。为此,对除杂方法进行选择。在

2、试验中选用五种不同的除杂方法,每种方法做四次试验,即重复四次,结果见表2-1。表2-1 不同除杂方法的除杂量(g/kg)除杂方法(Ai)除杂量(xij)平均()A125.622.228.029.826.4A224.430.029.027.527.7A325.027.723.032.227.0A428.828.031.525.928.6A520.621.222.021.221.3本试验的目的是判断不同的除杂方法对除杂量是否有显著影响,以便确定最佳除杂方法。我们可以认为,同一除杂方法重复试验得到的4个数据的差异是由随机误差造成的,而随机误差常常是服从正态分布的,这时除杂量应该有一个理论上的均值。而

3、对不同的除杂方法,除杂量应该有不同的均值。这种均值之间的差异是由于除杂方法的不同造成的。于是我们可以认为,五种除杂方法所得数据是来自五个均值不同的五个正态总体,且由于试验中其它条件相对稳定,因而可以认为每个总体的方差是相等的,即五个总体具有方差齐性。这样,判断除杂方法对除杂效果是否有显著影响的问题,就转化为检验五个具有相同方差的正态总体均值是否相同的问题了,即检验假设H0: 1=2=3=4=5对于这种多个总体样本均值的假设检验,第1章介绍的方法不再适用,须采用方差分析方法。二、方差分析的基本思想方差分析的实质就是检验多个正态总体均值是否相等。那么,如何检验呢?从表2-1可见,20个试验数据(除

4、杂量)是参差不齐的。数据波动的可能原因来自两个方面:一是由于因素的水平(即除杂方法)不同造成的,事实上,5种除杂方法下的数据平均值之间确实有差异;二是偶然失误造成的。从表中数据可见,每一种除杂方法下的4个数据虽然是相同条件下的试验结果,但仍然存在差异。这是由于试验中存在的偶然因素(如环境、原材料成分、测试技术等的微小而又随机的变化)引起的。我们把由因素的水平变化引起的试验数据波动称为条件误差;把由随机因素引起的试验数据波动称为随机误差或试验误差。方差分析的中心要点是:把实验数据的总波动分解为两部分,一部分反映由条件误差变化引起的波动;另一部分反映由实验误差引起的波动。即把数据的总偏差平方和分解

5、为反映必然性的各个因素的偏差平方和(SA、SB)与反映偶然性的误差偏差平方和(Se),并计算它们的平均偏差平方和,再将二者进行比较,借助F检验法,检验假设H0:,从而确定因素对试验结果的影响是否显著。换言之,找出对试验数据起决定性影响的因素(即显著性或高度显著性因素)作为进行定量分析判断的依据。2.2 单因素实验的方差分析一、问题的提出 在进行一项实验中,如果只有一个因素在改变,而其他因素保持固定不变,就被称为单因素实验。因素变化所划分的等级(或条件)叫做水平(level),对每个水平都要进行若干次重复实验,通常当作一个样本来看待,称为一个“处理”(treatment). 为了便于讨论,我们先

6、给出单因素方差分析的一般提法:设实验所考察的因素A有m个水平:A1,A2,Am,在每个水平上重复进行r次实验,每次实验的可能结果都是一个随机变量。同一条件下的r次重复实验的可能结果是同一总体的一个样本。设水平的第j次实验值为xij(i1,2,m;j1,2,r),可得实验数据及计算表的模式如下:表2-2 单因素试验数据及计算表(水平重复数相等)水平重复试验序号xi.1 2 j rA1A2AiAm x1.x2.xi.xm.总和 表中(,)就是的一个容量为r的样本。对应于m个总体,有m个这样的样本值。试验之后就得到m个样本值。问题就是要根据这m个样本值,分析试验条件的变化对所考察的指标有无显著影响。

7、实际上,就是要考察m个总体的数学期望有无显著差异,因而这是一个假设检验的问题。在表2-2中, ,二、单因素方差分析的前提条件单因素方差分析是建立在下述假设的基础上的:1、每一水平上的实验结果是一个随机变量(i为第i个水平,j为第j次试验),且服从正态分布。(,)是第i个水平的正态总体中抽出的一个简单随机样本,样本容量为r。2、所有m个不同水平对应的m个正态总体的方差是相等的,即具有方差齐性。N(,)3、m个总体相互独立,样本与样本之间也相互独立,要检验的假设是:H0:1=2=若拒绝H0,则认为至少两个水平之间的差异是显著的,因素A对实验结果有显著影响;反之,若接受原假设,则认为因素A对试验结果

8、无显著影响,试验结果在各水平之间的不同仅仅是由于随机因素引起的。三、单因素方差分析的一般步骤1. 偏差平方和的分解把整个试验结果所得的每一观测值xij对其总平均值的偏差进行平方并求总和,就是总的偏差平方和,用ST表示,它反映了全部观测值间的总的差异情况。ST= (2-1)将式(2-1)进行分解ST= 其中 又 ST= (2-2) 令 SA (2-3)它表示各水平(条件)下的平均数与总平均数的偏差平方和,反映了因素A的水平变化所引起的波动,称为组间偏差平方和或因素平方和。令 (2-4)它表示各条件(水平)下的试验值与该条件下的平均值之偏差的平方和。反映了随机误差引起的波动,称为组内偏差平方和或误

9、差平方和。 ST = SA + Se (2-5)这样,我们就将总的偏差平方和分解为组间偏差平方和与组内偏差平方和之和。2. 偏差平方和的简化计算为计算方便,在实际运算中,常用下列简便算法求ST、SA和Se。ST= 令 QT CT=则有 ST = QT - CT (2-7)式中:数据总和 CT修正项n数据总个数 n=mrm水平数, r每一水平重复试验次数QT各数据平方之和同理:令 QA则 SA = QA CT (2-8)一般先求出ST和SA,然后再利用Se = ST SA (2-9)求出Se。计算可在表2-2所示得数据计算表上进行。3. 方差(平均偏差平方和)与自由度 偏差平方和的大小,与参加求

10、和的项数有关,为了比较SA与Se的大小,应消除求和项数的影响,用它们的平均值进行比较。由理论推导可知,SA与Se的平均值,不是把SA和Se 分别除以相应的参与求和的项数,而应除以它们的自由度。ST、SA、Se的自由度分别用fT、fA和fe表示.经理论分析可知:fT=mr-1=n-1fA =m-1fe=mr-m=n-m显然,有 fTfAfe (210)上式为偏差平方和自由度分解公式。因为总自由度 fT=n-1是总的数据个数减1,而组间自由度fAm1是因素的水平数减1,都很好计算。所以一般先求出fT和fA,然后再利用fefT(组内自由度)fA(组间自由度) (2-11)求出组内自由度fe。 偏差平

11、方和与相应的自由度之比称为平均偏差平方和,简称为均方和或均方或方差, 方差均方均方和偏差平方和/自由度=平均偏差平方和因此,组间方差VA和组内方差Ve分别为组间方差VA=SA/fA (2-12)组内方差Ve= Se/fe (2-13)4. 用F检验法进行显著性检验若假设H0为真,即1=2=m那么全体样本可看作来自同一正态总体N(,2)。此时可证明ST/fT, SA/fA和Se/fe均为总体方差2的无偏估计值,所以比值F=VA/Ve应接近于1,即各平均数之间不存在条件误差,纯属试验误差或随机误差。如果F值比1大得多,即VA显著地大于Ve ,就有理由认为原假设不成立,表明SA中不仅包括随机误差,而

12、且包括因素A的水平波动引起的数据波动(称为因素误差),即因素A对试验结果影响显著。这种比较方差大小来判断原假设H0是否成立的方法,就是“方差分析”名称的由来。由前面的讨论可知,只要知道此值F的概率分布,就可以用它作为检验假设的统计量。事实上,可以证明:当原假设H0成立时,SA和Se分别为自由度(m-1)和(n-m)的c2 变量,从而统计量F服从自由度f1=m-1和f2=n-m的分布。于是对给定的显著水平,可查F分布表求得临界值F,使P(F>F)=。若由样本值求得FF,则认为原假设H0成立,即认为条件的改变对指标无显著影响;若F>F,则否定原假设H0,即认为因素A的改变对指标有显著影

13、响。关于值的选取,视具体情况而定,通常取0.01或0.05,从F分布表查出F0.01和F0.05。若F>F0.01,判定因素A对指标影响特别显著。称“某因素高度显著”,在方差分析表的“显著性”栏中记“*”;若F0.05<F<F0.01,判定因素A对指标的影响显著,称“某因素显著”,记为“*”;若FF0.05,则判定因素A对指标无显著性影响称“某因素不显著”,不作标记。5. 制定方差分析表由以上讨论可知,方差分析的步骤基本上就是假设检验的步骤,特殊的只是检验用的统计量是由两个平均偏差平方和之比构成。这两个偏差平方和分别表示条件误差与试验误差,它们是由总的偏差平方和分解出来的。因

14、此,在具体进行方差分析时,主要就是要计算这些偏差平方和。由于计算过程较繁,一般把计算结果列成简明的方差分析表,其格式如表2-3所示。表2-3 方差分析表方差来源偏差平方和自由度方差F值F显著性因素A(组间)误差e(组内)SASefAfeVAVeF=VA/Ve查表F0.05F0.01总 和STfT四、单因素方差分析实例 现在仍以例2-1的试验数据为例,说明单因素方差分析的步骤,表2-1数据的计算表见表2-4。例:2-1 五种除杂方法 废糖蜜利用解:1.计算偏差平方和及自由度=CT=(13707.85)=,如:= =25.6+22.2+28.0+29.8=105.6QT=ST=QT-CT=1395

15、4.72-13707.85=246.87fT =mr-1=4×5-119QA=SA=QA-CT=13839.81-13707.85=131.96fA =m-1=5-1=4 fe=n-m=20-5=15或fe=fT-fA=19-4=15Se=ST-SA=246.87-131.96114.912.计算方差和F值VA=SA/fA=131.96/4=32.99Ve=Se/fe=114.9/15=7.66F=VA/Ve=32.99/7.66=4.313.查F值 FF(fA, fe)F0.05(4,15)=3.06, F0.01(4,15)=4.894.列出方差分析表表2-5 方差分析表方差来源

16、偏差平方和自由度方差F值F显著性因素A(组间)误差e(组内)SA=131.96Se=114.91fA=4fe=15VA=32.99Ve=7.664.31查表F0.05(4,15)3.06F0.01(4,15)4.89*总 和ST=246.87fT=19由于F0.05(4,15)<F=4.31<F0.01(4,15)故拒绝原假设H0,即不同除杂方法对除杂效果有显著影响。2.3 双因素试验的方差分析 上面讨论了单因素试验的方差分析,即考虑一个因素对试验结果是否有显著影响的问题,但在实际中,影响实验结果的因素往往不只一个而是多个,这时要分析多个因素的作用。若同时考虑两个因素对试验结果的影

17、响,就要对两个因素试验进行方差分析,称双因素试验的方差分析。对于双因素试验的方差分析,其基本思想和方法与单因素试验的方差分析相似,关键在于如何把总的偏差平方和进行分解。前提条件仍然是要满足相互独立、方差齐性和正态分布三个条件。所不同的是,在双因素试验中,有可能出现交互作用。一、双因素无重复试验的方差分析1. 问题的一般提法某项试验要同时考察因素A和B对试验结果的影响,因素A取A1, A2, Aa 共 a个水平,因素B取B1, B2 ,Bb 共 b个水平。A和B两因素的每种水平搭配AiBj各进行一次独立试验,共进行a×bn次试验,试验数据为xij,这n个试验数据如表2-7所示。水平搭配

18、 共进行a×b=n次试验表2-7 双因素无重复试验数据及计算表因素A因素BB1 B2 Bj Bbxi.A1A2AiAax11 x12 x1j x1bx21 x22 x2j x2bxi1 xi2 xij xibxa1 xa2 xaj xabx1.x2.xi.xa.x.jx.1 x.2 x.j x.b x.表中行求和: (i1,2,a)行平均数:列求和: (j1,2,b)列平均数:总数据和:总平均数:=x./ab=x./n n=ab要求分别检验A、B两因素对试验结果有无显著影响,即检验假设:H01:因素A 无显著影响H02:因素B无显著影响2. 双因素无重复试验方差分析步骤(1) 偏差平方和的分解为了构造检验用的统计量,与单因素方差分析一样,先对偏差平方和进行分解。ST=不难证明,后三项交叉积均为零,例如(又)ST=令SA= SA为因素A各水平间(即各行间)的偏差平方和,反映了因素A对试验结果的影响;令SB= SB为因素B各水平间(即各列间)的偏差平方和,反映了因素B对试验结果的影响;Se=Se为误差的偏差平方和,即组内偏差平方和,反映了试验误差的大小。因此,是(2-15)可简记为ST=SASB +Se (2-16)(2)偏差平方和的简化计算 ST=SA+SB+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论