精品课件《方差分析》_第1页
精品课件《方差分析》_第2页
精品课件《方差分析》_第3页
精品课件《方差分析》_第4页
精品课件《方差分析》_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

方差分析

§8.1

方差分析§8.2

多重比较§8.3

方差齐性分析

§8.1

方差分析8.1.1

问题的提出

实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。

方差分析是统计检验的一种。由英国著名统计学家:

R.A.FISHER推导出来的,也叫F检验。

方差分析简述方差分析主要用来检验两个以上总体均值差异的显著程度。对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,方差分析是非常有用的。本章在讨论方差分析基本原理的基础上,重点介绍单因子试验方差分析法、多重比较及方差齐性检验。在此之前,先介绍几个常用术语。1、试验指标(experimentalindex):

为了衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产奶量、产蛋率、瘦肉率等。在农业试验中常用的试验指标是产量等2、试验因子(experimentalfactor):试验中所研究的影响试验指标的因素叫试验因子。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因子来考虑。又如在农业试验中,作物的品种,化肥的品种,土地肥沃程度的等级都对作物的产量有影响,可作为试验中感兴趣的因子。当试验中考察的因子只有一个时,称为单因子试验;若同时研究两个或两个以上因子对试验指标的影响时,则称为两因子或多因子试验。试验因子常用大写字母A、B、C、…等表示。3、因子水平(leveloffactor)

试验因子所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因子的3个水平;研究某种饲料中4种不同能量水平对肥猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因子的4个水平。因子水平用代表该因子的字母加添足标1,2,…,来表示。如A1、A2、…,B1、B2、…,等。例8.1.1

某大型集团公司的销售主管想比较五种不同的推销方法有无显著的效果差异。在条件基本相同且无销售经验的人员中选取若干名,分成五组分别进行不同销售方法的培训。培训后观察他们在一个月内的销售额列于下表:方法方法1方法2方法3方法4方法5销售额20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2

在例8.1.1中的试验指标为销售额,销售方法为因子,5种不同的方法代表5种不同的水平。这是一项单因子试验,试验的目的是了解不同销售方法水平对销售额有无显著影响。

通常,在单因子试验中,记因子为A,设其有r个水平,记为A1,A2,…,Ar.在每一水平下考察的指标可以看成一个总体,现有r个水平,故有r个总体.8.1.2单因子方差分析的统计模型假定:每一总体均为正态总体,记为N(i

,

i2),

i=1,2,…,r;各总体的方差相同:1

2=22=…=

r2=

2

;从每一总体中抽取的样本是相互独立的,即所有的试验结果yij

都相互独立。

比较各水平下的均值是否相同,即对如下的一个假设进行检验:H0

:1=2=…=r

(8.1.1)

备择假设为H1

:1,2,…,r

不全相等在不会引起误解的情况下,H1通常可省略不写。如果H0成立,因子A的r个水平均值相同,称因子A的r个水平间没有显著差异,简称因子A不显著;反之,当H0不成立时,因子A的r个水平均值不全相同,这时称因子A的不同水平间有显著差异,简称因子A显著。

设从第i个水平下的总体获得m个试验结果,记yij

表示第i个总体的第j次重复试验结果。共得如下n=rm个试验结果:yij,

i=1,2,…,r,j=1,2,…,m,

其中r为水平数,m为重复数,i为水平编号,j为重复编号。在水平Ai下的试验结果yij与该水平下的指标均值i一般总是有差距的,记ij

=yiji,ij

称为随机误差。于是有

yij

=

i+ij

(8.1.2)(8.1.2)式称为试验结果yij

的数据结构式。

单因子方差分析的统计模型:(8.1.3)

总均值与效应:

称诸i的平均为总均值.

称第i水平下的均值i与总均值

的差:

ai=i-为Ai的效应。

模型(8.1.3)可以改写为

(8.1.8)

假设(8.1.1)可改写为

H0

:a1

=a2=…=ar=0(8.1.9)

一、试验数据表

表8.1.2

单因子方差分析试验数据

因子水平

试验数据

平均

A1y11

y12

y1mT1A2y21

y22

y2mT2┆┆┆┆Aryr1

yr2

yrmTrT8.1.3平方和分解

表8.1.2中的最后二列的和与平均的含义如下:

数据间是有差异的。数据yij与总平均间的偏差可用yij

表示,它可分解为二个偏差之和(8.1.10)记二、组内偏差与组间偏差

由于(8.1.11)所以

仅反映组内数据与组内平均的随机误差,称为组内偏差;而(8.1.12)除了反映随机误差外,还反映了第i个水平的效应,称为组间偏差。在统计学中,把k个数据y1,y2,…,yk分别对其均值=(y1+…+yk

)/k的偏差平方和称为k个数据的偏差平方和,它常用来度量若干个数据分散的程度。三、偏差平方和及其自由度在构成偏差平方和Q的k个偏差y1

,…,yk

间有一个恒等式,这说明在Q中独立的偏差只有k1个。在统计学中把平方和中独立偏差个数称为该平方和的自由度,常记为f,如Q的自由度为fQ=k1。自由度是偏差平方和的一个重要参数。

各yij间总的差异大小可用总偏差平方和

表示,其自由度为fT=n1;

四、总平方和分解公式

仅由随机误差引起的数据间的差异可以用

组内偏差平方和

表示,也称为误差偏差平方和,其自由度为fe=nr;由于组间差异除了随机误差外,还反映了效应间的差异,故由效应不同引起的数据差异可用组间偏差平方和

表示,也称为因子A的偏差平方和,其自由度为fA=r1;

定理8.1.1

在上述符号下,总平方和ST可以分解为因子平方和SA与误差平方和Se之和,其自由度也有相应分解公式,具体为:

ST=SA+Se,fT=fA+fe

(8.1.16)(8.1.16)式通常称为总平方和分解式。

偏差平方和Q的大小与自由度有关.为了便于在偏差平方和间进行比较,统计上引入了均方和的概念,它定义为MS=Q/fQ

,其意为平均每个自由度上有多少平方和,它比较好地度量了一组数据的离散程度。如今要对因子平方和SA与误差平方和Se之间进行比较,用其均方和MSA=SA

/fA

,MSe=Se

/fe

进行比较,故用作为检验H0的统计量。8.1.4检验方法定理8.1.2

在单因子方差分析模型(8.1.8)及前述符号下,有

(1)Se/

2~

2(nr),从而E(Se)

=(nr)

2

,进一步,若H0成立,则有SA/

2~

2(r1)(2)SA与Se独立。

由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1(fA

,fe)},通常将上述计算过程列成一张表格,称为方差分析表。表8.1.3单因子方差分析表来源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe误差Sefe=nrMSe=Se/fe总和STfT=n1对给定的,可作如下判断:

若F

F1(fA

,fe)

,则说明因子A不显著。该检验的p值也可利用统计软件求出,若以Y记服从F(fA

,fe)的随机变量,则检验的

p值为p=P(YF)。

如果F>F1(fA

,fe),则认为因子A显著;常用的各偏差平方和的计算公式如下:

(8.1.19)

一般可将计算过程列表进行。

例8.1.1(续)对例8.1.1中的假设进行检验方法方法1方法2方法3方法4方法5合计销售额20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2Ti149172.1143.9127.6193.3T=785.9Ti2/m3171.574231.202958.172325.975337.8418024.75平方和

3243.304325.253030.992334.445365.9918295.74

算得各偏差平方和为:n=35,T2/n=17646.82,ST=18295.74-17646.82=648.92,SA=377.93,SE=ST

–SA=270.99,可列出如下方差分析表返回对于给定的显著性水平α=0.05,由于F=10.46>F1-α(t-1,n-t)=F0.95(4,30)=2.69,拒绝H0,即不同的销售方法对销售额由显著的影响。方差来源平方和自由度均方F比销售方法377.93494.4810.46误差270.99309.03总和648.9334单因素方差分析表例8.1.2

在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:

表8.1.2

鸡饲料试验数据

饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048

解:

这是一个单因子方差分析问题.,将原始数据减去1000,列表给出计算过程:

表8.1.4例8.1.2的计算表水平数据(原始数据-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363

利用(8.1.19),可算得各偏差平方和为:把上述诸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表

来源平方和自由度均方和F比因子9660.083324830.04173.5948

误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95

(2

,21)=3.47

,由于F=3.5948>3.47,故认为因子A(饲料)是显著的,即三种饲料对鸡的增肥作用有明显的差别。

8.1.5参数估计

在检验结果为显著时,我们可进一步求出总均值

、各主效应ai和误差方差2的估计。

一、点估计由模型(8.1.8)知诸yij相互独立,且yij~N(+ai

,2)

,因此,可使用极大似然方法求出一般平均

、各主效应ai和误差方差2的估计:由极大似然估计的不变性,各水平均值i的极大似然估计为,由于不是2的无偏估计,可修偏:

由于,可给出Ai的水平均值i的1-的置信区间为

其中。

二、置信区间例8.1.3

继续例8.1.2,此处我们给出诸水平均值的估计。因子A的三个水平均值的估计分别为从点估计来看,水平2(以槐树粉为主的饲料)是最优的。

误差方差的无偏估计为利用(8.1.23)可以给出诸水平均值的置信区间。此处,,若取=0.05

,则t1-/2(fe

)=t0.95(21

)=2.0796,,于是三个水平均值的0.95置信区间分别为

在单因子试验的数据分析中可得到如下三个结果:

因子是否显著;

试验的误差方差2的估计;

诸水平均值i的点估计与区间估计。

在因子A显著时,通常只需对较优的水平均值作参数估计,在因子A不显著场合,参数估计无需进行。8.1.6重复数不等情形单因子方差分析并不要求每个水平下重复试验次数全相等,在重复数不等场合的方差分析与重复数相等情况下的方差分析极为相似,只在几处略有差别。

数据:设从第i个水平下的总体获得mi个试验结果,记为yi1

,yi2…,yim

,i=1,2,…r,统计模型为:

(8.1.24)

总均值:诸i的加权平均(所有试验结果的均值的平均)(8.1.25)称为总均值或一般平均。

效应约束条件:

各平方和的计算:SA的计算公式略有不同

例8.1.4

某食品公司对一种食品设计了四种新包装。为考察哪种包装最受顾客欢迎,选了10个地段繁华程度相似、规模相近的商店做试验,其中二种包装各指定两个商店销售,另二个包装各指定三个商店销售。在试验期内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,列于表8.1.6左半边,其相应的计算结果列于右侧。

表8.1.6销售量数据及计算表

包装类型

销售量

miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180由此可求得各类偏差平方和如下

方差分析表如表8.1.8所示

.若取=0.01,查表得F0.01(3,6)=9.78,由于F=11.22>9.78,故我们可认为各水平间有显著差异。

表8.1.7例8.1.4的方差分析表

来源平方和自由度均方和F比因子A25838611.22误差e4667.67总和T3049

由于因子显著,我们还可以给出诸水平均值的估计。因子A的四个水平均值的估计分别为由此可见,第四种包装方式效果最好。误差方差的无偏估计为

进一步,利用(8.1.23)也可以给出诸水平均值的置信区间,只是在这里

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论