概率论-方差分析_第1页
概率论-方差分析_第2页
概率论-方差分析_第3页
概率论-方差分析_第4页
概率论-方差分析_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章方差分析ANOVA(analysis

of

variance)第一节

方差分析的基本原理

方差分析的基本特点是:将所有处理的观察值和平均数作

为一个整体加以考虑,把观察值总变异的自由度和平方和

分解为不同变异来源的自由度和平方和,进而获得不同变

异来源的总体方差估计值。

通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。•

方差分析实质上是关于观测值变异原因的数量分析,它在

科学研究中应用十分广泛。第一节

方差分析的基本原理方差分析的优点:不受比较组数的限制,可比较多组均数可同时分析多个因素的作用可分析因素间的交互作用第一节

方差分析的基本原理相关术语:试验指标(experimental

index):

为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。试验因素(experimental

factor)

试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。第一节

方差分析的基本原理因素水平(level

of

factor)

试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。试验处理(treatment)

事先设计好的实施在试验单位上的具体项目叫试验处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。试验单位(experimental

unit)

在试验中能接受不同试验处理的独立的试验载体叫试验单位。重复(repetition)

在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复。

第一节

方差分析的基本原理试验效应(experiment

effect)

:试验因素对试验指标所起

的增加和减少的作用。简单效应(simple

effect)

:同一因素内两种水平间试验指

标的差数。主要效应(main

effect)

:一个因素内各简单效应的平均数,

又称平均效应,简称主效。交互作用

(interaction

effect)

两个因素简单效应间的

平均差异称为交互作用效应,简称互作。它反映一个因素

的各个水平在另一因素的不同水平中反应不一致的现象。第一节

方差分析的基本原理

2×2试验数据表(解释各种效应)试验因素NIP水平

P1N110N216平均

13N2-N1

6P21824216平均14206IIPP2-P1

水平

P1

8N110

8N216

8平均

130,0/2=0

N2-N1

6P218282110平均14228IIIPP2-P1

水平

P1

8N11012N216

10平均

134,4/2=2

N2-N1

6P21820192平均14184P2-P1846-4,-4/2=-2第一节

方差分析的基本原理

自由度和平方和的分解:

[例5.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试分解其自由度和平方和。药剂苗高观察值总和Ti平均数ABCD18201028212415272026172913221432

72

92

5611618231429T=336=21=

182

+

212

++

322

=

602第一节

方差分析的基本原理

自由度和平方和的分解:

1、总变异把表中的全部观察值作为一个组看待[即把4个处理(4组、每组有4个观察值)合并成一组,共有24个观察值],根据前面讲过的计算平方和的公式

,可以计算出总变异的平方和和自由度SST

=(y

i

y)2

=y2

−3362

4×4(∑

y)2

nk∑∑自由度DFT=nk-1=4×4-1=15。∑∑第一节

方差分析的基本原理

自由度和平方和的分解:

2、误差效应

表中处理内(组内)各观察值之间,若不存在误差,则各观察值应该相等,由于误差是客观存在的,因而处理内(组内)各观察值之间必然是有差异的,因此,可以用组内(处理内)的差异度量误差效应:k

n1

1SSe

=(yij

yi)2

=

38+

20+

26+14

=

98

每个组内(处理内)的自由度为:n

-1=4-1=3所以误差的自由度为:DFe=k(n-1)=4(4-1)=12∑

−C,Ti2=

n∑(ySSt

i

y)

=2k1

nDFt

=

(k

−1)本例中平方和:

602=504+98自由度:15=3+12因此误差平方和可以采用简单的办法计算SSe=SST-SSt=602-504=98。第一节

方差分析的基本原理

自由度和平方和的分解:

3、处理效应

如果没有处理效应,表中各个处理(组)平均数

yi

从理论上

讲均应该相等,

因此可以用

y

来度量处理效应。s168.00=

=

20.56s8.17第一节

方差分析的基本原理

F

分布与F

检验

在一个平均数为μ、方差为σ2的正态总体中随机抽取两

个独立样本,将其均方的比值定义为F.

21

212)F(df1,df=1.0f(F)0.80.20.40.60.0F

分布•

F

分布是具平均数

μF=1和取值区间

为[0,

∞]的一组曲

线;而某一特定

曲线的形状仅决

定于参数df1和df2。01234Fdf=2,df=5df=8,df=20df=4,df=10和s

彼此独立。F

检验

在方差分析的体系中,F

检验可用于检测某项变异因素

的效应或方差是否存在。所以在计算F值时,总是将要检

验的那一项变异因素的均方作分子,而以另一项变异(如

误差项)作分母。

F

检验需具备的条件:

–(1)变量x遵循N(μ,σ2);–(2)s1

222查表在df1=3,df2=12时实得F=20.56>

F0.01F0.05=3.49,

F0.01=5.95

P<0.01多重比较(multiple

comparisons)•

通过平方和与自由度分解,将所估计的处理均方与误差均

方作比较,由F检验推论处理间有显著差异。但我们并不清楚那些处理间存在差异,故需要进一步做处理平均数间的比较。•

一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较。多重比较有多种方法,常用的有三种:最小显著差数法(LSD法)、复极差法(q法)和Duncan氏新复极差法(SSR法)。sxi

j

x

=2se多重比较(multiple

comparisons)

最小显著差数法(least

significant

difference,简称

LSD法),LSD法实质上是t检验。其程序是:在处理间的

F检验为显著的前提下,计算出显著水平为α的最小显著差

LSDα;任何两个平均数的差数如其绝对值≥

LSDα,即

为在α水平上显著;反之则为不显著。2jn−LSDα

=

tαsxi

−x多重比较(multiple

comparisons)•

LSD法的t检验是根据两个样本平均数差数(k=2)的抽样

分布提出来的,但是一组处理(k>2)是同时抽取k个样本

的结果。抽样理论提出k=2时与k>2时,例如k=10时其随

机极差是不同的,随着k的增大而增大,因而用k=2时的t

检验有可能夸大k=10时最大与最小两个样本平均数差数的

显著性。基于极差的抽样分布理论,Student-Newman-

Keul提出了q检验或称复极差检验,有时又称SNK检验或

NK检验。se

2n多重比较(multiple

comparisons)

q检验方法是将一组k个平均数由大到小排列后,根据所比

较的两个处理平均数的差数是几个平均数间的极差分别确

定最小显著极差LSRα的。q检验因是根据极差抽样分布原

理,其各个比较都可保证同一个α水平。其尺度构成为:

LSRα

=

qα,df

,Msxsx

=sxse

2不同药剂处理水稻苗高(q法)LSRα值P234q

0.05

3.08

3.77

4.20q

0.01

4.32

5.04

5.50LSR0.05

4.40

5.39

6.01LSR0.01

6.18

7.21

7.87处理苗高平均数

差异显著性0.05

0.01abDBAC29231814c

cAAB

BC

C不同药剂处理水稻苗高平均数比较(q法)例5.1中==

n8.17/

4

1.43多重比较(multiple

comparisons)•

q法不同秩次距M下的最小显著极差变幅大,虽然减小了犯α错误的概率,但同时增加了犯β错误的概率。为此,D.B.Duncan(1955)提出了新复极差法,又称最短显著极差法(shortest

significant

ranges

SSR)。该法与q法相似,其区别在于计算最小显著极差时不是查q表而是查SSR表,所得最小显著极差值随着k增大通常比q检验时减小。LSRα

=

SSRα,df

,Msx多重比较(multiple

comparisons)•

多重比较方法的选择1、试验事先确定比较的标准,凡是与对照相比较,

或与预定要比较的对象比较,一般可选用最小显

著差数法;2、根据否定一个正确的

H0

和接受一个不正确的

H0

的相对重要性来决定。•

三种方法的显著尺度不同,LSD法最低,SSR法次之,q

法最高。故LSD检验犯α错误的概率最大,q法最小,SSR法介于两者之间,因此,对于试验结论事关重大或有严格要求的,宜用q法;一般试验可用SSR法。方差分析的线性数学模型•

方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模型是指总体每一个变量可按其变异

的原因分解成若干个线性组成部分,它是方差分析的基础。数据的线性模型可表示为:•

式中,μ为总体平均数,τi为试验处理效应,εij为随机误差具有N(0,σ2)。xij

=

µ

i

+εij方差分析的线性数学模型•

在以样本符号表示时,样本的线性组成为:xij

=

x

+

ti

+

eij•

式中,x

是μ的无偏估计值,

ti

=

(xi

x)

→τ

i

+

eieij

=

(xij

xi)

εij方差分析的线性数学模型在线性可加模型中,由于对τi有不同解释产生了固定模型和随机模型。一、固定模型(fixed

model)指试验的各处理都抽自特定的处理总体,其处理效应τi=(μi-μ

)是一个固定的常量,我们的目的就在于研究τi,所测验的假设是H0:τi=0或H0:μi=

μ。①因素的水平确定后,因素的效应即被确定。②因素的

a个水平是人为特意选择的。③方差分析所得结论只适用于所选定的a个水平。指试验中的各处理皆是抽自N(0,

)的一组随机样

τ

σ方差分析的线性数学模型二、随机模型(random

model)本,因而处理效应τi是随机的,它会因试验的不同而不同;故我们的目的不在于研究τi而在于研究τi的变异度。随机模型在遗传、育种和生态的研究试验方面有较广泛的用处。①因素的水平确定之后,其效应并不固定。②因素的

a

个水平是从水平总体中随机抽取的。③从随机因素的

a

个水平所得到的结论,可推广到该因素的所有水平上。2第二节

单因素方差分析方差分析的基本步骤现归纳如下:(一)计算各项平方和与自由度。(二)列出方差分析表,进行F检验。(三)若F检验显著,则进行多重比较。处理

第二节

单因素方差分析根据各处理内重复数是否相等,单因素方差分析又分为重

复数相等和重复数不等两种情况。当重复数不等时,各项平

方和与自由度的计算,多重比较中标准误的计算略有不同。[例5.2见教材P100例6.3]小麦种子切胚乳试验的方差分析

小麦切胚乳试验单株粒重(g)表

株号合计平均数12345678910Ⅰ212924222530272620425.5Ⅱ2025252329312426202124424.4Ⅲ24222825212614624.3sxse

2第二节

单因素方差分析

小麦切胚乳试验方差分析表dfSum

SqMean

SqF

valuePr(>F)0.31760.7314groupResiduals2216.767223.7333.38310.654Total23230.510.654

8

#The

result

of

R

computing.•

如果F检验显著,则需多重比较,计算n0

24×2==

n0≈1.16光照(A)

5h/d

10h/d

15h/d

25℃143,138,

120,107

96,103,

78,91

79,83,

96,98

温度(B)

30℃101,100,

80,83

79,61,

83,59

60,71,

78,64

35℃

89,93,101,76

80,76,

61,67

67,58,

71,83

第三节

二因素方差分析具有重复观察值的二因素方差分析

[例5.3见教材P106例6.5]

不同温度及光照条件下某种昆虫滞育天数(天)表

第三节

二因素方差分析具有重复观察值的二因素方差分析

某种昆虫滞育天数方差分析表dfSum

SqMean

SqF

valuePr(>F)Group

AGroup

B

A×B2245367.15391.1

464.92683.52695.5

116.221.934522.0326

0.95012.199e-06

***2.119e-06

***

0.4505Residuals

273303.2122.3Total3514526.3#The

result

of

R

computing.∑TsABsAB∑TsABsABsssAB第三节

二因素方差分析

二因素方差分析表变异来源dfSS固定模型

F随机模型

F混合模型(A随

机、B固定)F

A因素B因素a-1b-1A×B互作(a-1)(b-1)试验误差ab(n-1)总变异abn-12SST=−C∑

xSSASSe

=

SST

SSA

SSB

SSABSSB

2i⋅

2⋅

j==/bn−C/an−C2SS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论