版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1/1方差分析和正交试验设计
第6章
§单因子方差分析
在实际问题中,某个指标的取值,往往可能与多个因素有关。例如,农作物的产量,可能与作物的品种有关,可能与施肥量有关,可能与土壤有关,等等。又例如,化工产品的收得率,可能与原料配方有关,可能与催化剂的用量有关,可能与反应温度有关,还可能与反应容器中的压力有关,等等。
由于因素很多,自然就会产生这样的问题:这些因素,对于指标的取值,是否都有显著的作用?如果不是所有的因素都有显著的作用,那么,哪些因素的作用显著?哪些因素的作用不显著?还有,这些因素的作用,是简单地叠加在一起的呢,还是以更复杂的形式交错在一起的?
以上这些问题,都需要我们从试验数据出发,来加以判断、分析,做出结论。方差分析(AnalysisofVariance,简称ANOVA)就是一种能够解决这类问题的有效的统计方法。
在方差分析中,将可能与某个指标的取值有关的因素,称为因子(Factor),通常用A,B,?来表示。因子所取的各种不同的状态,称为水平(Level),用A1,A2,?,B1,B2,?来表示。
如果问题中只考虑一个因子,这样的方差分析称为单因子方差分析。如果问题中要考虑两个因子,这样的方差分析就称为双因子方差分析。当然,还可以有三因子、四因子、更多因子的方差分析。
我们先来看单因子方差分析。
问题设某个指标的取值可能与一个因子A有关,因子A有r个水平:A1,A2,?,Ar。在这r个水平下的指标值,可以看作是r个相互独立、方差相等的正态总体
?i~N(?i,?2),i?1,2,?,r。
在每一个水平Ai下,对指标作t(t?1)次重复观测,设观测结果为
Xi1,Xi2,?,Xit。
它们可以看作是总体?i的样本。即有
问:因子A对指标的作用是否显著?
137
检验方法
检验因子A的作用是否显著,相当于要检验这样一个假设
H0:?1??2?r。
为了作检验,先给出一批定义。称
n?rt为总观测次数。
1t
i??Xij为水平Ai的均值,tj?1
SSi??(Xij?i)2为水平Ai的平方和。
j?1t
1rt1r
Xij??i为总均值,ni?1j?1ri?1
SST(Xij?)2为总平方和。
i?1j?1rt
SSe(Xij?i)??SSi为误差平方和,2
i?1j?1i?1rtr
SSA?t?(i?)2为因子A的平方和。
i?1r
这些统计量之间的相互关系,可以用下列图表的形式表示出来:
水平观测值Ai的平方和Ai的均值
1?
r??总均值A1?Ar
X11?X1t←─SS1─→???←─SSr─→X1?Xrt?r←────→│←──误差平方和SSe──→│←─A的平方和SSA──→││←─────────总平方和SST─────────→│
t
SSi??(Xij?i)2反映了在各水平Ai的内部指标取值的差异程度,这种差异
j?1
完全是由于误差引起的,而SSe是所有这样的.SSi的总和,所以称为误差平方和。
SSA?t?(i?)2反映了各水平之间指标取值的差异程度,如果因子A的作用i?1r
不显著,各水平之间差异很小,1,2,?,r近似相等,与X差异很小,SSA的值也比138
较小,如果因子A的作用显著,各水平之间差异很大,1,2,?,r与X的差异也很大。
所以称为因子A的平方和。SSA的值就会偏大。SSA的大小反映了因子A的作用大小。
总平方和SST、误差平方和SSe、因子A的平方和SSA之间,有下列平方和分解关系:
SST?SSe?SSA。
这是因为
SST(Xij?)2i?1j?1
rtrt
(X
i?1j?1
rtij?i?i?)2?i)?2??(Xij?i)(i?)(i?)22
i?1j?1i?1j?1
trtrt(Xi?1j?1ij
?SSe?2?(?X
i?1j?1rij?ti)(i?)?t?(i?)2i?1r
?SSe?0?SSA?SSe?SSA。
由SSA、SSe可以算出统计量MSA?SSA(r?1)和MSe?SSe(n?r)。MSA称为因子A的均方,MSe称为误差均方。由MSA、MSe可以算出统计量
FA?MSASSA(r?1)。?MSeSSe(n?r)
下面证明一个关于FA的分布的定理。
定理若H0:?1??2?r为真,则有
FA?MSASSA(r?1)~F(r?1,n?r)。?MSeSSe(n?r)
2证设?1??2?r??,这时有?i~N(?,?),i?1,2,?,r。
因为Xi1,Xi2,?,Xit是?i的样本,所以Xij~N(?,?)2Xij??
?~N(0,1)。
i?1,2,?,r,j?1,2,?,t,相互独立。139
Q?
r
t
?Xiji?1j?1??
r
t
2
??(X
i?1j?1
rt
ij
?)2
?
2
??(X
?
i?1j?1
ij2
?)
2
2??(Xij?)(??)?
i?1j?1
rt
??(??)
?
i?1j?1
rt
2
??
SST
?0?
2
?
2
?
SSA
SSe
n(??)2
?2?2
2
?
?
2
?
?2
?
n?Q1?Q2?Q3。
??
其中,Q1?
r
SSA
?
r
2
?
t?(i?)2
i?1
r
?2
是r项的平方和,但这r项又满足1个线性关系式:
?(i?1
i
?)??i?r?0,所以,Q1的自由度f1?r?1。
i?1
Q2?
SSe
??(X
?
i?1j?1
rt
ij
?i)2
是n?rt项的平方和,但这n项又满足r个线性
t
?
2
?2
ij
关系式:
?(X
j?1
t
?i)??Xij?ti?0,i?1,2,?,r,所以,Q2的自由度
j?1
f2?n?r。
?
?nQ3是1项的平方和,所以,Q3的自由度f3?1。
??
因为f1?f2?f3?(r?1)?(n?r)?1?n,所以由定理(Cochran定理)可知:
2
Q1?
SSA
?
2
2
~?(r?1),Q2?
SSe
?2
?22
?n~?(n?r),Q3~?(1)。
??
2
2
而且Q1?
SSA
?
2
,Q2?
SSe
?2
?
?n,Q3相互独立。
??
因此,由F分布的定义可知
140
2SSA(r?1)FA??
SSe(n?r)SSe
SSA
r?1)
~F(r?1,n?r)。
?
2
n?r)
由定理可知,若H0:?1??2?r为真,则FA~F(r?1,n?r);若H0:?1??2?r不真,则SSA的值会偏大,FA的值也会偏大,统计量FA的分布,相对于F(r?1,n?r)分布来说,峰值的位置会有一个向右的偏移。
因此,可得到检验方法如下:
从样本求出FA的值。对于给定的显著水平?,自由度(r?1,n?r),查F分布的分位数表,可得分位数F1??(r?1,n?r),使得P{FA?F1??(r?1,n?r)}??,当
FA?F1??(r?1,n?r)时,拒绝H0:?1??2?r,这时,可以认为因子A的
作用显著,否则,接受H0:?1??2?r,这时,可以认为因子A的作用不显著。单因子方差分析的计算步骤
方差分析的计算比较复杂,用带统计功能的计算器计算时,最好按照下列步骤进行,并把计算结果填写在下列形式的表格中:
t
1t
(1)从Xi1,Xi2,?,Xiti求出i??Xij和SSi??(Xij?i)2,i?1,2,?,r。
tj?1j?1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论