版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 单因素方差分析 (one-factor analysis of variance)一、一般概念及两种不同的处理效应 方差分析(ANOVA)是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。t 检验可以判断两组数据平均数的差异的显著性, 而方差分析则可以同时判断多组数据平均数之间的差异的显著性。1. 例 2.1调查了5个不同小麦品系的株高,结果列于表21。 在这个例子中,只出现“品系”这样一个因素(factor),故称单因素。共有5 个不同的品系,我们称品系这一因素共有5个水平(level)。5个品系可以认为是5个总体,表 24的数据是从5个总体中抽出的5个样本,通
2、过比较这5个样本,判断这5个总体是否存在差异。表 21 5个小麦品系株高调查结果 株号株 高 1 2 3 4 5 和 64.665.364.866.065.8326.5 64.565.364.663.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平均数65.364.467.370.868.62. 例 2.2 为了探讨不同窝的动物的出生重是否存在差异,随机选取4窝动物,每窝中均有4只幼仔,结果如下: 表22 4窝动物的出生重(克) 动物号窝 别1234和34.733
3、.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。 3. 以上两个例子的共同点是:每个实验都只有一个因素,该因素有a个水平或称为有a个处理(treatment),这样的实验称为单因素实验。 从单因素实验的每一处理所得到的结果都是一随机变量X i。对于a个处理,各重复n次(或者说做n次观察)的单因素方差分析的一般化表示方法见表23 。表 23单因素方差分析的典型数据 X1X2X
4、3 X i X a 123 :jnx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3: : :x3j xij xaj: : :x3n xin xan平均数x1 x2 x3 xi xa 4. 表中的数据xij,表示第 i 次处理下的第j次观察值。其中的n个符号做如下说明: 用“ ”表示下标的和,使用时很方便,在以后会经常遇到。 5. 常用如下的所谓线性统计模型(linear statistical model)描述每一个观察值:其中:xij 是在第 i 水平(处理)下的第 j 次观察值。是对所有观察值的一个参
5、量,称为总平均数(overall mean)。i是仅限于对第 i 次处理的一个参量,称为第i次处理效应(treatment effect)。方差分析的目的,就是要检验处理效应的大小或有无。eij是随机误差成份。6.上述模型中,包括两类不同的处理效应。第一类处理效应称为固定效应(fixed effect):它是由固定因素(fixed factor)所引起的效应。若因素的a个水平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。7. 在这些情况中,因素的水平是特意选择的,所检验的是关于ai
6、的假设,得到的结论只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似水平上。 所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所用的模型称为固定效应模型(fixed effect model)。 例2.1中的5个小麦品系是特意选择的,目的是从这5 个品系中,选出最优者,因而“品系”这个因素属于固定因素,所用的模型是固定效应模型。 8.第二类处理效应称为随机效应(ran-dom effect):它是由随机因素(random factor)所引起的效应。若因素的a 个水平,是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的a
7、个水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型称为随机效应模型(random effect mo-del)。例2.2 的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而“窝别”是随机因素。 9. 有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别:固定因素是指因素水平,可以严格地人为控制。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实验时,水解产物的产量
8、也是固定的。简单地说,在水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度是固定因素。 10.随机因素的水平是不能严格地人为控制的,在水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对作物产量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作物的产量是它的效应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而农家肥是一随机因素。 11.二、 固定效应模型 在固定效应模型中,ai 是处
9、理平均数与总平均数的离差 ,且是个常量,因而 要检验a个处理效应的相等性,就要 判断各 是否等于0。若各ai 都等于0,则各处理效应之间无差异。因此,零假设为: 备择假设为: HA:ai0(至少有1个i)。若接受H0,则不存在处理效应,每个观察值都是由平均数加上随机误差所构成。若拒绝H0,则存在处理效应,每个观察值是由总平均数、处理效应和误差三部分构成。 12. 方差分析的基本思想:就是将总的变差分解为构成总变差的各个部分。对单因素实验,可以将总平方和(total sum of squa-res)做如下分解: 对于每个固定的 xi , 13.因此, (23)式表示度量全部数据变差的总平方和,可
10、以分解为处理平均数与总平均数之间离差的平方和,处理内部观察值与处理平均数之间离差的平方和两部分。处理平均数与总平均数之间的离差,度量了处理之间的差异;而处理内部观察值与处理平均数之间的离差,度量了随机误差的大小。14.用SST表示总平方和, 用SSA表示(23)等号右边第一项,称为处理平方和(treatments sum of squares)或称为处理间平方和(sum of squares between treatments)。15. 用SSe表示(23)等号右边第二项,称为误差平方和(error sum of squares)或称为处理内平方和(sum of squares within
11、 treatments)。因此: 自由度可以做同样的分割:SST具an1自由度dfTan1;A因素工有a 水平,因而SSA有a1自由度dfAa1;SSe有ana自由度,这是因为每一处理均有n1自由度,共有a个处理,因而SS e的自由度为ana,dfeana。为了估计s2,用SS e除以相应的自由度16. MS e称为误差均方(error mean square)。 用类似的方法,可以求出处理均方MSA(treatments mean square) 用MSA与MS e比较,就可以反映出a i的大小。若MSA与MS e相差不大,就可以认为各a i与0的差异不大,或者说各m i之间差异不大。若MS
12、A与MS e超出很多,则认为各 m i之间差异是显著的。为此,用F单侧检验,具dfA,dfe自由度。 17. 当FFa时,则可以认为MSA与MSe差异不大,产生的变差是由随机误差造成的;接受零假设,处理平均数之间差异不显著。当FFa时,拒绝零假设,处理平均数间差异显著。 以上所述可以归纳成方差分析表(table of variance analysis),见表24。 表24 单因素固定效应模型方差分析表 变差来源平方和自由度均 方F处理间误差或处理内SSASSea1naaMSAMSeMSAMS e 总 和SSTna118.其中的(x2n a)通常称为校正项(correc-tion),用C表示。
13、 在实际计算时,通常将SST和SSA写成下列形式:19.误差平方和可由(213)式求出, 现在用以上各式计算例2.1。在方差分析中,为了简化计算同样可以用编码法。方差分析的编码,必须将全部数据均减去同一个共同的数。在例2.1中,每一个xij都减去65,列成下表,先计算校正项C再计算20.株号品 系123450.40.30.21.00.80.50.30.41.31.12.81.32.11.83.56.87.15.04.16.04.23.24.83.32.5总 和x ix 2ixi j1.52.251.933.09.003.411.5132.2529.4329.0841.0174.4618.032
14、4.068.06571308.50277.28 21.将以上结果列成方差分析表(见表25): 表25 不同小麦品系株高方差分析表 变 差 来 源平 方 和自 由 度均 方 F品 系 间误 差131.7415.5842032.720.7841.95* 总 和147.3224 * a0.01 当分子自由度为4,分母自由度为20时,F4,20,0.052.87,F4,20,0.014.43,FF0.01。因此,不同小麦品系的株高差异极显著。习惯上用“*”表示在0.05水平上差异显著,用“*”表示在0.01水平上差异显著,常常称为差异“极显著”(highly significant)。 22.三、 随
15、机效应模型 在实验中,经常回遇到某个因素有许多可能的水平,若参加实验的a个水平,是从该因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选取的a个水平对该因素的水平总体做推断。要求水平的总体是无暇总体,即使不是无限总体,也应相当大,以至于可以认为是无限总体。例2.2中动物的“窝”是随机因素,每一窝是一个水平,这种动物所有的窝构成一水平总体。从该总体中随机选择4个水平(4窝)做实验,实验的目的是希望由这4窝动物去推断该种动物所有不同的窝别之间幼仔出生重是否存在差异。23. 固定效应模型中ai0的假设在这里不再适用。在随机模型中,对单个处理效应的检验是无意义的,所要检验的是
16、关于ai的变异性的假设,因而, H0:sa20HA:sa2 0 如果接受H0:sa20,则表示处理之间没有差异;若拒绝H0而接受HA:sa20,则表示处理之间存在差异,方差分析的做法仍然是将总平方和分解, 24.自由度做同样分解, 由此可得出MSA和MSe。然后用F 单侧检验(具dfA ,dfe 自由度), 方差分析的程序与固定效应模型的方差分析程序完全一样,但是结论不同。随机效应模型适用于全部水平的总体,而固定效应模型只适用于所选水平的总体。下面计算例 2.2,并对结果加以解释。将表22中的每一个数值都减去30,列成下表, 25. 4.7 3.2 2.9 2.9 3.3 4.0 6.7 1.
17、4 3.8 1.4 2.2 4.3 1.6 2.3 3.3 2.0 总 和 c i 5.80 0.10 15.10 2.00 c 2i 33.64 0.01 228.01 4.00 c2i j 49.98 33.49 69.03 32.8611.20 265.66 185.3626.将上述结果列成方差分析表: 表26 动物出生重方差分析 变 差 来 源平 方 和自 由 度均 方F 窝 别 误 差58.575118.94531219.5259.9121.97总 和177.5215 查表得知,F3,12,0.053.49,因FF0.05,所以差异不显著。通过对4窝动物出生重的调查,可以推断不同窝别
18、动物的出生重没有显著差异。 27.四、 多重比较(multiple comparison) 假设对一个固定效应模型经过方差分析之后,结论是拒绝H0,处理之间存在差异。但这并不说在每对处理之间多存在差异。为了弄清究竟在哪些对之间存在显著差异,哪些对之间无显著差异,必须在个处理平均数之间一对一对地做比较,这就是多重比较。多重比较的方法很多,这里只介绍LSD法和Duncan法。 LSD称为最小显著差数(least significant difference),它的计算方法简述如下。 28. 对于任意两组数据的平均数,差数(x1x2)的差异显著性检验,可以用成组数据 t 检验, 当n1n2时 29. 其中MSe为误差均方,n为每一处理的观察次数,于是 具ana自由度,当tt0.05时差异显著,当 tt0.01时差异极显著。因此,当差异显著时 30.并可得到,当时差异显著。t0.052M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度金融科技与创新合同
- 2024乙方餐饮服务与甲方经营许可合同
- 2024年公交车驾驶员雇佣合同3篇
- 2024年度租赁期满续租合同标的租金调整3篇
- 2024版全新借款合同担保的五种类型及其实践应用3篇
- 2024年度合作伙伴联营框架合同版B版
- 2022年湖南省长沙市公开招聘警务辅助人员(辅警)笔试专项训练题试卷(2)含答案
- 2024年幼教专业人才租赁合同3篇
- 2023年黑龙江省七台河市公开招聘警务辅助人员(辅警)笔试专项训练卷(2)含答案
- 2024年呼伦贝尔办理客运从业资格证2024年试题
- 社会主义核心价值观主题班会-1587955431
- 政务服务综合受理平台解决方案课件
- 语言描写优秀课件
- 中压交联电缆电缆正、负和零序计算
- 洁净空调系统验证方案
- 区块链金融课件
- 益生菌概述课件
- 带状疱疹的护理查房课件
- 顺丰快递公司视觉识别VI手册(清晰电子版)
- 处方点评与合理用药-PPT课件
- XX某管道工程通信线路光缆施工组织设计
评论
0/150
提交评论