第八章_单因素方差分析(1)_第1页
第八章_单因素方差分析(1)_第2页
第八章_单因素方差分析(1)_第3页
第八章_单因素方差分析(1)_第4页
第八章_单因素方差分析(1)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 单因素方差分析(Onefactor ANOVA)ANOVA: Analysis of Variance目的要求 n掌握:方差分析的意义、功用与应用范围;多重比较法及多重比较结果的表示法。n熟悉:不同类型单因素资料的方差分析方法。n了解:方差分析的线性模型和期望均方。统计软件Excel、SPSS应用。讲授内容n第一节 方差分析的基本原理n第二节 固定效应模型n第三节 随机效应模型n第四节 多重比较n第五节 方差分析应具备的条件第一节 方差分析的基本原理n一、方差分析要解决的问题n二、方差分析的几个概念n三、方差分析的数学模型n四、方差分析的原理v一、方差分析要解决的问题?:,如平均数差异

2、的假设检验如何进行关于两样本的210H检验法。的答:常采用第五章里讲t)?假设检验(个样本的平均数差异的现在,如何进行3 aa检验。某人答:两两进行t的。评论:这种方法是不行主要原因有三:原因(1):检验的工作量大个平均数的差。合,就有个样本平均数,两两组当有2) 1( aaa个平均数的差。时,就有例如,45291010a检验,程序太繁琐。次检验法,要进行换句话说,采用两两tt45原因(2):检验的I 型错误增大,从而检验的可靠性低2102只有一个,即时, Ha 313221033,个,即有时, Ha 5432210, 105,个,即有时,Ha 95. 0120被接受的概率为时只作一次假设检验

3、,Ha05. 095. 01)( 0定为真时,但却被我们否型错误 HI8574. 095. 0133330)被接受的概率为(次检验,时作Ha1426. 08574. 01 型错误I5987. 095. 01 10510100)被接受的概率为(次检验,时作Ha4013. 05987. 01 型错误I是不可靠的。大大增大,这样的检验型错误的概率的增大,检验的通过以上分析,随着 Ia原因(3)检验统计量的精确性低21212222112111 2) 1() 1( yy nnnnsnsnt 检验的统计量是样本的数值。的估计,它只用了两个差这部分是对原始数据方2的估计有待改善。所以,我们认为对。时的利用来

4、估计个样本,没有被全部同但我们有22a。检验的精确性有待提高因此,两两t正确答案正确答案:析。统计分析方法方差分应使用一种更为合理的设检验,个样本平均数差异的假进行关于)3( aav二、方差分析的几个概念1、方差分析(analysis of variance):将试验数据的总变异分解成不同来源的变异,从而评定不同来源的变异相对重要性的一种统计方法。2、试验指标(experiment index):为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。3、试验因素(experiment factor):试验中所研究的影响试验指标的因素:单因素、双因素或多因素试验。4、因素水平

5、(level of factor):因素的具体表现或数量等级。5、试验处理(treatment):在试验对象上实施的事先设计好的具体项目,简称处理。在进行单因素试验时,试验因素的一个水平就是一个处理;对于双因素试验,处理的个数等于两个因素水平个数的乘积。每个处理可以看做是一个总体,每个处理得到的一组数据可以看做是从这个处理总体中抽取的一个样本的数据。6、试验单位(experiment unit):在试验中能接受不同试验处理的独立的试验载体,是获得观测数据的单位。7、重复(repetition):在试验中,将一个处理实施在两个或两个以上的试验单位上称为处理有重复,处理实施的试验单位数目称为处理的

6、重复数。观测数重复v三、方差分析的数学模型(一)单因素试验的数据描述处理(组别) (i=1,2,.,a) 重复数(j) 1 2 i a 1 y11 y21 yi1 ya1 2 y12 y22 yi2 ya2 3 y13 y23 yi3 ya3 j y1j y2j yij yaj n y1n y2n yin yan 组总和 组平均数 y1. 1y y2. 2y yi. iy ya. ay 个处理所有数据的和表示第 iyy1njiji值个处理所有数据的平均表示第iy1yiin据的总和表示所有处理中全部数ainjij11yy全部数据的总平均值y1yan和”表示对一个下标的求注意:“次观测值个处理的第

7、表示第jiyijijiijijy y 可表示成均数,为全体试验值的总体平其中,。对试验结果产生的影响理个处理的效应,表示处为第iiiaiiia1 , 0 是常数。且每个个不同处理,则有如果我们只研究这个处理的平均数。为第iii称为噪声)。的试验的随机误差(也是ijijy。布相互独立且服从正态分我们假定), 0(2Nij这是方差分析的条件。因此,方差分析假定),(y2iijN固定效应模型固定效应模型(二)单因素试验的数据描述v(三)因素处理效应和实验模型的分类1、固定效应模型 如果处理效应是由固定因素所引起的效应,就称为固定效应。 随机因素是指因素的水平可以严格地人为控制,水平固定后它的效应值也

8、是固定的,实验重复时可以得到相同的结果。 处理固定因素所用的模型称为固定效应模型,简称为固定模型。随机效应模型的方差分析所得到的结论可以推广到总体水平上2、随机效应模型 如果处理效应是由随机因素所引起的效应,就称为随机效应。 固定因素是指因素的水平可以严格地人为控制,水平固定后它的效应值也是固定的,实验重复时可以得到相同的结果。 处理固定因素所用的模型称为固定效应模型,简称为固定模型。 固定模型的方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论推广到其他未考虑的水平上。2、混合模型 在多因素试验中,若即包括固定因素,有包括随机因素,那么该实验应该用混合实验模型进行统计分析。v四、方

9、差分析的原理:(一)两类误差1、随机误差:在因素的同一水平(同一个总体)下,各样本的各观察值之间的差异。如同一盐浓度下的不同碱蓬植株鲜重的差异2、系统误差:在因素的不同水平(不同总体)下,各观察值之间存在的差异。如不同盐浓度处理的碱蓬植株鲜重的不同。(二)两类方差1、处理内方差:在因素的同一水平(同一个总体)下,样本数据的方差2、处理间方差:因素的不同水平(不同总体)下,各样本之间的方差。(三)方差的比较如果不同盐浓度对植株鲜重没有影响,则处理间方差就只包含随机误差,处理内方差与处理间方差的比值接近1,反之,则大于1,当大到某个程度时,就可以说不同水平之间存在着显著差异。(四)方差分析的原理(

10、1)将数据的总变异分解为不同处理引起的变异(系统误差或处理效应)和随机误差(试验误差)引起的变异(2)通过F检验,比较不同处理引起的变异和随机误差引起的变异的相对大小: 如果不同处理引起的变异明显比随机误差引起的变异大,则说明不同处理确实有显著差异 如果不同处理引起的变异明显不比随机误差引起的变异大,则说明不同处理没有显著差异第二节 固定效应模型v一、固定模型的方差分析程序(一)假设(二)确定显著性水平都相等不是所有的iAaHH:2100:0:210都等于不是所有的iAaHH即,ijiijy显著。从而得出不同处理是否否为零,不同处理引起的变异是方差分析的目的是分析总变异总变异不同处理引不同处理

11、引起的变异起的变异误差引起误差引起的变异的变异(三)计算统计量和处理内变异异异来源分解为处理间变个试验的总变异依据变,方差分析就是要把一1nyyS2n1ii2ijiijy总变异起的变异不同处理引起的变异随机误差引211)yy(ainjij21)yy(aiin211)yy(ainjiij如何定量地衡如何定量地衡量这些变异?量这些变异?称为总平方和总平方和,记为 SST称为处理平方处理平方和和,记为 SSA称为误差平方误差平方和和,记为 SSe1、平方和的计算和分解总平方和SST处理平方和SSA误差平方和SSeaiainjiijiainjijn11122211)yy()yy()yy(即,证明:21

12、1211 )yy()yy()yy(ainjiijiainjij)yy()yy)(yy(2)yy(1122ainjiijiijiiaiaiainjiijnjiijiin1111212)yy( )yy()yy(2)yy(aiainjiijinnjiij111220)yy()yy()yy(1平方和的简易求法CSSainjijT112yCnSSaiiA12y1ATeSSSSSS称为校正数其中,,y2anCTainjijTdfSS的自由度,记为总平方和112)yy(,yyijan个离均差计算该量时,需要这一条件的约束。化,但受到每个离均差可以自由变0)yy(11ainjij11目资料中所有观测值的数所以

13、,自由度 andfT2、总自由度的计算和分解AaiiAdfnSS的自由度,记为处理平方和12)yy(,yy个量共计算该量时,需要ai这一条件的约束。但受到0)yy(1aii11 处理的数目所以,自由度 adfAeainjiijedfSS的自由度,记为误差平方和112)yy(,yy个量共计算该量时,需要aniij。个条件的约束但受到), 2 , 1( 0)yy(1aianjiijATedfdfaandf所以,自由度理均方,和误差均方,由度便得到总均方,处各平方和除以相应的自即分别记为 , , , eATMSMSMSTTTdfSSMSAAAdfSSMSeeedfSSMSeATMSMSMS注意:*3

14、、方差(均方)的计算v4、显著性检验F检验(上尾检验)v(四)拒绝域的建立v(五)作出结论并给予相关知识领域的解释eAdfdfMSMSFeA),(,自由度和均方。如下表。试求各平方和场,其稻谷产量盆,随机置于同一盆栽盆,共有每个处理各不施氮肥。施尿素,施碳酸氢氨,水,两种不同工艺流程的氨分别施用和个处理:试验,设置了,有一水稻施肥的盆栽例204545154321AAAAA处理A1A2A3A4A5产量2427313221302428332228212533162626302821合计 1089811412680526y。重复数验资料,处理数解:这是一个单因素实4n5,a如下:平方和和自由度的计算

15、8 .1383345526y 22校正数anC191 2 .4028 .1383314326213024y 112222andfCCSSTainjijT总平方和41 2 .3018 .1383314135 801261149810841y1 1222222adfCCnSSAaiiA处理平方和15419 1012 .3012 .402 ATeATedfdfdfSSSSSS误差平方和17.21192 .402TTTdfSSMS所以,总均方30.7542 .301AAAdfSSMS处理均方73.615101eeedfSSMS误差均方例2:5个小麦品系株高的调查资料 品 系 株号株号 I I IIII

16、 IIIIII IVIV V V 1 1 6464.6.6 64.564.5 67.867.8 71.871.8 69.269.2 2 2 65.365.3 65.365.3 66.366.3 72.172.1 68.268.2 3 3 64.864.8 64.664.6 67.167.1 70.070.0 69.869.8 4 4 66.066.0 63.763.7 66.866.8 69.169.1 68.368.3 5 5 65.865.8 63.963.9 68.568.5 71.071.0 67.567.5 组总和组总和 iy 组平均数组平均数 iy 326.5326.5 65.36

17、5.3 322.0322.0 64.464.4 336.5336.5 67.367.3 354.0354.0 70.870.8 343.0343.0 68.668.6 y=1682 单因素:品种;单因素:品种; 单因素的单因素的5个水平(也称个水平(也称处理处理):):I, II, III, IV, V。 每个水平设置了每个水平设置了5个重复个重复题解v解:1、原假设,备择假设2、方差分析求校正项C C=129.96求各平方、自由度和值和均方值:SST=147.32 SSA=131.74 SSE=15.58 dfA=a-1=5-1=4;dfe=a(n-1)=20MSA=SSA/dfA=32.9

18、;MSe=SSe/dfe=0.783、检验统计量:F=MSA/MSe=42.234、拒绝域的建立:F4,20,0.05=2.87; F4,20,0.01=4.435、结论:这五个品种小麦的株高差异极显著。二、均方期望与统计量F所构造的。计量是根据均方的期望方差分析中所使用的统), 0( ,y2Nijijiij0: 0 210不等于至少有一个:待检验的假设为iAaHHaiiAeanMSEMSE12221)( )(可以证明:的大小。的大小就可以反映出与因此,通过比较iAeMSMS的差异不大;与各相差不大,就可以认为与如果0ieAMSMS。不可能全为各明显的大,就可以认为比如果0ieAMSMS常称为处理效应aiia122 ,11,即统计量,构造和为了比较eAeAMSMS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论