第四章方差分析2_第1页
第四章方差分析2_第2页
第四章方差分析2_第3页
第四章方差分析2_第4页
第四章方差分析2_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差:方差:用自由度来除离均差平方和,用自由度来除离均差平方和,得到平均的平方和,简称方差或均方。得到平均的平方和,简称方差或均方。是标准差的平方,是表示变异的量。是标准差的平方,是表示变异的量。方差分析方差分析:将总变异剖分成为各个变将总变异剖分成为各个变异来源的相应部分,从而发现各变异异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种原因在总变异中相对重要程度的一种统计分析方法。统计分析方法。 有人说,我们可以把多组数据化成有人说,我们可以把多组数据化成n n个两组数据(化整个两组数据(化整为零),用为零),用n n次次t t检验来完成这个多组数据差异显著性的判检验来完成这个

2、多组数据差异显著性的判断。断。对多个处理进行平均数差异显著性检验时,采用对多个处理进行平均数差异显著性检验时,采用t t检验法的缺点:检验法的缺点:1.1.检验过程烦琐。检验过程烦琐。试验包含个处理试验包含个处理t t 检验:检验: C C4 42 2 6 6次次缺缺 点点缺缺 点点2.2.无统一的试验误差,误差估计无统一的试验误差,误差估计的精确性和检验的灵敏性低。的精确性和检验的灵敏性低。t t检验:检验:C C4 42 2 6 6次次需计算需计算 6 6个标准误个标准误误差估计不统一误差估计不统一误差估计精确性降低误差估计精确性降低缺缺 点点3.3.推断的可靠性低,检验时犯推断的可靠性低

3、,检验时犯错误错误概率大。概率大。t t检验:检验:C C4 42 2 6 6次次H H0 0的概率:的概率:1-1-0.950.956 6次检验次检验相互独立相互独立6 6次都接受的概率次都接受的概率(0.95)(0.95)6 60.7350.735犯犯错误的概率错误的概率1-0.7351-0.7350.2650.265犯犯错误的概率明显增加错误的概率明显增加例如我们用例如我们用t t检验的方法检验检验的方法检验4 4个样本平均数之间的差异显著性个样本平均数之间的差异显著性观观测测值值不不同同的的原原因因处理效应处理效应(treatment effect):处理不同引起处理不同引起试验误差:

4、试验过程中偶然性试验误差:试验过程中偶然性因素的干扰和测量误差所致。因素的干扰和测量误差所致。在一个多处理试验中,可以得出一系列不同的观测值。在一个多处理试验中,可以得出一系列不同的观测值。方差分析的基本思想方差分析的基本思想总变异处处理理效效应应试试验验误误差差方差分析的目的方差分析的目的确定各种原因在总变异中所占的重要程度。确定各种原因在总变异中所占的重要程度。处理效应处理效应试验误差试验误差相差不大,说明试验处理对指标影响不大。相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。说明试验处理

5、影响是很大的,不可忽视。方差分析的用途方差分析的用途1. 1. 用于多个样本平均数的比较用于多个样本平均数的比较2.2.了解变异来源的真正原因了解变异来源的真正原因,估计各估计各个变异方差,合理的估计试验误差个变异方差,合理的估计试验误差k k处理每个处理有处理每个处理有n n个观察值的数据模式个观察值的数据模式 平均平均T=xij TkTiT2T1总和总和xk1xk2xkjxknxi1xi2xinx21x22x2jx2nx11 x12 x1jx1n12jnki21 处理处理重复重复x x1 x2 xi xk )()(xxxxxxiiijij 总变异总变异误差变异误差变异处理变异处理变异 22

6、222)()()()()()(xxxxxxxxxxxxxxiiiijiijiiijij njnjiiiijnjijnjijxxxxxxxxxx11212122)()()()(得第得第i i个处理平方和为:个处理平方和为: 21221)()()(xxnxxxxinjiijnjij kikikiinjiijnjijxxnxxxx11121212)()()(对应记作:对应记作: SSSST TSSSSe eSSSSt t一般记为:一般记为: SSSST TSSSSt tSSSSe e (二)自由度的分解(二)自由度的分解 )()()()(11111212112nkxxdfSSMSkxxndfSSMS

7、knxxdfSSMSkinjiijeeekiitttkinjijTTT组组内内均均方方组组间间均均方方总总均均方方计算公式3种平方和的简便计算公式种平方和的简便计算公式 211ktiiSSTCntTeSSSSSS2/CTkn矫正数矫正数 211knTijijSSxCix2 .11x解:计算各项自由度:解:计算各项自由度:总自由度总自由度 dfTnk193-1=26品种间品种间 dftk13-1=2误差误差 dfek(n1)3(9-1)=24计算各项平方和:计算各项平方和:矫正数矫正数933772730222. nkTC总平方和总平方和07790121862222. CCxSST55545522

8、4407790. tTeSSSSSS误差平方和误差平方和品种间平方和品种间平方和 52244972137932222. CCnTSSit品种间均方品种间均方26122252244. tttdfSSMS误差均方误差均方731222455545. eeedfSSMS2221ssF 在一个平均数为在一个平均数为,方差为,方差为2 2的正态总的正态总体中随机抽取两个样本,并求出它们的均方比,体中随机抽取两个样本,并求出它们的均方比,即得即得F F值,如果抽取许多样本可得若干个值,如果抽取许多样本可得若干个F F值,值,这些这些F F值的分布形成值的分布形成F F值的抽样分布。值的抽样分布。12, 01

9、F),(2N21s22s假设假设 H0:三个品种果重全相等:三个品种果重全相等 123HA:三个品种果重不全相等:三个品种果重不全相等38. 5731.2226.122F2221ss查查附表附表6,当,当 时,时,F0.053.40,F0.015.61,实得,实得F5.38F0.05=3.40,否定无,否定无效假设效假设显著水平显著水平 0.0524, 221例例12 kSSstt)(12 nkSSsee不相同与农大异号小麦蛋白质含量的变,即东方红,接受所以否定。,即,计算所得时,当推论:查附表测验计算:显著水平取。:对即相同异与农大号小麦蛋白质含量的变假设:1393HH05. 0FF00.

10、6F49601.12135. 0621. 1F0.05H,:H1393东方红:HA005. 005. 02122212221A222100Pss例例jixxstLSDnMSsexxji273.222es解:已知误差项均方解:已知误差项均方 ,dfe24, 故:故:查附表查附表4,当,当dfe24时,时,t0.052.064,t0.012.797296252797221010010. xxstLSD644252064221050050. xxstLSD25. 2973.2222221nssexx例例33.10ix00. 8ixpdfSSRSELSR, nMSSEe查查附表附表8,当,当df24时

11、,时,p2,3的的SSR值,值,再根据公式计算尺度值再根据公式计算尺度值LSR ,结果列于下表结果列于下表故:故:解:已知误差项均方解:已知误差项均方 ,dfe24, 73.222es59. 1973.222nsSEe例例LSR=SSRSE00. 8ix33.10ixSEqLSRpdf , nMSSEe故:故:查查附表附表7,当,当df24时,时,p2,3的的q值,值,再根据公式计算尺度值再根据公式计算尺度值LSR ,结果列于下表结果列于下表解:已知误差项均方解:已知误差项均方 ,dfe24, 73.222es59. 1973.222nsSEe例例LSR=qSE00. 8ix33.10ix将全

12、部平均数从大到小顺次排列,然将全部平均数从大到小顺次排列,然后算出各平均数间的差数。后算出各平均数间的差数。凡达到凡达到0.05水平差异的差数在右上角水平差异的差数在右上角标一个标一个“”号,凡达到号,凡达到0.01水平差水平差异的差数在右上角标两个异的差数在右上角标两个“”号,号,凡未达到凡未达到0.05水平差异的则不予标记。水平差异的则不予标记。 方法方法:将全部平均数从大到小,从左至右顺:将全部平均数从大到小,从左至右顺次排列,次排列,凡差数不显著的两个处理平均数的下面划一相连凡差数不显著的两个处理平均数的下面划一相连的横线,差异显著的则不连线。的横线,差异显著的则不连线。 SSRaab

13、AAAbijiijetxx表表6.16.1数据数据的线性模型(总体符号表示):的线性模型(总体符号表示): x xijiji iijij 样本符号表示:样本符号表示:要求要求ij 是相互独立的,且服从标准正态是相互独立的,且服从标准正态分布分布 N(0,2 )进行方差分析的基础;进行方差分析的基础;自由度与平方和分解的依据。自由度与平方和分解的依据。数学模型数学模型:根据的根据的i i不同假定,可将数学模型分为以下三种不同假定,可将数学模型分为以下三种:固定模型固定模型随机模型随机模型混合模型混合模型(一)数学模型类型(一)数学模型类型( (一一) )固定模型固定模型(fixed model)

14、(fixed model)指各个处理的效应值指各个处理的效应值i i 是固定值是固定值,各个的,各个的平均效应平均效应i i i i 是一个常量,且是一个常量,且i i 0 0。就是说除去随机误差以后每个处理所产生。就是说除去随机误差以后每个处理所产生的效应是固定的。的效应是固定的。实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。( (二二) )随机模型随机模型(random model)(random model)指各处理的效应值指各处理的效应值i i 不是固定的数值,而不是固定的数值,而是由随机因素所引起的效应。是由随机因素所引起的效应。这里这里i i 是一个随机变量,是从期

15、望均值为是一个随机变量,是从期望均值为 0 0,方差为方差为2 2 的标准正态总体中得到的随机变量。得的标准正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。出的结论可以推广到多个随机因素的所有水平上。(生态学调查样方推断群落的特征)(生态学调查样方推断群落的特征)方差分析和期望均方表方差分析和期望均方表22n 2随机模型随机模型05. 02222209. 477.1779.72FnssFet 遗传率:遗传率:606707717512751272222. gegh( (三三) )混合模型混合模型(mixed model)(mixed model)指多因素试验中既有固定因素

16、又有随机因素指多因素试验中既有固定因素又有随机因素时所用的模型时所用的模型在实际应用中,固定模型应用最多,随在实际应用中,固定模型应用最多,随机模型和混合模型相对较少机模型和混合模型相对较少20:0H对于单因素方差分析来说,两种模型无多大区别对于单因素方差分析来说,两种模型无多大区别) 1/()(2.kxxi22 2 22 2 2S S2 2E E试验误差试验误差 2 2+n+n 2 2ABAB 2 2+n+n 2 2ABAB 2 2+n+n ABAB2 2S S2 2ABABA AB B互作互作 2 2+n+n 2 2ABAB+an+an B B2 2 2 2+n+n 2 2ABAB+an+

17、an B B2 2 2 2+an+an B B2 2S S2 2B BB B因素因素 2 2+bn+bn A A2 2 2 2+n+n 2 2ABAB+bn+bn A A2 2 2 2+bn+bn A A2 2S S2 2A AA A因素因素混合模型混合模型(A(A随机,随机,B B固定固定) )随机模型随机模型固定模型固定模型期望均方(期望均方(EMSEMS)MSMS变异来源变异来源变异来源变异来源DFSSMSF期望均方(期望均方(EMSEMS)固定模型固定模型随机模型随机模型处理间处理间k1 1nst2st2/se2 2 2n n 2 2 2 2n n 2 2误差误差k(n1)1)se2

18、2 2 2 2总变异总变异nk1 1 2)(xxi2 )(iijxx2 )(xxijixDFT=nk-1=451=19DFt=k-1=51=4DFe=k(n-1)=5(41)=15矫正数矫正数 C=T2/nk=5262/(54)=13833.824022130242222. CCxSST230180981082222. CCnTSSit010123012402. eSS无效假设:无效假设:H0:A=B=E HA:A、B、E 不全相等不全相等求得求得 F75.3/6.7311.19查附表查附表5,当,当df14,df215时,时,F0.014.89,推断。推断。方差分析表见下页方差分析表见下页2

19、9714736. SESSRSELSR 查查SSR表得表得p2,3,4,5时的值,计算得:时的值,计算得:aabbcAAABCbBBC变异来源变异来源DFSSMSF期望均方(期望均方(EMSEMS)固定模型固定模型随机模型随机模型处理间处理间k1 1st2st2/se2 2 2n n 2 2 2 2n n 2 2误差误差se2 2 2 2 2总变异总变异 组内观察值数目不等的单向分组资料的方差分析1 inkni 2)(xxnii2 )(iijxx2 )(xxij41.848225/5 .460/22.NxC222222.22222(21.519.517.016.0 ) 8482. 418567

20、. 75 8482. 41 85.34/(121.0 /6 103.0 /6 91.5 /5 78.8 /4 66.5 /4)8482. 418528. 91 8482. 41 46.5085.34 46.5038.841 25 1TijtiieTtTSSxCSSTn CSSSSSSdfN 241 5 1 424 420teTtdfkdfdfdf nMSSex/96. 4254456625151112222220iiinnnkn625. 096. 4/94. 1/0 nMSSEe三、三、 系统分组资料的方差分析系统分组资料的方差分析 如果试验资料分为如果试验资料分为l 个组,每个组内个组,每个

21、组内又分为又分为 m个亚组,每个亚组又再分为若个亚组,每个亚组又再分为若干个小亚组。如此分下去,直至最后一干个小亚组。如此分下去,直至最后一个小亚组具有个小亚组具有n个观察值,这种分组资料个观察值,这种分组资料称为称为系统分组资料系统分组资料。 设一系统分组资料共有设一系统分组资料共有l组,每组组,每组内又分内又分m个亚组,每一亚组内有个亚组,每一亚组内有n个观察值,则该资料共有个观察值,则该资料共有lmn个个观察值。观察值。数据模式数据模式。二级系统分组资料且每组观察值数目相等二级系统分组资料且每组观察值数目相等一、数学结构与变异来源分解一、数学结构与变异来源分解对于表对于表6.106.10

22、资料中任一观察值,其数学模型资料中任一观察值,其数学模型为:为: 总体平均数总体平均数i=(i )组效应)组效应ij=( ij i )亚组效应)亚组效应ijk=(xijk-ij)随机误差)随机误差ijkjiijix上式表明,任一观察值的总变异可分解为:上式表明,任一观察值的总变异可分解为:用样本符号可表示为用样本符号可表示为), 2 , 1;, 2 , 1;, 2 , 1(nkmjliedtxxijkijiijk组间变异;组间变异;同一组内亚组间变异;同一组内亚组间变异;同一亚组内各观察值的变异(试验误差)同一亚组内各观察值的变异(试验误差). 总变异总变异 : 自由度自由度 平方和平方和 l

23、mnTCCxxxSSlmndflmnTT2122)(12. 组间变异:组间变异: 自由度自由度 平方和平方和CmnTxxmnSSldfilitt221)(1二、自由度与平方和的分解二、自由度与平方和的分解3.同一组内亚组间的变异同一组内亚组间的变异自由度自由度平方和平方和mnTnTxxnSSmldfiijilmijee 22211111)()(4. 亚组内的变异(误差):亚组内的变异(误差):自由度自由度平方和平方和nTxxxSSnlmdfijijkijlmnijkee 222111221)()(SSt, SSd, Sse分别代表组间、组内亚组间和误差平方和。 当测验组间平均数的差异时,用当测

24、验组间平均数的差异时,用组内亚组间的均方作分母,即组内亚组间的均方作分母,即1etMSMSF 当测验组内亚组间平均数的差异当测验组内亚组间平均数的差异时,以误差均方作分母,即时,以误差均方作分母,即21eeMSMSF 三、三、F F 测验测验2)(xxmni2)(iijxxn2)(ijijkxx2)( xxijk2ts2221eess22es221etss21es222mnn22n2222n222mnn用种不同浓度的农用保水剂蘸根,用种不同浓度的农用保水剂蘸根, 每种浓每种浓度的处理各种盆,一星期后每盆测定株度的处理各种盆,一星期后每盆测定株的发根数,其结果如表的发根数,其结果如表6.12,试

25、做方差分析。,试做方差分析。例例1、自由度与平方和的分解、自由度与平方和的分解59154316031647846365543618222222 lmndfCCxSSlmnTCTT.l=3 , m=4 , n=5213120251542542101542222 ldfCCmnTSStit.总变异总变异组间变异组间变异9)14(3)1(00. 35425421015456539371222222221 mldfmnTnTSSeiije组内亚组间变异组内亚组间变异48)15(43)1(40.6200.320.25160.31622 nlmdfSSSSSSSSedtTe误差变异(亚组内变异)误差变异(

26、亚组内变异)2、方差分析与、方差分析与F测验测验方差分析表方差分析表 Ft=MSt/MSe1Fd=MSe1/MSe2 以上结果表明,不同浓度蘸根对栽以上结果表明,不同浓度蘸根对栽后发根有极显著的影响;而同一浓度不后发根有极显著的影响;而同一浓度不同盆间无显著差异。同盆间无显著差异。为什么对不同变异来源的为什么对不同变异来源的F测测验其分母不同?验其分母不同?3、多重比较(、多重比较(SSR) 根根12850543301. mnMSSex 各浓度平均数的比较各浓度平均数的比较由前面的方差分析可知,由前面的方差分析可知,MSe1=0.33当当dfe1=9时,由附表时,由附表6查得查得k=2,3的的

27、SSR0.05和和SSR0.01的值,的值,LSR0.05=SSR0.05LSR0.01=SSR0.01SE求出相应的求出相应的LSR0.05和和LSR0.01的值。的值。SE各浓度平均数比较的各浓度平均数比较的LSR值值LSR0.05 0.41 0.43LSR0.01 0.59 0.62K 2 3 SSR0.05 3.20 3.34 SSR0.01 4.60 4.86表表6.13-b 不同浓度保水剂蘸根的差异显著性不同浓度保水剂蘸根的差异显著性(SSR)推断:三种处理相互之间的差异均达推断:三种处理相互之间的差异均达极显著水平。极显著水平。 a b c ABC尺度尺度nMSSEe2 组内平均

28、数进行比较时:组内平均数进行比较时:mnMSSEe1 一、组合内只有单个观察值的两向分组资料的一、组合内只有单个观察值的两向分组资料的方差分析方差分析线性模型:线性模型:ijjiijx. ax2.x1.x.bx.2x.1x.x. ixA因素B因素总和Ti平均数 B1B2BbA1x11x12x1bT1A2x21x22x2bT2Aax a1x a2xabTa总和T1T2TbT 平均数 .jx.jTBATSSSSSScx)xx(2ij2ij 变异变异来源来源DFSSMSFEMS(混合混合模型;模型;A固固定,定,B B随机随机) )A因因素素a1 1SSA=b 2 2+b 2 2 B因因素素b1 1

29、SSB=a 2 2+a 2 2 误差误差(a-1)(b-1)(b-1)SSe=s2e 2 2总变总变异异ab1 1SST= caT)xx(2j2j cbT)xx(2i2i 2As2Bs22eAss22eBss例例1、自由度与平方和的分解、自由度与平方和的分解231461621146565603894878461059222222 abdfCCxSSabTCTT.516876542502632432222 tiAdfCCbTSS.总变异总变异处理间变异处理间变异314145563753823752222 bdfCCaTSSBjB.组间变异组间变异1535113043455876562114 )(.badfSSSSSSSSeBATe误差变异误差变异2、方差分析与、方差分析与F测验(略)测验(略)方方 差差 分分 析析 表表 3、处理间比较(略,自己看)、处理间比较(略,自己看)ijkijjiijkexX )(. 1 .xA因素因素B因素因素总和总和T TiB1B2BbA1x111x121 x1b1T1x112x122x1b2 x11nx12n x1bnA2x211x221 x2b1T2x212x222 x2b2 x21nx22n x2bn Aaxa11xa21 xab1Taxa12xa22 xab2 xa1axa2a xabn总和总和T TJ JT1 1T2 2 Tb bT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论