2.1-第六章 方差分析ppt课件_第1页
2.1-第六章 方差分析ppt课件_第2页
2.1-第六章 方差分析ppt课件_第3页
2.1-第六章 方差分析ppt课件_第4页
2.1-第六章 方差分析ppt课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 方差分析方差分析第一节第一节 方差分析的基本原理方差分析的基本原理第二节第二节 多重比较多重比较第三节第三节 方差分析的基本假定和数据转换方差分析的基本假定和数据转换第一节第一节 方差分析的基本原理方差分析的基本原理 所谓方差分析所谓方差分析(analysis of variance) ,是关于是关于k(k3)个个样本平均数的假设测验方法,是将总变异剖分为各个变异来样本平均数的假设测验方法,是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。度的一种统计分析方法。 假设测验的依据是

2、假设测验的依据是:扣除了各种试验原因所引起的扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计变异后的剩余变异提供了试验误差的无偏估计 。 方差是平方和除以自由度的商。方差是平方和除以自由度的商。 一、自由度和平方和的分解一、自由度和平方和的分解 设有设有k组数据,每组皆具组数据,每组皆具n个观察值,则该资料共有个观察值,则该资料共有nk个观个观察值,其数据分组如表察值,其数据分组如表6.1。表表6.1 6.1 每组具每组具n n个观察值的个观察值的k k 组数据的符号表组数据的符号表组别组别观察值观察值 ( yij,i=1,2,k;j=1,2,n)总和总和平均平均均方均方1y

3、11y12y1jy1nT12y21y22y2jy2nT2iyi1yi2yijyinTikyk1yk2ykjyknTkyyTij1y2yiykyy21s22s2is2ks 在表在表6.1中,总变异是中,总变异是nk个观察值的变异,故其自由度个观察值的变异,故其自由度v = nk1,而其平方和,而其平方和SST则为:则为:nknkijijTCyyySS1122)((61)其中的其中的C称为矫正数:称为矫正数: nkTnkyC22)(62)对于第对于第 i 组的变异,有组的变异,有212121121212)()()()(2)()()(yynyyyyyyyyyyyyyyyyinjiijnjinjiii

4、jnjiijnjiiijnjij从而总变异从而总变异(61)可以剖分为可以剖分为: kiikinjiijkinjijTyynyyyySS12112112)()()((63) 即即 总平方和总平方和=组内组内(误差误差)平方和平方和+处理平方和处理平方和 组间变异由组间变异由k个个 的变异引起,故其自由度的变异引起,故其自由度 v =k1 , 组组间平方和间平方和 SSt 为:为:iykkiitCnTyynSS1122)( 组内变异为各组内观察值与组平均数的变异,故每组具有组内变异为各组内观察值与组平均数的变异,故每组具有自由度自由度 v =n1和平方和和平方和 ;而资料共有;而资料共有k 组,

5、故组,故组内自由度组内自由度 v = k (n1) ,组内平方和组内平方和 SSe 为:为: niijyy12)( kntTiijeSSSSyySS112)( (65) (64) 因而,得到表因而,得到表6.1类型资料的自由度分解式为:类型资料的自由度分解式为:1)(1)(1)(nkknk(66) 总自由度总自由度DFT =组间自由度组间自由度DFt +组内自由度组内自由度DFe 求得各变异来源的自由度和平方和后,进而可得求得各变异来源的自由度和平方和后,进而可得:(67)()()()(1 2 1 222222nkyysMSkyynsMSnkyysMSiijeeittijTT组内均方组内均方组

6、间的均方组间的均方总的均方总的均方 例例6.1 以以A、B、C、D 4种药剂处理水稻种子,其中种药剂处理水稻种子,其中A为对照,每处理各得为对照,每处理各得4个苗高观察值个苗高观察值(cm),其结果如表,其结果如表6.2,试分解其自由度和平方和。试分解其自由度和平方和。 表表6.2 6.2 水稻不同药剂处理的苗高水稻不同药剂处理的苗高(cm)(cm)药剂药剂苗高观察值苗高观察值总和总和Ti 平均平均 A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336 =21iyy 根据(66)进行总自由度的剖分: 总变异

7、自由度DFT=(nk1)=(44)1=15 药剂间自由度DFt=(k1)=41=3 药剂内自由度DFe=k(n1)=4(41)=12根据根据(63)进行总平方和的剖分:进行总平方和的剖分:70564433622nkTC6023221182222CCySSijT5044)116569272()(2222122C/CnTyynSSkiit或或 504)2129()2114()2123()2118(42222tSS98504602)(1111222tTknnkkiijiijeSSSSnTyyySS或或 药剂药剂A内:内: 药剂药剂B内:内: 药剂药剂C内:内: 药剂药剂D内:内:3847213202

8、118222221eSS2049222262420222222eSS2645614171510222223eSS14411632292728222224eSS所以所以 kniijeyySS1129814262038)( 进而可得均方:进而可得均方: 1340156022./sMSTT0016835042./sMStt17812982./sMSee二、二、F分布与分布与F测验测验 在一个平均数为在一个平均数为 、方差为、方差为 的正态总体中,随机抽的正态总体中,随机抽取两个独立样本,分别求得其均方取两个独立样本,分别求得其均方 s12 和和 s22,将,将 s12 和和 s22 的比值定义为的比

9、值定义为F:22221)(ssF21,(68)此此F值具有值具有s12 的自由度的自由度 v1 和和 s22 的自由度的自由度 v2。 所谓所谓F分布,就是在给定的分布,就是在给定的 v1 和和 v2 下按上述方法从下按上述方法从正态总体中进行一系列抽样,就可得到一系列的正态总体中进行一系列抽样,就可得到一系列的F 值而作值而作成一个分布。成一个分布。 F分布下一定区间的概率可从已制成的统计表查出。 F分布曲线特征:(1具有平均数 =1(2取值区间为0,;(3某一特定曲线的形状则仅决定于参数 v1和 v2 。在 v1=1或 v1=2时,F分布曲线是严重倾斜成反向J型;F0.51.01.52.0

10、2.53.03.54.04.55.05.56.00.00.20.40.60.81.0Ff(F)当当 v13时,曲线转为偏态时,曲线转为偏态(图图6.1)。4, 5215, 2215, 121图图6.1 F分布曲线分布曲线(随(随v1和和v2的不同而不同)的不同而不同)F测验需具备条件:(1)变数y遵循正态分布N( , ),(2) s12 和 s22 彼此独立 。 2 在在F 测验中,如果作分子的均方小于作分母的均方,测验中,如果作分子的均方小于作分母的均方,则则F0.05,应接受,应接受H0。 例例6.2 测定东方红测定东方红3号小麦的蛋白质含量号小麦的蛋白质含量10次,得均方次,得均方 s1

11、2 =1.621;测定农大;测定农大139小麦的蛋白质含量小麦的蛋白质含量5次,得均方次,得均方 s22 =0.135。试测验东方红。试测验东方红3号小麦蛋白质含量的变异是否号小麦蛋白质含量的变异是否比农大比农大139为大。为大。 假设假设H0:东方红小麦总体蛋白质含量的变异和农大:东方红小麦总体蛋白质含量的变异和农大139一样,即一样,即 ,对,对 。 22210:H2221:HA 显著水平显著水平 =0.05,v1=9,v2 =4时,时,F0.05 =6.00。 测验计算测验计算: F =1.621/0.135=12.01 此此FF0.05,即,即PF0.01F0.05 。 推断:否认推断

12、:否认 ,接受,接受 ;即药剂间;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。同效应的。 220:etH22:etAH 例例6.1和例和例6.3的分析结果可以归纳在一起,列出方差的分析结果可以归纳在一起,列出方差分析表,如表分析表,如表6.3所示。所示。表表6.3 6.3 水稻药剂处理苗高方差分析表水稻药剂处理苗高方差分析表变异来源变异来源DFSSMSF显著显著F值值药剂处理间药剂处理间 3504168.0020.56F 0.05(3,12) = 3.49 药剂处理内药剂处理内(误差误差)12 98 8.17F 0.

13、01(3,12) =5.95总总15602第二节第二节 多重比较多重比较 所谓多重比较所谓多重比较multiple comparisons是指一个是指一个试验中试验中k个处理平均数间可能有个处理平均数间可能有k(k1)/2个比较,亦称个比较,亦称为复式比较。为复式比较。 多重比较有多种方法,本节将介绍常用的三种:多重比较有多种方法,本节将介绍常用的三种: 最小显著差数法最小显著差数法 复极差法复极差法( q法法) Duncan氏新复极差法氏新复极差法一、最小显著差数法一、最小显著差数法 最小显著差数法最小显著差数法(least significant difference,简称,简称LSD法法

14、), 法实质上是第五章的法实质上是第五章的t 检验。检验。 其程序是:其程序是: (1在处理间的在处理间的F测验为显著的前提下,计算出显著测验为显著的前提下,计算出显著水平为水平为 的最小显著差数的最小显著差数 ; (2任何两个平均数的差数任何两个平均数的差数( ),如其绝对值,如其绝对值 ,即为在水平上差异显著;反之,则为在水平上差异,即为在水平上差异显著;反之,则为在水平上差异不显著。不显著。 LSDjiyy LSD知:知: )21ji,k,jisyytjiyyji;,(假设假设|t| , 即为在即为在 水平上显著。水平上显著。t因而,最小显著差数为:因而,最小显著差数为:jiyy jiy

15、ystLSD(69)当两样本的容量当两样本的容量n相等时,相等时,nsseyyji22 在方差分析中,上式的在方差分析中,上式的se2有了更精确的数值有了更精确的数值 MSe因为此自由度增大),因而因为此自由度增大),因而(69)中中 的为:的为:jiyyseMSnMSseyyji2 (610) 例例6.4 试以试以LSD法测验表法测验表6.2资料各种药剂处理的苗高资料各种药剂处理的苗高平均数间的差异显著性。平均数间的差异显著性。 由由(例例6.3)计算得计算得F=20.56为显著,为显著,MSe=8.17,DFe=12,故故 )(cm02241782.sjiyy由附表由附表4,v =12时,

16、时,t0.05 =2.179,t0.01=3.055故故 LSD0.05 =2.1792.02=4.40(cm) LSD0.01=3.0552.02=6.17(cm) 然后将各种药剂处理的苗高与对照苗高相比,差数大然后将各种药剂处理的苗高与对照苗高相比,差数大于于4.40cm为差异显著;大于为差异显著;大于6.17cm为差异极显著。为差异极显著。 二、二、q法法 q测验是测验是Student-Newman-Keul基于极差的抽样分布理基于极差的抽样分布理论提出来的,或称复极差测验,有时又称论提出来的,或称复极差测验,有时又称SNK测验或测验或NK测测验。验。 q法是将一组法是将一组k个平均数由

17、大到小排列后,根据所比较的个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值显著极差值 的。的。 q测验因是根据极差抽样分布原理的,其各个比较都可测验因是根据极差抽样分布原理的,其各个比较都可保证同一个保证同一个 显著水平。显著水平。LSR q测验尺度值构成为:测验尺度值构成为:SEqLSRpdf,;(611)nMSSEe/ (612) 式中式中2pk,p是所有比较的平均数按大到小顺序排列所是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数计算出的两极差范围内所包含的平均

18、数个数(称为秩次距称为秩次距)。 SE为平均数的标准误,可见在每一显著水平下该法有为平均数的标准误,可见在每一显著水平下该法有k1个尺度值。个尺度值。平均数比较时,尺度值随秩次距的不同而异。平均数比较时,尺度值随秩次距的不同而异。例例6.5 试对表试对表6.2资料的各平均数作资料的各平均数作q测验。测验。 由由6.1资料得:资料得: 431429214178././nMSSEe 查附表7 q值表,当DF=12时,p=2,3,4的 值,并由(611)计算出尺度值 ,列于表6.4。qLSRpq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.39

19、7.2144.205.506.017.87表表6.4 表表6.2资料资料 值的计算值的计算(q测验测验) LSR由表由表6.2可知可知, =29cm, =23cm, =18cm, =14cm。:。:由此可得到由此可得到- - - -当当p=2时,时, =6(cm)5水平上显著;水平上显著; =5(cm)5水平上显著;水平上显著; =4(cm)不显著。不显著。当当p=3时,时, =11(cm)1水平上显著;水平上显著; =9(cm)1水平上显著。水平上显著。当当p=4时,时, =15(cm)1水平上显著。水平上显著。DyByAyCyBDyy AByy CAyy ADyy CDyy CByy 三、

20、新复极差法三、新复极差法新复极差法是新复极差法是D.B. Duncan(1955)基于不同秩次距基于不同秩次距p下下的最小显著极差变幅比较大而提出的,又称最短显著极差的最小显著极差变幅比较大而提出的,又称最短显著极差法法( shortest significant ranges,SSR )。pSSRSELSR,pSSR,查得查得 后,有后,有(613) 此时,在不同秩次距此时,在不同秩次距p下,平均数间比较的显著水平下,平均数间比较的显著水平按两两比较是按两两比较是 ,但按,但按p个秩次距则为保护水平个秩次距则为保护水平 1p)(11例例6.6 试对表试对表6.2资料的各平均数作新复极差测验。

21、资料的各平均数作新复极差测验。 知知 =29cm, =23cm, =18cm, =14cm, MSe=8.17,DyByAyCy 查附表查附表8,得值,由,得值,由(613)算得在算得在p=2,3,4时的值时的值(表表6.5),即为测验不同,即为测验不同p时的平均数间极差显著性的尺度值。时的平均数间极差显著性的尺度值。)1.43(cmSEpSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69表表6.5 表表6.2资料资料LSR值的计算值的计算(新复极差测验新复极差测验)当当p=2时,时,

22、=6(cm) 5水平显著;水平显著; =5(cm) 5水平显著;水平显著; =4(cm) 不显著。不显著。当当p=3时,时, =11(cm) 1水平上显著;水平上显著; =9(cm) 1水平上显著。水平上显著。当当p=4时,时, =15(cm)1水平上显著。水平上显著。BDyy AByy CAyy ADyy CByy CDyy 结论:表结论:表6.2资料的资料的4个处理的苗高,除处理个处理的苗高,除处理A与与C差异差异不显著外,其余处理间均达显著差异,本例结果与上面介绍不显著外,其余处理间均达显著差异,本例结果与上面介绍的的q测验法相同,但测验法相同,但q法的法的 要比新复极差法的要比新复极差

23、法的 大。大。LSRLSR四、多重比较结果的表示方法四、多重比较结果的表示方法(一一) 列梯形表法列梯形表法(二二) 划线法划线法(三三) 标记字母法标记字母法 将全部平均数从大到小顺次排列,然后算出各平将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到均数间的差数。凡达到 =0.05水平的差数在右上角水平的差数在右上角标一个标一个“*”号,凡达到号,凡达到 =0.01水平的差数在右上角水平的差数在右上角标两个标两个“*”号号,凡未达到凡未达到 =0.05水平的差数则不予标水平的差数则不予标记。若以列梯形表法表示,则成表记。若以列梯形表法表示,则成表6.6。(一一) 列梯形表法列梯

24、形表法处理处理平均数平均数( )差差 异异 14 18 23D2915*11*6*B239*5*A184C14表表6.6 表表6.2资料的差异显著性资料的差异显著性(新复极差测验新复极差测验)iyiyiyiy优点:十分直观,优点:十分直观,缺点:占篇幅较大,特别是处理平均数较多时。缺点:占篇幅较大,特别是处理平均数较多时。 (二二) 划线法划线法 将平均数按大小顺序排列,以第将平均数按大小顺序排列,以第1个平均数为标准与以后个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第连接起来,依次以第2,k1个平

25、均数为标准按上述方个平均数为标准按上述方法进行。这种方法称划线法。下面就是表法进行。这种方法称划线法。下面就是表6.2资料用划线法标资料用划线法标出出0.01水平下平均数差异显著性结果水平下平均数差异显著性结果(q法法)。29cm(D)23cm(B)18cm(A)14cm(C) 优点:直观、简单方便,所占篇幅也较少。优点:直观、简单方便,所占篇幅也较少。 (三三) 标记字母法:标记字母法: (1将全部平均数从大到小依次排列。将全部平均数从大到小依次排列。 (2在最大的平均数上标上字母在最大的平均数上标上字母a;将该平均数与以下;将该平均数与以下各平均数相比,相差不显著的,都标上字母各平均数相比

26、,相差不显著的,都标上字母a,直至某一个,直至某一个与之相差显著的平均数则标以字母与之相差显著的平均数则标以字母b(向下过程向下过程), (3再以该标有再以该标有b的平均数为标准,与上方各个比它大的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母的平均数比,凡不显著的也一律标以字母b(向上过程向上过程); 再以该标有再以该标有b的最大平均数为标准,与以下各未标记的平均的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母数比,凡不显著的继续标以字母b,直至某一个与之相差显,直至某一个与之相差显著的平均数则标以字母著的平均数则标以字母c。 (4如此重复进行下去,直

27、至最小的一个平均数有了如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。标记字母且与以上平均数进行了比较为止。 (5这样各平均数间,凡有一个相同标记字母的即为这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。差异不显著,凡没有相同标记字母的即为差异显著。 在实际应用时,可以小写字母表示在实际应用时,可以小写字母表示 =0.05显著水平,显著水平,大写字母表示大写字母表示 =0.01显著水平。显著水平。 (1在表在表6.7上先将各平均数按大小顺序排列,并在上先将各平均数按大小顺序排列,并在行上标行上标a。 (2由于由于 与与 呈

28、显著差异,故呈显著差异,故 上标上标b。 (3然后以然后以 为标准与为标准与 相比呈显著差异,故标相比呈显著差异,故标c。 (4以以 为标准与为标准与 比,无显著差异,仍标比,无显著差异,仍标c。 同理,可进行同理,可进行4个在个在1水平上的显著性测验,结果列水平上的显著性测验,结果列于表于表6.7。例例6.7 试对例试对例6.6测验结果作出字母标记。测验结果作出字母标记。DyByDyByByAyAyCy表表6.7 6.7 表表6.26.2资料的差异显著性资料的差异显著性( (新复极差测验新复极差测验) )处 理苗 高平均数(cm)差异显著性0.050.01D29 a AB23 b ABA18

29、 c BCC14 c C 由表由表6.7就可清楚地看出,该试验除就可清楚地看出,该试验除A与与C处理无显著差处理无显著差异外,异外,D与与B及及A、C处理间差异显著性达到处理间差异显著性达到 =0.05水平。水平。处理处理B与与A、D与与B、A与与C无极显著差异;无极显著差异;D与与A、C,B与与C呈极显著差异。呈极显著差异。五、多重比较方法的选择五、多重比较方法的选择多重比较方法选用原则:多重比较方法选用原则: (1试验事先确定比较的标准,凡与对照相比较,或试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;与预定要比较的对象比较,一般可选用最小显著差

30、数法; (2根据否定一个正确的根据否定一个正确的H0和接受一个不正确的和接受一个不正确的H0的相对重要性来决定。的相对重要性来决定。 方差分析的基本步骤是:方差分析的基本步骤是: (1将资料总变异的自由度和平方和分解为各变异原将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并进而算得其均方;因的自由度和平方和,并进而算得其均方; (2计算均方比,作出计算均方比,作出F 检验,以明了各变异因素的检验,以明了各变异因素的重要程度;重要程度; (3对各平均数进行多重比较。对各平均数进行多重比较。 第三节第三节 方差分析的基本假定和数据转换方差分析的基本假定和数据转换一、方差分析的基本假

31、定一、方差分析的基本假定二、数据转换二、数据转换一、方差分析的基本假定一、方差分析的基本假定 方差分析是建立在线性可加模型的基础上的。所有进方差分析是建立在线性可加模型的基础上的。所有进行方差分析的数据都可以分解成几个分量之和,以例行方差分析的数据都可以分解成几个分量之和,以例6.13资料资料(样本样本)采用采用6生长素处理试验资料为例,该资料具有三生长素处理试验资料为例,该资料具有三类原因或效应:类原因或效应: (1)处置处置(生长素生长素)原因或效应;原因或效应; (2)环境环境(组组)原因或效应;原因或效应; (3)试验误差试验误差(这是处理内和环境内的其它非可控因素这是处理内和环境内的

32、其它非可控因素的变异的变异)。故其线性模型为:故其线性模型为:ijijijy 建立这一模型,有如下建立这一模型,有如下3个基本假定:个基本假定: (1) 处理效应与环境效应等应该具有处理效应与环境效应等应该具有“可加可加性性”(additivity) 以组合内只有单个观察值的两向分组资料以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明,如对其取离差式,那么的线性可加模型为例予以说明,如对其取离差式,那么)()(ijjiijy上式两边各取平方求其总和,则得平方和为:上式两边各取平方求其总和,则得平方和为:2222)(ijjiy (638) 因为三类原因均各自独立,所以右边有三个乘积

33、和,因为三类原因均各自独立,所以右边有三个乘积和,即即 、 和和 ,皆为零值。,皆为零值。 当从样本估计时,则为:当从样本估计时,则为:或或 eBATSSSSSSSS样本平方和的可加性样本平方和的可加性 :2222)()()()( yyyyyyayybyyjiji 对于非可加性资料,一般需作对数转换或其他转换,对于非可加性资料,一般需作对数转换或其他转换,使其效应变为可加性,才能符合方差分析的线性模型。使其效应变为可加性,才能符合方差分析的线性模型。 有一种非可加性事例是效应表现为倍加性。将倍加有一种非可加性事例是效应表现为倍加性。将倍加性数据转换为对数尺度,则又表现为可加性模型。如表性数据转

34、换为对数尺度,则又表现为可加性模型。如表6.37假设数字假设数字(不考虑误差不考虑误差). 表表6.37 6.37 可加性模型与非可加性模型的比较可加性模型与非可加性模型的比较处处 理理可加性可加性倍加性倍加性对倍加性取对数对倍加性取对数(lg10)121212A102010201.001.30B304030601.481.78 (2)试验误差试验误差 应该是随机的、彼此独立的,具有平应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即均数为零而且作正态分布,即“正态性正态性”(normality) . 因为多样本的因为多样本的F测验是假定测验是假定k个样本从个样本从k个正态总体中个正态

35、总体中随机抽取的,所以一定是随机性的。随机抽取的,所以一定是随机性的。 ij 如果试验误差如果试验误差 不作正态分布,则将表现为一个处理的不作正态分布,则将表现为一个处理的误差趋向于作为处理平均数的一种函数关系。例如,二项分误差趋向于作为处理平均数的一种函数关系。例如,二项分布数据,平均数为布数据,平均数为p,方差为,方差为p(1p)/n,方差与平均数有函,方差与平均数有函数关系。如果这种函数关系是已知的,则可对观察值进行反数关系。如果这种函数关系是已知的,则可对观察值进行反正弦转换或对数转换、平方根值转换,从而使误差正弦转换或对数转换、平方根值转换,从而使误差 作成近作成近似的正态分布。似的

36、正态分布。ij ij (3)所有试验处理必须具有共同的误差方差,即误差同质所有试验处理必须具有共同的误差方差,即误差同质性性(homogeneity) 因为方差分析中的误差项方差是将各处理的误差合并而因为方差分析中的误差项方差是将各处理的误差合并而获得一个共同的误差方差的,因此必须假定资料中有这样一获得一个共同的误差方差的,因此必须假定资料中有这样一个共同的方差存在,即假定各处理的个共同的方差存在,即假定各处理的 都具有都具有N(0, )的。的。这就是所谓误差的同质性假定。这就是所谓误差的同质性假定。 如果各处理的误差方差具有异质性如果各处理的误差方差具有异质性( ),则在假设,则在假设测验中

37、必然会使某些处理的效应得不到正确的反映。测验中必然会使某些处理的效应得不到正确的反映。 如果不同质如果不同质( ),可将方差特别大或变异特殊的处,可将方差特别大或变异特殊的处理从全试验中剔除,或者将试验分成几个部分,使每一部分理从全试验中剔除,或者将试验分成几个部分,使每一部分具有比较同质的误差方差,以作出较为准确的假设测验。具有比较同质的误差方差,以作出较为准确的假设测验。ij222i22i二、数据转换二、数据转换 对于并不符合基本假定的试验资料,在进行方差分析之前,对于并不符合基本假定的试验资料,在进行方差分析之前,一般可采用以下补救办法:一般可采用以下补救办法: (1剔除某些表现剔除某些

38、表现“特殊的观察值、处理或重复。特殊的观察值、处理或重复。 (2将总的试验误差的方差分裂为几个较为同质的试验将总的试验误差的方差分裂为几个较为同质的试验误差的方差。误差的方差。 (3针对数据的主要缺陷,采用相应的变数转换;然后针对数据的主要缺陷,采用相应的变数转换;然后用转换后的数据作方差分析。常用的转换方法有:用转换后的数据作方差分析。常用的转换方法有: 平方根转换平方根转换( square root transformation ) 如果样本平均数与其方差有比例关系,如如果样本平均数与其方差有比例关系,如poisson分分布那样,布那样, ,这种资料用平方根转换是有效的。,这种资料用平方根

39、转换是有效的。 采用平方根转换可获得一个同质的方差,同时也可减采用平方根转换可获得一个同质的方差,同时也可减小非可加性的影响。小非可加性的影响。 一般将原观察值一般将原观察值y转换成转换成 。这种转换常用于存在。这种转换常用于存在稀有现象的计数资料,例如稀有现象的计数资料,例如1平方米面积上某种昆虫的头平方米面积上某种昆虫的头数或某种杂草的株数等资料。数或某种杂草的株数等资料。 如果有些观察值甚小,甚至有零出现,则可用如果有些观察值甚小,甚至有零出现,则可用 转换。转换。2iiy1y 对数转换对数转换( logarithmic transformation ) 如果数据表现的效应为非可加性,而

40、成倍加性或可乘性,如果数据表现的效应为非可加性,而成倍加性或可乘性,同时样本平均数与其极差或标准差成比例关系,则采用对数同时样本平均数与其极差或标准差成比例关系,则采用对数转换,可获得一个同质的方差。转换,可获得一个同质的方差。 对于改进非可加性的影响,这一转换比之平方根转换更对于改进非可加性的影响,这一转换比之平方根转换更为有效。一般将为有效。一般将y转换为转换为lg y. 如观察值中有零而各数值皆不大于如观察值中有零而各数值皆不大于10,则可用,则可用lg(y+1)转转换。换。 反正弦转换反正弦转换(arcsine transformation) 如果资料系成数或百分数,则它将作二项分布,

41、而已如果资料系成数或百分数,则它将作二项分布,而已知这一分布的方差是决定于其平均数知这一分布的方差是决定于其平均数p的。所以,在理论的。所以,在理论上如果上如果p0.7皆需作反正弦转换,以获得一个比较皆需作反正弦转换,以获得一个比较一致的方差。反正弦转换是将百分数的平方根值取反正弦一致的方差。反正弦转换是将百分数的平方根值取反正弦值,即将值,即将p转换成转换成 ,从而成为角度。,从而成为角度。 附表附表12为百分数的反正弦转换表,可直接查得为百分数的反正弦转换表,可直接查得p的反的反正弦值。正弦值。 p1sin 采用几个观察值的平均数作方差分析采用几个观察值的平均数作方差分析 因为平均数比之单个观察值更易做成正态分布,如因为平均数比之单个观察值更易做成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论