方差分析原理_第1页
方差分析原理_第2页
方差分析原理_第3页
方差分析原理_第4页
方差分析原理_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2第六章方差分析第一节方差分析的基本原理上章介绍了 1个或两个样本平均数的假设测验方法。本章将介绍k(k>3)个样本平均数的假设测验方法,即方差分析(analysis of varianee)。方差分析就是将总变异剖分为各个变异来源 的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。其中,扣除方差了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依 据。因而,方差分析象上章的t测验一样也是通过将试验处理的表面效应与其误差的比较来进 行统计推断的,只不过这里采用均方来度量试验处理产生的变异和误差引起的变异而已。分析是科学的试验设计和分析中的

2、一个十分重要的工具。本章将在介绍方差分析基本原理和方法的基础上进一步介绍数学模型和基本假定。、自由度和平方和的分解方差是平方和除以自由度的商。 要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。下面先从简单的类型说起。设有k组数据,每组皆具n个观察值,6.1。则该资料共有nk个观察值,其数据分组如表表6.1 每组具n个观察值的k组数据的符号表组别观察值(yij , i=1,2,,k; j=1, 2,n)总和平均均方1y11y12y1jy1nT1y12S12y21y22-y2jy2nT2y

3、22S2MMMMMMMMiyi1yi2yijyinTiyi2SiMMMMMMMkyk1yk2ykjyknTkYks2T 乏 yij =Zyy在表6.1中,总变异是nk个观察值的变异,故其自由度 v=nk -1,而其平方和SST则为: nk_nk(6 1)SS =Z(yij y)2 =Zy2 -C1 1(6 1)中的C称为矫正数:(6 2)C=(竝工这里,nnk nk可通过总变异的恒等变换来阐明总变异的构成。对于第i组的变异,有_2n _2n _2n _ n - -Syij -y) =11 yj -yVi y)N)十皆®$)( Vi y)+2($ y)二 2 2 = 2(yij yi)

4、 +n (yi y)j 4总变异为第1, 2,k组的变异相加,利用上式总变异(6 1)可以剖分为:knokn2k2SSt =送送® y) =SZ(yij-yi) +n Z(yy)即总平方和SSt=组内(误差)平方和SSe+处理平方和组间变异由k个yi的变异引起,故其自由度 V =k-1,组间平方和kkfSS =n无(yi -y)=送/n -C11/组内变异为各组内观察值与组平均数的变异,故每组具有自由度n2Z(yij -yi)2 ;而资料共有k组,故组内自由度 v=k(n 1),组内平方和1(6 3)SStSS为:(6 4)V = n -1和平方和SSe 为:k n2sS3 =ZZ(

5、yij -%) =sst -SS1 1 因此,得到表6.1类型资料的自由度分解式为:(nk -1) =(k -1) +k(n -1)总自由度DFt=组间自由度DFt+组内自由度 求得各变异来源的自由度和平方和后,(6-5)(6DFe-6)总的均方mst2=St组间的均方MSt=St2组内均方MSe进而可得n k -1=辽(弘y)2-SZ(yj - Yi)2ZZ( yj -y)2(67)k(n-1)若假定组间平均数差异不显著 (或处理无效)时,(6 7)中MSt与MSe是b2的两个独立估 值,均方用 MS表示,也用s2表示,两者可以互换。其中组内均方 MSe也称误差均方,它是 由多个总体或处理所

6、提供的组内变异(或误差)的平均值。例6.1 以A、B、C、D 4种药剂处理水稻种子,其中A为对照,每处理各得 4个苗高观察值(cm),其结果如表6.2,试分解其自由度和平方和。表6.2 水稻不同药剂处理的苗高(cm)药剂苗高观察值总和Ti平均yiA18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336y =21根据(6 6)进行总自由度的剖分:总变异自由度 DF T= (n k-1) = (4 x4)-1 = 15药剂间自由度 DFt=(k-1) =4-1 =3药剂内自由度 DFe=k( n-1) =4x(4-

7、1) =12根据(6 3)进行总平方和的剖分:T 23362C = = =7056nk 4 x4SS Zyi2 -C =182 +212 +A + 322 -C =602kSSt =-y) -STj2/n-C =(722 +922 +562 +1162)/4 -C =5042 2 2 2SSt =4X(18 -21) +(23 -21) +(14 -21) +(29 -21) =504k n2nk2k2/SSe =ZZ(yij -Vi) =Zyij -ZTi /n =SSt SS =602-504 =981 1 /=182 +212 +202 +132 -722/4 =38=202 +242

8、+262 +222 -922/4 =20=102 +152 +172 +142 -562/4 =262 2 2 2 2 丿=28 +27 +29 +32 -116 /4=14药剂药剂药剂药剂内:内:内:SSe=ZZ(yij-yi )2=38 +20 +26 +14 =98误差平方和也可直接计算。进而可得均方:MSt =sTMStMSe =s2以上药剂内均方s2 =8.17系4种药剂内变异的合并均方值,它是表 估计;药剂间均方 st2 =168.00,则是不同药剂对苗高效应的变异。所以=602/15 =40.13=504/3 =168.00=98/12 =8.176.2资料的试验误差、F分布与F

9、测验分别求得其均方sj在一个平均数为 卩、方差为CT 2的正态总体中,随机抽取两个独立样本, 和s,将S12和s;的比值定义为F:(6 8)F(v V)2/2=& / S2此F值具有S12的自由度V1和s2的自由度V2。如果在给定的 匕和V2下按上述方法从正态总体中进行一系列抽样, 就可得到一系列的 F值而作成一个F分布。统计理论的研究证明,F分布乃具有平均数 4f=1和取值区间为0,8 的一组曲线;而某一特定曲线的形状则仅决定 于参数V1和叫。在*1 = 1或*1=2时,F分布曲线是严重倾斜成反向 J型;当V1 > 3时,曲线转 为偏态(图6.1)。F分布下一定区间的概率可从已

10、制成的统 计表查出。附表 5系各种v1和十2下右尾概率 a =0.05和a =0.01时的临界F值(一尾概率 表)。如查附表 5, w=3,十2=12 时,F0.05 = 3.49 , F0.01 = 5.95 ,即表示如以 V1 =3( n1=4)、 V2 = 12( n2=13)在一正态总体中进行连续抽样, 则所得F值大于3.49的概率仅有5%,而大于 5.95的仅有1%。附表5的数值设计是专供测 验s2的总体方差 切2是否显著大于s2的总体方 差b;而设计的(H0: b; W b;对Ha : b; > b;)。这时,F =S12/s;。若所得 F > F 0.05或 F0.0

11、1,则H0发生的概率小于等于0.05或0.01 ,应该在a =0.05或a =0.01水平上否定 H。,接受 的概率大于0.05或0.01,应接受H0。F图6.1 F分布曲线(随M和口的不同而不同)Ha;若所得 F< Fo.05或F V F0.01,贝U Ho发生在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否真实存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(例如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关,详情见后。在此测验中,如果作分子的均方小于作分母的均方,则F<1 ;此时不必查F表即可确定

12、P>0.05,应接受H0。2 2 2F测验需具备:(1)变数y遵循正态分布N (卩,CT),(2) S1和S2彼此独立两个条件。当 资料不符合这些条件时,需作适当转换,参见本章第六节。例6.2测定东方红3号小麦的蛋白质含量 10次,得均方sf =1.621 ;测定农大139小麦的蛋白质含量5次,得均方S; =0.135。试测验东方红3号小麦蛋白质含量的变异是否比农 大139为大。假设H0:东方红小麦总体蛋白质含量的变异和农大139 一样,即H0: cr12=cr;,对Ha: crf2> 2。显著水平取 a =0.05 , V1=9, V2=4 时,F0.05=6.00。测验计算:F

13、 =1.621/0.135 =12.01 此 F > F0.05,即 P< 0.05。139。以上这种比较两个事物变异大小的例子,在农业研究中是常常遇到的。例如比较杂种 代和F1代的变异大小,比较两种处理的草坪冻害程度等等,这些比较皆可应用 必须以大均方作分子而计算F值。例6.3 在例6.1算得药剂间均方St2 = 168.00,药剂内均方s2=8.17 ,V2 = 12。试测验药剂间变异是否显著大于药剂内变异? 假设 H0: cr;=cr2对 Ha: 寸 > 云,显著水平取 a =0.05 , F0.05 = 3.49。测验计算:F =168.00/8.1 7 =20.56

14、计算得F=20.56表示处理项的均方为误差项均方的20.56倍。查附表5F0.05=3.49 , F0.01 =5.95,实得 F > F0.01 > F0.05。F2F测验,但都具自由度Vi=3,=3, V2=12 时推断:否定H0,接受Ha,即东方红3号小麦蛋白质含量的变异大于农大推断:否定H0: bt2 = b;,接受Ha: 62 >b訂即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。以上通过例6.1说明了对一组处理的重复试验数据经对总平方和与总自由度的分解估计 出处理间均方和处理内均方(误差均方),并通过F =MSt/MSe测验处理间所表示出的差

15、异是 否真实(比误差大),这一方法即为方差分析法。这里所测验的统计假设是H0 W或£ =4b =% =4d对Ha :屛或£、4b、卩C和Ad间存在差异(不一定 £、和 4d间均不等,可能部分不等)。例6.1和例6.3的分析结果可以归纳在一起,列出方差分析 表,如表6.3所示。表6.3水稻药剂处理苗高方差分析表变异来源DFSSMSF显著F值药剂处理间3504168.0020.56 八Fo.O5(3,12) =3.49药剂处理内(误差)12988.17Fo.O1(3,12) =5.95总15602第二节多重比较上节对一组试验数据通过平方和与自由度的分解,将所估计的处理

16、均方与误差均方作比 较,由F测验推论处理间有显著差异,对有些试验来说方差分析已算告一段落,但对有些试 验来说,其目的不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,故需进一步做处理平均数间的比较。一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较(multiple comparisons)。通过方差分析后进行平均数间的多重比较,不同于处理间两两单独比较。因为(1)误差由多个处理内的变异合并估计,自由度增大了,因而比较的精确度也增大了;(2)由于F测验显著,证实处理间总体上有真实差异后再做两两平均数的比较,不大会像单独比较时

17、那样将个别偶然性的差异误判为真实差异。这种在F测验基础上再做的平均数间多重比较称为Fisher氏保护下的多重比较(Fisher 'p rotected multi pie comp ariso ns )。显然在无F测验保护时,4个处理做两两比较,每一比较的显著水平 a =0.05 , 4个处理间有6个比较,若处理间总体上无差异,每一比较误判 为有差异的概率为 0.05,贝y 6个比较中至少有1个被误判的概率为 a '=1 0.95 6 =0.2649。 若处理数k=10,则a '= 1 -0.95 45 =0.9006,因而尽管单个比较的显著水平为0.05,但从试验总体

18、上a(至少有1个误判的概率)是很大的,这说明通过F测验作保护是非常必要的。多重比较有多种方法,本节将介绍常用的三种:最小显著差数法、复极差法(q法)和Duncan氏新复极差法。、最小显著差数法最小显著差数法(least significant differenee,简称LSD法),LSD法实质上是第五章的t测验。其程序是:在处理间的F测验为显著的前提下,计算出显著水平为a的最小显著差数LSDa;任何两个平均数的差数(Vi -Vj),如其绝对值LSDa,即为在a水平上差异显著;反之,则为在a水平上差异不显著。这种方法又称为 F测验保护下的最小显著差数法(Fisher'Protected

19、LSD,或 FPLSD)。已知:t=匸亠,j=1, 2,A, k; i Hj) syi _yj若tl A t。, Vi -yj即为在a水平上显著。因此,最小显著差数为:-9),因此(6 9)中的LSDa=t4idj(6当两样本的容量n相等时,Sy =J2Se/n在方差分析中,上式的 S2有了更精确的数值 MSe (因为此自由度增大)10)(6Sy,占为:Syz =J2MSe/n例6.4 试以LSD法测验表6.2资料各种药剂处理的苗高平均数间的差异显著性。(2x8.17CCC,、Syi 卫=J4 =2.02( cm)4, V = 12 时,t0.05=2.179 , t0.01=3.055LSD

20、0.05=2.179 X 2.02 =4.40( cm) ; LSD0.01=3.055 X 2.02 =6.17( cm)由(例 6.3)计算得 F=20.56 为显著,MSe=8.17,DFe=12,由附表 故然后将各种药剂处理的苗高与对照苗高相比,差数大于4.40 cm为差异显著;大于6.17 cm为差异极显著。由表6.2可知:药剂D与A、D与C、以及B与C处理平均数差数分别为11、15和9,大于6.17,说明在0.01水平上差异显著;药剂 D与B、B与A处理平均数差数分 别为6和5,大于4.40,说明在0.05水平上差异显著;药剂 A与C处理平均数差数为 4,小 于4.40,差异不显著

21、。二、q法LSD法的t测验是根据两个样本平均数差数(k=2)的抽样分布提出的,但是一组处理(k>2)是同时抽取k个样本的结果。抽样理论指出k=2时与k>2,例如k=10时其随机极差是不同的,随着k的增大而增大,因而用 k=2时的t测验有可能夸大了 k=10时最大与最小两个 样本平均数差数的显著性。基于极差的抽样分布理论Student-Newman-Keul提出了 q测验或称复极差测验,有时又称 SNK测验或NK测验。q测验方法是将一组 k个平均数由大到小排列后, 根据所比较的两个处理平均数的差数是 几个平均数间的极差分别确定最小显著极差LSR值的。q测验因是根据极差抽样分布原理的,

22、其各个比较都可保证同一个 a显著水平。其尺度值构成为:(6 11)LSRj =qa df, pSESE=jMSe/ n(6 12)式中2< pw k, p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平 均数个数(称为秩次距),SE为平均数的标准误, 可见在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。例6.5 试对表6.2资料的各平均数作q测验。由6.1资料得:SE =jMSe / n = J8.17/4 =1.4292 "43查附表7 q值表,当DF = 12时,p=2, 3, 4的值,并由(6 11)计算出尺度值LSR, 列

23、于表6.4。Pqo.o5qo.o1LSR0.05lSrd.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表6.4 表6.2资料LSRa值的计算(q测验)由此可得到:由表6.2可知,当p=2 时,p=3 时,p=4 时,VD=29cm, Vb =23cm, ya = 18cm , yc =14cm。Vd - Vb =6(cm)Va =5( cm)yc =4( cm) yA=11(cm)Yc =9(cm)Vc =15( cm)Vb-Va-Vd-yB-Vd-5 %水平上显著;5 %水平上显著; 不显著。1 %水平上显著;1 %水平上显著。1

24、 %水平上显著。三、新复极差法不同秩次距P下的最小显著极差变幅比较大,(shortest significant ranges ,为此,D. B. Duncan(1955)SSR)。该法与q法相似,从表6.4可以发现,提出了新复极差法,又称最短显著极差法其区别在于计算最小显著极差LSRa时不是查q表而是查SSR表,所得最小显著极差值随着k增大通常比q测验时的减小。查得 SSR, P后,有LS = SE SSR, p(6 13)此时,在不同秩次距 P下,平均数间比较的显著水平按两两比较是a ,但按P个秩次距则为保护水平 a ' =1-(1 _a) Pd。例6.6 试对表6.2资料的各平均

25、数作新复极差测验。已知 Yd =29cm, Vb =23cm, Va =18cm, Vc =14cm, MSe=8.17 , SE=1.43(cm) 查附表8,得SSRt值,由(6 13)算得在p=2, 3, 4时的LS甩值(表6.5),即为测验不 同P时的平均数间极差显著性的尺度值。表6.5 表6.2资料LSR值的计算(新复极差测验)PSSF0.05SSFF).01LSRo.o5LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69当p=2时,yD- yB=6( cm)5 %水平显著;yB- y A=5( cm)5 %水平显著;y

26、A- yC=4( cm)不显著。当p=3 时,yD- yA=11(cm)1 %水平上显著;yB - yc=9(cm)1 %水平上显著。当p=4 时,Yd - yC =15( cm)1 %水平上显著。结论:表6.2资料的4个处理的苗高,除处理A与C差异不显著外,其余处理间均达显 著差异,本例结果与上面介绍的q测验法相同,但q法的LSR要比新复极差法的LSR大。四、多重比较结果的表示方法各平均数经多重比较后,应以简洁明了的形式将结果表示出来。常用的表示方法有:(一)列梯形表法将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到a =0.05水平的差“* ”号,凡未达到a =0.056.6

27、。数在右上角标一个“* ”号,凡达到a =0.01水平的差数在右上角标两个 水平的差数则不予标记。若以列梯形表法表示,则成表处理平均数(yi)差异y -14Yi -18yi -23D2915*11*6*B239*5*A184C14表6.6 表6.2资料的差异显著性(新复极差测验)该法十分直观,但占篇幅较大,特别是处理平均数较多时。因此,在科技论文中少见。(二)划线法以第将平均数按大小顺序排列,差异不显著的平均数用横线连接起来, 这种方法称划线法。下面就是表6.2法)。1个平均数为标准与以后各平均数比较,在平均数下方把依次以第2,,k-1个平均数为标准按上述方法进行。资料用划线法标出0.01水平

28、下平均数差异显著性结果(q29cm(D)23cm(B)18cm(A)14cm(C)该法直观、简单方便,所占篇幅也较少。(三)标记字母法:首先将全部平均数从大到小依次排列。然后在最大的平均数上标上字母a;并将该平均数与以下各平均数相比,凡相差不显著的,都标上字母a,直至某一个与之相差显著的平均数则标以字母b(向下过程),再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不 显著的也一律标以字母 b(向上过程);再以该标有b的最大平均数为标准, 与以下各未标记的Co平均数比,凡不显著的继续标以字母 b,直至某一个与之相差显著的平均数则标以字母 如此重复进行下去,直至最小的一个平均数有了标记

29、字母且与以上平均数进行了比较为止。这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,往往还需区分a =0.05水平上显著和a =0.01水平上显著。这时可以小写 字母表示a =0.05显著水平,大写字母表示 a =0.01显著水平。该法在科技论文中常常出现。例6.7试对例6.6测验结果作出字母标记。在表6.7上先将各平均数按大小顺序排列,并在yD行上标a。由于与Vb呈显著差异,6.7 o故Vb上标b。然后以Vb为标准与Ya相比呈显著差异,故标 C。以Va为标准与Vc比,无显著 差异,仍标C。同理,可进行4个y在1 %水平上的显著性测验,结果列

30、于表表6.7 表6.2资料的差异显著性(新复极差测验)处 理苗高平均数(cm)差异显著性0.050.01D29aAB23bABA18cBCC14cC由表6.7就可清楚地看出,该试验除 A与C处理无显著差异外,D与B及A、C处理间 差异显著性达到 a =0.05水平。处理 B与A、D与B、A与C无极显著差异;D与A、C,B 与C呈极显著差异。多重比较方法很多,可阅读其它参考书籍,以上列举的是常用的方法。五、多重比较方法的选择以上介绍三种多重比较方法。方法越多便存在选用何种更好的问题。根据统计学家的意见每种方法都有依据,也都有不足。这里提供几点原则供选用时参考:(1)试验事先确定比较的标准,凡与对

31、照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;(2)根据否定一个正确的 Ho和接受一个不正确的 H0的相对重要性来决定。按上述同一资料(表6.2 资料)的测验计算,可以看到当 k=2时,LSD法,SSR和q测验的显著尺度都完全相同,并且 SS%=qa而q =t血,又由于=1,甩弋,所以q与F的关系是q。k> 3时,三种FPLSD法进行多重比较,不必采方法的显著尺度不相同,LSD法最低,SSR法次之,q法最高。故LSD测验在统计推断时犯第 一类错误的概率最大,q测验最小,而SSR测验介于两者之间,因此,对于试验结论事关重大 或有严格要求的, 宜用q测验,q测验可以不经过 F

32、测验;一般试验可采用 SSR测验;也有统 计学家近期认为最小显著差数法已由F测验保护,可以采用用复杂的极差法测验。综上所述,方差分析的基本步骤是:(1)将资料总变异的自由度和平方和分解为各变异原 因的自由度和平方和,并进而算得其均方;(2)计算均方比,作出 F测验,以明了各变异因素的重要程度;(3)对各平均数进行多重比较。第三节方差分析的线性模型与期望均方、方差分析的线性数学模型方差分析是建立在一定的线性可加模型基础上的。所谓线性可加模型是指总体每一个变量可以按其变异的原因分解成若干个线性组成部分,它是方差分析的理论依据。表6.1数据的线性模型可表示为:yij=卩 + 山 +别(6 14)上式

33、中,卩为总体平均数,Ti为试验处理效应,£ij为随机误差具有分布 N(0 , b2)。 (6 14)说明,象表6.1类型的资料,其每一观测值都由总体平均数4、处理效应Ti和随机误差gjj三个部分相加而成。在以样本符号表示时,样本的线性组成为:(6 15)yij=y + ti + eij其中,y是卩的无偏估计量,ti是Ti的无偏估计量,se =Seij /( n -1)为其所属亚总体误差方i y /差bi22 2 .O! =6 =A =b的无偏估计量。当测验H0: A1=A2=A=Ak时,假定出二巴二人二和二卩和f =cr2, s; =Zeij2/n -1)可看作是总体CT2的无偏估计

34、量。因而各亚总体 S:k n/合并的SeZeij才K n -1)也是b的无偏估计量。i ij 1/,故k个样本的平方和是对于ti部分,每一样本的平方和是nti2 = n(yi -y)2 k 2k22n£ti = n£(yi -y),而处理间方差St为:i iy2 n Zti n S(yi-y)St =k -1k1因为ti =Ti +ei,故St2 =宜估计了 n 迁i i ik-1(k -1 n 丿k-1(6 16),或警。或写为:(6-17)这一部分,因试验模型的不同而有所区别。、期望均方在线性可加模型中,关于 £部分的假定,由于对 Ti有不同的解释产生了固定模

35、型(I )和随机模型(n)。从理论上讲,固定模型是指各个处理的平均效应Tih -)是固定的一个常量,且满足Zii =0(或£ ni =0),但常数未知;随机模型是指各个处理效应 Ti不是一个常量,而是从平 均数为零、方差为 畴的正态总体中得到的一个随机变量,即TiN(0, CT ;)。研究中,前者主要是研究并估计处理效应;后者主要是研究并估计总体变异即方差。例如,若要了解几个水稻新品种产量或几种密度、几种肥料、几种农药的效应等,那么研究对象是处理本身,处理效 应T为固定的处理效应,就是固定模型。换言之,固定模型仅在于供试处理范围内了解处理 间的不同效应。如果目的是要对这些处理所属的总

36、体作出推论,例如研究江淮地区大豆地方品种的遗传变异,从该地区大量地方品种中随机抽取一部分品种作为代表进行试验,以便通过这部分供试品种的试验结果推论该地区大豆地方品种的总体情况,这种处理效应便是随机模型的处理效应。在随机模型中,因为各处理仅是所属总体的随机变量,故总体方差CT;是重要的研究对象。由上可知,固定模型和随机模型,在试验设计思想和统计推断上是有明显不同的。固定模型中所得的结论仅在于推断关于特定的处理;而随机模型中试验结论则将用于推断处理的总 体。此外,在期望均方和 F测验方面,固定模型和随机模型也是有明显不同的,后面的内容 将予以说明。(一) 固定模型(fixed model )例6.

37、8 以5个水稻品种作大区比较试验,每品种作 3次取样,测定其产量,所得数据 为单向分组资料。本试验需明确各品种的效应, 故为固定模型,其方差分析和期望均方的参数 估计列于表6.8 。表6.8 5个水稻品种产量的方差分析和期望均方表变异来源DFSSMS期望均方(EMS):固定模型品 种 间487.621.90cr2+nK:2品种内(试验误差)1024.02.402Cy T2固定模型中t属于固定效应,其限制条件为 送Ti =0, (6 77)中为固定效应的方差,k 1用號2表示之,因而表 6.8的品种间均方估计了 b2 + nTC;。本例中品种内 MS估计了 CT2,因而C?2 =2.40 ;品种

38、间 MS估计了 CT2 + n瓷2因而 + ni?2=21.9,应2 珂21.90 2.40)/3 =6.50。固定模型的F测验St2合2 + ni?2F 七=Se0若埼=0,则F值等于1。所以固定模型是测验假设H0: Ti =0(i=1 , 2,,k)对Ha: £工0,即测验H0:气=卩2 =A =4k。因而,一般比较处理效应的试验都应当采用固定模型。(二) 随机模型(random model )例6.9研究籼粳稻杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估 计F5代系间单株干草

39、重的遗传变异,故这是随机模型。其单向分组分析结果见表6.9。表6.9籼粳杂种F5代干草重的方差分析和期望均方变异来源DFMS期望均方(EMS):随机模型系 统间7572.792 2c +系统内(试验误差)7617.772c为随机效应的方差, k -1CT2,因而(?2 =17.77 ;-17.77)/2=27.51。因而表6.9的系统间均方估计了CT2系统间MS估计了 b2 + nb;因而& 随机模型的F测验随机模型中飞是从总体随机抽出的,服从N(0 , CT;) , (6 ,17)中乙+ ncr;。本例中系统内 MS估计了2 2+ n&t=72.79 ,浮T =72.79S;

40、t?2 +nc?;F-IHa: b2=0。显然,这是测 测验显著则表示处理间的变 说明CT;是存在的。 晖=25.71测度了系统 凸2代表了环境条件所致的变异(记s2 少若假设CT; =0,贝U F=1。因而,随机模型的假设为H0: CT2=0对验处理效应的变异度(方差),而不是测验处理效应本身。如果 F 异是显著的。本例 F =72.79/17.7 7=4.09 > F0.05,,因而可求出遗传型变异占表型变异的份量,这就是间变异。本例中,浮;(或记为应g)代表了系间遗传型的变异; 作5;)。白g +0;代表了系间的表型变异 数量遗传中常用的遗传率h2,即:(6 18)这是随机模型方差

41、分析在数量遗传学中的应用。在本例可求得:27 51h2 = =0.6076 或 60.76%27.51 +17.77即籼粳杂种F5家系间的表型变异中有 60.76 %归属于遗传原因的变异。当试验因素在2个或2个以上时,可以在固定模型和随机模型的基础上产生第三种模型:混合模型(记作模型川)。混合模型乃既包括有固定模型的试验因素, 又包括有随机模型的试验因素的模型。这类模型凡随机因素仍用CT 2表示,固定模型用K2表示。混合模型中的期望均方组成因包括有不同的成份,应选择恰当的均方进行F测验,第13章将作介绍。第四节 单向分组资料的方差分析如表6.1及6.2所示。所用的试验设单向分组资料是指观察值仅

42、按一个方向分组的资料, 计为完全随机试验设计。、组内观察值数目相等的单向分组资料的方差分析这是在k组处理中,每处理皆含有 n个供试单位的资料如表6.1。在作方差分析时,其任一观察值的线性模型皆由(6 14)表示,方差分析如表6.10 。表6.10组内观察值数目相等的单向分组资料的方差分析变异 来源自由度DF平方和SS均方MSF-期望均方ems固定模型随机模型处理间k-12nS(yi -y)MStMSt/MSe2 2CT2 2b +ncyj误差k(n-1)ZZWj -yj2MSe2C72C7总变异nk-1SWj y)2例6.10作一水稻施肥的盆栽试验,设5个处理,A和B系分别施用两种不同工艺流程

43、的氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理 4盆(施肥处理的施肥量每盆皆为 折合纯氮1.2克),共5X 4=20盆,随机放置于同一网室中,其稻谷产量(克/盆)列于表6.11 ,试测验各处理平均数的差异显著性。(1)分析步骤:)自由度和平方和的分解表6.11 水稻施肥盆栽试验的产量结果处理观察值(yij)(克/盆)TViA (氨水1)2430282610827.0B (氨水2)272421269824.5C (碳酸氢铵)3128253011428.5D (尿素)3233332812631.5E (不施)212216218020.052626.3总变异自由度 DFt= nk-1 =5X 4

44、-1=19处理间自由度 DFt=k-1=5-1 =4误差(处理内)自由度DFe=k( n-1) =5 X (4-1) =15矫正数 C =T2/nk =5262/(5 I) =13833.8 SSt =2:y2 -C =242 +302 +A + 212 -C =402.2 SS =ZTi7n C =(1082 +982 +A +802) /4 C =301.2 SS =402.2 -301.2 =101.0F测验将上述结果录入表 6.12 ,假设H。:=AbA =4e , Ha: A、4B、卩e不全相等。为了测验H。,计算处理间均方对误差均方的比率,算得F =75.3/6.73 =11.19

45、,查F表当v 1=4,V2 = 15时,F0.01=4.89,现实得F = 11.19 > F0.01,故否定H0,推断这个试验的处理平均数间是 有极显著差异的。表6.12 表6.11资料的方差分析变异来源DFSSmsFF 0.01F 0.01处理间4301.275.3011.19 *3.064.89处理内(试验误差)15101.06.73总变异19402.2(3)各处理平均数的比较算得单个平均数的标准误SE 6.73/4 =1.297根据V = 15,查SSR表得p=2, 3,4,5时的SSF0.05与SSR©值,将SSR值分别乘以SE 值,即得SRa值,列于表6.13。进而

46、进行多重比较(表 6.14)。LSRa值计算表 6.13多重比较时的PSSR.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94表 6.14施肥效果的显著性(SSR测验)处理平均产量差异显著性(克/盆)5%1%尿素31.5aA碳酸氢铵28.5abAB氨水127.0beAB氨水224.0eBC不施20.0dC推断:根据表6.14多重比较结果可知, 施用氮肥(A、B、C和D)与不施氮肥有显著差异, 且施用尿素、碳酸氢铵、氨水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、

47、碳酸氢铵与氨 水1、氨水1与氨水2处理间均无显著差异。、组内观察值数目不等的单向分组资料的方差分析若k个处理中的观察值数目不等,分别为n1, n2,,nk,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:(1)自由度和平方和的分解总变异自由度处理间自由度误差自由度DFt =送 ni -1DFt =k -1DFZ rij k(6 19)(2)多重比较平均数的标准误为:Sst =2(y-y)2 =2y2 -Ckssni (Vi y)2 =2Ti2/ni Cizik mSS, =5:S(yij yj2 =SSr -SSt(6 20)(6GL 1/MSe 丄 MSe、 jlMSe/ 1

48、 丄 1、SE 2(+ )=(+) V2 nAne ¥ 2 nA ne上式的nA和ne系两个相比较的平均数的样本容量。但亦可先算得各(2>i)2 -送n,2门0 =(罚 i)(k1)(6 21)m的平均数no。-22)然后有:SE=jMSe/noSy,卫=J2MSe/no例6.11某病虫测报站,调查四种不同类型的水稻田百丛虫口密度列于表 6.15,试问不同类型稻田的虫口密度有否显著差异?(6(6-23)-24)28块,每块田所得稻纵卷叶螟的号表6.15不同类型稻田纵卷叶螟的虫口密度编12345678 iyi"iI1213141515161710214.577n1410

49、111314117312.176m921011121312118010.008IV1211109810127210.297T=327 y =11.68送山=28该资料送ni =7+6+8+7=28 故总变异自由度 DFt= 2 ni-1 =28-1 =27稻田类型间自由度 DFt=k-1 =4-1 =3误差自由度 DFe= 2 ni-k=28-4 =24求得:2C =(327) /28 =3818.89SSt =122 中132 +A +122 C =4045.00 -3818.89 =226.11SSt =1022 /7 +732 /6 +802 /8 +722 /7 -C =96.13SS

50、e SS, -SSt =129.98列入方差分析表6.16。表6.16 表6.15资料的方差分析变异来源DFSSMSFF0.01稻田类型间396.1332.045.91 *4.72误差24129.985.42总变异27226.11表6.16所得F = 5.91 > F0.01,因而应否定 H0:片=卩2 =卩3二巴,即4块麦田的虫口密度 间有极显著差异。F测验显著,再作平均数间的比较。 需进一步计算n0,并求得SE( LSR测验)或(LSD测验)。如在此可有:no28x2SE =J5.42/10=0.736 (头)s -1.込-ij -y2x5.42T.。41 (头)严2 "

51、2 +62 +82 +72)=10.46 10三、组内又分亚组的单向分组资料的方差分析如果每组又分若干个亚组,而每个亚组内又有若干个观察值,则为组内分或称系统分组资料。 系统分组并不限于组内仅分亚组,如此一环套一环地分下去。这种试验称为巢式试验(n ested如对数块土地取土样分析,每块地取了若 或调查某种果树病害,随机取若干株,每皆为系统分组资料。以下亚组内还可分小单向分组资料, 亚组的单向分组资料, 组,小组内还可分小亚组, exp erime nt)。在农业试验上系统分组资料是常见的。 干样点,而每一样点的土样又作了数次分析的资料, 株取不同部位枝条,每枝条取若干叶片查其各叶片病斑数的资料等, 讨论二级分组每组观察值数目相等的系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论