方差分析解读课件_第1页
方差分析解读课件_第2页
方差分析解读课件_第3页
方差分析解读课件_第4页
方差分析解读课件_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差分析(续)第四节 两因素资料的方差分析两因素资料的方差分析,又称为双向分组资料的方差分析很多情况下,我们需要设计两种不同的因素同时作用于供试动物或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析同时考虑的这两个因素,我们分别称之为因素 A 和因素 B,他们各有 a 个水平和 b 个水平有时候,因素 A 和因素 B 是同等重要的有时候,因素 B 是为了从总变异中分剖出环境因素而特意设置的在设计时,因素 A 和因素 B 相互交叉,形成 ab 个组合即:A 因素的每一个水平包含了 B 因素的所有水平B 因

2、素的每一个水平也包含了 A 因素的所有水平即:A 因素的各个水平与 B 因素的各个水平相逢一次,也只相逢一次例如:A 因素有 5个 水平,B 因素有 4 个水平,形成 54 = 20 个组合根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况一、组合内无重复观测值的两向分类资料的方差分析这种类型的资料结构是每一组合内仅一个独立供试动物(独立供试单位)其观测值的数学模型为:这一模型的含义是:每一个观测值 包含了总体平均值 ,同时还受 A 因素第 个水平的效应和 B因素第 个水平的效应,同时还具有一定的误差 :这一模型相应的数据

3、结构为: 因素 T : : T T 上页的数据结构表中,T为求和,不同因素的和的下标不同两因素无重复资料的方差分析应从 A 和 B 两个方向进行,我们可以将这种结构看成是两个单向资料的重合即:对 A 因素来说,有 a 个组(k = a),每一组有b 个观测值(n = b)对 B 因素来说,有 b 个组(k = b),每一个组有 a个观测值(n = a)因此我们可以直接用方差分析表来表示这种分剖的结果这里,无效假设有两个:A:设 不全相等B:设 不全相等方差分析表变异来源 A因素B因素误 差 T若 显著,应对 A 因素各水平的平均值进行多重比较,其标准误为:若 显著,应对 B 因素各水平的平均值

4、进行多重比较,其标准误为:下面我们以实例来说明具体分析的过程试验 4 种药物配伍(因素 A)对鲢鱼腐皮病的治疗效果,试验在 5 个发病的渔场(因素 B)进行,每个渔场随机抽取 4 个鱼池,每个鱼池随机使用其中的一种药物配伍,得如下治愈率,试比较这 4 种药物配伍的治疗效果药物 渔 场配伍 76 82 83 79 77 83 89 92 87 84 73 77 80 72 80 81 82 79 85 87由于数据是百分率,因此应作转换:转换后的数据见下面这张表(为了分析方便,所有数据转换后都扩大 100 倍):药物 鱼 场配伍 106 113 115 109 107 115 123 128 1

5、20 116 102 107 111 101 111 112 113 109 117 120得如下一级数据:药物 渔 场配伍 550 60560 110.0 3.87 602 72594 120.4 5.32 532 56696 106.4 4.77 571 65283 114.2 4.32 435 456 463 447 454 2255 255133 设 不全相等设 不全相等将上述数据填入方差分析表中:方差分析表变异来源药物间 3 542.55 180.85 9.57* 3.49 5.95渔场间 4 112.50 28.125 1.49 3.26误 差 12 226.70 18.892 T

6、 19 881.75对于 A因素,应否定无效假设,即不同的药物配伍其治疗鲢鱼腐皮病的疗效差异极显著(p0.05)由于药物配伍间差异极显著(p1)个观测值,整批资料共有 abn 个数据这种类型资料的数学模型为:数据结构见本书P104表7.3(请参看)任一观测值 包含了总体效应 ,A 因子第 个水平的效应,B 因子第 个水平的效应,A 因子和B 因子第 、 个互作效应,及随机误差 ,随机误差这一类资料的方差分析表为:方差分析表变异 自由度 平方和 均方 F值来源 A a-1 B b-1AB (a-1)(b-1) e ab(n-1) T abn-1在这种类型资料的方差分析中,人们的注意力和兴趣往往集

7、中于互作的检验上一般首先完成互作的 F 检验,如果互作部分的 F 检验显著,可不再进行 A 因子、B 因子的检验(当然习惯上我们还是同时完成 A 因子、B 因子的检验),而对组合进行多重比较因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多因此,一般的试验应当同时考察两个因子一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察不到的当互作不显著,则分别检验 A 因子和 B 因子是否显著,哪个因子显著,就对哪个因子进行多重比较两个因子都显著,两个因子都应当作多重比较考察两个因子的试验中,什麽时候在组合内设置重复

8、?一是当我们确认试验所设置的 A 因子和 B 因子间的确存在互作,我们为了检验这种互作二是当我们无法肯定 A、B 因子之间是否存在互作,我们为了发现这种互作,必须设置重复三是为了防止可能存在的互作混杂到误差项中去而无谓地扩大误差,因此必须设置重复下面我们用实例来说明这一类型资料的方差分析试验目的:作饲料增重试验,同时考察蛋白质(因子 A)和磷(因子 B)的影响A 因子:高、中、低三种水平(a = 3): :高含量 :中含量 :低含量B 因子:二种形态(b = 2): :有机磷 :无机磷每个组合内有 4 个重复(n = 4):4水箱一龄青鱼(每箱青鱼的尾数相等)观测指标:试验期内的增重量试验所得

9、数据结构见下表磷 蛋 白 质形态 9.62 8.68 6.15 7.86 4.93 5.59 9.31 9.97 7.38 7.05 6.10 5.46 =37.58 =28.44 =22.08 88.10 7.74 6.85 6.30 5.81 3.33 2.85 6.34 6.09 6.54 6.63 3.60 3.19 =27.02 =25.28 =12.97 65.27 64.60 53.72 35.05 =153.37 这是一张二维的数据表在计算一级数据时,应从最小单位开始,即首先计算组合的和,然后计算 A 和 B 因子各水平的和,最后计算总和在逐段计算各类和的时候,不要忘记同时计算

10、平方和、平均数做好上述准备工作后,即进行校正值、各类平方和及自由度的计算:各平方和:各自由度:蛋白质A:设 不全相等磷形态B:设 AB:设 不全相等方差分析表变异来源蛋白质(A) 55.8394 2 27.9197 92.48* 磷形态(B) 21.7170 1 21.7170 71.93* AB 3.8444 2 1.9222 6.38*误差 5.4343 18 0.3019 T 86.8351 23三个无效假设均否定,接受三个备择假设,即蛋白质的量、磷形态、蛋白质量与磷形态间的互作,差异均达极显著水平这里,仅需对互作进行多重比较即可多重比较: 2 3 4 5 6 2.97 3.61 4.0

11、0 4.28 4.49 4.07 4.70 5.05 5.38 5.60 0.82 0.99 1.10 1.18 1.23 1.12 1.29 1.39 1.48 1.54(同学们先自行完成这一多重比较)将各组合的平均值按从大到小的次序排列:组合 0.05 0.01 9.40 a A 7.11 b B 6.76 b BC 6.32 bc BC 5.52 c C 3.24 d D (请同学们自行完成平均数表的设置)课堂练习:今有一个试验,其数据分析为 F 值极显著,请对资料的 6 个平均值进行多重比较: R 2 3 4 5 6LSR0.05 0.82 0.99 1.10 1.18 1.23LSR

12、0.01 1.12 1.29 1.39 1.48 1.54平均值:1:6.48 2:6.32 3:7.95 4:4.50 5:5.52 6:7.11这里我们介绍的是组合内的数据量是一样多的情况当组合内数据量不一样多时,可采用以下两种方法进行方差分析:1、将每一组合内的数据截取为一样多例如,有的组合是 5 个数据,有的为 7 个数据,最少的为 3 个,则可将所有组合均截为 3个数据(取每一组合的平均值周围的数据)进行方差分析2、使用最小二乘方差分析法进行目前使用的统计软件均为最小二乘方差分析法,这一方法可不考虑组合内样本量的多少,甚至某一组合内为 0 都可以进行方差分析第五节 系统分组资料的方差

13、分析系统分组设计,又称为巢式设计、树状设计、多因子嵌套设计其英文名称为:nested design假设有 A、B 两个因子,这两个因子的搭配组成不再是上一节的交叉构成,而是 B 因子嵌套在 A 因子内,即 B 因子为次级因子:A 因子的某一个水平包含了 B 因子部分水平A 因子的另一个水平包含了 B 因子的另一部分水平即:B 因子的水平仅从属于 A 因子的一个水平而 A 因子的水平并不包含 B 因子的所有水平如果有第三个因子 C,则 C 因子嵌套在 B 因子内如果有第四个因子 D,则 D 因子嵌套在 C 因子内以此类推其数据结构呈现树状结构如行政区划,就是典型的系统结构:国家包含若干个省(A)

14、、一个省(A)包含若干个市(B)、一个市(B)包含若干个县(C)、一个县(C)包含若干个镇(D)、一个镇(D)包含若干个村(E)再如:畜牧生产中:一头公畜(A)交配若干头母畜、一头母畜(B)生产若干头仔畜、每头仔畜(C)有若干次生产成绩在这种数据结构中,各 因子的重要性是不完全相等的,下一级因子的重要性往往低于上一级因子 A1 Ai AaB11 B12 B1b Bi1 Bi2 Bib Ba1 Ba2 Bab C111 C112 C11c Ca11 Ca12 Ca1c A 因子称为一级因子,B 因子称为二级因子,因子之间是一种从属关系,而非上一节 A、B 因子的交叉构成中所讨论的那种平行关系 下

15、面我们写出两因子系统分组资料的数据结构:A因子 B因子 观测值 B因子和 A因子和 T A1 B11 x111 x112 x11. B12 x121 x122 x12. x1.A2 B21 x211 x212 x21. B22 x221 x222 x22. x2.Ai Bi1 xi11 xi12 xi1. Bi2 xi21 xi22 xi2. xi.Ap Bp1 xp11 xp12 xp1. Bp2 xp21 xp22 xp2. xp. x根据这一数据结构我们可以写出其数学模型:式中,为总体平均i为 A 因子第 i 个水平的效应ij为 A 因子第 i 个水平下的 B 因子第 j 个水平的效应i

16、jk为随机误差,且p为 A 因子的水平数;qi为第 i 个 A 因子水平下 B 因子的水平数;nij为第 i 个 A 水平中第 j 个 B 水平中的观测值下面我们先介绍两个概念:固定因子(fixed factor):如果一个试验中,某一因子的水平是我们有目的地挑选的,因而我们只是希望将这几个水平进行比较,也只是希望知道这几个水平的差异,并不将分析结果引申到其他水平,这样的因子就是固定因子,固定因子的水平所产生的效应就是固定效应(fixed effect)随机因子(random factor):如果一个因子的各个水平是从这因子的所有水平中随机挑选出来的,我们的试验目的是希望通过这几个水平的差异情

17、况了解整个因子的变异情况,即对这一因子的方差进行检验和估计,从而知道这一因子的方差组分,这样的因子就是随机因子,随机因子的各个水平所产生的效应就是随机效应(random effect)在数学模型 中:如果 A、B 两个因子所产生的效应都是固定效应,这样的数学模型就是固定效应模型(简称固定模型 fixed model),我们的检验目的是希望比较这一因子各参与试验的水平之间的差异固定模型中,我们总假定:如果 A、B 两因子所产生的效应都是随机效应,这样的数学模型就是随机模型(random model),我们的检验目的是希望知道每个因子的不同水平效应的方差2 和2 是否为 0两因子各个水平的效应之间

18、相互独立A 因子和 B 因子效应之间也相互独立且:如果两个因子,一个为固定因子(如 A 因子),另一个为随机因子(如 B 因子),由这样的两个因子组成的数学模型即为混合模型(mixed model),我们的检验目的是:A 因子各水平之间是否存在差异B 因子不同水平效应的方差2是否为 0这时:且不同的ij彼此独立我们在上一节讨论的两因子(A、B因子)交叉分组资料也有固定模型、随机模型、混合模型之分,但在一般情况下,这种分组资料更多的是固定模型,因此其方差分析方法是固定效应的分析而系统分组资料则三种模型都有系统分组资料常见于数量遗传学、动物育种学中此时我们往往希望通过方差组分的计算估计遗传参数,从

19、而进行数量遗传学的研究但系统分组资料进行固定效应的估计也是常见的下面我们给出平方和与自由度的剖分公式:每一观测值的总离均差平方为:等式两边求和(各乘积项的和均为 0 ) 上式中,右手第二项称为 A因子内 B因子水平间 SS 为 A 因子第 i 个水平中的观测值个数上一页的仅为推导的理论公式在实际计算时,我们使用以下公式(从理论公式如何到下面的实际计算公式,同学们应当很清楚了)校正值:总平方和:A因子平方和:B因子平方和:A 因子内 B 因子水平间平方和:误差平方和:相应的自由度: 相应的均方:根据试验的要求不同,次级及次级内观测值可分为重复数相等和不等两种情况下面我们以例题来说明具体的分析方法

20、一、次级样本含量相等的系统分组资料例1:对鲤鱼进行选育,考察 4 个鲤鱼品种 B,每个品种选择 2 个家系 F,每个家系考察 3 尾雌性亲鱼的平均后代增重xijk,得数据如下表(数据已经过了简化)B F xijk F B F SS F B B 后代增重 后代 后代 和 平均 和 平均1 1 2.2 2.3 2.0 3 6.5 14.13 2.17 2 2.0 2.1 2.3 3 6 6.4 13.70 2.13 12.9 2.152 3 1.6 1.5 1.7 3 4.8 7.70 1.60 4 1.8 2.0 1.7 3 6 5.5 10.13 1.83 10.3 1.723 5 2.6 2

21、.5 2.2 3 7.3 17.85 2.43 6 2.4 2.4 2.2 3 6 7.0 16.36 2.33 14.3 2.38 4 7 1.8 1.5 1.7 3 5.0 8.38 1.67 8 1.5 1.6 1.4 3 6 4.5 6.77 1.50 9.5 1.58 24 24 47.0 95.02 47 上表中,p = 4,q = 2,n = 3 N = 24校正值 C = 92.0417SST = (2.22+2.32+.1.42) - C = 95.02 - C = 2.9783SSB = (12.92+9.52)/6 - C = 94.54 - C = 2.4983 (一级

22、样本间)SSF(B) = (6.52+4.52)/3 - (12.92+9.52)/6 = 94.68 - 94.54 = 0.14 (二级样本间)SSe = SST SSS - SSD(S) = 2.9783 - 2.4983 -0.14 = 0.34自由度:dfT = 423 1 = 23dfB = 4 1 = 3dfF(B) = 4 (2 - 1) = 4dfe = 42(3 - 1) = 16 将平方和及自由度填入方差分析表中,并计算各均方和 F 值:方差分析表:变异来源 SS df MS F F0.05 F0.01品种间B 2.4983 3 0.8328 23.79* 6.59 16

23、.69(公猪内)家系间F 0.14 4 0.035 1.64 3.01误 差e 0.34 16 0.02125 T 2.9783 23 上述计算中,即:两个不同级别的 F 值均由下一级的 MS 作为比较标准,而不再是统一由误差项均方作为比较标准而查 F所用的自由度也应作相应的变动,即:FB的自由度分别为 df1=3,df2=4FF的自由度分别为 df1=4,df2=16由于不同品种间的增重差异极显著,而家系间差异不显著,因此,应对品种(一级样本)作多重比较: R 2 3 4 品种 0.05 0.01 q0.05 3.93 5.00 5.76 3 2.38 a A q0.01 6.51 8.12

24、 9.17 1 2.15 a ABLSR0.05 0.30 0.38 0.44 2 1.72 b BLSR0.01 0.50 0.62 0.70 4 1.58 b B如果家系间差异亦显著,则应当对家系进行多重比较,比较时的标准误以误差项均方为分子,每个家系的样本量为分母进行计算查 q 表时用误差项自由度本例中,我们将品种、家系均作为固定因子处理,因此其模型为固定模型如果是估计遗传参数,则品种、家系均为随机因子,则模型为随机模型当然也可以将品种作为随机因子,家系作为固定因子处理,则模型为混合模型处理实际数据资料时,样本量肯定要大得多,本例仅是一个说明统计方法的例子而已二、次级样本含量不等的系统分

25、组资料我们还以例子来说明统计方法调查 3 个县的渔业情况,各县抽取若干个乡镇,每个乡镇抽取若干个调查样点,得渔业产值(为了方便计算,数据已经过简化)如下,试进行分析县别 乡别 各样点观测值 乡样 县样 乡和 平方和 乡平均 县和 县平均一级 二级 点数 点数 A B nij ni. Tij xij Ti xi 1 21 19 21 18 20 5 99 1967 19.8 1 2 16 18 18 3 52 904 17.3 3 18 19 20 18 4 12 75 1409 18.75 226 18.83 2 4 16 14 16 13 15 14 6 88 1298 14.7 5 17

26、16 15 17 4 10 65 1059 16.25 153 15.30 6 15 18 16 17 15 5 81 1319 16.2 3 7 16 14 17 15 15 13 6 90 1360 15 8 17 18 18 3 14 53 937 17.7 224 16.0 36 36 603 10253 603将原始数据整理成表,并计算右边的一级数据,与左边连成一个表此例中:p = 3 为一级样本数q1 = 3,q2 = 2,q3 = 3 为二级样本数n11 = 5,n12 = 3,n33 = 3 得:n1 = 12,n2 = 10,n3 = 14 校正值 C = 10100.25

27、设立无效假设(此处略,该如何设立?)建立方差分析表变异来源 SS df MS F F0.05 F0.01县别间 A 80.98 2 40.49 6.33* 5.79 13.27乡别间 B 32.00 5 6.40 4.51* 2.56 3.76误 差 39.77 28 1.42 T 152.75 35其中:由于县、乡两级分别为显著、极显著,因此应分别作多重比较首先对县进行多重比较,各县的样本量不等,因此先求k1:然后求SE: R 2 3 q0.05 3.61 4.54 q0.01 5.70 6.97 LSR0.05 2.65 3.33 LSR0.01 4.18 5.11县别 0.05 0.01

28、 1 18.83 a A 3 16.0 b A 2 15.30 b A 对乡别进行多重比较:首先求k2:然后求SE: R 2 3 4 5 6 7 8 q0.05 2.90 3.49 3.86 4.13 4.32 4.48 4.62 q0.01 3.91 4.48 4.84 5.09 5.28 5.44 5.58LSR0.05 1.67 2.00 2.21 2.37 2.47 2.57 2.65 LSR0.01 2.24 2.57 2.77 2.92 3.02 3.12 3.20多重比较表:乡别 0.05 0.01 1 19.8 a A 3 18.75 ab AB 8 17.67 bc ABC

29、2 17.30 bc ABC 5 16.25 cd BC 6 16.20 cd BC 7 15.00 d C 4 14.67 d C请同学们自行作两个平均值表或平均值图可能大家都注意到了:在上面两个例子中我们并没有用到随机因子和固定因子这两个概念,这是因为我们这里仅仅进行了普通的方差分析,而没有涉及到遗传参数的分析,因此这里的因子都是固定因子,其所涉及的数学模型就都是固定模型在第一例中如果我们需要分析公猪和母猪在后代增重这一性状方面的遗传参数,就要将其作为随机模型或混合模型,从而计算方差组分,进而估计遗传参数思考与习题:1、试验不同的饼类饲料的养鱼效果,得如下数据,试作方差分析: 豆饼 菜饼

30、棉饼 花生饼 湖泊 5.4 4.8 3.7 4.5 水库 5.5 5.0 4.1 4.6 河道 5.1 4.5 4.2 4.8 鱼池 5.9 5.7 4.8 5.0 稻田 5.8 5.3 3.9 4.52、不同给食率和不同的饲料剂型都对鱼的产量会产生影响,用莫桑比克罗非鱼作网箱养殖试验,得如下数据(试验指标:净产kg/m2),试分析 低给食率 中等给食率 高给食率 湿团状料 14.15 13.26 15.80 15.32 16.32 16.88 15.23 15.98 17.54干 料 15.63 15.54 17.20 17.65 19.56 19.24 16.01 18.32 18.78颗 粒 料 15.24 15.89 16.74 18.45 20.88 21.56 14.58 18.01 21.42膨 化 料 15.87 16.54 19.55 20.45 23.44 24.17 16.71 20.89 23.873、在草鱼饵料内添加不同百分率的尿素,使用不同的饵料加工方法,试验对草鱼的增产效果,所得日增重如下,试作分析 0% 4.0% 8.0%一次成型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论