生物统计学方差分析省公开课一等奖全国示范课微课金奖课件_第1页
生物统计学方差分析省公开课一等奖全国示范课微课金奖课件_第2页
生物统计学方差分析省公开课一等奖全国示范课微课金奖课件_第3页
生物统计学方差分析省公开课一等奖全国示范课微课金奖课件_第4页
生物统计学方差分析省公开课一等奖全国示范课微课金奖课件_第5页
已阅读5页,还剩162页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析应用统计学重庆大学生物工程学院1/167基本概念方差分析:方差分析是对两个或两个以上样本平均数差异显著性检验方法。

例:为研究某种生物材料生物学性能,将材料分成三组,分别与成骨细胞共培养1,7,11天后测试细胞活性。为防止误差,每组测试5个样品,试判断材料生物学性能。2/167基本概念3/167两个样本数据平均数比较1、当总体方差和已知,或总体方差和未知,但两样本均为大样本u

检验2、当总体方差和未知,且两样本均为小样本t

检验4/167例:生产某种纺织品,要求棉花纤维长度平均在30mm以上。现有一棉花品种,以n=400进行抽样,测得纤维平均长度为30.2mm,标准差为2.5mm,问该棉花品种纤维长度是否合格?分析:1)已知,u检验

2)因为只能大于30mm才能合格,故单尾检验解:(1)假设,即该棉花品种纤维长度不能到达纺织品生产要求含量。对

(2)选取显著水平(3)检验计算(4)推断u<u0.05=1.64,P>0.05,显著水平上接收H0,拒绝HA。即认为该棉花品种纤维长度不符合纺织品种生产要求5/167

例为了探讨不一样窝动物出生重是否存在差异,随机选取4窝动物,每窝中都有4只幼仔,结果以下:表4窝动物出生重(克)动物号窝别ⅠⅡⅢⅣ1234和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.728.0118.0平均数31.45030.02526.22529.500

经过对以上数据分析,判断不一样窝别动物出生重是否存在差异。6/167方差分析意义k个样本均数比较:

假如仍用t检验或u检验,需比较次数为:

比如4个样本均数需比较次数为6次。假设每次比较所确定检验水准为0.05,则每次检验拒绝H0不犯第一类错误概率为1-0.05=0.95;那么6次检验都不犯第一类错误概率为(1-0.05)6=0.7351,而犯第一类错误概率为0.26497/167方差分析意义k个样本均数比较:

假如仍用t检验或u检验,有以下问题:

1、检验过程繁琐

2、无统一试验误差,误差预计准确性和检验灵敏性低

3、推断可靠性降低,犯第1类错误概率增加8/167方差分析:是一类特定情况下统计假设检验,或者说是平均数差异显著性检验一个引伸。u检验和t

检验能够判断两组数据平均数差异显著性,

而方差分析则能够同时判断多组数据平均数之间差异显著性。当然,在多组数据平均数之间做比较时,能够在平均数全部对之间做

t检验。但这么做会提升犯Ⅰ型错误概率,因而是不可取。

9/167

方差分析由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(F-test)。用于推断多个总体均数有没有差异10/167方差分析定义

方差分析是对两个或多个样本平均数差异显著性检验方法。它是将测量数据总变异按照变异起源分解为处理效应和试验误差,并做出其数量预计。

它将全部处理观察值作为一个整体,一次比较就对多有各组间样本平均数是否有差异做出判断。假如差异不显著,则认为它们都是相同;假如差异显著,再深入比较是哪组数据与其它数据不一样。11/167方差分析意义方差分析基本思想:1、把k个总体看成一个整体对待2、把观察值总变异平方和及自由度分解为不一样起源平方和及自由度3、计算不一样方差预计值比值4、检验各样本所属平均数是否相等实际上是观察值变异原因数量分析

12/167方差分析应用条件和用途方差分析应用条件:

1、各样本须是相互独立随机样本

2、各样原来自正态分布总体

3、各总体方差相等,即方差齐方差分析基本用途:

1、多个样本平均数比较

2、多个原因间交互作用

3、回归方程假设检验

4、方差同质性检验13/167第一节方差分析基本原理14/167试验指标(Experimentalindex):试验测定项目或者性状。日增重、产仔数、瘦肉率试验原因(Experimentalfactor):影响试验指标原因,也称:处理原因,简称原因或因子。

1、可控原因(固定原因):人为可控

2、非控原因(随机原因):不能人为控制试验原因表示:大写字母A,B,C,…等来表示一、相关术语15/167原因水平(Leveloffactor):试验原因所处特定状态或者数量等级。简称水平水平表示方法:用代表该原因字母添加下标表示,如A1,A2,B1,B2…试验处理(Treatment):实施在试验单位上详细项目,简称处理。单原因:试验原因一个水平多原因:试验原因一个水平组合一、相关术语16/167试验单位(Experimentalunit):试验载体,即依据研究目标而确定观察总体重复(Repetition):一个处理实施在两个或者两个以上试验单位上,称为处理有重复。试验单位数称为处理重复数一、相关术语17/167

方差分析是关于k(k≥3)个样本平均数假设测验方法,是将总变异按照起源分为处理效应和试验误差,并做出其数量预计。发觉各变异原因在总变异中相对主要程度一个统计分析方法。

二、方差分析基本原理18/167

总变异分解为组间变异和组内变异。组内变异是个体差异所致,是抽样误差。组间变异可能由两种原因所致,一是抽样误差;二是处理不一样。在抽样研究中抽样误差是不可防止,故造成组间变异第一个原因必定存在;第二种原因是否存在,需经过假设检验作出推断二、方差分析基本原理19/167三、数学模型处理A1A2…Ai…Ak

重复x11x21…xi1…xk1x12x22…xi2…xk2

…x1jx2j

…xij

…xkj

…x1nx2n…xin…xkn总和Ti.T1.T2.…Ti.…Tk.平均

……每组含有n个观察值k组样本数据资料20/167

例2.1调查了5个不一样小麦品系株高,结果列于表2-1。在这个例子中,只出现“品系”这么一个原因(factor),故称单原因。共有5个不一样品系,我们称品系这一原因共有5个水平(level)。5个品系能够认为是5个总体,表2-1数据是从5个总体中抽出5个样本,经过比较这5个样本,判断这5个总体是否存在差异。表2-15个小麦品系株高调查结果株号株高ⅠⅡⅢⅣⅤ12345和64.665.364.866.065.8326.564.565.364.663.763.9322.076.866.367.166.868.5336.571.872.170.069.171.0354.069.268.269.868.367.5343.0平均数65.364.467.370.868.621/167

例2.2为了探讨不一样窝动物出生重是否存在差异,随机选取4窝动物,每窝中都有4只幼仔,结果以下:表2-24窝动物出生重(克)动物号窝别ⅠⅡⅢⅣ1234和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.728.0118.0平均数31.45030.02526.22529.500经过对以上数据分析,判断不一样窝别动物出生重是否存在差异。22/167以上两个例子共同点是:每个试验都只有一个原因,该原因有a个水平或称为有a个处理(treatment),这么试验称为单原因试验。从单原因试验每一处理所得到结果都是一随机变量Xi。对于a个处理,各重复n次(或者说做n次观察)单原因方差分析普通化表示方法见表2-3。表2-3单原因方差分析经典数据X1X2X3……Xi……Xa

123:j∶nx11

x12x13:x1j:x1nx21

x22x23:x2j:x2nx31xi1xa1x32xi2xa2x33xi3xa3:::x3jxijxaj:::x3nxinxan平均数x1·x2·x3·xi·xa·23/167每一个观察值能够经过以下惯用所谓线性统计模型(linearstatisticalmodel)描述:其中:xij是在第i

水平(处理)下第

j

次观察值。μ是对全部观察值一个参量,称为总平均数(overallmean)。αi是仅限于对第

i

次处理一个参量,称为第i次处理效应(treatmenteffect)。方差分析目标,就是要检验处理效应大小或有没有。eij是随机误差成份。24/167上述模型中,包含两类不一样处理效应。第一类处理效应称为固定效应(fixedeffect),它是由固定原因(fixedfactor)所引发效应。若原因a个水平是经过特意选择,则该原因称为固定原因。比如,几个不一样试验温度,几个不一样化学药品或一个药品几个不一样浓度,几个作物品种以及几个不一样治疗方案和治疗效果等。25/167在这些情况中,原因水平是特意选择,所检验是关于ai假设,得到结论只适合与方差分析中所考虑那几个水平,并不能将其结论扩展到未加考虑其它类似水平上。所以上述那些原因:温度、药品、品种等,称为固定原因。处理这么原因所用模型称为固定效应模型(fixedeffectmodel)。例2.1中5个小麦品系是特意选择,目标是从这5个品系中,选出最优者,因而“品系”这个原因属于固定原因,所用模型是固定效应模型。26/167第二类处理效应称为随机效应(ran-domeffect),它是由随机原因(randomfactor)所引发效应。若原因a个水平,是从该原因全部水平总体中随机抽出样本,则该原因称为随机原因。从随机原因a个水平所得到结论,能够推广到这个原因全部水平上。处理随机原因所用模型称为随机效应模型(randomeffectmo-del)。例2.2动物窝别,是从动物全部可能窝别中随机选出来,试验目标是考查在窝别之间,出生重是否存在差异,因而“窝别”是随机原因。

27/167有时固定原因和随机原因极难区分,除上述所讲标准外,还能够从另一角度判别。固定原因是指原因水平,能够严格地人为控制。在水平固定之后,它效应值也是固定。比如,研究三种温度对胰蛋白酶水解产物影响。因为温度水平是能够严格控制,即每一温度水平,在各个重复之间都能够准确地控制在一个固定值上,所以在重复该试验时,水解产物产量也是固定。简单地说,在水平(不一样温度)固定以后,其效应值(产量)也是固定。所以,温度是固定原因。

28/167

随机原因水平是不能严格地人为控制,在水平确定之后,它效应值并不固定。比如,在研究不一样农家肥施用量对作物产量影响试验中,农家肥是原因,不一样施用量是该原因不一样水平,作物产量是它效应值。因为农家肥有效成份很复杂,不能像控制温度那样,将农家肥有效成份严格地控制在某一个固定值上。在重复试验时即使施以相同数量肥料,也得不到一个固定效应值。即在原因水平(施肥量)固定之后,它效应值(产量)并不固定,因而农家肥是一随机原因。

29/167三、数学模型30/167三、数学模型31/167三、数学模型32/167四、平方和与自由度分解全部观察值总变异能够用总体方差来度量。

方差即均方是离均差平方和除以自由度。把一个试验资料总变异按变异起源分解为对应变异,首先要将总平方和与总自由度分解为各个变异起源对应部分。则考查总方差能够考查处理间方差和处理内方差33/167四、平方和与自由度分解平方和分解:总平方和=处理间平方和+处理内平方和34/167四、平方和与自由度分解自由度分解:总自由度=处理间自由度+处理内自由度35/167四、平方和与自由度分解计算方差:36/167五、统计假设显著性检验

——F检验F检验目标:推断处理间差异是否存在37/167五、统计假设显著性检验

——F检验注意:方差分析中F检验总是单尾检验,而且为右尾检验38/167

F越大,越说明组间方差是主要方差起源,因子影响越显著;F越小,越说明随机方差是主要方差起源,因子影响越不显著五、统计假设显著性检验

——F检验39/167

eg.某水产研究所为了比较四种不一样配合饲料对鱼饲喂效果,选取了条件基本相同鱼20尾,随机分成4组,投喂不一样饲料,经1个月以后,各组鱼增重(g)资料以下表,试进行方差分析饲料重复A1A2A3A413192482212702279257236308331826827329042842792492455359262258286

分析:1个原因,4个水平,5个重复方差分析40/167

解:41/16742/167不一样饲料饲喂鱼增重方差分析表43/167二、固定效应模型在固定效应模型中,ai是处理平均数与总平均数离差,且是个常量,因而

要检验a个处理效应相等性,就要ai判断各是否等于0。若各ai都等于0,则各处理效应之间无差异。所以,零假设为:备择假设为:HA:ai≠0(最少有1个i)。若接收H0,则不存在处理效应,每个观察值都是由平均数加上随机误差所组成。若拒绝H0,则存在处理效应,每个观察值是由总平均数、处理效应和误差三部分组成。44/167

例2.1调查了5个不一样小麦品系株高,结果列于表2-1。在这个例子中,只出现“品系”这么一个原因(factor),故称单原因。共有5个不一样品系,我们称品系这一原因共有5个水平(level)。5个品系能够认为是5个总体,表2-4数据是从5个总体中抽出5个样本,经过比较这5个样本,判断这5个总体是否存在差异。表2-15个小麦品系株高调查结果株号株高ⅠⅡⅢⅣⅤ12345和64.665.364.866.065.8326.564.565.364.663.763.9322.076.866.367.166.868.5336.571.872.170.069.171.0354.069.268.269.868.367.5343.0平均数65.364.467.370.868.645/167解:在方差分析中,为了简化计算能够用编码法。方差分析编码,必须将全部数据均减去同一个共同数。在例2.1中,每一个xij都减去65,列成下表,株号品系ⅠⅡⅢⅣⅤ12345―0.40.3―0.21.00.8-0.50.3―0.4-1.3-1.12.81.32.11.83.56.87.15.04.16.04.23.24.83.32.5总和xi·x2i·∑x2ij1.52.251.93-3.09.003.411.5132.2529.4329.0841.0174.4618.0324.068.06571308.50277.2846/167先计算校正项C再计算47/167将以上结果列成方差分析表(见表2-5):表2-5

不一样小麦品系株高方差分析表

变差来源平方和自由度均方

F品系间误差131.7415.5842032.720.7841.95**总和147.3224**a=0.01当分子自由度为4,分母自由度为20时,F4,20,0.05=2.87,F4,20,0.01=4.43,F>F0.01。所以,不一样小麦品系株高差异极显著。习惯上用“*”表示在α=0.05水平上差异显著,用“**”表示在α=0.01水平上差异显著,经常称为差异“极显著”(highlysignificant)。48/167三、随机效应模型在试验中,经常回碰到某个原因有许多可能水平,若参加试验a个水平,是从该原因水平总体中随机选出,那么这一原因称为随机原因。其方差分析是经过随机选取a个水平对该原因水平总体做推断。要求水平总体是无暇总体,即使不是无限总体,也应相当大,以至于能够认为是无限总体。例2.2中动物“窝”是随机原因,每一窝是一个水平,这种动物全部窝组成一水平总体。从该总体中随机选择4个水平(4窝)做试验,试验目标是希望由这4窝动物去推断该种动物全部不一样窝别之间幼仔出生重是否存在差异。49/167固定效应模型中∑ai=0假设在这里不再适用。在随机模型中,对单个处理效应检验是无意义,所要检验是关于ai变异性假设,因而,

H0:sa2=0

HA:sa2>0假如接收H0:sa2=0,则表示处理之间没有差异;若拒绝H0而接收HA:sa2>0,则表示处理之间存在差异,方差分析做法依然是将总平方和分解,

50/167自由度做一样分解,由此可得出MSt和MSe。然后用F单侧检验(具dft,dfe

自由度),方差分析程序与固定效应模型方差分析程序完全一样,不过结论不一样。随机效应模型适合用于全部水平总体,而固定效应模型只适合用于所选水平总体。下面计算例2.2,并对结果加以解释。51/167例2.2为了探讨不一样窝动物出生重是否存在差异,随机选取4窝动物,每窝中都有4只幼仔,结果以下:表2-24窝动物出生重(克)动物号窝别ⅠⅡⅢⅣ1234和34.733.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.728.0118.0平均数31.45030.02526.22529.50052/1674.73.2-2.92.93.3-4.0-6.71.4-3.8-1.4-2.2-4.31.62.3-3.3-2.0总和

c

i·5.800.10-15.10-2.00

c

2i·

33.640.01228.014.00

∑c2ij

49.9833.4969.0332.86-11.20265.66185.36解:将表2-2中每一个数值都减去30,列成下表,

53/16754/167将上述结果列成方差分析表:表2-6动物出生重方差分析变差来源平方和自由度均方F窝别误差58.575118.94531219.5259.9121.97总和177.5215查表得知,F3,12,0.05=3.49,因F<F0.05,所以差异不显著。经过对4窝动物出生重调查,能够推断不一样窝别动物出生重没有显著差异。55/167Excel方差分析Office默认安装中没有“数据分析”要指定才会安装。一旦安装,“工具”菜单下出现“数据分析”条,能够用它来方便做方差分析等统计推断分析。可经过运行Analysis中模板文件

ANALYS32.XLL调入此宏56/167加载数据分析如“工具”菜单下没有“数据分析”单击“加载宏”57/167Excel解方差分析选一批单元格输入原始数据;58/167Excel解方差分析选“工具”→“数据分析”;59/167Excel解方差分析选“工具”→“数据分析”→“单原因方差分析”60/167Excel解方差分析“单原因方差分析”对话框中:

输入区域,分组方式,输出选项61/167Excel解方差分析“单原因方差分析”对话框中:填入信息后单击“确定”按钮62/167Excel解方差分析分析结果63/167Excel解方差分析方差分析结果表中各项目标含义SS平方和df自由度MS均方F及FcritF值及F临界值,Fcrit=FINV(a,df1,df2)P-valueF分布概率P-value=FDIST(F,df1,df2)64/167

F检验假如否定了H0,接收了HA,表明试验总变异主要起源于处理间变异六、多重比较

多重比较:假设对一个固定效应模型经过方差分析之后,结论是拒绝H0,处理之间存在差异。但这并不说在每对处理之间多存在差异。为了搞清终究在哪些对之间存在显著差异,哪些对之间无显著差异,必须在个处理平均数之间一对一对地做比较,这就是多重比较。即:多个平均数相互比较65/167六、多重比较

惯用:

1、最小显著差数法(LSD法)

2、最小显著极差法(LSR法)

—新复极差检验(SSR法)

—q检验LSD称为最小显著差数(leastsignificantdifference)它计算方法简述以下:66/167对于任意两组数据平均数,差数(x1-x2)差异显著性检验,能够用成组数据t检验,当n1=n2时最小显著差数法(LSD法)样本平均数差数样本平均数差数标准误67/167其中MSe为误差方差,即处理内方差,n为每一处理观察次数,于是具k(n-1)自由度,当t>t0.05时差异显著,当t>t0.01时差异极显著。所以,当差异显著时最小显著差数法(LSD法)68/167并可得到,当时差异显著。t0.05√2MSe/n

称为最小显著差数,记为LSD。每一对平均数差与LSD比较,当│x1-x2│>LSD时,差异显著;不然差异不显著。LSD是一个很有用检验方法,计算起来很方便,也轻易比较。不过它有难以克服缺点,即这种比较方法将会加大Ⅰ型错误概率。最小显著差数法(LSD法)69/167LSD法步骤:最小显著差数法(LSD法)1、计算平均数差数标准误2、由t逆函数(TINV)和平均数差数标准误计算出到达差异显著最小差数,记为LSD3、将全部平均数从大到小依次排列,并比较若即为在给定水平上差异显著,反之亦然70/167说明实质上是t

检验,但统一了标准误简单、灵敏(降低了检验标准、夸大了差异显著性)I类错误概率增大,控制单次比较I类错误时应用无法控制全部比较总体I类错误最小显著差数法(LSD法)71/1672、求解到达差异显著最小差数(LSD)临界值:t0.05(16)=2.120,t0.01(16)=2.921

LSD0.05(16)=2.120*14.622=31.0

LSD0.01(16)=2.921*14.622=42.73、将全部平均数从大到小依次排列,并比较72/167excel数据排序工具数据分析排序与百分比73/167excel数据排序74/167处理平均数A1311.864.4**49.0**32.2*A4279.632.2*16.8nsA2262.815.4nsA3247.4四种饲料饲喂鱼增重差异显著性(LSD检验,梯形法)4、分析结果:A1饲料对鱼增重效果极显著高于A3和A2,显著高于A4;A4饲料对鱼增重效果显著高于A3;A4和A2,A2和A3饲料对鱼增重效果没有显著差异75/167四种饲料饲喂鱼增重差异显著性(LSD检验,字母标识法)处理平均数差异显著性0.050.01A1A4A2A3311.8279.8262.8247.4(1)在最大平均数上标字母a——A1行标注aa(2)将该平均数与以下各平均数相比,凡相差不显著(<LSD)都标上字母a,直到某个与相差显著则标字母b——(A1-A4)=311.8-279.8=32.0>LSD0.05,则A4标bb(3)再以标有b平均数为标准,与各个比它大平均数比较,凡差数差异不显著在字母右边加标字母b,然后再以标b最大平均数为标准与以下未标字母平均数相比,凡相差不显著都标上字母b,直到某个与相差显著则标字母c——往上:(A4-A1)是已经比较了;往下(A4-A2)=17.0,标b,(A4-A3)=32.4,标cbc(4)以此重复,直到最小平均数标识字母——以A3为标准,往上:A3与A2相比无显著差异,故在A2行b右边标注c,A3与A4已比较了cAABBB

总结:差异不显著标同一字母,差异显著标不一样字母76/167四种饲料饲喂鱼增重差异显著性(LSD检验,字母标识法)

判断:凡有一个相同标识字母即为差异不显著,凡含有不一样标识字母即为差异显著分析结果:A1饲料对鱼增重效果极显著高于A3和A2,显著高于A4;A4饲料对鱼增重效果显著高于A3;A4和A2,A2和A3饲料对鱼增重效果没有显著差异77/167把平均数差异看成是平均数极差(range)依据极差范围内所包含处理数(称为秩次距)k不一样,而采取不一样检验尺度叫做最小显著极差LSR秩次距是指当平均数由大到小排序后,相比较两个平均数之间(含这两个平均数)包含平均数个数I类错误下降、工作量加大最小显著极差法(LSR法)78/167为了克服LSD法缺点,Duncan(1955)提出了Duncan多范围检验(Duncanmultipletest)。检验方法以下:首先,将需要比较a个平均数依次排列好,使之并将每一对

x

之间差(范围)列成下表

aa-1…321x1-xa

x1-xa-1…x1-x3

x1-x22x2-xa

x2-xa-1…x2-x3

∶a-2xa-2-xa

xa-2-xa-1a-1xa-1-xa注:表中x均为x

新复极差法79/167Duncan检验与LSD一个显著不一样是Duncan检验中,不一样对平均数差有不一样临界值Rk

。其中80/167

ra=ra(k,df)值能够从附表“多重比较中Duncan表”中查出:表最左边一列是误差自由度df=a(n-1),最上一列为k值,表体为ra

(k,df)。表中

k

值是相比较两个平均数之间所包含平均数个数。如两个要比较平均数相邻时k=2,两个要比较平均数中间隔一个平均数时k=3,依这类椎。因为平均数共有a个,所以需查出a一1个ra

,分别乘以S,得:81/167先从表第一行最左边一个差x1-xa开始比较。若x1-xa>Ra,则x1与xa差异显著;不然差异不显著,然后比较下一个。若x1-xa-1>Ra一1,则x1与xa-1差异显著,不然差异不显著,···。第一行比较完之后用一样方法比较第二行。先从第二行最左边一个差x2-xa开始,在x2到xa这个范围内共包含a-1个平均数,所以x2-xa应与Ra-1比较,若x2-xa>Ra-1,则差异显著,不然不显著,···。第二行比较完再比较第三行,第四行,···。直到全部平均数差均与其对应Rk比较完为止。对于显著标上“*”,极显著标上“**”。82/167新复极差法此法是以统计量SSR概率分布为基础。SSR值由下式求得83/167SSR检验步骤计算出平均数标准误;由自由度dfe、秩次距M(所含平均数个数)查临界SSR值(附表6),计算最小显著极差LSR0.05,M,LSR0.01,M;将平均数多重比较表中各极差与对应最小显著极差LSR0.05,M,LSR0.01,M比较,作出统计推断84/167相关采取excel自定义函数来生成SSR值可参见文件85/167q检验法此法是以统计量q概率分布为基础。q值由下式求得q值分布表附表7其余与SSR检验法一样86/167

例6.2:

测定东北、内蒙古、河北、安徽、贵州5个地域黄鼬冬季针毛长度(mm),每个地域随机抽取4个样本,测定结果于下表,试比较各个地域黄鼬针毛长度差异显著性地域东北内蒙古河北安徽贵州132.029.225.523.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7

分析:1个原因,5个水平,4个重复方差分析87/167

解:“excel”-“工具”—“数据分析”—“单原因方差分析”由分析结果知:P<0.01,说明5个地域黄鼬冬季针毛长度差异显著88/167q检验1、计算平均数标准误2、查附表7,当dfe=15,M=2,q0.05=3.01,q0.01=4.17,则当M=3,M=4,M=5时按同理计算,结果列表89/167不一样地域黄鼬冬季针毛长度LSR值(q检验)地域平均数差异显著性0.050.01东北内蒙古河北安徽贵州31.6027.4026.0324.7522.85abbcABBC3、不一样地域黄鼬冬季针毛长度差异显著(q检验)dCcCM2345q0.053.013.674.084.37q0.014.174.835.255.56LSR0.051.4001.7071.8972.032LSR0.011.9392.2462.4412.58590/1674、结果表明:东北与其它地域;内蒙古和安徽、贵州黄鼬冬季针毛长度差异均达极显著水平。河北和贵州,安徽和贵州差异达显著水平。内蒙古和河北,河北和安徽差异不显著。

LSD检验分析结果:东北与其它地域;内蒙古和安徽、贵州;以及河北和贵州黄鼬冬季针毛长度差异均达极显著水平。安徽和贵州差异达显著水平。内蒙古和河北,河北和安徽差异不显著。91/167多重比较有各种方法,不一样方法用途不一样、比较结果不一样总结:多重比较尺度大小:LSD法≤SSR法≤q检验法

(原因:SSR和q检验是针对不一样秩次距平均数极差采取不一样显著尺度,充分考虑到同一总体抽样时,平均数极差将随秩次距增大而增大这一现象)对试验要求严格时,用q检验法较为妥当生物试验中,因为试验误差较大,常采取新复极差法(SSR法)应该注明利用是何种多重比较方法92/1671、多个试验组与一个对照组均数间两两比较

若目标是减小第II类错误,最好选取最小显著差法LSD

;若目标是减小第I类错误,最好选取SSR法。总结:多重比较2、多个样本均数间两两比较

惯用q检验方法93/167第二节单原因方差分析94/167单原因方差分析分析目标:判断某试验原因各水平相对效果分类:依据组内观察数目(重复数)是否相同1、组内观察次数相等方差分析2、组内观察次数不等方差分析95/167各处理重复次数不等方差分析Excel中对应函数:求和:SUM()求幂:POWER(x,power)求平方和:SUMSQ()96/167

例题6.3.用某种小麦种子进行切胚乳试验,试验分为3种处理:整粒小麦(I),切去二分之一胚乳(II),切去全部胚乳(III),同期播种于条件比较一致花盆内,出苗后每盆选留2株,成熟后进行单株考种,每株粒重(g)结果以下表,试进行方差分析

分析:1个原因,10个水平,3个重复方差分析97/167

解:“excel”-“工具”—“数据分析”—“单原因方差分析”

结果分析:3种处理单株粒重无显著差异98/167第三节二原因方差分析99/167

两原因试验资料方差分析是指对试验指标同时受到两个试验原因作用试验资料方差分析两原因方差分析主效应:各试验原因相对独立作用,简称主效或效应互作:某一原因在另一原因不一样水平上所产生效应不一样,则二原因间存在交互作用,简称互作。互作效应实际是因为两个或多个试验原因相互作用而产生效应100/167互作分类:

1、正交互作用

2、负交互作用

3、无交互作用:即互作效应为零。没有交互作用原因是相互独立原因,此时,不论在某个原因哪个水平,另一原因效应都是相等互作效应101/167互作与主效应关系:

原因间交互作用显著是否关系到主效应利用价值

1、若交互作用不显著:各原因效应能够累加,各原因最优水平组合起来,即为最优处理组合

2、若交互作用显著:各原因效应就不能累加,最优处理组合选定应依据各处理组合直接表现选定

3、有时候交互作用相当大,甚至能够忽略主效应互作效应102/167二原因方差分析分析目标:判断对原因主效应和交互作用分类:1、无重复观察值二原因方差分析2、含有重复观察值二原因方差分析前提条件:两原因之间无交互作用103/167前提二原因无互作,每个处理可不设重复数据假定A原因有a个水平、B原因有b个水平,每个水平组合只有一个观察值,全试验共有ab个观察值无重复观察值二原因方差分析104/167原因A原因BB1B2…Bb和平均

A1x11x12…x1bT1.

A2x21x22…x2bT2.…………………

Aaxa1xa2…xabTa和T.1T.2…T.bT平均数…无重复观察值二原因数据资料A原因每个水平看作b个重复

B原因每个水平看作a个重复105/167模型假定每个观察值为一个从平均值等于

ij

群体随机、独立抽样。共有a

b

个样本。处理效应和区组效应是加性。处理和区组没有互作数据方差相等eij为随机误差,相互独立,且服从N(0,

2)106/167数学模型

=总体平均ai=第i

个处理效应,

i.

bj=第j个区组效应,

.j

eij=

随机误差项,xij

ij107/167方差剖分无重复观察值二原因试验A原因每个水平有b次重复,B原因每个水平有a次重复,每个观察值同时受到A、B两原因及随机误差作用。所以全部ab个观察值总变异能够剖分为A原因水平间变异、B原因水平间变异及试验误差三部分自由度也对应剖分108/167平方和计算109/167各项方差计算110/167ANOVA表变异起源SSdfMSFc.v.A原因SSAa-1B原因SSBb-1误差SSe(a-1)(b-1)和SSTab-1111/167例题6.4:

将一个生长激素配成M1,M2,M3,M4,M5五种浓度,并用H1,H2,H3三种时间浸渍某大豆品种种子,出苗45天后得到各处理每一植株平均干物重(g),结果以下表,试作方差分析。

分析:2个原因,无重复方差分析112/167

解:“excel”-“工具”—“数据分析”—“无重复双原因方差分析”113/167

F检验结果表明:激素处理浓度之间F值大于F0.01,到达极显著水平;激素处理时间之间F值未到达显著水平,说明不一样激素浓度对大豆干物重有极显著影响。

多重比较(用SSR检验):激素处理浓度之间效应到达极显著水平,而激素处理时间之间F值未到达显著水平,所以只对5种浸渍浓度进行多重比较。114/167

计算浓度之间平均数标准误:

查SSR值表(附表6),得到在dfe=8时,不一样秩次距下SSR值和LSR值115/167不一样激素浓度大豆干物重多重比较LSR值(SSR检验)浓度平均数差异显著性0.050.01M1M2M4M5M313.6712.339.673.673.00aabcAABCM2345SSR0.053.263.403.483.52SSR0.014.754.945.065.14LSR0.051.481.551.581.60LSR0.012.162.252.302.34不一样激素浓度大豆干物重平均数差异显著(SSR检验)cC116/167

多重比较结果表明:

5种生长激素浓度度对大豆干物重有极显著影响。

M1与M2,M5与M3之间差异不显著;除此之外,其它激素浓度之间大豆干物重均到达极显著差异。

5种激素浓度中,M1和M2处理效果很好117/167假如两个原因存在互作将互作项和误差项平方和自由度分解有互作试验设计设重复有重复观察值二原因方差分析118/167上面讲过,原因可分作固定原因和随机原因。在两原因试验中,当两个原因都是固定原因时,称为固定模型(fixedmodel);两个原因均为随机原因时,称为随机模型(randommodel);一个原因是固定原因,另一个原因是随机原因时,称为混合模型(mixedmodel)。这三种模型即使在计算方法上没有多大不一样,但在检验以及对结果解释上却截然不一样。尤其是在两原因之间存在交互作用时,不一样类型模型区分就更显著。119/167

两原因试验经典设计是:假定A原因有a水平,B原因有b水平,则每一次重复都包含ab次试验,并设试验重复次数n次,χijk表示A原因第i水平,B原因第j水平和第k次重复观察值。数据将以下表形式出现。表2-7中A和B能够是固定原因,也能够是随机原因,因而引出三种不一样统计模型。120/167表2-7两原因交互分组试验普通格式原因Bj=1,2,…,b总计B1B2…Bb因素Ai∥1,2,∶,aA1Χ111Χ112∶Χ11nΧ121Χ122∶Χ12n…Χ1b1Χ1b2∶Χ1bnΧ1··A2Χ211Χ212∶Χ21nΧ221Χ222∶Χ22n…Χ2b1Χ2b2∶Χ2bnΧ2··∶∶∶…∶∶AaΧa11Χa12∶Χa1nΧa21Χa22∶Χa2n…Χab1Χab2∶ΧabnΧa··总计Χ·1·Χ·2·…Χ·b·Χ1··121/167表2-7中各种符号做以下说明:ci··表示A原因第i水平全部观察值和;c·j·表示B原因第j水平全部观察值和;cij·表示A第i水平和B第j水平全部观察值和;c···表示全部观察值综合。122/167数学模型123/167平方和计算124/167自由度计算125/167各项方差计算126/167F检验127/167固定模型128/167两原因固定模型方差分析表以下:表2-8固定模型方差分析表(原因A、B固定型)变差起源平方和自由度均方

F因素A因素B交互作用AB误差SSASSBSSAB

SSe

a-1b-1(a-1)(b-1)ab(n-1)

MSA

MSB

MSAB

MSe

MSA/MSeMSB/MSeMSAB/MSe总和

SSTabn-1129/167

例2.3为了从三种不一样原料和三种不一样发酵温度中,选出最适条件,设计了一个两原因试验。并得到以下结果(表2-9):原料种类A温度B30℃35℃40℃1234149232547595040433553501113252443383336553847446222618822181430332619130/167在这个试验中,温度和原料均为固定原因。每一处理有4次重复。所以可按上面叙述过方法分析。将表中每一数字均减去30,列成表2-10.1,由表2-10.1中,能够计算出及131/167表2-10.1发酵试验方差分析计算表原料A温度Bcij1cij2cij3cij4cij·c2ij·∑c2ijk12330354030354030354011-19-241713-221325019-1718298-8583-7-5-4203-122317-4-5-6-12106-162014-1118-47-487630-586164-12324220923045776900336437214096144556711800163027894811231174146∑=84228387366132/167利用χij·列列成表2-10.2。表2-10.2发酵试验方差分析表温度Bci··c2i··

303540原1料2

A318-47-487630-586154-12-77481135929230412769c·j·

c2·j·

15547-11824025220913924844015821002133/167由表2-10.2中能够计算出134/167列成方差分析表:表2-11发酵试验方差分析表变差起源平方和自由度均方

F

原料A温度BAB误差1554.173150.58808.751656.5022427777.091575.29202.1961.3512.67**25.68**3.30*总和7170.0035**a=0.01*a=0.05原料和温度在α=0.01水平上拒绝H0;交互作用在α=0.05水平上拒绝H0。所以酒精产量不但与原料与温度相关,而且与二者交互作用也相关。135/167随机模型136/167表2-14随机效应模型方差分析表(原因A、B随机型)变差来源平方和自由度均方F因素A因素B交互作用AB误差SSASSBSSABSSea-1b-1(a-1)(b-1)ab(n-1)MSAMSBMSABMSeMSA/MSABMSB/MSABMSAB/MSe

总和SSTabn-1随机效应模型方差分析表以下:137/167

例2.6为了研究不一样地块中施用不一样数量农家肥对作物产量影响,设计了一个两原因试验。试验结果列在下表中。地块B一号地二号地三号地施肥量A100kg200kg300kg400kg8.698.478.888.7210.8210.8611.1611.428.808.749.689.5411.0010.9210.9711.139.499.379.399.5911.0711.0111.0010.90

解前面已经说过,这是一随机模型。随机模型各项平方和计算与固定模型是一样。将上表中cijk每一个均减去9.5列成下表:138/167表2-15.1作物产量方差分析计算表施地肥量块cij1cij2cij·c

2ij·∑c2ijk一100二三-0.81-0.70-0.01-1.03-0.76-0.13-1.84-1.46-0.143.38562.13160.01961.71701.06760.0170一200二三-0.620.18-0.11-0.780.040.09-1.400.22-0.021.96000.04840.00040.99280.03400.0202一300二三1.321.501.571.361.421.512.682.923.087.18248.52049.48643.59204.26644.7450一400二三1.661.471.501.921.631.403.583.102.9012.81649.61008.41006.44204.81784.210013.6263.577232.9218139/167利用χijk列,列成下表:表2-15.2作物产量方差分析计算表地块ci·c2i··一二三施肥量100200300400-1.84-1.402.683.58-1.460.222.923.10-0.14-0.023.082.90-3.44-1.208.689.5811.83361.440075.342491.7764c·i·

c2·i·

3.029.12044.7822.84845.8233.8724和13.6265.8412180.3924由表2-15.1计算出140/167由表2-15.2计算出141/167列成方差分析表:变差来源平方和自由度均方

F施肥量A地块B交互作用AB误差22.33600.50081.22291.1327326127.45530.25040.20380.094436.53**1.232.16总和25.192423**a=0.01从以上方差分析表中,能够看出所选择不一样地块对产量没有显著影响。但不一样施肥两对产量影响极为显著。142/167混合模型143/167混合模型方差分析表以下:表2-16混合模型方差分析表(A固定,B随机)变差来源平方和自由度均方

F因素A因素B交互作用AB误差SSASSBSSABSSea-1b-1(a-1)(b-1)ab(n-1)MSAMSBMSABMSeMSA/MSABMSB/MSeMSAB/MSe

总和SSTabn-1144/167

例2·7表2-17所列出数据是四个受试者在四种速度下工作,即正常速度60%、80%、100%、120%所得到能量消耗比值,试验共有16种处理,每一处理重复观察2次,共做32次观察。表2-17四个受试者在四种速度下工作能量消耗受试时间B一二三四工作相对速度(正常速度百分数)A60801001202.703.301.381.352.351.952.262.131.712.141.741.561.671.503.412.561.902.003.142.291.631.053.173.182.721.853.513.151.391.722.222.19145/167

解首先,看原因类型。原因A是从60~120%这个范围内,人为地选出四个水平,这四个水平是能够严格控制,所以原因A为固定型;原因B四个水平,是从受试者人群中随机抽取,所以原因B为随机型。本试验属于混合效应模型。详细计算过程不再重复,下面给出方差分析表表2-18能量消耗试验方差分析表变差来源平方和自由度均方F相对速度A试验对象B交互作用A误差3.99480.45418.41231.7902339161.33160.15140.93470.11191.421.358.35总和14.651431146/167首先,检验假设因为F>F9,16,0.05,所以A、B之间存在交互作用。检验

F<F3,16,0.05,所以试验对象个体之间差异不显著。147/167最终,检验

F<F3,16,0.01,接收H01。原因A是不显著。在这四种速度下,工作能量消耗没有显著不一样。要提醒大家是,在混合模型方差分析时,正确区分原因类型,正确地使用检验统计量是非常主要。148/167ANOVA表变异起源MS固定模型随机模型混合模型(A固,B随)原因A原因BAxB误差MSAMSBMSABMSe

MSA/MSe

MSB/MSe

MSAB/MSe

MSA/MSAB

MSB/MSAB

MSAB/MSe

MSA/MSAB

MSB/MSe

MSAB/MSe149/167例题6.5:

为了研究某种昆虫滞育期长短和环境关系,在给定温度和光照条件下进行试验室培养,每一处理统计4只昆虫滞育天数,结果列于下表,试对该资料进行方差分析

分析:2个原因,有重复,固定模型方差分析注意:整个数据输入区域,即数据有标题150/167

解:“excel”-“工具”—“数据分析”—“可重复双原因方差分析”151/167光照间温度间光照和温度误差

F检验结果表明:不一样光照和温度对该昆虫滞育有极显著影响,即昆虫滞育期长短主要决定光照和温度;光照和温度二者之间互作关系不大需要对光照和温度分别作多重分析152/167采取Excel计算重复观察值二原因方差分析注意事项:1、数据输入区域必须有标题2、直接分析结果仅适用用固定模型153/167例题:用两种不一样饲料A和B,以不一样配比喻式喂养大白鼠,每一个饲料均取4个水平,各配比处理食量相同,每一个处理重复2次,一段时间后测定增重(单位:g),结果见exc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论