生物统计学-单因素方差分析_第1页
生物统计学-单因素方差分析_第2页
生物统计学-单因素方差分析_第3页
生物统计学-单因素方差分析_第4页
生物统计学-单因素方差分析_第5页
已阅读5页,还剩169页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 方差分析应用统计学应用统计学 重庆大学生物工程学院重庆大学生物工程学院两个样本数据平均数比较两个样本数据平均数比较1、当总体方差、当总体方差 和和 已知,或总体方差已知,或总体方差 和和 未未知,但两样本均为大样本知,但两样本均为大样本21212222u 检验检验2、当总体方差、当总体方差 和和 未知,且两样本均为小样本未知,且两样本均为小样本2122t 检验检验检验,然后再检验,考察成组数据:首先检验成对数据:直接tFt2121or例例1.为了分析重庆大学为了分析重庆大学20122012年本科生中各地生源的高考年本科生中各地生源的高考成绩情况,从成绩情况,从20122012年新生中,

2、分别从生物、电气、机年新生中,分别从生物、电气、机械、土木、管理、外语等学院中调查四川、重庆、辽械、土木、管理、外语等学院中调查四川、重庆、辽宁、江苏、陕西、广西宁、江苏、陕西、广西6 6地生源的高考成绩,试问这地生源的高考成绩,试问这6 6地生源的高考成绩有无差异?地生源的高考成绩有无差异?例例2.为调查不同品种的小麦产量,分别从为调查不同品种的小麦产量,分别从3 3种不同小麦种不同小麦品种的试验田中抽取品种的试验田中抽取100100株小麦株,测试每株的小麦株小麦株,测试每株的小麦重量,试问这三种品种的小麦哪种的产量最高?重量,试问这三种品种的小麦哪种的产量最高?方差分析的意义方差分析的意义

3、k个样本均数的比较:个样本均数的比较: 如果仍用如果仍用t检验或检验或u检验,需比较次数为:检验,需比较次数为: 次)!2( ! 2!2kkCk 例如例如4 4个样本均数需比较次数为个样本均数需比较次数为6 6次。次。假设每次比较所确定的检验水准为假设每次比较所确定的检验水准为0.050.05, 则每次检验拒绝则每次检验拒绝H H0 0不犯第一类错误的概率为不犯第一类错误的概率为1-0.05=0.951-0.05=0.95; 那么那么6 6次检验都不犯第一类错误的概率为次检验都不犯第一类错误的概率为(1-0.05)(1-0.05)6 6=0.7351=0.7351, 而犯第一类错误的概率为而犯

4、第一类错误的概率为0.26490.2649方差分析的意义方差分析的意义k个样本均数的比较:个样本均数的比较: 如果仍用如果仍用t检验或检验或u检验,有以下问题:检验,有以下问题: 1 1、检验过程繁琐、检验过程繁琐 2 2、无统一的试验误差,误差估计的精确性和检、无统一的试验误差,误差估计的精确性和检 验的灵敏性低验的灵敏性低 3 3、推断的可靠性降低,犯第、推断的可靠性降低,犯第1 1类错误的概率增加类错误的概率增加 方差分析方差分析由英国由英国统计学家统计学家R.A.FisherR.A.Fisher首首创,为纪念创,为纪念FisherFisher,以,以F F命名,故方差分析又命名,故方差

5、分析又称称 F F 检验检验 (F F -test -test)。)。用于推断用于推断多个总体均多个总体均数数有无差异有无差异 方差分析的基本原理方差分析的基本原理组别A1 A2 Ai重复x11 x21 xi1 x12 x22 xi2 x1j x2j xij总和Ti.T1. T2. Ti. 平均 ix 1x 2x ix xijxTainjainjainjiiiijiijainjiiijainjijxxxxxxxxxxxxxx111111221121122)()(xxxxxxiiijij22xxxxxxiiijij01111njiijaiiainjiiijxxxxxxxxaiainjiijiai

6、njijxxxxnxx11122112方差分析的意义方差分析的意义方差分析基本思想:方差分析基本思想:1 1、把、把k k个总体当作一个整体看待个总体当作一个整体看待2 2、把观察值的总变异的平方和及自由度分、把观察值的总变异的平方和及自由度分 解为不同来源的平方和及自由度解为不同来源的平方和及自由度3 3、计算不同方差估计值的比值、计算不同方差估计值的比值4 4、检验各样本所属的平均数是否相等、检验各样本所属的平均数是否相等 实际上是观察值变异原因的数量分析实际上是观察值变异原因的数量分析 方差分析的应用条件和用途方差分析的应用条件和用途方差分析应用条件:方差分析应用条件: 1 1、各样本须

7、是相互独立的随机样本、各样本须是相互独立的随机样本 2 2、各样本来自正态分布总体、各样本来自正态分布总体 3 3、各总体方差相等,即方差齐、各总体方差相等,即方差齐 方差分析基本用途:方差分析基本用途: 1 1、多个样本平均数的比较、多个样本平均数的比较 2 2、多个因素间的交互作用、多个因素间的交互作用 3 3、回归方程的假设检验、回归方程的假设检验 4 4、方差的同质性检验、方差的同质性检验第一节 方差分析的基本原理 试验指标试验指标(Experimental index)(Experimental index):试验测定的项目或:试验测定的项目或者性状。者性状。日增重、产仔数、瘦肉率日

8、增重、产仔数、瘦肉率 试验因素试验因素(Experimental factor)(Experimental factor):影响试验指标的因:影响试验指标的因素,也称:素,也称:处理因素处理因素,简称,简称因素因素或或因子因子。 1 1、可控因素(固定因素):人为可控、可控因素(固定因素):人为可控 2 2、非控因素(随机因素):不能人为控制、非控因素(随机因素):不能人为控制试验因素的表示:试验因素的表示: 大写字母大写字母A A, , B B, , C C, , 等来表示等来表示一、相关术语一、相关术语 因素水平因素水平(Level of factor)(Level of factor):

9、试验因素所处的特定状态:试验因素所处的特定状态或者数量等级。简称或者数量等级。简称水平水平水平的表示方法:水平的表示方法:用代表该因素的字母添加下标表示,如用代表该因素的字母添加下标表示,如A A1 1,A A2 2,B B1 1,B B2 2 试验处理试验处理(Treatment)(Treatment):实施在试验单位上的具体项目:实施在试验单位上的具体项目, ,简称简称处理处理。单因素:试验因素的一个水平单因素:试验因素的一个水平多因素:试验因素的一个水平组合多因素:试验因素的一个水平组合一、相关术语一、相关术语 试验单位试验单位(Experimental unit)(Experiment

10、al unit):试验载体,即根据研:试验载体,即根据研究目的而确定的观测总体究目的而确定的观测总体 重复重复(Repetition)(Repetition):一个处理实施在两个或者两个:一个处理实施在两个或者两个以上的试验单位上,称为处理有重复。以上的试验单位上,称为处理有重复。试验单位数称为处理的重复数试验单位数称为处理的重复数一、相关术语一、相关术语 方差分析方差分析是关于是关于k k( (k k3)3)个样本平均数的假设测个样本平均数的假设测验方法,是将验方法,是将总变异总变异按照来源分为按照来源分为处理效应处理效应和和试验试验误差误差,并做出其数量估计。,并做出其数量估计。 发现各变

11、异原因在总变异中相对重要程度的一发现各变异原因在总变异中相对重要程度的一种统计分析方法。种统计分析方法。 二、方差分析的基本原理二、方差分析的基本原理 总变异总变异分解为分解为组间变异组间变异和和组内变异组内变异。组内变异组内变异是个体差异所致,是抽样误差。是个体差异所致,是抽样误差。组间变异组间变异可能由两种原因所致,可能由两种原因所致, 一是一是抽样误差抽样误差; 二是二是处理不同处理不同。 在抽样研究中抽样误差是不可避免的,故在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断是否存在

12、,需通过假设检验作出推断二、方差分析的基本原理二、方差分析的基本原理三、数学模型三、数学模型处理A1 A2 Ai Ak 重复x11 x21 xi1 xk1x12 x22 xi2 xk2 x1j x2j xij xkj x1n x2n xin xkn总和Ti.T1. T2. Ti. Tk.平均 每组具有每组具有n个观测值的个观测值的k组样本数据资料组样本数据资料 ix 1x 2x ix kxxijxT三、数学模型三、数学模型), 0(:2Njiijixxijijiijijiij分布相互独立,且服从正态要求个观测值的试验误差,个处理的第第数个处理观测值总体平均第个观测值个处理的第第kiik11,有

13、:对于总体平均数三、数学模型三、数学模型为试验误差处理的效应为样本的第为样本平均数模型为:对于由样本估计的线性即有:个处理效应,则为第令ijiijiijijiijiiieitxetxxxi三、数学模型三、数学模型混合模型固定模型、随机模型和可分为:的不同假定,数学模型根据对处理效应i的估计和比较分析的目的是应,且是由固定因素引起的效是固定的一个常量,效应固定模型:各个处理的iii0估计和检验即侧重在效应的方差的的变异程度,还有效应研究的目的不仅是处理随机变量的正态总体中得到一个是一个随机变量,是从因素所引起的效应。不是一个常量,由随机效应随机模型:各个处理的iiiiN), 0(2混合模型因素,

14、则该试验对应于又包括随机效应的试验应的试验因素,验中,若既包括固定效混合模型:在多因素试四、平方和与自由度的分解四、平方和与自由度的分解 方差即均方是离均差平方和除以自由度方差即均方是离均差平方和除以自由度则考察总方差可以考察处理间方差和处理内的方差则考察总方差可以考察处理间方差和处理内的方差四、平方和与自由度的分解四、平方和与自由度的分解平方和的分解:平方和的分解:总总平方和平方和= =处理处理间间平方和处理平方和处理内内平方和平方和tTeitijijTetTSSSSSSCTnSSCxnkTxSSnkTCSSSSSS那么:令矫正系数:即:222221)()(四、平方和与自由度的分解四、平方和

15、与自由度的分解自由度的分解:自由度的分解:总总自由度自由度= =处理处理间间自由度处理自由度处理内内自由度自由度) 1() 1() 1(11nkknkdfdfdfkdfnkdfdfdfdftTetTetT即:四、平方和与自由度的分解四、平方和与自由度的分解计算方差:计算方差:eeetttdfSSsdfSSs22处理内方差处理间方差五、统计假设的显著性检验五、统计假设的显著性检验F检验检验F F检验的目的:推断处理间的差异是否存在检验的目的:推断处理间的差异是否存在2222022:1etAetetHH即:相等,与误差方差认为处理间方差,的变量假设来同一总体无效假设是把各个处理、假设:、确定显著性

16、水平2五、统计假设的显著性检验五、统计假设的显著性检验F检验检验223etssF处理内方差处理间方差、计算”或不标记符合值右上方标记“在说明处理间差异不显著,则接受,则如果所计算的值。下的和值表中查出在,从根据确定的显著水平、推断ns,05. 04005. 0FHPFFFdfdfFet”号;值右上方标记“在水平,说明处理间差异达显著,接受,否定,则若FHPFFet,05. 022005. 0”号;值右上方标记“在显著水平,说明处理间差异达极,则若FPFF01. 001. 0注意:注意:方差分析中的方差分析中的F F检验总是检验总是单尾检验单尾检验, ,而且为而且为右尾检验右尾检验 F F越大,

17、越大,越说明越说明组间方差组间方差是主要方差来源,是主要方差来源, 因子影响越显著;因子影响越显著;F F越小,越小,越说明越说明随机方差随机方差是主要的方差来源,是主要的方差来源, 因子的影响越不显著因子的影响越不显著五、统计假设的显著性检验五、统计假设的显著性检验F检验检验 egeg. . 某水产研究所为了比较四种不同配合饲料对鱼的饲某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼喂效果,选取了条件基本相同的鱼2020尾,随机分成尾,随机分成4 4组,投喂不同饲料,经组,投喂不同饲料,经1 1个月以后,各组鱼的增重个月以后,各组鱼的增重(g g)资料如下表,试进行

18、方差分析资料如下表,试进行方差分析饲饲料料重复重复A1A1A2A2A3A3A4A41 13193192482482212212702702 22792792572572362363083083 33183182682682732732902904 42842842792792492492452455 5359359262262258258286286 分析分析:1 1个因素,个因素,4 4个水平,个水平,5 5个重复的方差分析个重复的方差分析 解解:22220:1etAetHH则、假设:05. 02、确定显著性水平01. 0,极显著性水平223etssF 、计算AVERAGESUMi求解采用函

19、数平均数求解采用函数总和xTiSUMSQ平方和求解采用函数tTeitijTSSSSSSCTnSSCxSSnkTCnk35.11435105.1998605.1517454153744105.15174544555095,42222平方和计算:由题有:163193141191451tTetTdfdfdfkdfnkdf自由度计算:、推断4”号。值右上方标记“在显著水平,说明处理间差异达极,则因为FPFF01. 001. 0不同饲料饲喂鱼增重的方差分析表不同饲料饲喂鱼增重的方差分析表Excel方差分析方差分析OfficeOffice的默认安装中没有的默认安装中没有“数据分析数据分析”要指定才要指定才

20、会安装。一旦安装,会安装。一旦安装,“工具工具”菜单下出现菜单下出现“数据数据分析分析”条,可以用它来方便的做方差分析等统计条,可以用它来方便的做方差分析等统计推断分析。推断分析。可通过运行可通过运行AnalysisAnalysis中的模板文件中的模板文件 ANALYS32.XLLANALYS32.XLL调入此宏调入此宏加载数据分析加载数据分析如如“工具工具”菜单下没有菜单下没有“数据分析数据分析”单击单击“加载宏加载宏”Excel解方差分析解方差分析选一批单元格输入原始数据选一批单元格输入原始数据; ;Excel解方差分析解方差分析选选“工具工具”“”“数据分析数据分析”; ;Excel解方

21、差分析解方差分析选选“工具工具”“”“数据分析数据分析”“单因素方差分析单因素方差分析”Excel解方差分析解方差分析“单因素方差分析单因素方差分析”对话框中:对话框中: 输入区域,分组方式,输出选项输入区域,分组方式,输出选项Excel解方差分析解方差分析“单因素方差分析单因素方差分析”对话框中:填入信息对话框中:填入信息后单击后单击“确定确定”按钮按钮Excel解方差分析解方差分析分析结果分析结果Excel解方差分析解方差分析方差分析结果表中各项目的含义方差分析结果表中各项目的含义SS SS 平方和平方和df df 自由度自由度MS MS 均方均方F F及及 F crit FF crit

22、F值及值及F F临界值,临界值, F crit=FINV(a, dfF crit=FINV(a, df1 1,df,df2 2) )P-value FP-value F分布概率分布概率 P-value=FDIST(F,dfP-value=FDIST(F,df1 1,df,df2 2) ) F F检验检验如果否定了如果否定了H H0 0,接受了,接受了H HA A,表明试验,表明试验的的总变异主要来源于处理间的变异总变异主要来源于处理间的变异六、多重比较六、多重比较 多重比较:多重比较:多个平均数的相互比较多个平均数的相互比较 常用的:常用的: 1 1、最小显著差数法(、最小显著差数法(LSDL

23、SD法)法) 2 2、最小显著极差法(、最小显著极差法(LSRLSR法)法) 新复极差检验(新复极差检验(SSRSSR法)法) qq检验检验LSDLSD法的步骤:法的步骤:nMSsexxji2.最小显著差数法(最小显著差数法(LSD法)法)检验两个平均数相比较的t1 1、计算平均数、计算平均数差差数标准误数标准误2 2、由、由t逆逆函数函数( (TINVTINV) )和平均数差数标准误计算出达到和平均数差数标准误计算出达到差异显著的最小差数,记为差异显著的最小差数,记为LSDLSD.)(jiexxdfstLSDLSDxxji3、将全部平均数、将全部平均数从大到小从大到小依次排列,并比较若依次排

24、列,并比较若 即为在给定的水平上差异显著,即为在给定的水平上差异显著, 反之亦然反之亦然 说明说明实质上是实质上是 t t 检验,但统一了标准误检验,但统一了标准误简单、灵敏(降低了检验标准、夸大了差异的简单、灵敏(降低了检验标准、夸大了差异的显著性)显著性) I I 类错误概率增大类错误概率增大, , 控制单次比较的控制单次比较的I I类错误类错误时应用时应用无法控制所有比较的总体无法控制所有比较的总体 I I 类错误类错误最小显著差数法(最小显著差数法(LSD法)法)2、求解达到差异显著的最小差数、求解达到差异显著的最小差数(LSD)临界值:临界值:t0.05(16)=2.120, t0.

25、01(16)= 2.921 LSD0.05(16)=2.120*14.622=31.0 LSD0.01(16)=2.921*14.622=42.7622.145/475.534221.nMSsexxji误、求解平均数差数标准例:3、将全部平均数、将全部平均数从大到小从大到小依次排列,并比较依次排列,并比较excel数据的排序数据的排序工具工具数据分析数据分析排序与百分比排序与百分比excel数据的排序数据的排序处理处理平均数平均数A1311.864.4*49.0*32.2*A4279.632.2*16.8nsA2262.815.4nsA3247.44 .247.ix8 .262.ix6 .27

26、9.ix四种饲料饲喂鱼增重差异显著性四种饲料饲喂鱼增重差异显著性(LSD检验,梯形法检验,梯形法)4、分析结果:、分析结果:A1饲料对鱼增重效果极显著高于饲料对鱼增重效果极显著高于A3和和A2,显著高于,显著高于A4;A4饲料对鱼增重效果显著高于饲料对鱼增重效果显著高于A3;A4和和A2,A2和和A3饲料对鱼增重效果没有显著差异饲料对鱼增重效果没有显著差异四种饲料饲喂鱼增重差异显著性四种饲料饲喂鱼增重差异显著性(LSD检验,字母标记法检验,字母标记法)处理处理平均数平均数差异显著性差异显著性0.050.01A1A4A2A3311.8279.8262.8247.4(1) 在最大的平均数上标字母在

27、最大的平均数上标字母aA1行标注行标注aa (2)将该平均数与以下各平均数相将该平均数与以下各平均数相比,凡相差不显著的比,凡相差不显著的(LSD0.05,则则A4标标bb (3)再以标有再以标有b的平均数为标准,与各个的平均数为标准,与各个比它大的平均数比较比它大的平均数比较,凡差,凡差数数差异不显著差异不显著的在字母的右边加标字母的在字母的右边加标字母b,然后再以标,然后再以标b的最大平均的最大平均数为标准与数为标准与以下未标字母以下未标字母的平均数相比,凡相差不显著的都标上字的平均数相比,凡相差不显著的都标上字母母b,直到某个,直到某个与相差显著与相差显著的则标字母的则标字母c往上:往上

28、:(A4-A1)是已经比是已经比较了;往下较了;往下(A4-A2)=17.0,标标b,(A4-A3)=32.4,标标cbc (4)以此重复,直到最小的平均数标记字母以此重复,直到最小的平均数标记字母以以A3为标准为标准,往上:往上:A3与与A2相比无显著差异,故在相比无显著差异,故在A2行行b右边标注右边标注c,A3与与A4已比较了已比较了cAABBB 总结:差异不显著标同一字母,差异显著标不同字母总结:差异不显著标同一字母,差异显著标不同字母四种饲料饲喂鱼增重差异显著性四种饲料饲喂鱼增重差异显著性(LSD检验,字母标记法检验,字母标记法) 判断:判断:凡有一个相同标记字母的即为差异不显著,凡

29、有一个相同标记字母的即为差异不显著, 凡具有不同标记字母的即为差异显著凡具有不同标记字母的即为差异显著分析结果:分析结果:A1饲料对鱼增重效果极显著高于饲料对鱼增重效果极显著高于A3和和A2,显著高于,显著高于A4;A4饲料对鱼增重效果显著高于饲料对鱼增重效果显著高于A3;A4和和A2,A2和和A3饲料对鱼增重效果没有显著差异饲料对鱼增重效果没有显著差异Excel解解LSDjiexxjidfsxxt)(nssexxji22.SQRTTDIST函数函数 把把平均数的差异平均数的差异看成是看成是平均数的极差平均数的极差(range)(range) 根据极差范围内所包括的处理数(称为根据极差范围内所

30、包括的处理数(称为秩次距秩次距)k k的不同,而采用不同的检验尺度叫做的不同,而采用不同的检验尺度叫做 最小显著最小显著极差极差LSRLSR 秩次距秩次距是指当平均数由大到小排序后,相比较的是指当平均数由大到小排序后,相比较的两个平均数之间(含这两个平均数)包含的平均两个平均数之间(含这两个平均数)包含的平均数个数数个数 I I类错误下降、工作量加大类错误下降、工作量加大最小显著极差法(最小显著极差法(LSR法)法)新复极差法新复极差法 此法是以统计量此法是以统计量SSR的概率分布为基础的。的概率分布为基础的。SSR值由下式求得值由下式求得xsdSSR xMdfksSSRLSR),(,nMSs

31、ex/SSR检验步骤检验步骤 计算出计算出平均数标准误平均数标准误; 由自由度由自由度dfe、秩次距、秩次距M(所含平均数的个数所含平均数的个数)查查临临界界SSR值(附表值(附表6),计算最小显著极差,计算最小显著极差LSR0.05,M,LSR0.01,M; 将平均数多重比较表中的各极差与相应的最小显将平均数多重比较表中的各极差与相应的最小显著极差著极差LSR0.05,M, LSR0.01,M比较,作出统计推断比较,作出统计推断q检验法检验法 此法是以统计量此法是以统计量q q的概率分布为基础的。的概率分布为基础的。q q值由下式求得值由下式求得xsdq xMdfMsqLSR),(,nMSs

32、ex/q q值分布表附表值分布表附表7 7 其余与其余与SSRSSR检验法一样检验法一样 例例6.2: 6.2: 测定东北、内蒙古、河北、安徽、贵州测定东北、内蒙古、河北、安徽、贵州5 5个地区个地区黄鼬冬季针毛的长度黄鼬冬季针毛的长度(mm)(mm),每个地区随机抽取,每个地区随机抽取4 4个样个样本,测定结果于下表,试比较各个地区黄鼬针毛长本,测定结果于下表,试比较各个地区黄鼬针毛长度的差异显著性度的差异显著性地区地区东北东北内蒙古内蒙古河北河北安徽安徽贵州贵州1 132.029.225.523.322.32 232.827.426.125.122.53 331.226.325.825.1

33、22.94 430.426.726.725.523.7 分析分析:1 1个因素,个因素,5 5个水平,个水平,4 4个重复的方差分析个重复的方差分析 解:解:“excelexcel”“工具工具”“数据分析数据分析”“单因素方差分析单因素方差分析”由分析结果知:由分析结果知:P P0.010.01,说明,说明5 5个地区黄鼬冬季针毛长个地区黄鼬冬季针毛长度差异显著度差异显著q检验检验1、计算、计算平均数标准误平均数标准误465. 04/866. 0/nMSSex 2、查附表、查附表7,当dfe=15, M=2, q0.05=3.01, q0.01=4.17,则40. 101. 3465. 005

34、. 0LSR94. 117. 434.1001. 0LSR当当M=3, M=4,M=5时按同理计算,结果列表时按同理计算,结果列表不同地区黄鼬冬季针毛长度的不同地区黄鼬冬季针毛长度的LSR值(值(q检验)检验)地区地区平均数平均数差异显著性差异显著性0.050.01东东 北北内蒙古内蒙古河河 北北安安 徽徽贵贵 州州31.6027.4026.0324.7522.85abbcABBC3、不同地区黄鼬冬季针毛长度的差异显著(、不同地区黄鼬冬季针毛长度的差异显著(q检验)检验)dCcCM2345q0.05 3.013.674.084.37q0.01 4.174.835.255.56LSR0.05 1

35、.400 1.707 1.897 2.032 LSR0.011.939 2.246 2.441 2.585 4、结果表明结果表明:东北与其他地区;内蒙古和安徽、贵州黄鼬冬季针毛长度差东北与其他地区;内蒙古和安徽、贵州黄鼬冬季针毛长度差异均达极显著水平。异均达极显著水平。河北和贵州,安徽和贵州差异达显著水平。河北和贵州,安徽和贵州差异达显著水平。内蒙古和河北,河北和安徽差异不显著。内蒙古和河北,河北和安徽差异不显著。 LSD检验的分析结果检验的分析结果: 东北与其他地区;内蒙古和安徽、贵州;以及东北与其他地区;内蒙古和安徽、贵州;以及 河北和贵州黄鼬冬季针毛长度差异均达极显著水平。河北和贵州黄鼬

36、冬季针毛长度差异均达极显著水平。 安徽和贵州差异达显著水平。安徽和贵州差异达显著水平。 内蒙古和河北,河北和安徽差异不显著。内蒙古和河北,河北和安徽差异不显著。 多重比较有多种方法,不同方法用途不同、比较多重比较有多种方法,不同方法用途不同、比较的结果不同的结果不同总结:多重比较总结:多重比较尺度大小:尺度大小:LSDLSD法法SSRSSR法法q q检验法检验法 (原因原因:SSRSSR和和q q检验是针对不同秩次距的平均数极差采检验是针对不同秩次距的平均数极差采用不同的显著尺度,充分考虑到同一总体抽样时,平用不同的显著尺度,充分考虑到同一总体抽样时,平均数的极差将随秩次距的增大而增大这一现象

37、均数的极差将随秩次距的增大而增大这一现象) 对试验要求严格时,用对试验要求严格时,用q q检验法较为妥当检验法较为妥当 生物试验中,由于试验误差较大,常采用新复极差生物试验中,由于试验误差较大,常采用新复极差法(法(SSRSSR法)法) 应该注明利用的是何种多重比较方法应该注明利用的是何种多重比较方法1 1、多个实验组与一个对照组均数间两两比较、多个实验组与一个对照组均数间两两比较 若目的是减小第若目的是减小第II II类错误,最好选用最小显著类错误,最好选用最小显著差法差法LSDLSD ; 若目的是减小第若目的是减小第I I类错误,最好选用类错误,最好选用SSRSSR法。法。总结:多重比较总

38、结:多重比较 2 2、多个样本均数间两两比较、多个样本均数间两两比较 常用常用q q检验的方法检验的方法第二节 单因素方差分析单因素方差分析单因素方差分析分析目的:分析目的: 判断某试验因素各水平的相对效果判断某试验因素各水平的相对效果分类:分类: 根据根据组内观测数目组内观测数目(重复数)是否相同(重复数)是否相同1 1、组内观测次数、组内观测次数相等相等的方差分析的方差分析2 2、组内观测次数、组内观测次数不等不等的方差分析的方差分析 例例 调查了调查了5 5个不同小麦品系的株高,结果列于表。个不同小麦品系的株高,结果列于表。分析:分析:在这个例子中,只出现在这个例子中,只出现“品系品系”

39、这样这样一个因素一个因素(factor)(factor),故称单因素。共有,故称单因素。共有5 5 个不同的品系,我们个不同的品系,我们称品系这一因素共有称品系这一因素共有5 5个水平个水平(level)(level)。5 5个品系可以认个品系可以认为是为是5 5个总体,表的数据是从个总体,表的数据是从5 5个总体中抽出的个总体中抽出的5 5个样本,个样本,通过比较这通过比较这5 5个样本,判断这个样本,判断这5 5个总体是否存在差异个总体是否存在差异。表表 5 5个小麦品系株高调查结果个小麦品系株高调查结果 株号株号株株 高高 1 2 3 4 5 和和 64.665.364.866.065.

40、8326.5 64.565.364.663.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平均数平均数65.364.467.370.868.6 例例 为了探讨不同窝的动物的出生重是否存在差异,为了探讨不同窝的动物的出生重是否存在差异,随机选取随机选取4 4窝动物,每窝中均有窝动物,每窝中均有4 4只幼仔,结果如下:只幼仔,结果如下: 表表 4窝动物的出生重(克)窝动物的出生重(克) 动物号动物号窝窝 别别1234和和34.733.326.231.6125.833.

41、226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均数平均数31.45030.02526.22529.500 通过对以上数据的分析,判断不同窝别动物通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。出生重是否存在差异。 以上两个例子的共同点是:每个实验都只有一以上两个例子的共同点是:每个实验都只有一个因素,个因素,该因素有该因素有a a个水平或称为有个水平或称为有a a个处理个处理(treatment)(treatment),这样的实验称为单因素实验。,这样的实验称为单因素实验。 从单因从单因素实验的每一处理所得

42、到的结果都是一随机变量素实验的每一处理所得到的结果都是一随机变量X X i i。对于对于a a个处理,各重复个处理,各重复n n次(或者说做次(或者说做n n次观察)的单次观察)的单因素方差分析的一般化表示方法见表。因素方差分析的一般化表示方法见表。单因素方差分析的典型数据单因素方差分析的典型数据 X1X2X3 X i X a 123 :j nx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3: : :x3j xij xaj: : :x3n xin xan平均数平均数x1 x2 x3 xi xa 表中的数据

43、表中的数据xij,表示第表示第 i 次处理下的第次处理下的第j次观察值。其中的次观察值。其中的n个符号做如下说明:个符号做如下说明:xanxxxaixnxxxainjijiiniiji1), 2 , 1(1111 用用“ ”表示下标的和,使用时很方便,表示下标的和,使用时很方便,在以后会经常遇到。在以后会经常遇到。 常用如下的所谓常用如下的所谓线性统计模型线性统计模型(linear statistical (linear statistical model)model)描述每一个观察值:描述每一个观察值:) 12(, 2 , 1, 2 , 1njaixijiij其中:其中:x xij ij 是

44、在第是在第 i i 水平(处理)下的第水平(处理)下的第 j j 次观察次观察值。值。是对所有观察值的一个参量,称为是对所有观察值的一个参量,称为总平均数总平均数(overall mean)(overall mean)。i i是仅限于对第是仅限于对第 i i 次处理的一次处理的一个参量,称为第个参量,称为第i i次次处理效应处理效应(treatment effect)(treatment effect)。方差分析的目的,就是要检验处理效应的大小或有方差分析的目的,就是要检验处理效应的大小或有无。无。e eijij是随机误差成份。是随机误差成份。 上述模型中,包括两类不同的处理效应。第一类处上述

45、模型中,包括两类不同的处理效应。第一类处理效应称为理效应称为固定效应固定效应( (fixed effectfixed effect) ),它是由,它是由固定因素固定因素( (fixed factorfixed factor) )所引起的效应。若因素的所引起的效应。若因素的a a个水平是经个水平是经过特意选择的,则该因素称为固定因素。例如,几个不过特意选择的,则该因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几种同的实验温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的治疗方案和治不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。疗效

46、果等。 在这些情况中,因素的水平是特意选择的,所检验的在这些情况中,因素的水平是特意选择的,所检验的是关于是关于a ai i 的假设,得到的结论只适合与方差分析中所考虑的假设,得到的结论只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类的那几个水平,并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、品种等,似水平上。所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所用的模型称为称为固定因素。处理这样的因素所用的模型称为固定效应固定效应模型模型(fixed effect modelfixed effect model)。例)

47、。例2.12.1中的中的5 5个小麦品系是个小麦品系是特意选择的,目的是从这特意选择的,目的是从这5 5 个品系中,选出最优者,因而个品系中,选出最优者,因而“品系品系”这个因素属于固定因素,所用的模型是固定效应这个因素属于固定因素,所用的模型是固定效应模型模型。 第二类处理效应称为第二类处理效应称为随机效应随机效应(random effectrandom effect),),它是由它是由随机因素随机因素(random factorrandom factor)所引起的效应。若因)所引起的效应。若因素的素的a a 个水平,是从该因素全部水平的总体中随机抽出的个水平,是从该因素全部水平的总体中随机

48、抽出的样本,则该因素称为随机因素。从随机因素的样本,则该因素称为随机因素。从随机因素的a a 个水平所个水平所得到的结论,可以推广到这个因素的所有水平上。处理随得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型称为机因素所用的模型称为随机效应模型随机效应模型(random effect random effect modelmodel)。例)。例2.22.2的动物窝别,是从动物所有可能的窝别中的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而否存在差异,因而“窝别窝别”是随机因

49、素。是随机因素。 有时固定因素和随机因素很难区分,除上述所讲的有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。原则外,还可以从另一角度鉴别。固定因素固定因素是指因素是指因素水平,可以严格地人为控制水平,可以严格地人为控制。在水平固定之后,它的。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,水解产物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准确地控制即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实验时

50、,水解产物的在一个固定值上,所以在重复该实验时,水解产物的产量也是固定的。简单地说,在水平(不同温度)固产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度定以后,其效应值(产量)也是固定的。因此,温度是固定因素。是固定因素。 随机因素随机因素的水平的水平是不能严格地人为控制的是不能严格地人为控制的,在,在水平确定之后,它的效应值并不固定。例如,在研水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对作物产量的影响试验中,农究不同农家肥施用量对作物产量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作家肥是因素,不同施用量是该因素的

51、不同水平,作物的产量是它的效应值。由于农家肥的有效成份很物的产量是它的效应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的有效成份复杂,不能像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即使严格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定的效应值。施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而农家肥是一随机因素。(产量)并不固定,因而农家肥是一随机因素。 二、二、 固定效应模型固定效应模型 在固定效应模型中,在固

52、定效应模型中,a ai i 是处理平均数与总平均数的离是处理平均数与总平均数的离差,且是个常量,因而差,且是个常量,因而 )22(01aiia要检验要检验a个处理效应的相等性,就要个处理效应的相等性,就要ai 判断各是判断各是否等于否等于0。若各。若各ai 都等于都等于0,则各处理效应之间,则各处理效应之间无差异。因此,零假设为:无差异。因此,零假设为: 0:210aH备择假设为:备择假设为: HA:ai0(至少有(至少有1个个i)。若接受)。若接受H0,则不存在处理效应,每个观察值都是由平均数,则不存在处理效应,每个观察值都是由平均数加上随机误差所构成。若拒绝加上随机误差所构成。若拒绝H0,

53、则存在处理效应,则存在处理效应,每个观察值是由总平均数、处理效应和误差三部分每个观察值是由总平均数、处理效应和误差三部分构成。构成。 方差分析的基本思想方差分析的基本思想,就是将总的变差分解为构成总变差,就是将总的变差分解为构成总变差的各个部分。对单因素实验,可以将总平方和(的各个部分。对单因素实验,可以将总平方和(total sum of squa-res)做如下分解:)做如下分解: ainjainjainjiiiijiijainjiiijainjijxxxxxxxxxxxxxx111111221121122对于每个固定的对于每个固定的 xi , 01111njiijaiiainjiiijx

54、xxxxxxx因此,因此, )32(11122112aiainjiijiainjijxxxxnxx(23)式表示度量全部数据变差的总平方和,可)式表示度量全部数据变差的总平方和,可以分解为处理平均数与总平均数之间离差的平方以分解为处理平均数与总平均数之间离差的平方和,处理内部观察值与处理平均数之间离差的平和,处理内部观察值与处理平均数之间离差的平方和两部分。处理平均数与总平均数之间的离差,方和两部分。处理平均数与总平均数之间的离差,度量了处理之间的差异;而处理内部观察值与处度量了处理之间的差异;而处理内部观察值与处理平均数之间的离差,度量了随机误差的大小。理平均数之间的离差,度量了随机误差的大

55、小。用用SSSST T表示表示总平方和总平方和, )42(112ainjijTxxSS用用SSA表示(表示(23)等号右边第一项,称为)等号右边第一项,称为处理平方和处理平方和(treatments sum of squares)或称为)或称为处理间平方和处理间平方和(sum of squares between treatments)。)。)52(12aiiAxxnSS 用用SSe表示(表示(23)等号右边第二项,称为)等号右边第二项,称为误差平方和误差平方和(error sum of squares)或称为)或称为处理内平方和处理内平方和(sum of squares within tre

56、atments)。因此:)。因此: )62( eATSSSSSS自由度自由度可以做同样的分割:可以做同样的分割:SST具具an1自由度自由度dfTan1;A因素工有因素工有a 水平,因而水平,因而SSA有有a1自由度自由度dfAa1;SSe有有ana自由度,这是因为每一处理均有自由度,这是因为每一处理均有n1自由度,共有自由度,共有a个处理,因而个处理,因而SS e的自由度为的自由度为ana,dfeana。为了估计为了估计s2,用,用SS e除以相应的自除以相应的自由度由度 MS e称为称为误差均方误差均方(error mean square)。)。 用类似的方法,可以求出处理均方用类似的方法

57、,可以求出处理均方MSA(treatments mean square) )72( aanSSMSee)82(1aSSMSAA用用MSA与与MS e比较,就可以反映出比较,就可以反映出a i的大小。若的大小。若MSA与与MS e相差不大,就可以认为各相差不大,就可以认为各a i与与0的差异的差异不大,或者说各不大,或者说各m i之间差异不大。若之间差异不大。若MSA与与MS e超出很多,则认为各超出很多,则认为各 m i之间差异是显著的。为此,之间差异是显著的。为此,用用F单侧检验,具单侧检验,具dfA,dfe自由度。自由度。 当当FFa时,则可以认为时,则可以认为MSA与与MSe差异不大,产

58、生的差异不大,产生的变差是由随机误差造成的;接受零假设,处理平均数变差是由随机误差造成的;接受零假设,处理平均数之间差异不显著。当之间差异不显著。当FFa时,拒绝零假设,处理平均时,拒绝零假设,处理平均数间差异显著。数间差异显著。 以上所述可以归纳成方差分析表(以上所述可以归纳成方差分析表(table of variance analysis),见表),见表2-4。 )92( eASSMSF表表2-4 单因素固定效应模型方差分析表单因素固定效应模型方差分析表 变差来源变差来源平方和平方和自由度自由度均均 方方F处理间处理间误差或处理内误差或处理内SSASSea1naaMSAMSeMSAMS e

59、 总总 和和SSTna1现在用以上各式计算例现在用以上各式计算例2.1。在方差分析中,为了简化计算。在方差分析中,为了简化计算同样可以用编码法。方差分析的编码,必须将全部数据均同样可以用编码法。方差分析的编码,必须将全部数据均减去同一个共同的数。在例减去同一个共同的数。在例2.1中,每一个中,每一个xij都减去都减去65,列,列成下表,先计算校正项成下表,先计算校正项C 96.129555722naxC再计算再计算32.14796.12928.2771122112CxnaxxSSainjijainjijT株号株号品品 系系123450.40.30.21.00.80.50.30.41.31.12

60、.81.32.11.83.56.87.15.04.16.04.23.24.83.32.5总总 和和x ix 2ixi j1.52.251.933.09.003.411.5132.2529.4329.0841.0174.4618.0324.068.06571308.50277.28 58.1574.13132.14774.13196.129550.1308112ATeaiiASSSSSSCxnSS将以上结果列成方差分析表将以上结果列成方差分析表(见表见表25): 表表2-5 不同小麦品系株高方差分析表不同小麦品系株高方差分析表 变变 差差 来来 源源平平 方方 和和自自 由由 度度均均 方方 F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论