




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方差分析及MATLAB实现第第1 1章章 方差分析方差分析 在工农业生产和科学研究中在工农业生产和科学研究中, ,经常遇到这样的问题经常遇到这样的问题: :影响产品产量、质量的因素很多影响产品产量、质量的因素很多, ,我们需要了解在这我们需要了解在这众多的因素中众多的因素中, ,哪些因素对影响产品产量、质量有显哪些因素对影响产品产量、质量有显著影响著影响. .为此为此, ,要先做试验要先做试验, ,然后对测试的结果进行分然后对测试的结果进行分析析. .方差分析就是分析测试结果的一种方法方差分析就是分析测试结果的一种方法. . 在方差分析中在方差分析中, ,把在试验中变化的因素称为因把在试验中变
2、化的因素称为因子子, ,用用A A、B B、C C、.表示表示; ;因子在试验中所取的不因子在试验中所取的不同状态称为水平同状态称为水平, ,因子因子A A的的r r个不同水平用个不同水平用A A1 1、A A2 2、.、A Ar r表示表示. .1 1 单因子方差分析单因子方差分析1.1 1.1 基本概念与数学模型基本概念与数学模型水平观测值A1x11x12.x1n1A2x21x22x2n2Arxr1xr2xrnr 例例: :为寻求适应本地区的高产油菜品种为寻求适应本地区的高产油菜品种, ,今选了五今选了五种不同品种进行试验种不同品种进行试验, ,每一品种在四块试验田上得到每一品种在四块试验
3、田上得到在每一块田上的亩产量如下在每一块田上的亩产量如下: : 我们要研究的问题是诸不同品种的平均亩产量是我们要研究的问题是诸不同品种的平均亩产量是否有显著差异否有显著差异. . 试验的目的就是要检验假设试验的目的就是要检验假设 H H0 0:1 1=2 2=3 3=4 4=5 5是否成立是否成立. .若是拒绝若是拒绝 , ,那么我们就认为这五种品种的那么我们就认为这五种品种的平均亩产量之间有显著差异平均亩产量之间有显著差异; ;反之反之, ,就认为各品种间产就认为各品种间产量的不同是由随机因素引起的量的不同是由随机因素引起的. .方差分析就是检验假方差分析就是检验假设的一种方法设的一种方法.
4、 . 在本例中只考虑品种这一因子对亩产量的影响在本例中只考虑品种这一因子对亩产量的影响, ,五个五个不同品种就是该因子的五个不同水平不同品种就是该因子的五个不同水平. .由于同一品种在不由于同一品种在不同田块上的亩产量不同同田块上的亩产量不同, ,我们可以认为一个品种的亩产量我们可以认为一个品种的亩产量就是一个总体就是一个总体, ,在方差分析中总假定各总体独立地服从同在方差分析中总假定各总体独立地服从同方差正态分布方差正态分布, ,即第即第i i个品种的亩产量是一个随机变量个品种的亩产量是一个随机变量, ,它它服从分布服从分布N(N(i i,2 2), i=1,2,3,4,5.), i=1,2
5、,3,4,5. 设在某试验中设在某试验中, ,因子因子A A有有r r个不同水平个不同水平A A1 1,A,A2 2,.,A,.,Ar r, ,在在A Ai i水平下的试验结果水平下的试验结果X Xi i服从正态分布服从正态分布N(N(i i,2 2),i=1,2,.,r,),i=1,2,.,r,且且X X1 1,X,X2 2,.,X,.,Xr r间相互独立间相互独立. .现现在水平在水平A Ai i下做了下做了n ni i次试验次试验, ,获得了获得了n ni i个试验结果个试验结果X Xijij,j=1,2,.,n,j=1,2,.,ni i这可以看成是取自这可以看成是取自X Xi i的一个
6、容量为的一个容量为n ni i的的样本样本,i=1,2,.,r. ,i=1,2,.,r. 实际上实际上, ,方差分析是检验同方差的若干正态总体均值方差分析是检验同方差的若干正态总体均值是否相等的一种统计方法是否相等的一种统计方法. . 在实际问题中影响总体均值的因素可能不止一个在实际问题中影响总体均值的因素可能不止一个. .我们按试验中因子的个数我们按试验中因子的个数, ,可以有单因子方差分析可以有单因子方差分析, ,双双因子分析因子分析, ,多因子分析等多因子分析等. .例中是一个单因子方差分析例中是一个单因子方差分析问题问题. .水平观测值A1x11x12.x1n1A2x21x22x2n2
7、Arxr1xr2xrnr 由于由于XijN(i,2) , ,故故X Xijij与与i i的差可以看成一个随机误的差可以看成一个随机误差差ijN(0,2) . .这样一来这样一来, ,可以假定可以假定X Xijij具有下述数据结构式具有下述数据结构式: : 为了今后方便起见为了今后方便起见, ,把参数的形式改变一下把参数的形式改变一下, ,并记并记 称称为一般平均为一般平均, ,i i为因子为因子A A的第的第i i 个水平的效应个水平的效应. . Xij= i+ ij,i=1,2,.,r;j=1,2,.,ni其中诸其中诸ijN(0,2),且相互独立且相互独立. .要检验的假设是要检验的假设是
8、H0:1=2=r 在这样的改变下在这样的改变下, ,单因子方差分析模型中的数据结单因子方差分析模型中的数据结构式可以写成构式可以写成: :所要检验的假设可以写成所要检验的假设可以写成: : 为了导出检验假设的统计量为了导出检验假设的统计量, ,下面我们分析一下下面我们分析一下什么是引起诸什么是引起诸X Xijij 波动的原因波动的原因. . 平方和分解公式平方和分解公式:引起诸引起诸X Xijij 波动的原因有两个波动的原因有两个: :一一个是假设个是假设H H0 0为真时为真时, ,诸诸X Xijij的波动纯粹是随机性引起的的波动纯粹是随机性引起的; ;另一个可能是假设另一个可能是假设H H
9、0 0不真而引起的不真而引起的. .因而我们就想用一因而我们就想用一个量来刻划诸个量来刻划诸X Xijij之间的波动之间的波动, ,并把引起波动的两个原并把引起波动的两个原因用另两个量表示出来因用另两个量表示出来, ,这就是方差分析中常用的平这就是方差分析中常用的平方和分解法方和分解法. .1.2 1.2 统计分析统计分析其中交叉乘积项其中交叉乘积项下面我们来看各式的意义下面我们来看各式的意义 检验统计量的构造检验统计量的构造:对于各组样本有对于各组样本有因此因此 一般一般, ,当当FFFF0.010.01时时, ,称因子的影响高度显著称因子的影响高度显著, ,记为记为“* * *”;”;当当
10、F F0.010.01FFFF0.050.05时时, ,称因子的影响显著称因子的影响显著, ,记为记为“* *”; ”; 当当F FF F0.050.05时时, ,称因子无显著影响称因子无显著影响, ,即认为因子各水平间无差即认为因子各水平间无差异异. . 检验过程:检验过程:1.3 1.3 方差分析表方差分析表 例例: :为寻求适应本地区的高产油菜品种为寻求适应本地区的高产油菜品种, ,今选了五种不今选了五种不同品种进行试验同品种进行试验, ,每一品种在四块试验田上得到在每一块每一品种在四块试验田上得到在每一块田上的亩产量如下田上的亩产量如下: : 我们要研究的问题是诸不同品种的平均亩产量我
11、们要研究的问题是诸不同品种的平均亩产量是否有显著差异是否有显著差异. . 解解:先列表计算先列表计算例: 下面给出了随机选取的, 用于计算器的四种类型的电路的响应时间(以毫秒计). 表: 电路的响应时间类型I类型II类型III类型IV152220184021332716 17151826182219这里试验的指标是电路的响应时间这里试验的指标是电路的响应时间. 电路类型为因素电路类型为因素. 这一因素这一因素有四个水平有四个水平, 试验的目的是要考察各类型电路对响应时间的影试验的目的是要考察各类型电路对响应时间的影响响.设四种类型电路的响应时间的总体均为正态, 且各总体方差相同, 但参数均未知
12、. 又设各样本相互独立. 解解 分别以m1,m2,m3,m4记类型I,II,III,IV四种电路响应时间总体的平均值. 我们需检验(a=0.05)H0:m1=m2=m3=m4,H1:m1,m2,m3,m4不全相等.现在n=18, s=4, n1=n2=n3=5, n4=3,试验号12345和和平方类型I1915222018948836类型II204021332714119881类型III 1617151826928464类型IV182219593481ST,SA,SE的自由度依次为17,3,14 表:方差分析表方差来源 平方和自由度均方F值显著性因素318.983106.333.76*误差39
13、5.461428.25总和714.4417因因F0.95(3, 14)=3.343.76 F0.99(3, 14)=5.56, 故认为各类型电路故认为各类型电路的响应时间有显著差异的响应时间有显著差异.1.4. 单因素方差分析的单因素方差分析的Matlab实现实现单因素方差分析单因素方差分析:anova1调用格式调用格式:(1) p=anova1(X)(2) p=anova1(X,group)(3) p=anova1(X,group,displayopt)(4) p,table=anova1(.)(5) p,table,stats=anova1(.)(2) p=anova1(X,group)输
14、入:输入:X是一个向量,从第一个总体的样本到第是一个向量,从第一个总体的样本到第r个总体个总体的样本依次排列,的样本依次排列,group是与是与X有相同长度的向量,表示有相同长度的向量,表示X中的元素是如何分组的中的元素是如何分组的. group中某元素等于中某元素等于i,表示表示X中中这个位置的数据来自第这个位置的数据来自第i个总体个总体.因此因此group中分量必须取正整中分量必须取正整数,从数,从1直到直到r.(1)p=anova1(X) %比较比较X中各列数据的均值是否相中各列数据的均值是否相等。等。此时输出的此时输出的p是零假设成立时,数据的概率,是零假设成立时,数据的概率,当当p0
15、.05称差异是显著的,当称差异是显著的,当p X=2.1650 3.6961 1.5538 3.6400 4.95511.6268 2.0591 2.2988 3.8644 4.20111.0751 3.7971 4.2460 2.6507 4.23481.3516 2.2641 2.3610 2.7296 5.86170.3035 2.8717 3.5774 4.9846 4.9438; p=anova1(X)p =5.9952e-005例例. 某水产研究所为了比较四种不同配合饲料对鱼的某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼饲喂效果,选取了条件基本相同的鱼
16、20尾,随机分尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。鱼的增重结果列于下表。表表 饲喂不同饲料的鱼的增(单位:饲喂不同饲料的鱼的增(单位:10g)饲料鱼的增重(xij)A131.927.931.828.435.9A224.825.726.827.926.2A322.123.627.324.925.8A427.030.829.024.528.5四种不同饲料对鱼的增重效果是否显著四种不同饲料对鱼的增重效果是否显著 ?解:这是单因素均衡数据的方差分析,解:这是单因素均衡数据的方差分析,Matlab程序如下:程序如下:A=
17、31.927.931.828.435.9 24.825.726.827.926.2 22.123.627.324.925.8 27.030.829.024.528.5; %原始数据输入原始数据输入 B=A; % 将矩阵转置将矩阵转置,Matlab中要求各列为不同水平中要求各列为不同水平p=anova1(B) 运行后得到一表一图,表是方差分析表(重要);图是运行后得到一表一图,表是方差分析表(重要);图是各列数据的盒子图,离盒子图中心线较远的对应于较大的各列数据的盒子图,离盒子图中心线较远的对应于较大的F值,较小的概率值,较小的概率p.Source方差来源SS平方和df自由度MS均方差F统计量P
18、值Columns(因素A组间)SSAr-1SS/(r-1)7.140.0029Error误差(组内)SSEn-rSS/(n-r)Total总和SSTn-1表中所列出的各项意义如下:表中所列出的各项意义如下:因为因为p=0.0029FFF0.990.99时时, ,称因子的影响高度显著称因子的影响高度显著, ,记为记为“* * *”;”;当当F F0.990.99FFFF0.950.95时时, ,称因子的影响显著称因子的影响显著, ,记为记为“* *”; ”; 当当F FF F0.950.95时时, ,称因子无显著影响称因子无显著影响, ,即认为因子各水平间无差异即认为因子各水平间无差异. . 例
19、例:为了考察蒸馏水的为了考察蒸馏水的pH值和硫酸铜溶液浓度对化值和硫酸铜溶液浓度对化验血清中白蛋白与球蛋白的影响验血清中白蛋白与球蛋白的影响,对蒸馏水的对蒸馏水的pH值值(A)取了取了4个不同水平个不同水平,对硫酸铜溶液浓度对硫酸铜溶液浓度(B)取了取了3个不同个不同水平水平,在不同水平组合在不同水平组合(Ai,Bj)下各测一次白蛋白与球蛋白下各测一次白蛋白与球蛋白之比之比,其结果列于计算表的左上角其结果列于计算表的左上角.试检验两因子对化验结试检验两因子对化验结果有无显著差异果有无显著差异.解解查查F-分布表得分布表得:F0.95(3,6)= 4.76, F0.95(2,6)= 5.14 ,
20、 F0.99(3,6)=9.78, F0.99(2,6)=10.9,由此可知由此可知FA F0.99(3,6); FB F0.99(2,6).所以因子所以因子A及因子及因子B的不同水平对化验结果有高度显著影响的不同水平对化验结果有高度显著影响.2.3 有交互作用的双因子方差分析有交互作用的双因子方差分析11,00ijrsijijAiBj称 为一般平均为因子 的第 个水平的效应为因子 的第 个水平的效应 它们满足关系式其中其中n=rst 仍然用平方和分解的思想来给出检验用的统计量,先仍然用平方和分解的思想来给出检验用的统计量,先引入下述记号:引入下述记号:由此可知由此可知总的偏差平方和可作如下的
21、分解总的偏差平方和可作如下的分解:其中各偏差平方和表达式如下其中各偏差平方和表达式如下: 各偏差平方和的意义各偏差平方和的意义: : S SE E表示试验的随机波动引起的误差表示试验的随机波动引起的误差, ,称为误差平方和称为误差平方和; ; S SA A除了反映了试验的随机波动引起的误差外除了反映了试验的随机波动引起的误差外, ,还反映了还反映了因子因子A A的效应间的差异的效应间的差异, ,称为因子称为因子A A的偏差平方和的偏差平方和; ; S SB B除了反映了试验的随机波动引起的误差外除了反映了试验的随机波动引起的误差外, ,还反映了还反映了因子因子B B的效应间的差异的效应间的差异
22、, ,称为因子称为因子B B的偏差平方和的偏差平方和; ; S SA AB B除了反映了试验的随机波动引起的误差外除了反映了试验的随机波动引起的误差外, ,还反还反映了交互效应的差异所引起的波动映了交互效应的差异所引起的波动, ,称为交互作用的偏称为交互作用的偏差平方和差平方和. . 同无交互作用的情况类似可得同无交互作用的情况类似可得: 检验统计量及显著性检验检验统计量及显著性检验: 这就是用来检验假设这就是用来检验假设H01,H02,H03,的统计量的统计量.按照显著性假按照显著性假设检验程序设检验程序,对给定的显著性水平对给定的显著性水平, 当当FAF1-(r-1,rs(t-1)时拒绝时
23、拒绝H01; 当当FBF1-(s-1,rs(t-1)时拒绝时拒绝H02; 当当 FABF1-(r-1)(s-1),rs(t-1)时拒绝时拒绝H03. 具体的计算过程具体的计算过程,各偏差平方和的计算也可用下面简化的各偏差平方和的计算也可用下面简化的表达式表达式,且可列成一张计算表和方差分析表且可列成一张计算表和方差分析表. 一般一般,当当FF0.99时时,称因子的影响高度显著称因子的影响高度显著,记为记为“*”;当当F0. 99FF0.95时时,称因子的影响显著称因子的影响显著,记为记为“*”;当当FF0.95时时, 称因称因子无显著影响子无显著影响,即认为因子各水平间无差异即认为因子各水平间
24、无差异. 例例:在某化工生产中为了提高收率在某化工生产中为了提高收率,选了三种不同浓度选了三种不同浓度,四种不四种不同温度做试验同温度做试验.在同一浓度与同一温度组合下各做二次试验在同一浓度与同一温度组合下各做二次试验,其其收率数据如下而计算表所列收率数据如下而计算表所列(数据均已减去数据均已减去75).试检验不同浓度试检验不同浓度,不同温度以及它们间的交互作用对收率有无显著影响不同温度以及它们间的交互作用对收率有无显著影响.解解:查表知查表知F0.95(2,12)=3.89, F0.99(2,12)=6.93; F0.95(3,12)=3.49, F0.99(3,12)=5.95; F0.9
25、5(6,12)=3.00, F0.99(6,12)=4.81.由此知由此知F0.95FA F0.99,而而FBF0.95,FABF0.95.故浓度不同将对故浓度不同将对收率产生显著影响收率产生显著影响;而温度和交互作用的影响都不显著而温度和交互作用的影响都不显著.2.4. 双因素的方差分析的双因素的方差分析的MATLAB实现实现 在在Matlab中双因素的方差分析命令如下:中双因素的方差分析命令如下:双因素方差分析双因素方差分析:anova2调用格式调用格式:(1) p=anova2(X)(2) p=anova2(X,reps)(3) p=anova2(X,reps,displayopt)(4
26、) p,table=anova1(.)(5) p,table,stats=anova1(.) 在在Matlab中双因素有交互作用的方差分析命令如下:中双因素有交互作用的方差分析命令如下:p,t,s=anova2(X,resp)其中输入其中输入X是一个矩阵;是一个矩阵;resp表示试验的重复次数输出的表示试验的重复次数输出的p值有三个,分别为各行、各列以及交互作用的概率值有三个,分别为各行、各列以及交互作用的概率.若若p0.05,有显著差异有显著差异若若p X=5.5 4.5 3.55.5 4.5 4.06.0 4.0 3.06.5 5.0 4.07.0 5.5 5.07.0 5.0 4.5;
27、p=anova2(X,3)p =0.0000 0.0001 0.7462Friday, March 18, 2022MATLAB和R软件83例例 一火箭使用了一火箭使用了4种燃料,种燃料,3种推进器作射程试验,种推进器作射程试验,每种燃料与每种推进器的组合各发射火箭每种燃料与每种推进器的组合各发射火箭2次,次,得到结果如下:得到结果如下:B1B2B3A158.2,52.6 56.2,41.265.3,60.8A249.1,42.854.1,50.551.6,48.4A360.1,58.370.9,73.239.2,40.7A475.8,71.5 58.2,51.048.7,41.4试在水平试在
28、水平0.05下,检验不同燃料(因素下,检验不同燃料(因素A)、)、不同推进器(因素不同推进器(因素B )下的射程是)下的射程是否有显著差异?交互作用是否显著?否有显著差异?交互作用是否显著?84解解 编写程序如下:编写程序如下:clc,clearx0=58.2,52.6 56.2,41.2 65.3,60.849.1,42.8 54.1,50.5 51.6,48.460.1,58.3 70.9,73.2 39.2,40.775.8,71.5 58.2,51.0 48.7,41.4;x1=x0(:,1:2:5);x2=x0(:,2:2:6);for i=1:4x(2*i-1,:)=x1(i,:)
29、;x(2*i,:)=x2(i,:);endp=anova2(x,2)求得求得p=0.0035 0.0260 0.001,表明各试验均值相等的概率都,表明各试验均值相等的概率都为小概率,故可拒绝均值相等假设。即认为不同燃料(因为小概率,故可拒绝均值相等假设。即认为不同燃料(因素素A)、不同推进器(因素)、不同推进器(因素B)下的射程有显著差异,)下的射程有显著差异,交互作用也是显著的。交互作用也是显著的。例例某高校为了解数学与计算机专业低年级、高年级、研究生某高校为了解数学与计算机专业低年级、高年级、研究生在人文社科知识方面差异,各选在人文社科知识方面差异,各选4 4名学生考试,成绩如下名学生考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 不动产权证书办理协议
- 海外二手车采购协议
- 合同终止的法律协商
- 怎样制作炫酷的创新创业项目
- 怎样预防春季疾病
- 辛集中学高二历史限时训练PDF版含答案
- 阳泉职业技术学院《铁路运输服务礼仪》2023-2024学年第二学期期末试卷
- 陇南师范高等专科学校《文学文本分析与应用》2023-2024学年第一学期期末试卷
- 陕西国际商贸学院《文学概论(I)》2023-2024学年第二学期期末试卷
- 陕西工业职业技术学院《应用有机化学》2023-2024学年第二学期期末试卷
- 2025年临床医师定期考核必考复习题库及答案(900题)
- 人力资源外包投标方案
- 国家旅游局新版团队出境旅游合同模板
- 装修工程施工进度计划表excel模板
- 一元立木材积表
- 4S店三表一卡标准模板
- 部编人教版二年级下册道德与法治全册教学课件
- 五年级语文下册 第四单元 9 古诗三首教学反思1 新人教版 素材
- 高中生物竞赛 第九章 染色体畸变课件
- 四年级下册《小数的意义和性质》整理和复习
- 土壤污染修复技术对比分析
评论
0/150
提交评论