数学专业毕业论文方差分析与应用_第1页
数学专业毕业论文方差分析与应用_第2页
数学专业毕业论文方差分析与应用_第3页
数学专业毕业论文方差分析与应用_第4页
数学专业毕业论文方差分析与应用_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差分析与应用第一章 前言方差分析(analysis of variance, 简称anova)有英国统计学家费歇尔创立。早先用于生物和农业,其后在许多科学研究方面都得到了广泛应用。在科学实验或生产生活实践中,任何事物总是受很多因素影响,例如,工业产品的质量受原料、机器、人工等因素的影响。农作物的产量受种子、肥料、土壤、水分、天气等因素的影响。利用实验数据,分析各个因素对该事物的影响是否显著,数理统计中所采用的一种有效方法就是方差分析。当方差分析需要进行实验来获得实验数据作为分析的对象时,将要考察的指标称为实验指标、影响实验指标的条件称为因素、因素所处的状态称为该因素的水平。如果在实验中只有一

2、个因素在改变,则称为单因素实验,否则称为多因素实验,本文讨论单因素实验和双因素实验。在文章中excel软件在方差分析中的应用也得到了充分的体现,为我们进行分析提供了很大的方便,我们就他在农业和饲养业中的有效应用展开论述。在农业科学研究中,通常会获取大量的数据,这些数据虽然凌乱且复杂,但其中蕴含的信息量往往较大,只有通过正确的处理和统计分析,才能发现其中的内部规律,从而总结规律得出结论。方差分析是统计分析中常用的分析方法,也是一种比较有效的分析方法,以前农业科研工作者在进行方差分析时主要是借助简单的计算器用手算进行,导致数据处理效率低且容易出错。利用微软公司研发的excel软件进行方差分析不仅操

3、作简便,而且可同时生成优美的电子表格,可有效地解决农业科研工作者进行方差分析时的繁琐计算问题,很大程度的提高了工作效率,在准确性方面也比较可信。 在饲养业中,通过进行饲养实验后,我们对原始数据进行方差分析,以确定最有效的饲养方法,可对原始数据进行分析是件烦琐的工作,需要大量的工作,花费不少时间。在这里我们也可以利用 excel应用软件快速、准确解决饲养试验中的方差分析计算任务。excel提供了一组数据分析工具,称为“分析工具库”,可以在进行复杂的统计或工程分析时节省宝贵的时间。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计和工程函数,在输出表格中显示相应的结果,把分析结果很

4、直观的摆在我们面前,省时有省力,具体应用过程我们将在下文进行详细的分析。第二章 预备知识2.1 单因素试验的方差分析2.1.1单因素试验的概念为了分析某一个因素a对所考察的随机变量的影响,我们可以在试验时让其它因素保持不变,而只让因素a改变,这样的试验叫做单因素试验,因素a所处的状态叫做水平。2.1.2单因素试验的方差分析原理设因素a有不同水平,各水平对应的总体服从正态分布,(); 这里我们假定各有相同的标准差,但各总体均值可能不同.例如,可以是用种不同工艺生产的电灯泡的使用寿命,或者是个不同品种的小麦的单位面积产量,等等。在水平进行次试验;,我们假定所有的试验都是独立的.设得到样本观测值j如

5、下表: 表2-1水平a1a2al观察值因为在水平下的样本观测值与总体服从相同的分布,所以有,() (1.1)我们的任务就是根据这l组观测值来检验因素a对试验结果的影响是否显著.如果因素a的影响不显著,则所有样本观测值就可以看作是来自同一总体,因此要检验的原假设是; (1.2)令. 当(1.2)成立时,各则原假设(1.2)等价于. 方差分析问题实质上是一个假设检验问题,下面探讨如何构造合适的统计2.1.3方差分析统计量的构造1定义组内平均值总平均值,总离差平方和,组间平方和误差平方和sa反映各组样本之间的差异程度,即由于因素a的不同水平所引起的系统差异;se反映各种随机因素引起的试验误差。2几个

6、重要结论我们可以导出如下结论:; sa与se是相互独立的; 若h0成立,则,.3构造f统计量利用以上结论,定义:组间平均平方和;误差平均平方和 考察统计量,它服从什么分布?因为,利用上面的结论及f分布的定义可知2.1.4 方差分析的方法如果因素a的各个水平对总体的影响差不多,则组间平方和sa较小,因而f也较小;反之,如果因素a的各个水平对总体的影响显著不同,则组间平方和sa较大,因而f也较大.由此可见,我们可以根据值的大小来检验上述原假设h对于给定的显著性水平,由f分布表5查得相应的分位数。如果由样本观测值计算得到的f的值大于,则在水平下拒绝原假设,即认为因素a的不同水平对总体有显著影响;如果

7、的值不大于,则接受,即认为因素a的不同水平对总体无显著影响。通常分别取=0.05和=0.01,按f所满足的不同条件作出不同的判断:表2-2条 件显 著 性ff0.05不显著f0.05 f0.01高度显著(可用“*”表示)通常还根据计算结果,列出如下方差分析表: 表2-3方差来源平方和自由度均方和f值临界值显著性组 间误 差sasel-1n-lf0.05f0.01 总 和s n-1 注:有时为了简化计算,可把全部观察值减去或加上一个常数c,并不影响离差平方和的计算结果。2.2 双因素无重复试验的方差分析2.2.1双因素试验的方差分析原理如果我们要同时考虑两个因素a与b对所考察的随机变量是否有影响

8、的问题,则应讨论双因素试验的方差分析,设因素a有不同水平,因素b有不同水平,在它们的每一种搭配(ai,)下的总体服从正态分布,(;)。这里我们假定各有相同的标准差,但各总体均值可能不同. 所谓无重复试验就是因素a和b的每一种水平搭配(ai,bj)下仅取一个观察值xij, 我们假定所有的试验都是独立的. 全部样本观测值xij可用下表表示: 表2-4因素b因素ab1b2bma1a2al因为观测值与总体服从相同的分布,所以有,() (1.3)我们的任务就是根据这些观测值来检验因素a和b对试验结果的影响是否显著.令 (总均值)(在因素a的水平下的均值)(在因素b的 水平下的均值),(因素a的水平的效应

9、),(因素b的水平的效应)显然有,因此可表示为 若因素a或b的影响不显著,则其各水平的效应为零.要检验的原假设可分别设为 , (1.4), (1.5)2.2.2方差分析统计量的构造1.定义第行平均值第列平均值总平均值,总离差平方和,因素a的离差平方和,因素b的离差平方和,误差平方和sa与sb分别反映因素a和b的不同水平所引起的系统差异;而se则反映各种随机因素引起的试验误差。2.几个重要结论我们可以导出如下结论:; 是相互独立的; 若h01成立,则, 若h02成立,则.3.构造f统计量利用以上结论,定义:因素a的平均平方和;因素b的平均平方和;误差平均平方和. 考察统计量和,利用上面的结论及f

10、分布的定义可知当h01成立时,当h02成立时,2.2.3方差分析的方法与单因素试验方差分析方法相仿,我们可以根据fa与fb的值的大小来检验上述原假设h01与h02。对于给定的显著性水平,由f分布表查得相应的分位数,如果由样本观测值计算得到的f的值大于,则在水平下拒绝原假设,即认为该因素的不同水平对总体有显著影响;如果f的值不大于,则接受原假设,即认为该因素不同水平对总体无显著影响。通常分别取=0.05和=0.01,按f所满足的不同条件作出不同的判断: 表2-5条 件显 著 性ff0.05不显著f0.05 f0.01高度显著(可用“*”表示)通常还根据计算结果,列出如下方差分析表: 表2-6方差

11、来源平方和自由度均方和f值临界值显著性因素asal-1fa0.05fa0.01 因素bsbm-1fb0.05fb0.01 误 差se(l-1)(m-1) 总 和slm-1 注:有时为了简化计算,可把全部观察值xij减去或加上一个常数c,并不影响离差平方和的计算结果。2.3双因素等重复实验的方差分析2.3.1交互作用的概念交互作用-两个因素a与b的各个水平之间的不同搭配对试验结果的影响. 例1 某化工厂为了掌握不同的催化剂量(毫升)、不同的聚合时间(小时)和不同的聚合温度(oc)对合成橡胶生产中转化率(%)的影响规律,做了两批试验,结果如下: 表2-7聚合时间催化剂量0.51聚合温度催化剂量30

12、502484.2089.3488.8394.252487.684.875.596.2从表2-7可见,催化剂量对转化率的影响与聚合时间长短无关,聚合时间对转化率的影响也与催化剂量大小无关,从而催化剂量与聚合时间之间不存在交互作用。从表2-7可见,当催化剂量为2毫升时,聚合温度低则转化率就高,而当催化剂量为4毫升时,聚合温度高就转化率高。这说明催化剂量对转化率的影响与聚合温度有关。同理,聚合温度对转化率的影响也与催化剂量有关,从而催化剂量与聚合温度之间存在交互作用。2.3.2考虑交互作用时的双因素等重复试验的方差分析原理因素a和因素b的交互作用记为或简记为i为了分析这种交互作用,对于它们的每一种搭

13、配(ai,bj)()需要分别进行r2次重复试验,即共需进行次试验。设搭配(ai,bj)下的总体服从布 ,() 这里,我们假定各有相同的标准差,但各总体均值可能不同。我们假定所有的试验都是独立的。全部样本观测值xijk()可用下表表示: 表2-8因素b因素ab1b2bma1al因为观测值xijk与总体服从相同的分布,所以有,() (1.6)我们的任务就是根据这些观测值来检验因素a、b及其交互作用对试验结果的影响是否显著我们仍沿用第二节的符号,再定义ai和bj对试验结果的交互效应为 ,() 则,()且易证.,我们要检验因素a、b及其交互作用对试验结果的影响是否显著。相当于检验原假设: ,()2.3

14、.3 方差分析统计量的构造1.定义 总平均值,总离差平方和,因素a的离差平方和,因素b的离差平方和,交互作用的离差平方和,误差平方和。sa与sb分别反映因素a和b的不同水平所引起的系统差异;si反映因素a和b的不同水平搭配所引起的系统差异;而se则反映各种随机因素引起的试验误差。2.几个重要结论 我们可以导出如下结论:; sa、sb、si、se是相互独立的; 若h01成立,则 若h02成立,则 若h03成立,则3.构造f统计量利用以上结论,定义:因素a的均方和;因素b的均方和;交互作用均方和;误差均方和考察统计量,利用上面的结论及f分布的定义可知当h01成立时, ; 当h02成立时,当h03成

15、立时,; 2.3.4 方差分析的方法我们可以根据fa、fb与fi的值的大小来检验上述原假设h01 、h02与h03,对于给定的显著性水平,由f分布表查得相应的分位数, 通过比较f的值与的大小,判断该因素的不同水平对总体有没有显著影响。通常分别取=0.05和=0.01,按f所满足的不同条件做出不同的判断: 表2-9条 件显 著 性ff0.05不显著f0.05 f0.01高度显著(可用“*”表示)通常还根据计算结果,列出如下方差分析表: 表2-10方差来源平方和自由度均方和f值临界值显著性因素asafa0.05fa0.01 因素bsbfb0.05fb0.01 交互作用isifi0.05fi0.01

16、 误 差se 总 和s 第三章 应用3.1 microsoft excel 方差分析功能介绍microsoft excel 是一个十分通用的计算机软件,它含有方差分析的功能。方差分析方法能判断各因素对试验指标的影响是否显著,并找出较好的水平组合。3.1.1 单因素方差分析若要考虑一个因素对某项试验指标的影响是否显著,则可通过对此因素的多个水平进行比较,找到最优水平,这时可采用单因素方差分析方法。例2 为提高合成纤维的抗拉强度,考虑合成纤维中棉花百分比这一因素a对其抗拉强度y的影响。选定因素a的5个水平:a1=15%,a2=20%,a3=25%,a4=30%,a5=35%.各水平重复试验5次。希

17、望通过试验分析找出最优工艺条件(引自刘朝荣试验的设计与分析第26页)。用excel软件解决此题的步骤如下:(1) 在某工作簿的电子表格中输入试验数据如下 图3-1(2)用鼠标单击主菜单的“工具”,然后单击下拉菜单的“数据分析”,再在弹出的窗口中选择“单因素方差分析”并单击“确定”按钮.。这时弹出“方差分析:单因素方差分析”对话框,选择各选项如图3-2后,单击“确定”按钮。 图3-2这时得到单因素方差分析的结果如图3-3所示, 图3-3 其中“f crit”栏中的2.866081为临界f0.05(4,20);“p-value”栏表示f分布的截尾概率。现在f=14.7572.866081说明合成纤

18、维中棉花百分比对其抗拉强度的影响是显著的,当然,若选=0.01,则临界值f0.01(4,20)=4.43说明其影响还是高度显著的。再从summary表中可见,a4的平均值21.6最大,方差也较小,因此,合成纤维中棉花百分比取30%时,其抗拉强度最高。注:每行数据个数也可以不等。3.1.2双因素方差分析通过例子来说明:例3用excel软件解决此题的步骤如下:(1)在某工作簿的电子表格中输入试验数据如图3-4,把ai和bj同一搭配的重复试验数据放在不同行; 图3-4(2)用鼠标单击主菜单的“工具”,然后单击下拉菜单的“数据分析”,在弹出的窗口中选择“可重复双因素方差分析”并单击“确定”按钮。这时弹

19、出“方差分析:可重复双因素方差分析”对话框,选择各选项如图3-5后,单击“确定”按钮。 图3-5这时得到可重复双因素方差分析的结果如图3-6所示,关键是看第2934行的方差分析表。其中“fcrit”栏为临界值。“样本”对应因素a;“列”对应因素b;“内部”对应误差。现fa=3.473.4903=fa0.05(3,12),fb=1.472.99612=fi0.05(6,12), 图3-6说明工人与机器的交互作用对产量的影响是显著的。对于无重复的方差分析,也可模仿此方法操作,我们不再赘述。3.2 方差分析在农业中的应用在农业科研中,不管试验设计如何完善、测量仪器 如何精确,试验数据之间总会存在差异

20、,这种差异是由试验中采用不同的处理方法、试验过程中的不可控制因素、试验中出现的偶然因素共同作用造成的,是不可避免的。为了解这些数据间差异的程度,通常要对这些数据进行方差分析。方差分析就是根据试验处理平均数的方差与试验误差的方差之间的比值(f值)的大小来判断各试验处理对试验均数有无显著的影响。通常将主要计算结果列成如表 3-1所示的方差分析表。 表3- 1 方差分析表变异来源自由度平方和均方检验临界值dfssms=ss/df处理间aa-1误差ear-a总变异ar-13.2.1 在excel中安装分析工具库 利用 excel进行方差分析首先要求其中有数据分析工具。打开excel,选择“工具”菜单,

21、察看是否有“数据分析”选项,若没有,则在“工具”菜单的下拉菜单中选择“加载宏”选项,在“加载宏”选项中选择“分析工具库”子选项,按“确定”按钮即可。在安装了“数据分析”工具之后,就可以利用excel方便地进行方差分析了。3.2.2 单因素方差分析 在单因素方差分析中,影响总体均值的因素仅有一个,单因素方差分析是方差分析最简单的形式。单因素方差分析假定总体均值服从正态分布,且方差相等。 例 4 设有5种治疗麻疹的药,要比较它们的疗效。为此,将30个病人随机分成5组,每组6人,令同组的病人使用同一种药,并记录下病人从使用药开始到痊愈所需天数(表3-2)。试检验5种药物的疗效有无显著差异。 表3-2

22、 5种治疗麻疹药治愈病人天数表药物 治愈所需天数a6877108b466356c644532d746635e945776应用 excel进行单因素方差分析的操作步骤如下: (1)新建一excel工作表,分别单击a1:g5单元格,输入表3-2中对应的数据; (2)单击“工具”菜单中的“数据分析”选项,单击其中的“方差分析;单因素方差分析”选项,单击“确定”按钮; (3)在出现的“方差分析;单因素方差分析”对话框中,在“输入区域”中输入“$a$1:$g$5”,在“分组方式中选择“行”,在“a”中输入“0.05”与“0.01”,在“输出区域”中输入“$a$6”,单击“确定”按钮。方差分析的最终结果如

23、表3-3所示: 表3-3 单因素方差分析结果表差异源ssdfmsff crit组间47.47411.875.55=2.76误差53.50252.14=4.18总计100.9729从表3-3可知,f值大于fnn5=276与 i=418,说明5种治疗麻疹的药物的疗效在5水平上显著,在l水平上极显著。 3.2.3 双因素方差分析 在实际问题中,可能不只一个因素对试验结果产生影响。如果同时研究两种因素对试验结果的影响,则要进行双因素方差分析。 根据两种因素对试验结果有无交互影响,方差分析又可分为无重复双因素方差分析和可重复双因素方差分析。 1. 无重复双因素方差分析 例 5 土壤因素(a)有砂土、壤土

24、和粘土三个水平,施肥因素(b)有对照(不施)、施 n肥、施p肥、施n肥和p肥,进行育苗试验,秋后落叶后调查树苗高度(表3-4)。试分析土壤、施肥和它们的交互作用对苗高生长的影响。应用 excel进行无重复双因素方差分析的操作步骤如下: (1) 新建一excel工作表,分别单击a1:e4单元格,输入表3-4中对应的数据 表3-4 不同土质、施肥条件下苗高资料表土壤因素 施肥因素b1(对照)b2(n)b3(n+k)b4(n+p)a1(砂土)32457462a2(壤土)52639073a3(粘土)43548570 (2)单击“工具”菜单中的“数据分析”选项,单击其中的“方差分析;无重复双因素方差分析

25、”选项 ,单击“确定”按钮; (3)在出现的“方差分析;无重复双因素方差分析对话框中,在“输入区域”中输人“口a口1:口e口4”,在“a”中输入“005”,在“输出区域”中输入“口a口5”,单击“确定”按钮。方差分析的最终结果如表3-5所示。由表3-5可知,不同的土壤和不同的施肥方法对育苗的高度在5水平上有显著的差异。 表3-5 无重复双因素方差分析结果差异源ssdfmsff crit行520.172260.0848.01=5.14列53.532.14171.26=4.76误差32.565.42总计3335.67112. 可重复双因素方差分析 例 6 小表有3个不育系(a1、a2、a3)与4个

26、恢复系(b1、b2、b3、b4)杂交,配成12个f1,重复3次,记载各fl的产量(表3-6)。试作方差分析。应用 excel进行有重复双因素方差分析的操作步骤如下: 表3-6 个f1的产量表不育系 回复系b1b2b3b4a15.05.35.65.35.15.45.75.24.95.25.45.4a24.65.65.85.64.65.45.95.14.85.25.95.0a34.65.97.45.44.45.26.25.44.86.07.04.6(1)新建一excel工作表,分别单击 a1:el0单元格,输入表3-6中对应的数据; (2)单击“工具”菜单中的“数据分析”选项,单击其中的“方差分析

27、;可重复双因素方差分析”选项,单击“确定”按钮; (3)在出现的“方差分析;单因素方差分析”对话框中,在“输入区域”中输入“$a$1:$e $io”,在“每一样本行数”中输入“3”,在“a”中输入“005”,在“输出区域”中输入“$a$11”,单击“确定”按钮。方差分析的最终结果如表3-7所示。 表3-7 有重复双因素方差分析结果差异源ssdfmsff crit样0.6520.323.88=3.40列8.4732.8233.75=3.01交互2.7660.465.51=2.51误差32.5245.42总计13.8835由表3-7可知,不育系、恢复系及它们间的交互作用对fl的产量在5水平上均有显

28、著的差异。3.3 方差分析生物中的应用本文结合经常使用的饲养试验设计资料来说明利用excel进行饲养试验方差分析的具体用法 。3.3.1 单因素随机分组实例 1 .材料与结果 选用15头健康体重无显著差异的仔猪随机分为3组,用于研究3种饲养标准的饲养试验试验1组按饲养标准饲喂试验2组前期按比标准低 20饲喂后期按比标准低15饲喂,试验3组自由采食。经56d试验取得增重结果如表3-8 表3-8 仔猪56d增重结果 ( kg)组别 56d增重试验1组3934353536试验2组1820191920试验3组35294235262 .用excel进行方差分析 (1) 输入原始数据 进入 exce1单击

29、“文件”菜单再单击“新建”命令创建一个新工作簿。选定一个工作表,并命名为“单因素分析”。在 a1、b1、c1单元格中分别输入“试验1组”、“试验2组”和“试验3组”。在a2:a6单元格区域中分别输入试验1组增重数据。同理在 b2、b6、c2、c6单元格区域中分别输入试验2组、试验3组的增重数据 。 (2) 实现自动计算 得出方差分析结果单击“工具”菜单中的“数据分析”命令(如果“数据分析”命令没有出现在“工具”菜单上,请运行“安装”程序来加载“分析工具库”。安装完毕, 通过“工具”菜单中的“加载宏”命令,在“加载宏”问内计对话框中选择并启动它)。在“数据分析”对话框中,单击“单因素方差分析”按

30、“确定”。再在出现的“方差分析:单因素分析”对话框“输入区域”输入ai:c6。在“or(a)”框中输入需要用来计算f统计临界值的置信度 (005或 001),本例输入 001。在“输出选项”中 ,选定要计算结果的位置。本例在“输出区域”中选定为a8单元格。单击“确定”,就得到增重分析结果报告表(表3-9)。 表3-9 单因素方差分析结果(部分)差异源ssdfmsfp-valuef crit时间694.6 2345.8016.810.00036.93组内246.8 1220.57总计938.4 14(3)分析讨论 由表3-9知;f=1681fcrit=693。所以 pfcrit=6.99,所 以

31、 p0.01; fb=i260.01。这说明:不同饲料对仔猪增重效应有非常显著的差异,而窝组问的差异不显著。3.3.3 有重复双因素分析实例 1. 材料与结果 用能量分为高、低两个水平 (用 a1、a2表示),蛋白质也分为高、低两个水平(用 bl、b2表示 )的饲料,组成a1b1(高能量高蛋白质)、a1b2 (高能量低蛋白质)、a2b1 (低能量高蛋白质)、a2b2(低能量低蛋白质)4种日粮。随机抽取试验用仔猪28头,随机分置于4个试验组,分别饲喂上述4种日粮,每组7头,28头仔猪分别单圈喂饲。记录试验开始与结束时体重。试验结束时取得的仔猪增重数据列入表3-12。2. 用excel进行方差分析

32、(1) 输入原始数据 选定一个工作表,并命名为“可重复双因素”。在 a2、a9、bl、cl单元格中输入 a1、a2、bl、b2,在 b2:b8单元格区域中依次输入表 3-12中albl列增重数据。同理,在c2:c8、b9:b15、c9:cl5单元格区域中依次输入表 3-12中 a1:b2、a2、b1、a2:b2列增重数据。 表3-12仔猪增重数据日粮能量(a) 高 低日粮能量(b) 高 低 高 低日粮符号 a1b1 a1b2 a2b1 a2b2增重/kg34.527.520.228.235.133.524.811.933.831.620.623.440.334.722.320.942.540.11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论