数学建模方差分析_第1页
数学建模方差分析_第2页
数学建模方差分析_第3页
数学建模方差分析_第4页
数学建模方差分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模方差分析第一页,共四十四页,2022年,8月28日第七章方差分析一、什么是方差分析?常用语言:检验一个或多个因素对试验结果的影响是否显著。统计语言:检验多个方差相等的正态总体的均值是否相等。第二页,共四十四页,2022年,8月28日二、几个术语1、试验指标--衡量试验结果的量(定量、定性)(必须是数量)。2、因素--影响试验指标的条件,(不)可控记作A,B,C……3、水平--因素所处等级、状态,A的r个水平记作A1,A2,……,Ar

4、单(多)因素试验--考察一(多)个因素的试验。第三页,共四十四页,2022年,8月28日第一节单因素方差分析一、基本问题1、基本数据:A的r个水平(试验)A1A2……Ar1x11x21……xr12x12x22……xr2…………………x1t1x2t2……xrtr第四页,共四十四页,2022年,8月28日2、任务:检验因素A对试验结果影响是否显著?(A是否是重要因素?)第五页,共四十四页,2022年,8月28日二、基本原理1、数学模型(数据结构)(1)设且检验:说明:若要接受,表示r个水平下的平均数相同,即A对试验结果影响不显著;反之,影响显著。第六页,共四十四页,2022年,8月28日(2)记―称为的效应,则欲检验:若接受,说明A对试验结果影响不显著。第七页,共四十四页,2022年,8月28日

2、基本思想(1)、条件误差:因条件不同引起的误差;随机误差:相同条件下引起的误差。(2)、基本思想:a、把条件误差与试验误差分开;b、在某种意义下加以比较,若条件误差明显大于随机误差,则有理由认为A影响显著。第八页,共四十四页,2022年,8月28日3、偏差平方和分解总样本均值:总样本容量:各总体的样本均值:第九页,共四十四页,2022年,8月28日总偏差平方和:第十页,共四十四页,2022年,8月28日其中表示由A所引起的各组数据之间的偏差平方和(反映条件误差?),称为组间平方和;表示由随机因素引起的各组数据内部的偏差平方和(反映随机误差?),称为组内平方和。4、构造检验统计量由柯赫伦分解定理知,在假设成立的情况下,。其中称为A的均方,称为随机均方。第十一页,共四十四页,2022年,8月28日5、具体判断利用公式(7.1.6)计算出F的值,记为F值,并根据F分布计算出相应的显著性概率若Sig.小于给定的显著水平,则拒绝原假设,即认为因素A对试验指标有显著影响;否则认为无显著影响。通常当时,称为有非常显著影响,记为;当时,称为有显著影响,记为。第十二页,共四十四页,2022年,8月28日三、基本计算1.建立数据文件a、定义试验指标变量x和因素变量kind;b、输入数据;c、保存数据文件。2.选择统计方法按Analyze→Comparemeans→One-WayANOV顺序选择菜单或菜单项。3.结果说明解释输出结果的统计意义。第十三页,共四十四页,2022年,8月28日对六种不同的农药在相同的条件下分别进行杀虫试验,试验结果如表7.1.1所示。

农药试验号A1A2A3A4A5A61879056559275285886248997238087958149491问杀虫率是否因农药的不同而有显著性的差异(显著水平)?第十四页,共四十四页,2022年,8月28日单因素方差分析要注意的两点:1、模型的条件(1)、服从正态分布;(2)、r个总体方差相等?(要求验证)2、多重比较若,则拒绝,意味着上式中至少有一个不等号,到底哪些不等?(要比较)第十五页,共四十四页,2022年,8月28日练习:1、将5种不同品种的种子,分别种在土质、气候条件基本相同的8块面积相等的小区域上,得到的收获量如下表。水平试验号A1A2A3A4A51767662656727867706871365706968724726473716957167716174672836969797837273657687973696984第十六页,共四十四页,2022年,8月28日现欲检验种子品种(因素A)对收获量(试验指标)的影响是否显著。2、四支温度计和被用来测定氢化奎宁的熔点,得如下结果:温度计T1T2T3T4观测值174.0173.0171.5173.5173.0172.0171.0171.0173.5173.0173.0试检验在测量氢化奎宁熔点时,这四支温度计之间有无显著性差异。第十七页,共四十四页,2022年,8月28日第二节两因素方差分析一、基本问题

A因素水平r个:;

B因素水平s个:。

A、B的每种搭配下进行试验t次,得到下表的试验数据:第十八页,共四十四页,2022年,8月28日第十九页,共四十四页,2022年,8月28日所谓两因素方差分析就是考察:1、因素A对试验指标的影响是否显著?2、因素B对试验指标的影响是否显著?3、交互作用A×B对试验指标的影响是否显著?注:若要考察A×B、每种搭配下试验次数。第二十页,共四十四页,2022年,8月28日什么是交互作用?例子:一种水稻品种种在四块面积与地力等条件相同的小区域上,各小区的施肥情况及产量如下表:区号一二三四施肥氮肥5斤磷肥5斤氮肥5斤+磷肥5斤产量(斤)608070110一般地,在两个因素的试验中,有时除了每个因素独立地起作用外,还可以联合起来起作用,这种作用,叫做这两个因素的交互作用。第二十一页,共四十四页,2022年,8月28日二、基本原理1、模型:来自总体的样本,记总体平均数水平下的平均数水平下的平均数第二十二页,共四十四页,2022年,8月28日--水平的效应--水平的效应--的交互效应第二十三页,共四十四页,2022年,8月28日则双因素方差分析模型为:其中,相互独立且满足第二十四页,共四十四页,2022年,8月28日要检验的统计假设为:若拒绝,则认为因素A的不同水平对试验结果有显著影响;若拒绝,则认为因素B的不同水平对试验结果有显著影响;若拒绝,则认为因素A与B不同水平搭配的交互效应对试验结果有显著影响;若三者均不拒绝,则认为因素A与B的不同水平搭配对试验结果无显著影响。第二十五页,共四十四页,2022年,8月28日2、偏差平方和分解总样本平均数:水平下样本平均数:水平下样本平均数:搭配下样本平均数:第二十六页,共四十四页,2022年,8月28日总偏差平方和:第二十七页,共四十四页,2022年,8月28日

其中,是因素A的离差平方和;是因素B的离差平方和;是误差平方和。是交互作用的离差平方和。上式说明,总离差平方和可以分解成由随机因素引起的误差平方和;由因素A各水平的效应引起的离差平方和;由因素B各水平的效应引起的离差平方和以及A与B的交互效应引起的离差平方和四部分。第二十八页,共四十四页,2022年,8月28日3、构造检验统计量对检验:对检验:对检验:由柯赫伦分解定理知,在假设成立的情况下,第二十九页,共四十四页,2022年,8月28日4、具体判断利用的公式计算出的具体数值,记为,并根据的分布计算出显著性概率。若Sig.<给定显著水平,则认为因素A对试验指标有显著性影响;否则无显著性影响。(2)利用的公式计算出的具体数值,记为,并根据的分布计算出显著性概率。第三十页,共四十四页,2022年,8月28日若Sig.<给定显著水平,则认为因素B对试验指标有显著性影响;否则无显著性影响。(3)利用的公式计算出的具体数值,记为,并根据的分布计算出显著性概率。若Sig.<给定显著水平,则认为交互作用对试验指标有显著性影响;否则无显著性影响。第三十一页,共四十四页,2022年,8月28日三、基本计算1.建立数据文件a、定义试验指标变量x和两个因素变量a,b;b、输入数据;c、保存数据文件。2.选择统计方法按Analyze→GeneralLinearModel→Univariate顺序选择菜单或菜单项。3.结果说明解释输出结果的统计意义。第三十二页,共四十四页,2022年,8月28日在某化工厂产品的生产过程中,对三种浓度,四种温度的每一种搭配重复试验二次,测得产量如下表7.2.2(单位:千克)。

温度B浓度AB1B2B3B4A121,2322,2325,2327,25A2

23,2526,2428,2726,24A3

26,2329,2724,2524,23试检验不同的浓度,不同的温度以及它们之间的交互作用对产量有无显著性的差异(显著水平)?第三十三页,共四十四页,2022年,8月28日练习:1、设四名工人分别操作机床甲、乙、丙各一天,生产同样产品,其日产量统计如下表(单位:件):

工人机床张某李某王某赵某甲53475745乙56506352丙45475442问工人的不同和机床的不同在日产量上有无显著性差异?(假定四名工人对这三台机床的熟悉情况是一样的。)第三十四页,共四十四页,2022年,8月28日2、将一块耕地等分为24个小区,今有3个不同的小麦品种(A1,A2,A3)和2中不同的肥料(B1,B2)。现将各小麦品种与各种肥料进行搭配,对每种搭配都在4个小区上试验,测得每个小区产量(千克)如下:ABA1A2A3B19109812119813141512B291012111213111222162018试分析品种、肥料以及它们的交互作用对产量有无显著性的影响。第三十五页,共四十四页,2022年,8月28日第三节多因素方差分析一、多因素试验的设计问题1、必要性有r个因素,每个因素有s个水平,所有搭配方式有:次(很大)。要做那么多的试验显然是不可能的,即使是因素及水平较少,全面试验也不一定是必要的,对试验费高或带有破坏性的试验更是如此。第三十六页,共四十四页,2022年,8月28日2、考虑:能否在所有的搭配的试验中,选出有代表性的部分试验,通过这一部分试验分析所关心问题(影响是否显著)。3、解决此问题就涉及到试验设计。4、试验设计的主要内容是讨论如何合理地安排试验以及试验后如何对数据进行统计分析。5、试验设计的种类:正交设计、区组设计、回归设计等。第三十七页,共四十四页,2022年,8月28日二、正交设计1、正交试验设计:用“正交表”来安排试验和分析试验结果的一种数理统计方法。2、正交表(1)、定义:具有以下两个性质的表都称为正交表:a、每一列中不同的数字出现的次数相等。b、任意两列中,将同一行的两个数字看成有序数对,每种数对出现的次数相等。一般记为:,其中L:正交表符号,n:试验次数,a:因素水平数,b:正交表的列数(因素个数)。第三十八页,共四十四页,2022年,8月28日例子:试验号列号1234111112122231333421235223162312731328321393321第三十九页,共四十四页,2022年,8月28日特点:a、将正交表中的任意两行交换或任意两列交换,它仍然是正交表。b、将某一列中的数字号码相互对换,它仍然是正交表。3、正交表的使用步骤:a、找出“合适”的正交表。第四十页,共四十四页,2022年,8月28日“合适”指:(1)正交表水平数必须和因素水平表中水平数一致。(2)正交表列数不少于因素的个数(所考虑的一个交互作用作为一个因素)。说明:若要进行(方差)分析时,一般要求正交表列数必须大于因素的个数,以便使正交表留出空列;此空列是(方差)分析中的试验指标以及误差平方和所在列。b、表头设计--因素放在表的哪一列。(1)若不考虑交互作用,可以任意放。第四十一页,共四十四页,2022年,8月28日(2)若考虑交互作用,先安排有交互作用的主因素的所在列,再由交互作用表决定交互作用所在列没有交互作用的主因素的安排,以尽量避免主因素与交互作用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论