版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析解决的主要问题是什么?单因素方差分析与双因素方差分析原理的相同点与不同点?正交实验设计的基本原理是什么?方差分析解决的主要问题是什么?
[例题]某公司计划引进一条生产线.为了选择一条质量优良的生产线以减少日后的维修问题,他们对6种型号的生产线作了初步调查,每种型号调查4条,结果列于表8-1。这些结果表示每个型号的生产线上个月维修的小时数。试问由此结果能否判定由于生产线型号不同而造成它们在维修时间方面有显著差异?4.1方差分析的基本概念和原理 4.1方差分析的基本概念和原理表4-1对6种型号生产线维修时数的调查结果序号型号1234A型9.58.811.47.8B型4.37.83.26.5C型6.58.38.68.2D型6.17.34.24.1E型10.04.85.49.6F型9.38.77.210.14.1方差分析的基本概念和原理序号1234A型9.58.811.47.8B型4.
研究的指标:维修时间记作Y, 控制因素是生产线的型号,分为6个水平即A,B,C,D,E,F,每个水平对应一个总体Yi(i=1,2,…,6)。
4.1方差分析的基本概念和原理 研究的指标:维修时间记作Y,4.1方差分析的基本概念和
现在的试验就是进行调查,每种型号调查4台,相当于每个总体中抽取一个容量为4的样本,得到的数据记作yij(i=1,2,…,6;j=1,2,3,4),即为下表数据。 计算各样本平均数如下:型号ABCDEF9.45.57.95.47.58.8表8-24.1方差分析的基本概念和原理 型号ABCDEF9.45.57.95.47.58.8表
两个总体平均值比较的检验法 把样本平均数两两组成对: 与,与,…与,与,…,与,共有(15)对。4.1方差分析的基本概念和原理 4.1方差分析的基本概念和原理即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等。这一结论的置信度仅是上述方法存在的问题工作量大置信度低将这15对平均数一一进行比较检验
4.1方差分析的基本概念和原理即使每对都进行了比较,并且都以0.95的置信度得出每对均值都方差分析的基本原理:(1)将数据总的偏差平方和按照产生的原因分解成: (总的偏差平方和)= (由因素水平引起的偏差平方和)+(试验误差平方和)(2)上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验.4.1方差分析的基本概念和原理方差分析的基本原理:4.1方差分析的基本概念和原理数学模型和数据结构参数点估计分解定理自由度显著性检验多重分布与区间估计4.2单因素试验的方差分析数学模型和数据结构4.2单因素试验的方差分析 在单因素试验中,为了考察因素A的k个水平A1, A2,…,Ak对Y的影响(如k种型号对维修时间的影响),设想在固定的条件Ai下作试验.所有可能的试验结果组成一个总体Yi,它是一个随机变量.可以把它分解为两部分 (4-1)4.2.1数学模型和数据结构4.2.1数学模型和数据结构其中: 纯属Ai作用的结果,称为在Ai条件下Yi的真值(也称为在Ai条件下Yi的理论平均).是实验误差(也称为随机误差)。 (4-2) 其中,和都是未知参数(i=1,2,…,k).4.2.1数学模型和数据结构4.2.1数学模型和数据结构 假定在水平Ai下重复做m次试验,得到观测值
12…j…M合计平均A1Y11Y12…Y1j…Y1mT1A2Y21Y22…Y2j…Y2mT2………………………AiYi1Yi2…Yij…YimTi………………………AkYk1Yk2…Ykj…YkmTk表4-34.2.1数学模型和数据结构12…j…M合计平均A1Y11Y12…Y1j…Y1mT1A2
表中:(i=1,2,…,k)(4-3)Yij表示在Ai条件下第j次试验的结果,用式子表示就是
(i=1,2,…,kj=1,2,…,m)(4-4)注意: 每次试验结果只能得到Yij,而(4-4)式中的和都不能直接观测到。4.2.1数学模型和数据结构表中:4.2.1数学模型和数据结构
为了便于比较和分析因素A的水平Ai对指标影响的大小,通常把再分解为
(i=1,2,…,k)(4-5)
其中, 称为一般平均(GrandMean),它是比 较作用大小的一个基点;8.2.1数学模型和数据结构 8.2.1数学模型和数据结构
并且称
为第i个水平Ai的效应.它表示水平的真值比一般水平差多少。满足约束条件(4-6)
可得
i=1,2,…,k;j=1,2,…,m4.2.1数学模型和数据结构 i=1,2,…,k;j=1,2,…,m4.2.1数学模要解决的问题找出参数和的估计量分析观测值的偏差检验各水平效应有无显著差异4.2.1数学模型和数据结构要解决的问题找出参数分析观测值的偏差检验各水平效应4.2.
用最小二乘法求参数的估计量,然后寻求的无偏估计量. 须使参数的估计值能使在水平Ai下求得的观测值Yij与真值之间的偏差尽可能小。 为满足此要求,一般考虑用最小偏差平方和原则,也就是使观测值与真值的偏差平方和达到最小.4.2.2参数点估计 4.2.2参数点估计 由(4-4)可知,上述偏差平方和
令下列各偏导数为零(i=1,2,…,k)4.2.2参数点估计 由(4-4)可知,上述偏差平方和(i=1,2,…,k)4.由 解得(4-7)由解得(4-8)4.2.2参数点估计4.2.2参数点估计 并由此得的估计量
至此,求得参数的估计量
(4-9)4.2.2参数点估计4.2.2参数点估计 按照上述原则求参数估计量的方法称为最小二乘法,称为最小二乘估计量. 我们还可以证明分别是参数的无偏估计量。 将和分别用它们的估计量代替,可以得到试验误差的估计量,
(4-10)4.2.2参数点估计4.2.2参数点估计
为了由观测值的偏差中分析出各水平的效应,我们研究三种偏差:,和. 根据前面参数估计的讨论,它们分别表示
,
定理
(4-11)的估计.和4.2.3分解定理自由度的估计.和4.2.3分解定理自由度证明:4.2.3分解定理自由度证明:4.2.3分解定理自由度 令则分解定理(8-11)可写成
(4-12)
4.2.3分解定理自由度 令4.2.3分解定理自由度上式中,
称为总偏差平方和.称为误差平方和(或组内平方和);称为因素A的效应平方和(或组间平方和),
ST的自由度fT=km-1
SA的自由度fA=k-1
SE的自由度fE=k(m-1) 容易看出,自由度之间也有类似于分解定理的关系
(4-13)4.2.3分解定理自由度上式中,4.2.3分解定理自由度参数假设检验的假设条件
观测值(i=1,2,…,k;j=1,2,…,m)相互独立在水平Ai条件下,Yij(j=1,2,…m)服从正态分布N4.2.4显著性检验参数假设检验的假设条件观测值(i=1,2,…,k;j=1, 要判断在因素A的k个水平条件下真值之间是否有显著性差异, 即检验假设
H0:,H1:不全相等
相当于检验假设
H0:(i=1,2,…,k),H1:αi不全为零
4.2.4显著性检验4.2.4显著性检验 可以证明当H0为真时, ,,(4-16)
并且与相互独立.
得
(4-17)
其中和称为均方(MeanSquare).4.2.4显著性检验4.2.4显著性检验 利用(8-17)式来检验原假设H0是否成立.对于给定的显著水平,可以从F分布表查出临界值再根据样本观测值算出FA的值. 当时,拒绝H0,
当时,接受H0。4.2.4显著性检验4.2.4显著性检验方差来源平方和自由度均方F比组间(因素A)SAK-1SA/(k-1)组内(实验误差)SEK(m-1)SE/k(m-1)总和ST=SA+SEKm-1---表4-4方差分析表4.2.4显著性检验方差来源平方和自由度均方F比组间(因素A)SAK-1SA/( 下面继续讨论前面6种型号的生产线的例子。根据调查结果,在=0.05的显著水平时,检验这6种型号的生产线在平均维修时间方面有无显著差异? 根据实践经验,认为各种型号生产线的维修时间是近似服从正态分布的。 作统计假设:6种型号的生产线平均维修时数无显著差异,即
H0:αi=0(i=1,2,…,6),H1:αi不全为零4.2.4显著性检验4.2.4显著性检验计算SA及SE
4.2.4显著性检验计算SA及SE4.2.4显著性检验表4-5计算列表台号型号1234TiTi2A型9.58.811.47.837.51406.25358.49B型4.37.83.26.521.8475.24131.82C型6.58.38.68.231.6998.56252.34D型6.17.34.24.121.7470.89124.95E型10.04.85.49.629.8888.04244.36F型9.38.77.210.135.31246.09316.034.2.4显著性检验表4-5计算列表台号1234TiTi2A型9.58 再将计算结果分别代入SA与SE两式中,得到
第一自由度 第二自由度4.2.4显著性检验4.2.4显著性检验
查F分布表得 由于,故拒绝H0。 该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显著差异的。方差来源平方和
自由度均方F比组间SA55.55511.11组内SE56.72183.15总和ST112.2723---表4-6方差分析表4.2.4显著性检验方差来源平方和自由度均方F比组间SA55.55511.11q检验法:计算任意两水平的差值,当时,判断与差异显著;当时,判断与差异显著。查多重比较的q表得
(8-18)
4.2.5多重分布与区间估计q检验法:计算任意两水平的差值,当区间估计在置信度为的情况下,的置信区间为(8-19)
4.2.5多重分布与区间估计4.2.5多重分布与区间估计双因素方差分析的类型数据结构离差平方和的分解应用实例4.3双因素方差分析双因素方差分析的类型4.3双因素方差分析 在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。 例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因。采用不同的销售策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该生产线。4.3.1双因素方差分析的类型 在实际问题的研究中,有时需要考虑两个因素对实验结果的影响
若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析。 双因素方差分析的内容,是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。4.3.1双因素方差分析的类型4.3.1双因素方差分析的类型双因素方差分析的类型无交互作用的双因素方差分析有交互作用的双因素方差分析假定因素A和因素B的效应之间是相互独立的,不存在相互关系假定因素A和因素B的结合会产生出一种新的效应4.3.1双因素方差分析的类型双因素方差分析的类型无交互作用的有交互作用的假定因素A和因
例如, 若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景; 否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。4.3.1双因素方差分析的类型 4.3.1双因素方差分析的类型双因素方差分析的数据结构如表所示:
双因素方差分析数据结构因素AA1A2…Ar因素BB1X11X12…X1rB2X21X22…X2r………………BkXk1Xk2…Xkr…表8-74.3.2数据结构双因素方差分析的数据结构如表所示:因素AA1A2…ArB1X
表中,因素A位于列的位置,共有r个水平,代表第j种水平的样本平均数;因素B位于行的位置,共有k个水平,代表第i种水平的样本平均数。为样本总平均数,样本容量n=r×k。
每一个观察值Xij看作由A因素的r个水平和B因素的k个水平所组合成的r×k个总体中抽取样本容量为1的独立随机样本。这r×k个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假定条件。4.3.2数据结构 表中,因素A位于列的位置,共有r个水平,代表第j种水平
4.3.3离差平方和的分解 4.3.3离差平方和的分解各离差平方和对应的自由度: 总离差平方和SST的自由度为r×k-1=n-1;
因素A的离差平方和SSA的自由度为r-1; 因素B的离差平方和的自由度为k-1; 随机误差SSE的自由度为(r-1)×(k-1)4.3.3离差平方和的分解4.3.3离差平方和的分解由离差平方和与自由度可以计算均方差:
对因素A而言:
对因素B而言:
对随机变量而言:4.3.3离差平方和的分解4.3.3离差平方和的分解表4-8双因素方差分析表误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=SSA/(r-1)FA=MSA/MSEB因素SSBk-1MSB=SSB/(k-1)FB=MSB/MSE误差SSE(r-1)(k-1)MSE=SSE/(r-1)(k-1)---合计SSTn-1------4.3.3离差平方和的分解误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=
某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.表4-9
现欲检验包装方式和销售地区对该商品销售是否有显著性影响。(ɑ=0.05)包装方式(A)A1A2A3A4A5销售地区(B)B12012201014B2221020126B32414181810B41648618B526221620104.3.4应用实例 某商品有五种不同的包装方式(因素A),在五个不同地区销售
解:
若五种包装方式的销售的均值相等,则表明不同的包装方式在销售上没有差别。建立假设 对因素A: H0:,包装方式之间无差别 H1:不全相等,包装方式之间有差别 对因素B: H0:地区之间无差别 H1:不全相等地区之间有差别4.3.4应用实例解:4.3.4应用实例计算F值
因素A的列均值分别为:因素B的行均值分别为:总均值=15.04故:SST=(20-15.04)2+…+(10-15.04)2=880.96SSA=5(21.6-15.04)2+…+5(11.6-15.04)2=335.36SSB=5(15.2-15.04)2+…+5(18.8-15.04)2=199.36SSE=880.96-335.36-199.36=346.24
4.3.4应用实例计算F值4.3.4应用实例接下来:因此4.3.4应用实例接下来:4.3.4应用实例统计决策对于因素A,因为
FA=3.87>Fcrit=3.01故拒绝H0,接受H1,说明不同的包装方式对该商品的销售产生影响。对于因素B,因为
FB=2.30<Fcrit=3.01故接受H0,说明不同地区该商品的销售没有显著差异。4.3.4应用实例统计决策4.3.4应用实例
在工农业生产和科学研究中,经常会遇到多因素试验问题,在实际中不需要进行各种水平组合的全面试验,只需从各种不同搭配情况中,选取一小部分来进行就可以了。那么,怎样选取以及如何分析试验结果,才能科学的回答如下问题:各因素对指标的影响,哪个因素重要?哪个因素次之?每个因素中,哪个水平为好?各个因素和水平依哪种情况搭配可使试验结果最佳?
解决这些问题正是正交试验设计的主要内容。4.4正交试验设计 在工农业生产和科学研究中,经常会遇到多因素试验问题,在实正交试验统计的基本思想正交表与直观分析法方差分析法4.4正交试验设计正交试验统计的基本思想4.4正交试验设计 考虑进行一个三因素、每个因素有三个水平的试验。如果作全面试验,需作=27次。图8-14.4.1正交试验统计的基本思想 考虑进行一个三因素、每个因素有三个水平的试验。如果作全面 如果进行正交试验设计,利用正交表安排试验,对于三因素三水平的试验来说,需要作9次试验,用“Δ”表示,标在图中。 如果每个平面都表示一个水平,共有九个平面,可以看到每个平面上都有三个“Δ”点,立方体的每条直线上都有一个“Δ”点,并且这些“Δ”点是均衡地分布着。4.4.1正交试验统计的基本思想4.4.1正交试验统计的基本思想 正交表是正交试验设计的工具。 最简单的正交表是L4(23),此外还有L8(27),L9(34),L16(45)等等。 L表示一张表,它的数字,有三层不同的含义,以L4(23)为例加以说明。4.4.2正交表与直观分析法4.4.2正交表与直观分析法L4(23)表的结构: 包括4行,3列,表中只出现1、2两个反映水平的数字。行数水平数列数L4(23)4.4.2正交表与直观分析法Ln(rm)L4(23)表的结构:行数水平数列数L4(23)4.4.2L4(23)表的用法
作4次试验,可以最多安排3个二水平的因素(因子)
试验数水平数因子数L4(23)4.4.2正交表与直观分析法L4(23)表的用法试验数水平数因子数L4(23)4.4.2L4(23)表的效率
全因素全水平的实验做8次,正交实验做4次.理论上全部试验的次数实际试验次数L4(23)4.4.2正交表与直观分析法L4(23)表的效率理论上全部试验的次数实际试验次数L4(2
表4-10L4(23)列号试验号12311112122321242214.4.2正交表与直观分析法列号12311112122321242214.4正交表的特点每一列中,不同的数字出现的次数相等,如L4(23)表中的数1和2,它们各出现了两次任意两列中,将同一横行的两个数字看成有序数对时,每种数对出现的次数相等。如L4(23)表中共有的四种有序数对(1,1),(1,2),(2,1),(2,2),它们各出现一次。由此保证了用正交表安排的试验计划是均衡搭配的。4.4.2正交表与直观分析法正交表的特点每一列中,不同的数字出现的次数相等,任意两列中,
[例]某化工厂生产一种试剂,产率较低,希望通过试验探索好的生产工艺以提高产率。考察的因子与水平如下表:表4-11因子水平A反应温度(摄氏度)B反应时间(小时)C搅拌速度一水平301快二水平401.5中三水平502慢4.4.2正交表与直观分析法 因子ABC一水平301快二水平401.5中表4-12试验计划表
列号试验号1反应温度(摄氏度)A2反应时间(小时)B3搅拌速度C1130111快213021.52中3130323慢4240112中524021.53慢6240321快7350113慢835021.51快9350322中4.4.2正交表与直观分析法列号12311301表8-13计算表4.4.2正交表与直观分析法表8-13计算表4.4.2正交表与直观分析法
在A因子水平相同的三组试验中,极差它表示反应温度40摄氏度与50摄氏度相比,试剂的产率平均提高15.6%. 用同样的方法可以比较B因子和C因子各水平的好与差.4.4.2正交表与直观分析法 4.4.2正交表与直观分析法结论反应温度对产率影响最大,其次是反应时间,再其次是搅拌速度.反应温度是40度好,反应时间是1.5小时好,搅拌速度是快速好.最好的生产工艺是A2B2C1:即 反应温度40摄氏度; 反应时间1.5小时; 搅拌速度快速.4.4.2正交表与直观分析法结反应温度对产率影响最大,其次反应温度是40度好,反应时间是 利用方差分析法来分析试验结果时,由于要考虑随机因素对指标的影响,因此在选取正交表安排试验时,要使表中的因子数大于实际的因子数。 例如,试剂产率的试验是三因子三水平,我们仍然可以选用L9(34)表安排试验,将三因素依次放在表的第1、2、3列后,还空出一列无因素可安排,这一列可视为随机试验误差。 把试验结果的所有数据都减去同一常数,不会影响结论,故常用此法简化数据。4.4.3方差分析法 利用方差分析法来分析试验结果时,由于要考虑随机因素对指试验计划表和计算表表8-144.4.3方差分析法试表8-144.4.3方差分析法 按本章前面介绍的方差分析方法,将试验结果产率y的变动(或波动、差异)用总偏差平方和ST来表示,则 其中,
,
T=∑yi4.4.3方差分析法 按本章前面介绍的方差分析方法,将试验结果产率y的变动(或 总偏差平方和可以分解为各因子的偏差平方和与试验误差的偏差平方和,即
ST=SA+SB+SC+SE 其中 可化简为
将具体数值代入得SA=421.64.4.3方差分析法 总偏差平方和可以分解为各因子的偏差平方和与试验误差的偏差 类似地,可求出因子B、C和试验误差E的偏差平方和SB,SC和SE的值:
各因子与试验误差的自由度为4.4.3方差分析法 类似地,可求出因子B、C和试验误差E的偏差平方和SB,S
表8-15方差分析方差来源平方和自由度均方F比因子ASA=421.62210.8FA=143.4因子BSB=46.26223.13FB=15.7因子CSC=26.93213.47FC=9.2试验误差ESE=2.9321.47总和ST=497.728------4.4.3方差分析法 方差来源平方和自由度均方F比因子ASA=421.62210正交检验的极差分析和方差分析课件 由F分布表查得F0.10(2,2)=9,F0.05(2,2)=19,F0.01(2,2)=99,比较F值与F0.10、F0.05、F0.01的大小得出: FA>F0.05,FA>F0.01,故A因子非常显著; F0.10<FB<F0.05,故B因子比较显著; F0.10<FC<F0.05,故C因子也比较显著,但比A、B 二因子的影响作用差。
4.4.3方差分析法 由F分布表查得F0.10(2,2)=9,F0.05(2,
本例方差分析的结论与直观分析法的结论是一致的 即: 反应温度对产率影响最大,搅拌速度影响最小;好的生产工艺条件仍然是A2B2C1。4.4.3方差分析法4.4.3方差分析法方差分析解决的主要问题是什么?单因素方差分析与双因素方差分析原理的相同点与不同点?正交实验设计的基本原理是什么?方差分析解决的主要问题是什么?
[例题]某公司计划引进一条生产线.为了选择一条质量优良的生产线以减少日后的维修问题,他们对6种型号的生产线作了初步调查,每种型号调查4条,结果列于表8-1。这些结果表示每个型号的生产线上个月维修的小时数。试问由此结果能否判定由于生产线型号不同而造成它们在维修时间方面有显著差异?4.1方差分析的基本概念和原理 4.1方差分析的基本概念和原理表4-1对6种型号生产线维修时数的调查结果序号型号1234A型9.58.811.47.8B型4.37.83.26.5C型6.58.38.68.2D型6.17.34.24.1E型10.04.85.49.6F型9.38.77.210.14.1方差分析的基本概念和原理序号1234A型9.58.811.47.8B型4.
研究的指标:维修时间记作Y, 控制因素是生产线的型号,分为6个水平即A,B,C,D,E,F,每个水平对应一个总体Yi(i=1,2,…,6)。
4.1方差分析的基本概念和原理 研究的指标:维修时间记作Y,4.1方差分析的基本概念和
现在的试验就是进行调查,每种型号调查4台,相当于每个总体中抽取一个容量为4的样本,得到的数据记作yij(i=1,2,…,6;j=1,2,3,4),即为下表数据。 计算各样本平均数如下:型号ABCDEF9.45.57.95.47.58.8表8-24.1方差分析的基本概念和原理 型号ABCDEF9.45.57.95.47.58.8表
两个总体平均值比较的检验法 把样本平均数两两组成对: 与,与,…与,与,…,与,共有(15)对。4.1方差分析的基本概念和原理 4.1方差分析的基本概念和原理即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等。这一结论的置信度仅是上述方法存在的问题工作量大置信度低将这15对平均数一一进行比较检验
4.1方差分析的基本概念和原理即使每对都进行了比较,并且都以0.95的置信度得出每对均值都方差分析的基本原理:(1)将数据总的偏差平方和按照产生的原因分解成: (总的偏差平方和)= (由因素水平引起的偏差平方和)+(试验误差平方和)(2)上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验.4.1方差分析的基本概念和原理方差分析的基本原理:4.1方差分析的基本概念和原理数学模型和数据结构参数点估计分解定理自由度显著性检验多重分布与区间估计4.2单因素试验的方差分析数学模型和数据结构4.2单因素试验的方差分析 在单因素试验中,为了考察因素A的k个水平A1, A2,…,Ak对Y的影响(如k种型号对维修时间的影响),设想在固定的条件Ai下作试验.所有可能的试验结果组成一个总体Yi,它是一个随机变量.可以把它分解为两部分 (4-1)4.2.1数学模型和数据结构4.2.1数学模型和数据结构其中: 纯属Ai作用的结果,称为在Ai条件下Yi的真值(也称为在Ai条件下Yi的理论平均).是实验误差(也称为随机误差)。 (4-2) 其中,和都是未知参数(i=1,2,…,k).4.2.1数学模型和数据结构4.2.1数学模型和数据结构 假定在水平Ai下重复做m次试验,得到观测值
12…j…M合计平均A1Y11Y12…Y1j…Y1mT1A2Y21Y22…Y2j…Y2mT2………………………AiYi1Yi2…Yij…YimTi………………………AkYk1Yk2…Ykj…YkmTk表4-34.2.1数学模型和数据结构12…j…M合计平均A1Y11Y12…Y1j…Y1mT1A2
表中:(i=1,2,…,k)(4-3)Yij表示在Ai条件下第j次试验的结果,用式子表示就是
(i=1,2,…,kj=1,2,…,m)(4-4)注意: 每次试验结果只能得到Yij,而(4-4)式中的和都不能直接观测到。4.2.1数学模型和数据结构表中:4.2.1数学模型和数据结构
为了便于比较和分析因素A的水平Ai对指标影响的大小,通常把再分解为
(i=1,2,…,k)(4-5)
其中, 称为一般平均(GrandMean),它是比 较作用大小的一个基点;8.2.1数学模型和数据结构 8.2.1数学模型和数据结构
并且称
为第i个水平Ai的效应.它表示水平的真值比一般水平差多少。满足约束条件(4-6)
可得
i=1,2,…,k;j=1,2,…,m4.2.1数学模型和数据结构 i=1,2,…,k;j=1,2,…,m4.2.1数学模要解决的问题找出参数和的估计量分析观测值的偏差检验各水平效应有无显著差异4.2.1数学模型和数据结构要解决的问题找出参数分析观测值的偏差检验各水平效应4.2.
用最小二乘法求参数的估计量,然后寻求的无偏估计量. 须使参数的估计值能使在水平Ai下求得的观测值Yij与真值之间的偏差尽可能小。 为满足此要求,一般考虑用最小偏差平方和原则,也就是使观测值与真值的偏差平方和达到最小.4.2.2参数点估计 4.2.2参数点估计 由(4-4)可知,上述偏差平方和
令下列各偏导数为零(i=1,2,…,k)4.2.2参数点估计 由(4-4)可知,上述偏差平方和(i=1,2,…,k)4.由 解得(4-7)由解得(4-8)4.2.2参数点估计4.2.2参数点估计 并由此得的估计量
至此,求得参数的估计量
(4-9)4.2.2参数点估计4.2.2参数点估计 按照上述原则求参数估计量的方法称为最小二乘法,称为最小二乘估计量. 我们还可以证明分别是参数的无偏估计量。 将和分别用它们的估计量代替,可以得到试验误差的估计量,
(4-10)4.2.2参数点估计4.2.2参数点估计
为了由观测值的偏差中分析出各水平的效应,我们研究三种偏差:,和. 根据前面参数估计的讨论,它们分别表示
,
定理
(4-11)的估计.和4.2.3分解定理自由度的估计.和4.2.3分解定理自由度证明:4.2.3分解定理自由度证明:4.2.3分解定理自由度 令则分解定理(8-11)可写成
(4-12)
4.2.3分解定理自由度 令4.2.3分解定理自由度上式中,
称为总偏差平方和.称为误差平方和(或组内平方和);称为因素A的效应平方和(或组间平方和),
ST的自由度fT=km-1
SA的自由度fA=k-1
SE的自由度fE=k(m-1) 容易看出,自由度之间也有类似于分解定理的关系
(4-13)4.2.3分解定理自由度上式中,4.2.3分解定理自由度参数假设检验的假设条件
观测值(i=1,2,…,k;j=1,2,…,m)相互独立在水平Ai条件下,Yij(j=1,2,…m)服从正态分布N4.2.4显著性检验参数假设检验的假设条件观测值(i=1,2,…,k;j=1, 要判断在因素A的k个水平条件下真值之间是否有显著性差异, 即检验假设
H0:,H1:不全相等
相当于检验假设
H0:(i=1,2,…,k),H1:αi不全为零
4.2.4显著性检验4.2.4显著性检验 可以证明当H0为真时, ,,(4-16)
并且与相互独立.
得
(4-17)
其中和称为均方(MeanSquare).4.2.4显著性检验4.2.4显著性检验 利用(8-17)式来检验原假设H0是否成立.对于给定的显著水平,可以从F分布表查出临界值再根据样本观测值算出FA的值. 当时,拒绝H0,
当时,接受H0。4.2.4显著性检验4.2.4显著性检验方差来源平方和自由度均方F比组间(因素A)SAK-1SA/(k-1)组内(实验误差)SEK(m-1)SE/k(m-1)总和ST=SA+SEKm-1---表4-4方差分析表4.2.4显著性检验方差来源平方和自由度均方F比组间(因素A)SAK-1SA/( 下面继续讨论前面6种型号的生产线的例子。根据调查结果,在=0.05的显著水平时,检验这6种型号的生产线在平均维修时间方面有无显著差异? 根据实践经验,认为各种型号生产线的维修时间是近似服从正态分布的。 作统计假设:6种型号的生产线平均维修时数无显著差异,即
H0:αi=0(i=1,2,…,6),H1:αi不全为零4.2.4显著性检验4.2.4显著性检验计算SA及SE
4.2.4显著性检验计算SA及SE4.2.4显著性检验表4-5计算列表台号型号1234TiTi2A型9.58.811.47.837.51406.25358.49B型4.37.83.26.521.8475.24131.82C型6.58.38.68.231.6998.56252.34D型6.17.34.24.121.7470.89124.95E型10.04.85.49.629.8888.04244.36F型9.38.77.210.135.31246.09316.034.2.4显著性检验表4-5计算列表台号1234TiTi2A型9.58 再将计算结果分别代入SA与SE两式中,得到
第一自由度 第二自由度4.2.4显著性检验4.2.4显著性检验
查F分布表得 由于,故拒绝H0。 该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显著差异的。方差来源平方和
自由度均方F比组间SA55.55511.11组内SE56.72183.15总和ST112.2723---表4-6方差分析表4.2.4显著性检验方差来源平方和自由度均方F比组间SA55.55511.11q检验法:计算任意两水平的差值,当时,判断与差异显著;当时,判断与差异显著。查多重比较的q表得
(8-18)
4.2.5多重分布与区间估计q检验法:计算任意两水平的差值,当区间估计在置信度为的情况下,的置信区间为(8-19)
4.2.5多重分布与区间估计4.2.5多重分布与区间估计双因素方差分析的类型数据结构离差平方和的分解应用实例4.3双因素方差分析双因素方差分析的类型4.3双因素方差分析 在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。 例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因。采用不同的销售策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该生产线。4.3.1双因素方差分析的类型 在实际问题的研究中,有时需要考虑两个因素对实验结果的影响
若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析。 双因素方差分析的内容,是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。4.3.1双因素方差分析的类型4.3.1双因素方差分析的类型双因素方差分析的类型无交互作用的双因素方差分析有交互作用的双因素方差分析假定因素A和因素B的效应之间是相互独立的,不存在相互关系假定因素A和因素B的结合会产生出一种新的效应4.3.1双因素方差分析的类型双因素方差分析的类型无交互作用的有交互作用的假定因素A和因
例如, 若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景; 否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。4.3.1双因素方差分析的类型 4.3.1双因素方差分析的类型双因素方差分析的数据结构如表所示:
双因素方差分析数据结构因素AA1A2…Ar因素BB1X11X12…X1rB2X21X22…X2r………………BkXk1Xk2…Xkr…表8-74.3.2数据结构双因素方差分析的数据结构如表所示:因素AA1A2…ArB1X
表中,因素A位于列的位置,共有r个水平,代表第j种水平的样本平均数;因素B位于行的位置,共有k个水平,代表第i种水平的样本平均数。为样本总平均数,样本容量n=r×k。
每一个观察值Xij看作由A因素的r个水平和B因素的k个水平所组合成的r×k个总体中抽取样本容量为1的独立随机样本。这r×k个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假定条件。4.3.2数据结构 表中,因素A位于列的位置,共有r个水平,代表第j种水平
4.3.3离差平方和的分解 4.3.3离差平方和的分解各离差平方和对应的自由度: 总离差平方和SST的自由度为r×k-1=n-1;
因素A的离差平方和SSA的自由度为r-1; 因素B的离差平方和的自由度为k-1; 随机误差SSE的自由度为(r-1)×(k-1)4.3.3离差平方和的分解4.3.3离差平方和的分解由离差平方和与自由度可以计算均方差:
对因素A而言:
对因素B而言:
对随机变量而言:4.3.3离差平方和的分解4.3.3离差平方和的分解表4-8双因素方差分析表误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=SSA/(r-1)FA=MSA/MSEB因素SSBk-1MSB=SSB/(k-1)FB=MSB/MSE误差SSE(r-1)(k-1)MSE=SSE/(r-1)(k-1)---合计SSTn-1------4.3.3离差平方和的分解误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=
某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.表4-9
现欲检验包装方式和销售地区对该商品销售是否有显著性影响。(ɑ=0.05)包装方式(A)A1A2A3A4A5销售地区(B)B12012201014B2221020126B32414181810B41648618B526221620104.3.4应用实例 某商品有五种不同的包装方式(因素A),在五个不同地区销售
解:
若五种包装方式的销售的均值相等,则表明不同的包装方式在销售上没有差别。建立假设 对因素A: H0:,包装方式之间无差别 H1:不全相等,包装方式之间有差别 对因素B: H0:地区之间无差别 H1:不全相等地区之间有差别4.3.4应用实例解:4.3.4应用实例计算F值
因素A的列均值分别为:因素B的行均值分别为:总均值=15.04故:SST=(20-15.04)2+…+(10-15.04)2=880.96SSA=5(21.6-15.04)2+…+5(11.6-15.04)2=335.36SSB=5(15.2-15.04)2+…+5(18.8-15.04)2=199.36SSE=880.96-335.36-199.36=346.24
4.3.4应用实例计算F值4.3.4应用实例接下来:因此4.3.4应用实例接下来:4.3.4应用实例统计决策对于因素A,因为
FA=3.87>Fcrit=3.01故拒绝H0,接受H1,说明不同的包装方式对该商品的销售产生影响。对于因素B,因为
FB=2.30<Fcrit=3.01故接受H0,说明不同地区该商品的销售没有显著差异。4.3.4应用实例统计决策4.3.4应用实例
在工农业生产和科学研究中,经常会遇到多因素试验问题,在实际中不需要进行各种水平组合的全面试验,只需从各种不同搭配情况中,选取一小部分来进行就可以了。那么,怎样选取以及如何分析试验结果,才能科学的回答如下问题:各因素对指标的影响,哪个因素重要?哪个因素次之?每个因素中,哪个水平为好?各个因素和水平依哪种情况搭配可使试验结果最佳?
解决这些问题正是正交试验设计的主要内容。4.4正交试验设计 在工农业生产和科学研究中,经常会遇到多因素试验问题,在实正交试验统计的基本思想正交表与直观分析法方差分析法4.4正交试验设计正交试验统计的基本思想4.4正交试验设计 考虑进行一个三因素、每个因素有三个水平的试验。如果作全面试验,需作=27次。图8-14.4.1正交试验统计的基本思想 考虑进行一个三因素、每个因素有三个水平的试验。如果作全面 如果进行正交试验设计,利用正交表安排试验,对于三因素三水平的试验来说,需要作9次试验,用“Δ”表示,标在图中。 如果每个平面都表示一个水平,共有九个平面,可以看到每个平面上都有三个“Δ”点,立方体的每条直线上都有一个“Δ”点,并且这些“Δ”点是均衡地分布着。4.4.1正交试验统计的基本思想4.4.1正交试验统计的基本思想 正交表是正交试验设计的工具。 最简单的正交表是L4(23),此外还有L8(27),L9(34),L16(45)等等。 L表示一张表,它的数字,有三层不同的含义,以L4(23)为例加以说明。4.4.2正交表与直观分析法4.4.2正交表与直观分析法L4(23)表的结构: 包括4行,3列,表中只出现1、2两个反映水平的数字。行数水平数列数L4(23)4.4.2正交表与直观分析法Ln(rm)L4(23)表的结构:行数水平数列数L4(23)4.4.2L4(23)表的用法
作4次试验,可以最多安排3个二水平的因素(因子)
试验数水平数因子数L4(23)4.4.2正交表与直观分析法L4(23)表的用法试验数水平数因子数L4(23)4.4.2L4(23)表的效率
全因素全水平的实验做8次,正交实验做4次.理论上全部试验的次数实际试验次数L4(23)4.4.2正交表与直观分析法L4(23)表的效率理论上全部试验的次数实际试验次数L4(2
表4-10L4(23)列号试验号12311112122321242214.4.2正交表与直观分析法列号12311112122321242214.4正交表的特点每一列中,不同的数字出现的次数相等,如L4(23)表中的数1和2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办公大楼幕墙施工安装合同
- 电子元器件瑕疵管理方案
- 物业管理集团福利费管理手册
- 家具行业项目招投标信息表
- 高空农业喷洒合同
- 2025个人信用贷款借款合同
- 临沂生态农场租赁合同
- 门店市场调研渠道分析
- 医用高值耗材管理指南
- 智能家居大清包施工合同
- 新《安全生产法》解读PPT课件
- E车E拍行车记录仪说明书 - 图文-
- 人才梯队-继任计划-建设方案(珍贵)
- WLANAP日常操作维护规范
- 《健身气功》(选修)教学大纲
- 王家岩隧道工程地质勘察报告(总结)
- GE公司燃气轮机组支持轴承结构及性能分析
- 《昆明的雨》优质课一等奖(课堂PPT)
- 油气田地面建设工程ppt课件
- 电动蝶阀安装步骤说明
- 全自动电镀流水线操作说明书(共12页)
评论
0/150
提交评论