正交试验结果如何进行数据分析_第1页
正交试验结果如何进行数据分析_第2页
正交试验结果如何进行数据分析_第3页
正交试验结果如何进行数据分析_第4页
正交试验结果如何进行数据分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 正交实验如何数据分析 我们把在试验中考察的有关影响试验指标的条件称为因素(也叫因子) ,把在试验中准 备考察的各种因索的不同状态(或配方)称为水平。在研究比较复杂的工程问题中,往往都包 含着多个因素,而且每个因素要取多个水平。 对于包含五个因素、五个水平的工程项目, 理论计算必须进行 55= 3125 次试验。显然, 所需要的试验次数太多了,工作量太大。 实践告诉我们,合理安排试验和科学分析试验,是 试验工作成败的关键。 试验方案设计的好,试验次数就少,周期也短,这样不仅节省了大量人力、物力、财 力和时间,而且可以得到理想的结果。相反, 如果试验设计安排的不好,即使进行了很多次 试验,浪费

2、了大量材料、人力和时间,也不一定能够得到预期的结果。 正交试验法,就是在多因素优化试验中, 利用数理统计学与正交性原理, 从大量的试验 点中挑选有代表性和典型性的试验点,应用“正交表”科学合理地安排试验,从而用尽量少 的试验得到最优的试验结果的一种试验设计方法。 正交试验法也叫正交试验设计法, 它是用“正交表”来安排和分析多因素问题试验的一 种数理统计方法。这种方法的优点是试验次数少,效果好,方法筒单,使用方便,效率高。 由于试验次数大大减少,使得试验数据处理非常重要。我们可以从所有的试验数据中找 到最优的一个数据,当然,这个数据肯定不是最佳匹配数据,但是肯定是最接近最佳的了。 用正交表安排的

3、试验具有均衡分散和整齐可比的特点。均衡分散,是指用正交表挑选 出来的各因素和各水平组合在全部水平组合中的分布是均衡的。 整齐可比是说每一因素的各 水平间具有可比性。 最简单的正交表 L4(23)如表-1 所示。 表-1 水 列 1 2 3 1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 记号 L4(23)的含意如下: “L”代表正交表; L 下角的数字“ 4”表示有 4 横行(简称为行),即要做四次试验; 括号内的指数“ 3”表示有 3 纵列(简称为列),即最多允许安排的因素个数是 3 个; 括号内的数“ 2”表示表的主要部分只有 2 种数字,即因素有两种水平 l 与 2,称之

4、为 l 水平与 2 水平。 表L4(23)之所以称为正交表是因为它有两个特点: 1、 每一列中,每一因素的每个水平,在试验总次数中出现的次数相等。表 -1 里不同的 水平只有两个一一 1 和 2,它们在每一列中各出现 2 次。 2、 任意两个因素列之间,各种水平搭配出现的有序数列(即左边的数放在前,右边的数 放在后,按这一次序排出的数对 )时,每种数对出现的次数相等。2 这里有序数对共有四种(1, 1), (1, 2), (2, 1), (2, 2).它们各出现一次。 常见的正交表有:L4(23), L8(27), L16(215), L32 (231) , ; L9 (34), L27 (3

5、13). . . ; L6(45),; L25(56),等。 此外还有混合水平正交表:各列中出现的最大数字不完全相同的正交表称为混合水平 正交表。如L8(41 X 24),表中有一列最大数字为 4,有 4 列最大数字为 2。也就是说该表可以 安排 1 个 4 水平因素和 4 个 2 水平因素。 选择正交表的原则,应当是被选用的正交表的因素数与水平数等于或大于要进行试验 考察的因素数与水平数,并且使试验次数最少。如我们要进行 3 因素 2 水平的试验,选用 L4(23)表最理想。但是,要进行 5 因素 2 水平的试验仍用 L4(23)表,那么便放不下 5 个因素 了。这时,应当选用 L8(27)

6、表,这样尽管只用了此表的 5 个因素列,还有两个因素列是空列, 但这并不影响分析。 对试验结果(数据)的处理分析通常有两种方法,一是直观分析法,又叫极值分析法;另 一种方法是方差分析。 素愈重要;由此可以确定出主、次要因素的排列顺序。 根据各因素各水平所对应指标结果的平均值的大小可以确定各因素取什么水平好。 确定的原则是:如果要求指标愈小愈好,则取最小的平均值所对应的那个水平; 如果要 求指标愈大愈好,则取最大的平均值所对应的那个水平;如果要求指标适中(固定值),则 取适中的平均值所对应的那个水平。 需要说明的是,最优的水平组合并不一定就在由正交实验设计所指定的实验当中。 1. 直观分析法:

7、根据正交表进行试验,可以得到就某 一(单指标,也有多指标)考察指标的试 验结果,通过直观分析或方差分析,就可 以得出最佳的实验方案。 直观分析试验结果的步骤(以四因素 三水平为例)如下,见表-2,根据实验数 据分别计算出: 分别对每次实验各因素的一水平 的实验结果求和,即 Ij: 再对每次实验各因素的二水平结果求 和,即 II j: 对每次试验各因子的三水平的结果求 和,即 III j : 分别求出各因素各水平结果的平 均值:即 Ij/3, II j/3, III j/3,并填入 正交表中; 分别求出各因素的平均值的差值 (也叫极差),如果是三个以上水平则要找 出平均值最大值或最小值之间的差值

8、 Rj。 根据极差数 Rj 的大小,可以判断各因 素对实验结果的影响大小。 判断原则是:极差愈大,所对应的因 水因 A B C D 结果 (指标) 1 2 3 4 5 6 7 8 9 Ij n j III j Ij/3 II j/3 III j/3 R R1 R2 R R 表一 2 3 所以,根据试验指标的数值要求所确定的各因素的最优水平组合, 就可以筛选出最佳的 3 j彳 4 试验方案条件、以及较好的试验方案条件。 对试验结果的直观分析法, 除了极差分析外。为了更形象直观的得出试验分析结果, 我 们还可以采用画趋势图(效应曲线图)的方法,得出正确的综合分析结论。 效应曲线图(因素指标分析)就

9、是要画出各因素水平与指标的关系图, 它是一种座标图, 它的横座标用各因素的不同水平表示; 纵座标同为试验指标。 其实它就是根据极差分析数据 所绘出来的,可以一目了然看出各因素的哪个水平为最优(根据指标的具体数值要求)。 2. 方差分析法: 通过试验可以获得一组结果实验数据, 这组数据之间一般会存在一定的差异, 即使在相 同的条件下做几次试验, 由于偶然因素的影响, 所得的数据数据也不完全相等, 这说明实验 数据的波动不仅与实验条件的改变有关,也包括实验误差的影响。 方差分析是用来区分所考察因子的由于水平不同对应的试验结果的差异是由于水平的 改变所引起还是由于试验误差所引起的, 以便进一步(在直

10、观分析的基础上) 检验哪些因子 对结果有影响,哪些没有影响,并区分哪些是影响结果的主要因素,哪些是次要因素。 我们通过一个例子来说明方差分析法的原理和计算方法。 在研究某胶料的过程中, 为考察生胶的转动黏度对胶料压缩变形有无显著的影响, 进行 了试验,其实验结果如表-3 所示: 表-3 压黏 缩 7* 变 度 试验 f 139 142 147 150 1 38.2 36.5 35.6 32.2 2 33.3 35.9 34.1 31.6 3 36.0 32.8 32.8 35.6 平均值 35.8 35.1 34.2 33.2 我们把转动黏度记做因子 A,这是单因子 4 水平的实验,每个水平都

11、进行了 3 次重复试验, 从这组试验数据,如何来判断 A 因子对压缩变形有无显著性影响呢? 首先从这组数据出发,计算出实验误差引起的数据波动及 A 因子水平的改变所引起的数 据波动。 可以观察到在 A 勺同一水平下,虽然试验条件没有改变, 但所得的试验数据不完全一样, 也就是说压缩变形值不完全一样。这是由于试验误差的存在使数据发生了波动。例如, A 勺 第一水平下(A1= 139)数据的平均数为: 1 / 、 Xl = (38.2+33.3+36.0 ) =35.8 3 数据的波动值是: $1=(38.2-35.8) 2+(33.3-35.8) 2+(36.0-35.8) 2=12.05 我们

12、称 S1为 A 的第一水平下的偏差平方和。偏差平方和反映了一组实验数据的分散和集 中的程度,S 大表明这组数据分散,S 小表明它们集中。 类似地,可以按公式: -1.3 Xi= Xij 5 SA= (Xj -Xi) ,i=1,2,3,4 计算各水平下数据的平均值及偏差平方和: X2 =35.1 S 2=7.89 确 34.2 S 3=3.93 兄=33.2 S 4=8.96 将各因子 A 在各水平下的偏差平方和相加,得 4 3 _ $吴=Si+&+S3+S4= (为-Xi)2 = 32.83 i 4 j=1 这完全是由试验误差引起的,它表征了试验误差在这组试验中引起的数据的总波动值,

13、我们称 S 吴为试验的偏差平方和。 对因子 A,可以注意到 A 的四个水平下的平均值 又也各不相同。这种数据平均值的波动 不仅与试验误差有关,还包括由于 A 的水平不同引起的数据波动。 A 勺第一水平下的平均值 X1 = 35.8,这个平均值可代替各个 1 水平(共 3 个)对压缩变形 的影响,对其它的水平亦可作同样地考虑,记做: =1 X4 X = Z Xi = 34.6 4 i 1 表示数据的总平均值,则 A 因子各水平平均值之间的偏差平方和为 : SA=3 痴X)2 =11.43 i =1 它刻划了 A 水平不同引起的数据波动值,称为因子 A 的偏差平方和,如果记: 4 3 - S 总=

14、 (Xj X) i d j =1 表示所有的数据围绕它们的总平均值的波动值,则可以证明: 5 总=SA+SK 从数据偏差平方和可见, 数据个数多的,偏差平方和就可能大。 为了消除数据个数的影 响,我们采用平均偏差平方和 SAf A、S 吴/f 误,其中 f A和 f 误分别表示偏差平方和 荫日 S 误的自由 度。 所谓自由度,就是独立的数据的个数。 与偏差平方和一样,自由度也可以分解为: f 总=f A+ f 误 而 f 总=N 1, N 为同一水平的总试验次数; f A= A 的水平数一 1; f 误=f 总一 f A; 考虑比值: 6 c _SA/fA Fa: S /f误 若 F比近似等于

15、 1,表明 S/f A与S吴/f误差不多,也就说明因子 A的水平改变对指标的影响在 误差范围之内,即水平之间无显著差异。 那么,当 F比多大时,才能说明因子 M 平改变对结果有显著影响呢? 这时要查一下 粉布临界值表。F 分布临界值表列出了各种自由度情况下 F比的临界值。在 F 分布临界值表上横行 fi代表 F 比中分子的自由度 fA,竖行 f2代表 F比中分母的自由度 f误。查得 的临界值记做 F,这里的 a 是预先给定的显著性水平,若 F 比Fa,我们就有(1 a )的 把握说明因子 A 的水平改变对结果(指标)有显著性影响,其几何意义见图- 1 所示。 圈 T 对我们所讨论的例子,有:

16、f 总=12 1= 11; f A = 4-1=3 ; f 误=11 3= 8; 把有关数据带入FA的表达式,得: _ SA/fA 11.43/3 F 比= A A = - =1.08 S误 /f误 32.83/8 我们给定显著性水平 a = 0.10,从 F 分布临界值表中查出: Fo.1o(3,8)=2.92 由于 R= 1.08 F 0.10(3,8)=2.92 因此我们大概有 90%的把握说因子 A 勺水平改变对结果的影响无显著差异,也就是说我 们有 90%的把握,说生胶转动黏度水平的改变对压缩变形的影响无显著差异, 试验结果所出 现的波动就主要是由试验误差造成的 (有必要通过改变试验

17、条件来减小试验结果数据的波 动)。 反之,当 F 比 N F0.10时,我们大概有 90%的把握说因子 A 的水平改变对结果的影响有显著 影响。 显著性水平 a,是指我们对作出的判断大概有 1a 的把握。对于不同的显著性水平, 有不同的 粉布表,常用的有 a = 0.01, a =0.05 和口 = 0.10 三种。 为了区别显著性的程度,当 F 比F0.01(f 1, f2)时,就说该因子水平的改变对试验结果有高 度显著的影响,记做*; 当 F0.01 (f 1, f2) F 比F0.05(f 1, f2)时,就说该因子水平的改变,对试验结果有显著的影响, 记做*; 当 F0.05(f 1,

18、 f2)FAF0.10(f 1, f2)时,就说该因子水平的改变,对试验结果有一定的影响, 记做*。 根据是否要考虑两个因素的交互作用, 又将双因素方差分析分为双因素重复试验的方差 7 分析和双因素不重复试验的方差分析。 此外还有多因素方差分析,分析方法与此类同,这里不进行讨论。 3. 交互作用: 在多因素对比试验中,某些因素对试验指标的影响往往有相互制约、互相联系的现象。 在处理多因素对比试验时,不仅需要分别研究各因素水平的改变对试验指标的影响以 及每个因素的单独作用,还要考虑它们之间的相互作用。 通常在一个试验里,不仅各个因素在起作用,而且因素之间有时会联合起来影响试验 的结果指标,这种作

19、用叫做交互作用。 如果因素 A 的数值和水平发生变化时,试验指标随因素 B 的变化也发生变化;同样地, 若因素 B 的数值或水平发生变化时,试验指标随因素 A 变化的变化也发生变化,则称因素 A、 B 间有交互作用,记为 A XB。 当任意两元素之间(如 A 与 B)存在交互作用而且显著时,则不论因素 A、B 本身对指标的 影响是否显著,A、B 的最佳水平的选取都应从 A 与 B 的搭配中去选择。 为了考虑交互作用的影响,一般在选择正交表时,要注意留有一定的空列。 进行方差分析时,当被分析因子对指标的影响不显著时, 其原因是试验误差太大或误差 的自由度小,试验误差有可能掩盖了被考察因素的显著性

20、, 使得 F 检验灵敏度下降。若 F 检验 显著,说明存在交互作用。 如果在处理实际问题时,已经知道不存在交互作用,或已知交互作用对试验的指标影响 很小,则可以不考虑交互作用。 主次因素的分析一般通过极差分析就可以得出结论,从效应图可以看得更直观。 对极差分析、方差分析以及交互作用的分析结果必须要根据具体的实际条件 (例如材料 成本,时间花费,主次因素,对指标的影响程度等,特别是对复合指标数据考核时)进行综 合分析,才能最后得出最佳水平组合。 本实验的设计和计算使用“正交设计助手”软件。 4软件分析法 使用“正交设计助手 n”进行实验设计。其操作步骤如下: 1. 文件新建工程:命名该未命名工程;并存储工程; 2. - 实验新建实验 进入设计向导: (1)实验说明:填写实验名称和简要叙述及选择标准正交表。 对于多指标(复合指标) 检验实验,可以在同一工程中建立多个实验, 实验最佳方案的确定要通过对各实验分析、 讨 论所得的结论加以综合考虑。 (2) 选择正交

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论