




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验设计与分析(一)【美】Douglas C. Montgomery许荣浩2015.12.21教材教材“这是实验设计领域最权威的一本书,全面、透彻而且非常实用”一、实验设计二、实验设计应用三、基本原理四、实验设计指南五、统计设计实简史一、实验设计一、实验设计 实验 试验我们可以定义一次实验实验(experiment)是一次试验试验(test)或一系列试验,在实验中通过对某一过程或系统的输入变量作一些有目的的改变,以便能够观测到和识别出可在输出响应中观测到的变化的缘由。实验包括新产品设计和配方、制造过程(process)开发以及过程改进在内的产品实验(product realization)中起
2、着重要的作用。多数情况下是为了开发一种稳健的(robust)过程,即受外部变异性来源影响最小的过程。案例:淬火实验案例:淬火实验淬火工艺(油淬和盐水淬) 铝合金 淬火溶液每种淬火介质都提供若干合金试件并在淬火后测量试件的硬度平均硬度淬火工艺(油淬和盐水淬)对铝合金的效应实验影响因素有:考虑这样一项简单的实验时,有很多重要的问题需要思考1、要研究的淬火介质只有这两种溶液吗?2、在这项实验中,有没有其他可能影响硬度的因子应该被研究或被控制呢(比如,淬火介质的温度)?3、每种淬火溶液中应该检测多少块合金试件呢?4、怎样把试件分配给淬火溶液?又应该按什么次序来收集数据?5、应该用什么样的数据分析方法?
3、6、两种淬火介质间的平均观测硬度之差是多大时将被认为是重要的? 机理模型(机理模型(mechanistic model)电路中关于电流的著名公式,即欧姆定律:E=IR。 经验模型(经验模型(empirical model)由实验决定的模型科学和工程的大多数都是对系统的运行进行观测观测和实验实验,从而阐明系统运行的原因和方式。收集数据的方法收集数据的方法 假定在上述实验中那位冶金工程师用来自第一炉第一炉的试件进行油淬油淬,而用第二炉第二炉的试件进行盐水淬盐水淬。那么,当比较平平均硬度均硬度时,工程师就不能说出所观测到的差别有多少是淬火介质所致,以及有多少是由于炉次的不同所致。 因此,收集数据的方
4、法对由实验所能得到的结论起到了负面的影响。过程和系统的一般模型过程和系统输入响应(response)可控因子不可控因子一般地,实验可以用来研究过程过程和系统系统的性能。实验目的实验目的实验目的包括:实验目的包括: 1、确定哪些变量对响应y的影响最大; 2、确定有影响的x设置为何值可使y几乎接近于所希望的额定值; 3、确定有影响的x设置为何值可使得y的变异性较小 4、确定有影响的x设置为何值可使得不可控制的变量z1,z2,zq的效应最小。实验往往包括几个因子。通常进行实验的人的目的,就是要确定这些因子对系统的输出响应的影响。设计和进行实验的一般方法称作实验策略实验策略。实验者可以采取多个策略。案
5、例:高尔夫球案例:高尔夫球高尔夫球规则:从发球区开始经一次击球或连续击球将球打入洞内,将每一洞的杆数累计起来,待打完一场(十八洞)后,把全部杆数加起来,以总杆数最少者胜。有些因子会影响高尔夫得分,包括: 1、使用的长打棒的类型(特大尺寸的还是常规尺寸的) 2、使用的球的类型(树胶的还是三片的) 3、步行并手提高尔夫球棒还是乘高尔夫球车 4、打球时喝的是水还是啤酒 5、在上午打球还是在下午打球 6、打球时天气是冷还是热 7、高尔夫球鞋钉的类型(金属的还是软的) 8、在有风的日子还是无风的日子打球最佳猜测法最佳猜测法 最佳猜测法最佳猜测法(best-guess approach)就是选择这些因子的
6、任意组合,测试它们,观测发生了什么。例如,选择使用特大长打棒、橡胶球、乘高尔夫球车和喝水的组合,结果为87杆。但是在这一轮中,注意到使用特大长打棒有几杆进球结果并不好,因此决定在另一轮中使用常规长打棒,其他因子保持不变。基于目前试验的结果,下基于目前试验的结果,下次试验改变一个(或两个)因子的水平,这种方法可以次试验改变一个(或两个)因子的水平,这种方法可以几乎无限期地继续下去。几乎无限期地继续下去。 这种试验策略在实践中经常被工程师和科学家所采用。因为实验者具有大量关于他们正研究的系统的技术上或理论上的知识,还有相当丰富的实际经验,所以该方法的使用效果通常相当好。最佳猜测法最佳猜测法但是最佳
7、猜测法至少有两点不足两点不足。 第一,假定最初的最佳猜测没有产生预期的结果,实验者不得不做另一种关于因子水平正确组合的猜想,这要继续很长一段时间,而且没有成功的保证没有成功的保证。 第二,假定最初的最佳猜测产生了一个可以接受的结果,现在虽然不能保证最优解决办法已被发现不能保证最优解决办法已被发现,但实验者仍试图终止实验。一次一因子方法一次一因子方法 一次一因子一次一因子(one-factor-at-a-time)方法包括对每个因子选择初始点,或者水平的初始(baseline)组合,然后在保持其他因子在初始水平不变的条件下(特大长打棒、树胶球、步行和喝水作为4个因子的初始水平),让每一个因子在其
8、所允许的范围内进行连续变动。当所有的试验都做完后,我们就可以做出一系列的图形,来显示响应变量如何受单个因子变化(即保持其他因子不变)的影响。一次一因子法一次一因子法 例如,行进模式曲线的斜率是负的,我们可以得出乘车有助于提高成绩的结论。根据这些一次一因子图形,我们选择的最优组合是常规长打棒、乘车和喝水。高尔夫球的类型似乎并不重要。一次一因子法一次一因子法 一次一因子策略的主要缺点主要缺点在于,它没有考虑因子间可能存在的交互作用交互作用(interaction)。交互作用会使一个因子与另一个因子的不同水平结合使用难以对响应产生同样的效应。 图1.3说明了高尔夫实验中长打棒的类型和饮料因子之间的交
9、互作用。可以看出,如果我使用常规长打棒,所喝的饮料类型对得分几乎没有影响,但是如果我使用特大长打棒,喝水的效果比喝啤酒的效果更好。一次一因子法一次一因子法 因子间的交互作用是非常普遍的,如果交互作用存在,那么一次一因子的策略产生的结果往往不理想。许多人没有意识到这一点,结果在实际中经常采用一次一因子实验。(有些人确实认为这个策略是一种科学方法,或者认为它“合乎”工程原理。)然而对设计而言,一次一因子实验往往比其他基于统计途一次一因子实验往往比其他基于统计途径的方法效率更低径的方法效率更低。析因实验析因实验 处理多个因子的正确方法是进行 这种实验策略是所有因子一起变化,而不是一次变一个。 全面实
10、验析因试验(析因试验(factorial experiment)析因实验(高尔夫实验)析因实验(高尔夫实验) 这样的实验设计可以帮助实验者研究每个因子的个体效个体效应应(或主效应)并判定因子是否存在交互作用交互作用。析因实验析因实验 因为我希望打8轮高尔夫球来检测这些因子,所以图1.4中显示的每个因子水平组合可以各打2轮。实验设计者称之为重复设计两次。 图1.5a显示了执行图1.4中的析因实验的结果。在正方形的4个角点上显示了每一轮高尔夫得分。析因实验析因实验球棒效应与球的类型4个角的数据分别为(88,91),(92,94),(88,90),(93,91)析因实验析因实验 这个简单的例子显现出
11、析因实验的一个非常重要的特性,即析因实验可以高效率地利用实验数据。注意到这组实验包括8个观测值,所有观测值所有观测值都用于计算长打棒、球和交长打棒、球和交互作用的效应互作用的效应。没有其他的实验策略可以这样高效率地利用数据,这是析因实验一个重要且有用的特性。析因实验析因实验 可以将析因实验的概念推广到3个因子。假定希望研究长打棒类型、球类型以及饮料类型对高尔夫得分的效应,并且假定这3个因子都有两个水平,析因实验的设计可以如图1.6所示。注意到各有两个水平的3个因子有8个试验组合,8个试验点可以在几何上用立方体的8个顶点来表示。这是一个2 23 3析因设计析因设计的例子。析因实验析因实验 图1.
12、7显示了如何在24析因设计中研究所有的4个因子长打棒、球、饮料和行进方式(步行或乘车)。像在任意的析因设计中一样,它利用了因子水平组合的所有可能。由于所有4个因子都有两个水平,所以这个实验设计在几何上仍然可以用立方体(实际上是超立方体)表示。分式析因实验(正交实验)分式析因实验(正交实验) 一般地,如果有k个因子,每个因子有两个水平,那么析因设计就要进行2k轮。例如,图1.7中的实验要进行16轮。显然,随着感兴趣的因子数的增加,要求的轮数也迅速增加。比如,具有10个因子、每个因子都有两个水平的实验需要进行1024轮。这无论从时间还是资源角度来说都是不可行的。 所幸的是,如果有45个甚至更多的因
13、子,通常没有必要对因子水平所有可能的组合一一进行试验。分式析因实验分式析因实验(fractional factorial experiment)是基本的析因设计的变形,它只对所有组合的一个子集进行试验。分式析因实验(正交实验)分式析因实验(正交实验) 图1.8显示了高尔夫实验中4个因子的一个分式析因设计。这个实验只需要做8轮而不是原来要求的16轮,因此称作1/2分式分式(one-half fraction)。 它提供了很好的关于4个因子主效应的信息主效应的信息以及因子间如如何交互的部分信息何交互的部分信息正交实验正交实验 正交试验设计就是安排多因素试验 、寻求最优水平组合 的一种高效率试验设计
14、方法。用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。正交实验正交实验 正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图10-1中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。正交实验正交实验正交实验正交实验正交实验的正交实验的代表性代表性 一方面: (1)任一列的各水平都出现,使得部分试验中包括了所有因素的所有水平; (2)任两列的所有水平组合都出现,使任意两因素间的试验组合为全面试验。另一方面: 由于正交表的正交性,正交试验的试验点必然均衡地分布在全面试验点中,具有很强的代表
15、性。因此,部分试验寻找的最优条件与全面试验所找的最优条件,应有一致的趋势。正交实验正交实验正交实验的综合可比性综合可比性 (1)任一列的各水平出现的次数相等;(2)任两列间所有水平组合出现次数相等,使得任一因素各水平的试验条件相同。这就保证了在每列因素各水平的效果中,最大限度地排除了其他因素的干扰。从而可以综合比较该因素不同水平对试验指标的影响情况。 根据以上特性,我们用正交表安排的试验,具有均衡分散均衡分散和整齐可比整齐可比的特点。正交表的三个基本性质中,正交性正交性是核心是核心,是基础,代表性和综合可比性是正交性的必然结果正交设计优化罗红霉素的处方工艺正交设计优化罗红霉素的处方工艺罗红霉素
16、不溶于水,对胶囊的溶出度影响较大,胶囊填充流动性不好,影响装量差异。基于以上原因,本课题运用正交设计,采用湿制粒,解决了溶出度问题正交设计优化罗红霉素的处方工艺正交设计优化罗红霉素的处方工艺 从方差分析看,B因素具有显著性影响,C因素、A因素的影响无显著性意义。直观分析与方差分析基本一致。最终确定最优选处方为A1B3C3。医药前沿2014年第19期供稿 作者:吴军 陈家香 陈兰 王正凤 李贵香 余春梅(通讯作者)西南药业股份有限公司 重庆正交实验正交实验二、实验设计的应用二、实验设计的应用在科学和工程学领域,实验设计是改进产品实现过程的非常重要的手段。这些活动是新的制造过程设计与开发以及过程管
17、理中的重要元素。在过程开发的早期过程开发的早期,应用实验设计方法能够: 1、提高产量 2、减少变异性,与额定值或目标值更为一致 3、缩短开发时间 4、降低总成本实验设计在工程设计工程设计(engineering design)中的应用包括 1、评价和比较基本的设计结构 2、评定材料的选择方案 3、选择设计参数,使得产品能在广泛的实际使用条件下运行良好,也就是说,使得产品是稳健的 4、确定影响产品性能的关键产品设计参数 5、新产品的配方案例案例1:过程刻画:过程刻画 一台浸流焊接机用在印刷电路板的制造过程中,机器将电路板在焊剂中清洗、预热,然后将它顺着传送带通过一波熔化的焊料。这一焊接的过程将板
18、上的加铅原件进行电连接和机械连接。 目前,该过程产生大约1%的次品。也就是说,电路板上约有1%的焊点是不合格的,需要人工修正。但是,因为每个印刷电路板平均含有2000多条焊接线,即使是1%的次品水平也使需要返工的焊点太多了。 对此,负责该过程的工程师想用实验设计来确定哪些机器参数对出现焊料次品有影响,以及应该怎样调整那些变量以便减少焊料次品。浸流焊接机有以下几个可以控制的变量: 1、焊料温度 2、预热温度 3、传送带速度 4、焊剂类型 5、焊剂的比重 6、焊料波的深度 7、传送带角度 (可控因子)除了这些可控制的因子之外,还有另外几个因子在日常生产中不容易控制(尽管为了试验的目的可以对它们进行
19、控制)这些因子是: 1、印刷电路板厚度 2、电路板上所用的元件的类型 3、电路板上的元件的布局 4、操作工 5、生产率 (不可控因子)案例案例1:过程刻画:过程刻画案例案例1:过程刻画:过程刻画在这种情况下,工程师想要刻画刻画(characterize)浸流焊接机,也就是说,他想要确定哪些因子(可控制的与不可控制的)对印刷电路板出现次品有影响。要完成这一任务,他可以设计一个实验以便能够估计因子效应的大小和方向。即当每个因子变化时,响应变量(每单位的次品数)能有多大的变化,所有因子一起改变产生的结果与调节个别因子产生的结果有没有差别(即,因子间是否存在交互作用)?我们称这类实验为筛选实验筛选实验
20、(screening experiment)。筛选实验一般需要使用分式析因设计(正交实验设计)筛选实验一般需要使用分式析因设计(正交实验设计) 由这种筛选实验/刻画实验所得到的信息,将用于识别关键的过程因子关键的过程因子,并确定这些因子的调整方向以便进一步减少单位次品数。实验也可以提供关于在日常生产中哪些因子应该更仔细地控制的信息,以避免出现高次品水平和不稳定的过程性能。案例案例1:过程刻画:过程刻画案例案例2:过程优化:过程优化在刻画实验中,人们通常希望确定哪些过程变量会影响过程的响应。逻辑上,下一步骤就是优化优化,即确定导导致最佳响应的重要因子的范围致最佳响应的重要因子的范围。例如,如果响
21、应是产率,则寻求最大最大产率的区域;如果响应是产品的一个重要尺度的变异性,则需求最小最小变异性的区域。响应曲面方法响应曲面方法 响应曲面方法响应曲面方法(response surface methodology)案例案例2:过程优化:过程优化 一旦找到了优化区域,一般就要进行另一次实验。第2次实验的目标是开发一个过程的经验模型,并得到一个对时间和温度的最优运行条件的精确估计。这种过程最优化的方法称作响应曲面方法响应曲面方法。 图1.9中第2个实验是一个中心复合设计中心复合设计(central composite design),是用在过程优化研究中最重要的实验设计之一。案例案例3、产品设计、产
22、品设计 生化工程师要设计一种新的药品静脉推射泵,这种推射泵应该在特定的时间里注射规定剂量的药品。他必须指定一些变量或设计参数,其中包括空筒的直径和长度、空筒和活塞的适合度、活塞的长度、连接推射泵和插入病人静脉的针的乳头的直径和壁厚、用来制造空筒和乳头的材料,以及系统必须控制的额定气压。部分设计参数的效应可以通过建立原型(原型中的参数在合适的范围内变化)来评估。可以设计实验来检验原型,从而发现哪些设计参数对静脉泵的性能影响最大。分析这些信息可以帮助工程师找到一种设计以提供可靠且平稳的药品注射。案例案例4、产品配方、产品配方 生化工程师要设计一种诊断产品来检测某一种特定疾病是否存在。该产品是生物材
23、料、化学试剂盒其他材料的混合物,当与人的血液混合时发生反应并提供诊断信息。这里使用的实验类型是混料实验混料实验(mixture experiment),因为组成诊断产品的各成分在混合物中的比率总和为100%。响应是在产品中出现混合比的函数。混料实验是响应曲面实验的特殊类型,在设计生物科技产品、药品、油漆和涂料以及各种其他产品方面,它们都有很大的用途。三、基本原理三、基本原理 实验的统计设计(实验的统计设计(statistical design of experiment) 就是设计实验的过程,以便收集适合于用统计方法分析的数据,从而得出有效且客观的结论。 如果想从数据中得出有意义的结论,那么用
24、统计方法作实验设计是必要的。当问题涉及受实验误差影响的数据时,只有统计方法才是客观的(只有统计方法才是客观的(objective)分析方法)分析方法。因此,任何实验问题就存在两个方面:实验的设计实验的设计和数据数据的统计分析的统计分析。 这两个方面是紧密相连的,因为分析方法直接依赖于所用的设计。 实验设计的3个基本原理: 随机化(随机化(randomization) 重复(重复(replication) 区组化(区组化(blocking)1、随机化、随机化 随机化是实验设计中使用统计方法的基石。随机化是实验设计中使用统计方法的基石。 它的意思是,实验材料的分配和实验中各次试验进行的顺序都是随机
25、确定的。统计方法要求观测值(或误差)是独立分布的随机变量。随机化通常能使这一假定有效。 把实验进行适当的随机化有助于“平均掉”可能出现的外来因子的效应。1、随机化、随机化 计算机软件程序计算机软件程序经常用于辅助实验者选择和指导实验设计。这些程序经常使实验设计按照随机的顺序执行每一轮。随机顺序可以由一个随机数字发生器产生。但即使有了这样一种计算机程序,仍有必要安排在实验中使用的各种实验材料、操作者和测量装置等。 有时候实验者很难随机化实验的某一部分。例如在化学过程中,温度是非常难以改变的变量,相对于其他因子,我们很少改变它。在这种实验中,完全随机化是非常困难的,因为它需增加时间和费用。我们将采
26、用统计设计方法来处理随机化的限制问题统计设计方法来处理随机化的限制问题。2、重复、重复 所谓重复,是指每个因子水平组合的独立重复所谓重复,是指每个因子水平组合的独立重复。在1.1节讨论的冶炼实验中,重复包含用油淬处理试件和用盐水淬处理试件。这样,当在每种淬火介质中处理了5块试件时,我们就说做了5次重复。这10个观测值中的每一个都是按照随机次序进行的。 重复有两条重要的性质。第一,它允许实验者得到一个实实验误差估计(偏差)验误差估计(偏差),这个误差估计成为了一个确定数据之间的观测差是否统计意义的实际差的基本度量单位。第二,如果用样本均值(y)估计实验中某一因子水平的响应均值的真值,则重复能够使
27、得实验者得到更精确的参数重复能够使得实验者得到更精确的参数估计(方差)估计(方差)。例如:如果2是单个观测值得方差,且有n次重复,则样本均值的方差是2、重复、重复 如果有n=1次重复并观测得y1=145(油淬)和y2=147(盐水淬),我们也许不能做出关于淬火介质效应的满意推断,即观测差可能是实验误差的结果观测差可能是实验误差的结果。关键是,没有重复我们没有重复我们就没有办法知道这两个观测值为何不同就没有办法知道这两个观测值为何不同。另一方面,如果n合理地大且实验误差足够小,当我们观测到y1y2时,就有相当可靠的结论:对这种特殊的铝合金而言,盐水淬会比油淬产生更高的硬度。2、重复、重复 通常在
28、随机化实验中连续两次(或更多次)试验的一些因子会出现完全相同的水平。例如,一个实验中有3个因子:压强、温度和时间。随机化实验次序后,我们发现:第i次和第i+1次试验中,压强的水平是相同的,而第i+1次和第i+2次试验中,温度和时间的水平是相同的。为了获得真正为了获得真正的重复性的重复性,实验者需要在第i次和第i+1次试验中间,“扭动压力旋钮”调到一个中间值,并在第i+1次试验中重新设定压强为30psi。类似地,在第i+1次和i+2次中间,在设定第i+2次试验设计水平之前,先将温度和时间设定在中间水平。部分实验误差就源自达到和维持因子水平的变异性。部分实验误差就源自达到和维持因子水平的变异性。2
29、、重复、重复 重复重复和重复测量重复测量是有很大区别的。例如,假定在一个单晶片等离子体蚀刻工序中蚀刻一个硅晶片,晶片的关键尺寸需测量3次。这种测量不是重复,是重复测量。 重复测量的观测差异受测量系统或量具内在的变异性的直重复测量的观测差异受测量系统或量具内在的变异性的直接影响。接影响。 重复既反映试验间的变异又反映试验内在的变异。重复既反映试验间的变异又反映试验内在的变异。3、区组化、区组化 区组化是用来提高实验精度的一种设计技术,使用它我们区组化是用来提高实验精度的一种设计技术,使用它我们在感兴趣的因子之间进行比较。在感兴趣的因子之间进行比较。区组化常用于减少或消除讨厌因子带来的变异。讨厌因
30、子是指可能影响实验响应而我们不直接感兴趣的因子。例如,在一个化学过程中,要在所有的轮次中使用两批原材料。然而,由于供货商之间的不同可能造成批次间的差异,如果我们对这种影响不是特别感兴趣,就可以将原材料的批次作为讨厌因子。一般地,区组是一组相对类似地实验条件。在刻画过程的例子中,批次内的变异差异预期小于批次间的变异,所以各个批次的原材料将组成一个区组。一般情况下,正如在该例中一样,讨厌因子的每个水平形成一个区组。实验者在统实验者在统计设计中将观测值按区组进行分组。计设计中将观测值按区组进行分组。四、设计实验指南四、设计实验指南 为了在设计和分析实验时使用统计方法,与实验有关的每一个人需要预先对所
31、研究的问题究竟是什么以及如何收集数据等有一个清晰的认识,至少要对如何分析这些数据有一个定性的了解。推荐步骤见表1.1。1、问题的识别与表述、问题的识别与表述1、问题的识别与表述问题的识别与表述 这一点看起来似乎是再明白不过了,但是在实践中,确认需要实验的问题的存在却并不是那么简单的,将问题阐述得简明而又可以被普遍接受就更不简单了。需要对实验目的有一个全面的考虑。通常,吸引所有有关各方的参与是很重要的,其中包括:工程部、质量保证部、制造部、市场营销部、管理部门、顾客以及操作工(通常,他们有很多很好的想法,却常常被忽略了)。基于这个原因,采用采用团队方法来设计实验是值得推荐的。团队方法来设计实验是
32、值得推荐的。1、问题的识别与表述、问题的识别与表述 对实验涉及的有关问题列一个清单对实验涉及的有关问题列一个清单往往是有帮助的。明确地陈述问题通常有助于更好地理解正在研究的现象以及问题的最终解决方案。牢记总目标也很重要牢记总目标也很重要。例如,它是否一个新的过程或系统(此时初始目标可能是刻画或因子筛选)?它是否一个已经被提前刻画的成熟的或者容易理解得系统(此时目标可能是优化)?一个实验可能有很多目标,包括确认(系统运行的方式是否与以前一样?)、发现(如果我们开发新的材料、变量、运行条件等,将会发生什么?)、稳定性或稳健性(在什么条件下响应变量受因子的影响小,或者我们怎样才能减小我们不能直接控制
33、的来源因其的响应变量的差异?)。1、问题的识别与表述、问题的识别与表述 显然,实验中涉及的问题直接与总目标相关,提出问题时必须认识到一个大的综合性实验不可能满意地回答所有的关键性问题。一个综合性实验要求实验者知道许多问题的答案,如果他们错了,结果将是令人失望的。这不仅浪费时间、材料和其他资源,也许还会导致根本不能满意地回答起初研究的问题。采用序贯的方法是一个较好的策略。采用序贯的方法是一个较好的策略。所谓序贯的方法,就是做一系列较小的实验,每个实验都有一个特定的目标,比如因子筛选。2、响应变量的选择、响应变量的选择2、 响应变量的选择响应变量的选择 在选择响应变量时,实验者应该确信这个变量确实
34、会对所研究的过程提供有用的信息。我们经常取测量特性的平均值或标准差(或两者)为响应变量。多重响应并非不常用。仪表性能(或测量误差)也是一个重要因子。如果仪表性能差,则只有相对大的因子效应才能通过实验检测出来,或者需要做附加的重复实验。在一些仪表性能不好的情形下,实验者可以多次测量每个实验单元,采用重复测量的平均值作为响应的观测值。在进行实验前,确定与响应的在进行实验前,确定与响应的定义及测量方式有关的事项是非常重要的定义及测量方式有关的事项是非常重要的。3、因子、水平和范围的选择、因子、水平和范围的选择3 、因子、水平和范围的选择、因子、水平和范围的选择 (如表1.1的注释所示,第2步和第3步
35、通常同时进行,或者以相反的次序进行。)当所考虑的因子可能影响过程或系统的改进时,实验者发现这些因子通常可以分为潜在设计潜在设计因子因子或讨厌因子讨厌因子,所以对它们进行进一步分类是有帮助的。一些有用的分类包括设计因子、保持常量因子设计因子、保持常量因子和允许改变允许改变因子因子。 设计因子设计因子是指在实验中被实际选择用来研究的因子3、因子、水平和范围的选择、因子、水平和范围的选择 保持常量因子保持常量因子是指可能对响应施加一些影响的变量,但是对当前实验的目的而言,我们对这些因子并不感兴趣,所以它们将被保持在一个特定的水平。例如,在半导体工厂的蚀刻实验中,也许有一个效应对于用在实验中的特定的等
36、离子蚀刻机来说是唯一的。但是这个因子在实验中试很难改变的,所以实验者也许会在一个特定(在理想情况下,是“典型的”)蚀刻机上进行所有的实验,因此该因子保持为常量。 至于允许改变因子允许改变因子,虽然实验单元或设计因子所运用到的“材料”通常不是类似地,但是我们经常忽略掉单元和单元之间的变异,而依靠随机化来抵消材料或实验单元的效应。我们通常假定保持常量因子和允许改变因子的效应相对较小。3、因子、水平和范围的选择、因子、水平和范围的选择 但是,讨厌因子讨厌因子可能有较大的效应。尽管在当前的实验环境中我们对此并不感兴趣,但是必须考虑这种效应。讨厌因子通常分为可控因子可控因子、不可控因子不可控因子和噪声因
37、子噪声因子。可控的讨厌因子是指它的水平可被实验者设置。例如,实验者在进行实验时可以选择原材料的不同批次或者一周中的不同日子。3、因子、水平和范围的选择、因子、水平和范围的选择 前面讨论的区组概念经常用来处理可控的讨厌因子区组概念经常用来处理可控的讨厌因子。如果一个讨厌因子在实验中是不可控的,但是它是可以测量的,那么采用一个被称为协方差分析协方差分析的分析过程来补偿它的效应。例如,过程环境的相对湿度影响过程的性能,如果湿度不能控制,那么它有可能被测量且被视为协变量。若因子在过程中自然变化且不可控制,但基于实验的目的而言它是可控的,则称此因子为噪声因子。在这种情况下,我们的目标通常是寻找可控实验因
38、子的设置,以最小化噪声因子引起的变异性。有时称之为过程稳健性研究过程稳健性研究或稳健设计问题。 区组、协方差分析和过程稳健性研究在后续章节继续讨论。3、因子、水平和范围的选择、因子、水平和范围的选择 一旦实验者选择了设计因子,他必须选择这些因子变化的因子变化的范围及其特定水平范围及其特定水平,还必须考虑如何将这些因子控制在所希望的数值上以及如何测量这些数值。例如,在浸流焊接实验中,工程师已经确定了12个可能影响出现焊接次品的变量。实验人员还必须确定每个变量的范围(即每个因子未来可能变化的范围)以及每个变量使用多少个水平。要做到这一点,就需要一定的过程知识。这种过程知识通常这种过程知识通常是实践
39、经验和理论理解得结合是实践经验和理论理解得结合。能够研究所有的重要因子能够研究所有的重要因子而不受过去经验的过分影响(特别是在实验的早期阶段或而不受过去经验的过分影响(特别是在实验的早期阶段或过程远未成熟时)是很重要的。过程远未成熟时)是很重要的。3、因子、水平和范围的选择、因子、水平和范围的选择 当实验目的是因子筛选或过程刻画时,通常应选择较少的因子水平数。一般地,在因子筛选研究中两个水平是较好的。选择感兴趣的范围也是重要的。在因子筛选中,范围必须相对地大,即因子变化范围应该较宽。 当我们对哪些变量重要和哪些水平能产生最佳效果认识得更多的时候,感兴趣的范围通常就会变得窄一些。3、因子、水平和
40、范围的选择、因子、水平和范围的选择3、因子、水平和范围的选择、因子、水平和范围的选择实验前计划实验前计划 从第1步到第3步所有的观点和过程信息是非常重要的。我们把这归诸于实验前计划实验前计划。在许多情况下,一个人不可能拥有所需的全部知识来把这类事情做得充分好。因此,我们强烈呼吁在计划实验过程中的团队效应团队效应。 成功的关键大多取决于实验前计划的好坏。成功的关键大多取决于实验前计划的好坏。4、实验设计的选择、实验设计的选择4、实验设计的选择、实验设计的选择 如果正确的做了前面的实验前计划活动,这一步就相对容易些。设计的选择涉及考虑样本量(重复次数),选择合适的实验次序,确定是否划分区组或者是否
41、设计其他随机化限制。本书讨论一些较重要的实验设计类型。对于大多数问题来说,你都可以从中选择到合适的实验设计类型。 在实验设计的这个阶段,有许多交互式的统计软件包交互式的统计软件包支持。(如minitab等)实验者可以输入包括因子数、水平和范围的信息,这些程序将会给出一个可供考虑的设计选择或推荐一个特定的设计。这些程序通常也会提供一个工作表(带已随机化的试验次序)用于指导实验的进行。 在选择设计时,时刻记着实验的目的是很重要的时刻记着实验的目的是很重要的,在很多工程实验中,我们已经知道,有些因子水平会使响应得出不同的数值。因此,我们想要识别是哪些因子引起差异并估计响应改变量的大小。在其他情况下,
42、我们会更注意验证一致性。例如,比较两种生产条件A和B,A是标准的,B是成本效益更好的。实验者可能会想弄清楚这两种生产条件的产率是否没有差异。5、进行实验、进行实验5、进行实验、进行实验 进行实验时,需要仔细监控实验的过程以确保每件事情都按计划做完。在这个阶段,实验程序中的错误通常会破坏实验的有效性。而预先计划是成功的关键预先计划是成功的关键。在复杂的制造或研究开发环境中实施已设计好的实验,人们很容易低估物流方面和计划方面的问题 Coleman and Montgomery(1993)认为进行实验前,做少数试验或尝试性试验尝试性试验通常是有帮助的,这些试验提供了关于实验材料一致性的信息关于实验材
43、料一致性的信息,使你能够检查测量系统检查测量系统,对实验误差有一个粗略估计,以及有机会实践全部的实验技实践全部的实验技术术。如果必要,可以借此机会重新审视在第14步中所作的决定。6、数据的统计分析、数据的统计分析6、数据的统计分析、数据的统计分析 分析数据应该用统计方法,以便结果和结论都是客观的,而不是主观臆断的。如果实验设计正确,并且按设计执行了,则所需的统计方法不必去费心准备。因为有限多优秀的软件包可用来分析数据,许多用在第4步中去选择设计的程序提供了无缝的、直接的界面进行统计分析。 在数据的分析和解释中,简单的图解法图解法起着重要的作用。因为实验者想回答的许多问题可以纳入假设检验的框架,
44、所以假设检验和置信区间估计程序非常有助于分析已设计好了的实验的数据。它通常也有助于根据经验模型来给出许多实验的结果。经验模型经验模型是指从数据中推导出的等式,它表达了响应和重要设计因子之间的关系。残差分析残差分析和模模型适合性检测型适合性检测也是重要的分析方法。6、数据的统计分析、数据的统计分析 统计方法并不能证明一个因子(或几个因子)有特殊的效统计方法并不能证明一个因子(或几个因子)有特殊的效应。它们仅对实验结果的可靠性和有效性提供准则。应。它们仅对实验结果的可靠性和有效性提供准则。只要统计方法应当得当。虽然我们不能用实验来证明任何事情,但是却可以用它们度量结论中可能出现的误差或者对一个命题
45、附加上置信水平。统计方法的主要优点是它对决策过统计方法的主要优点是它对决策过程加进了客观性。程加进了客观性。统计方法和良好的工程知识(或过程知识)以及常识相结合通常有助于人们得出正确的结论。7、结论和建议、结论和建议7、结论和建议、结论和建议 分析过数据之后,实验者必须作出有关实验结果的真实结论,并推荐一种处理方法。这时候,图解法图解法常常比较有用,特别是在给别人介绍成果时更是如此。另外,还需要进行跟踪试验跟踪试验与确认试验确认试验以证实实验结论的正确性。 通贯整个过程,要牢记实验是学习过程的一个重要部分实验是学习过程的一个重要部分,在学习过程中,我们暂时提出了关于系统的假设,进行实验来研究这
46、些假设,根据实验的结果再提出新的假设,如此等等。这表明,实验是迭代式迭代式地逐步深化的。 通常一种错误的做法,是在研究一开始,就去设计一个单一、庞大和内容广泛的实验。一个成功的实验需要先弄清其中的重要因子,这些因子可能变化的整个范围,使用合适的水平个数,以及度量这些变量的合适单位。一般来说,我们不可能完全知道这些问题的答案。但是,当我们不断实验下去就会获得对于它们更多的认识。随着实验的进展,我们经常会抛弃一些输入变量,而加入一些其他变量,改变某些因子的研究范围,或者加进新的响应变量。因此,我们通常序贯地进行实验序贯地进行实验。小结:在实验中使用统计方法小结:在实验中使用统计方法 在工程系、科学
47、和工业中,大多数的研究工作都是以经验为根据的,并且广泛使用实验方法。统计方法能够大大提高这些实验的效率,并经常强化得出的结论。在实验中恰当地使用统计方法就要求实验者牢记下列几点。1 1、利用你对问题非统计知识的了解、利用你对问题非统计知识的了解 实验者通常精通于他们自己的专业。例如,专门研究水文学问题的工程师在这一领域内一般都有着丰富的实践经验和正规的科学训练。在某些领域,有一大堆的物理学理论用来论述因子和响应之间的关系。这类非统计学方面的知识,在选择因子、确定因子水平、决定进行多少次重复、解释分析结果等方面是极有价值的。仅仅使用实验设计是无法替代这里应该考虑的问题的。小结:在实验中使用统计方
48、法小结:在实验中使用统计方法2、使设计和分析尽可能地简单、使设计和分析尽可能地简单 不要过分热心于使用复杂的、过于精致的统计方法。相对简单的设计和分析方法往往是最好的。此处我们重新强调1.4节中所推荐的步骤13.如果你实验前计划做的很仔细并且选择了正确的设计,那么分析方法相对来说往往是直截了当的。事实上,一个设计完美的实验有时几乎是自我分析!但是,如果你做出的实验前计划很马虎,并且执行的实验设计又很差,那么即使是用最复杂、最精巧的统计方法,也无可救药。小结:在实验中使用统计方法小结:在实验中使用统计方法3、识别实际的显著性和统计的显著性之间的差别、识别实际的显著性和统计的显著性之间的差别 仅仅因为两种实验条件产生统计上不同的平均响应,还不能保证这一差别大得足以有实际价值。例如,以为工程师可以确定一种汽车燃料喷射系统的修正方法能够确实改进汽车汽油行驶的里程数,平均为0.1英里/加仑,这是一个在统计学上有意义的结果。但是,如果修正方法耗费1000美元,则0.1英里/加仑的差别可能就太小了,没有任何实际价值。小结:在实验中使用统计方法小结:在实验中使用统计方法4、实验通常是迭代
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB31/T 534-2011通信网络运营环节的节能要求
- DB31/T 1282-2021车用气瓶氢气充装安全技术条件
- DB31/T 1184-2019特种设备隐患分类分级导则
- DB31/ 842-2014微电子元件制造业职业病危害控制规范
- DB31/ 731-2020船舶修正总吨单位产品能源消耗限额
- DB31/ 565-2013中小学课业簿册安全卫生与质量要求
- DB31/ 48-2012啤酒单位产品能源消耗限额
- 金属制品在工业中的智能制造资源优化策略设计优化考核试卷
- 初三中考前80天动员会上校长发言只有化紧张为动力变悔恨为拼搏让刻苦的学习把消极的情绪彻底淹没你才有可能笑对中考
- 2025年中国变形玩具行业市场前景预测及投资价值评估分析报告
- 店面出让股权协议书
- 深圳2025年深圳市住房公积金管理中心员额人员招聘8人笔试历年参考题库附带答案详解
- 英文电影鉴赏知到智慧树期末考试答案题库2025年北华大学
- 美容诊所合作协议书
- 2025年人教版小学一年级下学期奥林匹克数学竞赛试卷(附答案解析)
- 2025年滁州市轨道交通运营有限公司第二批次招聘31人笔试参考题库附带答案详解
- 2025年高考英语考前热点话题押题卷(新高考Ⅰ卷)-2025年高考英语模拟考试(解析版)
- 浙江国企笔试题目及答案
- 电力现场安全管理课件
- 分子生物学技术在检验中的应用试题及答案
- 中考语文专题一非连续性文本阅读市公开课一等奖市赛课获奖课件
评论
0/150
提交评论