版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、DOE(实验设计),Cherry 2018.09.15,Contents,目录,01,假设检验,02,DOE实验设计,01,假设检验,1.1假设检验的原理及方法,1.2假设检验的基本步骤,1,原假设H0 :=2000kg; 备择假设H1: 2000kg;,在假设H0是成立的条件下,与大概率事件相比,小概率事件在一次试验中几乎不会发生,如果发生,则H0成立是不正确的,拒绝H0。,2,1.1假设检验的基本原理及方法,Question:配方药物的疗效是否比原配方药物疗效好?采取措施后合格率是否提高? Answer :先把某个结论当成一种假设,根据样品的观察值的情况,运用统计分析的方法对假设进行检验,
2、并做出判断。 Example:生产线的钢筋平均抗拉强度为2000kg,标准差为300kg,调整参数后,希望钢筋平均抗拉强度有所提高。项目团队实施改进后抽取了25批钢筋,测得平均抗拉强度为2150kg,问:能否断言平均抗拉强度有提高?,先假定H0为真,若经过分析结果与H0矛盾,拒绝H0。,1.2假设检验的基本步骤,5,4,3,2,1,建立假设 H0 := 0,H1: 0(单边假设) H0 := 0,H1: 0(单边假设) H0 := 0,H1: 0(双边假设),根据样本观察值,计算检验统计量的值并进行判断,给出临界值,确定拒绝域,给出检验中的显著性水平,选择检验统计量,确定拒绝域的形式,步骤,1
3、.2.1建立假设,假设检验根据实际的需要可以分为 : 双侧检验(双尾): 指只强调差异而不强调方向性的检验。 单侧检验(单尾):强调某一方向性的检验。 左侧检验 右侧检验,1.2.2选择检验统计量,确定拒绝域的形式,01,总体均值进行检验,用样本均值引出检验统计量,正态总体的方差进行检验,用样本方差引出检验统计量,02,根据检验统计量的值,我们把整个样本空间分成两部分:拒绝域W与接受域A,确定单边和双边,确定临界值C,允许犯第一类错误的概率确定,1.2.3给出检验中的显著性水平,假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。 两类错误:
4、 错误(I型错误): H0为真时却被拒绝,弃真错误; 错误(II型错误): H0为假时却被接受,取伪错误。 假设检验中各种可能结果的概率:,总体情况,判断结论,1.2.4给出临界值,确定拒绝域,有了显著性水平 后,可以根据给定的检验统计量的分布,计算或查表得到临界值,从而确定具体的拒绝域。,1.2.5根据样本观察值,计算检验统计量的值并进行判断,计算出检验统计量的观测值,将它与临界值进行比较当它落在拒绝域中就作出拒绝原假设的结论,否则就作出无法拒绝原假设的结论。,计算总体参数的置信区间,然后看置信区间是否包含了原假设值,如果原假设值未被包含在内,则拒绝原假设,反之,则不能拒绝原假设。,p 值:
5、指的就是当原假设Ho 成立时,出现目前状况的概率。 P0.05,拒绝原假设,接受备择假设。反之,不能拒绝原假设Ho 。,计算检验统计量的值并进行判断,P值比较法,临界值法,置信区间法,生产线的钢筋平均抗拉强度为2000kg,标准差为300kg,调整参数后,希望钢筋平均抗拉强度有所提高。项目团队实施改进后抽取了25批钢筋,测得平均抗拉强度为2150kg,问:能否断言平均抗拉强度有提高?,举例子,解:设立原假设和备择假设 H0=2000kg;H12000kg; 方法1:计算统计量: Z=(2150-2000)/(300/25)=2.50 Z1.645(查表得知拒绝域),故拒绝H0; 方法2:用mi
6、nitab软件,计算P为0.006,小于 0.05,则拒绝H0; 方法3:置信区间:在本题中,样本均值为2150,总体均值可能稍大或稍小些,但我们可以有95%置信下限,总体均值上限是无穷的,因为原假设的均值2000比2051.3还小,并未落入此置信区间内,拒绝原假设。,02,DOE,2.1 DOE介绍,2.2 单因子设计,DOE:即实验设计(Design of Experimental)-是对实验方案进行优化设计、以降低实验误差和生产费用,减少实验工作量并对实验结果进行科学分析的一种科学研究方法;是一种藉用实验的手段来决定最佳设计或生产的方法。 Doe目的:分析出“哪些自变量X显着地影响着Y,
7、这些自变量X取什么值时将会使Y达到最佳值”。,2.1 DOE的定义,2.2.1基本术语响应Y,过程,x1,x2,x3,u1,u2,y1,y2,y3,我们假定过程的结果当中,y1,y2,y3是我们关心的输出变量,这些我们常常称之为响应(response),2.2.1基本术语可控因子 X,我们将影响响应的那些变量称为实验问题中的因子。其中x1,x2,x3是人们在实验中可以控制的因子,我们称为可控因子(controlled factor),过程,x1,x2,x3,u1,u2,y1,y2,y3,可控因子是输入变量,是影响过程最终结果的,2.2.1基本术语不可控因子u,在影响过程和结果的因子中除了控制因
8、子还包括一些不可控因子(uncontrolled factor):u1,u2,他们通常包括环境、操作员、材料批次等,对于这些变量我们通常很难把它们控制在某个精确值上,常把它们当作试验误差来处理。,过程,x1,x2,x3,u1,u2,y1,y2,y3,不可控因子-噪音U,2.2.1基本术语:模型与误差,模型与误差:在试验设计中建立的数学模型是Y = f(X1,X2, ,Xk) + f:是某个确定的函数关系,为试验误差。希望找到使响应变量Y达到最优的条件。工作中常有三种不同特性要求: 望目特性:此特性具有一特定的目标值(愈近目标值愈好),例如尺寸、换档压力、 间隙、粘度等。 望小特性:目标的极端值
9、是(值愈小愈好),例如磨耗、收缩、劣化、杂音水准等 望大特性:目标值为无限大(值愈大愈好),例如强度、寿命、燃料效率等。,2.2.1基本术语水平和处理,为了研究因子对响应的影响,需要用到因子的两个或者更多不同的取值,这些取值称为因子的水平(level)。 各因子选定了各自的水平之后,其组合被称为一个处理(treatment)或者一次实验(trail),2.2.1基本术语主效应,举一个例子:在合成氨生产中,考虑两个因子,每个因子2水平,A:温度,低水平,700;高水平:720。B:压力,低水压:1200Pa,高水平:1250Pa,以产量y为响应变量(kg),列表如下:(表1),A(温度),B(压
10、力),表1.可加模型数据表(只有主效应而不考虑交互效应的模型),1.A(低水平)产量平均值(不考虑B因子):(200+230)/2=215kg A(高水平)产量平均值(不考虑B因子):(220+250)/2=235kg 产量由215kg提高到235kg,完全因为A因子,称因子A的主效应为:235-215=20kg 同理计算出B的主效应为:30kg; 2.发现:当B为高压,A的效应:250-230=20kg;当B为低压,A的效应:220-200=20kg 如果以因子A为横轴,以响应变量(产量)为纵坐标,使用Minitab作图,见图1,图1 无交互作用的效应图,从图1可以看出:两条线平行,2.2.
11、1基本术语交互作用,如果数据变成另外一组,见表2,表2.有交互作用的数据表,1.A(低水平)产量平均值(不考虑B因子):(200+230)/2=215kg A(高水平)产量平均值(不考虑B因子):(220+270)/2=245kg 产量由215kg提高到235kg,完全因为A因子,称因子A的主效应为:245-215=30kg 同理计算出B的主效应为:40kg; 2.发现:当B为高压,A的效应:270-230=40kg;当B为低压,A的效应:220-200=20kg 同样在B不同状态下,A因子的效应变化量不同,所以因子A和因子B之间存在交互作用。 如果以因子A为横轴,以响应变量(产量)为纵坐标,
12、使用Minitab作图,见图2,图2 有交互作用的效应图,从图2可以看出:两条线不平行。 定义两个因子间的交互作用为:如果因子A的效应依赖于因子B所处的水平时,则称A与B之间有交互作用。 注意:如果两个因子间存在着显著的交互作用时,应该将主效应和交互效应结合在一起考虑。,对照是比较的基础,对照原则是主要用于比较 实验的一个原则。空白对照、安慰剂对照、实验条件对照、标准对照、历史或中外对照。,2.1.2实验设计原则,2.1.3试验设计的策划与安排,用部分因子设计进行因子的筛选:考虑到影响响应变量的因子个数可能较多(大于或等于5),所以先进行因子的筛选,用全因子试验设计法对因子效应和交互作用进行全
13、面的分析:当因子的个数被筛选到少于等于5 个之后,可以进一步在稍小范围内进行全因子试验设计以获得全部因子效应和交互作用的准确信息,并进一步筛选因子直到因子个数不超过3 个。,用响应曲面方法(RSM) 确定回归关系并求出最优设置:这种方法通常只对望大或望小特性的响应变量特别有效,用稳健参数设计方法(田口设计)寻求望目特性的最优设置:为了寻求望目特性响应的最优解,则最好采用稳健参数设计方法。虽然试验次数比RSM 稍多些,但此种方法很有效。,1.陈述实际问题和实验目的,2.选择“Y”响应变量,3.陈述因子和水平,4.选择DOE,5.实施实验及收集数据,6.分析实验结果,7.结论和计划,通过DOE 想
14、达到什么目的?,Y是什么?计量型?计数型? 如产出率, 作业时间, 清洁度等,如温度(100,150),重量(20,30,40kg),全因子实验, 田口设计, 2K因子实验或响应曲面设计等,收集实验结果的数据,运用Minitab等软件进行实验数据分析,制定改善方案,2.1.4试验设计的基本步骤,必要时重复实验,2.1.4.1选择DOE,设计实验-确定实验设计方法,筛选实验,6以上,部分因子实验,410,全因子实验,15,田口设计,213,DOE 种类,因子数量,选别重要因子,选别重要因子,因子与Y的关系,寻找因子的 最佳条件组合,目的,区分主效果,主效果和 部分交互作用,所有主效果和 交互作用
15、 (线性效果),设计或工序 参数优化,作用,低 现在 工序知识 状态 高,响应曲面实验,23,设定因子的 最佳条件,反应变量的 预测模型 (曲线效果),效果,陈述问题和实验目的,选择“Y”响应变量,陈述因子和水平,选择DOE,实施实验及收集数据,6.分析实验结果,结论和计划,2.1.4.2分析实验结果,1.为整个模型建立方差分析表 统计DOE因子分析因子设计 简化模型(去除不显著的项或平方和影响低的项) 2.进行残值诊断,保证模型适合 统计回归回归 3.研究显著的交互作用(P-值DOE因子因子图 统计方差分析交互作用图 4.研究显著的主效果(P-值DOE因子因子图 统计方差分析交互作用图 5.
16、陈述获得的数学模型Y=f(X),计算%SS的影响和评估实际的重要性,2.1.4.2分析实验结果,进行残差诊断,保证模型适合 四合一图的判断方法: 1)正态概率图:观察残差的正态性检验图:是否符合正态分布. 2)残差与拟合值图:观察残差对于以各自变量为横轴的散点图:是否有弯曲趋势。 3)直方图:观察残差对于以响应变量拟合预测值为横轴的散点图:等方差性,即是否 有“漏斗型”或“喇叭型”。 4)残差与顺序图:观察残差对于以观测值顺序为横轴的散点图:是否随机波动。,需回答的问题: Y是否存在改善迹象? 实验结果是否具有统计显著性? 实验结果是否具有实际显著性? 我们是否需要运行附加实验? 重新验证实验
17、,实验结果能够再现吗? 以后应该如何应用实验结果控制该工程? 总结与计划: 利用所有已知的情报解释实验结果 设定对输出变量的预测模型并决定最佳因子水平 追加实验确认结论 (再现性实验) 没有得到较好的结果应制定对策(必要的话实施追加实验) 将模型转换为真实的流程设置,下结论 对结论和改善方案制作成报告书 提议复制最佳状态,计划下一步实验并将变化制度化。,7.结论和计划,陈述问题和实验目的,选择”Y”响应变量,陈述因子和水平,选择DOE,实施实验及收集数据,分析实验结果,2.1.4.3分析实验结果结论和计划,2.2 单因子试验,比较因子的几个不同设置间是否有显著差异,如果有显著差异,哪个或哪些设
18、置较好; 建立响应变量与自变量间的回归关系(线性、二次或三次多项式); 例子:在焊接工序中希望比较4种不同烘烤时间所得到的拉拔力是否相等。将20个焊件用随机序编号顺序号,再采用随机抽取的方法,让4种时间下各选用5个焊件,获得数据表如下,完全重复:每种条件下进行5次试验; 随机化:每组样品的分配和试验顺序完全随机化; 区组化:如果有不同的型号,要分区组(本例不涉及);,表3 单因子试验设计拉拔力数据表,分析:等方差性检验的P值为0.7980.05,无法拒绝原假设,可以认为四组数据的方差相等。,2.2.1目的一:各条件下的平均值是否有显著差异?-单因子ANOVA 1、验证数据的正态性和等方差性(原假设):,2、进行方差分析,检验各总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论