六西格玛教材40-22ppt课件_第1页
六西格玛教材40-22ppt课件_第2页
六西格玛教材40-22ppt课件_第3页
六西格玛教材40-22ppt课件_第4页
六西格玛教材40-22ppt课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分析分析(Analyze)阶段阶段Step 8- Data 分析分析Step 9- Vital Few X的的选选定定q Multi Variq Central limitq Hypothesis testingq Confidence intervalq ANOVA, T-testq Chi-squareq Correlation,regressionStep 7- Data 搜集搜集路径位置路径位置目 录q ANOVA(方差分析)的概念q One way ANOVA的概念 q ANOVA的原理 q 应用MINITABq 实习 弹射器q 再多想一想q 简要及 附录ANOVA的概念(1) -

2、ANOVA是什么?q 在什在什么么情情况况下使用下使用? ? q 当当有有3 3个个以上水平以上水平时检验时检验均均值值差差异异. .q One way ANOVAOne way ANOVAq 当当有有2 2个个以上因子以上因子时检验时检验均均值值的差的差异异. .q Two, Three way ANOVATwo, Three way ANOVAq 用什用什么么原理分析原理分析? ?q 把所有把所有实验结实验结果的方差果的方差, ,对对几几个个因子的方差和其他因子的方差和其他误误差差的方差的方差来区来区分分, ,并并分析均分析均值值的差的差异异的方法的方法q 利用利用“ “总总方差方差 =

3、= 因子效果的方差因子效果的方差 + + 误误差方差差方差” ”X X数据数据有有1 1个个X X变变量量有多个有多个 X X 变量变量 Y Y 数据数据有有1 1个个 Y Y 变变量量 有多个有多个 Y Y变量变量 X DataX Data连续型连续型Y DataY Data连续型连续型X DataX Data连续型连续型Y DataY Data连续型连续型Chi-SquareChi-SquareRegressionRegressionMultipleMultipleRegressionRegressionMedians TestsMedians Tests2, 3, 4 way.2, 3,

4、 4 way.ANOVAANOVAANOVA的概念(2) - 包含在哪里?当当X X是离散型或连续型是离散型或连续型, Y, Y是连续型变量时使用是连续型变量时使用. . 是对是对“均值是否相等的检验方法均值是否相等的检验方法 ANOVA的概念(3) 路径分析包含包含3 3个以上水平个以上水平X X变量的变量的均值比较均值比较稳定性稳定性分布的形态分布的形态分布分布(Spread)(Spread)中心的位置中心的位置 (Centering)(Centering)ANOVAANOVA包含包含2 2个水平的个水平的X X变量均变量均值比较值比较稳定性稳定性分布的形态分布的形态分布分布(Spread

5、)(Spread)中心的位置中心的位置 (Centering)(Centering)包含包含1 1个水平的个水平的X X变量变量均值比较均值比较稳定性研究稳定性研究( (必要时必要时) )分布的形态分布的形态分布分布中心的中心的 位置位置OROR2sample2samplet testt test1sample1samplet testt testONE WAY ANOVA的概念(1) 概要q我们要观察的一个 input 变量(因子)有多个样本时, 我们实际上在实施 单因子实验 (Single Factor Experiment).q我们要分析对象的 因子是否有水平间的差异q确定3个供应商的平

6、均交货期是否有差异q确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同q现在开始做第一次实验!q观察.ONE ANOVA的概念(2) 例题o考虑如下情景:一个产品开发工程师要研究某个电阻焊考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中接系统中5 5种不同的电流设置对焊接强度的影响种不同的电流设置对焊接强度的影响 o她要研究的电流范围为她要研究的电流范围为15-1915-19安培。她将调查安培。她将调查5 5个水平的个水平的输入变量因子):输入变量因子): 15A, 16A, 17A, 18A 15A, 16A, 17A, 18A 和和 19A 19A。她。她将对每个水平进行将

7、对每个水平进行5 5次实验次实验 o输出输出: : 焊接强度焊接强度o输入输入: : 电流电流o这是一个具有这是一个具有5 5个水平的单因子实验电流)个水平的单因子实验电流)o该实验的结果参考下页该实验的结果参考下页. . One ANOVAOne ANOVA的概念的概念(3) (3) 例题例题存在电流对焊接强度的影响吗? 对于这个设备使用哪个电流,你的结论是什么?为什么?对于这个设备使用哪个电流,你的结论是什么?为什么? 191817161522201816141210电电 流流平平均均值值强强 度度 主主 效效 应应 图图数 据 平 均 值输入结果输入结果DATA的的 design mat

8、rix同下同下.实习实习: 打开窗口打开窗口 Mont52.mtw 制作各列数据的点图制作各列数据的点图.使用对所有变量相同的格式使用对所有变量相同的格式 (SCALE)!ONE ANOVA的概念(3) 例题2 42 11 81 51 291 51 61 71 81 9强强 度度电电流流强强 度度 的的 点点 图图各均值的各均值的 95% 置信区间置信区间(CI)如下如下.数据堆叠后数据堆叠后 统计统计方差分析方差分析区间图区间图对电流和焊接强度的关系做什么结论对电流和焊接强度的关系做什么结论?这结论的置信度是怎样这结论的置信度是怎样?ONE WAY ANOVA的概念(3) 例题1918171

9、615252015105电电 流流强强度度强强 度度 的的 区区 间间 图图平 均 值 的 95% 置 信 区 间25201510StrengthDotplot for Strength25201510Dotplot for 15-191516171819设定假设!One ANOVAOne ANOVA的概念的概念(4) (4) 假设假设Ha: 至少有一至少有一个水平产生不个水平产生不同过程同过程 H0: 数据只描数据只描述一个过程的述一个过程的自然散布自然散布 你认为答案是什么?为什么?你认为答案是什么?为什么? One ANOVAOne ANOVA的概念的概念(5) (5) 假设假设此设计的

10、数学模型是: l Ho 假设处理项是零假设处理项是零 数学模型假设数学模型假设 常规假设常规假设 0 :Ha0 = s :Hok至少一个不同至少一个 :Ha :Hok4321Yti = +t+ti其中其中: yti=来来自自处处理理t的的单个响应单个响应 =总总平均平均值值 t=处处理理tti=随随机机误误差差ONE ANOVA的概念(6) 变量选定*输入变量作为一个因子。输入变量作为一个因子。* 在单因子设计中,因子被当作特征变量处理,即使它在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。可能是间隔值或比率。 *如果因子自然为连续型的,可以把它分类成子群。如果因子自然为连续

11、型的,可以把它分类成子群。* - - 例如,我可以采用低和高来度量生产线的压力值。例如,我可以采用低和高来度量生产线的压力值。* - - 我们可以作中值分离我们可以作中值分离(Median Split)(Median Split)来把因子分成来把因子分成两个水平:低和高。两个水平:低和高。* - - 对于我们的例子,因为电流是连续型变量,我们把对于我们的例子,因为电流是连续型变量,我们把它分成它分成5 5个等级。个等级。*输出一般以间隔值或比率范围来度量合格率,温度,电输出一般以间隔值或比率范围来度量合格率,温度,电压,等等输出变量可以是分离型或间隔压,等等输出变量可以是分离型或间隔/ /比率

12、变量比率变量 ANOVA的原理 (1) 总变动q 因子因子A A的水平是的水平是I I个个, ,各水平的反复数都是各水平的反复数都是m m次次, ,则数据矩阵则数据矩阵q 排列成下面的样子排列成下面的样子因子的水平A1 A2 A3 A4 A5 A6 Al实验的反复x11 x21 x31 x41 x51 x61 xl1x12 x22 x32 x42 x52 x62 xl2 x13 x23 x33 x43 x53 x63 xl3 x14 x24 x34 x44 x54 x64 xl4 x15 x25 x35 x45 x55 x65 xl5x1m x2m x3m x4m x5m x6m xlm合计T

13、1 T2 T3 T4 T5 T6 TlT均值x1 x2 x3 x4 x5 x6 xlxq 总总均均值值 是用右是用右边边的公式求的公式求. . nTlmTxq 利用各利用各个个DATA DATA 和和总总均均值值 把把总总均均值值 分解分解为两个为两个, ,q同下表示同下表示. .q 左左边边和右和右边边平方平方时时同下同下. .ijxx)()()(xxxxxxiiijijxxxxxxxxxxilimjiijlimjilimjiijlimjij111121121122ANOVA的原理 (2) 总变动xxq 上面的第三上面的第三项变为项变为如下如下. . liilimjiijiilimjiijx

14、xxxxxxxxx1111100limjilimjiijlimjijxxxxxx112112112SS(total) SS(error) SS(factor)q 同同样样第第8 8页页式式从写从写如下如下, ,这这意意义义的略的略写写SS(Sum of SS(Sum of Squares)Squares)来来表示表示. .ANOVA的原理 (3) 总变动SS(total)SS(total)的自由度的自由度 是是, , T1lmSS(factor)SS(factor)的自由度的自由度 是是, , A1lSS(error)SS(error)的自由度的自由度 是是, , Ellm因而因而 EATAN

15、OVA的原理 (4) 自由度在一个系统中不影响其他变量能够独立移动的数在一个系统中不影响其他变量能够独立移动的数Ex) aEx) a* *b b* *c = 4 c = 4 这式中变量的自由度是这式中变量的自由度是 2 . 2 . 假设假设 a,b a,b定为定为 1,2, c 1,2, c必须是必须是 2 . 2 . 即能够自然的移动的变量。即能够自然的移动的变量。q 自由度是?q 自由度的自由度的计计算算因子(factor)平方和(Sum of Squares)自由度(Degree of Freedom)均值平方(Mean Square)F值AErrorTotalijiAxxSS2limj

16、ijTxxSS1121lmT) 1(mlE1lAAAASMSEEESMSEAMSMSF 0limjijExxSS112ANOVA的原理 (5) 方差分析表q 方差分析表的制作q 对错误的均值平方因子,利用A的均值平方的大小q 观察 A效果的大小.q F越大 A效果越大. ( 利用F 分布确认 P-value)ANOVA的原理 (6) F分布q F F分布的参考分布的参考q 自由度 k1,k2的变量的 F值的 F(k1,k2:)按 的大小 占有面积(发生概率). (显著水平)F(k1,k2)F(k1,k2: )F-分布分布 65432100.70.60.50.40.30.20.10.0Score

17、sProb10%1%5%q Exercise Exercise某个 coating 工程认为 反应温度对生产的 产品的强度有影响, 所以对反应温度变化强度有什么变化, 还有温度在什么水平时强度最好,进行了实验. 反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理. 这结果同下表. 制作方差分析表(ANOVA table) . (参考Excel sheet.)200度210度220度230度8.448.599.348.928.368.919.418.928.288.609.698.74合计平均实验反复ANOVA的原理 (7) 例题因子(factor)平方和(Sum of Squar

18、es)自由度(Degree of Freedom)均值平方(Mean Square)F值AErrorTotalq ANOVA table ANOVA tableANOVA的原理 (8) 例题F F分布表中分布表中 F F是是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 .(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 .那么那么 A A是显著水平是显著水平 1% 1%中是否采用零假设中是否采用零假设? ?还是推翻还是推翻? - ? - 要推翻要推翻. .ANOVA的原理 (9) 统计的假定g输出的总体方差在给定因子所有水平上都相等方差均一性输出

19、的总体方差在给定因子所有水平上都相等方差均一性 Test for Test for Equal Variance Equal Variance )。)。g 我们可以用统计我们可以用统计 方差分析方差分析 等方差检验程序来检验这个假设。等方差检验程序来检验这个假设。 g响应均值是独立的,并服从正态分布。响应均值是独立的,并服从正态分布。g - - 如果使用随机化和适当的样本数,这个假设一般有效。如果使用随机化和适当的样本数,这个假设一般有效。 g - - 警告警告: :在化学过程中在化学过程中, ,均值相关的风险很高均值相关的风险很高, ,应永远考虑随机化。应永远考虑随机化。 g残差数学模型的误

20、差是独立的,其分布是均值残差数学模型的误差是独立的,其分布是均值=0=0,方差为恒量的正,方差为恒量的正态分布。态分布。q 单一因子实验分析实验结果移动到实验结果移动到 MINITAB Worksheet. MINITAB Worksheet.数据有没有异常点利用管理图进行确认数据有没有异常点利用管理图进行确认. (. (稳定性分析稳定性分析) )利用统计利用统计 方差分析方差分析 等方差检验程序进行等方差检验等方差检验程序进行等方差检验. . 方差同一时实施方差同一时实施(p-value 0.05) ANOVA .(p-value 方差分析方差分析 单因子方差分析单因子方差分析 进行分析进行

21、分析 . .所有的数据在所有的数据在1 1列时列时 (Stacked) : One-way (Stacked) : One-way按水平别数据分几列时按水平别数据分几列时(Unstacked) :(Unstacked) :采用采用 One-way(Unstacked.) . One-way(Unstacked.) . 解释解释F-ratio. F-value F-ratio. F-value 高高 p-value p-value 显著水平时显著水平时( (一般一般 5-10%) 5-10%) 推翻零假设推翻零假设(Ho) . (Ho) . 推翻零假设时推翻零假设时, , 利用统计利用统计 方差

22、分析方差分析 主效应图主效应图 或统计或统计 方差分析方差分析 区间图对区间图对均值差异利用区间图说明均值差异利用区间图说明. . 利用利用Minitab Minitab 的的 Anova Anova 视窗中的视窗中的 残差项目残差项目( (残差残差 Plot) Plot) 对残差实施评价对残差实施评价. . 为测试实际的显著性为测试实际的显著性, ,对有影响的对有影响的 Epsilon-Squared Epsilon-Squared 进行计算进行计算. . 根据分析结果找出方案根据分析结果找出方案. . 应用应用MINITABMINITAB分析分析(1) (1) 分析顺序分析顺序 零假设零假

23、设 (Ho): 3名作业者刷漆厚度相同名作业者刷漆厚度相同. 备择假设备择假设(Ha): 作业者中至少有一名刷的厚度与其他作业者刷的厚作业者中至少有一名刷的厚度与其他作业者刷的厚度不同度不同(或大或小或大或小).应用应用MINITABMINITAB分析分析(1)(1)老板的思考老板的思考是谁刷漆刷的这么厚是谁刷漆刷的这么厚?Bob? Jane? Walt?一定要查找出来一定要查找出来!(显著水平设为显著水平设为 5%)q 设置假设按照下列样式在按照下列样式在MinitabMinitab中输入数据中输入数据翻开翻开ANOVA.MPJ的的 (3 Level ANOVA )worksheetBobJ

24、aneWalt25.296926.005628.426826.057825.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209 .应用MINITAB分析(2) 输入数据1、判信、判信2、判量、判量参考参考章节章节参考参考 章节章节应用应用MINITABMINITAB分析分析(3)(3)稳定性分析稳定性分析目的:确认各水平数据中是否有异常现象逃逸点、不随机等)目的:确认各水平数据中是否有异常现象逃逸点、不随机等). .途径:统计途径:统计- - 控制图参考下图)控制图参考下图)3 3、判异、判异应用

25、应用MINITABMINITAB分析分析(3)(3)稳定性分析稳定性分析输出结果输出结果结论结论 各水平中的数据没发现有异常点各水平中的数据没发现有异常点 可继续往后分析可继续往后分析282522191613107412827262524232221观观 测测 值值单单独独值值_X =24.848UCL=28.032LCL=21.664B Bo ob b 的的单单值值控控制制图图28252219161310741282726252423观观测测值值单单独独值值_X =25.446UCL=28.005LCL=22.887J Ja an ne e 的的单单值值控控制制图图2825221916131

26、074130292827262524观观测测值值单单独独值值_X =27.084UCL=29.990LCL=24.178W Wa al lt t 的的单单值值控控制制图图应用应用MINITABMINITAB分析分析(4)(4)正态性分析正态性分析目的:确认各水平数据是否服从正态分布目的:确认各水平数据是否服从正态分布. .途径:统计途径:统计- - 基本统计量基本统计量 - - 正态检验参考下图)正态检验参考下图)4 4、判形、判形应用应用MINITABMINITAB分析分析(4)(4)正态性分析正态性分析输出结果输出结果结论结论 各水平中的数据都服从正态分布各水平中的数据都服从正态分布 可继

27、续往后分析可继续往后分析2726252423999590807060504030201051B Bo ob b百百分分比比均值24.85标准差0.8693N30AD0.562P 值0.134B Bo ob b 的的 概概 率率 图图正态 282726252423999590807060504030201051J Ja an ne e百百分分比比均值25.45标准差0.9881N30AD0.280P 值0.618J Ja an ne e 的的概概率率图图正态 302928272625999590807060504030201051W Wa al lt t百百分分比比均值27.08标准差0.980

28、6N30AD0.329P 值0.503W Wa al lt t 的的概概率率图图正态 应用应用MINITABMINITAB分析分析(5)(5)等方差检验等方差检验目的:确认各水平数据之间方差是否相等目的:确认各水平数据之间方差是否相等.数据堆栈:途径:数据数据堆栈:途径:数据- 堆叠堆叠 - 堆叠列参考下图)堆叠列参考下图)5 5、判散、判散应用应用MINITABMINITAB分析分析(5)(5)等方差检验等方差检验等方差检验等方差检验 途径:途径: 统计统计- 方差分析方差分析 - 等方差检验等方差检验(参考下图)(参考下图)WaltJaneBob1.51.41.31.21.11.00.90

29、.80.70.6作作业业者者9 95 5% % 标标准准差差 B Bo on nf fe er rr ro on ni i 置置信信区区间间检验统计量0.57P 值0.751检验统计量0.23P 值0.796Bartlett 检验Levene 检验厚厚度度 等等方方差差检检验验P值值大于大于0.05 输出结果输出结果 结论:故结论:故3 3个人所油漆的厚度数据方差相等个人所油漆的厚度数据方差相等应用应用MINITABMINITAB分析分析(5)(5)等方差检验等方差检验应用应用MINITABMINITAB分析分析(6) (6) 均值检验均值检验目的:确认各水平数据集所对应的总体均值是否相等目的

30、:确认各水平数据集所对应的总体均值是否相等. .途径:(堆叠型统计途径:(堆叠型统计- - 方差分析方差分析 - - 单因子单因子(参考左下图)(参考左下图) (非堆叠型统计(非堆叠型统计- - 方差分析方差分析 - - 单因子单因子 (未堆叠存放)(未堆叠存放)6 6、判中、判中应用应用MINITABMINITAB分析分析(6) (6) 均值检验均值检验应用应用MINITABMINITAB分析分析(6) (6) 均值检验均值检验均值检验输出结果均值检验输出结果均值检验结论均值检验结论 各水平数据集所对应的总体之间的均值至少有一个不相等各水平数据集所对应的总体之间的均值至少有一个不相等单单因子

31、方差分析因子方差分析: 厚度厚度 与与 作作业业者者 来来源源 自由度自由度 SS MS F P作作业业者者 2 80.386 40.193 44.76 0.000误误差差 87 78.116 0.898合合计计 89 158.502S = 0.9476 R-Sq = 50.72% R-Sq调调整)整) = 49.58%32322212ssssPooled P 值值小于小于显显著水平著水平 5% 时时, 得到得到至少有一至少有一个总个总体均体均值与值与其他其他总总体体均均值值不同的不同的结论结论. (推翻零假推翻零假设设)这时这时,推翻所有推翻所有总总体均体均值值相同的零相同的零假假设设(Ho

32、 ) - 即至少有一即至少有一个个均均值值不不同同.因因随随机机现现象得到象得到这样这样大的大的F-值值, 实际实际上其上其概概率不足率不足 1/10,000.这与这与抛硬抛硬币时币时, 10次次连续连续相同的相同的情情况况是相同的是相同的.群间方差与群内方差群间方差与群内方差相近时相近时, F值接近值接近1 .本例中本例中, F-值很大值很大.子群大小相同时共有标准差子群大小相同时共有标准差应用应用MINITABMINITAB分析分析(7) (7) 残差分析残差分析 目的:二次检验前面的分析是否有不可信的证据残差有异常现象)目的:二次检验前面的分析是否有不可信的证据残差有异常现象) 途径:途

33、径: 统计统计-方差分析方差分析 - - 单因子单因子点击图形点击图形 - -点四合一点四合一7 7、判差、判差应用应用MINITABMINITAB分析分析(7) (7) 残差分析残差分析 残差输出结果:残差输出结果: 残差分析结论:没有足够的证据证明其残差分析有异常残差分析结论:没有足够的证据证明其残差分析有异常3.01.50.0-1.5-3.099.99990501010.1残残 差差百百分分比比27.026.526.025.525.0210-1-2拟拟 合合 值值残残差差2.41.60.80.0-0.8-1.620151050残残 差差频频率率9080706050403020101210

34、-1-2观观 测测 值值 顺顺 序序残残差差正正 态态 概概 率率 图图与与 拟拟 合合 值值直直 方方 图图与与 顺顺 序序厚厚 度度 残残 差差 图图主效果图、箱图及区间图应用应用MINITABMINITAB分析分析(8) Plots(8) Plots8、附图、附图主效果图及 箱图应用应用MINITABMINITAB分析分析(8) Plots(8) Plots统计统计方差分析方差分析主效主效应图应图图图形形箱箱线图线图WaltJaneBob27.026.526.025.525.0作作业业者者平平均均值值厚厚度度 主主效效应应图图数据平均值WaltJaneBob29282726252423作

35、作业业者者厚厚度度厚厚度度 的的箱箱线线图图Interval Plot (95% 置信置信区间区间)区间图区间图应用应用MINITABMINITAB分析分析(8) Plots(8) PlotsWaltJaneBob27.527.026.526.025.525.024.5作作 业业 者者厚厚度度厚厚 度度 的的 区区 间间 图图平 均 值 的 95% 置 信 区 间应用MINITAB分析(9) SQUAREDqEpsilon-SquaredEpsilon-Squared虽虽然是一然是一个个有有争议争议的的统计统计量量, , 但其但其结结果提供果提供实实质质性的性的显显著性情著性情报报. . qEpsilon-Squared Epsilon-Squared 根据适根据适当当的的 input input变变量量说说明的明的 output output变变量的量的大小大小. .q该统计该统计量很容易量很容易计计算算. .q这值这值是是 Sum-of-Squares (Effect)/Sum-of-Squares (Total) . Sum-of-Squares (Effect)/Sum-of-Squares (Total) .q在采取措施以前在采取措施以前应经应经常要确常要确认这值认这值. . 280 386158 5020 5072 SSSSBGTotal.厚度的变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论