版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(ANOVA) 主要内容变异方差分析假设检验假设模型ANOVA 模型单因子方差分析(One-Way ANOVA)双因子方差分析(Two-Way ANOVA)多因子方差分析(Multi-Factor ANOVA)变异的类型固有变异由许多不可避免的小因素累积而成的变异通常也叫噪声( noise)特殊变异a) 不适当地调教机器b) 操作错误c) 原材料有缺陷方差分析(ANOVA)方差分析 (ANOVA) 是 R.A. Fisher 在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法。方差分析做法:通过试验,以观察某一种或多种因素的变化,对试验结果的观察数值是否有显著影响,从而选取最优
2、方案。例:在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有显著影响的,哪些因素是不重要的,没有显著影响的。方差分析(ANOVA)试验中考虑的因素只有一个,即只有一个因素在变,其他因素保持不变,这种试验称为单因素方差分析 (One-Way ANOVA)。试验中考虑的因素有两个,这种试验称为双因素方差分析(Two-Way ANOVA)。试验中考虑的因素有 k 个,这种试验称为 k 因素方差分析(k-Way ANOVA)。ANOVA 的应用因素所处的状态,称为水平(Level)。例如,温度是一个因素,可在50, 60, 70三个水
3、平下做试验。ANOVA 可用于估计每个变异来源对总变异的贡献。明确各效应的显著性估计过程中的随机误差或噪声计算方差的成份ANOVA 假设检验H0 :1 = 2 = = r 所有总体均值相等H1 :至少有两个总体的均值不等ANOVA 通过比较组间差和组内差来进行F-检验:如果 ,则拒绝原假设。.ANOVA 假设检验N(1,1)N(2,2)N(3,3)N(4,4)N(groups,between)ANOVA 假设观察值相互独立.各水平的数据服从正态分布,即 因子水平 i N(i,i)各水平的方差相同,即 1 = 2 = = rANOVA 模型固定效应模型 (ANOVA I) 因子水平是指定的相关结
4、论只能对指定的因子水平而言随机效应模型 (ANOVA II) 因子水平是随机抽取的结论对整个处理总体有效混合效应模型 (ANOVA III) 有些因子是固定的,有些因子是随机的ANOVA 模型一个 kWay ANOVA 模型,是指试验中包含有k 个因素.kWay ANOVA I :k 个因素;所有因素效应固定kWay ANOVA II: k 个因素;所有因素效应随机kWay ANOVA III: k 个因素;有些因素效应固定,有些 因素效应随机注意:当 k 大于等于 2 时,还要考虑各因素之间的相互作用(或交互效应)(Interaction).我们要观察的一个 input 变量(因子)有多个样
5、本时, 我们实际上在实施 单因子实验 (Single Factor Experiment).我们要分析对象的 因子是否有水平间的差异确定3个供应商的平均交货期是否有差异确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同现在开始做第一次实验!观察.One way ANOVA的概念(1) 概要One ANOVA的概念(2) 例题考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中5种不同的电流设置对焊接强度的影响 她要研究的电流范围为15-19安培。她将调查5个水平的输入变量(因子): 15A, 16A, 17A, 18A 和 19A。她将对每个水平进行5次实验 输出: 焊接强度输入:
6、 电流这是一个具有5个水平的单因子实验(电流)该实验的结果参考下页. ? ?One ANOVA的概念(3) 例题存在电流对焊接强度的影响吗? 对于这个设备使用哪个电流,你的结论是什么?为什么? 输入结果DATA的 design matrix同下.实习: 打开窗口 Mont52.mtw 制作各列数据的 dotplot .使用对所有变量相同的格式 (SCALE)!One ANOVA的概念(3) 例题各均值的 95% 置信区间(CI)如下.DATA Stack 后 StatANOVAInterval Plot对电流和焊接强度的关系做什么结论?这结论的置信度是怎样?One way ANOVA的概念(3
7、) 例题设定假设!One ANOVA的概念(4) 假设Ha: 至少有一个水平产生不同过程 H0: 数据只描述一个过程的自然散布 你认为答案是什么?为什么? One ANOVA的概念(5) 假设此设计的数学模型是: Ho 假设处理项是零 数学模型假设 常规假设 Yti = +t+ti其中: yti=来自处理t的单个响应 =总平均值 t=处理tti=随机误差One ANOVA的概念(6) 变量选定输入变量作为一个因子。 在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。 如果因子自然为连续型的,可以把它分类成子群。 - 例如,我可以采用低和高来度量生产线的压力值。 - 我们可以作中
8、值分离(Median Split)来把因子分成两个水平:低和高。 - 对于我们的例子,因为电流是连续型变量,我们把它分成5个等级。输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出变量可以是分离型或间隔/比率变量 ANOVA的原理 (1) 总变动 因子A的水平是I个,各水平的反复数都是m次,则数据矩阵 排列成下面的样子 总均值 是用右边的公式求. 利用各个DATA 和总均值 把总均值 分解为两个,同下表示. 左边和右边平方时同下.ANOVA的原理 (2) 总变动 上面的第三项变为如下. SS(total) SS(error) SS(factor) 同样第8页式从写如下,这意义的略
9、写SS(Sum of Squares)来表示.ANOVA的原理 (3) 总变动SS(total)的自由度 是, SS(factor)的自由度 是, SS(error)的自由度 是, 因此 ANOVA的原理 (4) 自由度在一个系统中不影响其他变量能够独立移动的数Ex) a*b*c = 4 这式中变量的自由度是 2 . 假如 a,b定为 1,2, c必须是 2 . 即能够自然的移动的变量。 自由度是? 自由度的计算ANOVA的原理 (5) 方差分析表 方差分析表的制作 对错误的均值平方因子,利用A的均值平方的大小 观察 A效果的大小. F越大 A效果越大. ( 利用F 分布确认 P-value)
10、ANOVA的原理 (6) F分布 F分布的参考 自由度 k1,k2的变量的 F值的 F(k1,k2:)按 的大小 占有面积(发生概率). (显著水平)F(k1,k2)F(k1,k2: )F-分布 65432100.70.60.50.40.30.20.10.0ScoresProb10%1%5% Exercise某个 coating 工程认为 反应温度对生产的 产品的强度有影响, 所以对反应温度变化强度有什么变化, 还有温度在什么水平时强度最好,进行了实验. 反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理. 这结果同下表. 制作方差分析表(ANOVA table) . (参考Ex
11、cel sheet.)ANOVA的原理 (7) 例题 ANOVA tableANOVA的原理 (8) 例题F分布表中 F是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 .那么 A是显著水平 1%中是否采用零假设?还是推翻? - 要推翻.ANOVA的原理 (9) 统计的假定输出的总体方差在给定因子所有水平上都相等(方差均一性( Test for Equal Variance )。 我们可以用Stat ANOVA Test for Equal Variance程序来检验这个假设。 响应均值是独立的,并服从正态分布。 - 如果使用随机化和适当的样本数,这个假设一般有效。 -
12、 警告:在化学过程中,均值相关的风险很高,应永远考虑随机化。 残差(数学模型的误差)是独立的,其分布是均值=0,方差为恒量的正态分布。 单一因子实验分析实验结果移动到 MINITAB Worksheet.数据有没有异常点利用管理图进行确认. (稳定性分析)利用StatANOVATest for Equal Variance 进行等方差检验. 方差同一时实施(p-value ANOVAOne-way 进行分析 .所有的数据在1列时 (Stacked) : One-way按水平别数据分几列时(Unstacked) :采用 One-way(Unstacked.) . 解释F-ratio. F-val
13、ue 高 p-value 显著水平时(一般 5-10%) 推翻零假设(Ho) . 推翻零假设时, 利用StatANOVAMain Effects Plot 或StatANOVAInterval Plot 对均值差异利用区间图说明. 利用Minitab 的 Anova 视窗中的 残差项目(残差 Plot) 对残差实施评价. 为测试实际的显著性,对有影响的 Epsilon-Squared 进行计算. 根据分析结果找出方案. 应用MINITAB分析(1) 分析顺序零假设 (Ho): 3名作业者刷漆厚度相同.备择假设(Ha): 作业者中至少有一名刷的厚度与其他作业者刷的厚度不同(或大或小).应用MIN
14、ITAB分析(1) 老板的思考是谁刷漆刷的这么厚?Bob? Jane? Walt?一定要查找出来!(显著水平设为 5%) 设置假设按照下列样式在Minitab中输入数据打开ANOVA.MPJ的 (3 Level ANOVA )worksheetBobJaneWalt25.296926.005628.426826.057825.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209 .应用MINITAB分析(2) 输入数据1、判信2、判量参考MSA章节参考抽样与样本大小章节应用MINITAB分析(3)
15、稳定性分析目的:确认各水平数据中是否有异常现象(逃逸点、不随机等).路径:Stat- Control Chart(参考下图)3、判异应用MINITAB分析(3) 稳定性分析输出结果结论 各水平中的数据没发现有异常点, 可继续往后分析应用MINITAB分析(4) 正态性分析目的:确认各水平数据是否服从正态分布.路径:Stat- Basic Statistics - Normality Test(参考下图)4、判形应用MINITAB分析(4) 正态性分析输出结果结论 各水平中的数据都服从正态分布, 可继续往后分析应用MINITAB分析(5) 等方差检验目的:确认各水平数据之间方差是否相等.数据堆栈
16、:路径:Data- Stack - Columns(参考下图)5、判散应用MINITAB分析(5) 等方差检验等方差检验 路径: Stat- ANOVA - Test for Equal Variances(参考下图)P值大于0.05 输出结果 结论:故3个人所油漆的厚度数据方差相等应用MINITAB分析(5) 等方差检验应用MINITAB分析(6) 均值检验目的:确认各水平数据集所对应的总体均值是否相等.路径:(堆栈型)Stat- ANOVA - One-Way(参考左下图) (非堆栈型)Stat- ANOVA - One-Way(Unstacked)6、判中应用MINITAB分析(6) 均
17、值检验应用MINITAB分析(6) 均值检验均值检验输出结果均值检验结论 各水平数据集所对应的总体之间的均值至少有一个不相等One-way ANOVA: Bob, Jane, Walt Source DF SS MS F PFactor 2 80.386 40.193 44.76 0.000Error 87 78.116 0.898Total 89 158.502S = 0.9476 R-Sq = 50.72% R-Sq(adj) = 49.58%32322212ssssPooled+= P 值小于显著水平 5% 时, 得到至少有一个总体均值与其他总体均值不同的结论. (推翻零假设)这时,推翻
18、所有总体均值相同的零假设(Ho ) - 即至少有一个均值不同.因随机现象得到这样大的F-值, 实际上其概率不足 1/10,000.这与抛硬币时, 10次连续相同的情况是相同的.群间方差与群内方差相近时, F值接近1 .本例中, F-值很大.子群大小相同时共有标准差应用MINITAB分析(7) 残差分析 目的:二次检验前面的分析是否有不可信的证据(残差有异常现象) 路径: Stat- ANOVA - One-Way点击Graph -点Four in one7、判差应用MINITAB分析(7) 残差分析 残差输出结果: 残差分析结论:没有足够的证据证明其残差分析有异常主效果图、箱图及区间图应用MINITAB分析(8) Plots8、附图主效果图及 箱图应用MINITAB分析(8) PlotsStatANOVAMain Effects Plot选择GraphBoxplotInterval Plot(95% 置信区间)区间图应用MINITAB分析(8) PlotsEpsilon-Squared虽然是一个有争议的统计量, 但其结果提供实质性的显著性情报. Epsilon-Squared 根据适当的 input
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手术钳产业链招商引资的调研报告
- 天然气开采行业营销策略方案
- 电翻转烤肉器市场分析及投资价值研究报告
- 定天镜产业链招商引资的调研报告
- 关节用矫形绷带产品供应链分析
- 五四制人教版道德与法治三年级下册《第三单元 我们的公共生活》大单元整体教学设计2022课标
- 学习制定财务紧急计划
- 女性发展社团能力提升计划
- 舞蹈培训与演出协议三篇
- 优化工作流程的创新思维计划
- 2024山东济南轨道交通集团限公司招聘49人高频难、易错点500题模拟试题附带答案详解
- “数字三品”应用场景典型案例申报书
- 5.2 城镇与乡村(教学设计)七年级地理上册同步高效备课课件(人教版2024)
- 一 我有一个梦想(教学设计)2023-2024学年道德与法治(学生读本)低年级
- 2024-2030年中国乳化剂行业市场调研及发展策略研究报告
- 2024秋三年级语文上册第二次月考达标检测卷第三四单元新人教版
- 2024年保安员理论考试题库及答案(考点梳理)
- 深圳民政局离婚协议书模板
- 新高考背景下2025届高考物理一轮复习策略
- 2024-2030年中国玻尿酸行业竞争策略与消费动态分析报告
- 2024年下半年辽宁事业单位高频500题难、易错点模拟试题附带答案详解
评论
0/150
提交评论