




已阅读5页,还剩77页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 方差分析及方差检验 2 1 理解方差分析的概念2 知道方差分析解决什么样的问题3 掌握单因素和多因素方差分析的原理4 会利用Minitab对实际问题进行方差分析5 能够对方差分析的结果作出解释 学习目标 3 4 方差是描述变异的一种指标 也就是对变异的分析 是对总变异进行分析 看总变异是由哪些部分组成的 这些部分间的关系如何 5 方差分析 ANOVA analysisofvariance 能够解决多个均值是否相等的检验问题 方差分析是要检验各个水平的均值是否相等 采用的方法是比较各水平的方差 方差分析 6 7 某汽车厂商要研究影响A品牌汽车销量的因素 该品牌汽车有四种颜色 分别是黑色 红色 黄色 银色 这四种颜色的配置 价格 款式等其他可能影响销售量的因素全部相同 从市场容量相仿的四个中等城市收集了一段时期内的销售数据 见下表 A品牌汽车在四个城市的销售情况 单位 辆 方差分析 8 方差分析 9 怎样得到F统计量 10 水平间 也称组间 方差和水平内 也称组内 方差之比是一个统计量 实践证明这个统计量遵从一个特定的分布 数理统计上把这个分布称为F分布 即 F 组间方差 组内方差 注意 组间方差 SSB 组内方差 SSw 总方差 SST 怎样得到F统计量 11 F分布的特征 从F分布的式子看出 F分布的形状由分母和分子两个变量的自由度确定 因此F分布有两个参数 F分布的曲线为偏态形式 它的尾端以横轴为渐近线趋于无穷 自由度 30 100 12 所取样本在总体或过程中具有代表性 各样本是相互独立的随机样本过程是稳定的 流程中只有通常原因的偏差存在 没有随时间而产生的特殊原因偏差 各组的方差相同 可以用F检验来验证 或者用方差齐性检验来验证 X 转变成不同水平时 可能降低变差 提高Z值 方差分析的前提 13 各样本来自正态分布在进行ANOVA分析时 如果违反了这些原则 又可能会导致得出错误的结论当比较平均值时 正态性往往不成问题 因为中心极限定理表明 平均值趋向正态分布 当比较变差时 正态性非常重要 方差齐性 对于正态数据 应用 Bartlett 检验法 对于非正态数据 应用 Levene 检验法 对于因素水平的每一组合 残差值的均值为0 0这意味着我们所拟合的方程 或模型 正确 没有其它变量影响结果 方差分析的前提 14 方差分析的前提 不同组样本的方差应相等或至少很接近 15 使用方差分析的条件 16 ANOVA术语 因子factor 对响应变量 非独立 可能有影响的独立变量 并以不同水平出现在实验内 水平level 输入因子的特定设定 交互作用 当一个输入因子对输出所产生的效果是取决于另一个输入因子的水平时 17 检验单个因子的2个以上水平的平均值是否有显著差异 一元ANOVAANOVA存在两个 或多个 因子时 检验平均值是否有显著差异 二元 多元ANOVA ANOVA术语 18 单因子方差分析 19 方差分析的运用步骤 将业务问题转化成统计问题计算样本大小数据显示BOXPLOT数据正态检验方差齐性检验ANOVA残差分析主效应图统计结论转化成业务结论 20 方差分析的运用步骤 21 一元ANOVA 案例 某车间的六西格玛项目是 提高合金钢的强度 通过分析 发现三个班次是潜在根本原因之一 现收集了三个班生产的产品强度的数据 如何来验证班次的不同是根本原因 数据见练习文件 A04 方差分析 22 1 业务问题转化为统计问题 一元ANOVA 业务问题 三个班次生产的产品平均强度是否有显著差异 统计问题 原假设H0 1 2 3备择假设Ha 1 2 3不 全相等 23 2 因子样本容量的确定 一元ANOVA 24 功效和样本数量单因子方差分析Alpha 0 05假定标准差 0 37水平数 3SS平样本最大均值数量目标功效实际功效差值0 540 800 82564010 550 900 92798610 560 950 9724461样本数量是指每个水平的 一元ANOVA 25 一元ANOVA 3 箱线图 26 一元ANOVA 4 正态检验 27 一元ANOVA 统计 基本统计量 正态性检验 28 一元ANOVA 5 方差齐性检验 29 一元ANOVA P值 0 05时 接受方差齐性 30 一元ANOVA 6 AN0VA分析 31 一元ANOVA 单因子方差分析 强度与班组来源自由度SSMSFP班组26 8223 41129 400 000误差273 1330 116合计299 954S 0 3406R Sq 68 53 R Sq 调整 66 20 平均值 基于合并标准差 的单组95 置信区间水平N平均值标准差 1104 69500 3188 2104 05200 3782 3103 52900 3216 3 504 004 505 00合并标准差 0 3406 结论 P 0 05 拒绝原假设H0 1 2 3即接受备择假设 Ha 1 2 3不全相等 32 一元ANOVA P 0 05 拒绝原假设 说明班组间有显著差异这时就提出了下一个问题 哪些班组间有显著差异 哪些班组没有差异 这就需要了解各班组下平均值的差异的细致情况 这就是 如何分析多重比较的结果 当因子显著即因子在各水平下均值有差异时 我们可以进一步了解因子在L个水平下均值的差异 即同时检验如下个 i j 这个检验叫做多重比较 进行多重比较的关键是如何选定第一类错误风险的问题 MINITAB提供了四种多重比较的方法 我们只使用第一种 Tukey 整体误差率 方法 该种方法可以保证整体误差率为5 33 一元ANOVA 如果整体误差率设定为5 那么两两比较检验的第一类错误设定的风险要远远低于5 Tukey方法可以计算所有多重比较 两两均值差 的置信区间 以后我们在实际进行单因子的方差分析时 一定只选Tukey算法 以保证整体误差率为5 34 一元ANOVA 35 Tukey95 同时置信区间班组水平间的所有配对比较单组置信水平 98 04 班组 1减自 班组下限中心上限 2 1 0211 0 6430 0 2649 3 1 5441 1 1660 0 7879 1 40 0 700 000 70班组 2减自 班组下限中心上限 3 0 9011 0 5230 0 1449 1 40 0 700 000 70 单因子ANOVA分析多重比较方法 36 单因子ANOVA分析多重比较方法 我们先看Tukey方法的两组多重比较的置信区间 由于Tukey方法所设定的整体误差率是5 两两比较检验的第一类错误设定的风险要远远低于5 输出中指明 95 同时置信区间 班组间的所有配对比较 单独置信水平 98 04 这就意味着 在两两比较中 第一类错误概率只有1 98 04 1 96 我们从箱线图看班组1的强度最好 班组2强度稍差 班组3强度最差 37 单因子ANOVA分析多重比较方法 第一组以班组1作被减项 班组2 3的均值分别减去班组1的均值得到的置信区间 从班组1减去班组2时代样本均值为 0 6430 我们有98 04 的把握可以断言 总体的均值差将落入 1 0211 0 2649 内 可以看出这个置信区间不包含0 说明班组1与班组2总体均值有显著差异 从上面分析可以看出 我们对于两总体的均值差将落入什么区间的具体数值并不关心 关键是这个区间是否包含0 也就是区间的上下限是否恰好正负符号相反 如果上下限皆为正 则说明第二个总体均值比第一个总体均值大 如果上下限皆为负 则说明第二个总体均值比第一个总体均值小 38 同样分析 班组3减去班组1 置信区间 1 5441 0 7879 上下限皆小于0 说明班组3强度平均值比班组1强度平均值小第二组以班组2为减项 置信区间 0 9011 0 1449 说明班组3强度平均值比班组2强度平均值小 单因子ANOVA分析多重比较方法 39 一元ANOVA 7 残差分析 残差符合正态分布 各点分布在线的附近 与正态图相对应的直方图 残差图 实验数据的残差值均匀分布在0线上下 拟和值图形 该图形上的点均匀分布 无喇叭状或漏斗状 40 一元ANOVA 8 主效应图 41 一元ANOVA 42 一元ANOVA 9 统计结论转化为业务结论 业务问题 三个班次产品平均强度是否有显著差异 统计问题 运用ANOVA建立原假设H0 1 2 3备择假设 Ha 1 2 3不全相等统计结论 P 0 05 拒绝原假设H0 1 2 3即接受备择假设 Ha 1 2 3不全相等业务结论 三个班次产品平均强度存在显著差异 43 练习某六西格玛团队遇到这样一个问题 考察温度对某一个化工产品得率的影响 选了5种不同的温度进行试验 希望判断温度对化工产品得率是否有显著影响 ANOVA 单因子 1 业务问题转化为统计问题 建立假设 2 因子样本容量的确定3 箱线图4 正态检验5 方差齐性检验6 AN0VA分析7 残差分析 8 主效应图9 统计结论转化为业务结论 一元ANOVA 44 例子 实际问题 一个采购工程师要调查某个电阻焊接系统中 3种型号不同 A B C 的焊接机对焊接强度的影响是否有显著差异 他收集了一些数据 输出 焊接强度输入 焊接机输入的水平 3个 A B C 这是一个具有3个水平的单因子试验 45 两因子方差分析 46 在实际问题的研究中 有时需要考虑两个因素对实验结果的影响 例如饮料销售 除了关心饮料颜色之外 我们还想了解销售地区是否影响销售量 如果在不同的地区 销售量存在显著的差异 就需要分析原因 采用不同的销售策略 使该饮料品牌在市场占有率高的地区继续深入人心 保持领先地位 在市场占有率低的地区 进一步扩大宣传 让更多的消费者了解 接受该产品 若把饮料的颜色看作影响销售量的因素A 饮料的销售地区则是影响因素B 对因素A和因素B同时进行分析 就属于双因素方差分析的内容 双因素方差分析是对影响因素进行检验 究竟是一个因素在起作用 还是两个因素都起作用 或是两个因素的影响都不显著 两因子方差分析 47 现有4条生产线生产同一种垫片 为了了解不同生产线垫片的断裂强度有无明显的差异 现分别用两种不同的温度进行试验 测得数据见练习文件 两因子方差分析 如何分析不同的生产线及不同温度对垫片的断裂强度均值有无显著影响 如果有影响那么在什么条件下垫片的断裂强度达到最大 案例 二元ANOVA 指标 断裂强度因子A 温度 有两个水平 700 800因子B 生产线 有三个水平 1 2 3 4 48 箱线图 二元ANOVA 49 二元ANOVA 50 正态检验 二元ANOVA 51 二元ANOVA 主效果图 52 二元ANOVA 53 二元ANOVA 多变量分析 54 二元ANOVA 55 二元ANOVA 不选是考虑交互作用 56 双因子方差分析 强度 Y 与生产线 B 温度 A 来源自由度SSMSFP生产线 B 3158 85352 95096 610 001温度 A 13 5403 54030 440 511交互作用32 5670 85560 110 955误差32256 2008 0063合计39421 160S 2 830R Sq 39 17 R Sq 调整 25 86 生产平均值 基于合并标准差 的单组95 置信区间线 B 平均值 186 97 288 83 390 41 492 38 87 590 092 595 0平均值 基于合并标准差 的单组95 置信区间温度 A 平均值 70089 350 80089 945 88 8089 6090 4091 20 二元ANOVA 57 统计结论 在 0 05水平上 因子生产线P 0 010 05不显著交互作用P 0 955 0 05不显著 业务结论 生产线对垫片的断裂强度有显著的影响 温度及温度与生产线交互作用都不是影响断裂强度的因素 使垫片的断裂强度达到最高点生产条件是生产线4 其垫片平均断裂强度达到92 38 二元ANOVA 58 方差检验 59 单正态总体方差检验 在实际问题中 常常要检验一批数据的方差是否比设定的值大 或是否已经变小 例如 希望检验本次购进的原材料的方差是否比供应商宣称的要大 改进工作后的方差是否比改进工作前的方差有所降低 这些都导致我们要进行单正态总体的方差检验 60 单正态总体方差检验 某种金属丝折断力服从N 64 未知 现随机抽取了9根作折断力试验 测得数据见BS 单总体方差检验 试问在 0 05水平上能否认为这批金属丝的折断力方差还是64 1 建立假设 H0 2 64H1 2 642 进行数据的正态性检验统计 基本统计量 正态性检验 61 单正态总体方差检验 62 单正态总体方差检验 3 进行检验统计 基本统计量 单方差 63 单方差检验和置信区间 折断力方法原假设西格玛平方 64备择假设西格玛平方不 64标准方法只适用于正态分布 调整后的方法适用于任何连续分布 统计量变量N标准差方差折断力99 0281 495 置信区间标准差置信方差置信区变量方法区间间折断力标准 6 10 17 29 37 2 298 9 调整的 5 32 27 71 28 3 767 6 检验变量方法卡方自由度P值折断力标准10 188 000 505调整的4 693 690 559 单正态总体方差检验 64 单正态总体方差检验 P 0 505 0 05 所以我们的结论是 不能拒绝原假设 即认为这批金属丝的折断力方差还是64 此例说明 当样本量较小时 样本的标准差 或方差 的波动可以是很大的 原来总体标准差是8 现在样本的标准差是9 02 在稍微有些变化时不能被认为总体标准差已经发生变化 65 单正态总体方差检验 统计 基本统计量 图形化总汇 标准差的95 双侧置信区间为 6 1 17 29 而总体标准差8落入此置信区间 因此不能拒绝原假设 认为这批金属丝的折断力方差还是64 66 单正态总体方差检验 车工生产精密轴杆 其长度的规格限为15 0 3 原标准差已经达到0 1 过程能力达到4个西格玛水平 现经六西格玛团队完成黑带项目 过程能力达到5个西格玛水平 现随机抽取了30根轴杆测量其长度 数据文件 轴杆长度 试问在 0 05水平上能否认为这批轴杆长度的标准差比原来的0 1确实有降低 67 单正态总体方差检验 1 建立假设H0 0 1H1 0 1 2 进行数据的正态性检验统计 基本统计量 正态性检验 68 单正态总体方差检验 69 3 进行检验统计 基本统计量 单方差 单正态总体方差检验 70 单正态总体方差检验 单标准差检验和置信区间 轴杆长度方法原假设西格玛 0 1备择假设西格玛 0 1标准方法只适用于正态分布 调整后的方法适用于任何连续分布 统计量变量N标准差方差轴杆长度300 07530 0056795 单侧置信区间变量方法标准差上限方差上限轴杆长度标准0 09640 00929调整的0 09400 00883检验变量方法卡方自由度P值轴杆长度标准16 4529 000 030调整的19 8635 010 019 结论 P 0 03 拒绝原假设 即可以断言轴杆长度的标准差比0 1确实有所降低 71 单正态总体方差检验 如果把此问题用 统计 基本统计量 图形化总汇 方法检验 我们会得到什么样的结论 标准差的95 双侧置信区间为 0 061 0 101 而总体的标准差0 1落入此置信区间 因此不能拒绝原假设 应认为这批轴杆长度的标准差与原来的0 1无显著变化 Why 72 练习 某零件要求其直径的规格限为5 5 0 05 现抽取部分零件进行检测 其数据见单总体方差 试问在 0 05水平上 零件的标准差是否等于0 05 用单总体方差检验和置信区间两种方法检验 单正态总体方差检验 73 单正态总体方差检验 74 双总体等方差检验 在实际问题中 常常要检测两批数据的方差是否可以认为是相等的 例如希望检测两批购进的原材料的方差是否相等 改进工作后的方差是否比改进前的方差有所降低 另一方面 双样本T检验要在假定两总体方差相等的条件下才能进行 这些都导致我们要进行双正态总体的方差检验 75 双总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国流动办公室市场调查研究报告
- 2025年中国汽车太阳挡市场调查研究报告
- 2025年中国智能吸尘车市场调查研究报告
- 2025年蒸发冷却器项目可行性研究报告
- 2025-2030自动闸门系统行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030聚合物药物递送行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030美食炉行业风险投资发展分析及投资融资策略研究报告
- 2025-2030网络动漫产业市场深度调研及发展趋势与投资战略研究报告
- 2025-2030细菌检测行业发展分析及投资战略研究报告
- 2025-2030纯素食巧克力行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025版无人机生产加工委托合同3篇
- 军事法规基础知识
- 艾梅乙防治知识培训课件
- 《中医养生保健服务(非医疗)技术操作规范-砭术》-公示稿
- 【数学】第2课时 三角形的三边关系教学设计 2024-2025学年北师大版数学七年级下册
- 2025年国家招商局集团有限公司招聘笔试参考题库含答案解析
- 霍乱培训课件PPD
- 《国际物流与供应链管理》课程综述论文:跨境电商供应链管理研究的文献综述4100字
- 数控车削编程与加工 课件 3.5轴类零件综合
- DB37T 4515-2022 罚没物品分类与代码
- 中国传统文化(西安交通大学)知到智慧树章节测试课后答案2024年秋西安交通大学
评论
0/150
提交评论