Minitab全面培训教程(最新完整版)_第1页
Minitab全面培训教程(最新完整版)_第2页
Minitab全面培训教程(最新完整版)_第3页
Minitab全面培训教程(最新完整版)_第4页
Minitab全面培训教程(最新完整版)_第5页
已阅读5页,还剩566页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 Minitab介绍介绍 uMinitab是众多统计软件当中比较 简单易懂的软件之一; u相对来讲,Minitab在质量管理方 面的应用是比较适合的; uMinitab的功能齐全,一般的数据 分析和图形处理都可以应付自如。 Minitab与与6 Sigma的关系的关系 在上个世纪80年代Motolora开始在公司内推 行6 Sigma,并开始借助Minitab使6 Sigma得 以最大限度的发挥; 6 Sigma的MAIC阶段中,很多分析和计算都 可以都通过Minitab简单的完成; 即使是对统计的知识不怎么熟悉,也同样可 以运用Minitab很好的完成各项分析。 Minitab的功能的功能

2、计算功能计算功能 计算器功能 生成数据功 能 概率分布功 能 矩阵运算 Minitab的功能的功能 数据分析功能数据分析功能 基本统计 回归分析 方差分析 实验设计分析 控制图 质量工具 可靠度分析 多变量分析 时间序列 列联表 非参数估计 EDA 概率与样本容量 Minitab的功能的功能 图形分析图形分析 直方图 散布图 时间序列图 条形图 箱图 矩阵图 轮廓图 三维图 点图 饼图 边际图 概率图 茎叶图 特征图 课程内容安排课程内容安排 由于时间有限,很多内容只是 做简单的介绍; 在两天的时间里,主要的课程 内容安排如下: R , ) 控制图 一一. .控制图原理控制图原理 b. 3 控

3、制方式下的产品特性值区间 3 控制方式下产品 特性值落在 -3 , +3 范围内的 概率为99.73%,其产 品特性值落在此区 间外的概率为1- 99.73%=0.27%. 0.135%0.135% -3 +3 控制图 一一. .控制图原理控制图原理 c. 常规控制图的形成 -3 +3 +3 -3 -3 +3 控制图 一一. .控制图原理控制图原理 d.控制图原理的解释 第一种解释: 1.若过程正常,即分布不变,则点子超过UCL 的概率只 有1 左右. 2.若过程异常, 值发生偏移,于是分布曲线上、 下偏移,则点子超过UCL或LCL的概率大为增加. 结论:点出界就判异以后要把它当成一条规定来记

4、住. 8 9 10 11 UCL CL LCL 时间(h) 控制图 一一. .控制图原理控制图原理 第二种解释: 1.偶然因素引起偶然波动。偶然波动不可避 免,但对质量的影响微小,通常服从正态分布, 且其分布不随时间的变化而改变。 时间 目标线 可预测 过程受控 控制图 一一. .控制图原理控制图原理 2.异因引起异波。异波 产生后,其分布会随时 间的变化而发生变化。 异波对质量影响大,但 采取措施后不难消除。 第二种解释: 结论:控制图上的控制 界限就是区分偶波与 异波的科学 界限,休 哈特控制图的实质是 区分偶然因素与异常 因素两类因素. 时间 目标线 不可预测 过程失控 二二. .常规控

5、制图及其用途常规控制图及其用途 控制图 取样费时、昂 贵的场合. UCLx=X+2.66Rs UCLRs=3.267Rs 单值-移动极差控制图X-Rs 现场需把测定 数据直接记入 控制图进行控 制. UCLX=X+m3A2R UCLR=D4R LCLR=D3R 中位数-极差控制图X - R 当样本大小 n10,需要应用 s图来代替R图. UCLX= X+A3s UCLs= B4s LCLs = B3s 均值-标准差控制图 X - s 最常用最基本 的控制图.控制 对象:长度、重 量等. UCLX= X+A2R UCLR= D4R LCLR =D3R 均值-极差控制图X - R 正态 分布 (计

6、 量值) 备备 注注控制图界限控制图界限控制图名称控制图名称 控制图控制图 代号代号 分布分布 二二. .常规控制图及其用途常规控制图及其用途 控制图 一定单位,样 品大小不变 时 UCLc= c + 3 c 不合格数 控制图 c 一定单位中 所出现缺陷 数目控制 UCLu=u+3 u / n 单位不合格数 控制图 u 泊松 分布 (计点 值) 不合格品 数控制UCLnp=np+3 np(1-p) 不合格品数 控制图 np 用于不合格 品率或合格 品率控制 UCLp= p+ 3 p(1-p)/n 不合格品率 控制图 p 二项 分布 (计件 值) 备注备注控制图界限控制图界限控制图名称控制图名称

7、 控制图控制图 代号代号 分布分布 Minitab可提供的图形可提供的图形 计量型计量型 Xbar-R Xbar-s I-MR I-MR-s Z-MR 计数型计数型 P Np C U Xbar-R做法做法 Xbar-R是用于计量型 判稳准则:连续二十五点没有超出控制界限。 判异准则: 一点超出控制界限 连续六点上升或下降或在同一侧 不呈正态分布,大部份点子没有集中在中心线。 Xbar-R做法做法 决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Xbar-R练习练习 Select: Stat Control Charts Variable

8、s Charts for Subgroups Xbar-R 打开Data目录下的Camshaft.mtw 输入参数输入参数 根据不同的输入方式 选择不同的分析方法 决定测试要求决定测试要求 可以在这里选 择判异准则 判判 异异 准准 则则 准则准则1: 1: 一点超出控制界限一点超出控制界限 A A B C C B UCLUCL CLCL LCLLCL 区域A (+3 ) 区域A ( -3 ) 区域B (+2 ) 区域C (+1 ) 区域C ( -1 ) 区域B ( -2 ) UCLUCL CLCL LCLLCL 准则准则2: 2: 连续连续9 9点在中心线的同侧点在中心线的同侧 判判 异异

9、准准 则则 A A B C C B UCLUCL CLCL LCLLCL 准则准则3: 连续连续6点呈上升或下降趋势点呈上升或下降趋势 A A B C C B UCL CL LCL 判判 异异 准准 则则 准则准则4: 连续连续14点上下交替点上下交替 A A B C C B UCL CL LCL 判判 异异 准准 则则 准则准则5: 连续连续3点中有点中有2点落在中心线点落在中心线 同一侧的同一侧的B区以外区以外 判判 异异 准准 则则 A A B C C B UCL CL LCL 准则准则6: 连续连续5点中有点中有4点在点在C区之外区之外(同侧同侧) 判判 异异 准准 则则 A A B

10、C C B UCL CL LCL 准则准则7: 7: 连续连续1515点在中心线附近的点在中心线附近的C C区内区内 判判 异异 准准 则则 A A B C C B UCL CL LCL 准则准则8: 8: 连续连续8 8点在中心线两侧而无一点在点在中心线两侧而无一点在C C区区 判判 异异 准准 则则 A A B C C B UCL CL LCL 决定标准差的估计方法决定标准差的估计方法 一般选择Rbar的 标准差估计方式 决定选项决定选项 进行正态性转换 值将标准转换变量的 标准偏差最小化,当0, 转换结果为Y ,如0,转 换结果为LOGeY 值转换值 2Y=Y2 0.5Y=Y 0Y=lo

11、geY -0.5Y=1/Y -1Y=1/Y 决定选项决定选项(续续) 输入1,2,3StDEV控制限 图形输出图形输出: 判判 图图 请判定前图是否有异常 请问本图为解析用图或是控制用图 Xbar-s做法做法 决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Xbar-s练习练习 n Select: Stat Control Charts Variables Charts for Subgroups Xbar-s 打开Data目录下的Camshaft.mtw 输入参数输入参数 其他参数设置与Xbar-R图相同 图形输出图形输出: 判判 图

12、图 请判定前图是否有异常 请问本图为分析用图或是控制用图 I-MR图做法图做法 决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 I-MR练习练习 打开下列档案: Data目录下的Coating.MTW Select: Stat Control Charts Variables Charts for Individuals I-MR 输入参数输入参数 输入变量 图形输出图形输出 判判 图图 请判定前图是否有异常 请问本图为解析用图或是控制用图 I-MR-R图做法图做法 决定要研究或控制的Y或X特性 收集数据 输入minitab中 用min

13、itab绘图及分析 判定及采取措施 I-MR-R练习练习 打开Data目录下的Camshaft.mtw Select: Stat Control Charts Variables Charts for Subgroups I-MR-R 输入参数输入参数 输入变量和样本数 图形输出图形输出 判判 图图 请判定前图是否有异常 请问本图为分析用图或 是控制用图 Z-MR(标准化的单值移动极差标准化的单值移动极差)图做法图做法 决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Z-MR练习练习 Select: Stat Control Chart

14、s Variables Charts for Individuals Z-MR 打开Data目录下的Exh_qc.MTW 当过程数据少而无法很好 评估过程参数时使用 输入参数输入参数 输入变量 输入自变量 决定估计决定估计 选择标准差的估计方法 图形输出图形输出 P图做法图做法 判定及采取措施 决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 P图图练练 习习 P图只能适用在二项分布的质量特性性。 在做p图时,要注意其样本数必须达到 1/p5/p,如此之下的图才比较具有意义。 输入数据输入数据 打开数据文档 Select : Stat Control Cha

15、rts Attributes ChartsP 将数据输入到Minitab表中 输入参数输入参数 输入变量 输入样本数 决定判异准则决定判异准则 选择判异准则 计数型的判异准则 与计量型的不太一样 图形输出图形输出 NP图做法图做法 决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 NP图图练习练习 np图只能适用在二项分布的质量特性性。 在做np图时,要注意其样本数必须达到 1/p5/p,如此之下的图才比较具有意义。 输入数据输入数据 打开数据文档 Select : Stat Control Charts Attributes ChartsN

16、P 将数据输入到Minitab表中 图形输出图形输出 C图做法图做法 决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 C图练习图练习 c图只能适用在泊松分布的质量特性上。 在做c图时,要注意其样本数必须达到取样 时至少包含一个缺陷以上,如此之下的图 才比较具有意义。 另外就是基本上c图的样本要一定才可以。 如果样本数不一样,则应当使用u图。 输入数据输入数据 打开数据文档 将数据输入到 Minitab表中 Select: Stat Control Charts Attributes ChartsC 输入参数输入参数 输入变量 决定判异准则决

17、定判异准则 判异准则同P图一样 图形输出图形输出 U图做法图做法 决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 U图练习图练习 u图只能适用在泊松分布的质量特性上。 在做u图时,要注意其样本数必须达到 取样时至少包含一个缺陷以上,如此之 下的图才比较具有意义。 输入数据输入数据 打开数据文档 Select : Stat Control Chart Attributes ChartsU 将数据输入到 Minitab表中 输入参数输入参数 输入变量 输入样本量 图形输出图形输出 EWMA做法做法 决定要研究或控制的Y或X特性 收集数据 输入m

18、initab中 用minitab绘图及分析 判定及采取措施 EWMA的全称为Exponentially Weighted Moving Average,即指数加权移动平均控制图. EWMA图的特点: 1、对过程位置的稍小变动十分敏感; 2 、图上每一点都综合考虑了前面子组的信息; 3 、对过程位置的大幅度移动没有Xbar图敏感; 4 、可应用于单值,也可应用于子组容量大于1的场合. EWMA图的适用场合: 可用于检测任意大小的过程位置变化,因此常用于监 控已受控过程,以发现过程均值相对于目标值的漂移 EWMA练习练习 Select: Stat Control Chart Time Weight

19、ed Charts EWMA 输入参数输入参数 确定权重系数 的值,由 所需的EWMA图对位置 偏移检测灵敏度所决定, 要求检测灵敏度越高, 值越小.如需检测1的过 程偏移, =0.2,如需检测 2的过程偏移,=0.4.常 取=0.2, 1Control Chart Time Weighted Charts CUSUM 例:某机场每天离港、进港航班多 达千架次,航班延误情况很是严重. 航空公司在6管理中把航班延误 作为重点解决的质量项目,规定航 班起飞时间比时刻表晚5分钟为延 误,其中不包括因恶劣天气等无法 抗拒因数造成的延误.通过一段时 间的治理,航班延误率从过去的 10%降到现在的2%左右

20、,公司决定 采取过程控制,把航班延误率控制 在2%的较好水平. 输入参数输入参数 点击此选项 决策区间 过程允许偏移量 图形输出图形输出 MINITAB之制程能力分析之制程能力分析 制程能力之分类制程能力之分类 计量型(基于正态分布) 计数型(基于二项分布) 计数型(基于泊松分布) MINITAB 能力分析的选项能力分析的选项(计量型计量型) Capability Analysis (Normal) Capability Analysis (Between/Within) Capability Analysis (Nonnormal) Capability Analysis (Multiple

21、 Variable normal) Capability Analysis (Multiple Variable Nonnormal) Capability Analysis (Binomial) Capability Analysis (Poission) Capability Sixpack (Normal) Capability Sixpack (Between/Within) Capability Sixpack (Nonnormal) Capability Analysis (Normal) 该命令会划出带理论正态曲线的直方图, 这可直观评估数据的正态性。输出报告中 还包含过程能力统

22、计表,包括子组内和总 体能力统计。 Capability Analysis (Between/Within) 该命令会划出带理论正态曲线的直方图, 可以直观评估数据的正态性。 该命令适用于子组间存在较大变差的场合。 输出报告中还包含过程能力统计表,包括 子组间子组内和总体能力统计。 Capability Analysis (Nonnormal) 该命会会划出带非正态曲线的直方图,这 可直观评估数据是否服从其他分布。输出 报告中还包含总体过程总能力统计 Capability Analysis (Multiple Variable normal) Capability Analysis (Mult

23、iple Variable Nonnormal) -上述两个命令用于对多个变量进行分析 制程能力分析做法制程能力分析做法 决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 STEP1STEP1决定决定Y Y特性特性 决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 Y特性一般是指客户所关心所重 视的特性。 Y要先能量化,尽量以定量数据 为主。 Y要事先了解其规格界限,是单边 规格,还是双边规格。 目标值是在中心,或则不在中心 测量系统的分析要先做好。 STEP2STEP2决定决定Y Y特性特性 决定Y特性 收集Y特性数据 输入MINITAB数据表

24、 进行分析 结果说明 在收集Y特性时要 注意层别和分组。 各项的数据要按时间 顺序做好相应的整理 STEP3STEP3决定决定Y Y特性特性 决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 将数据输入MINTAB中, 或则在EXCEL中都可以。 STEP4STEP4决定决定Y Y特性特性 决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 利用MINITABSTAT QUALITY TOOLS CAPABILITY ANALYSIS (NORMAL) STEP5STEP5决定决定Y Y特性特性 决定Y特性 收集Y特性数据 输入MINITAB数据表

25、 进行分析 结果说明 利用MINITAB的各项图形 来进行结果说明 练习练习 样本样本X1X1X2X2X3X3X4X4X5X5 199.7098.72100.24101.28101.20 299.32100.97100.8799.2498.21 399.8999.83101.4899.56100.90 499.1599.7199.1799.3098.80 599.66100.80101.06101.16100.45 697.7498.8299.2498.6498.73 7101.18100.2499.6299.3399.91 8101.54100.96100.62100.67100.49 91

26、01.49100.6799.36100.38102.10 1097.1698.2697.59100.0999.78 输入数据输入数据 Select: Stat Quality Tools Capabilty Analysis(Normal) 注意输入方式 输入选项输入选项 根据不同的数据输入 方式选择分析方法 输入上下规格界限 选择标准差的估计方法选择标准差的估计方法 一般选择复合的标准差估计方式 选项的输入选项的输入 如果需要计算Cpm 则需要输入目标值 选择是否作正 态型转换 过程能力表现 形式的选择 以以Cpk, Ppk结果的输出结果的输出 Cpm是指样本数值相对 于对于目标值的一个能

27、力值,也就是样本是否 靠近目标值的概率 样本数值超过分 析规格界限的分 布率 模拟曲线落在 控制线以外的 分布率 Cp:过程能力指数,又称为潜在过程能力指数, 为容差的宽度与过程波动范围之比. Cp=(USL-LSL)/6 Cpk:过程能力指数,又称为实际过程能力指数, 为过程中心与两个规范限最近的距离 minUSL- , -LSL与3之比. Cpk= minUSL- , -LSL/ 3 Cpm:过程能力指数,有时也称第二代过程力 指数,质量特性偏离目标值造成的质量损失 其中:=R/d2 其中:=R/d2 Cpm =(USL-LSL)/6其中: 2= 2+(-m)2 Cpmk=Cpk/1+(-

28、m)/2Cpmk称为混合能力指数 Pp与Ppk:过程绩效指数,计算方法与计算Cp和 Cpk类似,所不同的是,它们是规范限与过程总 波动的比值过程总波动通常由标准差s来估计 S = 过程能力与缺陷率的关系: 1、假如过程中心位于规范中心M与上 规范限USL之间,即M USL时, p(d)=-3(2Cp-Cpk)+(-3Cpk) 2 、假如过程中心位于规范中心M与下 规范限LSL之间,即LSL M时, p(d)=-3(1+K)Cp+-3(1-K)Cp K=(2 M- )/T 以以Zbench方式输出方式输出 ZUSL=(USL- )/ ZLSL=( -LSL)/ Z=(USL- LSL)/2 或

29、Z=3Cp 双侧规范下综合Sigma Level Zbench 需通过总缺陷率进行折算 使用Sigma Level Z来评价过程能力的 优点是:Z与过程的不合格率p(d)或DPMO 是一一对应的. 结果说明结果说明 请打开Data目录下的 Camshaft.mtw,以 Zbench方式输出 练练 习习 填入参数填入参数 结果输出结果输出 通过通过DPMO求求Sigma Level Select :CalcProbability Distribution-Normal Select :CalcCalculator 结果输出结果输出 合格率Z值,Sigma Level Capability Ana

30、lysis (Between/Within) 组间的 组内的 此处的PpkCpk 总的= 组间的2+组内的2 (XiX)2/(n1) 过程稳定系数d = StDev(overall) - StDev(B/W) 过程相对稳定系数 dr = StDev(overall) - StDev(B/W) / StDev(overall) StDev(overall):长期标准差的估计值 StDev(B/W) :短期标准差的估计值 过程相对稳定系数的评价参考过程相对稳定系数的评价参考 过程相对稳定系数过程相对稳定系数dr的范围的范围评价评价 dr10% 接近稳定 10%=dr20% 不太稳定 20%=dr=

31、50% 很不稳定 Capability Analysis (Nonnormal) 此项的分析是用在当制程不是呈现正 态分布时所使用。因为如果制程不是 正态分布硬用正态分布来分析时,容 易产生误差,所以此时可以使用其他 分布来进行分析,会更贴近真实现像。 练练 习习 请使用同前之数据来进行分析。 上规格:103 下规格:97 规格中心:100 输入相关参数输入相关参数 Select: Stat Quality Tools Capabilty Analysis(Nonnormal) 填入选项要求填入选项要求 威布尔分布的参数估计 结果图形结果图形 形状参数 正态分布适用性的判定正态分布适用性的判定

32、 可以使用 Statbasic statisticnormality test 但数据要放到同一个column中,所以必须 针对前面的数据进行一下处理 数据调整数据调整 进行数据的堆积 填写选项填写选项 输入变量 输入作为参考 的概率记号 结果输出结果输出 P-valueP-value 0.050.05,接,接 收为正态收为正态 分布分布 结果输出结果输出(加标加标0.5概率概率) 计量型制程能力分析总结计量型制程能力分析总结 一般的正态分布使用 Capability Analysis (Normal) 如果是正态分布且其组内和组间差异较大 时可用 Capability Analysis (B

33、etween/Within) 当非正态分布时则可以使用 Capability Analysis (Nonnormal) Capability Sixpack (Normal) 复合了以下的六个图形 Xbar R 原始数据分布(plot) 直方图 正态分布检定 CPK, PPK 练习练习 请以前面的数据来进行相应的Capability Sixpack (Normal)练习 Select: Stat Quality Tools Capabilty Sixpack(Normal) 输入各项参数输入各项参数 输入规格 选定判异准则选定判异准则 选择判异准则 选择标准差估计方法选择标准差估计方法 默认值

34、是复合标准 差计算公式 考虑可选择项考虑可选择项 如果希望计算Cpm, 则输入目标值 结果输出结果输出 Capability Sixpack (Between/Within) 复合了以下的六个图形 Individual Moving Range Range 直方图 正态分布检定 CPK, PPK 同前练习及结果同前练习及结果 Capability Sixpack (Nonnormal) 复合了以下的六个图形 Xbar R 原始数据分布 直方图 正态分布检定 CPK, PPK 结果输出结果输出 形状参数 二项分布制程能力分析二项分布制程能力分析 二项分布只适合用在 好,不好 过,不过 好,坏 不

35、可以用在 0,1,2,3等二项以上的选择,此种状况必须使用 泊松分布。 示例示例 数据在Data目录下 的Bpcapa.mtw中 Select : Stat Quality Tools Capabilty Analysis Binomial 填好各项的参数填好各项的参数 输入样本数 输入历史的不良率 选好控制图的判异准则选好控制图的判异准则 结果及输出结果及输出 该线与P Chart中的 P bar 是 相同的 不良的比例(希 望它是随机分布) 累计不良率 泊松泊松分布制程能力分析分布制程能力分析 泊松分布只适合用在 计数型,有二个以上的选择时 例如可以用在 外观检验,但非关键项部份 0,1,

36、2,3等二项以上的选择,此种 状况必须使用泊松分布。 示例示例 数据在Data目录下 的Bpcapa.mtw中 Select: Stat Quality Tools Capabilty Analysis(Poisson) 填好各项的参数填好各项的参数 结果及输出结果及输出 基础统计基础统计 描述性统计描述性统计 Select: Stat Basic Statistics Display descriptive statistics 假设想对两组学生的身高进行 描述性统计以便比较,数据如右: 填入参数填入参数 输出结果输出结果 变异系数 3/4数据点与1/4数据点的差值InterQuartile

37、 Range数据连续差异平方的均值 选定栏数据修正均值 Trimmed Mean 输出结果输出结果(续续1) 输出结果输出结果(续续2) Select: Stat Basic Statistics Graphical Summary 输出结果输出结果(续续3) 假设检验假设检验 广告宣传的虚假性广告宣传的虚假性 l手机电池的使用寿命不是按年来计算的,而是按电 池的充放电次数来计算的。镍氢电池一般可充放电 200-300次,锂电池一般可充放电350-700次。某手机 电池厂商宣称其一种改良产品能够充放电900次,为 了验证厂商的说法,消费者协会对10件该产品进行 了充放电试验。得到的次数分别为8

38、91,863,903, 912,861,885,874,923,841,836。 广告宣传是虚假的吗广告宣传是虚假的吗 上述数据的均值为878.9,明显少于900。但是, 到底均值落在什么范围内我们就认为广告宣 传是虚假的呢? 900 接受广告宣传接受广告宣传 现在的问题是如现在的问题是如 何确定这两条线何确定这两条线 的位置的位置 假设检验的原理假设检验的原理 假设检验的原理是逻辑上的反证法逻辑上的反证法和 统计上的小概率原理统计上的小概率原理 反证法:当一件事情的发生只有两种可 能A和B,如果能否定B,则等同于间接 的肯定了A。 小概率原理:发生概率很小的随机事件 在一次实验中是几乎不可能

39、发生的。 假设检验的原理假设检验的原理( (续续) ) l由于个体差异的存在,即使从同一总体中严格的随机 抽样,X1、X2、X3、X4、,也不尽不同。 l它们的 不同有两种(只有两种)可能: (1)分别所代表的总体均值相同,由于抽样误差 造成了样本均值的差别。差别无显著性 。 (2)分别所代表的总体均值不同。差别有显著性。 假设检验的几个步骤假设检验的几个步骤 假设检验的一般步骤,即提出假设、确定 检验统计量、计算检验统计量值、做出决 策。 提出假设 构造统计量 做出统计 决策 计算统计量值 做出推断 提出假设提出假设 l在决策分析过程中,人们常常需要证实自 己通过样本数据对总体分布形式做出的

40、某 种推断的正确性(比如,总体的参数大 于某个值0),这时就需要提出假设,假 设包括零假设H0与备择假设H1。 零假设的选取零假设的选取 l假设检验所使用的逻辑上的间接证明法决定 了我们选取的零假设应当是与我们希望证实 的推断相对立的一种逻辑判断,也就是我们 希望否定的那种推断。 零假设的选取零假设的选取( (续一续一) ) l同时,作为零假设的这个推断是不会轻易 被推翻的,只有当样本数据提供的不利于 零假设的证据足够充分,使得我们做出拒 绝零假设的决策时错误的可能性非常小的 时候,才能推翻零假设。 零假设的选取零假设的选取( (续二续二) ) l所以,一旦零假设被拒绝,它的对立 面我们希望证

41、实的推断就应被视为 是可以接受的。 构造检验统计量构造检验统计量 l收集样本信息 l利用样本信息构造检验统计量 计算检验统计量值计算检验统计量值 l把样本信息代入到检验统计量中,得到检验 统计量的值。 做出决策做出决策 1、 规定显著性水平,也就是决策中所面临的风险 2、决定拒绝域(critical region)和判别值(critical value) 3、判定检验统计量是否落在拒绝域内 4、得出关于H0和关于H1的结论 显著性水平显著性水平 l显著性水平是当原假设正确却被拒绝的概 率 l通常人们取0.05或0.01 l这表明,当做出接受原假设的决定时,其 正确的可能性(概率)为95%或99

42、% 判定法则判定法则 1 1、如果检验统计量落入拒绝域中,则拒绝原假设、如果检验统计量落入拒绝域中,则拒绝原假设 2 2、如果检验统计量落入接受域中,则我们说不能拒绝原假设、如果检验统计量落入接受域中,则我们说不能拒绝原假设 注意:判定法则2的含义是指我们在这个置信水平下 没有足够的证据推翻原假设;实际上,如果我们改变 置信水平或样本数量就有可能得到与先前相反的结果。 零假设和备择假设零假设和备择假设 零假设零假设 备择假设备择假设 1.大于等于() 小于() 2.小于等于() 大于() 3. 等于() 不等于() 可能的零假设和备择假设的情况可能的零假设和备择假设的情况 单侧检验单侧检验(o

43、ne-tailed hypothesis)(one-tailed hypothesis) l某种果汁的包装上标明其原汁含量至少为 90%。假定我们想通过假设检验对这项说 明进行检验。 检验的方向性检验的方向性 l如果要检验的问题带有方向性,如灯泡寿 命、电池时效、头盔防冲击性等数值是越 大越好;零件废品率、生产成本等数值则 是越小越好,这类问题的检验就属于单侧 检验。 单侧检验 拒绝域和临界值 临界值 接受域拒绝域 接受域拒绝域 临界值 左单侧检验左单侧检验右单侧检验右单侧检验 单侧检验的例子 l例例1: 1:一家食品公司广告说他的一种谷物一袋一家食品公司广告说他的一种谷物一袋 有有2424千

44、克。消费者协会想要检验一下这个说千克。消费者协会想要检验一下这个说 法。他们当然不可能打开每袋谷物来检查,法。他们当然不可能打开每袋谷物来检查, 所以只能抽取一定数量的样品。取得这个样所以只能抽取一定数量的样品。取得这个样 本的均值并将其与广告标称值作比较就能做本的均值并将其与广告标称值作比较就能做 出结论。请给出该消费者协会的零假设和备出结论。请给出该消费者协会的零假设和备 择假设。择假设。 单侧检验的例子(续一) 解:解: (一)、(一)、首先找出总体参数,这里应该是总体的均值首先找出总体参数,这里应该是总体的均值m,即谷即谷 物的平均重量,给出原假设和备择假设,即用公式表达两个物的平均重

45、量,给出原假设和备择假设,即用公式表达两个 相反的意义。相反的意义。 H0: m 24 (均值至少为 24) Ha: m Basic Statistics 1-Sample Z 假设检验的假设检验的MinitabMinitab实现实现: : 填入参数填入参数 输出结果输出结果 单样本单样本t检验检验(1-Sample t) Select: Stat Basic Statistics 1-Sample t 例:右表为测量9个 工件所得到的数据.假 设工件数据服从正态 分布并且未知总体的 ,需计算总体均值是 否等于5及其在95%置 信度下的置信区间. 填入参数填入参数 输出结果输出结果 双样本双样

46、本t检验检验(2-Sample t) Select: Stat Basic Statistics 2-Sample t 采用Data目录下的Furnace.mtw 填入参数填入参数 输出结果输出结果 P-Value0.05 接受原假设 成对样本成对样本t检验检验(Paired t) Select: Stat Basic Statistics Paired t 采用Data目录下的Exh_stat.mtw 填入参数填入参数 输出结果输出结果 P-ValueBasic Statistics 1 Proportion 实验次数 成功次数 输出结果输出结果: 双样本比例检验双样本比例检验(2 Prop

47、ortion) 本案例采用总结数据形式本案例采用总结数据形式,直接填入参数直接填入参数: Select: Stat Basic Statistics 2 Proportion 输出结果输出结果 其它注意事项其它注意事项 l选择假设检验方法要注意符合其应用条件; l当不能拒绝H0时,即差异无显著性时,应考 虑的因素: 可能是样品数目不够; 单侧检验与双侧检验的问题。 正态性检验正态性检验(Normality test) 本例采用Data目录下的Scores.MTW Select: Stat Basic Statistics Normality test 填入参数填入参数 基于ECDF的检验 基于

48、相关分析的检验 基于卡方分析的检验 注:ECDF:(Experimental Cumulative Distribution Function) 实验室累计分布函数 基于基于ECDF检验的输出结果检验的输出结果 基于相关分析检验的输出结果基于相关分析检验的输出结果 基于相关卡方检验的输出结果基于相关卡方检验的输出结果 报纸报导某地汽油的价格是每加仑115美分,为 了验证这种说法,一位学者开车随机选择了一些 加油站,得到某年一月和二月的数据如下: 一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109

49、109 118 二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125 1)分别用两个月的数据验证这种说法的可靠性; 2)分别给出1月和2月汽油价格的置信区间; 3)给出1月和2月汽油价格差的置信区间. 小组讨论与练习 方差分析方差分析 方差分析的引入 怎样得到F统计量 单因素方差分析的例子 检验方差假设 多因素方差分析 多变量图分析 小组讨论与练习 本本 章章 目目 标标 1.理解方差分析的概念 2.知道方差分析解决什么样的问题 3.掌握单因素和多因素方差分析的原理 4.会利用Min

50、itab对实际问题进行方差分析 5.能够对方差分析的结果作出解释 方差分析的引入方差分析的引入 l假设检验讨论了检验两个总体均值是否相等 的问题,但对于多个总体的均值比较,如果 仍用假设检验,就会变得非常复杂。 方差分析的引入方差分析的引入( (续一续一) ) l方差分析(ANOVA:analysis of variance)能够解决多个均值 是否相等的检验问题。 l方差分析是要检验各个 水平的均值是否相等, 采用的方法是比较各水 平的方差。 l某汽车厂商要研究影响A品牌汽车销量的因素。该 品牌汽车有四种颜色,分别是黑色、红色、黄色、 银色,这四种颜色的配置、价格、款式等其他可 能影响销售量的

51、因素全部相同。从市场容量相仿 的四个中等城市收集了一段时期内的销售数据, 见下表。 方差分析的引入方差分析的引入( (续二续二) ) 城市黑色红色黄色银色 145362319 241432122 338391926 439421719 A品牌汽车在四个城市的销售情况品牌汽车在四个城市的销售情况单位:辆 方差分析的引入(续三)方差分析的引入(续三) l方差分析实际上是用来 辨别各水平间的差别是否 超出了水平内正常误差的 程度 l观察值之间的差异包括 系统性差异和随机性差异。 方差分析的引入方差分析的引入( (续四续四) ) 观察值观察值期望值期望值 差距差距 总离差总离差 组内方差组内方差 组间

52、方差组间方差 水平水平1 水平水平2 怎样得到怎样得到F统计量统计量 总离差总离差 组内方差组内方差 组间方差组间方差 怎样得到怎样得到F统计量统计量 水平间(也称组间)方差和水平内(也称组内)方 差之比是一个统计量。实践证明这个统计量 遵从一个特定的分布,数理统计上把这个分 布称为F分布。即 注意:组间方差注意:组间方差(SSB)+组内方差组内方差(SSw)=总方差总方差(SST) F=组间方差组内方差组间方差组内方差 F分布的特征分布的特征 l从F分布的式子看出,F分布的形状由分母和 分子两个变量的自由度确定,因此F分布有两 个参数。 lF分布的曲线为偏态形式,它的尾端以横轴为 渐近线趋于

53、无穷。 自由度(25,25) 自由度(5,5) 自由度(30,100) F分布的特征分布的特征( (续续) ) l从上图可以看出,随着分子分母自由度的 增加,分布图逐渐趋向正态分布的钟型曲 线(但它的极限分布并不是正态分布),以前 接触过的t分布、2分布的图像也有类似的 性质 2分布分布 F F分布分布 t t分布分布 正态分布正态分布 方差分析的前提方差分析的前提 l不同组样本的方差应相等或至少很接近 水平水平1水平水平2 水平水平1组内方差远远组内方差远远 超过两水平组间方差,超过两水平组间方差, 我无法分离这两种差我无法分离这两种差 别!别! 单因素方差分析单因素方差分析 l例1:我们要

54、研究一家有三个分支机构的公司 各分支机构的员工素质有无显著差异,已邀 请专业的人力评测单位对每一分支机构的员 工进行了评测,结果以百分制的分数给出, 每一机构抽取五位员工的结果如下表: 员工素质人力评测员工素质人力评测 观察值分支一(北京)分支二(上海)分支二(广州) 1758869 2828565 3767770 4856974 5897280 样本均值81.478.271.6 样本方差35.366.732.3 样本标准差5.948.175.68 检验方差是否一致检验方差是否一致 l在方差分析之前,我们可利用Minitab对数据 作方差一致性检验 MinitabMinitab能够读取的数据格

55、式与上表给出的格式不同,我们必须能够读取的数据格式与上表给出的格式不同,我们必须 把数据转化为把数据转化为MinitabMinitab能够理解的形式,具体做法是:能够理解的形式,具体做法是: 将所有变量值输入工作表的第一列,对因素进行编码,按照一定 的顺序编为1、2、3.,输入后面几列。 对本例对本例: 1. 先将素质测评的得分输入工作表列一; 2. 三个分支分别编码为1、2、3,对应于变量值填入第二列; 数据数据 StatANOVATest for Equal Variance 菜单菜单 方差一致性检验方差一致性检验 方差一致性检验方差一致性检验(续一续一) 适用于正态适用于正态 分布的数据

56、分布的数据 适用于非正适用于非正 态分布的数据态分布的数据 方差一致性检验方差一致性检验(续二续二) 给出假设给出假设 l因素是方差分析研究的对象,在这个例子里, 两个变量分别是分支机构位置和员工素质测 评分数,这里分支机构的位置就是一个因素, 因素中的内容就称为水平。该因素中有三个 水平,即机构的不同位置。学过假设检验的 知识后,我们可以给出下面的假设: l若零假设为真,则可以认为只有一个抽样分 布,此时三个样本均值比较接近。三个样本 均值的均值与方差可用于估计该抽样分布的 均值与方差。 零假设为真零假设为真 x3x2 x1 三个样本均值 零假设为真零假设为真 l总体均值的最优估计是三个样本

57、均值的算术 平均数,而抽样分布的方差的估计可以由三 个样本均值的方差给出,这个估计就是 的 组间估计 又由 得到 零假设为假零假设为假 l为了说明零假设为假时的情况,假定总体 均值全不相同,由于三个样本分别来自不 同均值的总体,则样本均值不会很接近, 此时 将变大,使得 的组间估计变大。 321x3x2x1 三个样本均值 零假设为假零假设为假( (续续) ) l每个样本方差都给出 的一个估计,这个 估计只与每个样本内部方差有关,若样 本量相同,各个样本方差的算术平均值 就是组内方差的估计值。 l前面已经讨论过,当零假设为真时, 的 组间估计和组内估计应该很接近,即其比 值应接近于1。而当零假设

58、不成立时, 的 组间估计将偏大,从而两者的比值会大于 1,因此我们构造形如 检验统计量检验统计量 F=组间方差组间方差/组内方差组内方差 的检验统计量,在一定的置信水平下,将 这个值和某个临界值作比较,就可以得出 接受还是拒绝零假设的结论。 深入理解深入理解F统计量统计量 lF统计量实际上是用来比较组间差异与组 内差异的大小,造成这种差别既有抽样的 随机性,也可能包含系统因素的影响。 l组间差异是用各组均值减去总均值的离差组间差异是用各组均值减去总均值的离差 的平方再乘以各组观察值的个数,最后加的平方再乘以各组观察值的个数,最后加 总总 l组内差异则是各组内部观察值的离散程度组内差异则是各组内

59、部观察值的离散程度 深入理解深入理解F统计量统计量(续续) l上述组间差异与组内差异必须消除自由度 不同的影响 l对SSW,其自由度为n-g,因为对每一种水 平,该水平下的自由度为观察值个数-1, 共有g个水平,因此拥有自由度个数为 l对SSB,其自由度为g-1,g为水平的个数。 Fcr F的抽样分布 拒绝域拒绝域 检验方差假设检验方差假设 接受域接受域 检验步骤检验步骤 l对于k个总体均值是否相等的检验: l 检验统计量为: l 给定显著性水平的拒绝域: 其中,其中,g-1,n-gg-1,n-g分别是分别是F F统计量分子分母的自由度统计量分子分母的自由度 计算结果 l对上例,计算得F=组间

60、方差/组内方差 =125/44.8=2.79; l查F分布表得到=0.05时临界值 Fcr(2,12)=3.89 lFFcr,所以不能拒绝零假设,即认为三 个分支机构员工素质大体一致,不存在 显著差异。 方差分析表 l上面的计算结果可以很方便的用方差分析表 来描述。下面是用Minitab软件得到的输出结 果,p值大于0.05,不能拒绝原假设.即认为三 个分支机构员工素质评分无显著差异. 方差分析表方差分析表 方差来源 自由度 离差平方和 均方 F P 组间 2 249.7 124.9 2.79 0.101 组内 12 537.2 44.8 合计 14 786.9 多因素方差分析 l方差分析也可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论