精益六西格玛统计工具介绍-假设检验课件_第1页
精益六西格玛统计工具介绍-假设检验课件_第2页
精益六西格玛统计工具介绍-假设检验课件_第3页
精益六西格玛统计工具介绍-假设检验课件_第4页
精益六西格玛统计工具介绍-假设检验课件_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、六西格玛统计工具介绍(二)2014年2月精益六西格玛理论体系全景图客户流程描述控制计划测量系统控制过程能力分析多变量分析实验设计VoC分析失效模式分析流程图(I/O)因果矩阵统计过程控制定性分析 定量分析头脑风暴+KJ失效树鱼骨图Why-Why分析PFMEA对标分析访谈现场调研流程观察回归分析软件使用项目管理精益六西格玛意识统计基础精益工具基本图表精益六西格玛持续改进体系精益六西格玛推行综合管理课程大纲假设检验概述相关与回归统计基础-数据类型计数型数据(离散型数据,属性型数据):通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器 A, 机器 B, 机器 C白班/中班/夜班计量型数据 (

2、连续型数据):通常是通过测量仪器测量得到的数据压力时间长度重量目录假设检验相关基础概念总体参数及样本统计量推定置信区间假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T 与配对T的区别 讨论及问答假设检验相关基础概念总体参数与样本统计量s= 样本标准差X= 样本平均值 参数 估计 统计量 = 总体平均值= 总体标准差抽样(Sampling)AABDDDCCCCBAAAAAAABBBBBBCCCCCCDDDDDDD总体标本估计的概念点估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋月饼的保质期是3个月点估计的种类:平均的估计、标准差、方差的估计

3、、比率的估计等区间估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋的月饼的保质期是1-6个月置信区间置信区间的概念(Confidence Interval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1- )%置信水平(Confidence Level)是指区间估计时,能够包含总体参数的能力水平,即1- 。=0.5(50%)=0.1(10%)信赖水准信赖区间误 差置信区间90%的置信区间举例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均95%置信区间的解释:大约100个置信区间中有95个会包含总体参数, 或者我们

4、有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间 总体的平均样本 1样本 2 样本 10置信区间置信区间的计算通用公式:置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式( 知道的时候):样本的置信区间公式(不知道,只能计算S):样本的平均遵循t分布置信区间Minitab中置信区间的计算这些都可以计算出置信区间假设检验假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。是为了解决选择的困难性假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部

5、门最需要的工具之一。假设检验假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法假设检验术语假设设定:对要进行判断的情况进行假设设定H0 -Null Hypothesis:说明没有变化或者差异的设定Ha- Alternative Hypothesis:说明有变化或者差异的设定假设设定练习:为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性假设检验假设检验的种类单边检验 One-sided hypothesis双边检验 Two-sided hypothesis假设检验的两种错误第1种 错误 (TypeError, -风险)

6、不顾Null Hypothesis 真实. Null Hypothesis放弃的错误 把良品判断为不良的时候(误判) 既, 可以说生产者危险1- 就是置信区间 第2种 错误 ( TypeError, -风险) : 不顾Null Hypothesis 假的. Null Hypothesis接受的错误 不良品当成良品的时候( 漏失 ) 即, 可以说顾客危险1- 是检定力,即检出能力假设检验的两种错误说明你的判定接受 Ho真实情况Ho 对Ho 错I类错误 (-风险)II类错误 (-风险)正确正确拒绝 Ho假设检验的两种错误举例陪审团的判决他无罪事实实际清白他有罪实际有罪正确正确清白的人进监狱罪犯逍遥

7、法外I类错误 (-风险)后果: II 类错误 (-风险)后果:假设检验假设检验原理假设检验其实是个比较的过程两种假设的比较,是A还是B?我们总是用H0 来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0 放弃H0 的决策不会总是正确的 ,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大?于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value)假设检验假设检验原理(续)知道了做出放弃H0 的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0 的决策呢?于是我们需要提前

8、设定一个风险判断标准 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01 、0.05、0.1 等但我们通常设定 为0.05这也就是我们通常拿P值和0.05 进行大小比较的原因。如果P0.05 接受H0; P0.05 放弃H0 (P Low H0 Go) 理解练习为什么正态检验,等方差检验P要大于0.05?假设检验假设检验原理(续) (Significance Level)置信水平:风险判断标准P-value 做出放弃H0 的决策犯错误的最大风险值p 值Ho 选择域Ho弃却域 Ho选择域Ho弃却域 p值P值 接受H0不能做决策 ,不能说有差异TPT TPT 假设检验假设检验步骤假设

9、 设定检定统计量选择留意水准 决定p-value 计算(弃却域 , 检定统计量 计算)判定(统计结论)p-value 0.05 时 Ho 接受P-值 0.05 时 Ho 放弃正态数据标准偏差的置信区间一个总体两个以上的总体2 Sample t(方差相等)2 Sample t(方差不相等) 1 Sample t 或者1 Sample ZHo: m1 = m (平均值)H1: m1 m (平均值)Stat - Basic Stats - 1 Sample-t (s不知道时候) 1Sample Z (s知道时候)1 Sample-Sign 或者 1 Sample-WilcoxonMann-Whitn

10、ey Test两个以上的总体两个母集团1-Proportion2-Proportion一个总体两个总体两个以上的总体非正态数据等 方差YesNoKruskal-Wallis Test一个总体一个总体两个以上的总体Ho: M1 = M2H1: M1 M2Stat - Nonparametric - Mann-WhitneyHo: M1 = M2 = M3 = .H1: 至少一个是不一样Stat - Nonparametric - Kruskal-WallisHo: m1 = m2H1: m1 m2Stat - Basic Stats - 2-Sample t “assume equal vari

11、ances”“假定等方差选择按钮” 不选择 Test for Equal Variances(Levenes Test) Test for Equal Variances(F Test or Bartletts Test)Ho: s1 = s2 = s3 = .H1: 至少有一个不一样Stat - Anova - Test for Equal Variances两个总体比较的时候 用F-testHo: s1 = s (标准差)H1: s1 s (标准差)标准差的置信区间使用Minitab 路径 Stat -Basic Statistics - Display Descriptive Stats

12、计量型数据数据稳定性研究(控制图)配对T(Paired T)Ho: D =0 (差值)H1: D 0 (差值)要对差值进行正态性检验Minitab 路径 Stat -Basic Statistics Paired t test (配对T)假设检验-常用路径图假设检验 - 单样本T检验“单样本t检验”解决什么问题?典型的问题为: “我们抽取了新坐席员Bob的30通电话录音数据,想知道坐席员A的话后整理时长的平均值是否刚好等于考核要求的25秒?”当然问题也可以是“Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”建立零假设和备选假设:平均整理时间等于目标值平均整理时

13、间不等于目标值决定显著性水平: = 0.05(5%)随机抽取30通电话的整理时间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论按照以下步骤完成如果P值大于或等于0.05,不能推翻零假设 H0如果P值小于a,推翻零假设 H0选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25不是正态分布是正态分布单样本T检验单样本T检验单样本T检验先把数据转换为正态后再使用单样本T检验检验数据正态性数据不稳定应先解决稳定性问题NOYES算出P值样本数据n个打开文件1- Making Comparison.JMP 分析路线图 单样本T步骤1: 检验稳定性步骤1: 检

14、验稳定性我们得到什么结论?是否有任何明显的变化趋势或模式,足以证明数据并非来自单一的总体/流程?步骤2: 检验正态性1234步骤2: 检验正态性P 值0.05,数据是正态步骤 3: 检验均值Ho: 均值(Bob) = 25Ha: 均值 (Bob) = 25我们得到什么结论?无法推翻零假设结论的陈述由于p值大于临界置信水平(本例中P=0.34680.05),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论:我们没有足够的证据拒绝零假设。是否可以说零假设是正确的(Bob的均值=25秒)? 不!但是,我们通常在假定零假设是正确的情况下执行操作。延伸如果问题是: “Bob的平均整理时长大于

15、25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”如何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?假设检验 - 双样本t检验“双样本t检验”解决什么问题?典型的问题为: “我们各抽取了坐席员Bob和Jane的30通电话样本,想知道坐席员A和B的平均话后整理时长是否相等?”当然问题也可以是“Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”建立零假设和备选假设: Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值决定显著性水平: = 0.05(5%)随机抽取Bob和Jane各30通电话的整理时

16、间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论按照以下步骤完成如果P值大于或等于0.05,不能推翻零假设 H0如果P值小于a,推翻零假设 H0JaneBob:1HJaneBob:0Hmmm=m选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25样本量在获取数据并试图得出一些陈述之前, 我们需要确定进行这种检验数要多少数据.记住, 我们有一些基于估计值的抽样“经验方法 Rules of Thumb并不要求Bob和Jane的两组样本量一定是相同的注意: 我们将在以后的模块中讲解样本量的计算工具或统计 最小样本量 平均值5 - 10 标准偏差 25

17、- 30 有缺陷的比例 (P) 100 并且 nP = 5 直方图 或帕累托图 50 散点图 25 控制图 20不同工具的样本量通常:连续数据: 30属性数据 100步骤1: 检验稳定性步骤1: 检验稳定性步骤2: 检验正态性123步骤2: 检验正态性步骤2: 检验正态性数据是否为正态分布 ?小 P-Value (.05), 数据为非正态分布注意样本大小的问題处理数据JMP喜欢数据按栏输入我们希望下列表格结构:测量的数据至于单独的一栏“标识符”在一栏在我们的范例中, 我们希望有下列栏:坐席员 Operator (用Bob 和 Jane 作为值)话后整理时长 Time (用所用 Bob 和 Ja

18、ne的通话时间值)我们显然希望这些数据按照测量值和答复电话的人之间适当的关系安排.JMP 能帮助我们完成这项任务堆叠数据为下一步进行数据格式转换数据变换步骤3: 等方差检验Ho: s(Bob) = s(Jane)Ha: s(Bob) = s(Jane)步骤3: 等方差检验我们得到什么结论?P-值!Equal Variance Not equal variance 方差不等时的解决方法步骤4:均值检验 Ho: Mean(Bob) = Mean(Jane)Ha: Mean(Bob) = Mean(Jane)步骤4:均值检验 我们得到什么结论?结论的陈述由于P值小于临界置信水平(本例中P=0.015

19、70.05,我们可以作出下述结论:我们有足够的证据拒绝零假设如果问题是: “Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”假设检验 多样本比较假设检验用于比较2个或更多数据样本的均值ANOVA检验陈述的原假设(null hypothesis)是所有样本的均值都相同Ho: a = b = c = d = e ANOVA检验陈述的备择假设(alternate hypothesis) 是至少有一个均值是不同的Ha: 至少一对 是不同的方差分析 ANOVA“方差分析(ANOVA)”解决什么问题?典型的问题为: “我们各抽取了坐席员Bob,

20、Jane和Walt的各30通电话样本,想知道坐席员的平均话后整理时长是否相等?”建立零假设和备选假设: Ho: Bob = Jane = san 三个坐席员的平均值彼此相等 Ha: 至少一对 是不同的 至少一个坐席员得平均值和其他人不同决定显著性水平: = 0.05(5%)随机抽取Bob和Jane各30通电话的整理时间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论按照以下步骤完成如果P值大于或等于0.05,不能推翻零假设 H0如果P值小于a,推翻零假设 H0选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25步骤1 & 2 不再重复步骤1:稳定性

21、检验分别使用控制图检验三名坐席员样本数据的稳定性步骤2:正态性检验分别使用分布图检验三名坐席员样本数据的正态性堆叠数据 数据变换步骤3: 等方差检验Ho: s(Bob) = s(Jane) = s(Walt)Ha: 至少一对S不相等步骤3: 等方差检验我们得到什么结论?P-值!步骤4:均值检验 Ho: Mean(Bob) = Mean(Jane) = Mean(Jane)Ha: 至少有一对均值不相等步骤4:均值检验 我们得到什么结论?步骤4:均值检验 从左侧圆环可以观察到相互之间是否相等ANOVA: 我们了解到什么?有一个操作员与其它操作员之间存在差异同样我们可以从菱形图看到, Walt 用的

22、时间比其它两位操作员用的长一些现在我们需要问 “为什么?”致使长于整体周期的根源是CWalt么?你将如何找到答案?假设检验 - 非正态(非参数检验)Mann-Whitney 检验查看工作表 2- Non-Normal Shipping 中的数据我们希望了解在周末和工作天期间发货的时间是否有差异 遵循分析路径图研究稳定性研究形状研究散布(离散程度)研究稳定性我们得到什么结论?研究正态性我们得到什么结论?我们得到什么结论?注意你一定要堆栈数据.研究等方差性p-值! P值不低, 所以我们说, 没有差异. Wilcoxon/Kruskal Wallis检验p-值! P值不低, 所以我们说, 没有差异.

23、 中位数检验总结全面的数据分析包括查看稳定性,形状,散布(离散程度),居中(中心趋势)和相关性T-检验 (单样本, 双样本) 检查居中, ANOVA (2个或2个以上样本) 检查居中等方差检验检查离散程度检验关系是下一步如要检查的卡方检验比例数据检验单比例检验例:缺陷品率 3 单比例检验.jmp以前,合同审批发现的不合格率为12%对过程进行了变更。从新过程抽样300个产品,其中45个存在缺陷是不合格品请问:过程是否得到了改善单比例检验步骤1.) 建立备选假设和零假设新过程产生12%或更多的的缺陷率新过程的缺陷率少于12%单比例检验步骤2.) 决定显著性水平a = 0.053.) 随机抽取数据抽

24、样数量为300发现有45个产品为缺陷品。b.) 决定显著性水平:a = 0.05c.) 随机抽取数据:抽样数量为300,发现有45个为缺陷品。d.) 计算P值:分析 分布 检验概率单比例检验步骤e.) 比较P值和显著性水平:P-value =0.9507 a = 0.05 0.951 0.05f.) 结论:所以我们不能否定零假设,流程没有得到改善!单比例检验步骤卡方分析检验相互关系:卡方检验当y和 x都是属性数据,要检验相互关系时使用我们假设变量是独立的。Ho: 数据是独立的 (不相关)Ha: 数据不独立 (相关)如果p值 c所以,我们否定零假设。因为比较计算的卡方和临界值这种查表的方法并不方

25、便,更常使用的方法利用软件直接计算 卡方值对应的P值(概率值)JMP 软件计算P值用JMP建立列联表和P数值分析 以X拟合YP值因为P值=0.000,小于 = 0.05,我们将否定零假设,既学院招生与性别之间并不是独立的,观察马赛克图可以看到教育学院女生比例较高结论JMP输出JMP输出进一步扩展使用“对应分析”可以看到,图中相距比较近说明而这之间具有紧密关系,例如教育学院和女生而这相距很近,而工程学院和男生距离很近。说明教育女生比例高,工程男生比例高卡方检验注释卡方检验是我们本周将学到的“较易分析”工具的一种,但它并不如其他假设检验那样“富有洞察力”属性数据的结果对于卡方检验,为了满足假设,期

26、望频率必须至少为5如果该值小于5 , 将告警数据必须确保随机性注意其他隐藏的因子 (Xs)范例: 贷款审批通过率JMP 工作表结构我们的信用审批部处理小宗商业贷款申请。许多申请得到批准,但有一些被拒绝。部门经理猜想拒绝率可能与该申请是哪天被处理的有关。她的猜想正确吗?打开文件 5- Loan Approval.JMP 范例: 贷款审批通过率P值0.05,表明贷款审批时间和通过与否存在显著相关性,本例中周五贷款通过率明显低于其他时间范例: 贷款审批通过率对应分析图中周五和拒绝距离比较近星期五是否不寻常?第一次卡方检验趋向于显示星期五与其他工作日不同。我们将通过把星期一到星期四相加编为一组,按照通

27、过/不通过计算数目,并与星期五的数据相比较。JMP 工作表结构星期五是否不寻常?P值0.05,表明周五贷款通过率确实和其它天存在显著差别其他几天呢?最后,我们不再分析星期五的数据,只分析星期一到星期四。我们试图发现剩下的几天之间是否有相互关系。JMP 数据表结构其他几天呢?较高的P值表示剩下的几天没有明显的相互关系。星期五才是我们要找的!还有哪些情况我能使用卡方检验?行政流程充满属性数据例如:职能: (Y) 和 (X)人力资源: 病假天数和员工或部门财会: 错误的费用报告数和员工或部门销售: 失去的销售额和帐户或区域或国家后勤: 迟到的交货次数和配送中心或国家呼叫中心: 错过的客户电话数和公司

28、人员或班次安装: 反复服务电话数和区域技术(field tech)采购: 订单的交货天数和供应商库存: 零件数和配送中心 如果你的数据成比例或百分比,将其转换为次数#实际意义明确问题“我关心吗?”P值可能显示统计上的意义样本容量越大,p值越小对非常大的样本容量而言,即使很小的差异或相互关系通常都比较显著在实际上这些细小的差异可能并不显著通过关注组间差异评估实际的显著性差异是否大到有所影响?如果是,那么在实际中这些差异就是显著的。既统计显著又实际显著的因子可以用于操作流程相关性分析与简单线性回归相关性从这张图我们可以看出什么?这些变量是否相关?相关性:它对我们意味着什么?当我们提到相关性时,我们

29、怎么想?广告投入是否与销售量有关?资本的利用与定价是否有关?你认为奥运会溜冰项目两个裁判员之间有多大的相关性?为什么当我携带雨伞时,天色看起来都不会下雨呢?相关性与回归分析当y和x都是连续数据,检验相互关系时使用假设变量不相关。 Ho: 数据独立 (不相关)Ha: 数据不独立 (相关)如果p值 0.05, 拒绝 HoX 数据单一 X多元 Xs Y 数据单一 Y 多元 Ys 多变量分析(注:此表和多变量图表不同)X数据离散 连续 Y 数据离散 连续 卡方检验逻辑 回归ANOVA均值/中位数检验回归分析X 数据离散 连续 Y 数据离散 连续多元回归逻辑 回归多元 中位数检验2, 3, 4 way.

30、ANOVA逻辑 回归多重 何时使用相关性和回归分析相关定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1 R 1 。按照惯例, R 表示 真实的 系数, R 表示我们的最佳估算。 R值取值范围从-1.0到 +1.0,即 -1 R 1 ,R值越接近+1或-1说明线性相关性越强R 0 意味着一个正线性相关,即是 Y 随着 X 的增加而增加。R=-1意味着一个完全负线性关系R=1 意味着一个完全正线性关系R=0 意味着无线性关系。相关系数:R1009080706050110100908070605040InputOutputR-Squared = 0.359Y = 25.7595 + 0.645418XModerate Positive Correlation弱的正相关强的正相关中等正相关弱

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论