版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、六西格玛基本统计2022/7/15六西格玛基本统计1基础统计理论目录4 1235 统计目的数据分类统计概述基本图表六西格玛度量的种类六西格玛基本统计1第一部分统计目的六西格玛基本统计1你看到了什么?六西格玛基本统计1你需要整个图片!六西格玛基本统计1数据的重要性数据是来自观察的,由一个过程所搜集得来的数据可让我们描绘过程,了解过程,改善过程甚至控制过程.Data 数据驱动决策和行动六西格玛基本统计1数据对六西格玛很重要使用统计学来解决真实的问题真实的解决方案统计学解决方案统计学问题真实的问题把问题转换为数字 (Y)定义 Y 的规格(可接受范围)理解(xi) 与流程输出(Y)的关系Y = f(x
2、1, x2, x3.)影响流程表现的关键因子是什么? 找到因子(xi)的水平和操作窗口, 保证输出 (Y) 是在可接受范围内控制输入 (xi) 避免输出/缺陷六西格玛基本统计1统计思想所有作业是相互关联的工序的系统例) 线路板作业过程原料投入贴插装清洗喷胶所有工序中都存在散布可避免原因不可避免原因同样原料同样生产工艺同样作业者同样方法发生散布统计思想是 遵守以下四种根本原则的学习,思考和实践的一种哲学。六西格玛基本统计1 调查散布和减少散布的活动减少工序散布的活动减少产品质量散布顾客满足费用降低考虑判断失误的错误注意从样本数据的结果判断时发生错误统计思想不是单纯的数字组合或计算,而是为质量革新
3、而思考的方法,也是思考的过程。统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维看待和分析问题,避免只看到表面层次的现象就去下结论作决策。统计思想举例:去年公司的顾客满意率为80%,今年调查了100位顾客,有85位顾客表示满意,满意率达到85%。能否说今年的顾客满意率比去年提高了5%?六西格玛基本统计1当重复测量时,经常产生不同的结果,这就是偏差偏差的类型: 通常原因的偏差: 测量中的差异是被期望的并可以预测的 特殊原因的偏差(随机): 测量中的差异是不可预测的偏差六西格玛基本统计1我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题如果所有的区域的产品的销售量完全相同,我
4、们将怀疑数据的真实性.偏差的存在使我们的工作更有挑战性我们通常不相信来源于单个数据的结果,通常收集多个数据并注意收集的方法以减少偏差结论:偏差是自然存在的,被期望的并是统计的基础偏差六西格玛基本统计1统计领域用下列方法处理偏差 描述型统计-用图表或总结性的数字(中心值,方差,标准偏差)来描述一系列数据的特征. 统计推论-当结果的差异可能因为随机偏差或不能归属为随机偏差时所作的决定。(置信区间和假设检验) 试验设计(DOE)-收集并分析数据,以估计过程并改变效果. 统计领域中偏差的处理六西格玛基本统计1过程偏差确定过程是否稳定 如果过程不稳定,鉴别并消除不稳定的要因 确定过程的平均值的位置 -
5、它在目标线上吗?如果不在,确定影响平均值的变量,并决定最优的设置以达到目标值 估计总散布的幅度 - 与顾客的要求(规格限)比起来,是可接受的吗? 如果不是, 确定散布源,而后消除或减少他们对过程的影响。 六西格玛基本统计1第二部分数据分类六西格玛基本统计1数据的种类不间断的总是可以以更小的单位来测量经常与测量系统一起出现不可以以更小的单位来测量只能选择几个有限的数值连续型的离散型的举例时间, 重量, 金额, 长度举例二元的: 男/女, 好/坏, Yes/no分类的: 周一-周日, 地点 (Paris, London, Beijing, .)计数: 一张发票上的错误数目, 一个月内发生意外的次数
6、六西格玛基本统计1连续型数据 益处 :1.能够为使用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率3. 能够预估发展趋势和情况 缺点 :1.通常较难得到数据2.分析更为复杂六西格玛基本统计1离散型数据 益处 :容易得到数据,并且计算方法简单2. 数据容易理解3. 数据随时可得 缺点 :1.无法显示缺陷怎样发生及过程如何变化2.不适合低缺陷率(需要大量的抽样)3.不能预测发展趋势和情况六西格玛基本统计1数据类型比较连续型数据离散型数据连续数据计数数据通常为正态分布通常为二项式分布或泊松分布实际数值合格/不合格实际定义严谨数据定义较差需少量抽样需大量抽样六西格玛基本统计1练习: 这是什么种类
7、的数据 ?申请贷款所需要的时间每张发票上的错误数目每张发票上的缺陷百分比一天内销售酒的数量导线的长度办公室的地点申请贷款所需要的时间 (天)销售人员一天内拜访的客户数量赢得招标的百分比销售人员的销售额销售人员的名字六西格玛基本统计1第三部分统计概述六西格玛基本统计1总体 想要测量对象的全部参数 用总体的所有数据计算出的数值(如均值, 标准差), 称为总体的参数 x参数总体平均值总体标准差总体统计学基本术语六西格玛基本统计1统计学基本术语样本 从总体抽出的部分数据统计量 用样本的所有数据计算出的数值(如均值, 标准差), 称为样本的统计量x统计量样本平均值样本标准差s总体样本六西格玛基本统计1描
8、述计量型数据集一组计量型数据能显示以下3个特性:中央趋势 (均值, 中值, 众数)变异(全距, 标准差, 方差)形状六西格玛基本统计1参数和统计量符号Mean 均值Variance 方差Standard Deviation标准差Proportion 比例总体(参数)样本(统计量) s2sp六西格玛基本统计1数据位置测量中心趋势均值中值众数四分值六西格玛基本统计1样本均值若样本(样本量为n)的观测值为x1,x2,xn,则样本均值为: 类似地,一个有着大量但限个(N个)观测值的总体,其总体均值 为:均值六西格玛基本统计1练习三10个连接线的拉拔强度为 : 230 240 236 248 252 2
9、78 265 262拉拔强度的均值是多少?10个观测值的均值为:均值六西格玛基本统计1练习四199X年一个行动中,战机进行了3000次战斗,总共用时6900小时。那末每次战斗平均用时多少?每次战斗平均用时为:注意所使用的符号均值六西格玛基本统计1均值的计算使用了每个观测值;每个观测值对均值都有影响。所有观测值对均值的偏差的总和为零。均值对极端的观测值很敏感,极端值会导致均值向他偏移。X x x x x x x6 3 5 1 2 7 4624均值的特性六西格玛基本统计1 将一组观测值按大小顺序排列,位于中心的数值即为中值 若观测值的个数为偶数,则中值为中间2个数值的平均 若观测值的个数为奇数,则
10、位于中心的数值即中值中值六西格玛基本统计1样本中值 假如x (1),x (2) ,x (n) )是按大小排序的样本值,则样本中值为: 中值的优点是不受极端大或极端小的观测值的影响。中值六西格玛基本统计1练习五假设一个样本观测值为 : 3 1 2 4 7 8 6 样本均值和样本中值是多少? 这2个值是测量数据中心趋势的合理指标吗? 中值六西格玛基本统计1(b) 假如最后一个数值改变为 : 3 1 2 4 7 8 2680 则样本平均值和样本中值是多少? 据此你有何结论? 中值六西格玛基本统计1Median vs Mean 中值与均值 因为中值不象均值对极端值敏感,因此,当有极端大或极端小值时,中
11、值比均值更能代表数据的位置 典型的例子是一个城市居民的收入中位值中值六西格玛基本统计1中值有时会有欺骗性50%-50% Rule ? 一半一半准则? 以下一组数据的中值是多少? 2,2,2,2,2,2,90可以用一半一半准则吗?六西格玛基本统计1众数是样本中出现次数最多的观测值。众数可以是唯一的,也可以有不止一个,有时并不存在众数。众数六西格玛基本统计1练习六如果样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 4 3 7 2 6 8 1众数是什么? 具有一个众数,两个众数或多于两个众数分布
12、的数据分布叫什么?(单峰分布)众数六西格玛基本统计1为何使用众数? 当观测值为分类式(如名义数据, 序列数据)时.众数是描述数据位置的最好的指标.典型的例子是,一个公司内员工收入的众数众数的重要信息当众数不止1个时,从中抽取样本的总体通常是多个总体 的混合众数六西格玛基本统计1均值、中值、众数的比较MOMeMeMO正态分布偏上分布偏下分布MOMeMOMeMOMe六西格玛基本统计1四分值 将一组按大小顺序排列的数据平均分为四部分,分界点即四分值. 第一四分值(低四分值),约25%的观测值小于它.第二四分值,约50%的观测值小于它, 即中值.第三四分值(高分值),约75%的观测值小于它.六西格玛基
13、本统计1练习七 以下为20个电灯泡失效期间的观测值, 已按递增顺序排列.210 216 252 300 366 454 624 720 816 924 12161296 1392 1488 1542 2480 2856 3192 3528 3710请确定三个四分值.计算方法:先确定位置再计算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/4四分值六西格玛基本统计1答案 Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20
14、+1)/4=3*21/4=15.75则:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.5四分值六西格玛基本统计1数据散布的测量(变异)Range 极差Variance 方差Standard Deviation 标准差Inter-Quartile Range 四分植极差 六西格玛基本统计1极差样本极差为样本中最大和最小观测值之间的差别,即:极差是测量数据散布或变异的最简单的方法但它忽略了最大和最小值之间的所有信息r =xmax - xmin六西格玛基本统计1试考虑以下的2个样本:
15、10 20 50 60 70 90 and 10, 40, 40, 40, 90具有相同的极差(r= 80)但是,第二个样本的变异只是2个极端数值的变异,而在第1个样本,中间的数值也有相当大的变异. 当样本量较小(n10)时,极差丢失信息的问题不是很严重极差六西格玛基本统计1方差与标准差若x1, x2, ,xn 是一个具有N个观测值的样本,则样本方差为:样本标准差是样本方差的算术平方根,即:六西格玛基本统计1方差计算练习八:计算下列观测值的方差和标准差.30 50 70 90 110 130 六西格玛基本统计1i xi xi-x (xi-x)2 1 30 -50 25002 50 -30 90
16、03 70 -10 1004 90 10 1005 110 30 9006 130 50 2500方差计算六西格玛基本统计1方差与标准差再考虑以下2个样本. Sample A : 10 20 50 60 70 90 Sample B : 10 40 40 40 40 90 Sample A Sample BRange 极差 80 80Variance 方差 ? ?Standard Deviation 标准差 ? ? 六西格玛基本统计1类似于样本方差S2,用总体的所数据计算出总体变异总体方差(2)总体的标准差()是总体方差的算术平方根 对于包含N个数值的有限总体,其方差为: 2=方差与标准差六西
17、格玛基本统计1方差特性 方差计算使用了所有观测值,每个观测值对方差都有影响 方差对极端值很敏感,因平方的缘故,极端大的观测值会严重的放大方差。六西格玛基本统计1四分值极差 四分值极差是测量散布的另一指标:IQR=Q3-Q1 四分值极差不如极差对极端值敏感 当分布显著不对称时,用它衡量散布会更好 样本(10,20,50,60,90)和(10,40,40,40,90)的四分值极差分别是40和0.六西格玛基本统计1正态分布正态分布是一种具有特定的、非常有用的特性的数据分布 这些特性对我们理解所研究之过程的特性十分有用大部分自然现象和人造过程是正态分布或可有正态分布描述六西格玛基本统计1标准正态分布标
18、准正态分布,也叫Z分布,有下列参数:Z代表距离均值的标准差的数量=0 =1 -4 -3 -2 -1 1 2 3 4 六西格玛基本统计1特性 1 :只需知道下述两项参数就可完整描述正态分布均值标准差分布 1分布 2分布 3此三项正态分布有何区别?正态分布六西格玛基本统计1正态曲线和概率特性 2 :曲线下面的面积可用来估算某一特定事件发生 的累积概率得到在两个值之间的某个价值的累积概率99.73%95%68%离均值的标准差数目样本值的概率40%-30%-20%-10%-0%-六西格玛基本统计1正态分布特点-3-2-112368%95%99.73%Standard Deviation标准差Avera
19、ge标准差六西格玛基本统计1正态曲线下的区域分析过程能力时,我们运用正态曲线下的区域预测超过规格界限的产品所占的比例.5%5%规格上限USL规格下限LSL六西格玛基本统计1标准差的经验规则 当一组数据不是最理想正态分布时,前述累积概率规则仍可 应用比较理论(理想)正态分布和经验(现实)分布Number of Standard Deviations 标准差数目Theoretical Normal 理论正态Empirical Normal经验正态+/- 168%60-75%+/- 295%90-98%+/- 399.7%99-100%六西格玛基本统计1长期和短期能力(Z-偏差)ZLT=ZST-1.
20、5 Sigma水平 短期DPMO 长期DPMO 1158655.3691462.5 2 22750.1308537.5 3 1350.0 66807.2 4 31.7 6209.7 5 0.3 232.7 6 0.0018 3.4六西格玛基本统计1第四部分基本图表六西格玛基本统计1这是什么? 4.5 3.9 1.4 5.6 3.3 6.0 4.0 4.6 6.7 7.9 5.0 3.6 5.6 3.5 6.8 5.6 6.0 5.4 6.6 6.6 0.0 5.0 3.7 3.6 5.8 4.3 3.0 5.4 5.3 8.5 4.5 4.1 2.5 3.6 4.2 4.2 3.0 4.3 7
21、.0 5.6 3.6 3.9 5.3 4.5 5.7 3.2 4.1 3.9 4.9 7.2 6.8 3.7 3.7 4.9 5.9 3.9 4.2 2.2 3.7 6.7 2.6 3.7 2.2 3.8 2.2 4.6 4.4 6.0 4.5 7.5 4.2 3.8 3.0 4.9 4.7 4.4 8.3 4.9 6.8 7.6 5.7 3.7 3.6 5.6 4.0 4.7 3.9 2.9 5.0 6.8 4.2 5.3 6.5 2.9 3.1 3.2 3.9 5.7 7.6 7.0 顾客等待时间例如: 你是 Pizza Hut 的一个门店的经理. 你要求你的助理记录每个顾客的等待时间,
22、今天你已经有了100个数据. 六西格玛基本统计1观察顾客等待时间(Rate)打开PUMPING.MPJ RATE 转换为变量.时间序列图六西格玛基本统计1时间序列图垂直轴(Y)显示被测变量的规模每个点代表一个实际的价值点是用一条线连接帮助视觉分析运行秩序等待时间(分钟)水平轴(X)反映了一段时间或序列顾客等待时间六西格玛基本统计1观察顾客等待时间(Rate)打开PUMPING.MPJ RATE 转换为变量.直方图六西格玛基本统计1等待时间(分钟)一个类别或等待的时间间隔Class “j”Class “k”Class “l”频率直方图六西格玛基本统计1产生具有正态曲线的直方图直方图六西格玛基本统
23、计1频率最高频率(数量的点)等待时间(分钟)顾客等待时间的直方图水平轴(x)显示测量范围的变量钟形曲线纵轴(y)显示的频率直方图六西格玛基本统计1观察顾客等待时间(Rate) 打开PUMPING.MPJ 文件RATE 作为变量.点图六西格玛基本统计1Minitab 结果采集100位顾客实际的等待时间,作图如上。每一个点代表一个具有给定值输出的“事件”。随着点的积累,顾客等待时间的实际表现的特性可被看作一个 “分布”。 点图六西格玛基本统计1是各分布差异容易把握的数据调查方法. 让我们顾客等待时间打开文件 PUMPING.MPJ用列RATE 作为变量箱线图六西格玛基本统计1Minitab 结果9
24、0%75%50%25%10%Outlier箱线图可以体现数据扩散性及中心. 注意 ! 箱线图中的中心线不是 平均 而是 中心值. 箱线图六西格玛基本统计1第五部分六西格玛度量的种类六西格玛基本统计1 Defect 缺陷 Unit 单位 Opportunity 机会 DPU(Defects Per Unit) 单位的缺陷数 DPO(Defects Per Opportunities) 单位缺陷机会数 DPMO(Defects Per Million Opportunities) 百万单位缺陷机会 RTY(Rolled Throughput Yield) 过程通过率(受率) Sigma Level
25、 (Z值) Z值的转换方法 Cp&Cpk (工程能力指数)6Sigma度量的种类六西格玛基本统计1 Defect(缺陷): - 所有诱发顾客不满足的 - 所有与规定基准不一样的 - 所有导致产品和服务质量下降的 Unit(单位) - 产品和服务等流程过程中的对象或传递给顾客的最终产品和 服务(一块单板,一批原材料,一个合同,一笔贷款,一份报表等) Opportunity(机会) - 一个产品和服务可能脱离基准的机会数 - 是可测量的用语的意思六西格玛基本统计1 DPU (Defects Per Unit): - 单位缺陷数 - 例如:一个数据报表上有100个数据,其中有5个数据错误 -DPU=
26、 Defects/ Unit=5/1=5 DPO (Defects Per Opportunities) - 机会缺陷数(每个机会出现缺陷的概率) - 例如:一个数据报表上有100个数据,其中有5个数据错误 - DPO= Defects/(Unit数*Opportunity)=5/(1*100)=0.05 DPMO (Defects Per Million Opportunities) - 百万机会缺陷(PPM) - DPMO=DPO*1,000,000=50000PPM用语的意思六西格玛基本统计1注意:机会只有在被评价时才计算为机会例) ZXJ10交换机中的一种单板在生产过程中缺陷发生的机会
27、数为100,000次.但是在正常生产过程中只对其中1,000次机会进行评价,且在一个单板中发现了10个缺点.下列计算中哪一个正确?DPO = 10/100,000DPO = 10/1,000例题六西格玛基本统计1下面单板例子中计算DPU与DPMO.圆圈表示评价元器件的个数,黑色表示功能失效元器件.例题六西格玛基本统计1一个单位发生的总缺点机会数1,000,000 x DPU=DPMO 一般说6 SIGMA水平时把不良率说成3.4DPMO比3.4PPM更恰当 适于互相不同的Process或产品间,制造范筹和非制造范筹间的比较 DPMO的计算例题六西格玛基本统计1总缺点数=DPU总生产单位数DPU的计算例题六西格玛基本统计1例题:为了掌握固定资产申购过程的现况,整理了今年1月份到6月份的固定资产申购单,总共有678份,每份申购单要求事业部填写12项内容的信息,经过整理发现共有1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度硅酮胶绿色生产技术合同
- 2025年度海富通中债1号债券基金品牌合作与联合营销合同
- 2025年度航空货运代理佣金结算合同范本
- 2025年度文化旅游合伙经营公司合同范本
- 二零二五年度影视制作基地租赁合同补充协议3篇
- 2025年度智能设备购销合同及供应链管理服务协议
- 2025年度股权质押贷款合同范本(含风险控制条款)
- 2025年度合租房租租赁合同(含社区健身房及瑜伽教练)
- 住宅项目整体建设承包合同2024版版B版
- 二零二五年度二手房买卖合同备案与过户服务协议3篇
- 2024年全国职业院校技能大赛高职组(生产事故应急救援赛项)考试题库(含答案)
- 老年上消化道出血急诊诊疗专家共识2024
- 广东省广州黄埔区2023-2024学年八年级上学期期末物理试卷(含答案)
- 学校安全工作计划及行事历
- 《GMP基础知识培训》课件
- 数学家华罗庚课件
- 贵州茅台酒股份有限公司招聘笔试题库2024
- 《纳米技术简介》课件
- 血液透析高钾血症的护理查房
- 北京房地产典当合同书
- 文学类文本阅读 高一语文统编版暑假作业
评论
0/150
提交评论