六西格玛数据技术2_第1页
六西格玛数据技术2_第2页
六西格玛数据技术2_第3页
六西格玛数据技术2_第4页
六西格玛数据技术2_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

六西格玛管理培训丛书(5)何晓群主编

六西格玛数据分析技术何晓群编著光盘作者:陶沙苏晨辉中国人民大学出版社

3.1

随机变量

3.2

随机变量的分布

3.3

随机变量的均值与方差

3.4

二项分布及其应用

3.5

泊松分布及其应用

3.6

正态分布及其应用

3.7

中心极限定理

3.8

各种概率分布计算的Minitab实现

小组讨论与练习第3章管理中常见的几个概率分布σσσσσσσσσ返回目录本章目标1.理解随机变量及随机变量分布的基本概念2.理解随机变量的均值及方差在管理中运用的思想3.理解二项分布的意义,掌握二项分布的应用4.掌握泊松分布的意义和应用理念5.理解正态分布与6σ的关系6.理解中心极限定理的意义7.掌握各种概率分布的计算实现返回目录3.1

随机变量

日常生活中,生产实践中随机现象无处不在把随机现象的结果用变量来表示,就称为随机变量随机变量是随机现象表示的一种抽象,有了这种抽象,使得我们的研究更具普遍性。常用大写的字母X,Y,Z等表示随机变量,随机变量的取值常用小写字母x,y,z等表示。随机变量有离散型和连续型两大类返回目录离散型随机变量定义:如果一个随机变量的取值是可数的,则称该随机变量是离散型随机变量。离散型随机变量是仅取数轴上有限个点或可列个点x1x2x3x4x5x6x7X图1公路上的汽车完好瓷砖的数目返回目录连续型随机变量定义:如果一个随机变量可取数轴上某一区间内的任一值,则称该随机变量为连续型随机变量。连续型随机变量的取值可以是整个实数轴上的任一区间(a,b)(如图2)。abX图2返回目录3.2

随机变量的分布随机变量的取值的统计规律就是随机变量的分布。知道了一个随机变量的分布就掌握了它的关键。离散型随机变量的分布。随机变量X可能取哪些值,X取这些值的概率各是多大?连续型随机变量的分布。随机变量X在哪个区间上取值,它在任意小区间取值的概率是多少?返回目录离散型随机变量的分布离散型随机变量的分布常用下面表格形式的分布列来表示:用数学表达式表示即为:P(X=xi)=pi,i=1,2,…,n离散型随机变量的分布应满足概率公理化定义的要求,即pi≥0,p1+p2+…+pn=1掷一枚骰子出现的点数及其概率就可用离散型随机变量的分布列表示:

X x1x2¨¨xnP p1p2¨¨pn

X(出现的点数) 123456

P(所对应的概率) 1/61/61/61/61/61/6返回目录连续型随机变量的分布连续型随机变量X,它可取某一区间内的所有值,但它的取值不能逐一列出。我们用函数f(x)表示随机变量X的密度函数。用概率密度函数f(x)来反映随机变量X在某一区间取值的统计规律性连续型随机变量取某一固定值的概率为零在6σ管理中用连续型随机变量X常常表示产品的某种质量特性,譬如啤酒的装量、电子元件的灵敏度、电子产品的寿命等。返回目录质量特性与概率密度函数在生产制造业的管理现场我们常常要抽取若干样品测定某种产品的质量特性X。如在啤酒厂今天生产的啤酒中随机抽取若干瓶量测它们的装量(ml),就可用直方图表示它们的质量特性。随着测定的数量越多,直方图就会演变成一条光滑曲线,这就是所谓的概率密度函数曲线,它就刻画出隐藏在质量特性X随机取值后面的统计规律性。这条光滑曲线f(x)告诉了我们什么信息?

640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL返回目录概率密密度曲曲线的的几种种不同同情形形在管理理现场场,不不同产产品的的不同同质量量特性性所表表现的的概率率密度度曲线线不同同,这这决定定了形形状不不同,,散布布不同同,位位置不不同。。正是是这些些不同同的曲曲线形形式决决定了了质量量特性性的差差别。。正态偏态形状不不同散布不不同位置不不同返回目目录概率密密度函函数的的性质质概率密密度曲曲线的的纵轴轴在做做直方方图时时,它它是“单位长长度上上的频频率”,由于于频率率的稳稳定性性,于于是用用概率率代替替了频频率,,从而而纵轴轴就演演变成成为“单位长长度上上的概概率”,这也也是为为什么么把密密度曲曲线称称为概概率密密度曲曲线的的缘由由。连续型型随机机变量量的密密度函函数f(x)具有如如下性性质::1.2.3.其中表表示质质量特特性值值在区区间(a,b)中的概概率。。这里涉涉及到到积分分概念念,不不必感感到忧忧虑,,因为为积分分计算算不是是重点点。f(x)xab返回目目录3.3随机变变量的的均值值与方方差前面第第1章中看看到的的具体体数据据可以以用均均值和和方差差来分分别描描述数数据的的集中中趋势势和离离种趋趋势,,随机机变量量也有有均值值和方方差的的概念念,用用它们们分别别表示示分布布的中中心位位置和和分散散程度度。在掷骰骰子例例子中中,每每次掷掷下后后出现现的点点数不不仅相相同,,平均均出现现的点点数是是多少少?在在啤酒酒的装装量测测定中中,每每瓶啤啤酒的的装量量严格格来说说都不不一样样,它它们的的平均均装量量是多多少??这就就是随随机变变量的的均值值问题题。相对均均值而而言,,每次次掷骰骰子出出现的的结果果都在在它的的左右右,那那么平平均的的偏差差有多多大??假如如一批批瓶装装啤酒酒的平平均装装量是是640ml,各瓶瓶偏离离640ml的多少少都不不一样样,它它们平平均偏偏离是是多少少?这这就是是随机机变量量的方方差及及标准准差问问题。。返回目目录随机变变量均均值与与方差差的理理解生产或或服务务过程程中的的差别别是难难以避避免的的。生生产过过程中中由于于种种种随机机因素素的影影响,,使得得我们们无法法避免免变异异的产产生。。在扔飞飞镖时时,谁谁都想想发发发命中中靶心心,可可遗憾憾的事事常常常发生生!计算多多次投投标的的平均均结果果就是是求均均值,,计算算相对对均值值的离离散程程度就就是计计算方方差。。5432154321如何理理解上上面两两图的的结果果返回目目录如何理理解直直方图图直方图图的上上下公公差限限的总总宽度度是对对生产产能力力的一一个设设计。。在大大部分分时间间里,,生产产运行行的结结果就就在这这一区区间上上发生生。譬如,,根据据啤酒酒装量量的抽抽检数数据建建立了了如下下的直直方图图T废品废品期望值值640返回目目录直方图图的解解释图形纵纵轴表表示在在某一一范围围内量量测到到的数数目,,公差差限以以内就就是合合格品品,出出了公公差限限就是是废品品。上图中中的T值就是是均值值(640ml),也即即数学学期望望。这这是一一个理理想值值,也也就是是说,,设计计人员员期望望每瓶瓶啤酒酒的装装量正正好是是640ml,然而而由于于种种种说不不清道道不明明的原原因的的影响响,不不可能能,也也不存存在正正好的的640ml,于是是只要要在上上下公公差限限之内内的都都是合合格品品,出出了上上下公公差限限的就就是废废品。。假如总总共抽抽检了了300瓶啤酒酒,有有10瓶低于于下规规格限限LSL,15瓶超过过了上上规格格限USL,因此此,这这批产产品的的废品品率是是25/300=0.083合格率率是1-0.083=0.917,即合合格率率为91.7%返回目目录实际与与理想想的差差距我们应应该意意识到到,一一个生生产过过程内内在的的精度度不是是由设设计人人员及及设计计方案案所规规定的的。就就像我我们扔扔飞镖镖每一一发都都想命命中靶靶心,,但往往往事事与愿愿违。。提高质质量的的核心心就是是优化化流程程,减减小变变异,,提高高生产产流程程内在在的精精度。。这是是6σ管理的的精髓髓。返回目目录6σ管理的的目标标是缩缩小实实际与与理想想的差差距T是目标标值,,期望望值,,设计计值。。然而而常常常在生生产实实际中中,生生产实实际的的中心心值会会发生生变化化,偏偏离目目标值值。这这也说说明实实际生生产结结果的的中心心值是是独独立于于设计计值规规定的的目标标值(T)的。6σ管理的的目的的就在在于优优化流流程,,减小小变异异,使使实际际生产产结果果的中中心值值尽可可能与与设计计的目目标值值重合合。LSLUSLT返回目目录均值的的计算算公式式离散型型随机机变量量的数数学期期望((均值值)连续型型随机机变量量的数数学期期望返回目目录均值计计算举举例例3-1.掷骰子子试验验中出出现的的点数数用随随机变变量X表示,,随机机变量量X的均值值(数学期期望)为即掷骰骰子出出现的的结果果很不不一样样,但但它们们的平平均取取值是是3.5例3-2.电子产产品首首次发发生故故障((需要要维修修)的的时间间通常常遵从从指数数分布布。譬譬如某某种品品牌的的手机机首次次发生生故障障的时时间T(单位::小时时)遵从指指数分分布问计算算这种种品牌牌的手手机首首次需需要维维修的的平均均时间间是多多少小小时。。解:即这种种品牌牌的手手机首首次需需要维维修的的平均均时间间是10000小时。。返回目目录方差的的计算算公式式离散型型随机机变量量的方方差连续型型随机机变量量的方方差由于方方差不不能带带单位位,故故用标标准差差来刻刻画随随机变变量相相对均均值的的离散散程度度返回目目录方差计计算举举例例3-3.掷骰子子问题题中,,出现现点数数的平平均值值是3.5,每次次取值值相对对于均均值的的离散散程度度是多多大??解:即相对对均值值平均均偏离离1.71点。可以证证明,,指数数分布布的均均值与与标准准差相相等,,即例3-2中某种种品牌牌的手手机首首次需需要维维修的的平均均时间间是10000小时,,即标标准差差σ也为10000小时。。标准准差如如此之之大有有点不不好理理解。。然而而,凡凡是遵遵从指指数分分布的的产品品寿命命问题题就是是这样样,也也即你你的期期望越越高,,标准准差必必然就就大。。实际际中,,也确确有同同一品品牌的的手机机有的的刚刚刚使用用就遇遇到故故障,,而有有的用用了好好几年年也不不需修修理。。返回目录3.4二项分布及及其应用二项分布的的概率计算算公式:其中是是从从n个不同元素素中取出x个的组合数数,计算公公式为:二项分布的的概率计算算公式中有有两个重要要的参数,,一个是n,一个是p,故通常把把二项分布布记为B(n,p)返回目录一个产品检检验的例子子例3-4.已知某生产产流程生产产的产品中中有10%是有缺陷的的,而该生生产流程生生产的产品品是否有缺缺陷完全是是随机的,,现在随机机选取5个产品,求求其中有2个产品有缺缺陷的概率率是多大??解:这是一一个符合二二项分布情情形的问题题。设X为抽取的5个产品中有有缺陷的产产品的个数数,则X是遵从二项项分布B(5,0.1)的随机变量量。某一产产品有缺陷陷的概率为为p=0.1,n=5。择所要求求的概率为为:类似可以计计算出在抽抽取的5件产品中有有0、1、3、4、5个产品有缺缺陷的概率率分别为返回目录二项分布的的均值与标标准差可以证明,,如果随机机变量X~B(n,p),它们的均值值、方差、、标准差分分别为:在例3-4中,二项分分布B(5,0.1)的均值、方方差与标准准差分别为为:二项分布的的计算在n很大时,像像上面的那那样的运算算是很麻烦烦的,然而而,通常可可以通过查查二项分布布表直接解解决这一问问题,或通通过Minitab软件计算。。返回目录3.5泊松分布及及其应用单位产品缺缺陷数的概概念在任何生产产流程中,,缺陷的出出现难以避避免缺陷的出现现完全是随随机的如果50件产品发现现了50处缺陷,则则单位产品品的缺陷数数为1生产一件产产品无缺陷陷的最大可可能性是多多少?一件产品保保证不再返返工或修理理的最大可可能性是多多少?返回目录某一产品无无缺陷的最最大可能性性是多大??假设某种产产品由10个零部件组组成设零部件有缺陷的概率是0.10该零部件无缺陷的概率是0.90重要结论:该种产品无缺陷的最大可能性是34.87%返回目录零件数和单单位产品缺缺陷数(DPU)10100100010000100000.3480.3500.3520.3540.3560.3580.3600.3620.3640.3660.36800.9010=.348680.991000.99910000.9999100000.99999100000零件数产生合格率率(以DPU=1为例)返回目录对缺陷模型型的泊松模模拟(DPU=1)当零件数趋趋于无限时时,我们可可以注意到到合格品率率趋于:泊松公式::其中,d/U是单位产品品缺陷数,,r是缺陷实际发生生的数量。。因此,当当r=0时,就可得到单单位产品无无缺陷的概概率。注意:它不不同于传统统意义上的的产品合格格率。例如合合格产品的的数量比上上所有被检检验产产品品的的数数量量。。rP(r)00.3678810.3678820.1839430.0613140.0153350.0030760.0005170.0000780.0000090.00000100.00000110.00000120.00000130.00000140.00000∑1.00000返回回目目录录泊松松分分布布的的更更一一般般情情形形泊松松分分布布常常用用来来描描述述在在一一指指定定时时间间、、面面积积、、体体积积之之内内某某一一事事件件出出现现的的个个数数的的分分布布。。譬譬如如::1.修一一条条铁铁路路,,每每月月出出的的伤伤亡亡事事故故数数2.在某某一一单单位位时时间间内内,,某某种种机机器器发发生生的的故故障障数数3.一辆辆汽汽车车的的表表面面上上的的斑斑痕痕数数4.你的的手手机机每每天天接接到到的的呼呼唤唤次次数数泊松松分分布布的的一一般般数数学学形形式式是是::其中中为为某某种种特特定定单单位位内内的的平平均均数数。。在在研研究究产产品品缺缺陷陷问问题题中中返回回目目录录一个个实实际际例例子子例3-5.某一一大大型型矿矿山山每每年年发发生生工工伤伤事事故故的的平平均均次次数数为为2.7,如如果果企企业业的的安安全全条条件件没没有有质质的的改改变变,,则则下下一一年年发发生生的的工工伤伤事事故故小小于于2的概概率率是是多多少少??解::设设X为下下一一年年发发生生的的工工伤伤事事故故数数,,则则X遵从从为为2.7的泊泊松松分分布布,,于于是是X遵从从的的分分布布为为于是是可可算算得得即下下一一年年发发生生工工伤伤事事故故数数小小于于2的概概率率为为24.866%。可以以证证明明泊泊松松分分布布的的均均值值与与方方差差相相等等,,且且均均为为λ,即即返回回目目录录用泊泊松松分分布布近近似似二二项项分分布布通常常在在实实际际应应用用中中,,当当时时,,用用泊泊松松分分布布近近似似二二项项分分布布效效果果良良好好。。例3-6.已知知某某种种电电子子元元件件的的次次品品率率为为1.5‰,在在一一大大批批元元件件中中随随机机抽抽取取1000个,,问问次次品品数数为为0,1,2,3的概概率率是是多多少少??解::把把“电子子元元件件的的次次品品数数”看成成随随机机变变量量X,显显然然X遵从从二二项项分分布布B(1000,0.0015)。如如果果直直接接利利用用二二项项分分布布公公式式求求解解,,就就要要计计算算显然然,,计计算算量量很很大大!!返回回目目录录用泊泊松松分分布布近近似似二二项项分分布布((续续))如果果用用泊泊松松分分布布去去近近似似计计算算,,则则泊松松分分布布与与二二项项分分布布计计算算结结果果的的比比较较P(X=x)二项分布泊松分布绝对差P(X=0)0.2228790.2231300.000251P(X=1)0.3348210.3346950.000126P(X=2)0.2512410.2510210.000220P(X=3)0.1255580.1255110.000047返回回目目录录3.6正态态分分布布及及其其应应用用随机机变变量量X~N(μμ,σσ2)的正正态态分分布布曲曲线线:曲线线拐拐点点的的横横坐坐标标σ或sP(a<X<b)=?返回回目目录录不同同的的μ、σ对应应的的正正态态曲曲线线σ相同同,,μ不同同的的情情况况μ相同同,,σ不同同的的情情况况返回回目目录录当σ不变变时时,,不不同同的的μ对应应的的曲曲线线形形状状不不变变,,仅仅仅仅是是位位置置不不同同。。而而当当μ不变变时时,,不不同同的的σ对应应的的曲曲线线形形状状不不同同,,σ大的的曲曲线线较较矮矮胖胖,,σ小的的曲曲线线较较瘦瘦高高。。因因此此μ反映映了了曲曲线线的的位位置置,,是是位位置置参参数数,,它它是是正正态态随随机机变变量量的的平平均均值值,,也也称称μ为正正态态变变量量的的均均值值(或数数学学期期望望)。σ反映映了了曲曲线线的的形形状状,,即即随随机机变变量量取取值值的的离离散散程程度度,,是是形形状状参参数数(也称称尺尺度度参参数数),称称σ为正正态态变变量量的的标标准准差差,,σ2为其其方方差差。。常常记记为为返回回目目录录标准准正正态态分分布布蓝色色部部分分的的面面积积::P(-3σσ<X<3σσ)=0.9973返回回目目录录当μ=0,σ=1时,,称称随随机机变变量量X遵从从标标准准正正态态分分布布,,记记为为。。如如果果一一个个随随机机变变量量X遵从从标标准准正正态态分分布布,,则则其其取取值值落落在在横横轴轴上上任任意意区区间间的的概概率率可可通通过过标标准准正正态态分分布布表表查查出出。。标准正态分分布的分布布函数用表表示,即例:当时时,,即返回目录把一般正态态分布转换换为标准正正态分布返回目录把一般正态态分布转换换为标准正正态分布1.当时时,,要通过变变换公式把把一一般正态分分布转换为为标准正态态分布2.当转换为标标准正态分分布后,查查相应的标标准正态分分布表3.对于,可由获获取4.当时时,直接查查表即可5.当时时,有公式式:返回目录例3-7:某批零件的的长度遵从从正态分布布,平均长度为为10mm,标准差为为0.2mm.试问:(1)从该批零零件中随机机抽取一件件,其长度度不到9.4mm的概率是多多少?(2)为了保证证产品质量量,要求以以95%的概率保证证该零件的的长度在9.5mm~10.5mm之间,这一一要求能否否得到保证证?解:已知X~N(10,0.22)(1)P(X<9.4)=φφ((9.4-10)/0.2)=φφ(-3)=0.00135返回目录-2.52.59.510.5(2)P(9.5<x<10.5)=φ((10.5-10)/0.2)-φ((9.5-10)/0.2)

=φφ(2.5)-φ(-2.5)=2φφ(2.5)-1=0.98758P(9.5<X<10.5)=?P(-2.5<z<2.5)=?Z=(X-μ)/σ即可以用98.76%的概率保证证该批零件件的长度在在9.5mm~10.5mm之间返回目录6σ与正态分布布99.9937%99.999943%99.9999998%99.73%68.27%95.45%返回目录USL不考虑漂移移时6σ水准的合格格率为99.9999998%1/10亿LSL1/10亿USLLSL1/10亿0.999999998返回目录规格范围LSLUSL0.001ppm1350ppm0.001ppm1350ppm标称值=μ西格玛水平平和对应的的合格率一个容易引引起误会的的比较图返回目录流程II流程I与流程II的比较方差方差>上下限内曲线的面积上下限内曲线的面积<上下限内所容s个数上下限内所容s个数<流程I流程IILSLUSL流程I(样本均值值)返回目录3σ流程与6σ流程的比较较3σ流程LSLUSL

合格6σ流程

合格由客户决定由客户决定废品0.001ppm废品0.001ppm6σ流程比3σ流程好得多多!废品1350ppm废品1350ppm返回目录LSLUSL1.5σ的漂移如果你达到到了6sigma质量水准,,就意味着着在有100万个出现缺缺陷的机会的流流程中,实实际出现的的缺陷仅为为3.4个6σ7.5σ1.5σ6σ当考虑漂移移后:6σ<≠>十亿分之二二次品率6σ<=>3.4ppm期望流程流程平均值值的漂移4.5σ面积约等于于百万分之之3.4返回目录3.8各种概率分分布计算的的Minitab实现二项分布以例3-4为例1、在工作表表中填入1-5(因为选取了了五个产品品)2、选取Calc>ProbabilityDistributions>Binomial.3、选取Probability.4、在Numberoftrials(试验次数)栏中,填入5.在Probabilityofsuccess(成功概率)栏中,填入0.10.5、选取Inputcolumn并选择数据据列.点击OK.返回目录用Minitab计算二项分分布概率输入数据选取Calc>ProbabilityDistributions>Binomial.返回目录录用Minitab计算二项项分布概概率(续)在Numberoftrials(试验次数数)栏中,填入5.在Probabilityofsuccess(成功概率率)栏中,填入0.10.选取Inputcolumn并选择数数据列.点击OK计算得5个产品中中有2个产品有有缺陷的的概率是是0.0729返回目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论