版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基本统计概念第一页,共四十九页,2022年,8月28日统计概念解释以下基本统计概念。1. 波动(偏差)2. 连续数据和离散数据3. 平均值、方差、标准差4. 正态曲线5. 用Z值将数据标准化6.中心极限定理7. 过程能力 -使用Z值作为衡量工序能力的指标 -通过改进关键值Xs来改进Y8.稳定性因子第二页,共四十九页,2022年,8月28日波动所有的人不会都是同样的高度;所有的葡萄不可能同一天采摘问题:你期望存在波动吗?什么类型的波动?第三页,共四十九页,2022年,8月28日观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是波动!系统波动预期的和可预测的测量结果之间的差异。举例:夏季和冬季的空调的销售量不同。随机波动不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的结果。1.2.第四页,共四十九页,2022年,8月28日观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了问题。. 如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。波动的产生是很自然的,意料之中的,是统计学的基础第五页,共四十九页,2022年,8月28日统计学的作用统计学用以下方法处理误差: (置信区间和假设检验)。统计描述用图表和几个总结性数字(均值、方差、标准差)描述一组数据。统计推理确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。
收集并分析数据,以估算过程变化的影响。
试验设计第六页,共四十九页,2022年,8月28日数据的两种类型
连续(可变)数据
使用一种度量单位,比如英寸或小时。
离散(属性)
数据是类别信息,比如““通过”或““未通过”。连续数据离散数据问题解决办法举例: 部件号 离散 连续 1 通过 2.031 2 通过 2.034 3 未通过 2.076 4 通过 2.022 5 未通过 2.001第七页,共四十九页,2022年,8月28日连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。你能举出我们用来获得连续数据的三个器具例子吗?相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。连续数据(也称为可变数据)第八页,共四十九页,2022年,8月28日离散数据不能更进一步精确地细分。
离散数据是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。离散数据(也包括属性或类别数据)地区亮和不亮第九页,共四十九页,2022年,8月28日离散数据一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。.连续数据与离散数据进行比较的解释: 离散数据举例:有凹痕的部件数量 通过/未通过申诉决议 产出生产线不合格品数量 及时交货离散数据需要更多的数据点才能进行有效的分析第十页,共四十九页,2022年,8月28日请在下面的例子旁,写出它是“连续”还是“离散”1销售订单准确度2数据输入准确度3销售地区4使用“合格/不合格”测量仪器得到的孔径5孔径6应答中心对话时间7制冷氟利昂的重量(克)8每百万部件中有缺陷部件的数量9装配线缺陷(ALD)应用你所学到的东西第十一页,共四十九页,2022年,8月28日总体-全组数据,全部对象。 -一个总体中的元素数量用N来表示样本-总体的一个子集 -样本的元素数量用n来表示平均值-总体或样本的平均值-总体的平均值用来表示样本的平均值用X或来表示方差-数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用表示
-样本的方差用s2或表示均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用来表示
-样本的标准差用s或来表示统计学术语^^^-第十二页,共四十九页,2022年,8月28日统计学术语和定义总体-全部对象.举例–1998年5月在深圳生产的所有的21英寸彩电样本-代表总体的一个子集数据。举例-1998年5月在深圳生产的一百二十台21英寸彩电举例:这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。第十三页,共四十九页,2022年,8月28日平均值-总体或样本的平均值。 用x或来表示样本,用来表示总体。举例:给定一个样本:{1,3,5,4,7},平均值就是:统计学术语和定义x
=
xn在这里X1是样本的第一个点,
Xn是样本的最后一个点。.i1nå,平均值的公式
x=(1+3+5+4+7)=20=4.0 55样本的平均值等于4。^第十四页,共四十九页,2022年,8月28日标准差-衡量数据分散程度的一个指标。一般用表示总体,用s
或表示样本。=(Xi-)2i=1NN总体的公式方差-与平均值之差的平方的平均值。一般用s2或2来表示。
=
S=(Xi-X)2i=1nn-1样本的公式统计学术语和定义^^第十五页,共四十九页,2022年,8月28日举例课堂举例:计算样本{2,6,4}的方差和标准差首先计算均值:(2+6+4)/3=12/3=4计算平均值、方差和标准差x
=
xn
ii=1ns2=n(Xi-X)2i=1n-1
s=(Xi-X)2i=1nn-1平均值 方差 标准差方差(s2)=8/(3-1)=4标准差(s)=sqrt(4)=2
i
xi
(xi-4)
(xi-4)2
1 2 -2 4 2 6 2 4
3
4
0
0
和 12 0 8第十六页,共四十九页,2022年,8月28日课堂练习课堂举例:计算样本{1,3,5,4,7}的方差和标准差
(使用下面的表作为向导。)首先计算平均值X:计算平均值、方差和标准差x
=
xni1ns2=n(Xi-X)2i=1n-1
s=(Xi-X)2i=1nn-1均值 方差 标准差方差(s2)=标准差(s或)=^第十七页,共四十九页,2022年,8月28日统计学术语和定义缺陷;未满足与预期或规定用途有关的要求。(引起顾客不满意)单位缺陷数(DPU):PPM(PartsperMillion)不合格品PPM=
用PPM来表示缺陷率:PPM=DPU
1000000
不合格品数量检验的产品数量1000000xx第十八页,共四十九页,2022年,8月28日统计术语和定义缺陷机会:做一项工作(或生产一件产品等)所有产生缺陷的可能性。如:一个过程的步骤数;一个产品的零件数。
每百万机会的缺陷数(DPMO)DPMO=单位缺陷数每单位的缺陷机会1000000第十九页,共四十九页,2022年,8月28日我能计算缺陷率吗?我的过程产生了多少缺陷?生产40000只灯泡,其中50只有缺陷.DPMO是多少?x1,000,000=5040,0001250DPMO第二十页,共四十九页,2022年,8月28日如何计算DPMO?我的过程产生了多少缺陷?1999年A19灯泡的客户退货率是1.0%。DPMO是多少?x1,000,000=
如何把%转化成DPMO?把%转化成小数DPMO小数点向前移动2位0.01x1,000,000=10,000DPMO第二十一页,共四十九页,2022年,8月28日作业-商务一名客户服务代表3天收到这些电话:小时: 第1天: 第2天: 第3天:
电话数 回答数 电话数 回答数 电话数 回答数
1 20 20 25 23 22 222 15 12 20 18 25 243 25 23 15 15 20 174 23 20 22 20 24 245 26 24 26 23 20 196 27 25 28 28 24 247 23 23 24 21 25 228 21 20 25 23 21 16未回答电话的DPMO是多少:a)第1天 b)第2天 c)第3天 d)3天 第二十二页,共四十九页,2022年,8月28日绘制直方图75706560151050高度频数
59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390位女士的身高第二十三页,共四十九页,2022年,8月28日用直方图形成一个连续分布测定单位条形的中心点平滑的曲线连接每个条形的中心点许多(但非全部)数据符合“正态”分布,或钟形曲线。第二十四页,共四十九页,2022年,8月28日正态分布的标准差()拐点1USLp(d)上限(USL)下限(LSL)均值()标准差()3拐点与平均值之间的距离是一个标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”平均值LSL曲线从较陡的状态变得越来越平坦第二十五页,共四十九页,2022年,8月28日面积和概率合格部件控制限曲线下的面积是1.0。我们可以计算规范上下限之外的面积,也就是出现缺陷的概率。一个缺陷部件的概率正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。正态分布可以用来将和转换为出现缺陷的百分比。第二十六页,共四十九页,2022年,8月28日规范上限出现缺陷的概率=.0643假设Z=1.52。1.52之外的正态曲线下部的面积就是出现缺陷的概率。
Z值是工序能力的一种尺度,通常称为“工序的西格马”,不要与过程标准差混淆。Z曲线下的整个面积是1=0(在这里=1,=0)使用正态表Z=1.52下页上的表列出了Z值右边的面积。第二十七页,共四十九页,2022年,8月28日正态分布Z00.010.020.030.040.050.060.070.080.090.05.00E-014.96E-014.92E-014.88E-014.84E-014.80E-014.76E-014.72E-014.68E-014.64E-010.14.60E-014.56E-014.52E-014.48E-014.44E-014.40E-014.36E-014.33E-014.29E-014.25E-010.24.21E-014.17E-014.13E-014.09E-014.05E-014.01E-013.97E-013.94E-013.90E-013.86E-010.33.82E-013.78E-013.75E-013.71E-013.67E-013.63E-013.59E-013.56E-013.52E-013.48E-010.43.45E-013.41E-013.37E-013.34E-013.30E-013.26E-013.23E-013.19E-013.16E-013.12E-010.53.09E-013.05E-013.02E-012.98E-012.95E-012.91E-012.88E-012.84E-012.81E-012.78E-010.62.74E-012.71E-012.68E-012.64E-012.61E-012.58E-012.55E-012.51E-012.48E-012.45E-010.72.42E-012.39E-012.36E-012.33E-012.30E-012.27E-012.24E-012.21E-012.18E-012.15E-010.82.12E-012.09E-012.06E-012.03E-012.01E-011.98E-011.95E-011.92E-011.89E-011.87E-010.91.84E-011.81E-011.79E-011.76E-011.74E-011.71E-011.69E-011.66E-011.64E-011.61E-011.01.59E-011.56E-011.539E011.52E-011.49E-011.47E-011.45E-011.42E-011.40E-011.38E-011.11.36E-011.34E-011.31E-011.29E-011.27E-011.25E-011.23E-011.21E-011.19E-011.17E-011.21.15E-011.13E-011.11E-011.09E-011.08E-011.06E-011.04E-011.02E-011.00E-019.85E-021.39.68E-029.51E-029.34E-029.18E-029.01E-028.85E-028.69E-028.53E-028.38E-028.23E-021.48.08E-027.93E-027.78E-027.64E-027.49E-027.35E-027.21E-027.08E-026.94E-026.81E-021.56.68E-026.55E-026.43E-026.30E-026.18E-026.06E-025.94E-025.82E-025.71E-025.59E-021.65.48E-025.37E-025.26E-025.16E-025.05E-024.95E-024.85E-024.75E-024.65E-024.55E-021.74.46E-024.36E-024.27E-024.18E-024.09E-024.01E-023.92E-023.84E-023.75E-023.67E-021.83.59E-023.52E-023.44E-023.36E-023.29E-023.22E-023.14E-023.07E-023.01E-022.94E-021.92.87E-022.81E-022.74E-022.68E-022.62E-022.56E-022.50E-022.44E-022.39E-022.33E-022.02.28E-022.22E-022.17E-022.12E-022.07E-022.02E-021.97E-021.92E-021.88E-021.83E-022.11.79E-021.74E-021.70E-021.66E-021.62E-021.58E-021.54E-021.50E-021.46E-021.43E-022.21.39E-021.36E-021.32E-021.29E-021.26E-021.22E-021.19E-021.16E-021.13E-021.10E-022.31.07E-021.04E-021.02E-029.90E-039.64E-039.39E-039.14E-038.89E-038.66E-038.42E-032.48.20E-037.98E-037.76E-037.55E-037.34E-037.14E-036.95E-036.76E-036.57E-036.39E-032.56.21E-036.04E-035.87E-035.70E-035.54E-035.39E-035.23E-035.09E-034.94E-034.80E-032.64.66E-034.53E-034.40E-034.27E-034.15E-034.02E-033.91E-033.79E-033.68E-033.57E-032.73.47E-033.36E-033.26E-033.17E-033.07E-032.98E-032.89E-032.80E-032.72E-032.64E-032.82.56E-032.48E-032.40E-032.33E-032.26E-032.19E-032.12E-032.05E-031.99E-031.93E-032.91.87E-031.81E-031.75E-031.70E-031.64E-031.59E-031.54E-031.49E-031.44E-031.40E-033.01.35E-031.31E-031.26E-031.22E-031.18E-031.14E-031.11E-031.07E-031.04E-031.00E-033.19.68E-049.35E-049.04E-048.74E-048.45E-048.16E-047.89E-047.62E-047.36E-047.11E-043.26.87E-046.64E-046.41E-046.19E-045.98E-045.77E-045.57E-045.38E-045.19E-045.01E-043.34.84E-044.67E-044.50E-044.34E-044.19E-044.04E-043.90E-043.76E-043.63E-043.50E-043.43.37E-043.25E-043.13E-043.02E-042.91E-042.80E-042.70E-042.60E-042.51E-042.42E-043.52.33E-042.24E-042.16E-042.08E-042.00E-041.93E-041.86E-041.79E-041.72E-041.66E-043.61.59E-041.53E-041.47E-041.42E-041.36E-041.31E-041.26E-041.21E-041.17E-041.12E-043.71.08E-041.04E-049.97E-059.59E-059.21E-058.86E-058.51E-058.18E-057.85E-057.55E-053.87.25E-056.96E-056.69E-056.42E-056.17E-055.92E-055.68E-055.46E-055.24E-055.03E-053.94.82E-054.63E-054.44E-054.26E-054.09E-053.92E-053.76E-053.61E-053.46E-053.32E-054.03.18E-053.05E-052.92E-052.80E-052.68E-052.57E-052.47E-052.36E-052.26E-052.17E-054.12.08E-051.99E-051.91E-051.82E-051.75E-051.67E-051.60E-051.53E-051.47E-051.40E-054.21.34E-051.29E-051.23E-051.18E-051.13E-051.08E-051.03E-059.86E-069.43E-069.01E-064.38.62E-068.24E-067.88E-067.53E-067.20E-066.88E-066.57E-066.28E-066.00E-065.73E-064.45.48E-065.23E-065.00E-064.77E-064.56E-064.35E-064.16E-063.97E-063.79E-063.62E-064.53.45E-063.29E-063.14E-063.00E-062.86E-062.73E-062.60E-062.48E-062.37E-062.26E-064.62.15E-062.05E-061.96E-061.87E-061.78E-061.70E-061.62E-061.54E-061.47E-061.40E-064.71.33E-061.27E-061.21E-061.15E-061.10E-061.05E-069.96E-079.48E-079.03E-078.59E-074.88.18E-077.79E-077.41E-077.05E-076.71E-076.39E-076.08E-075.78E-075.50E-075.23E-074.94.98E-074.73E-074.50E-074.28E-074.07E-073.87E-073.68E-073.50E-073.32E-073.16E-07Z第二十八页,共四十九页,2022年,8月28日科学记数法科学记数法是将数字写成一个数字的10次幂的一种方法。我们来看一些用科学记数法表示的数字。6.43E-02是.0643的科学记数法格式。6.43E-02=6.42x10-2=.06426.43E-02实际数字科学记数法6.43代表基数将基数乘以10的幂:10-21271.27E+02224162.24E+040.06436.43E-020.0000565.60E-052.0512.05E+00如果“E”后面的数字是负的,那么就将数字的小数点的位置挪到左边。第二十九页,共四十九页,2022年,8月28日Z值–转化为“标准正态”我们需要利用正态分布的平均值和标准差将其转化为“标准正态”分布,以便使用标准正态分布表来获得概率。通过转换将变量(y)转换为标准正态分布。标准正态分布的平均值(=0,标准差()=1.规范上限(USL)规范上限Z值是平均值与规范的上下限之间所包含的标准差个数。出现一个缺陷部件的概率
USL-
Z=对于规范的上限:第三十页,共四十九页,2022年,8月28日正态分布举例规范是1.030”+.030=(1.000,1.060)假设我们测量了30个部件,X=1.050,s=.015计算一下不符合规范的部件的比例1.0201.0351.0501.0651.080LSLUSL目标值从正态表可以看出,.2514或者(25%)不符合规范。USL
Z.USL=USL-X
S=1.060-1.050
.015Z.USL=+.67XLSLZ.LSL=X-LSL S
=1.050-1.000.015
Z.LSL=3.33从正态表可以看出,.0004或者(.04%)不符合规范数据的实际分布第三十一页,共四十九页,2022年,8月28日现状分析报告中的Z值就是ZBench。ZBench的定义
PUSL
是相对USL而出现缺陷的概率。PLSL
是相对LSL而出现缺陷的概率。PTOT
是出现缺陷的总概率PTOT=PUSL+PLSL
ZBench
是与出现缺陷的总概率相对应的Z值,可从正态表中查到。25.14%.04%ZLSL=3.33ZUSL=0.6725.18%ZBENCH=.67第三十二页,共四十九页,2022年,8月28日从正态表获得面积
(合格品和不合格品的百分比)例1:
Z=2.00
右边的面积=_________ 左边的面积=_________ 例2:
Z=1.57
右边的面积=_________ 左边的面积=_________例3:
=6.34
=.03
x=6.41计算Z=x-
右边的面积=_______ 左边的面积=_______第三十三页,共四十九页,2022年,8月28日中心极限定理-
为什么我们得到的通常是正态分布平均值分布–n个测量结果的平均值单个变量的分布图XX(总平均数)中心极限定理表明,如果n足够大,样本平均值(x)或其总和的分布,都近似于正态分布,无论单个变量是否服从正态分布。每个子群中有“n”个样本。-第三十四页,共四十九页,2022年,8月28日中心极限定理(例)第三十五页,共四十九页,2022年,8月28日中心极限定理-
为什么我们通常得到正态分布中心极限定理表明,如果n足够大,样本平均值(x)或其总和的分布,都近似于正态分布,无论单个变量是否服从正态分布。例1“总销量”是许多经销商的销售量的总和。一个经销商的销售量可能不是正态分布,但总销量很可能近似于正态分布。例2一堆部件的高度可能近似服从于正态分布,尽管个别部件的高度不是正态分布。注意:不是所有数据都符合正态分布。后面我们将讨论如何检验正态性,以及如何处理非正态分布数据。第三十六页,共四十九页,2022年,8月28日Z作为一种能力的尺度zUSLT+3能力Z=3123USL+6能力Z=6123456T随着偏差减小,出现缺陷的概率降低,所以,能力提高。我们希望:小z大第三十七页,共四十九页,2022年,8月28日提高工序能力Y=f(X)Y是因变量。X是独立变量。
Y取决于X。改进X才能改进Y。不太重要的多数变量30%+70%=100%至关重要的少数变量独立变量(Xs)有时被称为“根本原因系统”。因变量(Y)有时被称为响应变量。Y取决于独立变量,或“X”变量。至关重要的少数变量也被称为“杠杆”变量,因为它们对因变量具有重大影响。第三十八页,共四十九页,2022年,8月28日统计学问题:是均值偏离、偏差过大,还是两者兼而有之改进的焦点控制平均值的杠杆变量控制标准差的杠杆变量变量YY=f(X1,...,XN)较差的工序能力LSLUSLLSLUSL出色的工序能力
均值偏移过度分散能力第三十九页,共四十九页,2022年,8月28日这适用于所有过程—制造业和商业。稳定运行可以从过程中消除偏差,使结果更加稳定、提高可预测度。偏差是恶魔,发现它并且清除它!低劣表现出色表现客户:“我希望每天都这样”稳定的运行第四十页,共四十九页,2022年,8月28日“坏日子”“一般的日子”“好日子”Q1平均值Q3产品产量的直方图根除坏日子,提高一致性,提高平均值。将坏日子变为好日子第四十一页,共四十九页,2022年,8月28日原来的行为增加平均值。偏差保持不变。依然存在着坏日子!稳定运行根除过程的“不稳定“部分(坏日子)。平均值也增加了!初始表现根除坏日子,改进一致性,提高平均值。平均值平均值平均值稳定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 异位妊娠期妇女的护理
- 小学英语动物类总结
- 2023年万载投资发展集团有限公司招聘考试真题
- 2023年陕西延长石油有限责任公司招聘考试真题
- 心内科护理文书书写规范
- 研读新课标赋能新课堂
- 初探孤独症儿童随班就读的融合策略
- 心律失常护理问题及措施
- hadoop大数据分析课程设计
- 人教版九年级物理第十七章欧姆定律微专题12图像题的分析与计算分层作业课件
- 中外政治思想史-形成性测试四-国开(HB)-参考资料
- 沟通技巧与商务礼仪
- 18 奇妙的建筑 (教案)岭南版美术三年级上册
- 小学三通两平台汇报
- 防火巡查记录表防火检查记录表
- “校园周边环境安全隐患”自检自查(排查)记录表
- 高二上学期日语阅读四篇自测
- 大学生职业生涯规划成长赛道 (第二稿)
- JB T 6464-2006额定电压1kV(Um=1.2kV)到35kV行业标准
- 呼吸科健康宣教
- 人体身体成分健康分析报告
评论
0/150
提交评论