数据统计与分析精选教学课件_第1页
数据统计与分析精选教学课件_第2页
数据统计与分析精选教学课件_第3页
数据统计与分析精选教学课件_第4页
数据统计与分析精选教学课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主讲人 史玉杰八月 22质量管理培训系列教程Data Statistics and Analysis数据统计与分析 第一章: 数据的特性 第二章:数据的收集、整理 第三章:数据的简单统计图形 第四章:数据统计与分析工具 第五章:数据分析体系建立目 录质量数据质量数据的地位检验标准质量数据检验对象检验结果凡是检验必然伴生检验标准与质量数据;质量数据在生产中客观存在,因管理的不细大量质量数据未被发现和利用。“数据发现数据搜集数据分析管理决策”,形成质量数据的管理循环。质量数据作用确定单位产品合格与否检验结果确定一批产品的质量统计检验观察和判断生产工艺过程的稳定性过程控制调查工序能力首件检验为产品设

2、计和质量控制提供依靠质量信息为企业质量管理提供情报TQC闭环系统思考:数据与信息的关系思考:数据与事实的关系质量数据分类计量型数据:可带小数的能连续取值的测量数据。如长度、温度、重量、时间、化学成分等。计量型数据是计量仪器测量得出的。计数型数据:可用件数、个数或点数等整数统计计值的数据。如不合格品数、废品数、铸件表面的砂眼数。计数型数据是通过观察和统计得出的。计件值;计点值。某班组职工人数接受QC培训人数某产品当班产量当班不合格品数表面不良产品数某机器工作年限某产品实际重量某产品体积某产品加工工时某产品加工温度计数型计量型从您身边找例子不合格率依自身特性分质量数据分类定性数据定量数据历史数据当

3、前数据原始数据加工数据依性质分依来源分依时间分优、良、一般、差不良率为0.99%调查表中的数据统计整理后的数据2010年各月平均不良率2010年7月平均不良率举例注意:数据还有其他分类质量数据特点波动性(分散性、变异性)规律性数据不是一个固定的数值,而是有波动的。例:加工一批轴零件,直径尺寸要求:80mm+0.15mm。该批产品测量结果为(20个零件):79.95mm、79.91mm、80.08mm、79.93mm 、79.96mm、80.04mm、80.08mm、79.98mm79.92mm、80.05mm、79.97mm、80.03mm 、79.91mm、80.02mm、80.05mm、7

4、9.94mm79.95mm、80.02mm、79.90mm、80.05mm 数据虽有波动,但却呈现一定的规律性。通过对上述数据观察,该批轴零件直径尺寸均在79.90mm至80.10mm之间,分散在80.00mm两侧。通过统计分析,该批数据的规律如下:最小值:79.90mm;最大值:80.08mm;平均值:79.987mm;中值:79.975mm;标准差:0.060mm;其他略。该批数据可进一步分组,统计各组频数,以作出直方图。思考:两个特点的影响及利用?数据的特征值中位数众数数据集中位置平均值将所有的数据相加作分子,数据的个数作分母,即得平均值。注意平均值的有效数字要多取1位。将一组数据按大小

5、顺序排列,排在中间的那个数叫中位数。表示为 。X当一组数据是奇数是,最中间的数就是中位数;当一组数据是偶数时,中位数为中间两个数据的算术平均值。当一组数据中出现次数最多的数。注意点三种方法各有优缺点,常要灵活使用。例:一组测量值:12,11,12,13,12,13,20结果:平均值:13.3;中位数:12;众数:12分析:由于数值20的影响,平均值13.3不如中位数12或众数12更能准确表示集中位置。注意总体均值表示为数据的特征值第三四分位数(Q3)数据集中位置第一四分位数(Q1)第一四分位数是这样一个数,当把数据集划分为两个部分时,其中小于等于此数的数据约占整个数据集的25%,大于等于此数的

6、数据约占整个数据集的75%第三四分位数是这样一个数,当把数据集划分为两个部分时,其中小于等于此数的数据约占整个数据集的75%,大于等于此数的数据约占整个数据集的25%Q1=X(k)+f(X(k+1)-X(k)k:4n+1的整数部分f:4n+1的小数部分Q3=X(k)+f(X(k+1)-X(k)的整数部分的小数部分k:43(n+1)f:43(n+1)数据的特征值样本极差样本方差数据离散程度一组数据中最大值与最小值之差,用符合R表示。R = X - X maxmin能精确的表示数据离散程度的特征值。数据个数;n某个数据与样本平均值的偏差样本标准差能精确的表示数据离散程度的特征值,用符合S表示。例:

7、两组测量值:A组:50,50,50,50,100;B组:40,50,60,60,90举例结果:极差比较:Ra组=Rb组=50;标准差比较:Sa组=22.4,Sb=18.7标准差较极差更准确地表示了数据的离散程度。A组较B组更分散。注意总体标准差表示为数据的特征值偏度数据分布形状是对数据不对称行的度量,总体参数偏度用s表示,样本统计量偏度用bs表示峰度是对数据分布平坦性的度量,总体参数偏度用k表示,样本统计量偏度用bk表示综合练习打开数据文件:BS_描述性统计.MTW统计基本统计量图形化汇总指定“变量”为“身高”练习数据的分布-正态分布调查总体内的所有个体的某种特性会发现:大部分数值接近中心值周

8、围,越是远离中心值则个体数越来越少。例:测量一个车间男性职工的身高发现,大部分的身高处在165cm至175cm之间,处在155cm至165cm,175cm至185cm的人比较少,而155cm以下或185cm以上身高的人更少。将这些数值用直方图描述显示如下情形(各点表示该范围内占有的人数。) 正态分布图形可以为一个曲线包围,形状类似一个倒挂的钟。该曲线被叫做正态分布曲线。(上图) 165175185155正态分布特征对称性:以平均值为中心呈左右对称的倒挂的钟的形状。连续性:左右两尾无限接近横轴。正规性:曲线下横轴上的面积等于1。平均值不同分散相同的两个分布形状相同,平均值相同分散不同的两个分布形

9、状不同。u平均值左右对称平均不同分散相同时分散不同平均相同时 小大正态分布特征正态分布特征正态分布特征正态分布特征正态分布大多数值集中在以为中心位置,越往边缘个体数越少。从下图可以看出正态分布中,以平均值为中心,标准偏差内的个体占个体总数的百分比。 上述事实也可以从概率的角度去观察。如果从具有正态分布的总体中抽取一个个体并测定某种特性,则该个体的测定值大于+3或小于-3的概率只有0.27。(0.27=100-99.73)-6-5-4-3-2-1+1+2+3+4+5+668.27%95.4%99.73%99.99997141%1Tolerance(Spec)LSLUSL0.001 ppm数据的分

10、布-二项分布数据的分布-二项分布数据的分布-二项分布数据的分布-二项分布数据的分布-二项分布数据的分布-二项分布第一章: 数据的特性第二章:数据的收集、整理第三章:数据的简单统计图形第四章:数据统计与分析工具第五章:数据分析体系建立目 录数据收集1、选题,确定要调查的问题是那一类问题,如不合格项目、损失金额、事故等2、确定问题调查的期间,如3月1日-4月30日3、确定哪些数据是必要的,以及如何将数据分类,如按不合格类型、不合格发生位置、工序、人机物法分,分类后将不常出现的项目归为“其他”项4、确定收集数据的方法,以及在什么时候收集数据。通常采用调查表的形式收集数据。质量数据分层生产条件检验结果

11、计数型计量型投料件数设备数成形温度生产工时生产人数压力条件计数型计量型合格品数不良品数白点数产品尺寸产品强度废品重量质量数据的分层(分类)是质量数据分析的基础。生产条件与检验结果是数据的一个基本分层。4M1E(人、机、料、法、环)是影响质量的重要方面,也是数据分层的思考方向。计量型检验数据常可作控制图,用于过程控制。计数型检验数据常可作排列图、直方图等,用于质量控制。分层法引例漏油调查表调查结论:为降低漏油率,应选方法C,应用甲厂材料。结论可靠吗?分层法引例漏油分层表36%32%42%22%调查结论:当用甲厂材料时,应选方法B;当用乙厂材料时,应用方法C。我们有何启发?分层法概念分层法又叫分类

12、法、分组法。它把所搜集到的质量数据性质相同、条件相同的归为一组,把划分的组叫作“层”。它是按照一定的特征,把收集到的有关某一特定主题的统计数据加以归类、整理和汇总的一种方法。把杂乱无章和错综复杂的数据加以归类汇总,可以清楚地反映产品质量波动的原因和变化规律,以便采取措施加以解决。差别是一种客观存在,差别的输入必然产生差别的输出,分层就是要找出这种客观差别并加以区别。有差别之处就可应用分层法,分层法的应用范围极其广泛。分层法是一种基本的思维模式。“物以类聚,人以群分”,应用好分层法对工作对生活都非常有用。例:员工考评。意义定义目的应用步骤确定研究主题和收集数据的范围按不同的分层标志对数据分类画分

13、层数据表分层数据观察分析操作人员:按个人、年龄、性别、工龄、班次、技能等。机器设备:按设备类型、新旧、工装模具等;原材料:按供方、产地、成分、批次、库存时间等;产品:规格型号、复杂性、成熟与否、使用地域等;加工方法:按加工方法、生产工艺等;环境:按气象情况、室内环境、操作环境等;测量:按测量手段、测量工具、测量人员等;时间:按上、下午分,按年、月、日分,按季节分;其他:按发生位置等。一般可采用以下因素分层:人、机、料、法、环、量、时,其他。选择分层标志设计表格并收集数据分层标志的选择注意事项用多种因素进行分层由于事先不知道是哪个因素产生的影响最大,因此不宜简单的按单一因素分层,必须考虑多个因素

14、的综合影响效果。注意分层的原则分层的原则是使同一层次内的数据波动幅度尽可能小,而层与层之间的差别尽可能大。不同层次的数据应按相同的方法进行统计,以利于相互比较。其他统计方法,如直方图、排列图、散布图等结合运用。讨论:我们工作中做了哪些分层法分析数据整理机器整理法人工整理法整理分类收集正确可用的数据避免个人主观的判断掌握事实真相注意要点采取改善对策前,必须有数据作为依据。数据使用目的应清楚了解。立即使用它。数据的整理与运用,具备的条件应一致。数据不可造假。数据整理原则统计软件的应用第一章: 数据的特性第二章:数据的收集、整理第三章:数据的简单统计图形第四章:数据统计与分析工具第五章:数据分析体系

15、建立目 录1.收集数据,一般要求数据至少要50个以上, 并记录数据总数(N);2.将数据分组,定出组数 K=1+3.23logN,也可采用以下经验数据3.找出最大值(L)和最小值(S),计算出全距(R)。4.定出组距(H):全距/组数(通常为2.5或10的倍数)直方图组 数 数据N 50 50100 57 100250 250以上6107121020 5.定出组界 最小一组的下组界值=S - 测量值的最小位数/2 最小一组的上组界值=最小一组的下组界值+组距 最小二组的下组界值=最小组的上组界值6.决定组的中心点 组的中心点= (上组界+下组界)/2 7.作次数分配表 依照数值的大小记入各组界

16、内,然后计算各组出现的次数。8.绘直方图 横轴表示数值的变化,纵轴表示出现的次数。9.对绘制出的直方图进行分析。即最小分辨率的一半直方图实例练习1.某罐头厂生产罐头,罐头容量规格为3108g,今抽验50罐数据如下:308317306314308315306302311307305310309305304310316307303318309312307305317312315305316309313307317315320311308310311314304311309309310309312316312318请大家练习一下作次数分布表作直方图计算 (1)确定基本内容:N=50 (2)组数:K=

17、7(参考经验数值) (3)最大值L=320 最小值S=302 全距 R=320-302=18 (4)计算组距H H=R/K 即 187=2.5 取H为3 (为测定值最小单位的整数倍) (5)第一组下限值为302-0.5, 上限值为第一组下限值+组距=301.5+3=304.5 (6)各组中心值=(上组界+下组界)/2 组号组 界中心值标记F(次数)12345671301.5 304.530342304.5307.5306103307.5310.5309134310.5313.531295313.5316.531586316.5319.531857319.5322.53211作直方图外观形态分析

18、正常状态(理想型)双峰状不同操作者或不同机器加工的产品混在一起了 偏峰状 加工习惯造成,如车外园易贴近上差离岛状显示在加工或测量中出现过异常情况,如刀具磨损、对刀读数错误,测量仪器出现系统偏差峭壁状往往是已剔除了不合格的数据而绘制成的直方图锯齿状常是由于测量方法或读数不准确造成的,分组组数过多也可能出现。 直方图的原理特别适用于计量值; 应剔除特殊的数据; 数据尽可能多,一般不能少于50个; 注意恰当的分组作直方图注意事项绘制直方图的注意事项小练习打开数据文件:BS_直方图.MTW图形直方图简单指定“图形变量”为“等候时间”练习箱线图箱线图(Boxplot)也称箱须图(Box-whisker

19、Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。箱线图由箱体、上下须触线和星号三部分组成。箱线图上触线=min(Q3+1.5IQR,最大值)下触线=max(Q1-1.5IQR,最小值)异常点中位数四分位间距小练习打开数据文件:BS_箱线图.MTW图形箱线图一个Y含组指定“图形变量”为“使用寿命”指定“用于分组的类别变量”为“供应商”小练习小练习饼图饼图显示一个数据系列 (数据系列:在图表中绘制的相关数据点,这些数据源自数据表的行或列。图表中的

20、每个数据系列具有唯一的颜色或图案并且在图表的图例中表示。可以在图表中绘制一个或多个数据系列。饼图只有一个数据系列。)中各项的大小与各项总和的比例。饼图中的数据点 (数据点:在图表中绘制的单个值,这些值由条形、柱形、折线、饼图或圆环图的扇面、圆点和其他被称为数据标记的图形表示。相同颜色的数据标记组成一个数据系列。)显示为整个饼图的百分比。小练习打开数据文件:BS_饼图.MTW图形饼图用整理好的表格画图指定“类别变量”为“种类”指定“汇总变量”为“金额”在“饼图选项排列扇形区大小递减在标签扇形区标签百分比指定“多图形按变量按变量,组在相同图形中”为“工厂”小练习小练习时间序列图时间序列图也叫推移图

21、,是以时间轴为横轴,变量为纵轴的一种图。经常应用在产品质量管理中,推移图主要目的是观 察变量是否随时间变化而呈某种趋势。它是统计技术中的一种,便于管理者随时掌握管理效果或产品的主要性能参数的动态趋势,便于管理者及时分析改进。其好处是一目了然。时间序列图BS_时间序列图.MTW3D散点图第一章: 数据的特性第二章:数据的收集、整理第三章:数据的简单统计图形第四章:数据统计与分析工具第五章:数据分析体系建立目 录置信区间假设检验相关分析与回归分析变异源分析测量系统分析(1)绘制作业过程的流程图,最好为QC工程图(2)生产条件和产品特性,决定应使用的质量控制方案。(3)制定各项标准。(4)实施控制方案的教育训练。(5)设计控制图。(6)过程(制程)能力的分析。(7)异常原因的追查与纠正活动。(8)过程改善的标准化。八. SPC管理体系建立企业建立统计过程的实施步骤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论