版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/11/91第三章工程质量数据★学习目的与要求:通过本章的学习,使学生生疏到工程质量数据是以事实为决策根底,是科学决策的依据。为此要求学生把握质量数据的特征和质量数据统计规律及其处理方法2023/11/92第三章工程质量数据★二、考试学问点:1.质量数据的统计规律〔一般〕2.质量数据统计处理方法〔一般〕3.质量数据采集方法〔次重点〕2023/11/93第三章工程质量数据★第一节 概述其次节 质量数据采集第三节 质量数据统计处理方法第四节 质量数据变异的数字特征及其度量第五节 质量数据的统计规律考试要求练习题总名目2023/11/943.1概述1、工程质量数据的类型:依据工程质量数据特性的不同,可将其分为:〔1〕计量值数据,即可以连续取值的数据。〔2〕计数值数据,即不能连续取值,只能数出个数、次数的数据。依据使用目的不同,工程质量数据大体可分为:〔1〕把握工程质量状况的数据。〔2〕分析问题缘由用的数据。〔3〕治理工序、活动或作业质量用的数据。〔4〕判定工程质量水平的数据。2023/11/952、工程质量数据的重要特点:〔1〕波动性质量数据并非同一,而是在确定的范围内存在差异。质量数据的这种特性称之为波动性。〔2〕规律性从外表上看,质量数据是杂乱无章的,但假设作进一步分析处理,就可以看出:在正常状况〔即稳定状态〕下所猎取的质量数据,往往呈现出确定的规律性。第三章2023/11/963.2质量数据采集方法与质量数据采集有关的几个概念质量数据的采集方法:〔1〕全数采集:是指对所要治理的工程或工序中的全部“个体”都进展相关质量数据的采集工作。〔2〕抽样采集:是指从所要治理的工程或工序中抽取假设干“样品”进展相关质量数据的采集工作。2023/11/97抽样采集涉及到以下几个概念:1.总体与个体供给数据的原始集团〔观看对象〕,或争论对象的全体。总体中的一个单元称为个体。有限总体:总体所含个体的数量是有限的。无限总体:总体所含个体的数量是无限的。2.样本与样品样本:是指从总体中抽取的一局部个体所构成的集合。样品:组成样本的每一个个体称。抽样:抽取样本的过程。样本容量:样本中所含样品的数量。总体、样本、样品之间的关系如图3-1所示。2023/11/983.2.2质量数据采集方法在工程质量治理中,主要实行抽样的方法采集质量数据。抽样方法分成两类:〔1〕非随机抽样,即进展人为的有意识的选择取样。〔2〕随机抽样。随机抽样排解了人的主观因素,使总体中的每一个个体都具有同等的时机被抽取到。这类方法所得到的质量数据牢靠性好、代表性强,是一种科学的抽样方法。2023/11/99随机抽样的方式:1.单纯随机抽样:在总体中,直接抽取样本的方法就是单纯随机抽样。
2.系统抽样:有系统地将总体分成假设干局部,然后从每一局部抽取一个或假设干个个体,组成样本。3.分层抽样:将工程或工序分为假设干层,以便了解每层的质量状况,分析每层产生质量问题的缘由。2023/11/910抽样误差:无论承受何种抽样方法,抽样误差是客观存在的。样本所供给的质量信息不愿定恰与总体的质量状况相全都的误差,称之为代表性误差。代表性误差的大小主要取决于三个因素:〔1〕总体中的数据的离散程度,即总体质量的均一性。离散程度愈小,抽样代表性误差就愈小,代表性就愈好。〔2〕样本容量的大小。样本容量愈大,代表性误差就愈小。〔3〕抽样方法的随机性。随机性愈好,误差就愈小第三章2023/11/9113.3质量数据统计处理方法3.3.1频数分布表对采集后的数据进展整理。基量整理:以数据的大小为根底,不考虑数据消逝的先后挨次和时间的整理方法。例如:频数分布。基时整理:假设要获得的某种质量信息与数据消逝的先后挨次有关,则应按时间先后挨次加以整理的方法。例如:把握图。2023/11/912频数分布表频数分布表:按数据大小排列后,以确定的间隔分组,然后计算每一组内的频数和频率,用表格表示频数分布状况。设:不同的数据为一个变量,以x表示,则这批数据即为x的一个变异数列。表示任一变量。fi表示消逝的次数,在统计学中称fi为频数。全部频数之和为∑fi变量的频数fi占全部频数之和∑fi的比值称之为频率,用Pi表示,称之为相对频数。
2023/11/913
频数分布表5步法编制过程:〔以P82采集到的一组数据为例,例3-1〕1.确定分组数〔K〕按组距相等的原则确定。一般来说,K的选取范围常在6~25之间,K=10最常用。通常应保持按K分组后,平均每组至少能有4~5个数据为宜。2.确定组距〔h〕分组数K确定后,组距h也就随之而定。
h=取整处理时,要误差最小,保证K组实现2023/11/9143.确定组的边界值以一批数据中的最小值为第一组〔从小往大排列〕的组中值,加减1/2组距,即可得到第1组的下限和上限。留意避开实测数据落在组边界。第1组的上限即为第2组的下限,加组距即得到第2组的上限。依此,即可得到各组的边界值。4.计算组中值组中值=5.作频数分布表用频数符号表示出每个组的数据个数。2023/11/9153.3.2直方图定义:为了能够比较准确地反映出质量数据的分布状况,可以用横坐标标注质量特性值,纵坐标标注频数或频率值,各组的频数或频率的大小用直方柱的高度表示,这种图形称为直方图。1.直方图的类型按纵坐标的计量单位不同,直方图可分为两种:〔1〕频数直方图以频数为纵坐标的直方图称之为频数直方图,它直接反映了质量数据的分布状况,故又称质量分布图。〔2〕频率直方图以频率为纵坐标的直方图为频率直方图。该图中,各直方柱面积之和为1,其纵坐标值与正态分布的密度函数全都,故可在同一图中画出标准正态分布曲线,可以形象地看出直方图与正态分布曲线的差异。2023/11/916频率Pi质量特征值(X)2023/11/917直方图绘制步骤:依据作图目的,采集50以上数据采集数据确定组数、组距及组的边界值统计每组频数〔计算频率〕绘制直方图与频数分布表完全全都。承受查数的方式确定每组频数,并计算出频率。2023/11/9181426102030fi134.5138.5142.5130.5126.50281822271频数直方图2023/11/9190.10.20.3Pi134.5138.5142.5130.5126.500.020.080.180.220.27频率直方图2023/11/9203.直方图的观看与分析〔1〕观看图形的分布状态通过观看图形的分布状态,推断其属于正常型还是特殊型。1)正常型分布状态图的中部有一峰值,两侧的分布大体对称且越偏离峰值其数值越小,符合正态分布。说明这批数据所代表的实施过程中仅存在随机变异。因此,从稳定正常的生产过程中得到的数据所做出的直方图,是一种正常型直方图。2023/11/9212)特殊型分布状态与正常型分布状态相比,带有某种缺陷的直方图称之为特殊型直方图。说明这批数据所代表的生产过程特殊。常见的特殊型直方图:①偏向型。直方的顶峰偏向一测。计数值或计量值仅对一侧加以把握;或一侧把握严另一侧把握宽等,常消逝这种图形。依据直方的顶峰偏向的位置不同,有左偏峰型和右偏峰型。仅把握下限或下限把握严上限把握宽时多呈现左偏峰型。左偏峰型右偏峰型2023/11/922②双峰型。一个直方图消逝两个顶峰,这往往是由于两种不同的分布混在一起所造成的。也就是说,虽然测试统计的是同一工程的数据,但数据来源条件差距较大。③平峰型。在整个分布范围内,频数〔频率〕的大小差距不大,形成平峰型直方图,这往往是由于生产过程中有某些缓慢变化的因素起作用所造成的。双峰型平峰型2023/11/923④高端型。制造假数据,或将超出某一界限的数据剔除后,易消逝此种类型的直方图。⑤孤岛型。在远离主分布中心处消逝孤立的小直方,这说明工程实施过程在某一段时间内受到特殊因素的影响,使工程条件突然发生较大变化。⑥锯齿型。往往是由于分组不当所致。如数据少,分组多时就可能消逝这种类型。高端型孤岛型锯齿型2023/11/924〔2〕直方图与公差〔或标准〕比照将直方图与公差或标准比照,可以推断是否能稳定地生产出合格的产品。比照的方法:在直方图上做出标准规格的界限或公差界限。观看直方图是否都落在规格或公差范围内,是否有相当的余地以及偏离程度如何。2023/11/925约T/8约T/8BT几种典型的直方图与标准比较状况:1)数据分布范围充分地居中,分布在规格上下界限内,且具有相当余地。这是一种抱负状态,工程处于正常状态,不会消逝不合格品。2023/11/9262)数据分布根本上填满规格上下界限内,没有多少余地,稍有波动就会超差。消逝这种状况,虽未产生不合格品,但应实行措施减小分散。TB2023/11/9273)数据分布偏向一侧,有可能超差。这说明把握存在倾向性。消逝这种状况,应实行措施使直方图居于规格界限之中。BTBT2023/11/9284)数据分布与标准规格相比留有太多余地。这种分布虽能保证工程质量,但在经济上是不合理的。应考虑适当放宽把握,在保证质量的同时使工程的经济性更为合理。此外,假设要求进一步提高工程质量,则可缩小标准规格。BT2023/11/9295)数据分布极为偏向一侧,局部数据已超出规格界限,产生了不合格品。这时应考虑是否有特殊因素在起作用或重新争论标准规格是否合理。6)数据分布过于分散,超出标准规格上下界限,产生了不合格品。应实行措施减小分散或争论标准规格是否合理。BTBTBT2023/11/9307)绝大多数数据分布正常,但有少量数据超出标准规格界限成为孤岛,产生了局部不合格品。说明有特殊因素在起作用,应加以查明并消退。BT2023/11/9313.3.3直线图与折线图1.直线图直线图是直方图的简化形式,即以质量特性值为横坐标,以频数〔或频率〕为纵坐标,以直线的长短表示频数或频率的大小。直线图的制作过程与直方图全都,所不同的是,直线所对应的位置为组中值。2.折线图以质量特性值为横坐标,以频数或频率为纵坐标,将各组频数〔频率〕所对应的点用折线连接起来形成的图形,即为折线图。2023/11/9323.3.4累计频率及其分布曲线1.累计频数及累计频率累计频数:质量特性值等于或小于某一数值时的频数。累计频率:累计频数与总频数的比值。累计频率特性值2.累计频率分布曲线在实际工作中,常用累计频率分布曲线表示累计频率。
频率曲线图:以横坐标表示质量特性值,纵坐标表示频率,将各组〔各特性值〕频率所对应的点,用平滑的曲线连接起来形成的图形。频率特性值2023/11/933频率函数与累积频率函数假设设质量特性值为x,频率函数为P(x),累计频率函数为Y(x),a、b分别表示x的变异下限和变异上限,则P(x)、Y(x)之间的关系为:在质量治理工作中,假设已求得频率分布函数P(x),通过积分即可得到累计频率分布函数Y(x);假设Y(x),通过微分则可得到P(x)。第三章2023/11/934变异的数字特征,常承受集中性、离散性、偏度与峰度来度量。3.4.1集中性变异的数据所表现出的集中的趋势称之为集中性。集中性是反映数据变异状况的一种典型特征。度量集中性的主要指标有:平均数、中位数和众数。3.4质量数据变异的数字特征及其度量2023/11/935集中性指标1.平均数〔平均值〕加权平均数:平均数是一批数据的中心,围绕这一中心集合着众多的数据,它反映出大量现象的典型特征。2023/11/9362.中位数〔中值〕一批数据按大小挨次排列,其中间的数值即为中位数。假设k是奇数,中间的数只有一个,就是中位数;假设k是偶数,中间的数有两个,则这两个数的平均数为中位数。用中位数表示数据的集中性比较粗略,但计算比较简洁,当只需对数据集中性进展粗略描述时,可使用中位数。3.众数一批变异数据中,消逝次数最多的数据,即与最高频数所对应的数值便是众数。集中性指标2023/11/9374.平均值、中位数、众数三者关系假设一批数据的频率分布图完全对称,则三点重合〔即三者相等〕;假设频率曲线不对称,则三者不等。曲线越不对称,三者的差异就越大。三者都反映了变异数据的集中性。平均值定义较严谨,能较好地反映数据的集中性,因此,在质量治理中用的较多。2023/11/9383.4.2离散性离散性,反映了数据相对集中的程度或分散程度。主要指标有极差、标准差和变异系数。1.极差R极差,是指一批数据中最大值与最小值之差,一般用R表示2.标准差标准差也称之为均方差,是每个数据以平均值为基准相差的大小,比较全面地代表了一批数据的分散程度。方差:离差平方的均值。均方差:方差开平方。2023/11/939当数据个数很多即n很大时,标准差的计算公式为:2023/11/940当n较小时,则:2023/11/941请思考:两组数据:1;3;5;7;9和11;13;15;17;19试比较其离散程度如何?极差、方差各位多少?说明其离散程度~比较不了啊!!!怎么办啊????2023/11/9423.变异系数C应用标准差与平均值的相对数值进展比较。该相对数值称为变异系数,通常用C表示:明显,C值越大,离散程度也就越大;反之,则越小。C1=63%;C2=21%。说明第一组数据的离散程度比其次组的大。请再次比较前面两组数据的离散程度!2023/11/9433.4.3偏度与峰度偏度与峰度是就频率曲线的外形而言的,偏度与峰度反映了质量数据的分布状态。1.偏度正常的频率分布曲线应是对称的,无任何偏斜,说明该频率曲线所代表的工程实施过程是正常稳定的。从非正常的工程实施过程中所取数据,其频率曲线是不对称的,即处于偏斜状态,其偏斜程度越大,说明工程实施过程越不正常。频率曲线不对称,消逝偏斜的程度,叫偏度。顶峰偏左的状态称为正偏;顶峰偏右的状态称为负偏。2023/11/944PP正偏负偏频率曲线的偏斜特征,可用偏度系数表示:=0时,频率曲线对称,>0时,频率曲线正偏,越大,正偏程度越大;<0时,频率曲线负偏,越小,负偏程度越大。2023/11/9452.峰度频率曲线顶部外形平缓的程度,叫峰度。反映了频率曲线顶部的外形,用峰度系数表示。=3.0时,曲线呈正态分布状态;<3.0时,曲线呈平缓状态,越小,曲线越平缓;>3.0时,曲线呈尖峰状态。P>3.0=3.0<3.02023/11/946练习有两组质量监测数据,其频率分布曲线的偏度系数分别是α1=0.579和α2=0.619试推断其频率分布曲线有可能是下面一组中的哪一对?1、A和B2、A和C3、B和C4、B和DPPPPBADC第三章2023/11/9473.5.1正态分布1.正态分布曲线及数学表达式例如,在某工程实施过程中,取100个试件,对其进展某质量指标的检验,将所得数据整理并做出频率直方图.假设不断增加试件数量,则数据个数不断增加,而组距亦不断减小,分组愈来愈细,则直方图将趋于图中虚线所示的圆滑曲线,该曲线即为正态分布曲线。3.5质量数据的统计规律2023/11/948P正态分布频率函数的一般形式为:可以通过从总体中随机抽取的样本求得均值和标准偏差S来估量,即:2023/11/949依据概率的定义,在一样条件下进展大量试验,随着试验次数的增加,某大事发生的频率渐渐稳定于某个数值,该数值即称为该大事的概率。在特殊因素的影响下,质量数据是不听从正态分布规律的,只有在符合以下性质的随机因素作用下,质量数据才听从正态分布。〔1〕正负随机因素消逝的数目〔或范围〕相等;〔2〕大小一样的正负误差因素消逝的概率相等;〔3〕小误差因素消逝的概率比大误差因素大。2023/11/9502.正态分布频率曲线及函数的重要性质〔1〕无论x为何值,函数总有。〔2〕曲线有一个单峰和一个对称轴,且对称轴在均值处。〔3〕离对称轴愈远,P(x)值愈小,当时,P(x)=0,即:,横坐标为P(x),当时的渐近线。〔4〕在对称轴两边处各有一个拐点。〔5〕,即频率曲线与横坐标所构成的面积为1。P2023/11/951图3-18所示,与对应的是曲线的最高点,当时,P(x)最大,即。的大小表达了曲线胖瘦程度。愈大,曲线愈胖,数据愈分散;愈小,曲线愈瘦,数据愈集中。数理统计学中,用或表示均值为,标准差为的正态分布。假设=0,=1,则:符合上述特征的正态分布,称为标准正态分布,记作N(0,1)分布,这是一种最简洁的正态分布。2023/11/9523.正态分布的标准化及积分计算在质量治理中,常承受正态分布函数计算质量特性值在某一范围的概率。例如:某工程的质量指标听从N(15,2)正态分布,即:假设要计算x在11~13MPa范围内所发生的频率〔概率〕,则实际上是计算图3-19中阴影局部的面积,即:2023/11/9539111513171921x(Mpa)P通常将正态分布的一般形式标准化,即变换为N(0,1)分布,然后查标准正态分布表,见附表1。2023/11/954〔1〕正态分布的标准化正态分布一般形式:令,由于、是常数,所以当x听从正态分布时,t也是随机变量,同样听从与x一样的分布。依据平均数和标准差的运算性质可求得t的均值和标准差。=1则原函数可化为:t听从标准正态分布,即N(0,1)分布。因此,用上述变换方法,可使具有任意均值和标准差值的正态分布,变换为标准正态分布。2023/11/955〔2〕正态分布的积分计算1)计算累计概率累计概率的计算如图3-20所示。xP0xi其积分值可查标准正态分布表〔附表1〕求得。例如,则查附表1可得:2023/11/9562)计算质量数据在某一范围内的概率xPx10x2如以以下图,计算的概率。假设为标准正态分布,则:讲计算例如2023/11/957假设为非标准正态分布,则令,得:例如,,求P(11<x<12)。查附表1,得:=0.06681=0.02275则P(11<x<12)=0.06681-0.02275=0.04412023/11/958在质量治理中有三个最常用的积分值:2023/11/9593.5.2二项分布假定有一个工程,假设该工程某质量指标的不合格率为0.05,即平均每100个单位产品中有5件不合格品。假设从中随机抽取5个单位产品组成样本,则在样本中,不合格品数r为0,1,2,3,4,5件的概率各为多少?要计算出这些概率,就要承受排列、组合,概率定理。1.假设争论的对象为有限总体设总体中所含个体的数为N,不合格品率为P,总体中不合格品数为E,则:2023/11/960从N中抽取n,n中不合格品数为r这一大事〔r=0,1,2,…,n〕,相当于n件样品中,有r件是从不合格品中抽取,而样本剩余〔n-r〕件是从总体的〔N-E〕件合格品中抽取的。从E件不合格品中抽取r件不合格品的全部可能组合数为:从(N-E)件合格品中抽取〔n-r〕件合格品全部可能组合数为:2023/11/961所以,在一个样本中,恰好有r件不合格品的全部可能组合数为:从N中抽取n的全部可能组合数为:在样本中恰有r件不合格品的概率为:符合该式的分布称之为超几何分布。2023/11/962结论:当一批产品〔总体〕的数量为有限的N件时,在该总体中随机抽取大小为n的样本,则样本中消逝r件不合格品的概率听从超几何分布。2.争论对象为无限总体假设总体中不合格品率P在抽样之后可以认为无变化,看作常数。则从该无限总体中抽取大小为n的样本,样本中含不合格品数为r的概率P(r):式中P——总体不合格品率;q——总体合格品率,q=1-P符合上式的概率分布称为二项分布。2023/11/963综上,就有限总体而言,假设承受无放回抽样,则在样本中,随机变量r消逝的概率听从超几何分布;假设承受有放回抽样,则随机变量r消逝的概率听从二项分布。就无限总体而言,随机变量r消逝的概率亦听从二项分布。二项分布由参数n与P确定,其分布图形可以用直线图或曲线图表示。2023/11/964假设P确定,则n愈小,图形偏度愈大,随着n的增大,分布中心渐渐右移且对称性随之提高,当n到达确定程度时,趋于正态分布。P(r)0.40.30.20.10246810121416rn=20n=30n=40n=50n=10P确定,二项分布图形随n的变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论