质量分析与质量改进课件_第1页
质量分析与质量改进课件_第2页
质量分析与质量改进课件_第3页
质量分析与质量改进课件_第4页
质量分析与质量改进课件_第5页
已阅读5页,还剩131页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质量分析与质量改进

培训内容2质量分析与质量改进

培训内容211、质量改进用的随机变量分布连续随机变量的概率分布问题。采用概率密度的概念,即是随机变量(连续)单位长度上的概率p(x)

概率密度函数是概率密度与随机变量(自变量)的变化关系,显然p(x)≥0,它与x轴所夹的面积恰好为1。其在区间(a,b)上取值的概率P(a≤x≤b)为概率密度曲线下,区间(a,b)上的面积。一、随机变量分布技术1、质量改进用的随机变量分布一、随机变量分布技术2正态分布:①概率密度函数

a、根据函数可知图形以值构成纵向对称,呈钟形曲线;

b、为正态分布均值,是分布中心位置,是正态分布的方差,表明分散性。决定了正态分布曲线的形状,故正态曲线用表示;

c、曲线围绕横轴的总面积等于1;

d、固定,不同的,则曲线形状不变,只是在横轴上的位置改变;

e、固定,改变,则曲线位置不变,只是改变了形状。正态分布:3正态概率分布函数②标准正态分布当的正态分布,称标准正态分布,记为u~N(0,1)。其随机变量记为u,概率密度函数记为标准正态曲线只有一条(唯一),因而可制成表绘成图,可以根据u的大小在表中查得对应的概率。标准正态概率密度和标准正态概率分布表起同样的作用正态概率分布函数4根据定义及图形可获得如下的计算公式:③标准正态分布的分位数

N(0,1)的分位数是一个在分位数左侧面积为,右侧面积恰好为的分界线,即分位数是满足下列等式的实数就是分位数,可根据概率的大小在标准正态表中查到。尾数可用内插法决定。ⅠⅡⅢⅣ根据定义及图形可获得如下的计算公式:ⅠⅡⅢⅣ5例1:求的分位数因为表中都大于0.5,不能直接查表,故需变换,根据对称性知:例2:求的分位数因为正态分布表中不能直接查,只有由于刚介于0.9495与0.9505中间,故例1:求的分位数6④正态分布的计算任一正态变量x经过标准化变换后

都可以变换成标准正态变量u。

例:因此以下正态分布的概率计算可方便的利用标准变换。式中为标准正态分布函数,可以直接查表。④正态分布的计算式中为标准正态分布函数,7举例1:电阻器的规格限为,服从正态分布,均值80.80k,则其低于的概率和超过的概率分别为举例1:电阻器的规格限为,8举例2:已知:1、受控情况下,产品质量特性的分布2、产品规格限,包括上规格限和下规格限,它们是依据文件中的规定,顾客要求,公认的标准,企业下达的任务书等来决定的。问题一:分布中心与规格中心重合时,产品的质量特性x超出规格限的不合格品率。举例2:9规格限合格品率(%)不合格品率(ppm)68.2731730095.454550099.73270099.99376399.9999430.5799.99999980.002规格限合格品率(%)不合格品率(ppm)68.273173010问题二:分布中心与规格中心不重合时。不合格品率的计算。1、允许有的偏移;2、偏移只在一个方向上,不能上下同时发生。问题二:分布中心与规格中心不重合时。不合格品率的计算。1、允112、统计量与抽样分布⑴、统计量样本通过加工把零散的信息集中起来以反映总体的特征,其中构造样本函数是一种有效的方法,不同函数反映总体的不同特征,通常我们将不含未知参数的样本函数称为统计量。统计量举例2、统计量与抽样分布12⑵、抽样分布统计量的分布称抽样分布抽样分布的解释⑵、抽样分布13样本1样本2样本3样本411911121140109911910108111181313109.810.210.810.4总体8991110911121013910111310109101012计算每个样本的均值,它们不全相等为什么这些样本均值不全相等呢?因为抽样的随机性若取更多的样本,会发生什么呢?会产生样本均值分布样本1样本2样本3样本41.301.931.481.14计算每个样本的标准差,它们也不全相等由于抽样的随机性,该样本标准差不全相等若取更多样本,会产生样本标准差的分布抽样分布的解释样本1样本2样本3样本411911121140109911914可以得出:每个统计量都有一个抽样分布;不同统计量有不同的抽样分布,当样本来自时,其样本均值,方差,以及它们的某种组合所组成的抽样分布,在理论上已经导出;抽样分布是统计推断的基础。⑶、正态分布的抽样分布。①当已知时,正态总体的样本均值分布为这可通过标准化变换得到,可以得出:15②当未知时,即用样本标准差S代替上式中的,此时。称服从自由度为n-1的t分布,即t(n-1)t(n-1)与N(0,1)的概率密度函数类似,是对称分布;t(n-1)的峰值比N(0,1)略低,底部略宽;当自由度(n-1)超过30时,两者区别不大。③正态样本的分布——分布定义:正态样本方差除以总体方差的(n-1)倍的分布,是自由度为(n-1)的分布,记为②当未知时,即用样本标准差S代替上式中的16分布的概率密度函数在正半轴上是偏态函数④两个独立的正态样本方差之比的分布——F分布定义:a、两个独立的正态总体方差相等;b、是分别来自的两个样本,它们互相独立;c、这两个样本方差之比的分布是自由度为n-1和m-1的F分布分布的概率密度函数在正半轴上是偏态函数17二、参数估计在实际问题中,总体的参数都是未知的,需要选用适当的统计量作为未知参数的估计,此统计量称为点估计量。㈠点估计⑴定义:用样本的某一函数作为总体中未知参数的估计。设是总体的某个未知参数,X是该总体的随机变量,是总体的一个样本量为n的样本,若构造一个统计量,用它作为对的估计,则称是的点估计。如抽取到一个,就可计算出值,此乃估计量中的一个具体值。二、参数估计在实际问题中,总体的参数都是未知的,需18⑵点估计优良性标准是随机的,不能用某个具体的估计值来评价是否接近的优劣,应从多次使用中来评定。与之间总有偏差,即,但因未知,其差也无法得到,通常用多次采样,将不同的进行的平均。即用来表征估计量的优劣,因此此时称是无偏的,否则称有偏的,无偏性是表示估计优良性的一个重要指标,在选择估计值时尽量选用无偏估计量。式中是估计量的方差,希望方差愈小愈好,这是估计优良性的另一指标。⑵点估计优良性标准19⑶点估计方法无论是总体均值或总体方差都可用样本的均值或方差作出估计,这就是点估计:①用样本矩去估计相应的总体矩。②用样本矩的函数去估计相应的总体矩的函数。此法简单实用,对的估计是无偏的,对的估计也是无偏的,但这种估计未必总是有效的,也不唯一。⑷点估计举例(正态总体参数的无偏估计)例:把钢材弯成钢夹,其间隙大小是一个重要特性,现从生产线上随机取5个钢夹测量其间隙,得数据如下:0.750.700.650.700.60已知钢夹间隙服从正态分布,试定出参数的无偏估计。⑶点估计方法20解:用样本均值估计,用样本方差估计:解:用样本均值估计,用样本方差估计21㈡区间估计⑴概述:点估计只给出参数的一个具体估计值,未给出估计精度,而区间估计是用一个区间来估计未知参数,区间体现了估计的精度。⑵区间估计定义是总体的待估计参数,其一切可能取值组成参数空间。记是总体的样本量为n的样本,对给定的确定两个统计量:若对任意,则称随机区间是的置信水平为的置信区间。

㈡区间估计22⑶正态总体参数的置信区间①总体均值的置信区间求法⑶正态总体参数的置信区间23注:ⅰ、该区间的中心为,区间半径为ⅱ、置信水平增大时,置信区间的长度将增加,因为此时减小,则就增大。ⅲ、若要提高估计精度,势必要缩短置信区间的长度,在置信水平及标准差都不变的情况下,只有加大n.②总体的置信区间求法注:ⅰ、该区间的中心为,区间半径为24⑷应用举例例1:某溶液中的甲醛浓度服从正态分布,从中抽取一个n=4的样本得=9.34%,样本S=0.03%,分别求正态均值的95%的置信区间。解:求的置信区间,因未知,故用t分布来求。根据=8.34%,S=0.03%,及n=4,=0.05,查t分布表,得。⑷应用举例25例2:一物体的重量未知,若用天平去称,所得称重总有误差,且是一个随机变量,通常服从正态分布。如果已知称重误差的标准差为0.1克(根据天平精度给出),为使的95%的置信区间长度不超过0.1,则至少应称多少次?这是估计样本量的问题,在已知时,的95%置信区间为:例2:一物体的重量未知,若用天平去称,所得称重总有误差,且是26三、假设检验㈠假设检验问题用来判定获取的样本值与总体值或几个样本值之间的差异是确实存在还是由于偶然因素产生的。对总体参数分布做某种假设,再根据抽取的样本观测值,运用统计分析方法,检验这种假设是否成立,从而决定是接受或拒绝这一假设。这一过程就是假设检验。例:装配线的直通率在最近三个月内由95%降为85%,经分析认为,由于供应商A和B提供的电子物料品质(某参数均值)不同,是造成直通率下降的原因,试通过假设检验对这种判断进行检验。三、假设检验㈠假设检验问题27例:某车床加工零件的外园直径目标值为550mm,之前,零件尺寸的标准差,现从加工零件中抽取35个,测得35个数据,试问外园直径均值是否偏离目标值。意义:1、用样本代替总体(节省时间,降低成本,替代某种不可能的事。)2、确认这种替代的精确性或可行性。例:某车床加工零件的外园直径目标值为550mm,之前,零件尺28㈡假设检验步骤1、2、步骤:根据所获样本,运用统计分析方法,对总体的某种假设H0作出接收或拒绝的判断。⑴建立假设:日生产化纤纤度肯定会偏离目标值1.40,若是随机误差引起的差异,则认为H0:1.40会成立。若是别的特殊因素引起的差异,则应拒绝H0,此时相反的假设这叫备择假设,若也叫备择假设,但这是单侧检验问题。。,=㈡假设检验步骤。,=29⑵选择统计量,给出拒绝域的形式由于检验涉及,因此选用样本均值是合适的,把作为分布的均值更易把区分开来。

⑵选择统计量,给出拒绝域的形式30⑶显著性水平的含义利用统计技术处理问题,难免不犯错误,问题在于控制犯错误的概率,假设检验中常犯两种错误:第一类错误(拒真错误)和第二类错误(取伪错误)。它们发生的概率分别为。判断正确第二类错误(发生概率为)第一类错误(发生概率为)判断正确接受H0接受H1统计判断真实情况H0成立H1成立⑶显著性水平的含义判断正确第二类错误第一类错误判断正确31理论分析表明:①在相同样本量时,取得小,必导致增大。②在相同样本量时,要使小,必导致增大。③要同时使都减小,只有增大样本量n才能实现。通常是控制,不使过小,常选从中制约。把第一类错误概率控制在的意思是:“”理论分析表明:“32⑷确定临界值c,给出拒绝域W据N(0,1)的分位数性质:⑸判断⑷确定临界值c,给出拒绝域W33本例通过u统计量实施假设检验,故称作u检验,在正态总体中,有关它的假设检验总是涉及两个参数,如果是的假设检验,而已知,则如上所述,用u检验,如果未知,则用t检验,如果是的假设检验,则用检验,上述各种正态总体的假设检验综合在下表:检验法条件H0H1检验统计量拒绝域本例通过u统计量实施假设检验,故称作u检验,在正态总34㈢举例例1:据环保法规定,倾入河流的废水中有毒物质平均含量不得超过3ppm,已知废水中该有毒物质含量服从正态分布,现对倾入河中的废水进行检查,15天的记录如下(单位:ppm)3.1,3.2,3.3,2.9,3.5,3.4,2.5,4.3,2.9,3.6,3.2,3.0,2.7,3.5,2.9

试在水平上判断该厂排污是否符合环保规定。解:①如果符合环保规定,那么,应该不超过3ppm,不符合的话应该大于3ppm。所以立假设:②由于未知,故选用t检验③~④根据显著性水平及备择假设确定拒绝域为⑤根据样本观测值,求得,因而有由于它大于1.7613,所以检验统计量t落在拒绝域中,因此在水平上拒绝原假设,认为该厂不符合环保规定,应该采取措施降低废水中该有毒物质的含量。㈢举例35例2:某导线电阻服从未知,要求电阻标准差不得超过,现从一批导线中随机抽取了9根,其样本的标准差为S=0.0066,问:在水平时该批导线电阻是否合格。解:①建立假设:②选用检验。③~④根据显著水平及备择假设,可确定拒绝域为:⑤由样本观测值,求得:由于值未落在拒绝域中,所以不能拒绝原假设,可以认为该批导线电阻波动合格。例2:某导线电阻服从未知,36四、正交试验㈠概述1、质量改进项目,涉及多个因素和多个水平,要确定其中的主要影响因素和水平,要找到因素和水平之间的最佳组合,以达到改进目的。2、由试验获得的结果是客观和可信的,试验综合了现场的各种条件,试验结果比理论分析结果更真实,可靠。3、试验涉及多个因素和水平,要从众多的试验中寻找最佳结果并非易事,试验工作量大,如使人望而生畏。试验设计为我们提供了一种试验工作量小,又能获取优化结果的有效方法。四、正交试验㈠概述37㈡有关名词解释⑴试验指标:考察要达到的效果(目标),有数量指标(长度、电压、强度),非数量指标(颜色、外观等定性指标)。⑵因素:对试验指标产生影响的参数,定量描述因素,定性描述因素,单因数试验,多因素试验。⑶水平(位级):因素变化的各种状态和条件,一个因素往往有好几个水平。⑷完全因素水平组合:㈢正交表:正交设计的基本工具,它是运用组合数学和试验设计经验,构成的规范化表格。⑴正交表符号㈡有关名词解释38正交表举例:1234123456789111222333123123123123231312123312231列号试验号正交表举例:123411111列号试验号39⑵正交表正交性正交性体现在两方面,整齐可比性;因素水平的均衡分散性。①整齐可比性:表中每一因素的每一水平,所出现的次数完全相同。每个因素及水平在试验结果中与其它因素及水平参与试验的机率完全相同,以保证各水平平等参与不造成干扰。②均衡分散性:表中任意两列(因素)的搭配(横向数字对)完全相同,保证试验条件均衡分散在因素水平的完全组合之中,具有很好的代表性。分散可比性就是正交性图中以三个平面,每个平面上分成等间隔的三行,三列。每行、每列都有一个点。⑵正交表正交性40质量分析与质量改进课件41二、无交互作用的正交设计与数据分析㈠试验的设计步骤:⑴、明确试验目的;⑵、确定试验指标,用来判断试验条件的好坏,指标越大(或越小、相等),试验条件越好;⑶、选择因子与水平:首先要分析影响指标的因素是什么,每个因素取哪些水平,通过理论与实践的经验综合判定。⑷、选用合适的正交表,进行表头设计,列出试验计划。首先根据试验中考察的因子水平数和因子的个数具体选定一张表。ⅰ、把因子放到选定的正交表的列上去,即是表头设计。ⅱ、试验计划即是将列中因子的数字换成因子的相应水平,不放因子的列就不考虑,允许有空白列。二、无交互作用的正交设计与数据分析42㈡进行试验和记录试验结果将试验结果记录在试验条件后面1、试验注意事项:①、试验次序要随机化,避免因考虑不周而产生系统误差;②、试验中应避免操作人员不同,仪器设备不同引起的系统误差,尽可能使试验外的其它因素固定,若不能避免时,可增加一个区间因子。(如人)③、试验时,常需要在同一条件下进行重复,可观察试验的稳定性。㈢应用实例例:按质量要求,磁鼓电机输出力矩应大于0.0210N·m,欲通过试验设计找到好的条件,以提高磁鼓电机输出力矩。㈡进行试验和记录试验结果43ⅰ目的:提高磁鼓电机的输出力矩。ⅱ指标:输出力矩是考察指标。ⅲ因子与水平:经分析影响力矩的因子是:A:充磁量,B:定位角度,C:定子线圈匝数。根据以往经验,本试验采用如下水平:123A:充磁量()特90011001300B:定位角度(度)101112C:定子线圈匝数(匝)708090因子水平ⅰ目的:提高磁鼓电机的输出力矩。123A:充磁量(44①选用正交表,本题涉及三个因子,三个水平的正交表,故选用。②将因子列中的数字换成相应的因子水平。③正交表安排了9个不同的试验,呈“整体设计”,由三维图看9个试验点的分布。④记录试验的结果。1、数据直观分析。⑴寻找最好的试验条件按水平号将数据分成三组,每组三个试验结果的和与平均值①选用正交表,本题涉及三个因子,三个水平的正交表,故选用45①上述计算的之间的差异只反映了A的三个水平间的差异,其中二水平数据最佳。②同理可分析第2列,第3列,得到:因子B的二水平,因子C的三水平最好。③综上可知,使指标达到最大的条件是即充磁量取特,定位角取11度,线圈取90匝时,力矩最大,达到0.0236N·m。比原力矩提高了12.4%。⑵各因子对指标影响程度的分析①采用极差分析法,该“极差”是指某一因子的。

②极差大,说明该因子对指标造成的变化大,影响大,因子B极差最大,故影响最大,其次是因子A,再次是因子C。①上述计算的之间的差异只反映了A的三46⑶因子水平对指标的影响图1701601801902002102209001300101112708090⑶因子水平对指标的影响图170160180190200210472、数据方差分析①问题:上述分析用极差评价各因子对指标的影响,那极差要小到何种程度时,可认为该因子对指标值已没有显著影响了呢?实际上,极差方法,不能辨别指标变化是因素水平还是误差原因所造成的,数据的方差分析可解决这个问题。②假设:ⅰ上述每一试验都是独立进行的。ⅱ每一试验条件下的试验指标服从正态分布。ⅲ试验随机变量分布的均值与试验条件有关,可能不相等。它们的方差是相等的。⑴离差平方和分解①各试验结果不同是由于试验条件不同及试验中存在误差。用总离差平方和ST描述,即是九次试验结果数据的总波动2、数据方差分析48表头设计ABCY1234123456789111222333123123123123231312123312231160215180168236190157205140T1T2T3555594502485656510555523573536562553S1421.65686.9427.6116.2试验号列号表头设计ABCY123411111160数据波动源自各因子所取的不同水平及可能的试验误差(组间平方和),分别表示各因子在三个水平下试验结果的平均值,则:③未置因子的空白列,可安放由于误差造成的数据波动,称误差的离差平方和Se(组内平方和),其值为正交表上空白列的离差平方和相加。令Se=S4。④用代数法可证明:在中有如下关系:②数据波动源自各因子所取的不同水平及可能的试验误差50⑵F比:①认为在显著性水平上因子是显著的,分别是因子的均方与自由度,是误差的均方与自由度。②因子与误差自由度的决定来源平方和自由度均方F比因子A1421.32710.812.23因子B5686.922843.448.94因子C427.62213.83.68误差e116.2258.1总计7652.28F0.90(2,2)=9.0,F0.90(2,2)=19.0⑵F比:来源平方和自由度均方F比因子A1421.32710.51ⅰ、列自由度=水平数-1;ⅱ、因子自由度与所在列自由度相等;ⅲ、误差自由度为正交表上空白列自由度相加;ⅳ、总离差平方和的自由度是试验次数n-1;ⅴ、当正交表中n,p,q满足(*)时,离差平方和有(**)式。

自由度具有⑶计算用列表法计算各列的离差平方和与总离差平方和。利用(**)可验证离差平方和计算是否正确。

对F比的计算可借助方差分析表ⅰ、列自由度=水平数-1;523、最佳条件的选择原则:对显著因子应选择其最好的水平,对不显著因子可任意选择水平,实际上常根据降低成本,操作方便等其它因素来确定。本例最佳条件:A2B2或A2B2C,C无下标表示有很大灵活性。4、因子贡献率当试验指标不服从正态分布时,方差分析的依据就不充分,此时采用“因子贡献率”来衡量因子作用的大小。来源平方和自由度纯平方和贡献率(%)因子A1421.621305.417.06因子B5686.925570.772.80因子C427.62311.44.07误差e116.22464.86.07总计7652.283、最佳条件的选择来源平方和自由度纯平方和贡献率(%)因子A53结论:①因子B最重要,其水平变化在数据引起的波动中占总离差的72.8%;②因子A的水平变化引起的指标变化占17.06%,也是显著因素。5、验证试验分析所得的最佳条件未必出现在试验中,为此通常需要验证试验,如A2B2C1(不在9次试验中)。即使在试验条件中出现也需通过验证,看其是否稳定。结论:①因子B最重要,其水平变化在数据引起的波动中占总离差的54㈣几点说明①质量指标的要求是望小值,望目值时,数据的处理。②非数字指标的试验设计举例。③调优试验

一般情况下通过一轮正交试验设计,难以捕捉到最佳试验方案。为此应多轮反复使用,以逼近最佳方案。每一轮正交试验后,应根据试验结果进行分析,然后作调优试验(确定下轮正交试验设计的因素和水平)。调优的原则为:ⅰ、重要因素有苗头处加密水平。ⅱ、次要因素按技术、经济两方面来综合考虑舍取。ⅲ、有疑问的因素重复考虑。ⅳ、意外发现的因素补充考虑。ⅴ、若试验结果与预期目标差异较大时,应重新考虑因素位级的选择。㈣几点说明55三、有交互作用的正交设计与数据分析多因子试验中,两个因子不同水平的搭配,对指标也会有影响,这种影响称A、B间的交互作用。提高某农药收率的试验设计。㈠试验设计设计与上述基本相同,但略有差异。⑴试验目的:提高农药收率;⑵试验指标:农药收率,指标越高越好。hhB2B1A1A2A1A2B2B1B2B1A2A1三、有交互作用的正交设计与数据分析hhB2B1A1A2A1A56⑶确定考虑的因子与水平及交互作用:因素有四个,据经验反应温度与反应时间的交互作用,对收率有较大影响A×B。⑷选用合适的正交表。进行表头设计,列出试验计划。本题要考察4个二水平因子及一个交互作用,因而可看成有5个二水平因子,故选用正交表是适当的。表头设计时要利用交互作用表,指明任意两列的交互作用所在的列号,不可随意放置。因子水平1水平2A:反应温度()6080B:反应时间(小时)2.53.5C:两种原料配比1.1/11.2/1D:真空度(kPa)5060⑶确定考虑的因子与水平及交互作用:因素有四个,据经验反应温度57列号1234567(1)325476(2)16745(3)7654(4)123(5)32(6)1列号1234567(1)325476(2)16745(3)758有了表头便可写试验计划并进行计算,见下表:表头设计ABA×BCD列号1234567表头设计ABA×BCDY123456711(60)1(2.5)11(1.1/1)111(50)8621(60)1(2.5)12(1.2/1)222(60)9531(60)2(3.5)21(1.1/1)122(60)9141(60)2(3.5)22(1.2/1)211(50)9452(80)1(2.5)21(1.1/1)212(60)9162(80)1(2.5)22(1.2/1)121(50)9672(80)2(3.5)11(1.1/1)221(50)8382(80)2(3.5)12(1.2/1)112(60)88T1366368352351361359359T2358356372373363365365S8185060.50.54.54.5试验号列号有了表头便可写试验计划并进行计算,见下表:表头设计ABA59㈡数据分析1、方差分析每一列离差平方和用下式计算:利用方差分析公式,可证明第三列的离差平方和即是交互作用的离差平方和,除误差外,只反映交互效应不同所引起的数据波动,记为。㈡数据分析60的自由度为两因子自由度的乘积,是1。在中同样有平方和分解式,各列离差平方和用计算。由表可知,在水平上,因子C与交互作用A×B对指标有显著的影响。来源平方和自由度均方F比A8.018.03.2B18.0118.07.2C60.5160.524.2D4.514.51.8A×B50.0150.020E5.022.5总计146.07F0.95(1,2)=18.5的自由度为两因子自由度的乘积,是1。在612、最佳条件选择当两因子交互作用显著时,暂不考虑每一因子是否显著,先分析两个因子不同搭配的指标均值,从中选择最好的搭配组合。A、B因子各占一列,各有两个水平,其搭配见下表:

由此可见AB搭配A2×B1以为最好,因子D不显著,水平可任取。最佳条件是A2B1C2A1A2B1(86+95)/2=90.5(91+96)/2=93.5B2(91+94)/2=92.5(83+88)/2=85.52、最佳条件选择A1A2B1(86+95)/2=90.5(962㈢避免混杂现象避免在一列中同时存在两个因子或交互作用的情况,否则存在两个因子或交互作用的列,将难以判别何者是显著因子,选用较多列数的正交表可避免此问题。原则:1、安排时,因子与所在列的自由度与因子的自由度相同;2、交互作用的自由度应与交互作用所占列的自由度之和相同。3、选择的正交表必须满足(必要条件),所考察因子的自由度与交互作用的自由度之和≤n-1。

㈢避免混杂现象63举例:1、A,B,C,D为二水平因子,且要考察交互作用A×B,A×C。

选二水平正交表,因子与交互作用的自由度之和为:2、A,B,C,D为二水平因子,且要考察交互作用A×B,C×D。

选二水平正交表,因子与交互作用的自由度之和为6。表头设计ABA×BCA×CD列号1234567举例:1、A,B,C,D为二水平因子,且要考察交互作用A×B643、A,B,C,D,E为三水平因子,且要考察A×B。

选三水平正交表,因子与交互作用的自由度之和表头设计ABA×BC×DCD列号1234567表头设计ABA×BCDC×D列号123456789101112131415表头设计ABA×BCDE列号123,456789101112133、A,B,C,D,E为三水平因子,且要考察A×B。表头设6512345678912345678966质量分析与质量改进课件67质量分析与质量改进课件68质量分析与质量改进

培训内容2质量分析与质量改进

培训内容2691、质量改进用的随机变量分布连续随机变量的概率分布问题。采用概率密度的概念,即是随机变量(连续)单位长度上的概率p(x)

概率密度函数是概率密度与随机变量(自变量)的变化关系,显然p(x)≥0,它与x轴所夹的面积恰好为1。其在区间(a,b)上取值的概率P(a≤x≤b)为概率密度曲线下,区间(a,b)上的面积。一、随机变量分布技术1、质量改进用的随机变量分布一、随机变量分布技术70正态分布:①概率密度函数

a、根据函数可知图形以值构成纵向对称,呈钟形曲线;

b、为正态分布均值,是分布中心位置,是正态分布的方差,表明分散性。决定了正态分布曲线的形状,故正态曲线用表示;

c、曲线围绕横轴的总面积等于1;

d、固定,不同的,则曲线形状不变,只是在横轴上的位置改变;

e、固定,改变,则曲线位置不变,只是改变了形状。正态分布:71正态概率分布函数②标准正态分布当的正态分布,称标准正态分布,记为u~N(0,1)。其随机变量记为u,概率密度函数记为标准正态曲线只有一条(唯一),因而可制成表绘成图,可以根据u的大小在表中查得对应的概率。标准正态概率密度和标准正态概率分布表起同样的作用正态概率分布函数72根据定义及图形可获得如下的计算公式:③标准正态分布的分位数

N(0,1)的分位数是一个在分位数左侧面积为,右侧面积恰好为的分界线,即分位数是满足下列等式的实数就是分位数,可根据概率的大小在标准正态表中查到。尾数可用内插法决定。ⅠⅡⅢⅣ根据定义及图形可获得如下的计算公式:ⅠⅡⅢⅣ73例1:求的分位数因为表中都大于0.5,不能直接查表,故需变换,根据对称性知:例2:求的分位数因为正态分布表中不能直接查,只有由于刚介于0.9495与0.9505中间,故例1:求的分位数74④正态分布的计算任一正态变量x经过标准化变换后

都可以变换成标准正态变量u。

例:因此以下正态分布的概率计算可方便的利用标准变换。式中为标准正态分布函数,可以直接查表。④正态分布的计算式中为标准正态分布函数,75举例1:电阻器的规格限为,服从正态分布,均值80.80k,则其低于的概率和超过的概率分别为举例1:电阻器的规格限为,76举例2:已知:1、受控情况下,产品质量特性的分布2、产品规格限,包括上规格限和下规格限,它们是依据文件中的规定,顾客要求,公认的标准,企业下达的任务书等来决定的。问题一:分布中心与规格中心重合时,产品的质量特性x超出规格限的不合格品率。举例2:77规格限合格品率(%)不合格品率(ppm)68.2731730095.454550099.73270099.99376399.9999430.5799.99999980.002规格限合格品率(%)不合格品率(ppm)68.273173078问题二:分布中心与规格中心不重合时。不合格品率的计算。1、允许有的偏移;2、偏移只在一个方向上,不能上下同时发生。问题二:分布中心与规格中心不重合时。不合格品率的计算。1、允792、统计量与抽样分布⑴、统计量样本通过加工把零散的信息集中起来以反映总体的特征,其中构造样本函数是一种有效的方法,不同函数反映总体的不同特征,通常我们将不含未知参数的样本函数称为统计量。统计量举例2、统计量与抽样分布80⑵、抽样分布统计量的分布称抽样分布抽样分布的解释⑵、抽样分布81样本1样本2样本3样本411911121140109911910108111181313109.810.210.810.4总体8991110911121013910111310109101012计算每个样本的均值,它们不全相等为什么这些样本均值不全相等呢?因为抽样的随机性若取更多的样本,会发生什么呢?会产生样本均值分布样本1样本2样本3样本41.301.931.481.14计算每个样本的标准差,它们也不全相等由于抽样的随机性,该样本标准差不全相等若取更多样本,会产生样本标准差的分布抽样分布的解释样本1样本2样本3样本411911121140109911982可以得出:每个统计量都有一个抽样分布;不同统计量有不同的抽样分布,当样本来自时,其样本均值,方差,以及它们的某种组合所组成的抽样分布,在理论上已经导出;抽样分布是统计推断的基础。⑶、正态分布的抽样分布。①当已知时,正态总体的样本均值分布为这可通过标准化变换得到,可以得出:83②当未知时,即用样本标准差S代替上式中的,此时。称服从自由度为n-1的t分布,即t(n-1)t(n-1)与N(0,1)的概率密度函数类似,是对称分布;t(n-1)的峰值比N(0,1)略低,底部略宽;当自由度(n-1)超过30时,两者区别不大。③正态样本的分布——分布定义:正态样本方差除以总体方差的(n-1)倍的分布,是自由度为(n-1)的分布,记为②当未知时,即用样本标准差S代替上式中的84分布的概率密度函数在正半轴上是偏态函数④两个独立的正态样本方差之比的分布——F分布定义:a、两个独立的正态总体方差相等;b、是分别来自的两个样本,它们互相独立;c、这两个样本方差之比的分布是自由度为n-1和m-1的F分布分布的概率密度函数在正半轴上是偏态函数85二、参数估计在实际问题中,总体的参数都是未知的,需要选用适当的统计量作为未知参数的估计,此统计量称为点估计量。㈠点估计⑴定义:用样本的某一函数作为总体中未知参数的估计。设是总体的某个未知参数,X是该总体的随机变量,是总体的一个样本量为n的样本,若构造一个统计量,用它作为对的估计,则称是的点估计。如抽取到一个,就可计算出值,此乃估计量中的一个具体值。二、参数估计在实际问题中,总体的参数都是未知的,需86⑵点估计优良性标准是随机的,不能用某个具体的估计值来评价是否接近的优劣,应从多次使用中来评定。与之间总有偏差,即,但因未知,其差也无法得到,通常用多次采样,将不同的进行的平均。即用来表征估计量的优劣,因此此时称是无偏的,否则称有偏的,无偏性是表示估计优良性的一个重要指标,在选择估计值时尽量选用无偏估计量。式中是估计量的方差,希望方差愈小愈好,这是估计优良性的另一指标。⑵点估计优良性标准87⑶点估计方法无论是总体均值或总体方差都可用样本的均值或方差作出估计,这就是点估计:①用样本矩去估计相应的总体矩。②用样本矩的函数去估计相应的总体矩的函数。此法简单实用,对的估计是无偏的,对的估计也是无偏的,但这种估计未必总是有效的,也不唯一。⑷点估计举例(正态总体参数的无偏估计)例:把钢材弯成钢夹,其间隙大小是一个重要特性,现从生产线上随机取5个钢夹测量其间隙,得数据如下:0.750.700.650.700.60已知钢夹间隙服从正态分布,试定出参数的无偏估计。⑶点估计方法88解:用样本均值估计,用样本方差估计:解:用样本均值估计,用样本方差估计89㈡区间估计⑴概述:点估计只给出参数的一个具体估计值,未给出估计精度,而区间估计是用一个区间来估计未知参数,区间体现了估计的精度。⑵区间估计定义是总体的待估计参数,其一切可能取值组成参数空间。记是总体的样本量为n的样本,对给定的确定两个统计量:若对任意,则称随机区间是的置信水平为的置信区间。

㈡区间估计90⑶正态总体参数的置信区间①总体均值的置信区间求法⑶正态总体参数的置信区间91注:ⅰ、该区间的中心为,区间半径为ⅱ、置信水平增大时,置信区间的长度将增加,因为此时减小,则就增大。ⅲ、若要提高估计精度,势必要缩短置信区间的长度,在置信水平及标准差都不变的情况下,只有加大n.②总体的置信区间求法注:ⅰ、该区间的中心为,区间半径为92⑷应用举例例1:某溶液中的甲醛浓度服从正态分布,从中抽取一个n=4的样本得=9.34%,样本S=0.03%,分别求正态均值的95%的置信区间。解:求的置信区间,因未知,故用t分布来求。根据=8.34%,S=0.03%,及n=4,=0.05,查t分布表,得。⑷应用举例93例2:一物体的重量未知,若用天平去称,所得称重总有误差,且是一个随机变量,通常服从正态分布。如果已知称重误差的标准差为0.1克(根据天平精度给出),为使的95%的置信区间长度不超过0.1,则至少应称多少次?这是估计样本量的问题,在已知时,的95%置信区间为:例2:一物体的重量未知,若用天平去称,所得称重总有误差,且是94三、假设检验㈠假设检验问题用来判定获取的样本值与总体值或几个样本值之间的差异是确实存在还是由于偶然因素产生的。对总体参数分布做某种假设,再根据抽取的样本观测值,运用统计分析方法,检验这种假设是否成立,从而决定是接受或拒绝这一假设。这一过程就是假设检验。例:装配线的直通率在最近三个月内由95%降为85%,经分析认为,由于供应商A和B提供的电子物料品质(某参数均值)不同,是造成直通率下降的原因,试通过假设检验对这种判断进行检验。三、假设检验㈠假设检验问题95例:某车床加工零件的外园直径目标值为550mm,之前,零件尺寸的标准差,现从加工零件中抽取35个,测得35个数据,试问外园直径均值是否偏离目标值。意义:1、用样本代替总体(节省时间,降低成本,替代某种不可能的事。)2、确认这种替代的精确性或可行性。例:某车床加工零件的外园直径目标值为550mm,之前,零件尺96㈡假设检验步骤1、2、步骤:根据所获样本,运用统计分析方法,对总体的某种假设H0作出接收或拒绝的判断。⑴建立假设:日生产化纤纤度肯定会偏离目标值1.40,若是随机误差引起的差异,则认为H0:1.40会成立。若是别的特殊因素引起的差异,则应拒绝H0,此时相反的假设这叫备择假设,若也叫备择假设,但这是单侧检验问题。。,=㈡假设检验步骤。,=97⑵选择统计量,给出拒绝域的形式由于检验涉及,因此选用样本均值是合适的,把作为分布的均值更易把区分开来。

⑵选择统计量,给出拒绝域的形式98⑶显著性水平的含义利用统计技术处理问题,难免不犯错误,问题在于控制犯错误的概率,假设检验中常犯两种错误:第一类错误(拒真错误)和第二类错误(取伪错误)。它们发生的概率分别为。判断正确第二类错误(发生概率为)第一类错误(发生概率为)判断正确接受H0接受H1统计判断真实情况H0成立H1成立⑶显著性水平的含义判断正确第二类错误第一类错误判断正确99理论分析表明:①在相同样本量时,取得小,必导致增大。②在相同样本量时,要使小,必导致增大。③要同时使都减小,只有增大样本量n才能实现。通常是控制,不使过小,常选从中制约。把第一类错误概率控制在的意思是:“”理论分析表明:“100⑷确定临界值c,给出拒绝域W据N(0,1)的分位数性质:⑸判断⑷确定临界值c,给出拒绝域W101本例通过u统计量实施假设检验,故称作u检验,在正态总体中,有关它的假设检验总是涉及两个参数,如果是的假设检验,而已知,则如上所述,用u检验,如果未知,则用t检验,如果是的假设检验,则用检验,上述各种正态总体的假设检验综合在下表:检验法条件H0H1检验统计量拒绝域本例通过u统计量实施假设检验,故称作u检验,在正态总102㈢举例例1:据环保法规定,倾入河流的废水中有毒物质平均含量不得超过3ppm,已知废水中该有毒物质含量服从正态分布,现对倾入河中的废水进行检查,15天的记录如下(单位:ppm)3.1,3.2,3.3,2.9,3.5,3.4,2.5,4.3,2.9,3.6,3.2,3.0,2.7,3.5,2.9

试在水平上判断该厂排污是否符合环保规定。解:①如果符合环保规定,那么,应该不超过3ppm,不符合的话应该大于3ppm。所以立假设:②由于未知,故选用t检验③~④根据显著性水平及备择假设确定拒绝域为⑤根据样本观测值,求得,因而有由于它大于1.7613,所以检验统计量t落在拒绝域中,因此在水平上拒绝原假设,认为该厂不符合环保规定,应该采取措施降低废水中该有毒物质的含量。㈢举例103例2:某导线电阻服从未知,要求电阻标准差不得超过,现从一批导线中随机抽取了9根,其样本的标准差为S=0.0066,问:在水平时该批导线电阻是否合格。解:①建立假设:②选用检验。③~④根据显著水平及备择假设,可确定拒绝域为:⑤由样本观测值,求得:由于值未落在拒绝域中,所以不能拒绝原假设,可以认为该批导线电阻波动合格。例2:某导线电阻服从未知,104四、正交试验㈠概述1、质量改进项目,涉及多个因素和多个水平,要确定其中的主要影响因素和水平,要找到因素和水平之间的最佳组合,以达到改进目的。2、由试验获得的结果是客观和可信的,试验综合了现场的各种条件,试验结果比理论分析结果更真实,可靠。3、试验涉及多个因素和水平,要从众多的试验中寻找最佳结果并非易事,试验工作量大,如使人望而生畏。试验设计为我们提供了一种试验工作量小,又能获取优化结果的有效方法。四、正交试验㈠概述105㈡有关名词解释⑴试验指标:考察要达到的效果(目标),有数量指标(长度、电压、强度),非数量指标(颜色、外观等定性指标)。⑵因素:对试验指标产生影响的参数,定量描述因素,定性描述因素,单因数试验,多因素试验。⑶水平(位级):因素变化的各种状态和条件,一个因素往往有好几个水平。⑷完全因素水平组合:㈢正交表:正交设计的基本工具,它是运用组合数学和试验设计经验,构成的规范化表格。⑴正交表符号㈡有关名词解释106正交表举例:1234123456789111222333123123123123231312123312231列号试验号正交表举例:123411111列号试验号107⑵正交表正交性正交性体现在两方面,整齐可比性;因素水平的均衡分散性。①整齐可比性:表中每一因素的每一水平,所出现的次数完全相同。每个因素及水平在试验结果中与其它因素及水平参与试验的机率完全相同,以保证各水平平等参与不造成干扰。②均衡分散性:表中任意两列(因素)的搭配(横向数字对)完全相同,保证试验条件均衡分散在因素水平的完全组合之中,具有很好的代表性。分散可比性就是正交性图中以三个平面,每个平面上分成等间隔的三行,三列。每行、每列都有一个点。⑵正交表正交性108质量分析与质量改进课件109二、无交互作用的正交设计与数据分析㈠试验的设计步骤:⑴、明确试验目的;⑵、确定试验指标,用来判断试验条件的好坏,指标越大(或越小、相等),试验条件越好;⑶、选择因子与水平:首先要分析影响指标的因素是什么,每个因素取哪些水平,通过理论与实践的经验综合判定。⑷、选用合适的正交表,进行表头设计,列出试验计划。首先根据试验中考察的因子水平数和因子的个数具体选定一张表。ⅰ、把因子放到选定的正交表的列上去,即是表头设计。ⅱ、试验计划即是将列中因子的数字换成因子的相应水平,不放因子的列就不考虑,允许有空白列。二、无交互作用的正交设计与数据分析110㈡进行试验和记录试验结果将试验结果记录在试验条件后面1、试验注意事项:①、试验次序要随机化,避免因考虑不周而产生系统误差;②、试验中应避免操作人员不同,仪器设备不同引起的系统误差,尽可能使试验外的其它因素固定,若不能避免时,可增加一个区间因子。(如人)③、试验时,常需要在同一条件下进行重复,可观察试验的稳定性。㈢应用实例例:按质量要求,磁鼓电机输出力矩应大于0.0210N·m,欲通过试验设计找到好的条件,以提高磁鼓电机输出力矩。㈡进行试验和记录试验结果111ⅰ目的:提高磁鼓电机的输出力矩。ⅱ指标:输出力矩是考察指标。ⅲ因子与水平:经分析影响力矩的因子是:A:充磁量,B:定位角度,C:定子线圈匝数。根据以往经验,本试验采用如下水平:123A:充磁量()特90011001300B:定位角度(度)101112C:定子线圈匝数(匝)708090因子水平ⅰ目的:提高磁鼓电机的输出力矩。123A:充磁量(112①选用正交表,本题涉及三个因子,三个水平的正交表,故选用。②将因子列中的数字换成相应的因子水平。③正交表安排了9个不同的试验,呈“整体设计”,由三维图看9个试验点的分布。④记录试验的结果。1、数据直观分析。⑴寻找最好的试验条件按水平号将数据分成三组,每组三个试验结果的和与平均值①选用正交表,本题涉及三个因子,三个水平的正交表,故选用113①上述计算的之间的差异只反映了A的三个水平间的差异,其中二水平数据最佳。②同理可分析第2列,第3列,得到:因子B的二水平,因子C的三水平最好。③综上可知,使指标达到最大的条件是即充磁量取特,定位角取11度,线圈取90匝时,力矩最大,达到0.0236N·m。比原力矩提高了12.4%。⑵各因子对指标影响程度的分析①采用极差分析法,该“极差”是指某一因子的。

②极差大,说明该因子对指标造成的变化大,影响大,因子B极差最大,故影响最大,其次是因子A,再次是因子C。①上述计算的之间的差异只反映了A的三114⑶因子水平对指标的影响图1701601801902002102209001300101112708090⑶因子水平对指标的影响图1701601801902002101152、数据方差分析①问题:上述分析用极差评价各因子对指标的影响,那极差要小到何种程度时,可认为该因子对指标值已没有显著影响了呢?实际上,极差方法,不能辨别指标变化是因素水平还是误差原因所造成的,数据的方差分析可解决这个问题。②假设:ⅰ上述每一试验都是独立进行的。ⅱ每一试验条件下的试验指标服从正态分布。ⅲ试验随机变量分布的均值与试验条件有关,可能不相等。它们的方差是相等的。⑴离差平方和分解①各试验结果不同是由于试验条件不同及试验中存在误差。用总离差平方和ST描述,即是九次试验结果数据的总波动2、数据方差分析116表头设计ABCY1234123456789111222333123123123123231312123312231160215180168236190157205140T1T2T3555594502485656510555523573536562553S1421.65686.9427.6116.2试验号列号表头设计ABCY123411111160T155548555117②数据波动源自各因子所取的不同水平及可能的试验误差(组间平方和),分别表示各因子在三个水平下试验结果的平均值,则:③未置因子的空白列,可安放由于误差造成的数据波动,称误差的离差平方和Se(组内平方和),其值为正交表上空白列的离差平方和相加。令Se=S4。④用代数法可证明:在中有如下关系:②数据波动源自各因子所取的不同水平及可能的试验误差118⑵F比:①认为在显著性水平上因子是显著的,分别是因子的均方与自由度,是误差的均方与自由度。②因子与误差自由度的决定来源平方和自由度均方F比因子A1421.32710.812.23因子B5686.922843.448.94因子C427.62213.83.68误差e116.2258.1总计7652.28F0.90(2,2)=9.0,F0.90(2,2)=19.0⑵F比:来源平方和自由度均方F比因子A1421.32710.119ⅰ、列自由度=水平数-1;ⅱ、因子自由度与所在列自由度相等;ⅲ、误差自由度为正交表上空白列自由度相加;ⅳ、总离差平方和的自由度是试验次数n-1;ⅴ、当正交表中n,p,q满足(*)时,离差平方和有(**)式。

自由度具有⑶计算用列表法计算各列的离差平方和与总离差平方和。利用(**)可验证离差平方和计算是否正确。

对F比的计算可借助方差分析表ⅰ、列自由度=水平数-1;1203、最佳条件的选择原则:对显著因子应选择其最好的水平,对不显著因子可任意选择水平,实际上常根据降低成本,操作方便等其它因素来确定。本例最佳条件:A2B2或A2B2C,C无下标表示有很大灵活性。4、因子贡献率当试验指标不服从正态分布时,方差分析的依据就不充分,此时采用“因子贡献率”来衡量因子作用的大小。来源平方和自由度纯平方和贡献率(%)因子A1421.621305.417.06因子B5686.925570.772.80因子C427.62311.44.07误差e116.22464.86.07总计7652.283、最佳条件的选择来源平方和自由度纯平方和贡献率(%)因子A121结论:①因子B最重要,其水平变化在数据引起的波动中占总离差的72.8%;②因子A的水平变化引起的指标变化占17.06%,也是显著因素。5、验证试验分析所得的最佳条件未必出现在试验中,为此通常需要验证试验,如A2B2C1(不在9次试验中)。即使在试验条件中出现也需通过验证,看其是否稳定。结论:①因子B最重要,其水平变化在数据引起的波动中占总离差的122㈣几点说明①质量指标的要求是望小值,望目值时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论