质量常用统计技术三_第1页
质量常用统计技术三_第2页
质量常用统计技术三_第3页
质量常用统计技术三_第4页
质量常用统计技术三_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质量常用统计技术方差分析回归分析试验设计上海质量教育培训中心2005年第一节方差分析

一、几个概念二、单因子方差分析

一、几个概念

在试验中改变状态的因素称为因子,常用大写英文字母A、B、C、…等表示。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为A1,A2,…,Ak。试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用Y表示。Y是一个随机变量。单因子试验:若试验中所考察的因子只有一个。[例2.1-1]现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?

工厂量件强度

10310198110

113107108116

82928486三个工厂的零件强度

在这一例子中,考察一个因子:因子A:工厂该因子有三个水平:甲、乙、丙试验指标是:零件强度这是一个单因子试验的问题。每一水平下的试验结果构成一个总体,现在需要比较三个总体均值是否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比较各个总体均值是否一致的问题可以用方差分析方法来解决。二、单因子方差分析

假定因子A有r个水平,在Ai水平下指标服从正态分布,其均值为,方差为,i=1,2,…,r。每一水平下的指标全体便构成一个总体,共有r个总体,这时比较各个总体的问题就变成比较各个总体的均值是否相同的问题了,即要检验如下假设是否为真:当不真时,表示不同水平下的指标的均值有显著差异,此时称因子A是显著的,否则称因子A不显著。检验这一假设的分析方法便是方差分析。方差分析的三个基本假定1.在水平下,指标服从正态分布;2.在不同水平下,各方差相等;3.各数据相互独立。设在一个试验中只考察一个因子A,它有r个水平,在每一水平下进行m次重复试验,其结果用表示,i=1,2,…,r。常常把数据列成如下表格形式:单因子试验数据表记第i水平下的数据均值为,总均值为。此时共有n=rm个数据,这n个数据不全相同,它们的波动(差异)可以用总离差平方和ST去表示记第i水平下的数据和为Ti,;引起数据波动动(差异)的的原因不外如如下两个:一是由于因子子A的水平不不同,当假设设H0不真时,各个个水平下指标标的均值不同同,这必然会会使试验结果果不同,我们们可以用组间间离差平方和和来表示,也也称因子A的的离差平方和和:这里乘以m是是因为每一水水平下进行了了m次试验。。二是由于存在在随机误差,,即使在同一一水平下获得得的数据间也也有差异,这这是除了因子子A的水平外外的一切原因因引起的,我我们将它们归归结为随机误误差,可以用用组内离差平平方和表示::Se:也称为误差差的离差平方方和可以证明有如如下平方和分分解式:ST、SA、Se的自由度分别用、、表示,它们也有分解式:,其中:因子或误差的的离差平方和和与相应的自自由度之比称称为因子或误误差的均方和和,并分别记记为:两者的比记为:当时认为在显著性水平上因子A是显著的。其中是自由度为的F分布的1-α分位数。单因子方差分分析表各个离差平方方和的计算::其中是第i个水平下的数据和;T表示所有n=rm个数据的总和。

进行方差分析析的步骤如下下:(1)计算因因子A的每一一水平下数据据的和T1,T2,…,Tr及总和T;(2)计算各类数据的平方和;

(3)依次计计算ST,SA,Se;(4)填写方方差分析表;;(5)对于给定的显著性水平α,将求得的F值与F分布表中的临界值比较,当时认为因子A是显著的,否则认为因子A是不显著的。

对上例的分析析(1)计算各各类和:每一水平下的的数据和为::数据的的总和和为T=1200(2))计算算各类类平方方和::原始数据的平方和为:

每一水平下数据和的平方和为

(3))计算算各离离差平平方和和:ST=121492-12002/12=1492,,fT=3××4-1=11SA=485216/4-12002/12=1304,fA=3-1=2Se=1492-1304=188,fe=11-2=9(4))列方方差分分析表表:[例2.1-1]的的方差差分析析表(5)如果给定=0.05,从F分布表查得

由于F>4.26,所以在=0.05水平上结论是因子A是显著的。这表明不同的工厂生产的零件强度有明显的差异。

当因子子A是是显著著时,,我们们还可可以给给出每每一水水平下下指标标均值值的估估计,,以便便找出出最好好的水水平。。在单单因子子试验验的场场合,,第i个水水平指指标均均值的的估计计为::,

在本例例中,,三个个工厂厂生产产的零零件的的平均均强度度的的的估计计分别别为::由此可可见,,乙厂厂生产产的零零件的的强度度的均均值最最大,,如果果我们们需要要强度度大的的零件件,那那么购购买乙乙厂的的为好好;而而从工工厂来来讲,,甲厂厂与丙丙厂应应该设设法提提高零零件的的强度度。误差方差的估计:这里方差的估计是MSe。在本例中:的估计是20.9。

的估计是

[例2.1-2]略略(见见教材材P92))三、重重复数数不等等的情情况若在每一水平下重复试验次数不同,假定在Ai水平下进行次试验,那么进行方差分析的步骤仍然同上,只是在计算中有两个改动:

例2.1-3某某型号号化油油器原原中小小喉管管的结结构使使油耗耗较大大,为为节约约能源源,设设想了了两种种改进进方案案以降降低油油耗。。油耗耗的多多少用用比油油耗进进行度度量,,现在在对用用各种种结构构的中中小喉喉管制制造的的化油油器分分别测测定其其比油油耗,,数据据如表表所列列,试试问中中小喉喉管的的结构构(记记为因因子A)对对平均均比油油油耗耗的影影响是是否显显著。。(这这里假假定每每一种种结构构下的的油耗耗服从从等方方差的的正态态分布布)[例2.1-3]的的试验验结果果水平试验结果(比油耗-220)A1:原结构11.012.87.68.34.75.59.310.3A2:改进方案12.84.5-1.50.2A3:改进方案24.36.11.43.6(为简简化计计算,,这里里一切切数据据均减减去220,不不影响响F比比的计计算及及最后后分析析因子子的显显著性性)(1))各水水平下下的重重复试试验次次数及及数据据和分分别为为:A1:m1=8,T1=69.5A2:m2=4,T2=6.0A3:m3=4,T3=15.4总的试试验次次数n=16,,数据据的总总和为为T=90.9(2))计算算各类类平方方和::(3))计算算各离离差平平方和和:ST=757.41-516.43=240.98,fT=16-1=15SA=672.07-516.43=155.64,fA=3-1=2Se=240.98-155.64=85.34,fe=15-2=13(4))列方方差分分析表表:[例2.1-3]方方差分分析表表(5)如果给定=0.05,从F分布表查得

由于F>3.81,,所以在α=0.05水平上我我们的结论论是因子A是显著的的。这表明明不同的中中小喉管结结构生产的的化油器的的平均比油油耗有明显显的差异。。我们还可以以给出不同同结构生产产的化油器器的平均比比油耗的估估计:这里加上220是因因为在原数数据中减去去了220的缘故。。由此可见,,从比油耗耗的角度看看,两种改改进结构都都比原来的的好,特别别是改进结结构1。在本例中误误差方差的的估计为6.56,,标准差的的估计为2.56。。第二节回回归归分析例2.2-1合合金的强强度y与合合金中的碳碳含量x有有关。为了了生产出强强度满足顾顾客需要的的合金,在在冶炼时应应该如何控控制碳含量量?如果在在冶炼过程程中通过化化验得到了了碳含量,,能否预测测合金的强强度?这时需要研研究两个变变量间的关关系。首先先是收集数数据(xi,yi),i=1,2,……,n。。现从生产产中收集到到表2.2-1所示示的数据。。表2.2-1数数据表表一、散布图图6050400.150.200.10xy[例2.2-1]的的散布图二、相关系系数1.相关系系数的定义义在散布图上上n个个点在一条条直线附近近,但又不不全在一条条直线上,,称为两个个变量有线线性相关关关系,可以以用相关系系数r去去描述它它们线性关关系的密切切程度其中性质:

表示n个点在一条直线上,这时两个变量间完全线性相关。

r>0表示示当x增加加时y也增增大,称为为正相关r<0表示示当x增加加时y减小小,称为负负相关r=0表示示两个变量量间没有线线性相关关关系,但并并不排斥两两者间有其其它函数关关系。2.相关系系数的检验验若记两个变变量x和y理论的相相关系数为为,,其其中x为一一般变量,,y服从等等方差的正正态分布,,则对给定的显著性水平,当可以认为两者间存在一定的线性相关关系,可以从表2.2-2中查出。(其中n为样本量)。

3.具体计计算求上例的相相关系数::步骤如下::(1)计算算变量x与与y的数据据和:Tx==1.90,Ty==590.5

(2)计算算各变量的的平方和与与乘积和::(3)计算算Lxx,Lyy,Lxy:Lxy=95.9250-1.90×590.5/12=2.4292Lxx=0.3194-1.902/12=0.0186Lyy=29392.75-590.52/12=335.2292(4)计算r:在=0.05时,,由于r>0.576,说明两个变量间有(正)线性相关关系。

四、一元线线性回归方方程1.一一元线性回回归方程的的求法:一元线性回归方程的表达式为

其中a与b使下列离离差平方和和达到最小小:通过微分学学原理,可可知,

称这种估计计为最小二二乘估计。。b称为回回归系数;;a一般称称为常数项项。求一元线性性回归方程程的步骤如如下:(1)计算算变量x与与y的数据据和Tx,Ty;(2)计算算各变量的的平方和与与乘积和;;(3)计算算Lxx,Lxy;(4)求出出b与a;;利用前面的的数据,可可得:b=2.4392/0.0186=130.6022a=590.5/12-130.6022××1.90/12=28.5297(5)写出出回归方程程:画出的回归直线一定通过(0,a)与两点

上例:或2.回回归方程的的显著性检检验有两种方法法:一是用上述述的相关系系数;二是用方差差分析方法法(为便于于推广到多多元线性回回归的场合合),将总总的离差平平方和分解解成两个部部分:回归归平方和与与离差平方方和。总的离差平方和:

回归平方和:

离差平方和:

且有ST=SR+SE,其中

它们的自由由度分别为为:fT=n-1,,fR=1,fE=n-2=fT-fR计算F比,,对给定的显著性水平,当时认为回归方程是显著的,即回归方程是有意义的。一般也列成方差分析表。

对上面的例例子,作方方差分析的的步骤如下下:根据前面的的计算(1)计算算各类平方方和:ST=Lyy=335.2292,fT=12-1=11SR=bLxy=130.6022×2.4292=317.2589,fR=1SE=335.2292-317.2589=17.9703,fE=11-1=10(2)列方方差分析表表:[例2.2-1]的的方差分析析表对给定的显著性水平=0.05,有

F0.95(1,10)=4.96由于F>4.96,,所以在0.05水水平上认为为回归方程程是显著的的(有意义义的)。3.利用回回归方程进进行预测对给定的,y的预测值为

概率为的y的预测区间是

其中当n较大,与相差不大,那么可给出近似的预测区间,此时

进行预测的的步骤如下下:(1)对给给出的x0求预测值上例,设x0=0.16,则(2)求的估计

上例有

(3)求上例n=12,如果果求概率为为95%的的预测区间间,那么t0.975(10)=2.228,所以以(4)写出预测区间

上例为(49.43-3.11,49.43+3.11)=(46.32,52.54)由于u0.975=1.96,故概率率为0.95的近似似的预测区区间为:∵∴所求区间::(49.43-2.63,49.43+2.63)=((46.80,52.06))相差较大的的原因总n较小。四、可化为为一元线性性回归的曲曲线回归在两个重复复的散布图图上,n个个点的散布布不一定都都在一条直直线附近波波动,有时时可能在某某条曲线附附近波动,,这时以建建立曲线回回方程为好好。1.确确定曲曲线回归归方程形形式2.曲曲线回回归方程程中参数数的估计计通过适当当的变换换,化为为一元线线性回归归的形式式,再利利用一元元线性回回归中的的最小二二乘估计计方法获获得。回归曲线线的形式式:(1),,((a>0,b>0)(2),,(b>0))(3),,(b>0))(4),,((b>0)3.曲曲线回回归方程程的比较较常用的比比较准则则:(1)要要求相关关指数R大,其其平方也也称为决决定系数数,它被被定义为为:(2)要要求剩余余标准差差s小,,它被定定义为::第三节试试验设设计一、试验验设计的的基本概概念与正正交表(一)试试验设计计多因素试试验遇到到的最大大困难是是试验次次数太多多,若十十个因素素对产品品质量有有影响,,每个因因素取两两个不同同状态进进行比较较,有210=1024、如如果每个个因素取取三个不不同状态态310=59049个个不同的的试验条条件选择部分分条件进进行试验验,再通通过数据据分析来来寻找好好的条件件,这便便是试验验设计问问题。通通过少量量的试验验获得较较多的信信息,达达到试验验的目的的。利用用正正交交表表进进行行试试验验设设计计的的方方法法就就是是正正交交试试验验设设计计。。(二二))正正交交表表“L””表表示示正正交交表表,,““9””是是表表的的行行数数,,在在试试验验中中表表示示试试验验的的条条件件数数,,““4””是是列列数数,,在在试试验验中中表表示示可可以以安安排排的的因因子子的的最最多多个个数数,,““3””是是表表的的主主体体只只有有三三个个不不同同数数字字,,在在试试验验中中表表示示每每一一因因子子可可以以取取的的水水平平数数。。正交交表表具具有有正正交交性性,,这这是是指指它它有有如如下下两两个个特特点点::(1))每每列列中中每每个个数数字字重重复复次次数数相相同同。。在表L9(34)中,每每列有3个不同同数字::1,2,3,,每一个个出现3次。(2)将将任意两两列的同同行数字字看成一一个数对对,那么一切可可能数对对重复次次数相同同。在表L9(34)中,任任意两列列有9种种可能的的数对::(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一一对出现现一次。。常用的正正交表有有两大类类(1)一一类正正交表的的行数n,列数数p,水水平数q间有如下下关系::n=qk,k=2,3,4,…,p=(n-1)/(q-1)如:L4(23),L8(27),L16(215),L32(231)等,,可以以考察察因子子间的的交互互作用用。(2))另一一类正正交表表的行行数,,列数数,水水平数数之间间不满足足上述述的两两个关关系如:L12(211),L18(37),L20(219),L36(313)等这类正正交表表不能能用来来考察察因子子间的的交互互作用用常用正正交表表见附附录二、无交互互作用的正正交设计与与数据分析析试验设计一一般有四个个步骤:1.试试验设计2.进进行试验获获得试验结结果3.数数据分析4.验验证试验例2.3-1磁磁鼓电机是是彩色录像像机磁鼓组组件的关键键部件之一一,按质量量要求其输输出力矩应应大于210g.cm。某生生产厂过去去这项指标标的合格率率较低,从从而希望通通过试验找找出好的条条件,以提提高磁鼓电电机的输出出力矩。(一)试验验的设计在安排试验验时,一般般应考虑如如下几步::(1)明确确试验目的的(2)明确确试验指标标(3)确定定因子与水水平(4)选用用合适的正正交表,进进行表头设设计,列出出试验计划划在本例中::试验目的::提高磁鼓鼓电机的输输出力矩试验指标::输出力矩矩确定因子与与水平:经经分析影响响输出力矩矩的可能因因子及水平见见表2.3-2表2.3-2因因子水水平表选表:首先先根据因子子的水平数数,找出一一类正交表表再根据因子子的个数确确定具体的的表把因子放到到表的列上上去,称为为表头设计计把放因子子的列中的的数字改为为因子的真真实水平,,便成为一一张试验计计划表,每每一行便是是一个试验验条件。在在正交设计计中n个试试验条件是是一起给出出的的,称称为“整体设计”,并且均匀匀分布在试试验空间中中。表头设计ABC列号

1234试验计划与与试验结果果9个试验点点的分布3C3C2C1A115798642A2A3B1B2B3(二)进行行试验,并并记录试验验结果在进行试验验时,要注注意几点::1.除除了所考察察的因子外外的其它条条件,尽可可能保持相相同2.试试验次序最最好要随机机化3.必必要时可以以设置区组组因子(三)数据据分析1.数数据的直观观分析(1)寻找找最好的试试验条件在A1水平下进行行了三次试试验:#1,#2,,#3,而而在这三次次试验中因因子B的三三个水平各各进行了一一次试验,,因子C的的三个水平平也各进行行了一次试试验。在A2水平下进行行了三次试试验:#4,#5,,#6,在在这三次试试验中因子子B与C的的三个水平平各进行了了一次试验验。在A3水平下进行行了三次试试验:#7,#8,,#9,在在这三次试试验中因子子B与C的的三个水平平各进行了了一次试验验。将全部试验验分成三个个组,那么么这三组数数据间的差差异就反映映了因子A的三个水水平的差异异,为此计计算各组数数据的和与与平均:T1=y1+y2+y3=160+215+180=555=T1/3=185

T2=y4+y5+y6=168+236+190=594=T2/3=198

T3=y7+y8+y9=157+205+140=502=T3/3=167.3

同理对因子B与与C将数据据分成三组组分别比较较所有计算列列在下面的的计算表中中例2.3-1直观分分析计算表表(2)各因因子对指标标影响程度度大小的分分析极差的大小小反映了因因子水平改改变时对试试验结果的的影响大小小。这里因因子的极差差是指各水水平平均值值的最大值值与最小值值之差,譬譬如对因子子A来讲::RA=198--167.3=30.7其它的结果果也列在上上表中。从从三个因子子的极差可可知因子B的影响最最大,其次次是因子A,而因子子C的影响响最小。(3)各因因子不同水水平对指标标的影响图图从图上可以以明显地看看出每一因因子的最好好水平A2,B2,C3,也可以看看出每个因因子对指标标影响的大大小RB>RA>RC。CBA22020519017516090011001300101112708090RARBRC图2.3-2因因子各各水平对输输出力矩的的影响由于正交表表的特点,,使试验条条件均匀分分布在试验验空间中,,因此使数数据间具有有整齐可比比性,上述述的直观分分析可以进进行。但是是极差大到到什么程度度可以认为为水平的差差异确实是是有影响的的呢?2.数数据的方差差分析要把把引引起起数数据据波波动动的的原原因因进进行行分分解解,,数数据据的的波波动动可可以以用用离离差差平平方方和和来来表表示示。。正交交表表中中第第j列列的的离离差差平平方方和和的的计计算算公公式式::其中中Tij为第第j列列第第i水水平平的的数数据据和和,,T为为数数据据总总和和,,n为为正正交交表表的的行行数数,,q为为该该列列的的水水平平数数该列列表表头头是是哪哪个个因因子子,,则则该该Sj即为为该该因因子子的的离离差差平平方方和和,,譬譬如如SA=S1正交交表表总总的的离离差差平平方方和和为为::在这里有:[例例2.3-1]的的方方差差分分析析计计算算表表第4列列上上没没有有放放因因子子,,称称为为空空白白列列。。S4仅反反映映由由误误差差造造成成的的数数据据波波动动,,称称为为误误差差平平方方和和。。Se=S4利用用可可以以验验证证平平方方和和的的计计算算是是否否正正确确。。[例例2.3-1]的的方方差差分分析析表表因子子A与与B在在显显著著性性0.10与与0.05上上都都是是显显著著的的,,而而因因子子C不不显显著著。。3.最最佳佳条条件件的的选选择择对显著因子应应该取最好的的水平;对不显著因子子的水平可以以任意选取,,在实际中通通常从降低成成本、操作方方便等角度加加以选择。上面的例子中中对因子A与与B应该选择择A2B2,因子C可以以任选,譬如如为节约材料料可选择C1。4.贡献率率分析方法当试验指标不不服从正态分分布时,进行行方差分析的的依据就不够够充足,此时时可通过比较较各因子的““贡献率”来来衡量因子作作用的大小。。由于S因中除因子的效效应外,还包包含误差,从从而称S因-f因Ve为因子的纯离离差平方和,,将因子的纯纯离差平方和和与ST的比称为因子子的贡献率。。(四)验证试试验对A2B2C1进行三次试验验,结果为::234,240,220,平均值值为231.3此结果是是满意的三、有交互作作用的正交设设计与数据分分析例2.3-2为为提高某种农农药的收率,,需要进行试试验。(一)试验的的设计明确试验目的的明确试验指标标确定试验中所所考虑的因子子与水平,并并确定可能存存在并要考察察的交互作用用选用合适的正正交表。在本例中:试验目的:提提高农药的收收率试验指指标::收率率确定因因子与与水平平以及及所要要考察察的交交互作作用::因子水水平表表还要考考察因因子A与B交互互作用用选表表::首首先先根根据据因因子子的的水水平平数数,,找找出出一一类类正正交交表表再再根根据据因因子子的的个个数数及及交交互互作作用用个个数数确确定定具具体体的的表表。。把因因子子放放到到表表的的列列上上去去,,但但是是要要先先放放

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论