版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本资料来源常用统计技术在质量管理中的应用安徽大学经济学院祝清电话mail:anhuizhuqing@126.com讲座提纲(Outline)方差分析回归分析试验设计讲座方式(Arrangement)案例为主注重理论现场答疑在终极的分析中,一切知识都是历史在抽象的意义下,一切科学都是数学在理性的基础上,所有的判断都是统计学质量管理三阶段检验质量管理统计质量管理全面质量管理第一节方差分析
一、几个概念二、单因子方差分析
三、重复数不等的情况(略)一、几个概念
在试验中改变状态的因素称为因子,常用大写英文字母A、B、C、…等表示。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为A1,A2,…,Ak。试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用Y表示。Y是一个随机变量。单因子试验:若试验中所考察的因子只有一个。[例2-1]
现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?
工厂量件强度
甲
乙
丙
10310198110
113107108116
82928486三个工厂的零件强度
在这一例子中,考察一个因子:因子A:工厂该因子有三个水平:甲、乙、丙试验指标是:零件强度
这是一个单因子试验的问题。每一水平下的试验结果构成一个总体,现在需要比较三个总体均值是否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比较各个总体均值是否一致的问题可以用方差分析方法来解决。二、单单因子子方差差分析析假定因因子A有r个水平平,在在Ai水平下下指标标服从从正态态分布布,其其均值值为,,方方差为为,,i=1,2,……,r。每一一水平平下的的指标标全体体便构构成一一个总总体,,共有有r个总体体,这这时比比较各各个总总体的的问题题就变变成比比较各各个总总体的的均值值是否否相同同的问问题了了,即即要检检验如如下假假设是是否为为真::
当不真时,表示不同水平下的指标的均值有显著差异,此时称因子A是显著的,否则称因子A不显著。检验这一假设的分析方法便是方差分析。方差分分析的的三个个基本本假定定1.在水平下,指标服从正态分布;2.在不同同水平平下,,各方方差相相等;;3.各数据相互独立。
设在一个试验中只考察一个因子A,它有r个水平,在每一水平下进行m次重复试验,其结果用表示,i=1,2,…,r。常常把数据列成如下表格形式:单因子子试验验数据据表
记第i水平下的数据均值为,总均值为。此时共有n=rm个数据,这n个数据不全相同,它们的波动(差异)可以用总离差平方和ST去表示记第i水平下下的数数据和和为Ti,;;引起数数据波波动((差异异)的的原因因不外外如下下两个个:一是由由于因因子A的水平平不同同,当当假设设H0不真时时,各各个水水平下下指标标的均均值不不同,,这必必然会会使试试验结结果不不同,,我们们可以以用组组间离离差平平方和和来表表示,,也称称因子子A的离差差平方方和::这里乘乘以m是因为为每一一水平平下进进行了了m次试验验。二是由由于存存在随随机误误差,,即使使在同同一水水平下下获得得的数数据间间也有有差异异,这这是除除了因因子A的水平平外的的一切切原因因引起起的,,我们们将它它们归归结为为随机机误差差,可可以用用组内内离差差平方方和表表示::Se:也称称为误误差的的离差差平方方和可以证证明有有如下下平方方和分分解式式:ST、SA、Se
的自由度分别用、、表示,它们也有分解式:,其中:因子或或误差差的离离差平平方和和与相相应的的自由由度之之比称称为因因子或或误差差的均均方和和,并并分别别记为为:两者的比记为:
当时认为在显著性水平上因子A是显著的。其中是自由度为的F分布的1-α分位数。单因子子方差差分析析表各个离离差平平方和和的计计算::
其中是第i个水平下的数据和;T表示所有n=r•m个数据的总和。
进行方方差分分析的的步骤骤如下下:(1)计算算因子子A的每一一水平平下数数据的的和T1,T2,…,Tr及总和和T;
(2)计算各类数据的平方和;
(3)依次次计算算ST,SA,Se;(4)填写写方差差分析析表;;
(5)对于给定的显著性水平α,将求得的F值与F分布表中的临界值比较,当时认为因子A是显著的,否则认为因子A是不显著的。
对例2-1的分析析(1)计算算各类类和::每一水水平下下的数数据和和为::数据据的的总总和和为为T=1200(2)计计算算各各类类平平方方和和::原始数据的平方和为:
每一水平下数据和的平方和为
(3)计计算算各各离离差差平平方方和和::ST=121492-12002/12=1492,fT=3××4-1=11SA=485216/4-12002/12=1304,fA=3-1=2Se=1492-1304=188,fe=11-2=9(4)列列方方差差分分析析表表::[例2-1]的方方差差分分析析表表(5)如果给定=0.05,从F分布表查得
由于F>4.26,所以在=0.05水平上结论是因子A是显著的。这表明不同的工厂生产的零件强度有明显的差异。
当因因子子A是显显著著时时,,我我们们还还可可以以给给出出每每一一水水平平下下指指标标均均值值的的估估计计,,以以便便找找出出最最好好的的水水平平。。在在单单因因子子试试验验的的场场合合,,第第i个水水平平指指标标均均值值的的估估计计为为::,
在例2-1中,,三三个个工工厂厂生生产产的的零零件件的的平平均均强强度度的的的的估估计计分分别别为为::由此此可可见见,,乙乙厂厂生生产产的的零零件件的的强强度度的的均均值值最最大大,,如如果果我我们们需需要要强强度度大大的的零零件件,,那那么么购购买买乙乙厂厂的的为为好好;;而而从从工工厂厂来来讲讲,,甲甲厂厂与与丙丙厂厂应应该该设设法法提提高高零零件件的的强强度度。。
误差方差的估计:这里方差的估计是MSe。在本例中:的估计是20.9。
的估计是
三、、重重复复数数不不等等的的情情况况((略略))第二二节节回回归归分分析析一、、散散点点图图二、、相相关关系系数数三、、一一元元线线性性回回归归分分析析四、、可可化化为为一一元元线线性性回回归归分分析析的的曲曲线线回回归归分分析析请看看例例子子例2-2合金金的的强强度度y与合合金金中中的的碳碳含含量量x有关关。。为为了了生生产产出出强强度度满满足足顾顾客客需需要要的的合合金金,,在在冶冶炼炼时时应应该该如如何何控控制制碳碳含含量量??如如果果在在冶冶炼炼过过程程中中通通过过化化验验得得到到了了碳碳含含量量,,能能否否预预测测合合金金的的强强度度??这时时需需要要研研究究两两个个变变量量间间的的关关系系。。首首先先是是收收集集数数据据(xi,yi),i=1,2,……,n。现从从生产产中收收集到到表2.2-1所示的的数据据。表2-1数据表表一、散散点图图6050400xy[例2-2]的散点点图二、相相关系系数1.相关关系数数的定定义在散点点图上上n个点在在一条条直线线附近近,但但又不不全在在一条条直线线上,,称为为两个个变量量有线线性相相关关关系,,可以以用相相关系系数r去描述述它们们线性性关系系的密密切程程度å=iyyTå=ixxT,性质:
表示n个点在一条直线上,这时两个变量间完全线性相关。
r>0表示当当x增加时时y也增大大,称称为正正相关关r<0表示当当x增加时时y减小,,称为为负相相关r=0表示两两个变变量间间没有有线性性相关关关系系,但但并不不排斥斥两者者间有有其它它函数数关系系。2.相关关系数数的检检验若记两两个变变量x和y理论的的相关关系数数为,,其中中x为一般般变量量,y服从等等方差差的正正态分分布,,则
对给定的显著性水平,当可以认为两者间存在一定的线性相关关系,可以查表得出。(其中n为样本量)。
3.具体体计算算求上例例的相相关系系数::步骤如如下::(1)计算算变量量x与y的数据据和::Tx==1.90,Ty==590.5
(2)计算算各变变量的的平方方和与与乘积积和::(3)计算算Lxx,Lyy,Lxy:Lxy=95.9250-1.90×590.5/12=2.4292Lxx=0.3194-1.902/12=0.0186Lyy=29392.75-590.52/12=335.2292(4)计算r:
在=0.05时,,由于r>0.576,说明两个变量间有(正)线性相关关系。
三、一一元线线性回回归方方程1.一元线线性回回归方方程的的求法法:一元线性回归方程的表达式为
其中a与b使下列列离差差平方方和达达到最最小::通过微微分学学原理理,可可知,
称这种种估计计为最最小二二乘估估计。。b称为回回归系系数;;a一般称称为常常数项项。求一元元线性性回归归方程程的步步骤如如下::(1)计算算变量量x与y的数据据和Tx,Ty;(2)计算算各变变量的的平方方和与与乘积积和;;(3)计算算Lxx,Lxy;(4)求出出b与a;利用前前面的的数据据,可可得::b=2.4392/0.0186=130.6022a=590.5/12-130.6022××1.90/12=28.5297(5)写出回归归方程:
画出的回归直线一定通过(0,a)与两点
上例:或2.回归方程的的显著性检检验有两种方法法:一是用上述述的相关系系数;二是用方差差分析方法法(为便于于推广到多多元线性回回归的场合合),将总总的离差平平方和分解解成两个部部分:回归归平方和与与离差平方方和。总的离差平方和:
回归平方和:
离差平方和:
且有ST=SR+SE,其中
它们的自由由度分别为为:fT=n-1,fR=1,fE=n-2=fT-fR计算F比,
对给定的显著性水平,当时认为回归方程是显著的,即回归方程是有意义的。一般也列成方差分析表。
对上面的例例子,作方方差分析的的步骤如下下:根据前面的的计算(1)计算各类类平方和::ST=Lyy=335.2292,fT=12-1=11SR=bLxy=130.6022×2.4292=317.2589,fR=1SE=335.2292-317.2589=17.9703,fE=11-1=10(2)列方差分分析表:[例2-2]的方差分析析表对给定的显著性水平=0.05,有
F0.95(1,10)=4.96由于F>4.96,所以在0.05水平上认为为回归方程程是显著的的(有意义义的)。3.利用回归归方程进行行预测对给定的,y的预测值为
概率为的y的预测区间是
其中
当n较大,与相差不大,那么可给出近似的预测区间,此时
进行预测的的步骤如下下:(1)对给出的的x0求预测值上例,设x0=0.16,则(2)求的估计
上例有
(3)求上例n=12,如果求概概率为95%的预测区间间,那么t0.975(10)=2.228,所以(4)写出预测区间
上例为(49.43-3.11,49.43+3.11)=(46.32,52.54)由于u0.975=1.96,故概率为为0.95的近似的预预测区间为为:∵∴所求区间::(49.43-2.63,49.43+2.63)=(46.80,52.06)相差较大的的原因总n较小。四、可化为为一元线性性回归的曲曲线回归((略)在两个重复复的散点图图上,n个点的散布布不一定都都在一条直直线附近波波动,有时时可能在某某条曲线附附近波动,,这时以建建立曲线回回方程为好好。1.确定曲线回回归方程形形式2.曲线回归方方程中参数数的估计通过适当的的变换,化化为一元线线性回归的的形式,再再利用一元元线性回归归中的最小小二乘估计计方法获得得。回归曲线的的形式:(1),,(a>0,b>0)(2),,((b>0)(3),,((b>0)(4),,(b>0)3.曲线回归方方程的比较较常用的比较较准则:(1)要求相关关指数R大,其平方方也称为决决定系数,,它被定义义为:(2)要求剩余余标准差s小,它被定定义为:第三节试试验验设计一、试验设设计的基本本概念与正正交表二、无交互互作用的正正交设计与与数据分析析三、有交互互作用的正正交设计与与数据分析析(略)一、试验设设计的基本本概念与正正交表(一)试验验设计多因素试验验遇到的最最大困难是是试验次数数太多,若若十个因素素对产品质质量有影响响,每个因因素取两个个不同状态态进行比较较,有210=1024、如果每个个因素取三三个不同状状态310=59049个不同的试试验条件选择部分条条件进行试试验,再通通过数据分分析来寻找找好的条件件,这便是是试验设计计问题。通通过少量的的试验获得得较多的信信息,达到到试验的目目的。利用正交表表进行试验验设计的方方法就是正正交试验设设计。(二)正交交表“L”表示正交表表,“9”是表的行数数,在试验验中表示试试验的条件件数,“4”是列数,在在试验中表表示可以安安排的因子子的最多个个数,“3”是表的主体体只有三个个不同数字字,在试验验中表示每每一因子可可以取的水水平数。正交表具有有正交性,,这是指它它有如下两两个特点::(1)每列中每每个数字重重复次数相相同。在表L9(34)中,每列有有3个不同数字字:1,2,3,每一个出出现3次。(2)将任意两两列的同行行数字看成成一个数对对,那么一切可能能数对重复复次数相同同。在表L9(34)中,任意两两列有9种可能的数数对:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一对出现现一次。常用的正交交表有两大大类(1)一类正正交表的行行数n,列数p,水平数q间有如下关关系:n=qk,k=2,3,4,…,p=(n-1)/(q-1)如:L4(23),L8(27),L16(215),L32(231)等,可以考考察因子间间的交互作作用。(2)另一类正正交表的行行数,列数数,水平数数之间不满足上述述的两个关关系如:L12(211),L18(37),L20(219),L36(313)等这类正交交表不能能用来考考察因子子间的交交互作用用常用正交交表见附附录二、无交交互作用用的正交交设计与与数据分分析试验设计计一般有有四个步步骤:1.试验设计计2.进行试验验获得试试验结果果3.数据分析析4.验证试验验例2-3磁鼓电机机是彩色色录像机机磁鼓组组件的关关键部件件之一,,按质量量要求其其输出力力矩应大大于210g.cm。某生产产厂过去去这项指指标的合合格率较较低,从从而希望望通过试试验找出出好的条条件,以以提高磁磁鼓电机机的输出出力矩。。(一)试试验的设设计在安排试试验时,,一般应应考虑如如下几步步:(1)明确试试验目的的(2)明确试试验指标标(3)确定因因子与水水平(4)选用合合适的正正交表,进行表头头设计,,列出试试验计划划在本例中中:试验目的的:提高高磁鼓电电机的输输出力矩矩试验指标标:输出出力矩确定因子子与水平平:经分分析影响响输出力力矩的可可能因子及水平平见表2-3表2-3因子水平平表选表:首首先根据据因子的的水平数数,找出出一类正正交表再根据因因子的个个数确定定具体的的表把因子放放到表的的列上去去,称为为表头设设计把放放因子的的列中的的数字改改为因子子的真实实水平,,便成为为一张试试验计划划表,每每一行便便是一个个试验条条件。在在正交设设计中n个试验条条件是一一起给出出的的,,称为“整体设计计”,并且均均匀分布布在试验验空间中中。表头设计ABC列号
1234试验计划划与试验验结果9个试验点点的分布布3C3C2C1A115798642A2A3B1B2B3(二)进进行试验验,并记记录试验验结果在进行试试验时,,要注意意几点::1.除了所考考察的因因子外的的其它条条件,尽尽可能保保持相同同2.试验次序序最好要要随机化化3.必要时可可以设置置区组因因子(三)数数据分析析1.数据的直直观分析析(1)寻找最最好的试试验条件件在A1水平下进进行了三三次试验验:#1,#2,#3,而在这这三次试试验中因因子B的三个水水平各进进行了一一次试验验,因子子C的三个水水平也各各进行了了一次试试验。在A2水平下进进行了三三次试验验:#4,#5,#6,在这三三次试验验中因子子B与C的三个水水平各进进行了一一次试验验。在A3水平下进进行了三三次试验验:#7,#8,#9,在这三三次试验验中因子子B与C的三个水水平各进进行了一一次试验验。将全部试试验分成成三个组组,那么么这三组组数据间间的差异异就反映映了因子子A的三个水水平的差差异,为为此计算算各组数数据的和和与平均均:T1=y1+y2+y3=160+215+180=555=T1/3=185
T2=y4+y5+y6=168+236+190=594=T2/3=198
T3=y7+y8+y9=157+205+140=502=T3/3=167.3
同理对因子B与C将数据分分成三组组分别比比较所有计算算列在下下面的计计算表中中例2-3直观分析析计算表表(2)各因子子对指标标影响程程度大小小的分析析极差的大大小反映映了因子子水平改改变时对对试验结结果的影影响大小小。这里里因子的的极差是是指各水水平平均均值的最最大值与与最小值值之差,,譬如对对因子A来讲:RA=198-167.3=30.7其它的结结果也列列在上表表中。从从三个因因子的极极差可知知因子B的影响最最大,其其次是因因子A,而因子子C的影响最最小。(3)各因子子不同水水平对指指标的影影响图从图上可可以明显显地看出出每一因因子的最最好水平平A2,B2,C3,也可以以看出每每个因子子对指标标影响的的大小RB>RA>RC。CBA22020519017516090011001300101112708090RARBRC图2-4因子各水水平对输输出力矩矩的影响响由于正交交表的特特点,使使试验条条件均匀匀分布在在试验空空间中,,因此使使数据间间具有整整齐可比比性,上上述的直直观分析析可以进进行。但但是极差差大到什什么程度度可以认认为水平平的差异异确实是是有影响响的呢??2.数据的方方差分析析要把引起起数据波波动的原原因进行行分解,,数据的的波动可可以用离离差平方方和来表表示。正交表中中第j列的离差差平方和和的计算算公式::其中Tij为第j列第i水平的数据和和,T为数据总和,,n为正交表的行行数,q为该列的水平平数该列表头是哪哪个因子,则则该Sj即为该因子的的离差平方和和,譬如SA=S1正交表总的离离差平方和为为:在这里有:[例2-3]的方差分析计计算表第4列上没有放因因子,称为空空白列。S4仅反映由误差差造成的数据据波动,称为为误差平方和和。Se=S4利用可可以验证证平方和的计计算是否正确确。[例2-3]的方差分析表表因子A与B在显著性0.10与0.05上都是显著的的,而因子C不显著。3.最佳条件的选选择对显著因子应应该取最好的的水平;对不显著因子子的水平可以以任意选取,,在实际中通通常从降低成成本、操作方方便等角度加加以选择。上面的例2-3中对因子A与B应该选择A2B2,因子C可以任选,譬譬如为节约材材料可选择C1。4.贡献率分析方方法当试验指标不不服从正态分分布时,进行方差分析析的依据就不不够充足,此时可通过比比较各因子的的“贡献率””来衡量因子子作用的大小小。由于S因中除因子的的效应外,,还包含误误差,从而而称S因-f因Ve为因子的纯纯离差平方方和,将因因子的纯离离差平方和和与ST的比称为因因子的贡献献率。(四)验证证试验对A2B2C1进行三次试试验,结果果为:234,240,220,平均值为为231.3此结果是满满意的三、有交互互作用的正正交设计与与数据分析析(略)例2-4为提高某种种农药的收收率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度农业机械设备租赁服务合同4篇
- 2025年度墓地陵园墓地租赁期限调整合同4篇
- 2025年度个人与文化传播公司合作推广合同2篇
- 2025年度个人信用汽车贷款额度调整合同4篇
- 2025年度绿色能源储藏系统采购合同4篇
- 二零二五年度美容院美容院连锁经营管理股份合作合同3篇
- 二零二五版绿色建筑暖通系统性能评估合同4篇
- 2025年度建筑工地临时宿舍租赁服务合同范本2篇
- 2025年度宁波市事业单位财务人员劳动合同4篇
- 二零二五年度养老服务业合作合同2篇
- 碳排放管理员 (碳排放核查员) 理论知识考核要素细目表四级
- 撂荒地整改协议书范本
- GB/T 20878-2024不锈钢牌号及化学成分
- 诊所负责人免责合同范本
- 2024患者十大安全目标
- 印度与阿拉伯的数学
- 会阴切开伤口裂开的护理查房
- 实验报告·测定鸡蛋壳中碳酸钙的质量分数
- 部编版小学语文五年级下册集体备课教材分析主讲
- 电气设备建筑安装施工图集
- 《工程结构抗震设计》课件 第10章-地下建筑抗震设计
评论
0/150
提交评论