版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、假设检验一、假设检验*编编SIX SIGMA 培训培训二、方差分析二、方差分析三、质量工具三、质量工具四、试验设计四、试验设计假设检验假设检验& 假设检验的理解假设检验的理解(Hypothesis Test)对总体参数分布做假设对总体参数分布做假设,根据样本根据样本(Sample)观测值运用统计技术分析方法检验这种观测值运用统计技术分析方法检验这种假设是否正确,从而选择接受或拒绝假设的过程。假设是否正确,从而选择接受或拒绝假设的过程。假设假设 :特定某总体是特定某总体是 , , , ex) 制造部男员工的平均制造部男员工的平均 身高是身高是172 cm. 原假设原假设(Ho, Null H
2、ypothesis) : 肯定肯定 对立假设对立假设(H1 or Ha, Alternative Hypothesis) : 否定原假设否定原假设某总体某总体(N)Sample根据根据Sample的数据的数据检验已设定的该总体的假设检验检验已设定的该总体的假设检验 原假设原假设(Ho)设定设定 : 制造部男员工身高是制造部男员工身高是172cm 设定对立假设设定对立假设(H1 or Ha) : 不是不是172cm(或或0.05时,接受原假设,拒绝对立假设;时,接受原假设,拒绝对立假设; PBasic Statistics1-Sample Z,4、比较比较P0.05的大小,判定的大小,判定:接受
3、接受H0, 11 -7/22出现对话框后:出现对话框后:Variables栏中选外园直径数值;栏中选外园直径数值;SIGMA:栏中填栏中填0.016(总体(总体)TEST MEAN栏中填栏中填5.50(目标均值)(目标均值)GRAPHS对话框可填可不填对话框可填可不填OPTIONS 对话框对话框:CONFIDENCE LEVEL:95.0(置信度水置信度水平)平)ALTERNATIVE: not equal(对立假设)对立假设)One-Sample Z: sample实施结果:实施结果:Test of mu = 5.5 vs mu not = 5.5The assumed sigma = 0.
4、016Variable N Mean StDev SE Meansample 35 5.50143 0.02390 0.00270Variable 95.0% CI Z Psample ( 5.49613, 5.50673) 0.53 0.597假设检验事例假设检验事例1 Sample T Test& 1 Sample T Test实例:实例:Height66.0072.0073.5073.0069.0073.0072.0074.0072.0071.0074.0072.0070.0067.0071.0072.0069.0073.0074.0066.00 确认确认HeightHeight的平均个
5、子是否的平均个子是否70.(70.(单单, ,不知道母体的标准偏差不知道母体的标准偏差.).) - - 原假设原假设 : : 平均个子平均个子 = 70 - = 70 -对立假设对立假设 : : 平均个子平均个子 70 70 Test of mu = 70 vs mu not = 70Variable N Mean StDev SE MeanHeight 20 71.175 2.561 0.573Variable 95.0% CI T PHeight (69.976, 72.374) 2.05 0.054平均平均:71.175 :71.175 标准偏差标准偏差:2.561:2.561平均的标准
6、偏差平均的标准偏差:0.573 :0.573 母平均的母平均的95% 95% 置信区间置信区间 :69.976 72.374 :69.976 72.374p-value:0.054p-value:0.054p-valuep-value比比0.050.05大,接受大,接受0 0假设假设. .即即, ,可以平均个子看作可以平均个子看作70707070包含在置信区间里面。包含在置信区间里面。Minitab Menu : Stat / Basic Statistics/ 1 Sample T Test* 注意注意 : 在在Option 上各上各 greater than, less than, not
7、 equal的含义是什么的含义是什么 ? 11 -8/22目标均值目标均值假设检验事例假设检验事例2 Sample T Test& 2 Sample T Test实例:实例:例例3:A、B两种不同情况下测得某两种不同情况下测得某PCB焊点拉拔力数据如下:焊点拉拔力数据如下:A:5.65 5.89 4.37 4.28 5.12 ; B:5.99 5.78 5.26 4.99 4.88;问两种条件下问两种条件下PCB的焊点拉拔的焊点拉拔力是否有显著区别?力是否有显著区别? H0:A=B;H1:AB Minitab Menu : Stat / Basic Statistics/ 2 Sample T
8、 Test两样本数据存于一栏两样本数据存于一栏两样数据存于不同栏两样数据存于不同栏对分散的同质性与否的对分散的同质性与否的check(在这里不是同质的在这里不是同质的 no-check) 11 -9/22数据数据标注标注数据数据假设检验事例假设检验事例2 Sample T Test& 实施结果:实施结果: P值比值比0.05大,接受大,接受H0;即即2种条件下的种条件下的PCB板焊点拔取力没有差异板焊点拔取力没有差异 从平均值看从平均值看B比比A 拔取力大拔取力大 总体均值的置信区间:(总体均值的置信区间:(-1.278,0.642)Two-sample T for A vs B N Mean
9、 StDev SE MeanA 5 5.062 0.729 0.33B 5 5.380 0.487 0.22Difference = mu A - mu BEstimate for difference: -0.31895% CI for difference: (-1.278, 0.642)T-Test of difference = 0 (vs not =): T-Value = -0.81 P-Value = 0.448 DF = 6 11 -10/22AB4.55.05.56.0Boxplots of A and B(means are indicated by solid circl
10、es)假设检验事例假设检验事例&成对数据的假设检验成对数据的假设检验 英语分数向上程序运营后,比较程序实施前和实施后的英语分数,检讨向上程序是否实际上很有用英语分数向上程序运营后,比较程序实施前和实施后的英语分数,检讨向上程序是否实际上很有用 程序实施前程序实施前/ /后的分数入以下时,检讨程序是否有利于英语分数向上后的分数入以下时,检讨程序是否有利于英语分数向上.( .(各各 10 10个随意抽出个随意抽出) )Before after7681605285875870918675778290646379858883Paired T-Test and CI: before, afterPair
11、ed T for before - after N Mean StDev SE Meanbefore 10 75.80 11.64 3.68after 10 77.40 12.18 3.85Difference 10 -1.60 6.38 2.0295% CI for mean difference: (-6.16, 2.96)T-Test of mean difference=0(vs not=0):T-Value=-0.79 P-Value=0.448-10010DifferencesBoxplot of Differences(with Ho and 95% t-confidence i
12、nterval for the mean)X_HoMinitab Menu : Stat / Basic Statistics/ Paired T Paired T : CI Mean Difference 2 Sample T : CI DifferencePaired T 11 -11/22假设检验事例假设检验事例1-Proportion1-Proportion DID DID 事业部为了确认事业部为了确认A A 厂家的厂家的6 6sigmasigma的的PJTPJT成果,调查了成果,调查了300300个个samplesample,出现了出现了1515个不良品个不良品. . A A 厂家交
13、货部品的目标不良率为厂家交货部品的目标不良率为15% 15% ,能不能看做目标达成了,能不能看做目标达成了 ? ?Minitab Menu : stat /Basic StatisticsMinitab Menu : stat /Basic Statistics/ /1-Proportion1-ProportionClickClickTest of p = 0.15 vs p not = 0.15 Sample X N Sample p 95.0% CI P-Value1 15 300 0.050 (0.028251,0.081127) 0.000 实行结果实行结果 11 -12/22假设检验
14、事例假设检验事例2-Proportion DIDDID事业部为了比较事业部为了比较 A,BA,B两个两个lineline上发生的不良率,收集了上发生的不良率,收集了DataData. .其结果其结果A LineA Line上上10001000个当中有个当中有7575个不良个不良, , B Line B Line 上上15001500个当中发现了个当中发现了120120个不良。能不能看作个不良。能不能看作LineLine间不良率有差异间不良率有差异? ?Minitab Menu : stat /Basic StatisticsMinitab Menu : stat /Basic Statisti
15、cs/2/2-Proportion-ProportionTest and CI for Two ProportionsSample X N Sample p1 75 1000 0.0750002 120 1500 0.080000Estimate for p(1) - p(2): -0.00595% CI for p(1) - p(2): (-0.0263305, 0.0163305)Test for p(1)-p(2)=0(vs not=0): Z=-0.46 P-Value=0.646P-value : 0.646(64.6%)P-value : 0.646(64.6%)P-valueP-
16、value值大,因此可以说值大,因此可以说0 0假设是对的。假设是对的。 即即, ,可以说可以说A ,BA ,B两个两个lineline上所发生的不良率上所发生的不良率 没有差异。没有差异。 11 -13/22假设检验事例假设检验事例 需同时检验多个样本均值有无差异时,需要用到方差分析需同时检验多个样本均值有无差异时,需要用到方差分析建立假设:建立假设:H0H0:胶水胶水A A粘接力均值粘接力均值= =胶水胶水B B粘接力均值粘接力均值= =胶水胶水C C的粘接力均值的粘接力均值H1H1:胶水胶水A A粘接力均值粘接力均值胶水胶水B B粘接力均值粘接力均值胶水胶水C C的粘接力均值的粘接力均值
17、确定显著水平:确定显著水平:=0.05=0.05选择假设检验类别选择假设检验类别: :单变量方差分析单变量方差分析Minitab Minitab 计算计算P P值。值。 11 -14/22例:想了解三种不同胶水对元件粘接力的影响,分别测得不同胶水粘接力如下:例:想了解三种不同胶水对元件粘接力的影响,分别测得不同胶水粘接力如下:胶水A胶水B胶水C5.674.884.895.345.365.214.984.995.365.565.755.895.86.216.116.716.075.29问三种胶水粘接力均值有无差异?问三种胶水粘接力均值有无差异?假设检验事例假设检验事例 11 -15/22Stat
18、 ANOVA One-way(Unstacked)注:注:Unstacked 指不同条件的数据存储在不同列指不同条件的数据存储在不同列的状态的状态实施结果:实施结果:One-way ANOVA: A, B, CAnalysis of VarianceSource DF SS MS F PFactor 2 0.145 0.073 0.26 0.778Error 15 4.273 0.285Total 17 4.419 Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev -+-+-+-A 6 5.6767 0.58
19、23 (-*-) B 6 5.5433 0.5558 (-*-) C 6 5.4583 0.4547 (-*-) -+-+-+-Pooled StDev = 0.5338 5.25 5.60 5.95假设检验事例假设检验事例2-Proportion 11 -16/22P0.05,因此接受零假设因此接受零假设H0A、B、C胶水粘接力胶水粘接力均值数据置信区间有重均值数据置信区间有重合部分合部分假设检验事例假设检验事例2VARIANCES 11 -17/22对两个总体的分布状况进行比较,如对两个车床所加工出来的零件尺寸精度的比较,这时会用到对两个总体的分布状况进行比较,如对两个车床所加工出来的零件
20、尺寸精度的比较,这时会用到F检检验。验。例:两台车床加工一批零件,为了解两台车床加工精度方面有无差异,各抽取例:两台车床加工一批零件,为了解两台车床加工精度方面有无差异,各抽取10个零件测得尺寸个零件测得尺寸A数数值如下:车床值如下:车床1:25.3,25.2,25.2,25.5,25.52,25.51,25.54,25.55,25.5,25.52;车床车床2: 25.5,25.55,25.56,25.49,25.48,25.53,25.52,25.54,25.5,25.47;问问:两台车床加工精度有无差异两台车床加工精度有无差异?步骤步骤:H0:车床车床1加工的工件尺寸加工的工件尺寸A的标准
21、差的标准差=车床车床2加工的工件尺寸加工的工件尺寸A的标准差的标准差H1:车床车床1加工的工件尺寸加工的工件尺寸A的标准差的标准差车床车床2加工的工件尺寸加工的工件尺寸A的标准差的标准差确定确定=0.05选择假设检验类别选择假设检验类别F检验法检验法;例用例用MINITAB 计算计算PMinitab StatBasic Statistics2 Variances假设检验事例假设检验事例2-Proportion 11 -18/22假设检验事例假设检验事例2-Proportion 11 -19/220.050.100.1595% Confidence Intervals for Sigm asCH
22、E2CHE125.325.425.5Boxplots of Raw DataF-TestTest Statistic: 5.422P-Value : 0.019Levenes TestTest Statistic: 0.077P-Value : 0.785Factor LevelsCHE1CHE2Test for Equal VariancesTest for Equal VariancesTest for Equal VariancesLevel1 CHE1Level2 CHE2ConfLvl 95.0000 Bonferroni confidence intervals for stand
23、ard deviations Lower Sigma Upper N Factor Levels4.66E-02 7.13E-02 0.143584 10 CHE12.00E-02 3.06E-02 0.061664 10 CHE2F-Test (normal distribution)Test Statistic: 5.422P-Value : 0.019Levenes Test (any continuous distribution)Test Statistic: 0.077P-Value : 0.785接受零假设,两台车床加工精度没接受零假设,两台车床加工精度没有差异有差异假设检验事例
24、假设检验事例2-Proportion 11 -20/22在需要同时比较多个方差的场合,需进行多样本方差检验在需要同时比较多个方差的场合,需进行多样本方差检验四台设备同时加工一种工件,为了解四台设备同时加工一种工件,为了解4 4台设备的精度有无差异,每台设备抽样台设备的精度有无差异,每台设备抽样1010PCSPCS测得尺寸如测得尺寸如下下(略),问四台设备精度是否有差异?(略),问四台设备精度是否有差异?H0H0:。;:。;H1H1:。:。MINTAB MINTAB 工工作表数据:作表数据:Stat ANOVA Test for Equal VariancesStat ANOVA Test fo
25、r Equal Variances 假设检验事例假设检验事例2-Proportion 11 -21/22271295% Confidence Intervals for SigmasBartletts TestTest Statistic: 3.055P-Value : 0.383Levenes TestTest Statistic: 0.295P-Value : 0.829Factor LevelsABCDTest for Equal Variances for SIZEResponse SIZEFactors EQUIPConfLvl 95.0000 Bonferroni confiden
26、ce intervals for standard deviations Lower Sigma Upper N Factor Levels 1.84368 2.94581 6.5147 10 A 3.29134 5.25885 11.6301 10 B 3.13351 5.00666 11.0723 10 C 2.76454 4.41714 9.7686 10 DBartletts Test (normal distribution)Test Statistic: 3.055P-Value : 0.383Levenes Test (any continuous distribution)Te
27、st Statistic: 0.295P-Value : 0.829假设检验事例假设检验事例2-Proportion 11 -22/22根据上图结果根据上图结果BartlettBartlett检验法和检验法和LeveneLevene检验法得出一致结论,检验法得出一致结论,P P值大于值大于0.05,0.05,所以所以认为四台车床加工的工件精度没有显著差异认为四台车床加工的工件精度没有显著差异. .有时会存在有时会存在BartlettBartlett检验法和检验法和LeveneLevene检验法得出的结论不一致的问题检验法得出的结论不一致的问题, ,这时可检验这时可检验数据的正态性数据的正态性,
28、 ,如为正态分布数据如为正态分布数据, ,则以则以BartlettBartlett检验法为结论检验法为结论. .如为非正态分布如为非正态分布, ,则则以以LeveneLevene检验法为准检验法为准. . 2.3 统计技术方法 2.3.1 方差分析 2.3.2 回归分析 2.3.3 试验设计2.3.1 方差分析方差分析 一、几个概念一、几个概念二、单因子方差分析二、单因子方差分析 三、重复数不等的情况三、重复数不等的情况一、几个概念一、几个概念 在试验中改变状态的因素称为因子,常用大写在试验中改变状态的因素称为因子,常用大写英文字母英文字母A、B、C、等表示。等表示。 因子在试验中所处的状态称
29、为因子的水平。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为用代表因子的字母加下标表示,记为A1,A2,Ak。 试验中所考察的指标(可以是质量特性也可试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用以是产量特性或其它)用Y表示。表示。Y是一个随机变是一个随机变量。量。单因子试验:单因子试验:若试验中所考察的因子只有一个。若试验中所考察的因子只有一个。例例2.1-1 现有甲、乙、丙三个工厂生产同一种零现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测
30、定其异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?强度是否相同? 工厂工厂 量件强度量件强度 甲甲 乙乙 丙丙 103 101 98 110 113 107 108 116 82 92 84 86三个工厂的零件强三个工厂的零件强度度 在这一例子中,考察一个因子:在这一例子中,考察一个因子: 因子因子A:工厂:工厂该因子有三个水平:甲、乙、丙该因子有三个水平:甲、乙、丙试验指标是:零件强度试验指标是:零件强度 这是一个单因子试验的问题。每一水平下这是一个单因子试验的问题。每一水平下的试验结果构成一
31、个总体,现在需要比较三个总的试验结果构成一个总体,现在需要比较三个总体均值是否一致。如果每一个总体的分布都是正体均值是否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比较各态分布,并且各个总体的方差相等,那么比较各个总体均值是否一致的问题可以用方差分析方法个总体均值是否一致的问题可以用方差分析方法来解决。来解决。二、单因子方差分析二、单因子方差分析 假定因子假定因子A有有r个水平,在个水平,在Ai水平下指标服水平下指标服从正态分布,其均值为从正态分布,其均值为 ,方差为,方差为 ,i=1,2, , r。每一水平下的指标全体便构成一个总体,共。每一水平下的指标全体便构成一个
32、总体,共有有r个总体,这时比较各个总体的问题就变成比个总体,这时比较各个总体的问题就变成比较各个总体的均值是否相同的问题了,即要检验较各个总体的均值是否相同的问题了,即要检验如下假设是否为真:如下假设是否为真:i2r:H 210 当当 不真时,表示不同水平下的指标的不真时,表示不同水平下的指标的均值有显著差异,此时称因子均值有显著差异,此时称因子A是显著的,否是显著的,否则称因子则称因子A不显著。检验这一假设的分析方法不显著。检验这一假设的分析方法便是方差分析。便是方差分析。0Hv 方差分析的三个基本假定方差分析的三个基本假定1. 在水平在水平 下,指标服从正态分布下,指标服从正态分布 ;iA
33、),(Ni2 2. 在不同水平下,各方差相等;在不同水平下,各方差相等;3. 各数据各数据 相互独立。相互独立。ijy 设在一个试验中只考察一个因子设在一个试验中只考察一个因子A,它有,它有r个个水平,在每一水平下进行水平,在每一水平下进行m次重复试验,其结果用次重复试验,其结果用 表示,表示,i=1,2, , r。 常常把数据列成常常把数据列成如下表格形式:如下表格形式:imiiy,y,y21单因子试验数据表单因子试验数据表水平水平试验数据试验数据和和均值均值A1myyy11211,T11yA2myyy22221,T22yArrmrryyy,21Trry 记第记第i水平下的数据均值为水平下的
34、数据均值为 ,总均值为,总均值为 。此时共有此时共有n=rm个数据,这个数据,这n个数据不全相同,它们个数据不全相同,它们的波动(差异)可以用总离差平方和的波动(差异)可以用总离差平方和ST去表示去表示iyy rimjijT)yy(S112记第记第i 水平下的数据和为水平下的数据和为Ti, ; mjijiyT1引起数据波动(差异)的原因不外如下两个引起数据波动(差异)的原因不外如下两个: 一是由于因子一是由于因子A的水平不同,当假设的水平不同,当假设H0不真不真时,各个水平下指标的均值不同,这必然会使试时,各个水平下指标的均值不同,这必然会使试验结果不同,我们可以用组间离差平方和来表示验结果不
35、同,我们可以用组间离差平方和来表示,也称因子,也称因子A的离差平方和:的离差平方和: riiAyymS12这里乘以这里乘以m是因为每一水平下进行了是因为每一水平下进行了m次试验次试验。 二是由于存在随机误差,即使在同一水平二是由于存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子下获得的数据间也有差异,这是除了因子A的水的水平外的一切原因引起的,我们将它们归结为随机平外的一切原因引起的,我们将它们归结为随机误差,可以用组内离差平方和表示:误差,可以用组内离差平方和表示: rimjiijeyyS112 Se:也称为误差的离差平方和:也称为误差的离差平方和可以证明有如下平方和分解式:
36、可以证明有如下平方和分解式:eATSSS ST、SA、Se 的自由度分别用的自由度分别用 、 、 表示,它们也有分解式:表示,它们也有分解式: ,其中:,其中:TfAfefeATfff 1 试试验验数数Tf1 水水平平数数AfATefff 因子或误差的离差平方和与相应的自由度因子或误差的离差平方和与相应的自由度之比称为因子或误差的均方和,并分别记为:之比称为因子或误差的均方和,并分别记为:AAAfSMS eeefSMS 两者的比记为:两者的比记为:eAMSMSF 当当 时认为在显著性水平时认为在显著性水平 上上因子因子A是显著的。其中是显著的。其中 是自由度为是自由度为 的的F分布的分布的1-
37、分位数。分位数。),(1eAffFF ),(1eAffF eAff ,单因子方差分析单因子方差分析表表 来来源源偏偏差差平平方方和和自自由由度度均均方方和和F比比因因子子A误误差差eSASe1 rfArnfe AAAfSMS eeefSMS eAMSMSF 总总计计TST1 nfT各个离差平方和的计算各个离差平方和的计算: nTyyySrimjijrimjijT2112112 r1i22i2ir1iAnTmTyymSATeSSS 其中其中 是第是第i个水平下的数据和;个水平下的数据和;T表示表示所有所有n=rm个数据的总和。个数据的总和。 iT进行方差分析的步骤如下:进行方差分析的步骤如下:
38、(1)计算因子)计算因子A的每一水平下数据的和的每一水平下数据的和T1,T2,Tr及总和及总和T; (2)计算各类数据的平方和)计算各类数据的平方和 ; 222,TTyiij (3)依次计算)依次计算ST,SA,Se; (4)填写方差分析表;)填写方差分析表; (5)对于给定的显著性水平)对于给定的显著性水平,将求得的,将求得的F值与值与F分布表中的临界值分布表中的临界值 比较,当比较,当 时认为因子时认为因子A是显著的,否则认为是显著的,否则认为因子因子A是不显著的。是不显著的。 eAffF,1 eAffFF,1 对上例的分析对上例的分析 (1)计算各类和:)计算各类和: 每一水平下的数据和
39、为:每一水平下的数据和为: 344,444,412321 TTT数据的总和为数据的总和为T=1200 (2)计算各类平方和:)计算各类平方和: 原始数据的平方和为:原始数据的平方和为: 1214922ijy每一水平下数据和的平方和为每一水平下数据和的平方和为 4852162 iT(3)计算各离差平方和:)计算各离差平方和: ST=121492-12002/12=1492, fT=34-1=11SA=485216/4-12002/12=1304, fA=3-1=2Se= 1492-1304=188, fe=11-2=9(4)列方差分析表:)列方差分析表: 例例2.1-1的方差分析表的方差分析表
40、来源来源偏差平方和偏差平方和自由度自由度均方和均方和F比比因子因子A1304AS2Af652 AMSF=31.21误差误差e188eS9ef920.MSe 总计总计T1492TS11Tf(5) 如果给定如果给定 =0.05,从,从F分布表查得分布表查得 26. 4)9 , 2(95. 0 F 由于由于F4.26,所以在,所以在 =0.05水平上结论是因水平上结论是因子子A是显著的。这表明不同的工厂生产的零件强是显著的。这表明不同的工厂生产的零件强度有明显的差异。度有明显的差异。 当因子当因子A是显著时,我们还可以给出每一是显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。水平
41、下指标均值的估计,以便找出最好的水平。在单因子试验的场合,第在单因子试验的场合,第i个水平指标均值的估个水平指标均值的估计为:计为: iiy , ri, 2 , 1 在本例中,三个工厂生产的零件的平均强度在本例中,三个工厂生产的零件的平均强度的的估计分别为:的的估计分别为: 86,111,103321 由此可见,乙厂生产的零件的强度的均值由此可见,乙厂生产的零件的强度的均值最大,如果我们需要强度大的零件,那么购买最大,如果我们需要强度大的零件,那么购买乙厂的为好;而从工厂来讲,甲厂与丙厂应该乙厂的为好;而从工厂来讲,甲厂与丙厂应该设法提高零件的强度。设法提高零件的强度。 误差方差的估计:这里方
42、差误差方差的估计:这里方差 的估计是的估计是MSe。在本例中:。在本例中: 的估计是的估计是20.9。 2 2 的估计是的估计是 57. 49 .20 例例2.1-2 略(见教材略(见教材P92)三、重复数不等的情况三、重复数不等的情况 若在每一水平下重复试验次数不同,假定若在每一水平下重复试验次数不同,假定在在Ai水平下进行水平下进行 次试验,那么进行方差分次试验,那么进行方差分析的步骤仍然同上,只是在计算中有两个改动析的步骤仍然同上,只是在计算中有两个改动: im imnnTmTSriiiA212 例例2.1-3 某型号化油器原中小喉管的结构使某型号化油器原中小喉管的结构使油耗较大,为节约
43、能源,设想了两种改进方案以油耗较大,为节约能源,设想了两种改进方案以降低油耗。油耗的多少用比油耗进行度量,现在降低油耗。油耗的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器分别测定对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如表所列,试问中小喉管的结构其比油耗,数据如表所列,试问中小喉管的结构(记为因子(记为因子A)对平均比油油耗的影响是否显著)对平均比油油耗的影响是否显著。(这里假定每一种结构下的油耗服从等方差的。(这里假定每一种结构下的油耗服从等方差的正态分布)正态分布) 例例2.1-3的试验结果的试验结果 水平水平试验结果(比油耗试验结果(比油耗-220)A1:
44、原结构:原结构11.0 12.8 7.6 8.3 4.7 5.5 9.3 10.3A2:改进方案:改进方案12.8 4.5 -1.5 0.2A3:改进方案:改进方案24.3 6.1 1.4 3.6 (为简化计算,这里一切数据均减去(为简化计算,这里一切数据均减去220,不,不影响影响F比的计算及最后分析因子的显著性)比的计算及最后分析因子的显著性) (1)各水平下的重复试验次数及数据和分别为:)各水平下的重复试验次数及数据和分别为: A1:m1=8,T1=69.5A2:m2=4,T2=6.0A3:m3=4,T3=15.4总的试验次数总的试验次数n=16,数据的总和为,数据的总和为T=90.9
45、(2)计算各类平方和:)计算各类平方和: 41.7572 ijy07.6722 iimT43.5162 nT(3)计算各离差平方和:)计算各离差平方和: ST=757.41-516.43=240.98, fT=16-1=15SA=672.07-516.43=155.64, fA=3-1=2Se= 240.98-155.64=85.34, fe=15-2=13(4)列方差分析表:)列方差分析表: 例例2.1-3方差分析表方差分析表 来来源源偏偏差差平平方方和和自自由由度度均均方方和和F 比比因因子子 A64.155 AS2 Af8277.MSA 86.11 F误误差差 e34.85 eS13 e
46、f566.MSe 总总计计 T98.240 TS15 Tf(5) 如果给定如果给定 =0.05,从,从F分布表查得分布表查得 81. 3)13, 2(95. 0 F 由于由于F3.81,所以在,所以在=0.05水平上我们水平上我们的结论是因子的结论是因子A是显著的。这表明不同的中小是显著的。这表明不同的中小喉管结构生产的化油器的平均比油耗有明显喉管结构生产的化油器的平均比油耗有明显的差异。的差异。 我们还可以给出不同结构生产的化油器的平我们还可以给出不同结构生产的化油器的平均比油耗的估计:均比油耗的估计: 69.22822069. 81 50.22122050. 12 85.22322085.
47、 33 这里加上这里加上220是因为在原数据中减去了是因为在原数据中减去了220的缘故。的缘故。 由此可见,从比油耗的角度看,两种改进由此可见,从比油耗的角度看,两种改进结构都比原来的好,特别是改进结构结构都比原来的好,特别是改进结构1。 在本例中误差方差的估计为在本例中误差方差的估计为6.56,标准差,标准差的估计为的估计为2.56。 2.3.2 回归分析回归分析 例例2.2-1 合金的强度合金的强度y与合金中的碳含量与合金中的碳含量x有有关。为了生产出强度满足顾客需要的合金,在冶关。为了生产出强度满足顾客需要的合金,在冶炼时应该如何控制碳含量?如果在冶炼过程中通炼时应该如何控制碳含量?如果
48、在冶炼过程中通过化验得到了碳含量,能否预测合金的强度?过化验得到了碳含量,能否预测合金的强度? 这时需要研究两个变量间的关系。首先是这时需要研究两个变量间的关系。首先是收集数据收集数据(xi,yi),i=1,2, ,n。现从生产中收集到。现从生产中收集到表表2.2-1所示的数据。所示的数据。 表表2.2-1 数据表数据表 序号序号xy10.1042.020.1143.530.1245.040.1345.550.1445.060.1547.570.1649.080.1753.090.1850.0100.2055.0110.2155.0120.2360.0一、散布图一、散布图 6050400.15
49、0.200.10 xy例例2.2-1的散布图的散布图 二、相关系数二、相关系数 1相关系数的定义相关系数的定义 在散布图上在散布图上 n 个点在一条直线附近,但又个点在一条直线附近,但又不全在一条直线上,称为两个变量有线性相关不全在一条直线上,称为两个变量有线性相关关系,可以用相关系数关系,可以用相关系数 r 去描述它们线性关系去描述它们线性关系的密切程度的密切程度 yyxxxyLLLr 其中其中 nTTyxyyxxLyxiiiixy)( nTxxxLxiixx222 nTyyyLyiiyy222 iyixyTxT,性质:性质: 1 r 表示表示n个点在一条直线上,这时两个点在一条直线上,这时
50、两个变量间完全线性相关。个变量间完全线性相关。 1r r0表示当表示当x增加时增加时y也增大,称为正相关也增大,称为正相关 r0.576,说明两个变量间有(正)线性相关关系。,说明两个变量间有(正)线性相关关系。 576. 0)10(975. 0 r四、一元线性回归方程四、一元线性回归方程 1. 一元线性回归方程的求法:一元线性回归方程的求法: 一元线性回归方程的表达式为一元线性回归方程的表达式为 bxay 其中其中a与与b使下列离差平方和达到最小使下列离差平方和达到最小: 2)(),(iibxaybaQ通过微分学原理,可知通过微分学原理,可知 xxxyLLb , xbya 称这种估计为最小二
51、乘估计。称这种估计为最小二乘估计。 b 称为回归系数;称为回归系数;a一般称为常数项。一般称为常数项。 求一元线性回归方程的步骤如下:求一元线性回归方程的步骤如下: (1)计算变量)计算变量x与与y的数据和的数据和Tx,Ty;(2)计算各变量的平方和与乘积和;)计算各变量的平方和与乘积和;(3)计算)计算Lxx,Lxy;(4)求出)求出b与与a;利用前面的数据,可得:利用前面的数据,可得: b=2.4392/0.0186=130.6022 a=590.5/12-130.6022 1.90/12=28.5297 (5)写出回归方程:)写出回归方程: xy6022.1305340.28 画出的回归
52、直线一定通过(画出的回归直线一定通过(0,a)与)与 两点两点 ),(yx上例:上例: bxay 或或 xxbyy 2. 回归方程的显著性检验回归方程的显著性检验 有两种方法:有两种方法: 一是用上述的相关系数;一是用上述的相关系数; 二是用方差分析方法(为便于推广到多元二是用方差分析方法(为便于推广到多元线性回归的场合),将总的离差平方和分解成线性回归的场合),将总的离差平方和分解成两个部分:回归平方和与离差平方和。两个部分:回归平方和与离差平方和。 总的离差平方和:总的离差平方和: 2yySiT回归平方和:回归平方和: xyiRbLyyS 2离差平方和:离差平方和: RTiiESSyyS
53、2且有且有ST=SR+SE,其中,其中 iibxay 它们的自由度分别为:它们的自由度分别为: fT=n-1,fR=1,fE=n-2=fT-fR 计算计算F比,比, EERRfSfSF/ 对给定的显著性水平对给定的显著性水平 ,当,当 时认为回归方程是显著的,即回归方程是有意时认为回归方程是显著的,即回归方程是有意义的。一般也列成方差分析表。义的。一般也列成方差分析表。 )2, 1(1 nFF 对上面的例子,作方差分析的步骤如下:对上面的例子,作方差分析的步骤如下: 根据前面的计算根据前面的计算 (1)计算各类平方和:)计算各类平方和: ST=Lyy=335.2292, fT=12-1=11S
54、R=bLxy=130.60222.4292=317.2589,fR=1SE=335.2292-317.2589=17.9703, fE=11-1=10 (2)列方差分析表:)列方差分析表: 例例2.2-1的方差分析表的方差分析表 来源来源 偏差平方和偏差平方和自由度自由度均方和均方和F比比回归回归317.25891317.2589 176.55残差残差17.9703101.7970T335.229211对给定的显著性水平对给定的显著性水平 =0.05,有,有 F0.95(1,10)=4.96 由于由于F4.96,所以在,所以在0.05水平上认为回归水平上认为回归方程是显著的(有意义的)。方程是
55、显著的(有意义的)。 3利用回归方程进行预测利用回归方程进行预测 对给定的对给定的 ,y的预测值为的预测值为 0 xx 00bxay 1概率为概率为 的的y的预测区间是的预测区间是 ),(00 yy其中其中 xxLxxnnt2021112 EEfS 当当n较大,较大, 与与 相差不大,那么可给出相差不大,那么可给出近似的预测区间,此时近似的预测区间,此时 0 xx21 u进行预测的步骤如下:进行预测的步骤如下: (1)对给出的)对给出的x0求预测值求预测值 上例,设上例,设x0 =0.16,则,则 43.4916. 06022.1305364.280 y(2)求)求 的估计的估计 上例有上例有
56、 34. 1109703.17 (3)求)求 上例上例n=12,如果求概率为,如果求概率为95%的预测区的预测区间,那么间,那么t0.975(10)=2.228,所以,所以 11. 30186. 0)1583. 016. 0(1211228. 234. 12 (4)写出预测区间)写出预测区间 ),(00 yy上例为上例为(49.43-3.11,49.43+3.11)=(46.32,52.54) 由于由于u0.975=1.96,故概率为,故概率为0.95的近似的预测的近似的预测区间为:区间为:63. 234. 196. 1 所求区间:所求区间:(49.43-2.63,49.43+2.63)=(4
57、6.80,52.06) 相差较大的原因总相差较大的原因总n较小。较小。四、可化为一元线性回归的曲线回归四、可化为一元线性回归的曲线回归 在两个重复的散布图上,在两个重复的散布图上,n个点的散布不一个点的散布不一定都在一条直线附近波动,有时可能在某条曲线定都在一条直线附近波动,有时可能在某条曲线附近波动,这时以建立曲线回方程为好。附近波动,这时以建立曲线回方程为好。 1. 确定曲线回归方程形式确定曲线回归方程形式 2. 曲线回归方程中参数的估计曲线回归方程中参数的估计 通过适当的变换,化为一元线性回归的形通过适当的变换,化为一元线性回归的形式,再利用一元线性回归中的最小二乘估计方式,再利用一元线
58、性回归中的最小二乘估计方法获得。法获得。 回归曲线的形式:回归曲线的形式:(1) ,(,(a0,b0) xbay11 (2) ,(,(b0) )lg(xbay (3) ,(,(b0) xbay (4) ,(,(b0) xbay/exp100 3. 曲线回归方程的比较曲线回归方程的比较 常用的比较准则:常用的比较准则: (1)要求相关指数)要求相关指数R大,其平方也称为决大,其平方也称为决定系数,它被定义为:定系数,它被定义为: 222)(1yyyyRiii(2)要求剩余标准差)要求剩余标准差s小,它被定义为:小,它被定义为: 2n)y y(s2ii 2.3.3 试验设计试验设计 一、试验设计的
59、基本概念与正交表一、试验设计的基本概念与正交表 (一)试验设计(一)试验设计 多因素试验遇到的最大困难是试验次数太多因素试验遇到的最大困难是试验次数太多,若十个因素对产品质量有影响,每个因素取多,若十个因素对产品质量有影响,每个因素取两个不同状态进行比较,有两个不同状态进行比较,有210=1024、如果每个、如果每个因素取三个不同状态因素取三个不同状态310=59049个不同的试验条个不同的试验条件件 选择部分条件进行试验,再通过数据分选择部分条件进行试验,再通过数据分析来寻找好的条件,这便是试验设计问题。通过析来寻找好的条件,这便是试验设计问题。通过少量的试验获得较多的信息,达到试验的目的。
60、少量的试验获得较多的信息,达到试验的目的。 利用正交表进行试验设计的方法就是正交利用正交表进行试验设计的方法就是正交试验设计。试验设计。 (二)正交表(二)正交表 493L试验号列号试验号列号1 12 23 34 41 11 11 11 11 12 21 12 22 22 23 31 13 33 33 34 42 21 12 23 35 52 22 23 31 16 62 23 31 12 27 73 31 13 32 28 83 32 21 13 39 93 33 32 21 1 “L”表示正交表,表示正交表,“9”是表的行数,在试是表的行数,在试验中表示试验的条件数,验中表示试验的条件数,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阳江职业技术学院《工业机器人与自控系统集成技术》2023-2024学年第一学期期末试卷
- 扬州环境资源职业技术学院《短视频编辑技术》2023-2024学年第一学期期末试卷
- 2024年度运输中介服务与承运公司合作承揽合同9篇
- 《杨树光合同化物卸载的细胞学路径及其生理生化机制》
- 《合成气合成C2氧化物反应中Cu催化剂活性位价态及中间体CHx的作用》
- 《动作观察法联合肌电生物反馈对脑卒中患者上肢功能障碍的疗效研究》
- 2024停薪留职合同员工内部竞岗及晋升机制2篇
- 2024年环保型二手房买卖合同范本与绿色装修指南2篇
- 2025钢材采购合同范本简易版
- 2025车辆抵押借款合同的范本
- Be going to 句型(教学设计)-2023-2024学年人教PEP版英语五年级下册
- 2024小学数学新教材培训:新教材的主要特色
- 2024年中考数学复习:阿氏圆最值模型专项练习
- 2023年10月下半年空军直接选拔招录军官笔试历年典型考题及考点剖析附答案详解
- 土方清理合同范本
- 防洪排涝项目社会稳定风险分析
- DL∕T 1455-2015 电力系统控制类软件安全性及其测评技术要求
- 新公司组织架构图及人员设置
- 大一英语议论文范文模板
- 小学三年级上册道德与法治期末测试卷及完整答案(有一套)
- JCT 2776-2023 平滑式紧急疏散自动门 (正式版)
评论
0/150
提交评论