![方差分析讲稿_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-1/9/ec449685-7134-4e91-9650-65b8aadf36fa/ec449685-7134-4e91-9650-65b8aadf36fa1.gif)
![方差分析讲稿_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-1/9/ec449685-7134-4e91-9650-65b8aadf36fa/ec449685-7134-4e91-9650-65b8aadf36fa2.gif)
![方差分析讲稿_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-1/9/ec449685-7134-4e91-9650-65b8aadf36fa/ec449685-7134-4e91-9650-65b8aadf36fa3.gif)
![方差分析讲稿_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-1/9/ec449685-7134-4e91-9650-65b8aadf36fa/ec449685-7134-4e91-9650-65b8aadf36fa4.gif)
![方差分析讲稿_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-1/9/ec449685-7134-4e91-9650-65b8aadf36fa/ec449685-7134-4e91-9650-65b8aadf36fa5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 方方 差差 分分 析析(ANOVA)MeasureAnalyzeImproveControl2 学学 习习 目目 标标l 从双样本从双样本t检验过渡到更一般的情况检验过渡到更一般的情况, ,即比较即比较2 2组以上数组以上数据的均值据的均值(单因素方差单因素方差分析分析- one-way ANOVA)l 如果各组均值存在显著差异如果各组均值存在显著差异, ,能指出是哪些组的均值与能指出是哪些组的均值与众不同众不同(多重多重 比较比较-multiple comparisons multiple comparisons )l 检检 验验2 2个或个或2 2个以上因素在不同水平时的效应个以上因素
2、在不同水平时的效应(双因素或双因素或多因素方差分析多因素方差分析-two-way or higher ANOVAtwo-way or higher ANOVA)l 用方差分析法来分析总波动中各个因素的波动组成用方差分析法来分析总波动中各个因素的波动组成,从而从而得出得出方差分量方差分量(variance components)的估计值的估计值.3 单因素方差分析与双样本单因素方差分析与双样本t t 检验检验Old MethodNew Method16.320.715.216.614.918.119.222.220.124.113.216.615.817.7 双双 样样 本本T T 检检 验验
3、如如 何何 比比 较较 更更 多多 的的 方方 法法? ?Method 1Method 2Method 3Method 416.319.320.422.215.217.419.621.914.919.020.423.719.222.323.525.620.121.624.825.813.214.115.816.615.819.623.623.9 问问: : 两两 种种 方方 法法 的的 均均 值值 是是 否否 有有 差差 异异? ? 问问: : 各各 种种 方方 法法 的的 均均 值值 是是 否否 有有 差差 异异? ? 如如 存存 在在 差差 异异, , 究究 竟竟 是是 哪哪 些些 方方
4、法法 与与 众众 不不 同同? ?4 是否存在差异是否存在差异? ? 输输 出出10203040501 2 3xAxx 因素因素A A 是指线路板焊接过程中的预热温度是指线路板焊接过程中的预热温度. . 图中横坐标表示预热温度的三个水平设置图中横坐标表示预热温度的三个水平设置. . 纵坐标输出表示每块线路板上的平均焊接缺陷数纵坐标输出表示每块线路板上的平均焊接缺陷数. . 问问: : 因素因素A A的不同水平是否对输出有影响的不同水平是否对输出有影响, , 为什么为什么? ? 要做出正确判断还需什么信息要做出正确判断还需什么信息? ?5 方差分析方差分析l 现在你的结论如何现在你的结论如何?
5、? 因素因素A A是否会产生输出差异是否会产生输出差异? ?为什么为什么? ?10203040501 2 3xxx 输输 出出A6 单因素方差分析单因素方差分析l 单因素方差分析是一种比较单因素方差分析是一种比较2 2组以上数据均值的统计方组以上数据均值的统计方法法 l 检验假设检验假设:l 简而言之简而言之, , ANOVA 只检验均值是否存在差异只检验均值是否存在差异, ,但并不但并不能指出哪些均值与众不同能指出哪些均值与众不同, ,要回答这一问题要回答这一问题, ,需用多重比需用多重比较法较法.l 为什么不用为什么不用 t t 检验两两比较检验两两比较? ?different is on
6、eleast At :Ha. :Hokk43217 举举 例例l 一高尔夫设计人员需从四种凹陷形式中选取一种一高尔夫设计人员需从四种凹陷形式中选取一种, , 他想了解不同的他想了解不同的凹陷形式是否对球的射程有影响凹陷形式是否对球的射程有影响.l 现有现有4 4 种凹陷形式的高尔夫球共种凹陷形式的高尔夫球共24 24 个个.l 输入变量是凹陷形式输入变量是凹陷形式, ,输出变量是射程输出变量是射程. l 实验采用美国高尔夫协会采用的标准测试器实验采用美国高尔夫协会采用的标准测试器, , 实验用球随机抽取实验用球随机抽取, ,为什么为什么? ?Dimple 1Dimple 2Dimple 3Di
7、mple 4277281304250268299295277281317317268263286299272290304281295304286281263golf.mtw8 ANOVA 涉及的问题涉及的问题 各种凹陷形式的平均射程是否相同各种凹陷形式的平均射程是否相同? 即即4 4 组样本是否来自同一总体组样本是否来自同一总体?4 4组均值是否确实有差异组均值是否确实有差异?4321 :Hodifferent is oneleast At :Hak9 方差分析方差分析lANOVA考察三种波动来源考察三种波动来源: 总总 体体 = 所有观察值的总体波动所有观察值的总体波动 组组 间间 = 各组
8、均值之间的波动各组均值之间的波动(因素因素) ) 组组 内内 = 各组内部的随机波动各组内部的随机波动( (噪声噪声, ,统计误差统计误差)Total = between + within 子子 组组 之之 间间 波波 动动 子子 组组 内内 部部 波波 动动 与与 控控 制制 图图 比比 较较10 ANOVAANOVA基础基础-平方和平方和432170656055 FactorResponseyij - 单单 值值y - 总总 均均 值值yj - 组组 均均 值值i = 第第j j组的第组的第i i 个观察值个观察值j = 第第j j组组g = 总组总组 数数SS(Tot) = 总平方和总平
9、方和 (单值单值- -总均值总均值) )SS(Factor)= 组间平方和组间平方和( (因素平方和因素平方和) ) ( (组均值组均值- -总均值总均值) )SS(Error)= 组内平方和组内平方和( (误差平方和误差平方和) ) ( (单值单值- -组均值组均值) )SS(Error) SS(Factor) SS(Total) gjnigjnijijgjjjijjjyyyynyy11112122)()()(11 方差分析表方差分析表Hypothesis TestHo: Ha: At least one is different1k234 为决定是否接受零假设为决定是否接受零假设, , 我
10、们将利用方差分析表计算检验统计量我们将利用方差分析表计算检验统计量F 为何称组内波动为误差或噪声为何称组内波动为误差或噪声. .F F值有何意义值有何意义? F F值大意味什么值大意味什么?方差分析表方差分析表标标 准准 形形 式式误差的共同方差误差的共同方差SOURCE SS df MS (=SS/df)F =MS(Factor)/MS(Error)BETWEENSS(Factor)g - 1SS(Factor)/(g - 1)MS(Factor) / MS(Error)WITHINSS(Error)SS(Error)/TOTALSS(Total)njjg ( ) 11g njj 11()g
11、 njj 11()12 用用MinitabMinitab进行方差分析进行方差分析l 打开文件打开文件golf.mtwgolf.mtwl Minitab Minitab通过统计法和图表法进行方差分析通过统计法和图表法进行方差分析. . 图表法图表法 主效应图主效应图 区间图区间图 统计法统计法 方差分析表方差分析表l 稍后我们会学习如何确定哪些组对之间存在差异稍后我们会学习如何确定哪些组对之间存在差异? ? 多重比较多重比较13 图表法图表法 - - 主效应图主效应图 要产生主效应图要产生主效应图, ,首先需将各组数据堆栈首先需将各组数据堆栈, ,命令如下命令如下: :ManipStack/Un
12、stackStackManipStack/UnstackStack 数据堆栈后数据堆栈后, ,用下列命令产生主效应图用下列命令产生主效应图: :StatANOVAMain Effects Plots StatANOVAMain Effects Plots 说明主效应图的意义说明主效应图的意义Choose GraphBoxplotdimple 1dimple 2dimple 3dimple 4250260270280290300310320Boxplots of dimple 1 - dimple 4(means are indic ated by s olid c irc les )43213
13、05295285275dimple patterndistanceMain Effects Plot - Data Means for distance14 图表法图表法- - 区间图区间图产生区间图命令如下产生区间图命令如下: :StatANOVAInterval PlotStatANOVAInterval Plot 选取选取Standard ErrorStandard Error 选取选取Confidence IntervalConfidence Interval 区间图有何意义区间图有何意义, ,你能否判断不同的凹陷形式是否有差异你能否判断不同的凹陷形式是否有差异, ,为什么为什么? ?
14、d im p le p a tte rndistance traveled1234270280290300S ta n d a rd E rro r - In te rva l P lo tdimple patterndistance traveled12342 6 02 7 02 8 02 9 03 0 03 1 095% ConfidenceInterval Plot15 方差分析表方差分析表 用如下命令产生方差分析表用如下命令产生方差分析表: :StatANOVAOne-Way (Unstacked)OKStatANOVAOne-Way (Unstacked)OKSourceDFSSMS
15、FPFactor34,6261,54213.750.0000Error202,242112Total236,868Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev -+-+-+-+Dimple 1 4 272.25 8.22 (-*-)Dimple 2 6 294.67 12.66 (-*-)Dimple 3 6 303.83 7.41 (-*-)Dimple 4 8 272.25 11.73 (-*-) -+-+-+-+Pooled StDev = 10.59 270 285 300 315One- Way
16、 Analysis of VarianceAnalysis of Variance on Distance Traveled11259.1016 方差分析表说明方差分析表说明One-Way Analysis of VarianceAnalysis of Variance on ResponseSource DF SS MS F pPattern34,626 1542.0 13.76 0.000Error 202,242 112.1Total236,8684242322212sssssPooledF值接近1时,说明各组 均值很相近, 本例中F 值很大如P值小于5% ,说明至少有一组均值与众不同,
17、本例中,我们拒绝各组均值相同的原假设,即至少有一种凹陷形式的组均值与其它组不同. 本例中F值对应的发生概率小于万分之一. 当各组样本数相同时当各组样本数相同时. .( (本例样本数不同本例样本数不同, , 所以是加权平均值所以是加权平均值) )17 F F分布说明分布说明141210864200.70.60.50.40.30.20.10.0F-ValueP robF -D is tribu tio n fo r 3 a n d 2 0 de g re e s o f F re e d o m10% Point5% Point1% PointObserved Point 下面我们来解释下面我们来
18、解释F F分布及分布及F F检验量检验量, ,下图显示的是如果所有方法产生的均值下图显示的是如果所有方法产生的均值相同时相同时F F值的分布值的分布. .注意本例中计算出的注意本例中计算出的F F值在分布图形的尾部值在分布图形的尾部. 10%10%点表示如果不同凹陷形式的均值相同点表示如果不同凹陷形式的均值相同, ,F F值大于值大于2 2的概率是的概率是10% .10% .18 多重比较多重比较l 我们已经找出凹陷形式之间存在着显著的差异我们已经找出凹陷形式之间存在着显著的差异. .下一步是什么下一步是什么? ?哪种哪种形式是最佳的形式是最佳的? ?哪组均值显著不同哪组均值显著不同?l 我们
19、采用多重比较来解决上述问题我们采用多重比较来解决上述问题. .19 多重比较多重比较l 按命令按命令 StatANOVAOnewayStatANOVAOneway , , 选择选择 ComparisonsComparisons 项项, , 屏幕显示如下选屏幕显示如下选择项择项: :l TukeysTukeysl Fishers Fishersl Dunnetts Dunnettsl Hsus MCB Hsus MCB 究竟采用哪一种多重比较方法究竟采用哪一种多重比较方法? ?通常我们推荐使用通常我们推荐使用 FisherFisher多重比较法多重比较法. . FisherFisher多重比较法
20、将控制各比较检验的显著性水平多重比较法将控制各比较检验的显著性水平( (通常通常p=.05)p=.05)然后得然后得出总体误差率出总体误差率. . TukeyTukey多重比较法提高各个比较检验的显著性水平多重比较法提高各个比较检验的显著性水平( (p.05),pANOVABalanced ANOVASurvivalPoison Treatment Poison*TreatmentOK 因素效应显著因素效应显著,而而互作用则不显著互作用则不显著.15.0224.s28 结结 论论l 基于前述分析基于前述分析, ,我们得出如下结论我们得出如下结论: :毒药和医序处理是重要因素毒药和医序处理是重要
21、因素, ,而而互交作用不是互交作用不是(p=0.11).l 如何检查模型的完备性如何检查模型的完备性? 模型假设成立的前提模型假设成立的前提? 方差齐次性方差齐次性 残差相互独立残差相互独立 残差呈正态分布残差呈正态分布 均值为零均值为零 标准差由组内波动估计标准差由组内波动估计 模型是可被加的模型是可被加的. .29 检查模型符合性检查模型符合性-0.4-0.3-0.2-0.10.00.10.20.30.40.5-2-1012Normal ScoreResidualNormal Probability Plot of the Residuals(response is Survival)0.
22、20.30.40.50.60.70.80.9-0.4-0.3-0.2-0.10.00.10.20.30.40.5Fitted ValueResidualResiduals Versus the Fitted Values(response is Survival) 残差看上去不呈正态分布残差看上去不呈正态分布. 喇喇 叭叭 口口30 -5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.5 0.0 0.5 1.00.10.20.30.40.50.60.795% Confidence IntervalStDevLambdaLast Iteration InfoLambda
23、StDev-0.844-0.787-0.730 0.089 0.089 0.089LowEstUpBox-Cox Plot for Survival 方差稳定化方差稳定化l 用用Box-CoxBox-Cox变化可以确定正确的变化参数从而保证残差正态性变化可以确定正确的变化参数从而保证残差正态性与方差齐次性与方差齐次性. . l 子组数为子组数为4 4. .StatControl Charts Box-Cox Transformation Survival4OK 看来应取倒数看来应取倒数. . 生存时间的倒生存时间的倒数数 是何意义是何意义? ?31 对死亡率进行方差分析对死亡率进行方差分析An
24、alysis of Variance (Balanced Designs)Factor Type Levels ValuesPoison fixed 3 1 2 3Treatmen fixed 4 1 2 3 4Analysis of Variance for Dying Source DF SS MS F PPoison 2 34.8771 17.4386 72.63 0.000Treatmen 3 20.4143 6.8048 28.34 0.000Poison*Treatmen 6 1.5708 0.2618 1.09 0.387Error 36 8.6431 0.2401Total 4
25、7 65.5053 互作用波动与组互作用波动与组内波动一致内波动一致. .32 对死亡率再进行残差分对死亡率再进行残差分析析-101-2-1012Normal ScoreResidualNormal Probability Plot of the Residuals(response is Dying)12345-101Fitted ValueResidualResiduals Versus the Fitted Values(response is Dying) 变化后数据表明残差方差变化后数据表明残差方差稳定稳定, , 残差正态性良好残差正态性良好 结论结论:(1) 死亡率死亡率( (Su
26、rvival)Survival)-1 -1 作作为输出响应应更合适为输出响应应更合适; (2)(2)毒药和医序处理都是重毒药和医序处理都是重要的显著因素要的显著因素. . 注注 意意: :我们的记录指标对实验分析来说我们的记录指标对实验分析来说不不 一定是最佳的一定是最佳的. .33 ANOVAANOVA与方差分量与方差分量( (COV)COV)l 前述例子是前述例子是: : 双双因素方差分析因素方差分析 “毒药毒药”和和“医序处理医序处理”两个因素两个因素 固定效应固定效应 我们选择的两个因素的水平是我们选择的两个因素的水平是固定固定的的, ,而而不能从不能从“毒药毒药”总体或总体或“医序处
27、理医序处理”总体中随机选取总体中随机选取. . “毒药毒药”和和“处理处理”这两个因素是这两个因素是交叉交叉的的. . 实验单元是实验单元是“动物动物”,”,这是这是随机随机变量变量, ,套套在在PoisonPoison和和TreatmentTreatment组合中组合中, ,动物变量波动动物变量波动 组合成实验误差或噪声组合成实验误差或噪声误差误差. . TreatmentPoisonABCD10.310.820.430.450.451.100.450.710.460.880.630.660.430.720.760.6220.360.920.440.560.290.610.351.020.4
28、00.490.310.710.231.240.400.3830.220.300.230.300.210.370.250.360.180.380.240.310.230.290.220.33Box, G. E. P. and D. R. Cox (1964). An Analysis of transformations, J. Roy. Stat Soc.,Series B, 26, 211. See also Box, Hunter and Hunter, page 228 ff.34 2 2 因素套设计方差分析因素套设计方差分析l 数据见右图数据见右图: : 双因素双因素 “ “小时小时”
29、和和“零件零件” “小时小时”和和“零件零件”是是随机因素随机因素 这里这里“小时小时”代表从大量的代表从大量的小时集合中的随机样本小时集合中的随机样本,“,“零件零件”代表一小时内生产的零件中随代表一小时内生产的零件中随机选择的样本机选择的样本. . “ “零件零件”套套在在“小时小时”内内 因第一小时内选取的因第一小时内选取的2 2个零件并个零件并不是第二小时内选取的不是第二小时内选取的2 2个零件个零件. . 实验单元是测量值实验单元是测量值, ,这是一这是一随机随机变量变量, ,套在套在“零件零件”内内, ,而而“零件零件”又又套套在在“小时小时”内内. .HourPartMeasur
30、emtYHour.1Part.1Mean.1Range.11111.45112.01330.881122.33123.62330.121132.26233.84670.351213.56242.33670.301223.68354.16670.061233.63362.90330.332313.85473.06330.352324.02483.75330.382333.67593.93330.552412.465101.92000.272422.162432.393514.203524.143534.163612.843623.103632.774712.944722.964733.29481
31、3.704823.974833.595914.275923.725933.8151011.8151021.8751032.08Nested-Parts.mtw35 10987654321Subgroup0432Sample Mean11111111X=3.1563.0SL=3.523-3.0SL=2.7891.00.50.0Sample RangeR=0.35903.0SL=0.9242-3.0SL=0.00E+00Xbar/R Chart for Y 图表分析图表分析: :零件测量值均值零件测量值均值Stat Control Charts Xbar-R Subgroup size: Part
32、 (3 measurements) 代代 表表 什什 么么? ? 答答 案案: : 22dRmeas22essmeas0450.212.693. 13590.2222dRmeas36 图表分析图表分析: :每小时均值每小时均值5432Subgroup16543210Sample MeanX=3.1563.0SL=5.821-3.0SL=0.4906543210Sample RangeR=1.4173.0SL=4.631-3.0SL=0.00E+00Xbar/R Chart for Mean.1 极差图反映每小时内零件测量值均值的变化极差图反映每小时内零件测量值均值的变化 代表代表 什什 么么?
33、 ? 回回 答答: : 22dRpart3measpart22ss578. 1256. 1128. 1417. 12222dRpart37 图表分析图表分析: :每小时均值的波动每小时均值的波动5432Subgroup1432Individual ValueX=3.1563.0SL=4.037-3.0SL=2.2751.00.50.0Moving RangeR=0.33123.0SL=1.082-3.0SL=0.00E+00I and MR Chart for Mean.2移动极差图是根据相邻每小时均值的变化量绘制的移动极差图是根据相邻每小时均值的变化量绘制的 代表什么代表什么? ? 答案答案
34、: : 22dRhour62measparthour222sss0862.2936.128. 13312.2222dRhour38 控制图计算总结控制图计算总结Variation analysis so far:Chart GroupR22dREstimatesVarianceComponent2ssParts Xbar/R0.3590.0452meass2meass0.0450.21Hours Xbar/R1.4171.578322measpartss2parts1.5631.25Hours I/MR0.3310.0866measparthour2223sss2hours-0.7030现在我
35、们用现在我们用Minitab Minitab 进行分析进行分析: : Stat ANOVA Fully Nested ANOVAStat ANOVA Fully Nested ANOVA 注意注意: : 方差分量估计时方差分量估计时, ,需减去一部分对应的下级分量方差需减去一部分对应的下级分量方差. . 有时当某一方差分量很小时有时当某一方差分量很小时, , 计算结果会出现负数计算结果会出现负数. .由于方差不可能为负由于方差不可能为负, , 我们就将其设为我们就将其设为0.0. 39 Minitab: Minitab: 套设计方差分析套设计方差分析40 MinitabMinitab结果结果Fully Nested Analysis of VarianceAnalysis of Variance for Y Source DF SS MS F PHour 4 2.2684 0.5671 0.172 0.944 不显著不显著Part 5 16.4967 3.2993 64.277 0.000 非常显著非常显著Measurem 20 1.0266 0.0513Total 29 19.7917Variance Component
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年心脑血管检查合同
- 2025年落地灯项目深度研究分析报告
- 2025年中国火鸭养殖行业市场发展现状及投资规划建议报告
- 2019-2025年中国吉林省旅游市场深度调研分析及投资前景研究预测报告
- 2021-2026年中国危险品物流行业发展监测及投资战略规划研究报告
- 2025年中国摩托车总装线行业市场发展前景及发展趋势与投资战略研究报告
- 2025年乌龟饲料行业深度研究分析报告
- 2025年紫外线强度观测仪器项目规划申请报告
- 2025年智能断路器市场调查报告
- 2025年IPTV行业深度调研与投资战略规划分析报告
- 五年级下册语文教案 学习双重否定句 部编版
- 南京地区幼儿园室内空气污染物与儿童健康的相关性研究
- 平安产险陕西省地方财政生猪价格保险条款
- 地震应急救援培训课件
- 初中物理光学难题难度含解析答案
- 《霍尔效应测量磁场》课件
- 《疯狂动物城》全本台词中英文对照
- 中专数学(基础模块)上册课件
- 高考作文复习任务驱动型作文的审题立意课件73张
- 品质部经理KRA KPI考核表
- 一个28岁的漂亮小媳妇在某公司打工-被老板看上之后
评论
0/150
提交评论