变异数分析:一元变异数分析_第1页
变异数分析:一元变异数分析_第2页
变异数分析:一元变异数分析_第3页
变异数分析:一元变异数分析_第4页
变异数分析:一元变异数分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变异数分析–一元变异数分析

(AnalysisofVariance-OnewayANOVA)Pg169介绍变异数分析概念离差平方和平均变异数误差演练计算

ANOVA表手工计算Minitab计算练习

ANOVA练习家庭作业章节目的与用途Pg170分析阶段:可能取得的成果项目回顾和第一次课程其余成果确定变异来源:探测性资料分析应用工具:FMEA和用Excel操纵资料图表技巧确定变异来源:统计分析信赖区间假设检定与样本大小中心趋势

确定变异来源:变异数分析实验设计(DOE)规划完成阶段总结结论,问题和下阶段任务Pg171不连续连续不连续列联表(ContingencyTables)变异数分析连续逻辑回归(LogisticRegression)回归(Regression)因变数自变数数学工具与数据类型Pg172检定平均数一个平均数的检定大样本或

s

已知的

Z-检定小样本或

s

未知的

t-检定

两个平均数的检定2-样本

t-检定(2-Sample-test)配对样本

t-检定

(Pairedt-test)三个或三个以上的平均数检定一元变异数检定(One-wayANOVA)Ho:m=mtargetHa:m<mtarget

m>mtarget

m¹mtargetHo:m1

=m2Ha:m1

<m2

m1

>m2

m1¹m2

Ho:m1

=m2Ha:至少有一个不同mtargetPg173变异数分析模型(ANOVAModel)变异数分析数学模型其中:yij=来自试验组合

j的单个回应

=母体平均数

j

=来自试验组合

j的基值(Tao发音)

ij=随机误差000¹=ja

至少一个:Hs':Htt

不同

至少一个

:H...:Hjajmmmm===210数学假设惯例转换Pg174变异数分析简介实例:一肥料公司想比较施用四种新的春麦肥料的农田与没有施用肥料的农田之间的差别.

从每一个试验组合中抽取了不同的农田样本并且计算了每英亩平均蒲式耳(Bushel)是多少.问题:四种肥料之间有什么不同并且与未施肥受控农田(控制组or对照组)又有什么不同?注:Bushel榖物、水果等容量单位美:35.238升、英:36.368升?Pg175案例研究案例1案例2?IntroANOVA.mtwPg176案例1图表案例1–

箱形图(Boxplot)案例1–

点状图(Dotplot)?Pg177案例2图表案例2–

箱形图(Boxplot)案例2–

点状图(Dotplot)?Pg178多元

t-检定–恰当吗?实验者需要与每一个平均数的组合进行2-样本

t-检定.1与2,1与3,1与4,1与52与3,2与4,2与53与4,3与54与5

为什么这不是一个好的办法?很明显,单调乏味麻烦.

风险有多大?每个

t-检定都有一个不正确(

)的风险.4.010^95.01=-=totala??aPg179解决办法

变异数分析(ANOVA)ANOVA其实是2-Samplet-检定的延伸(综合)ANOVA是一种检定多个样本平均数之间差异的方法为什么称之为变异数分析

ANOVA?ANOVA是直觉背后的数学ANOVA比较/分析变异数组内变异数组间变异数Pg180Minitab中的变异数分析–快速示范在Minitab中选

Stat>ANOVA>One-way(Unstacked)…IntroANOVA.mtw

至少一个不同

:H...:Hjajmmmm===210Pg181Minitab的变异数分析结果–案例1

One-wayANOVA:TmtA,TmtB,TmtC,TmtD,TmtCntrl1AnalysisofVarianceSourceDFSSMSFPFactor424.657206.16430643.600.000Error450.431000.00958Total4925.08820Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev----------+---------+---------+------TmtA106.55000.0850(*)TmtB106.95000.0850(*)TmtC105.99000.1101(*)TmtD107.52000.1033(*)TmtCntrl105.52000.1033(*)----------+---------+---------+------PooledStDev=0.09796.006.607.20你认为这是什么意思?Pg182Minitab的变异数分析结果–案例2One-wayANOVA:Tmt1,Tmt2,Tmt3,Tmt4,TmtCntrl2AnalysisofVarianceSourceDFSSMSFPFactor431.517.883.890.009Error4591.252.03Total49122.76Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev--+---------+---------+---------+----Tmt1106.2501.457(------*-------)Tmt2107.2601.561(-------*------)Tmt3106.2400.729(-------*-------)Tmt4107.7101.412(------*-------)TmtCntrl105.4901.748(-------*------)--+---------+---------+---------+----PooledStDev=1.4244.86.07.28.4你认为这是什么意思?Pg183变异数分析

基本方法描述实际问题描叙虚无假说描述对立假设验证模型假设条件是否成立?建立变异数分析表验证误差假设条件是否成立(残差分析)?请用p-值(或F-值)诠释因子的影响(p<)计算%SS(变异数总和比率)来说明因子及误差用得出的结论诠释实际问题

Pg184控制666774737564除草剂

A858576827986除草剂

B919388879086变异数分析计算实例桃树与杂草测试两种除草剂确定桃树周围杂草的清除是否有助于桃树树苗的生长.保留第三组未施用除草剂当作对照组.挑选了十八棵树苗做试验,随机分配6棵树苗给3个组中的每一组.在研究结束时,每棵树苗的生长高度均以厘米单位记录下来.运用

ANOVA和下列数据检测不同树苗之间高度的差别. 用=0.05来计算.Peaches.mtwPg185图形探究–运用

Minitab

?每组高度的箱形图(Boxplot)每组高度的点状图(Dotplot)高度高度未除草

除草剂A除草剂B未除草

除草剂A除草剂BPg186变异数分析假设条件每一个样本是独立的,随机的样本.独立的任何样本的抽样不依赖任何其他抽样样本或未抽样样本.随机的母体中的每个数值都有相同的机会被选中.每组内的量测值是常态分布并且组与组之间有相同的变异数.这仅适用于组内变异,而不适用于组间变异.每组(试验组合)的变异数相等.Pg187变异数分析的常态性检定常态机率绘制Pg188变异估计–离差平方和n个样本测量平均数的变异程度可用对总平均数的离差平方和来测量

同样地,组内离差平方和是每组平均数与总平均数变异是:由数学模型得知

:Pg189离差平方和模式将所有等式带入:TotalSSWithinSSBetweenSSPg190ANOVA表:自由度k是组的(或自变数的)数目d.f.(Between)=n是样本的总数d.f.(Within)=d.f.(Total)=21517Pg191ANOVA表:离差平方和Pg192控制除草剂

A除草剂

B668591678593747688738287757990648686每列总和平均数(总和/个数)总平均数平均数-总平均数差额平方乘以nj(每组样本大小)总和SSBetweenANOVA表:SSBetween填空计算离差平方和(Between)å-=jjjBetweenyynSS2)(Pg193ANOVA表:

SSTotal因子CtlCtlCtlCtlCtlCtlHAHAHAHAHAHAHBHBHBHBHBHB数据666774737564858576827986919388879086总平均数资料减去总平均数

总和SSTotal差额平方

填空计算离差平方和(总和)2)(åå-=ijijTotalyySSPg194ANOVA表:SSWithin重新排列平方和模型公式,给出:于是:Pg195ANOVA表:均变异数与FCalc5752

11502===BetweenBetweenBetweendfSSs1515

2242===WithinWithinWithindfSSs33.3815

57522===WithinBetweenCalcssFPg196TheANOVA表–全部Pg197解析

FCritical在Minitab中选择

Calc>ProbabilityDistributions>F…Minitab输出P(X<=x)x0.95003.6823DfBetweenDfWithin1-

?Pg198桃树与杂草测试两种除草剂确定桃树周围杂草的清除是否有助于桃树树苗的生长.挑选了十八棵树苗做试验,随机分配6棵树苗给3个组中的每一组.在研究结束时,每棵树苗的生长高度均以厘米单位记录下来.运用ANOVA和下列数据检测不同树苗之间高度的差别.用=0.05来计算.

步骤1:陈述实际问题:任意一种除草剂的试验组合都影响桃树苗的生长率吗?ANOVA实例(运用

Minitab)控制666774737564除草剂

A858576827986除草剂

B919388879086Peaches.mtwPg199步骤2(样本大小)与步骤3

(Ho

及Ha):虚无假设是什么?除草剂

B除草剂

A受控:Hmmm==0其中至少一个μ是不同

:Ha诠释–使用两种除草剂的桃树苗试验组合不影响其生长率.对立假设是什么?诠释–至少有一种除草剂与未除草受控组不同并且影响桃树苗

的生长率选择合适的样本大小.我们假设在这之前已完成.Pg200步骤4:假设条件是否有效?独立的,随机的样本从一个较大的群体里随机抽取的树苗数据常态,并且有相同的变异数.用

Minitab做一个常态性检定用

Minitab做一个变异数相等检定使用文件

Peaches.mtw结果:常态性检定的

p-值:变异数相等检定的

p-值:0.2300.3040.8590.480Pg201步骤5:建立ANOVA表在Minitab中选

Stat>ANOVA>One-way…为步骤6的分析做准备?Pg202Minitab的

ANOVA输出One-wayANOVA:HeightversusGroupAnalysisofVarianceforHeightSourceDFSSMSFPGroup21149.8574.938.410.000Error15224.515.0Total171374.3

这些数值见过吗?(请看425页)接受或拒绝虚无假设H0?Pg203Minitab的

ANOVA输出(接上页)Minitab显示试验组的平均数和标准偏差.Minitab也显示基于平均标准偏差的信赖区间图形重迭的区间大概区别不大本实例中哪个区间有差异呢?Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-------+---------+---------+------Cntrl669.8334.708(---*---)HerbA682.1673.971(---*---)HerbB689.1672.639(---*----)-------+---------+---------+------PooledStDev=3.86972.080.088.0Pg204步骤6:误差假设条件成立吗?

什么是误差假设条件?模型的误差是独立的没有任何趋势,模式,或明显的畸点模型的误差常态地分布在零的周围常态分布–常态性检定在零的周围–因为模型的特性,这总是真实的,这是数学的必然性.

怎样检定误差假设条件?利用

Minitab的残差和预期值分析预期值–模型成立时的计算值.对于一元

ANOVA:残差–原始数据点(测量值)jtm+=预期值Pg205残差分析在Minitab中选

Stat>Regression>ResidualPlots…Pg206残差分析输出残差看上去常态吗?残差看上去常态吗?在样本顺序中寻找趋势或异常随机分布在零周围没有趋势??Pg207残差的常态性检定残差是常态分布的常态机率图绘制机率残差

P-值Pg208步骤7:诠释

p-值

One-wayANOVA:HeightversusGroupAnalysisofVarianceforHeightSourceDFSSMSFPGroup21149.8574.938.410.000Error15224.515.0Total171374.3接受或拒绝虚无假设

H0?一元变异数分析:高度对试验组来源试验组误差总计Pg209步骤8-9:%SS影响与结论步骤8:什么是%SS影响程度?是计算每个变异源对总变异的影响量步骤9:对实际问题的诠释桃树苗生长高度变异的84%是可以用不同除草剂试验组合来解释说明用除草剂

B做试验的桃树苗生长最快Pg210ANOVA–练习一位园艺家正在研究3棵不同种类苹果树(1,2,和3)树叶中磷的含量.从这3种树中的每一种树中抽取5片叶子的样本进行含磷量的分析.该资料在

AppleTrees.mtw文件中的数据框内.不同种类的苹果树叶中含磷量是相同的吗?

(用0.05的

来计算)AppleTrees.mtwPg211用

Minitab绘制资料图?含磷量含磷量各类树叶含磷量点图各类树叶含磷量方框图Pg212ANOVA练习解答陈述实际问题

规定虚无假设规定对立假设

模型假设条件成立吗?

建立

ANOVA表误差假设条件成立吗?用

p-值来解释因子的影响计算因子和误差的影响百分比用统计结论简要阐明实际问题的解决办法

参见

Minitab的

ANOVA表

0H拒绝.0.000<<0.05苹果树叶中含磷量有差别吗?

μ

其中至少一个

是不同

p=.89,.83,.79–数据是常态p=.89–变异数是相同树的种类不同,树叶中含磷量也不同参见

Minitab的

残差分析

Pg213Minitab的ANOVA表AnalysisofVarianceforPhosSourceDFSSMSFPTree20.276640.1383216.970.000Error120.097800.00815Total140.37444Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev------+---------+---------+---------+Var150.460000.08916(-----*-----)Var250.776000.10164(-----*-----)Var350.708000.07855(-----*-----)------+---------+---------+---------+PooledStDev=0.090280.450.600.750.90Pg214Minitab的残差分析残差模型诊断Pg215ANOVA–家庭作业家庭作业的问题数据在

Minitab的

A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论