实用统计学-8.方差分析_第1页
实用统计学-8.方差分析_第2页
实用统计学-8.方差分析_第3页
实用统计学-8.方差分析_第4页
实用统计学-8.方差分析_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章方差分析(ANOVA)AnalysisofVariance

在参数假设检验中,我们经常检验两个总体分布的均值是否相同,其中运用的统计量主要是t统计量。如果有多个总体,则必须进行两两比较检验,显然很繁琐。而方差分析,可以一次完成对多个总体的均值是否相同的检验:

H0:1=2=3=...=sOne-FactorAnalysisofVariance

单因子方差分析如:s组人员的工资水平、s种同功能药品的效果、s种训练方法的训练效果、等问题,有无显著性差异。假设条件:样本是随机并独立地抽取 (这个条件一定要满足)所有总体都服从正态分布所有总体的方差都相等

单因素方差分析是对多套实验方案的效果的对比分析,可以用来检验多组相关样本之间均值有无显著性差异。多个独立样本均值的比较--单因素方差分析1、资料类型

注意,s个样本中含量不必相等!!!方案1x11x12……方案2x21x22……方案3x31x32……………………方案sxs1xs2……单因素方差分析的假设检验H0:1=2=3=...=s=所有总体的均值都相等

各组均值之间没有差异H1:1,2,3,…,s不全相等至少有两个不相等 (其它可能相同!)不意味着有:

1

2

...

sOne-FactorANOVA:

H0:1=2=3=...=cH1:notallthekareequalTheNullHypothesisisTrue请注意其含义OneFactorANOVA:

H0:

1

=

2

=

3

=...=cH1:notallthekareequalTheNullHypothesisisNOTTrueTotalVariation总变异Xij=theithobservationingroupini=thenumberofobservationsingroupin=thetotalnumberofobservationsinallgroups

s=thenumberofgroups2、总变异的分解……方差分析的关键!!!Among-GroupVariation组间变异ni

=thenumberofobservationsingroupis=thenumberofgroups

thesamplemeanofgroup

i

theoverallorgrandmeanijVariationDuetoDifferencesAmongGroups.XiX___Within-GroupVariation

组内变异

thejthobservationingroupi

thesamplemeanofgroupi

iSummingthevariationwithineachgroupandthenaddingoverallgroups.Within-GroupVariation

iIfmorethan2groups,useFTest.For2groups,uset-Test.FTestmorelimited.One-WayANOVASummaryTable

单因子方差分析表SourceofVariationDegreesofFreedomSumofSquaresMeanSquare(Variance)Among(Factor)s-1SSAMSA=SSA/(s-1)

MSAMSWWithin(Error)n-sSSWMSW=SSW/(n-S)Totaln-1SST=SSA+SSWFTestStatistic=根据观测值,计算出f值,若f>f(s-1,n-s)(显著性水平为),则表明SSb较大,Xi–Xtotal的平方和较大,对应的总体参数是i-的绝对值较大,所以拒绝H0

,即至少有两个方案之间的平均效果(均值)差异足够大,方案之内的差异相对小.反之,就接受H0,即不同方案的效果没有显著性差异.注:

用SPSS做方差分析中,输出的结果是:统计值f右侧的概率,其与给定显著性水平进行比较.

如:查F表得:f,当ff,在SPPS的结果中是输出f值右侧概率p.ffpOne-FactorANOVAFTestExampleAsproductionmanager,youwanttoseeif3fillingmachineshavedifferentmeanfillingtimes.Youassign15similarlytrained&experiencedworkers,5permachine,tothemachines.Atthe0.05level,isthereadifferenceinmeanfillingtimes?

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40One-FactorANOVAExample:ScatterDiagram

272625242322212019X

XxxX=24.93

X=22.61

X=20.59X=22.71TimeinSeconds

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40__________One-FactorANOVAExampleComputationsX1=24.93X2=22.61X3=20.59X=22.71SSA=5[(24.93-22.71)2+(22.61-22.71)2+(20.59-22.71)2]=47.164SSW=4.2592+3.112+3.682=11.0532MSA=SSA/(s-1)=47.16/2=23.5820MSW=SSW/(n-s)=11.0532/12=0.9211

nj=5s=3n=15

Machine1

Machine2

Machine3

25.40 23.40 20.00

26.31 21.80 22.20

24.10 23.50 19.75

23.74 22.75 20.60

25.10 21.60 20.40_____SummaryTableSourceofVariationDegreesofFreedomSumofSquaresMeanSquare(Variance)F==25.60

Among(Machines)3-1=247.164023.5820Within(Error)15-3=1211.0532.9211Total15-1=1458.2172MSAMSWF03.89One-FactorANOVA

Example

SolutionH0:1=2=3H1:NotAllEqual=.05df1=2,df2=12CriticalValue(s):TestStatistic:Decision:Conclusion:Rejectat=0.05Thereisevidencethatatleastoneidiffersfromtherest.=0.05FMSAMSW2358209211256...2、[实例分析]

三组销售不同包装饮料商品的日均销售量瓶装组罐装组袋装(老包装)757460707864667265696855716358问题:三种包装的日平均销售量是否有显著差异?方差分析结果(=0.05)

ANOVAforSALESSdfMeanSquare F Sig.

Between420.367 2 210.183 14.661.001 Within172.033 12 14.336Total 592.400 14

结论:P=0.001<0.05,可以认为不同包装下的饮料平均销售量整体上表现出统计学意义上的差异。(注意,要想知道是哪两种包装之间有差异,尚须做两量两比较)举例:一家销售复印机的跨国公司采用了三种不同的方法来对新招收的市场营销人员进行培训,以便使他们尽快适应工作。在培训结束时,培训主管从这些接受过三种不同培训方法的人当中随机抽取了16名受训人员,以研究不同培训方法产生的效果。由于销售额可以作为显示培训结果的一个重要指标,因此他收集了这16名受训人员的季度销售额并将结果汇总如下:当显著水平为0.05时,请根据记录下来的季度销售额确定:三种培训方法是否会产生明显不同的效果。H0

:三种培训方法会产生相同的效果HA:至少有一种培训方法产生的效果与另外两种方法不同解:总平均值

:组间方差:组内方差:0

临界值,3.81F检验统计量,1.754临界区域,0.05F检验统计量1=31=2,2=163=13F,1,2=F0.05,2,13=3.81检验统计量落在临界区域之外(1.754<3.81) 接受H0数据显示:当显著水平为0.05时,三种培训方法不会产生明显不同的效果SPSS为我们提供了方便

--

阅读并解释输出结果定义数据–变量图有两个变量有待定义–方法和销售额SPSS为我们提供了方便

--

阅读并解释输出结果输入数据–数据图有2栏、16排数据需要输入SPSS为我们提供了方便

--

阅读并解释输出结果进行分析–菜单条1.在菜单条中单击分析比较均值单向方差分析…2.将销售额放置到因变量表中,并将方法放置到因子中单击选项…并检查描述

方差的同质性单击继续3.单击OKSPSS为我们提供了方便

--

阅读并解释输出结果

SPSS输出结果–从输出结果得到,F检验统计量=1.754p–值=0.667由于 p–值>(=0.05) 接受H0SPSS为我们提供了方便

--

阅读并解释输出结果S2BS2W检验统计量p–值汇总后的标准差=3.716无重复实验的双因素方差分析问题:例如:对运动员进行训练的效果,不仅与训练方法有关,而且与运动员本身的特质有关.我们选出了n组运动员,每个组的运动员都具有同样的体质特征,每组有s个运动员,用s种不同方法进行训练.我们会得到sn个不同的训练效果,怎样判断不同训练方法的效果是否有显著效果?将其概括为数学问题,如表:无重复,双因素方差分析的已知条件因素A1因素A2因素As……因素B1因素B2因素Bn……x11x12x1n…..x21x22x2n…………xs1xs2xsn……问:因素A的不同水平(方案)的效果(均值),有无显著不同?因素B的不同水平(方案)的效果(均值),有无显著不同?

不同激励方法的效果与被激励者的素质(文化环境,传统观念,等等)有关,是双因素方差分析问题;不同药品的治疗效果,与病人的体质有关,是双因素方差分析问题;不同营销方案的效果与产品的质量有关等,是双因素方差分析问题;等等.

除了上述训练方法和运动员的特质问题外,在实践中常遇到的双因素方差分析问题有:Two-WayANOVAAssumptions

双因素方差分析的假设Normality(正态性假设)PopulationsarenormallydistributedHomogeneityofVariance(方差齐性假设)PopulationshaveequalvariancesIndependenceofErrors(独立抽样假设)Independentrandomsamplesaredrawn分析:

假设在Ai与Bj下的总体Xij服从N(ij,2)分布,(假设sn个总体分布的方差都相同)设:称为总体Xij的总平均.称为第j列总体的平均.称为第i行总体

的平均.把“第i行的平均i·与总平均

之差”ai=i·-

,其中,i=1,2…,s称为Ai的主效应.把“第j列的平均

·j与总平均

之差”

bj=

·j-

,其中,j=1,2…,n称为Bj的主效应.如果Ai与Bj间不存在交互效应,就有

ij=+ai+

bj,其中,i=1,2…,s,j=1,2…,n也就是说,随机样本Xij的均值ij,是由“总平均”,“Ai的主效应ai”,“Bj的主效应bj”组成.随机样本Xij,可视为其总体均值ij与随机误差ij之和:式中,ij

服从N(0,2)分布,并且ij

之间相互独立.于是有:

Xij=+ai+

bj+ij,其中,i=1,2…,s,j=1,2…,n称为“无交互影响的双因素(一元)模型”处理过程:1.假设零假设H0A

:i·=

,即ai=0,i=1,2…,sH0B

:

·j=

,即bj=0,j=1,2…,n备择假设H1A

:1·,2·

,…,s·之间不完全相同,或ai不全等于0H1B

:

·1,

·2

,…,

·n之间不完全相同,或bj不全等于0式中:可以证明:在“无交互影响的双因素模型”下,有以下结论:SA,SB,SE

相互独立,且ST=SA+SB+SESE/2

服从2((s-1)(n-1))分布当H0A成立时,有SA/2服从2(s-1)分布当H0B成立时,有SB/2服从2(n-1)分布2

计算按下面公式,计算出SA,SB,SE所对应的值sA,sB,sE,进而算出与FA,FB对应的值fA,fB.定义统计量:总变差:行间变差:列间变差:总误差平方和:(5)当H0A成立时,有服从F((s-1),(s-1)(n-1))分布(6)当H0B成立时,有服从F((n-1),(s-1)(n-1))分布3对给定的显著性水平为,查表f((s-1),(s-1)(n-1)),若fA>f((s-1),(s-1)(n-1)),表明SA较大,则拒绝H0A,即至少A因素中有两个水平之间的平均效果(均值),差异足够大.反之,接受H0A,即A因素的不同水平的效果(均值)没有显著性差异.同理,对给定的显著性水平为,查表f((n-1),(s-1)(n-1)),若fB>f((n-1),(s-1)(n-1)),表明SB较大,则拒绝H0B,即至少B因素中有两个水平之间的平均效果(均值),差异足够大.反之,接受H0B,即B因素的不同水平的效果(均值)没有显著性差异.2、变异分解及假设检验例:某公司对某产品设计了4种类型的产品包装(用A,B,C表示),又设计了3种销售方案,在某地区用3种销售方案,对4种包装的该产品试销一个月,业绩如表所示。现在想知道:不同包装、不同销售方案,对销售业绩的影响是否有显著差异。不同销售方案对不同包装的产品的销售业绩不同销售方案包装类型ABCD甲乙丙1031061358210211871100106526685这是一个典型的无重复实验的双因素方差分析问题。其模型是:

Xij=+ai+

bj+ij,其中,i=1,2…,s,j=1,2…,n注意:在SPSS中,数据按如下方式表达。

SPSS中数据存放方式包装类型销售方案销售业绩A甲103A乙106A丙135B甲85B乙102B丙118C甲71C乙100包装类型销售方案销售业绩C丙106D甲52D乙66D丙85用SPSS后的输出结果为:CorrectedModel5815.66751163.13332.919.000Intercept105656.3331105656.3332990.274.000包装类型3503.00031167.66733.047.000销售方案2312.66721156.33332.726.001Error212.000635.333Total111684.00012CorrectedTotal6027.66711SourceSunofSquaresdfMeanSquareFSig.说明:Intercept:截距,相当于包装类型:包装类型的变差sA销售方案:销售方案的变差sB

Rrror:误差(残差)项的变差sE,相当于ij的平方和给定显著性水平=0.05,从上表结果可知,其p值均小于0.05,所以在两个因素的不同水平的不同组合下,至少有的效果之间,有显著性差异.重复实验的双因素方差分析问题提出:仍以下面问题为例:对运动员进行训练的效果问题。两个因素,仍然是A:训练方法s种,B:运动员本身的特质n种,同样体质的运动员分在同一组,即有n组运动员。为了便于比较,每组安排st个具有同样体质的运动员,也就是说,每种训练方法在每个组内,对t个运动员进行训练。我们就会得到snt个不同的训练效果值。怎样判断不同的训练方法的效果是否有显著效益?不同特质对训练效果是否有显著影响?有重复,双因素方差分析的已知条件问:因素A的不同水平(方案)的效果(均值),有无显著不同?因素B的不同水平(方案)的效果(均值),有无显著不同?因素A与B之间的交互作用如何?因素A1因素A2因素As……因素B1因素B2因素Bn……X111,X112,···,X11t

…..………………X121,X122,···,X12t

X1n1,X1n2,···,X1nt

X211,X212,···,X21t

X221,X222,···,X22t

X2n1,X2n2,···,X2nt

Xs11,Xs12,···,Xs1t

Xs21,Xs22,···,Xs2t

Xsn1,Xsn2,···,Xsnt

理论假设与分析:假设在Ai与Bj下的总体Xij服从N(ij,2)分布,(假设sn个总体分布的方差都相同,但均值可能不同),与上节相同,设:称为总体Xij的总平均.称为第j列总体的平均.称为第i行总体

的平均.把“第i行的平均i·与总平均

之差”ai=i·-

,其中,i=1,2…,s称为Ai的主效应.把“第j列的平均

·j与总平均

之差”bj=

·j-

,其中,j=1,2…,n称为Bj的主效应.如果Ai与Bj间存在交互效应,就有cij

=ij-

ai-

bj-=ij-i·-

·j+称为Ai与Bj的交互效应.于是,有ij

=+ai+

bj+cij,其中,i=1,2…,s,j=1,2…,n也就是说,随机样本Xij的均值ij,是由“总平均”,“Ai的主效应ai”,“Bj的主效应bj”,“Ai与Bj的交互效应cij”组成.式中,ijk服从N(0,2)分布,并且ijk之间相互独立.于是,从重复抽样的角度看,随机样本Xijk,可以视为其总体均值ij与随机误差ijk之和:

Xijk=+ai+

bj+cij+ijk

,其中,i=1,2…,s,j=1,2…,nk=1,2…,t,t是实验次数.称为“有交互影响的双因素(一元)模型”.处理过程:假设零假设:

H0A

:i·=

,即ai=0,i=1,2…,sH0B

:

·j=

,即bj=0,j=1,2…,nH0C

:

cij

=

ij-

ai-

bj-=0,i=1,2…,s,j=1,2…,n

备择假设:

H1A

:1·,2·

,…,s·之间不完全相同,或ai

不全等于0

H1B

:

·1,

·2

,…,

·n之间不完全相同,或bj

不全等于0H1C

:

cij

=ij-

ai

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论