统计学(第二版) 费宇第5章方差分析_第1页
统计学(第二版) 费宇第5章方差分析_第2页
统计学(第二版) 费宇第5章方差分析_第3页
统计学(第二版) 费宇第5章方差分析_第4页
统计学(第二版) 费宇第5章方差分析_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学主编:费宇,石磊第二版第五章方差分析2023/1/5《统计学》第5章方差分析5-3

方差分析是统计检验的一种。由英国著名统计学家:R.A.FISHER推导出来的,也叫F检验。用于分析试验数据中各个因素对试验指标值影响显著程度的一种统计方法。2023/1/5《统计学》第5章方差分析5-4主要内容5.1方差分析的思想及基本概念5.2单因素方差分析5.3双因素方差分析2023/1/5《统计学》第5章方差分析5-55.1方差分析的思想及基本概念

方差分析(analysisofvariance,简记为ANOVA)的主要思想是将影响指标值的一个或几个因素取不同的水平,然后建立相应的方差分析模型,由此给出检验因素的不同水平对指标值是否有显著影响的统计分析过程。2023/1/5《统计学》第5章方差分析5-6方差分析的基本概念

因变量(dependentvariable)

:也称为响应变量(responsevariable)或指标值,它是指在我们在研究问题中最感兴趣的测量指标。

因素(factor):也称为自变量,是指那些可能对指标值产生影响的变量。

水平(level):因素的不同取值也称为“处理”

(treatment)。2023/1/5《统计学》第5章方差分析5-7方差分析的基本假设方差分析中有3个基本假设假设1:每一个总体都应该服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。假设2:各个总体的方差都相等。也就是说,对于每一个水平下的观察数据,是从具有相同方差的正态总体抽取的。假设3:从每一个总体中抽取的样本是相互独立的,即各个观测值之间是相互独立的。2023/1/5《统计学》第5章方差分析5-85.2单因素方差分析5.2.1单因素方差分析的数据结构

在单因素方差分析中,记因素为,其有个水平,指标值在因素的第水平上等重复的取个数值,

第个重复观测值为,

,则数据结构可写为:2023/1/5《统计学》第5章方差分析5-9表5.1单因素方差分析数据2023/1/5《统计学》第5章方差分析5-105.2.2单因素方差分析的统计模型

在表5.1中,假设不同水平上观测数据相互独立,同一水平中,n个重复观测数据也相互独立,具有常数方差。描述方差分析的统计模型为:其中,表示因素表示随机误差。且

第表示观测指标值的总平均,水平上的主效应,满足约束条件。

(5.1),2023/1/5《统计学》第5章方差分析5-11

利用最小二乘估计理论,可以得到模型(5.1)参数的估计如下:其中为数据的总平均,为数据表中的行平均。2023/1/5《统计学》第5章方差分析5-125.2.3单因素方差分析检验过程和方差分析表因素对试验结果的影响,可以表述为

(5.2)对如下假设问题的检验,该假设的检验可以通过平方和分解得到。2023/1/5《统计学》第5章方差分析5-13总平方和的分解组间平方和总平方和组内平方和2023/1/5《统计学》第5章方差分析5-14

总平方和:

所有测量值之间总的变异程度,计算公式自由度2023/1/5《统计学》第5章方差分析5-15

组间平方和:各组均数与总均数的差值的平方和,计算公式为自由度2023/1/5《统计学》第5章方差分析5-16

组内平方和:用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为自由度2023/1/5《统计学》第5章方差分析5-17三种“平方和”之间的关系平方和分解:2023/1/5《统计学》第5章方差分析5-18

由于上述几种平方和的数值受到样本量和水平数的影响,一种更为科学的方法是将各部分平方和除以相应自由度,其比值称为均方和,简称均方(meansquare,MS),即上式中分母的数值为对应平方和的自由度。2023/1/5《统计学》第5章方差分析5-19

,则拒绝零假设,即认为因素对指标值(或试验结果)有显著影响,否则认统计量的数值大于对给定置信水平,没有显著影响。为因素为了检验,定义F统计量2023/1/5《统计学》第5章方差分析5-20α接受域

拒绝域2023/1/5《统计学》第5章方差分析5-21

将上述主要结果总结成一个表格,称为方差分析表,可以直观反映方差分析的计算及检验过程。表5.2单因素方差分析表2023/1/5《统计学》第5章方差分析5-22

【例5.1】(方差分析,数据文件example5.0)在0.05的置信水平下,研究例5.0表的试验中咖啡因用量是否对人体神经功能有显著影响,并说明在那些水平上他们有显著差异?2023/1/5《统计学》第5章方差分析5-23

解:用SPSS打开数据文件,选择“分析”“比较均值”“单因素方差分析”,将因变量选入到“因变量列表”中,将因素A选入到“因素”中,点击进入“选项”对话框,在“统计量”下选择“方差同质性检验”,最后点击“继续”“确定”,输出表5.3和表5.4两个表格。

2023/1/5《统计学》第5章方差分析5-24表5.3咖啡因用量实验的方差一致性检验表5.4咖啡因用量实验的方差分析表输出结果方差齐性检验Levene统计量df1df2显著性.292227.749单因素方差分析平方和df均方F显著性组间61.400230.7006.181.006组内134.100274.967

总数195.500292023/1/5《统计学》第5章方差分析5-25

表5.3给出了对样本方差齐性的检验,检验的p-值(即表中的Sig.)为0.749大于置信水平0.05,因此不能拒绝方差齐性的假设,即认为各水平样本方式是常数,满足我们的假设。表5.4给出了单因素方差分析表,说明咖啡因服用量对人体神经功能有显著影响。

2023/1/5《统计学》第5章方差分析5-265.2.4多重比较

1、多个总体的差异性检验

事实上表5.1中不同水平的观测可以看成是来自不同总体的观测数据。假设第个总体有个样本(对应于表5.1中的第个水平的次重复观测),

他们为来自第个总体的独立样本。2023/1/5《统计学》第5章方差分析5-27多个总体是否存在差异的假设问题可以表述为:

,而该检验当统计量的数值大于

一节的方差分析法,与(5.2)中的假设是等价的。

因此,利用上其临界值

时,我们认为

个总体存在显著差异。2023/1/5《统计学》第5章方差分析5-282、多重比较不拒绝H0,表示拒绝总体均值相等的证据不足

————>分析终止。拒绝H0,接受H1,表示总体均值不全相等哪两两均数之间相等?哪两两均数之间不等?

————>需要进一步作多重比较。2023/1/5《统计学》第5章方差分析5-29

一种使用比较多的是所有成对假设,形成如下的假设问题:注意到与是等价的。因此

该假设中共有个不同的成对比较。

(5.7)

2023/1/5《统计学》第5章方差分析5-30

多重比较的特点是它同时对多个成对假设进行比较。多种比较的思想有两种,一是寻找每一个成对假设的检验统计量,给出检验临界值,通过比较界定显著程度;二是使用同时置信区间(simultaneousconfidenceinterval)的概念。

多重比较有许多种方法,使用比较多的包括Fisher的LSD方法,Turkey方法,Bonferroni方法等。我们下面通过实例来说明在SPSS下如何进行多重比较。2023/1/5《统计学》第5章方差分析5-31

【例5.2】(多重比较,数据文example5.0)在0.05的置信水平下,例5.0的试验中咖啡因用量在那些水平上有显著差异?2023/1/5《统计学》第5章方差分析5-32

解:用SPSS打开数据文件,选择“分析”表5.5的结果。

选入到“因变量列表”中,将因素A选入到“因素”中,点击进入“两两比较”,进入后在“假设方差齐性”下选定Turkey,LSD和Bonferroni选项,点击“继续”

“确定”,可以得到“比较均值”“单因素ANOVA”,将因变量2023/1/5《统计学》第5章方差分析5-33表5.5咖啡因用量实验的多重比输出结果多重比较(I)A(J)A均值差

(I-J)标准误显著性95%置信区间下限上限TukeyHSD0100-1.60000.99666.261-4.0711.8711200-3.50000*.99666.004-5.9711-1.028910001.60000.99666.261-.87114.0711200-1.90000.99666.156-4.3711.571120003.50000*.99666.0041.02895.97111001.90000.99666.156-.57114.3711LSD0100-1.60000.99666.120-3.6450.4450200-3.50000*.99666.002-5.5450-1.455010001.60000.99666.120-.44503.6450200-1.90000.99666.067-3.9450.145020003.50000*.99666.0021.45505.54501001.90000.99666.067-.14503.9450Bonferroni0100-1.60000.99666.360-4.1439.9439200-3.50000*.99666.005-6.0439-.956110001.60000.99666.360-.94394.1439200-1.90000.99666.202-4.4439.643920003.50000*.99666.005.95616.04391001.90000.99666.202-.64394.4439*.均值差的显著性水平为

0.05。2023/1/5《统计学》第5章方差分析5-34

这里我们选用三种方法,输出结果给出了基于这三种方法下的多重比较结果,包括研究统计量及其p-值和95%的同时置信区间。三种方法的结果是一致的。从检验统计量的p-值可以看出咖啡因剂量在0mg水平与200mg水平上有显著差异(p-值<0.05),但在0mg水平与100mg水平和100mg水平与200mg水平之间没有显著差异。从同时置信区间也可以发现,成对比较差异显著时,其对应的同时置信区间不包含0。此外0mg-200mg与200mg-0mg的比较的检验结果是一致的,但其同时置信区间的上下限要互换。2023/1/5《统计学》第5章方差分析5-355.3

双因素方差分析5.3.1双因素方差分析的数据结构

假设除了5.2节介绍的因素之外,还有一可能对指标产生影响。假设因素有个水平,这样因素就有组合。假设在每一个水平组合上进行相等重复数的观测,称之为等重复试验,本节主要研究等重复试验数据的双因素方差分析。双因素方差分析模型的数据结构如下:个因素和个水平2023/1/5《统计学》第5章方差分析5-36表5.6双因素方差分析数据2023/1/5《统计学》第5章方差分析5-37其中表示在因素的第个水平和因素的第个水平上进行的第次重复观测结果。5.3.2有可加效应的双因素方差分析1.模型结构

假设不同水平上观测数据相互独立,同一水平中,n个重复观测数据也相互独立,具有

2023/1/5《统计学》第5章方差分析5-38常数方差

效应的情况,此时双因素方差分析模型表述为:。先考虑可加效应模型,即没有交互

(5.8)其中,表示观

测指标值的总平均,

表示因素第水平上的主效应,

表示因素第水平上的主效应,

表示随机误差。

且,。2023/1/5《统计学》第5章方差分析5-39

利用最小二乘估计理论,可以得到模型(5.8)中参数的估计如下:其中2023/1/5《统计学》第5章方差分析5-402.方差分解

对双因素方差模型,将涉及两个因素主效应的检验。因素的显著性假设为:

而对因素,显著性假设为2023/1/5《统计学》第5章方差分析5-41仿单因素方差分析的方法,考察总平方和可分解为:2023/1/5《统计学》第5章方差分析5-42称为因素A的离差平方和,反映因素A对试验指标的影响。称为因素B的离差平方和,反映因素B对试验指标的影响。2023/1/5《统计学》第5章方差分析5-43消除自由度的影响后,定义均方和如下:上式中分母的数值为对应平方和的自由度。自由度数值也满足分解等式。称为误差平方和,反映试验误差对试验指标的影响。2023/1/5《统计学》第5章方差分析5-44为了给出假设问题和的检验过程,

定义如下两个统计量:

(5.12)

(5.13)

2023/1/5《统计学》第5章方差分析5-45可以证明,当成立时,

当成立时,

2023/1/5《统计学》第5章方差分析5-46时,当对给定的检验水平,拒绝,即认为因素A对指标值有显著影响。时,当拒绝,即认为因素B对指标值有显著影响。F右侧检验2023/1/5《统计学》第5章方差分析5-47表5.7有可加效应的双因素方差分析表2023/1/5《统计学》第5章方差分析5-48

【例5.5】(两因素可加效应模型,数据文件example5.5)有四种品牌(brand)的饮料在四个地区(district)销售,在每一个地区对每一种品牌的饮料销售量观测两次(上半年一次,下半年一次)得到数据如表5.7所示。在0.05的置信水平下,问品牌及地区对饮料的销售量是否有显著影响?

2023/1/5《统计学》第5章方差分析5-49表5.8饮料品牌及销售数据2023/1/5《统计学》第5章方差分析5-50解:用SPSS打开数据文件,选择“分析”“一般线性模型”

“单变量”,

将因变量选入到“因变量”中,

将brand和district两个因素选入到“固定因子”中,

点击“模型”,然后选择“设定”(这样是模型中不包括交互效应),在“构建项”中选择“主效应”,

再把brand和district

出如表5.8的结果。

选入“模型”,

选择“在模型中包含截距”,以确定模型中包含常数项,最后点击“继续”“确定”

,输

2023/1/5《统计学》第5章方差分析5-51表5.9

饮料品牌及销售数据的方差分析表2023/1/5《统计学》第5章方差分析5-52

在表5.8中,输出结果没有交互效应参数。从p-值(Sig.)可以看出,在0.05的置信水平下,brand的主效应显著,但district的主效应不显著。因此说明如果仅考虑可加模型,品牌对销售量有显著影响,但对地区没有显著影响。

2023/1/5《统计学》第5章方差分析5-535.3.3有交互效应的双因素方差分析

当考虑有交互效应时,双因素方差分析模型表述为:(5.14)上式中参数表示交互效应,

它满足约束条件

,1、模型结构2023/1/5《统计学》第5章方差分析5-54其他参数的假设与模型(5.8)相同。利用最小二乘估计理论,可以得到模型(5.14)中参数的估计如下:其中。2023/1/5《统计学》第5章方差分析5-552.方差分解对具有交互效应的双因素方差模型中效应参数的检验,除5.3.2节中的和之外,与因素的交互效应显著性假设表述为:还涉及交互效应的假设检验。因素2023/1/5《统计学》第5章方差分析5-56仿单因素方差分析的方法,考察总离差平方和可分解为:

SSA称为因素A的离差平方和,反映因素A对试验指标的影响。SSB称为因素B的离差平方和,反映因素B对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用A与B对试验指标的影响。SSE称为误差平方和,反映试验误差对试验指标的影响。2023/1/5《统计学》第5章方差分析5-57其中2023/1/5《统计学》第5章方差分析5-58类似的,均方和定义为:上式中分母的数值为对应平方和的自由度,自由度数值也满足分解等式。2023/1/5《统计学》第5章方差分析5-593.检验过程

对具有交互效应的双因素方差分析问题,对参数的检验分为两个步骤:第一步:首先检验交互效应,定义检验统计量:2023/1/5《统计学》第5章方差分析5-60对给定的检验水平,即认为交互效应显著。时,拒绝当可以证明,当成立时,

。2023/1/5《统计学》第5章方差分析5-61第二步:如果在第一步中交互效应显著,定义检验和的两个统计量分别为用类似的方法检验因素与因素的主效应是否显著。2023/1/5《统计学》第5章方差分析5-62如果第一步中交互效应不显著,则因素与因素的主效应的检验采用5.3.1节中可加效效应模型的方法检验主效应。2023/1/5《统计学》第5章方差分析5-63

两因素方差分析的检验过程可以通过双因素方差分析表反映出来:表5.10

有交互效应的双因素方差分析表2023/1/5《统计学》第5章方差分析5-64

【例5.6】(两因素交互效应模型,数据文件example5.5)在例5.5的例子中,问品牌和地区是否存在交互效应?2023/1/5《统计学》第5章方差分析5-65解:用SPSS打开数据文件,选择“分析”“一般线性模型”

“因变量”,

将因变量选入到“因变量”中,

将brand和district两个因素选入到“固定因子”中,

点击“模型”,然后选择“全因子”(或选择“设定”,在“构建项”中选择“主效应”,

再把brand和district

选入“模型”,再在

“构建项”中选择“交互”,把brand和district选入“模型”,出现brand*district项),选择“在模型中包含截距”,模型中包含常数项,最后点击“继续”“确定”

,输出如表5.10的结果。

2023/1/5《统计学》第5章方差分析5-66表5.11

饮料品牌、地区及销售数据的方差分析表

2023/1/5《统计学》第5章方差分析5-67

从表5.10中看出,此时有交互效应项出现,其p-值明显小于0.05,因此交互效应显著。与例5.5比较看出,在考虑了交互效应之后,brand和district均显著(无交互效应时,district不显著),因此我们可以得出结论:品牌和地区对饮料销售量有显著影响,同时不同品牌在不同地区的销售量有显著差异(即交互效应显著)。2023/1/5《统计学》第5章方差分析5-68本章主要介绍方差分析的主要原理和方法,包括但因素方差分析和双因素方法分析。双因素方差分析分别介绍了可效应模型和交互效应模型的原理和方法。在每一种情况,介绍了方差分析的数据结构、统计模型、检验统计量和方差分析表。同时通过实例和SPSS软件的使用,使读者能将理论和应用有机的结合起来。本章的主要概念包括主效应、交互效应、因素、指标值、假设、F统计量、多重比较、方差分析表等。重点是F统计量的检验原理,方差分析表的含义及如何使用SPSS软件进行方差分析的计算和解释。本章小结2023/1/5《统计学》第5章方差分析5-69

(1)本章我们仅考虑单因素和双因素的方差分析模型,多因素也可类似处理。但当因素较多时,所有可能的水平组合大幅增大,这样将会增加试验的成本。一种通过试验设计方法,用较少量的数据(部分试验,即不是在每一个水平组合上都做试验)获得所需要的效应估计及检验结果的方法称为析因试验,它是试验设计(designofexperiment)的一个重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论