版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章方差分析2/11/20231《统计学》第5章方差分析
方差分析是统计检验的一种。由英国著名统计学家:R.A.FISHER推导出来的,也叫F检验。用于分析试验数据中各个因素对试验指标值影响显著程度的一种统计方法。2/11/20232《统计学》第5章方差分析主要内容1.1方差分析的思想及基本概念1.2单因素方差分析1.3双因素方差分析2/11/20233《统计学》第5章方差分析5.1方差分析的思想及基本概念
方差分析(analysisofvariance,简记为ANOVA)的主要思想是将影响指标值的一个或几个因素取不同的水平,然后建立相应的方差分析模型,由此给出检验因素的不同水平对指标值是否有显著影响的统计分析过程。2/11/20234《统计学》第5章方差分析方差分析的基本概念
因变量(dependentvariable)
:也称为响应变量(responsevariable)或指标值,它是指在我们在研究问题中最感兴趣的测量指标。
因素(factor):也称为自变量,是指那些可能对指标值产生影响的变量。
水平(level):因素的不同取值也称为“处理”(treatment)。2/11/20235《统计学》第5章方差分析5.2单因素方差分析5.2.1单因素方差分析的数据结构
在单因素方差分析中,记因素为,其有个水平,指标值在因素的第水平上等重复的取个数值,
第个重复观测值为,
,则数据结构可写为:2/11/20236《统计学》第5章方差分析表5.1单因素方差分析数据2/11/20237《统计学》第5章方差分析5.2.2单因素方差分析的统计模型
在表5.1中,假设不同水平上观测数据相互独立,同一水平中,n个重复观测数据也相互独立,具有常数方差。描述方差分析的统计模型为:其中,表示因素表示随机误差。且
第表示观测指标值的总平均,水平上的主效应,满足约束条件。
(5.1),2/11/20238《统计学》第5章方差分析利用最小二乘估计理论,可以得到模型(5.1)参数的估计如下:其中为数据的总平均,为数据表中的行平均。2/11/20239《统计学》第5章方差分析5.2.3单因素方差分析检验过程和方差分析表因素对试验结果的影响,可以表述为
(5.2)对如下假设问题的检验,该假设的检验可以通过平方和分解得到。2/11/202310《统计学》第5章方差分析总平方和的分解组间平方和总平方和组内平方和2/11/202311《统计学》第5章方差分析
总平方和:
所有测量值之间总的变异程度,计算公式自由度2/11/202312《统计学》第5章方差分析
组间平方和:各组均数与总均数的差值的平方和,计算公式为自由度2/11/202313《统计学》第5章方差分析
组内平方和:用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为自由度2/11/202314《统计学》第5章方差分析三种“平方和”之间的关系平方和分解:2/11/202315《统计学》第5章方差分析
由于上述几种平方和的数值受到样本量和水平数的影响,一种更为科学的方法是将各部分平方和除以相应自由度,其比值称为均方和,简称均方(meansquare,MS),即上式中分母的数值为对应平方和的自由度。2/11/202316《统计学》第5章方差分析
,则拒绝零假设,即认为因素对指标值(或试验结果)有显著影响,否则认统计量的数值大于对给定置信水平,没有显著影响。为因素为了检验,定义F统计量2/11/202317《统计学》第5章方差分析α接受域
拒绝域2/11/202318《统计学》第5章方差分析将上述主要结果总结成一个表格,称为方差分析表,可以直观反映方差分析的计算及检验过程。表5.2单因素方差分析表2/11/202319《统计学》第5章方差分析
【例5.1】(方差分析,数据文件example5.0)在0.05的置信水平下,研究例5.0表的试验中咖啡因用量是否对人体神经功能有显著影响,并说明在那些水平上他们有显著差异?2/11/202320《统计学》第5章方差分析
解:用SPSS打开数据文件,选择AnalyzeComparemeansOne-wayANOVA,将因变量选入到Dependentlist中,将因素A选入到Factor中,点击进入Option对话框,
在Statistics下选择Homogeneityofvariancetest,最后点击ContinueOk,输出表5.3和表5.4两个表格。
2/11/202321《统计学》第5章方差分析表5.3咖啡因用量实验的方差一致性检验表5.4咖啡因用量实验的方差分析表输出结果2/11/202322《统计学》第5章方差分析
表5.3给出了对样本方差齐性的检验,检验的p-值(即表中的Sig.)为0.749大于置信水平0.05,因此不能拒绝方差齐性的假设,即认为各水平样本方式是常数,满足我们的假设。表5.4给出了单因素方差分析表,说明咖啡因服用量对人体神经功能有显著影响。
2/11/202323《统计学》第5章方差分析5.2.4多重比较
1、多个总体的差异性检验
事实上表5.1中不同水平的观测可以看成是来自不同总体的观测数据。假设第个总体有个样本(对应于表5.1中的第个水平的次重复观测),
他们为来自第个总体的独立样本。2/11/202324《统计学》第5章方差分析多个总体是否存在差异的假设问题可以表述为:
,而该检验当统计量的数值大于
一节的方差分析法,与(5.2)中的假设是等价的。
因此,利用上其临界值
时,我们认为
个总体存在显著差异。2/11/202325《统计学》第5章方差分析2、多重比较不拒绝H0,表示拒绝总体均值相等的证据不足
————>分析终止。拒绝H0,接受H1,表示总体均值不全相等哪两两均数之间相等?哪两两均数之间不等?
————>需要进一步作多重比较。2/11/202326《统计学》第5章方差分析一种使用比较多的是所有成对假设,形成如下的假设问题:注意到与是等价的。因此
该假设中共有个不同的成对比较。
(5.7)
2/11/202327《统计学》第5章方差分析多重比较的特点是它同时对多个成对假设进行比较。多种比较的思想有两种,一是寻找每一个成对假设的检验统计量,给出检验临界值,通过比较界定显著程度;二是使用同时置信区间(simultaneousconfidenceinterval)的概念。
多重比较有许多种方法,使用比较多的包括Fisher的LSD方法,Turkey方法,Bonferroni方法等。我们下面通过实例来说明在SPSS下如何进行多重比较。2/11/202328《统计学》第5章方差分析
【例5.2】(多重比较,数据文example5.0)在0.05的置信水平下,例5.0的试验中咖啡因用量在那些水平上有显著差异?2/11/202329《统计学》第5章方差分析
解:用SPSS打开数据文件,选择Analyze表5.5的结果。
选入到Dependentlist中,将因素A选入到Factor中,点击进入PostHoc…,进入后在EqualVarianceAssumed(假设方差齐性)下选定Turkey,LSD和Bonferroni选项,点击ContinueOk,可以得到ComparemeansOne-wayANOVA,将因变量2/11/202330《统计学》第5章方差分析表5.5咖啡因用量实验的多重比输出结果2/11/202331《统计学》第5章方差分析
这里我们选用三种方法,输出结果给出了基于这三种方法下的多重比较结果,包括研究统计量及其p-值和95%的同时置信区间。三种方法的结果是一致的。从检验统计量的p-值可以看出咖啡因剂量在0mg水平与200mg水平上有显著差异(p-值<0.05),但在0mg水平与100mg水平和100mg水平与200mg水平之间没有显著差异。从同时置信区间也可以发现,成对比较差异显著时,其对应的同时置信区间不包含0。此外0mg-200mg与200mg-0mg的比较的检验结果是一致的,但其同时置信区间的上下限要互换。2/11/202332《统计学》第5章方差分析5.3
双因素方差分析5.3.1双因素方差分析的数据结构
假设除了5.2节介绍的因素之外,还有一可能对指标产生影响。假设因素有个水平,这样因素就有组合。假设在每一个水平组合上进行相等重复数的观测,称之为等重复试验,本节主要研究等重复试验数据的双因素方差分析。双因素方差分析模型的数据结构如下:个因素和个水平2/11/202333《统计学》第5章方差分析表5.6双因素方差分析数据2/11/202334《统计学》第5章方差分析其中表示在因素的第个水平和因素的第个水平上进行的第次重复观测结果。5.3.2有可加效应的双因素方差分析1.模型结构假设不同水平上观测数据相互独立,同一水平中,n个重复观测数据也相互独立,具有
2/11/202335《统计学》第5章方差分析常数方差
效应的情况,此时双因素方差分析模型表述为:。先考虑可加效应模型,即没有交互
(5.8)其中,表示观
测指标值的总平均,
表示因素第水平上的主效应,
表示因素第水平上的主效应,
表示随机误差。
且,。2/11/202336《统计学》第5章方差分析利用最小二乘估计理论,可以得到模型(5.8)中参数的估计如下:其中2/11/202337《统计学》第5章方差分析2.方差分解
对双因素方差模型,将涉及两个因素主效应的检验。因素的显著性假设为:
而对因素,显著性假设为2/11/202338《统计学》第5章方差分析仿单因素方差分析的方法,考察总平方和可分解为:2/11/202339《统计学》第5章方差分析称为因素A的离差平方和,反映因素A对试验指标的影响。称为因素B的离差平方和,反映因素B对试验指标的影响。2/11/202340《统计学》第5章方差分析消除自由度的影响后,定义均方和如下:上式中分母的数值为对应平方和的自由度。自由度数值也满足分解等式。称为误差平方和,反映试验误差对试验指标的影响。2/11/202341《统计学》第5章方差分析为了给出假设问题和的检验过程,
定义如下两个统计量:
(5.12)
(5.13)
2/11/202342《统计学》第5章方差分析可以证明,当成立时,
当成立时,
2/11/202343《统计学》第5章方差分析时,当对给定的检验水平,拒绝,即认为因素A对指标值有显著影响。时,当拒绝,即认为因素B对指标值有显著影响。F右侧检验2/11/202344《统计学》第5章方差分析
【例5.5】(两因素可加效应模型,数据文件example5.5)有四种品牌(brand)的饮料在四个地区(district)销售,在每一个地区对每一种品牌的饮料销售量观测两次(上半年一次,下半年一次)得到数据如表5.7所示。在0.05的置信水平下,问品牌及地区对饮料的销售量是否有显著影响?
2/11/202345《统计学》第5章方差分析表5.7饮料品牌及销售数据2/11/202346《统计学》第5章方差分析解:用SPSS打开数据文件,选择AnalysisGeneralizedlinearmodel
Univariate,
将因变量选入到Dependentvariable中,
将brand和district两个因素选入到Fixedfactor中,
点击Model,然后选择Custom(这样是模型中不包括交互效应),在Buildterm中选择Maineffects,
再把brand和district
出如表5.8的结果。
选入Model,
选择Includeinterceptinmodel
,以确定模型中包含常数项,最后点击ContinueOk
,输
2/11/202347《统计学》第5章方差分析表5.8
饮料品牌及销售数据的方差分析表2/11/202348《统计学》第5章方差分析
在表5.8中,输出结果没有交互效应参数。从p-值(Sig.)可以看出,在0.05的置信水平下,brand的主效应显著,但district的主效应不显著。因此说明如果仅考虑可加模型,品牌对销售量有显著影响,但对地区没有显著影响。
2/11/202349《统计学》第5章方差分析5.3.3有交互效应的双因素方差分析
当考虑有交互效应时,双因素方差分析模型表述为:(5.14)上式中参数表示交互效应,
它满足约束条件
,1、模型结构2/11/202350《统计学》第5章方差分析其他参数的假设与模型(5.8)相同。利用最小二乘估计理论,可以得到模型(5.14)中参数的估计如下:其中。2/11/202351《统计学》第5章方差分析2.方差分解对具有交互效应的双因素方差模型中效应参数的检验,除5.3.2节中的和之外,与因素的交互效应显著性假设表述为:还涉及交互效应的假设检验。因素2/11/202352《统计学》第5章方差分析仿单因素方差分析的方法,考察总离差平方和可分解为:
SSA称为因素A的离差平方和,反映因素A对试验指标的影响。SSB称为因素B的离差平方和,反映因素B对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用A与B对试验指标的影响。SSE称为误差平方和,反映试验误差对试验指标的影响。2/11/202353《统计学》第5章方差分析其中2/11/202354《统计学》第5章方差分析类似的,均方和定义为:上式中分母的数值为对应平方和的自由度,自由度数值也满足分解等式。2/11/202355《统计学》第5章方差分析3.检验过程
对具有交互效应的双因素方差分析问题,对参数的检验分为两个步骤:第一步:首先检验交互效应,定义检验统计量:2/11/202356《统计学》第5章方差分析对给定的检验水平,即认为交互效应显著。时,拒绝当可以证明,当成立时,
。2/11/202357《统计学》第5章方差分析第二步:如果在第一步中交互效应显著,定义检验和的两个统计量分别为用类似的方法检验因素与因素的主效应是否显著。2/11/202358《统计学》第5章方差分析如果第一步中交互效应不显著,则因素与因素的主效应的检验采用5.3.1节中可加效效应模型的方法检验主效应。2/11/202359《统计学》第5章方差分析
两因素方差分析的检验过程可以通过双因素方差分析表反映出来:表5.9
双因素方差分析表2/11/202360《统计学》第5章方差分析
【例5.6】(两因素交互效应模型,数据文件example5.5)在例5.5的例子中,问品牌和地区是否存在交互效应?2/11/202361《统计学》第5章方差分析解:用SPSS打开数据文件,选择AnalysisGeneralizedlinearmodel
Univariate,
将因变量选入到Dependentvariable中,
将brand和district两个因素选入到Fixedfactor中,
点击Model,然后选择Fullfactorial(或选择Custom,在Buildterm中选择Maineffects,
再把brand和district
选入Model,再在
Buildterm
中选择Interaction,把brand和district选入Model,出现brand*district项),选择Includeinterceptinmodel,模型中包含常数项,最后点击ContinueOk
,输出如表5.10的结果。
2/11/202362《统计学》第5章方差分析表5.10
饮料品牌、地区及销售数据的方差分析表
2/11/202363《统计学》第5章方差分析
从表5.10中看出,此时有交互效应项出现,其p-值明显小于0.05,因此交互效应显著。与例5.5比较看出,在考虑了交互效应之后,brand和district均显著(无交互效应时,district不显著),因此我们可以得出结论:品牌和地区对饮料销售量有显著影响,同时不同品牌在不同地区的销售量有显著差异(即交互效应显著)。2/11/202364《统计学》第5章方差分析本章主要介绍方差分析的主要原理和方法,包括但因素方差分析和双因素方法分析。双因素方差分析分别介绍了可效应模型和交互效应模型的原理和方法。在每一种情况,介绍了方差分析的数据结构、统计模型、检验统计量和方差分析表。同时通过实例和SPSS软件的使用,使读者能将理论和应用有机的结合起来。本章的主要概念包括主效应、交互效应、因素、指标值、假设、F统计量、多重比较、方差分析表等。重点是F统计量的检验原理,方差分析表的含义及如何使用SPSS软件进行方差分析的计算和解释。本章小结2/11/202365《统计学》第5章方差分析(1)本章我们仅考虑单因素和双因素的方差分析模型,多因素也可类似处理。但当因素较多时,所有可能的水平组合大幅增大,这样将会增加试验的成本。一种通过试验设计方法,用较少量的数据(部分试验,即不是在每一个水平组合上都做试验)获得所需要的效应估计及检验结果的方法称为析因试验,它是试验设计(designofexperiment)的一个重要内容,它将涉及区组设计、正交设计等内容。有兴趣的读者可参看这方面的著作。进一步的阅读
2/11/202366《统计学》第5章方差分析(2)本章考虑的方差分析仅给出了等重复试验数据的方差分析内容,在许多观测数据中,获得的数据的重复个数不一定相等(即不同),这样的数据称之为不等重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于诚信的主题班会主持词
- 六级辅导专题-六级考试之简介
- 江苏省靖江市名校2025届高三12月阶段质量检测语文试卷及参考答案
- 《盘点程序说明会》课件
- 黄金卷05-【赢在中考·黄金8卷】备战2023年中考生物全真模拟卷(全国2024)(原卷版)
- 房屋安全管理
- 仓库人员管理
- 金融行业博士分析师聘用合同
- 旅游小镇照明规划
- 办公空间通风系统安装合同
- 智慧农业中的智能装备课件
- 烹饪中的营养学和烹饪技法
- 人音版三年级下册《剪羊毛》
- 甘肃教育出版社《四年级信息技术上册》教案新部编本完整通过版
- 超高加宽例题
- 第6章计算机文化基础(第十版)课件
- 给排水系统调试方案94503
- SSS-I双立环脉动高梯度磁选机使用说明书
- 钢管材料对照
- XX音乐厅舞台灯光调试报告
- 民用机场工程造价控制的难点浅析
评论
0/150
提交评论