




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七
章方差分析第一节方差分析的基本问题第二节
单因素方差分析第三节双因素方差分析学习目标1.理解方差分析的含义2.掌握方差分析的基本思想3.掌握单因素方差分析的步骤4.了解双因素方差分析及其应用5.掌握方差分析的EXCEL操作【例7-1】某汽车公司新推出一款新型轿车,该型轿车有黑色、银色、蓝色、白色、红色五种颜色,除颜色外,其它性能、广告、舒适度等因素全部相同。该公司为了了解此款汽车的不同颜色的销售量是否有区别,以便合理制订产品的生产与销售计划,针对性地对汽车进行加工生产及广告投入。现从经营规模相仿的七家经销商同时收集该型汽车在一个月内的销售数据,数据如表7-1所示,试分析这五种不同颜色的汽车的销售量是否有显著差异。引例表7-1五种不同颜色汽车的销售量(单位:辆)思考1.该型汽车的销售量会受到颜色的影响吗?2.不同的销售区域对销量会有影响吗?3.汽车的颜色与销售区域会产生交互作用吗?4.如何比较不同颜色汽车对销量的影响?第一节方差分析的基本问题一、方差分析的基本术语二、方差分析的基本思想三、方差分析的基本假定一、方差分析的基本术语1.方差分析
■检验多个总体均值是否相等的统计方法,称为方差分析,简称ANOVA(AnalysisofVariance)。2.自变量和因变量
■在方差分析中,涉及到两种变量:自变量和因变量。3.因素
■在方差分析中,所要检验的对象称为因素或因子。一、方差分析的基本术语4.水平
■因素的不同表现称为水平或处理。5.观测值
■每个因子水平下得到的样本数据称之为观测值。6.随机误差和系统误差
■由随机因素的影响造成的,或者说是由于抽样的随机性造成的,称之为随机误差。由系统性因素造成的,我们称之为系统误差。二、方差分析的基本思想
样本数据波动有二个来源,一个是同一因素中的不同水平造成的,另一个是由于抽选样本的随机性而产生的波动。
这两个方面产生的波动可以用两个方差来计量,一个称为水平之间的方差,即组间方差;另一个称为水平内部的方差,即组内方差。
组间方差包括系统性因素,也包括随机性因素,而组内方差仅包括随机性因素。二、方差分析的基本思想
组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。
如果不同水平对结果没有影响,则组间方差中仅仅有随机因素的差异,而没有系统性的差异,它与水平内部的组内方差就应该近似,两个方差比值接近于1。
反之,两个方差的比值就会显著地大于1,当这个比值大到某个程度,或者说达到某临界点,就可以判断出不同水平之间存在着显著性差异。二、方差分析的基本思想因素或因素间“交互作用”对观测结果的影响是否显著,关键要看组间方差与组内方差的比较结果。当然,产生方差的独立变量的个数对方差大小也有影响,独立变量个数越多,方差就有可能越大;独立变量个数越少,方差就有可能越小。为了消除独立变量个数对方差大小的影响,用方差除以独立变量个数,得到均方差(MeanSquare),作为不同来源方差比较的基础。引起方差的独立变量的个数,称为自由度。二、方差分析的基本思想
检验因子影响是否显著通常用统计量:
■统计量越大,越说明组间方差是主要方差来源,因子的影响越显著。
■统计量越小,越说明随机方差是主要的方差来源,因子的影响越不显著。第二节单因素方差分析一、单因素方差分析步骤二、单因素方差分析的应用三、用Excel进行单因素方差分析四、单因素方差分析的多重比较一、单因素方差分析步骤方差分析根据自变量的多少,可分为单因素方差分析和双因素方差分析。
■单因素方差分析:检验一个因素、不同水平(总体)的观测值是否相等。
■双因素方差分析:同时检验两个因素对观察值的影响。一、单因素方差分析步骤单因素方差分析的数据结构表7-2单因素方差分析的数据结构其中:一、单因素方差分析步骤1.提出假设
自变量对因变量没有显著影响
自变量对因变量有显著影响2.构造统计量
■1)计算误差平方和总误差平方和SST反映了离差平方和的总体情况,计算公式为
一、单因素方差分析步骤组内误差平方和SSE反映的是水平内部,或组内观察值的离散状况,计算公式为组间误差平方和SSA反映的是组间差异,计算公式为误差平方和之间满足等式:一、单因素方差分析步骤
■2)计算自由度SST是由所有观测值的波动引起的误差,但是,这里所有的n个变量并不独立,它们满足一个约束条件,真正独立的变量只有n-1个,自由度是n-1。SSA是因子在不同水平上的均值变化而产生的误差。但是,k个均值并不是独立的,它们满足一个约束条件,因此也丢失一个自由度,它的自由度是k-1。SSE是由所有的各因素观测值围绕对应水平均值波动产生的误差,它们满足的约束条件一共k个,失去了k个自由度,所以SSE的自由度是n-k。SST、SSA和SSE的自由度满足关系:一、单因素方差分析步骤
■3)计算检验统计量检验统计量的计算公式为F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设,接受备选假设。F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,没有充分证据说明待检验的因素对总体波动有显著影响。一、单因素方差分析步骤3.决策分析将统计量的值F与给定的显著性水平
的临界值F
进行比较,作出对原假设H0的决策:根据给定的显著性水平
,F分布表中查找与第一自由度df1=r-1、第二自由度df2=n-r相应的临界值F
。若F>F
,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响。若F<F
,则不能拒绝原假设H0,表明所检验的因素对观察值没有显著影响。一、单因素方差分析步骤4.方差分析表在现实生活中,为了更直观地展现计算过程,通常将有关统计量和计算过程列在一张表中,这就是方差分析表(AnalysisofVarianceTable),其一般形式如表7-3所示。表7-3单因素方差分析表的一般形式二、单因素方差分析的应用【例7-1】五种不同颜色的汽车的销售量是否有显著差异。表7-1五种不同颜色汽车的销售量(单位:辆)二、单因素方差分析的应用1.提出假设
汽车颜色对销售量没有显著影响
不全相等汽车颜色对销售量有显著影响2.构造统计量因此检验统计量的值为二、单因素方差分析的应用3.决策分析当时,查表得临界值为
可见,因此拒绝原假设,说明汽车的颜色对销售量有显著影响。为便于分析,方差分析表如表7-4所示。表7-4方差分析表二、单因素方差分析的应用4.关系强度的测量
在表7-3中,组间平方和(SSA)度量了自变量(汽车颜色)对因变量(销售量)的影响效应:只要组间平方和SSA不等于0,就表明两个变量之间有关系(只是是否显著的问题);
■当组间平方和SSA比组内平方和SSE大,且大到一定程度时,就意味着两个变量之间的关系显著,大得越多,表明它们之间的关系就越强。
■反之,小得越多,表明它们之间的关系就越弱。二、单因素方差分析的应用
通常,变量间关系的强度用自变量平方和SSA及残差平方和SSE占总平方和SST的比例大小来反映。其中,自变量平方和占总平方和的比例记为
,即
越大,代表在总变差中,能够由自变量解释的比例越大,不能解释的(残差变量)越小。其平方根就可以用来测量两个变量之间的关系强度。二、单因素方差分析的应用
在例7-1中,计算得
这表明,汽车颜色对销售量的影响效应占总效应的69.10%,而其他因素(残差变量)的影响效应占总效应的31.90%。
这表明,汽车颜色与销售量之间的关系强度为0.8313,可见,汽车颜色与销售量之间有较强的关系。三、用Excel进行单因素方差分析■第1步:选择“工具栏”中“数据”项的“数据分析”选项;■第2步:在分析工具中选择“单因素方差分析”,然后选择“确定”;■第3步:当对话框出现时在“输入区域”方框内键入数据的单元格区域(本例是B1:F8);在“分组方式”选择“列”(如果水平为行变量,则选择“行”),勾选“标志于第一行”;在“方框”内键入0.05(可根据需要确定);在“输出选项”中选择输出区域(本例选择新工作表组),如图7-1所示。三、用Excel进行单因素方差分析图7-1用Excel进行单因素方差分析的步骤三、用Excel进行单因素方差分析■第4步:点击“确定”,输出区域如图7-2所示。图7-2Excel输出的单因素方差分析结果决策判断:拒绝原假设四、单因素方差分析的多重比较1.为什么要进行多重比较?
以上检验我们能判断出这5种颜色汽车的销售量的均值是不全相同的,但并不是说5种颜色汽车销售量两两完全不同,那么究竟哪几种颜色的相同?哪几种不同?
这里就需要进行两两比较,此方法为方差分析中的多重比较。多重比较可以分别对总体的均值进行两两比较,看到底哪些总体的均值之间存在差异。
多重比较有多种方法:如Tukey检验、Bonferronit检验、Sidak检验法、LSD检验法、LSR检验法等,这里介绍最小显著差异方法,简记为LSD检验。四、单因素方差分析的多重比较2.
LSD方法的步骤:■第1步:提出假设;。();■第2步:计算检验统计量:;■第3步:计算LSD,计算公式为:其中,为分布的临界值,通过查分布表得到,其自由度为;为因素中水平的个数;和是第个样本和第个样本的容量,即观测值的个数。■第4步:根据显著性水平作出决策:如果,则拒绝原假设;如果,则不拒绝。四、单因素方差分析的多重比较3.多重比较的实例分析■第1步:提出假设四、单因素方差分析的多重比较■第2步:计算检验统计量四、单因素方差分析的多重比较■第3步:计算LSD。四、单因素方差分析的多重比较■第4步:做出决策。第三节双因素方差分析一、双因素方差分析概述二、无交互作用的双因素方差分析三、有交互作用的双因素方差分析一、双因素方差分析概述
单因素方差分析只考虑一个分类型自变量对数值型因变量的影响。在对实际问题的研究中,有时需要考虑几个因素对实验结果的影响。例如,分析影响某种产品销售量的因素时,需要考虑品牌、销售地区、价格、质量和广告策略等多个因素的影响。
当方差分析中涉及两个分类型自变量时,称为双因素方差分析(Two-wayAnalysisofVariance)。一、双因素方差分析概述■当双因素方差分析中,在获取数据时,需要将一个因素安排在“行”(Row)的位置,称为行因素,另一个因素安排在“列”(Column)的位置,称为列因素。
■双因素方差分析依据两因素之间的效应是否独立分为无交互作用的双因素方差分析和有交互作用的双因素方差分析。无交互作用的双因素方差分析,指两个因素对试验结果的影响是相互独立的;有交互作用的双因素方差分析,指两个因素的搭配会对试验数据产生一种新的影响。如,某个地区的消费者对某种汽车颜色有特殊的偏好,即“销售地区”和“颜色”结合的产生一种新效应。二、无交互作用的双因素方差分析(一)数据结构
二、无交互作用的双因素方差分析
双因素方差分析的数据结构如表7-5所示。表7-5无交互作用的双因素方差分析的数据结构二、无交互作用的双因素方差分析
二、无交互作用的双因素方差分析(二)分析步骤双因素方差分析分为三个步骤:1.提出假设2.构造检验统计量3.统计决策二、无交互作用的双因素方差分析1.提出假设二、无交互作用的双因素方差分析2.构造检验统计量二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析3.统计决策二、无交互作用的双因素方差分析4.方差分析表为便于计算,使用方差分析表,基本结构如表7-6所示。表7-6无交互作用双因素方差分析表的基本结构二、无交互作用的双因素方差分析(三)应用实例【例7-3】某汽车公司认为汽车的销售量不仅受到“颜色”单个因素的影响,还会受到其“销售地区”的影响,但假定“颜色”和“销售地区”这两个因素对汽车销售量的影响是独立的。现在,该公司对五种不同颜色的汽车在四个不同地区的销售情况进行调查,取得的数据如表7-7所示。试分析颜色和地区对汽车的销售量是否有显著的影响。()二、无交互作用的双因素方差分析表7-75种不同颜色汽车在4个不同地区的销售量数据(单位:辆)二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析表7-8方差分析表二、无交互作用的双因素方差分析关系强度的测量行平方和(行SSR)度量了销售地区这个自变量对因变量(销售量)的影响效应。列平方和(列SSC)度量了汽车颜色这个自变量对因变量(销售量)的影响效应。行列平方和加一起度量了两个自变量对因变量的联合影响效应。联合效应与总平方和的比值定义为其平方根反映了这两个自变量合起来与因变量之间的关系强度。二、无交互作用的双因素方差分析在例7-3中,因此,销售地区因素和汽车颜色因素合起来总共解释了销售量差异的84.41%,其他因素(残差变量)解释了销售量差异的15.59%。,表明销售地区因素和汽车颜色两个因素合起来与销售量之间有较强的关系。二、无交互作用的双因素方差分析(四)用Excel进行无交互作用的双因素方差分析第1步:选择“工具栏”中“数据”项的“数据分析”选项;第2步:在分析工具中选择“方差分析:无重复单因素方差分析”;第3步:当对话框出现时在“输入区域”方框内键入数据单元格区域(在本例是A1:F5);勾选“标志”复选框;在“”方框内键入0.05(可根据需要确定);在“输出选项”选择输出区域(本例选择新工作表组),如图7-3所示。二、无交互作用的双因素方差分析图7-3用Excel进行无交互作用的双因素方差分析二、无交互作用的双因素方差分析(四)用Excel进行无交互作用的双因素方差分析第4步:选择“确定”,输出结果如图7-4所示。图7-4Excel输出的无交互作用的双因素方差分析结果三、有交互作用的双因素方差分析在上面的分析中,假定两个因素对因变量的影响是独立的,但如果两个因素搭配在一起会对因变量产生一种新效应,就需要考虑交互作用对因变量的影响,这就是有交互作用的双因素方差分析。有交互作用的双因素方差分析,不仅分析两个因素自身各个独立的效应,还对两个因素的组合所产生的交互作用进行显著性检验。为了进行交互作用的显著性检验,需要对两个因素的任意组合进行多次观测,获得多项观测值,因此有交互作用的双因素方差分析又称为可重复双因素方差分析。三、有交互作用的双因素方差分析类似与无交互作用的双因素方差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于房屋租赁的协议
- 教学楼装饰工程承包合同
- 国际贸易术语解释及运用试题
- 填土工程清包工合同
- 新建筑工程施工合同
- 管道清淤疏通施工方案
- 教师参与教育资源共享情况统计表
- 钢连廊施工方案
- 专项治理施工方案
- 通信顶管施工方案
- 高中英语丨高考核心高频词汇
- 《营养均衡膳食指南》课件
- 《数智化技术应用与创新》课件 第1章 走进数智化时代
- 2025年浙江省台州机场管理有限公司招聘笔试参考题库含答案解析
- 中央2025年公安部部分直属事业单位招聘84人笔试历年参考题库附带答案详解
- 2025年江苏医药职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年常德职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2024年江西青年职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 绿色建筑材料在土木工程施工中的应用研究
- 四川省成都市高新区2024-2025学年八年级(上)期末物理试卷(含答案)
- 《智能家居系统》课件
评论
0/150
提交评论