统计学教学课件第7章方差分析_第1页
统计学教学课件第7章方差分析_第2页
统计学教学课件第7章方差分析_第3页
统计学教学课件第7章方差分析_第4页
统计学教学课件第7章方差分析_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

方差分析方差分析导论单因素方差分析双因素方差分析利用Excel进行方差分析引例某医学教授,为测试一种新安眠药的效果,将18只试验小白鼠随机等分成3组,各组分别注射不同剂量的这种安眠药,观察每只小白鼠从注射到入睡的时间,得到的数据如表7-1所示。表7-1小白鼠安眠药试验入睡时间数据表组号剂量/mg入睡时间/分钟10.521231924252321.019212018222031.5151013141115可以看出不同剂量的安眠药效果有差异,表明安眠药的剂量对入睡时间(interval)有一定的影响。同时同一剂量下的6只小白鼠的入睡时间各不相同,这表明入睡时间除了受到安眠药剂量的影响之外,还有某些偶然性因素及测量误差的影响。医学教授想检验这3组小白鼠的平均入睡时间之间的差别,以便判断安眠药在不同剂量时的治疗效果。要正确解决以上问题,就需要使用本章介绍的方差分析。第一节

方差分析导论方差分析中的几个术语方差分析的原理一、方差分析中的几个术语从本质上讲,方差分析也是一种假设检验。它通过对样本观测数据的波动性进行分析,然后分解,将某因素下各组样本数据间可能存在的系统性波动与随机波动加以分解和比较,据此推断各总体之间是否存在显著性差异,若存在显著性差异,也就说明该因素的影响是显著的。检验多个总体均值是否相等的统计方法,称为方差分析(analysisofvariance,ANOVA)。为了更好地理解方差分析的含义,我们先通过一个简单的例子说明方差分析的有关概念及方差分析所要解决的问题。【例7-1】为了比较5种班容量(每班人数分别为10人、20人、30人、40人、50人)的学习效果(以考试成绩衡量),将30个学生随机分成5组,每组6个学生,让同组的学生在班容量相同的班级学习,并相应记录下学生的考试成绩,如表7-2所示。一般而言,考试成绩越高,说明学习效果越好。要分析这5种班容量的学习效果是否存在显著性差异,实际上就是要判断班容量对学习成绩是否有显著影响,做出这种判断最终可归纳为检验这5种班容量中的学生所考成绩的均值是否相等。如果它们的均值相等,就意味着班容量对学习效果是没有影响的,也就是5种班容量的学习效果没有显著差异;如果均值不全相等,则意味着班容量对学习效果是有影响的,5种班容量的学习效果有显著差异。该例中,涉及方差分析中的几个术语。

考试成绩10人班608070701008020人班90405070706030人班70406060305040人班60404050203050人班406060305060表7-2五种班容量学生的考试成绩单位:分(1)因素。在方差分析中,所要检验的对象称为因素或因子(factor)。例7-1中,班容量是所要检验的对象,我们就把它称为因素或因子。(2)水平。因素的不同表现称为水平或处理(treatment)。例7-1中,10人班、20人班、30人班、40人班、50人班是班容量这一因素的具体表现,我们称之为水平或处理。(3)观测值。每个因素水平下得到的样本数据称为观测值。例7-1中,每一种班容量中学生的考试成绩就是观测值。由于例7-1中只涉及班容量一个因素,5种班容量就是5种水平,因此就可以称为一个单因素5水平的试验。当我们把因素的每一个水平看作是一个总体,例7-1中有5种班容量,就可以认为有5个总体。表7-2中的数据是从这5个总体中随机抽取的样本数据(各样本数据的个数可以相等,也可以不等)。在例7-1中,我们要研究班容量对学生的考试成绩是否有影响,这里的班容量就是自变量,它是一个分类型变量;考试成绩是因变量,它是一个数值型变量。因此,方差分析所要回答的问题便是:分类型自变量对数值型因变量是否有显著性影响。二、方差分析的原理(一)方差分解原理一般地,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随机影响的加总。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。

第二节

单因素方差分析单因素条件下离差平方和的分解因素作用显著性的检验单因素方差分析中的几个问题一、单因素条件下离差平方和的分解在试验中只考虑一个因素对试验结果影响显著性的方差分析称为单因素方差分析。为了检验该因素的不同水平下的均值是否有显著差异,我们可在该因素的不同水平下进行一组重复试验(或抽样),并将不同水平下的试验结果作为来自不同总体的样本,即得到了多个组别的重复试验结果。单因素方差分析的试验结果可以记为表7-3。表7-3单因素方差分析数据表次数水平12…n合计均值A1X11X12…X1nX1.A2X21X22…X2nX2.…………………ArXr1Xr2…XrnXr.合计————X..

二、因素作用显著性的检验

在开展分析时,通常利用如表7-4所示的方差分析表。表7-4单因素试验的方差分析表差异源平方和自由度均方差F统计量组间SAr-1组内SEr(n-1)—总计STnr-1——【例7-2】请对例7-1进行单因素方差分析(显著性水平α=0.05)。解:这是一个等重复的单因素试验。根据题意,设在3种剂量下的入睡时间均值为μ1、μ2、μ3。检验安眠药剂量对入睡时间是否有显著影响就是建立假设检验H0:μ1=μ2=μ3,H1:μ1,μ2,μ3不全相等。使用Excel中的单因素方差分析可以很方便地得到如表7-5所示的分析表。从表7-5中可以看出p=1.08E-06,远远小于α=0.05。所以认为安眠药剂量对入睡时间存在显著影响,应该拒绝原假设H0。差异源平方和自由度均方差F值P值F临界值剂量2912145.539.324321.08E-063.682317误差55.5153.7———总计346.517————表7-5

Excel得到的方差分析表【例7-3】现有4种不同产地的化工原料,按照同样的工艺合成一新产品,测得新产品的熔点(单位:℃)数据如表7-6所示。表7-6新产品的熔点请分析原料产地对产品熔点的影响(显著性水平α=0.05)。

重复测得新产品的熔点/℃1234产地A1124.0123.0123.5123.0A2123.0122.0——A3121.5121.0123.0—A4123.5121.0——解:这是一个不等重复的单因素试验。由题意设原料来自4个产地的产品熔点均值分别为μ1、μ2、μ3、μ4。可以建立假设检验H0:μ1=μ2=μ3=μ4,H1:μ1,μ2,μ3,μ4不全相等。由Excel软件的方差分析可以得到表7-7。表7-7

Excel得到的方差分析表由于p=0.274499,大于显著性水平α=0.05,所以认为原料产地不会对新产品的熔点产生显著影响,不能拒绝原假设H0。差异源平方和自由度均方差F值P值F临界值组间4.42992431.4766411.5953420.2744994.34683组内6.47916770.925595———总计10.9090910————三、单因素方差分析中的几个问题(1)方差分析需满足的假设条件。方差分析实质上是对各总体均值相等假设进行检验,为了得到检验统计量的精确分布,要求满足的前提条件是:①每次试验都是独立进行的;②各样本都是来自正态总体的;③各总体的方差是相等的。只有满足这些条件,方差分析的结果才是有效的。而一般地,我们总认为以上的假定条件都是满足的或近似满足的。(2)在实际问题中,各水平下的总体的试验次数可以相等也可以不等,分析过程和结论基本不变。但是当试验次数相差较大或因素较多时应该考虑采用广义线性模型分析,以消除非均衡试验设计的影响。(3)方差分析只能判断各总体的均值是否相等,而不能判断出哪个总体的均值是大还是小,这时需要在均值不等的前提下,采用多重比较法进一步比较各个均值的大小。第三节

双因素方差分析无交互作用的双因素方差分析有交互作用的双因素方差分析在实际问题中往往需要考察多个因素对试验结果的影响程度,这时就需要进行多因素试验的方差分析。多因素方差分析和单因素方差分析基本原理相同,但除了考虑因素对试验结果的影响之外,还需要考虑因素之间的相互影响,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。本章主要介绍双因素方差分析,多因素方差分析的原理和双因素方差分析相同,可以类推得到。先看下面的例题:【例7-4】有一工业产品,在两种不同用量的催化剂(P、N)作用下产量如表7-8所示。表7-8工业产品的产量这里,有两个因素N和P对产量起作用。从图7-1可以清楚看到,当P=0时和P=4时,对应的N=0和N=6的产量各不相同。

P=0P=4N=0400450N=6430560图7-1

P、N对产量的交互效应这就表明因素P的影响程度要受因素N的水平影响,即存在因素之间的交互作用。而若P=0和P=4的两条直线平行,则可以认为P、N之间不存在交互作用或者交互作用不显著。对于存在交互作用的情况,必须要在两个因素的各种水平组合下进行重复试验,并利用重复试验的平均值来估计该水平组合对试验结果的影响,以区分出试验误差和交互作用。而对于交互作用不显著的情况则没有必要重复试验。因此,双因素方差分析可以分为无交互作用的方差分析和有交互作用的方差分析。而无交互作用的方差分析无须重复试验;有交互作用的方差分析需要在不同水平组合下进行重复试验,其中又有等重复的双因素方差分析和不等重复的双因素方差分析之分。本节主要介绍无交互作用的方差分析和等重复的交互作用的方差分析。一、无交互作用的双因素方差分析A与B是待确认是否对试验结果有显著影响的两个因素,假定A、B之间无交互作用,在两个因素的各种水平组合下进行重复试验可得表7-9。表7-9无交互作用的双因素方差分析数据表

因素B均值B1B2…Bs因素AA1X11X12…X1sA2X21X22…X2s………………ArXr1Xr2…Xrs均值…

差异源平方和自由度均方差F统计量A因素SAr-1B因素SBs-1误差SE(r-1)(s-1)—总计STrs-1——【例7-5】为了给同规格的4种品牌(brand)的电视机鉴定评分,邀请了5位专家(scorer)评价,结果如表7-11所示。表7-11

4种品牌电视机的鉴定评分假设各水平搭配下总体服从正态分布且同方差,且鉴定人无法知道电视机的品牌(即鉴定人与电视机品牌无交互作用),试用方差分析检验品牌和专家是否对评分有影响(显著性水平α=0.05)。

专家B1B2B3B4B5品牌A179878A21010889A375546A486744

差异源平方和自由度均方差F值P值F临界值品牌43.2314.412.992480.0004463.4903专家11.542.8752.5939850.0899813.25916误差13.3121.108333———总计6819————

表7-13品酒师对酒的评价结果

酒型ABCD品酒师152662613536443433655334562344756558232393445利用Excel得到如表7-14所示结果。表7-14

Excel得到的双因素无交互作用的方差分析表因为品酒师因素的p值为0.16088,酒型因素的p值为0.16221,所以品酒师和酒型两个因素都对评分没有显著影响。差异源平方和自由度均方差F值P值F临界值品酒师20.7222282.59031.657780.160882.35508酒型8.7532.91671.866670.162213.00879误差37.5241.5625———总计66.9722235————二、有交互作用的双因素方差分析

表7-15有交互作用的双因素方差分析数据表

因素BB1B2…Bs因素AA1…A2………………Ar…

表7-16双因素等重复试验方差分析表差异源平方和自由度均方差F统计量A因素SAr-1B因素SBs-1交互作用SAB(r-1)(s-1)误差SErs(t-1)—总计STrst-1——【例7-7】某连锁便利店想要进行抽奖销售,为此设计了3种不同的销售点展示牌类型,同时还选择了收银台和入口处两个不同的地点摆放。试验选择了18家分店进行,每种组合随机分配了3家分店,各分店的彩票销售数量(单位:百张)如表7-17所示。表7-17各分店的彩票销售数量

单位:百张请在显著性水平α=0.025下,分析两种因素是否对彩票销售有显著影响。

展示牌类型ABC收银台旁43,39,4039,38,4357,60,49便利店入口处53,46,5158,55,5047,42,46

表7-18由Excel得到的方差分析表由表7-18可以得出结论:展示牌的位置不同对彩票销售有显著影响(p=0.0240),展示牌的类型对彩票销售没有显著影响(p=0.10912),而两个因素的交互作用对彩票销售存在显著影响(p=0.0002)。差异源平方和自由度均方差F值p值F临界值位置88.8889188.88896.666670.02404.7471类型71.4444235.72222.679170.10923.8853交互510.1112255.055619.12920.00023.8853内部1601213.3333———总计830.444417————【例7-8】一商场想要分析顾客衣着、是否携带购物袋与他们在珠宝柜台前的停留时间之间的关系(单位:秒)。每种组合随机选取了2名顾客测验,12次随机试验的结果如表7-19所示。表7-19顾客停留时间请在显著性水平(α)=0.025下,分析两种因素对停留时间的影响。

衣着不讲究的便服的衣着考究的携带购物袋是41,3924,2914,19否52,4916,1627,21

表7-20由Excel得到的方差分析表由表7-20可知,是否携带购物袋不会显著影响停留时间(p=0.1824),衣着因素显著地影响停留时间(p=0.0000),而两者的组合也会显著影响停留时间(p=0.0042)。差异源平方和自由度均方差F值p值F临界值购物袋18.75118.752.27270.18245.9874衣着1602.6672801.333397.13130.00005.1432交互258212915.63640.00425.1432内部49.568.25———总计1928.91711————第四节利用Excel进行方差分析单因素方差分析双因素方差分析一、单因素方差分析Excel中有专门的方差分析工具,可进行单因素方差分析和双因素方差分析(有交互作用或无交互作用)。【例7-9】用Excel实现例7-3的计算,操作步骤如下。(1)输入数据,如图7-2所示。(2)在“数据”选项卡的“分析”命令组中,单击“数据分析”按钮,在弹出的对话框中,选中“方差分析:单因素方差分析”,再单击“确定”,打开单因素方差分析对话框,按图7-3所示填写。图7-2单因素方差分析“输入区域”:指定待分析数据的单元格区域,该区域必须由两个或两个以上按列或行组织的相邻数据区域组成。本例输入区域是“$A$2:$E$5”,注意不要填写为“$A$1:$E$5”,即不要将产品熔点序号所在的行包括在内。“分组方式”:这里“组”的含义与方差分析恒等式的组间/内方差中“组”的含义是相同的,对于本例来讲,四个产地的抽样数据是按行存放的,因而分组方式选择“行”。图7-3单因素方差分析对话框“标志位于第一行/列”:如果输入区域的第一行中包含标志项,请选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,请选中“标志位于第一列”复选框;如果输入区域没有标志项,则该复选框不会被选中,Excel将在输出表中生成适宜的数据标志。“α”:在此输入计算F统计临界值检验的显著水平。(3)单击“确定”按钮,即可得到方差分析的结果。输出结果包括两个部分:第一部分是每一组数据的观察值个数,总和、平均和方差(略);第二部分是方差分析表,如表7-7所示。二、双因素方差分析【例7-10】无交互作用的双因素方差分析。用Excel实现例7-5的检验过程。操作步骤如下。(1)输入数据,如图7-4所示。图7-4无交互作用双因素方差分析(2)打开“方差分析:无重复双因素分析”对话框,按图7-4所示填写

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论