第8章-方差分析课件_第1页
第8章-方差分析课件_第2页
第8章-方差分析课件_第3页
第8章-方差分析课件_第4页
第8章-方差分析课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章方差分析§8.1方差分析的基本原理§8.2单因素方差分析§8.3双因素方差分析第8章方差分析§8.1方差分析的基本原理18.1方差分析的基本原理

8.1.1什么是方差分析?

8.1.2误差分解

8.1.3方差分析的基本假定8.1方差分析的基本原理8.1.1什么是方2什么是方差分析(ANOVA)?

(analysisofvariance)检验多个总体均值是否相等;通过分析观测数据的误差来判断各总体均值是否相等;用方差来衡量误差的大小。研究分类型自变量对数值型因变量的影响;一个或多个分类自变量2个或多个(k个)处理水平或分类一个数值型因变量有单因素方差分析和双因素方差分析;单因素方差分析:一个分类自变量双因素方差分析:两个分类自变量什么是方差分析(ANOVA)?

(analysisofv32014-12-16什么是方差分析?

(例题分析)【例8-1】确定超市的位置和竞争者的数量对销售额是否有显著影响,获得的年销售额数据(单位:万元)如下表:因素水平或处理样本数据2014-12-16什么是方差分析?

(例题分析)【例42014-12-16什么是方差分析?

(例题分析)分析“超市位置”和“竞争者数量”对销售额的影响;如果只分析超市位置或只分析竞争者数量一个因素对销售额的影响,则称为单因素方差分析(one-wayanalysisofvariance);如果只分析超市位置和竞争者数量两个因素对销售额的单独影响,但不考虑它们对销售额的交互效应(interaction),则称为只考虑主效应的双因素方差分析;如果除了考虑超市位置和竞争者数量两个因素对销售额的单独影响外,还考虑二者对销售额的交互效应,则称为考虑交互效应的双因素方差分析。2014-12-16什么是方差分析?

(例题分析)分析“超58.1.2误差分解8.1方差分析的基本原理8.1.2误差分解8.1方差分析的基本原理62014-12-16方差分析的基本原理

(误差分解)总误差(totalerror):反映全部观测数据的误差;所抽取的全部36家超市的销售额之间差异;组间误差(between-grouperror)—处理误差(treatmenterror):由于不同处理造成的误差,它反映了处理(超市位置)对观测数据(销售额)的影响,也叫做系统误差;组内误差(within-grouperror)

—随机误差(randomerror):由于随机因素造成的误差,也简称为误差(error);2014-12-16方差分析的基本原理

(误差分解)总误差(72014-12-16方差分析的基本原理

(误差分解)数据的误差可以用平方和(sumofsquares)来表示,常简记为SS;总平方和,记为SST;反映全部数据总误差大小的平方和;抽取的全部36家超市销售额之间的误差平方和组间平方和,记为SSA;反映系统误差(处理误差)大小的平方和;也称为处理平方和(treatmentsumofsquares)组内平方和,记为SSE;反映随机误差大小的平方和;也称为误差平方和(sumofsquaresoferror)2014-12-16方差分析的基本原理

(误差分解)数据的误82014-12-16方差分析的基本原理

(误差分解)误差平方和的分解及其关系总误差总平方和(SST)系统误差随机误差组间平方和(SSA)组内平方和(SSE)==++2014-12-16方差分析的基本原理

(误差分解)总误差总2014-12-16方差分析的基本原理

(误差分析)方差分析的基本原理,就是要分析数据的总误差中有没有系统误差。如果超市的不同位置对销售额没有显著影响,意味着没有系统误差。这时,每种处理所对应的总体均值(i)应该相等。如果存在系统误差,每种处理所对应的总体均值(i)至少有一对不相等;就例8-1而言,在只考虑超市位置一个因素的情况下,方差分析也就是要检验下面的假设:H0:123

H1:1,2,3

不全相等2014-12-16方差分析的基本原理

(误差分析)方差分析10方差分析的基本原理

(方差比较)若不同位置对销售额没有影响,则组间方差中只包含随机误差,没有系统误差。这时,组间方差与组内方差经过平均后的数值就应该很接近,它们的比值就会接近1;若不同位置对销售额有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差平均后的数值就会大于组内方差平均后的数值,它们之间的比值就会大于1;当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响;方差分析的基本原理

(方差比较)若不同位置对销售额没有影响,112014-12-16方差分析的基本假定正态性(normality)。每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;在例8-1中,要求每个位置超市的销售额必须服从正态分布;检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图等;方差齐性(homogeneityvariance)。各个总体的方差必须相同,对于分类变量的每个水平,有12=22=…=k2;在例8-1中,要求不同位置超市的销售额的方差都相同;独立性(independence)。每个样本数据是来自因素各水平的独立样本(该假定不满足对结果影响较大);在例8-1中,3个样本数据是来自不同位置超市的3个独立样本;2014-12-16方差分析的基本假定正态性(normali12单因素方差分析的数学模型设因素A有k种处理(比如超市位置有“居民区”、“商业区”、“写字楼”3种),单因素方差分析可用下面的线性模型来表示:设总均值为,第i个处理的效应可以用第i个处理的均值与总均值的差表示,记为i,即i=i-;这样,第i个处理均值被分解成i=i+,方差分析模型可以改写为:单因素方差分析的数学模型设因素A有k种处理(比如超市位置有“13§8.2单因素方差分析8.2.1数据结构8.2.2分析步骤8.2.3关系强度的测量8.2.4方差分析中的多重比较§8.2单因素方差分析8.2.1数据结构14单因素方差分析的数据结构

(one-wayanalysisofvariance)

观测值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11x21…

xk1x12x22…

xk2::::::::x1n

x2n…

xkn单因素方差分析的数据结构

(one-wayanalysis15提出假设一般提法:H0:m1=m2=…=

mk自变量对因变量没有显著影响;H1:m1

,m2

,…

,mk不全相等自变量对因变量有显著影响;要注意的是:若拒绝原假设,只是表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。提出假设一般提法:16构造检验的统计量构造统计量需要计算:各个水平的均值;全部观测值的总均值;各个离差平方和;各个均方(MS,即方差)。构造检验的统计量构造统计量需要计算:17构造检验的统计量

(计算水平的均值)假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观测值总和除以观测值的个数;计算公式为式中:ni为第i个总体的样本观测值个数

xij为第i个总体的第j个观测值

构造检验的统计量

(计算水平的均值)假定从第i个总体中抽取一18构造检验的统计量

(计算全部观测值的总均值)全部观测值的总和除以观测值的总个数;计算公式为构造检验的统计量

(计算全部观测值的总均值)全部观测值的总和19构造检验的统计量

(计算总离差平方和SST)全部观测值与总平均值的离差平方和;反映全部观测值的离散状况;其计算公式为:构造检验的统计量

(计算总离差平方和SST)全部观测值20构造检验的统计量

(计算组间平方和SSA)各组平均值与总平均值的离差平方和;反映各总体的样本均值之间的差异程度,又称水平项平方和;该平方和既包括随机误差,也包括系统误差;计算公式为:构造检验的统计量

(计算组间平方和SSA)各组平均值21构造检验的统计量

(计算组内平方和SSE)每个水平或组的各样本数据与其组平均值的离差平方和;反映每个样本各观测值的离散状况,又称误差项平方和(或残差平方和);该平方和反映的是随机误差的大小;计算公式为:构造检验的统计量

(计算组内平方和SSE)每个水平或组的各22构造检验的统计量

(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系:SST=SSA+SSE构造检验的统计量

(三个平方和的关系)总离差平方和(SST23构造检验的统计量

(计算均方MS)各误差平方和的大小与观测值的多少有关,为消除观测值多少对误差平方和大小的影响,需要将其平均,这就是均方,即方差;计算方法是用误差平方和除以相应的自由度;三个平方和对应的自由度分别是:SST的自由度为n-1,其中n为全部观测值的个数;SSA的自由度为k-1,其中k为因素水平的个数;SSE的自由度为n-k;构造检验的统计量

(计算均方MS)各误差平方和的大小与观测值24构造检验的统计量

(计算均方MS)

组间方差:SSA的均方,记为MSA,计算公式为:

组内方差:SSE的均方,记为MSE,计算公式为:构造检验的统计量

(计算均方MS)组间方差:SSA的均方25构造检验的统计量

(计算检验统计量F)将MSA和MSE进行对比,即得到所需要的检验统计量F;当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即:构造检验的统计量

(计算检验统计量F)将MSA和MSE进26构造检验的统计量

(F分布与拒绝域)aF分布F(k-1,n-k)0拒绝H0不拒绝H0F构造检验的统计量

(F分布与拒绝域)aF分布F(k-27单因素方差分析结果

(基本结构)单因素方差分析结果

(基本结构)282014-12-16单因素方差分析

(例题分析)拒绝H02014-12-16单因素方差分析

(例题分析)拒绝H029Spss方差分析预处理分析之前需要将原始数据进行调整;将超市位置作为一个单独的变量,作为spss是一列;并对其取值居民区、商业区、写字楼分别进行赋值编码;保证超市位置的变量类型为数值,度量尺度为名义。Spss方差分析预处理分析之前需要将原始数据进行调整;302014-12-16用SPSS进行方差分析选择【分析-比较均值】,并选择【单因素方差分析ANOVA】;将因变量选入因变量列表框,将影响因素选入因子列表框;点确定;另,使用教材介绍的GLM分析方法;2014-12-16用SPSS进行方差分析选择【分析-比较均312014-12-16用SPSS进行方差分析

(均值图)2014-12-16用SPSS进行方差分析

(均值图)32关系强度的测量

拒绝原假设表明因素(自变量)与观测值之间有关系;组间平方和(SSA)度量了自变量对因变量的影响效应;实际上,只要组间平方和SSA不等于0,就表明两个变量之间有关系(只是是否显著的问题);当组间平方和(SSA)比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著;反之,就意味着两个变量之间的关系不显著。关系强度的测量拒绝原假设表明因素(自变量)与观测值之间有关33关系强度的测量

变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映;自变量平方和占总平方和的比例记为R2,即:其平方根R也可以用来测量两个变量之间的关系强度。关系强度的测量变量间关系的强度用自变量平方和(SSA)及残34方差分析中的多重比较

(multiplecomparisonprocedures)通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异;可采用Fisher提出的最小显著性差异方法,简写为LSD;

LSD是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正,即用MSE代替两个总体的方差计算得到的。方差分析中的多重比较

(multiplecompariso35方差分析中的多重比较

(步骤)提出假设H0:mi=mj(第i个总体的均值等于第j个总体的均值)H1:mi

mj(第i个总体的均值不等于第j个总体的均值)计算检验的统计量:

计算LSD:决策:若,拒绝H0;若

,不拒绝H0方差分析中的多重比较

(步骤)提出假设362014-12-16多重比较的LSD方法

(例题分析)第1步:提出假设检验1:检验2:检验3:第2步:计算检验统计量检验1:检验2:检验3:2014-12-16多重比较的LSD方法

(例题分析)第1步372014-12-16多重比较的LSD方法

(例题分析)第3步:计算LSD第4步:做出决策不拒绝H0,没有证据表明居民区和商业区的超市销售额之间有显著差异;拒绝H0,居民区和写字楼的超市销售额之间有显著差异;拒绝H0,商业区和写字楼的超市销售额之间有显著差异;2014-12-16多重比较的LSD方法

(例题分析)第3步382014-12-16用SPSS进行多重比较【例8-3】多重比较2014-12-16用SPSS进行多重比较【例8-3】多重比39§8.3双因素方差分析8.3.1双因素方差分析及其类型8.3.2无交互作用的双因素方差分析8.3.3有交互作用的双因素方差分析§8.3双因素方差分析8.3.1双因素方差分析及其类型40双因素方差分析

(two-wayanalysisofvariance)

分析两个因素(行因素Row和列因素Column)对试验结果的影响;如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析(Two-factorwithoutreplication);如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析

(Two-factorwithreplication);双因素方差分析

(two-wayanalysisofv41双因素方差分析的基本假定每个总体都服从正态分布;对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本各个总体的方差必须相同;对于各组观测数据,是从具有相同方差的总体中抽取的观测值是独立的;双因素方差分析的基本假定每个总体都服从正态分布;422014-12-16双因素方差分析

(数学模型)设因素A有I种处理(比如超市位置有“居民区”、“商业区”、“写字楼”3种处理),因素B有J种处理(比如竞争者数量有0个、1个、2个、3个及以上4种处理),双因素方差分析可用下面的线性模型来表示:ij≠02014-12-16双因素方差分析

(数学模型)设因素A有I43无交互作用双因素方差分析

(例题分析)不同品牌的彩电在各地区的销售量数据品牌因素地区因素地区1地区2地区3地区4地区5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有四个品牌的彩电在五个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05)无交互作用双因素方差分析

(例题分析)不同品牌的彩电在各44数据结构

数据结构45数据结构

是行因素的第i个水平下各观测值的平均值;是列因素的第j个水平下的各观测值的均值;是全部kr个样本数据的总平均值;数据结构是行因素的第i个水平下各观测值的平均46分析步骤

(提出假设)提出假设;对行因素提出的假设为:H0:m1=m2

=

…=mi=…=

mk(mi为第i个水平的均值)H1:mi

(i=1,2,…,k)不全相等对列因素提出的假设为:H0:m1=m2

=

…=mj=…=

mr(mj为第j个水平的均值)H1:mj

(j=1,2,…,r)不全相等分析步骤

(提出假设)提出假设;47分析步骤

(构造检验的统计量)计算平方和(SS);总误差平方和:行因素误差平方和:列因素误差平方和:随机误差项平方和:分析步骤

(构造检验的统计量)计算平方和(SS);48分析步骤

(构造检验的统计量)

总离差平方和(SST)、水平项离差平方和(SSR和SSC)、误差项离差平方和(SSE)之间的关系:SST=SSR+SSC+SSE分析步骤

(构造检验的统计量)总离差平方和(SST)49分析步骤

(构造检验的统计量)计算均方(MS);各个离差平方和除以相应的自由度;三个平方和的自由度分别是:总离差平方和SST的自由度为kr-1;行因素的离差平方和SSR的自由度为k-1;列因素的离差平方和SSC的自由度为r-1;随机误差平方和SSE的自由度为(k-1)(r-1);

分析步骤

(构造检验的统计量)计算均方(MS);50分析步骤

(构造检验的统计量)计算均方(MS);行因素的均方,记为MSR,计算公式为:列因素的均方,记为MSC

,计算公式为:随机误差项的均方,记为MSE

,计算公式为:分析步骤

(构造检验的统计量)计算均方(MS);51分析步骤

(构造检验的统计量)

计算检验统计量(F);检验行因素的统计量:检验列因素的统计量:分析步骤

(构造检验的统计量)计算检验统计量(F);52分析步骤

(统计决策)将统计量的值F与给定的显著性水平的临界值F进行比较,作出决策;根据给定的显著性水平在F分布表中查找相应的临界值F

;若FR>F,则拒绝原假设H0

,表明均值之间的差异是显著的,即所检验的行因素对观测值有显著影响;若FC>F,则拒绝原假设H0

,表明均值之间有显著差异,即所检验的列因素对观测值有显著影响;分析步骤

(统计决策)将统计量的值F与给定的显著性水平53双因素方差分析结果

(基本结构)双因素方差分析结果

(基本结构)54双因素方差分析

(例题分析)提出假设;对品牌因素提出的假设为:H0:m1=m2=m3=m4(品牌对销售量没有影响)H1:mi

(i=1,2,…,4)不全相等(品牌对销售量有影响)对地区因素提出的假设为:H0:m1=m2=m3=m4=m5(地区对销售量没有影响)H1:mj

(j=1,2,…,5)不全相等(地区对销售量有影响)双因素方差分析

(例题分析)提出假设;55双因素方差分析

(例题分析)

结论:

FR=18.10777>F=3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;

FC=2.100846<F=3.2592,不拒绝原假设H0,不能认为销售地区对彩电的销售量有显著影响。双因素方差分析

(例题分析)结论:562014-12-16双因素方差分析

在用SPSS中进行双因素方差分析时,需要把多个样本的观测值作为一个变量输入,然后把两个因素分表单列,并与相应的销售额对应;第1步:选择【分析】,并选择【广义线性模型-广义线性模型】进入主对话框;第2步:在模型标签下默认选线性,在响应标签下将因变量选入【因变量】框中,在预测标签中将影响因素选入【因子】框中,在模型标签将两个因子选入模型窗口,需要考虑交互作用时,选上交叉项;第3步:其他标签默认,点击确定;

2014-12-16双因素方差分析

在用SPSS中进行双因素57双因素方差分析

(关系强度的测量)行平方和(行SS)度量了品牌这个自变量对因变量(销售量)的影响效应;列平方和(列SS)度量了地区这个自变量对因变量(销售量)的影响效应;这两个平方和加在一起则度量了两个自变量对因变量的联合效应;联合效应与总平方和的比值定义为R2:其平方根R反映了这两个自变量合起来与因变量之间的关系强度。双因素方差分析

(关系强度的测量)行平方和(行SS)度量了品58双因素方差分析

(关系强度的测量)例题分析:品牌因素和地区因素合起来总共解释了销售量差异的83.94%;其他因素(残差变量)只解释了销售量差异的16.06%;R=0.9162,表明品牌和地区两个因素合起来与销售量之间有较强的相关关系。双因素方差分析

(关系强度的测量)例题分析:592014-12-16有交互作用双因素方差分析

(例题分析)【例8-1】确定超市的位置和竞争者的数量对销售额是否有显著影响:2014-12-16有交互作用双因素方差分析

(例题分析)【60有交互作用双因素方差分析

(例题分析)【例】城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时间(分钟)的数据,如下表。试分析路

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论