第七章SPSS方差分析_第1页
第七章SPSS方差分析_第2页
第七章SPSS方差分析_第3页
第七章SPSS方差分析_第4页
第七章SPSS方差分析_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章SPSS方差分析第1页,共64页,2023年,2月20日,星期一本章内容7.1方差分析概述7.2单因素方差分析7.3多因素方差分析7.4协方差分析第2页,共64页,2023年,2月20日,星期一7.1方差分析概述7.1.1方差分析及类型

7.1.2方差分析对变量要求7.1.3方差分析的原理第3页,共64页,2023年,2月20日,星期一7.1.1方差分析及类型

方差分析(ANOVA;analysisofvariance)从观测变量的方差入手,研究一个或多个控制变量对观测变量是否有显著影响的一种分析方法。方差分析类型:单因素、多因素和协方差分析。第4页,共64页,2023年,2月20日,星期一7.1.2方差分析对变量要求一、对控制变量要求单因素方差分析:控制变量为一个定类或定序型变量。

注:控制变量的不同取值或水平,称为控制变量的不同水平。多因素方差分析:控制变量为两个或以上定类或定序型变量;协方差分析:控制变量为定类或定序型变量,协变量为定距型变量;第5页,共64页,2023年,2月20日,星期一二、对观测变量要求观测变量为定距型变量;对观测变量各总体分布要求:服从正态分布和同方差的假设。第6页,共64页,2023年,2月20日,星期一观测变量的变动来源于两部分:控制变量影响和随机因素(抽样误差)影响;如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。在观测变量各总体服从正态分布和同方差的假设之上,方差分析的问题就转化为控制变量不同水平上的观测变量均值是否存在显著差异的推断问题。7.1.3方差分析的原理第7页,共64页,2023年,2月20日,星期一概述小结方差分析作用:是比较两组及以上样本均值;分组依据:控制变量的不同水平;分析工具:分解和比较方差。第8页,共64页,2023年,2月20日,星期一7.2单因素方差分析7.2.1单因素方差分析的基本思想7.2.2单因素方差分析的基本步骤7.2.3在SPSS中的操作步骤7.2.4单因素方差分析的基本结果解读7.2.5单因素方差分析的进一步分析及操作第9页,共64页,2023年,2月20日,星期一7.2.1单因素方差分析的基本思想

1、单因素方差分析:用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。例如:研究不同学历是否对工资收入产生显著影响等。2、适应条件:一个定类或定序型变量对定距型变量的影响分析。3、明确控制变量和观测变量:第10页,共64页,2023年,2月20日,星期一4、分解观测变量方差将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表示为:

其中,SST为观测变量的总离差平方和;SSA为组间离差平方和,是由控制变量不同水平造成的观测变量的变差;SSE为组内平方和,是由抽样误差引起的观测变量的变差。第11页,共64页,2023年,2月20日,星期一其中:第12页,共64页,2023年,2月20日,星期一学历1111222222基本工资1,01484808278899848591,014989879879学历2233333333基本工资8798301,044866824824824827867867学历3444444444基本工资827938887887887867847887847867

本科专科高中初中totalN489930Mean894.50914.13863.33879.33885.83各离差平方和的计算-例题问题:学历是否对基本工资影响是否显著第13页,共64页,2023年,2月20日,星期一5、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。据此可构造F统计量来表示这种比例关系。第14页,共64页,2023年,2月20日,星期一7.2.2单因素方差分析的基本步骤提出原假设:控制变量不同水平下观测变量各总体的均值无显著差异计算检验统计量和概率P值

进行统计推断:将给定显著性水平与p值做比较,如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。

第15页,共64页,2023年,2月20日,星期一7.2.3在SPSS中的操作步骤

在利用SPSS进行单因素方差分析时,应注意数据的组织形式。SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:1、选择菜单Analyze-Comparemeans-One-WayANOVA,出现窗口第16页,共64页,2023年,2月20日,星期一2、将观测变量选择到DependentList框。3、将控制变量选择到Factor框。控制变量有几个不同的取值表示控制变量有几个水平。至此,SPSS便自动分解观测变量的方差,计算组间方差、组内方差、F统计量以及对应的概率p值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。第17页,共64页,2023年,2月20日,星期一7.2.4单因素方差分析的基本结果解读例一、请利用某企业数据,分析在该企业中学历是否对基本工资有显著影响。例子二、某企业在制订某商品的广告策略时,需要对不同广告形式的广告效果(销售额)进行了评估。请单因素方差分析方法帮助其进行分析。注意分析步骤:明确观测变量和控制变量;明确原假设;利用数据在SPSS中进行单因素方差分析,解读结果。第18页,共64页,2023年,2月20日,星期一例一结论:不同学历对基本工资影响不显著。第19页,共64页,2023年,2月20日,星期一

SumofSquaresdfMeanSquareFSig.BetweenGroups5866.08331955.36113.483.000WithinGroups20303.222140145.023

Total26169.306143

例二的ANOVA

销售额

结论:不同广告形式对销售额产生了显著影响。第20页,共64页,2023年,2月20日,星期一7.2.5单因素方差分析的进一步分析及操作一、方差齐性检验

1、方差齐次性检验:对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。

2、检验的原因:方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,

SPSS单因素方差分析中,方差齐性检验采用了方差同质性(HomogeneityofVariance)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验(即判断不同水平下,各组的平均绝对离差是否相等)。第21页,共64页,2023年,2月20日,星期一问题:如果方差不具备齐次性,能否进行方差分析?--------张文彤《spss统计分析基础教程》,p262当方差不具备齐次性时,可采用非参数检验方法检验不同组样本均值是否存在差异,或进行变量变换使其满足方差分析条件。第22页,共64页,2023年,2月20日,星期一3、方差齐次性检验的操作--设置Option选项

Option选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。其中:Homogeneityofvariancetest选项实现方差齐性检验;Descriptive选项输出观测变量的基本描述统计量;Brown-Forsythe、Welch选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是F统计量。Means

Plot选项输出各水平下观测变量均值的折线图;MissingValues框中提供了两种缺失数据的处理方式。第23页,共64页,2023年,2月20日,星期一第24页,共64页,2023年,2月20日,星期一二、多重比较检验

1、作用:判别控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显大于其它水平,哪些水平的作用是不显著的。2、原理:多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异。注意:依据方差齐次性检验结果,选择多重比较方法。

第25页,共64页,2023年,2月20日,星期一3、PostHoc选项用来实现多重比较检验提供了18种多重比较检验的方法。其中EqualVariancesAssumed框中的方法适用于各水平方差齐性的情况;EqualVariancesNotAssumed框中的方法适用于各水平方差不齐的情况。在方差分析中,由于其前提所限,应用中多采用EqualVariancesAssumed框中的方法。多重比较检验中,SPSS默认的显著性水平为0.05,可以根据实际情况修改Significancelevel后面的数值以进行调整。第26页,共64页,2023年,2月20日,星期一第27页,共64页,2023年,2月20日,星期一

SPSS提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条件下。其中:LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。第28页,共64页,2023年,2月20日,星期一三、其他检验及操作1、先验对比检验如果发现某些水平与另一些水平的均值差距显著,就可以进一步比较这两组总的均值是否存在显著差异。在检验中,SPSS根据用户确定的各均值的系数,再对其线性组合进行检验,来判断各相似性子集间均值的差异程度。2、趋势检验当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的。

第29页,共64页,2023年,2月20日,星期一3、Contrasts选项用来实现先验对比检验和趋势检验

如果进行趋势检验,则应选择Polynomial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。第30页,共64页,2023年,2月20日,星期一第31页,共64页,2023年,2月20日,星期一7.2.6单因素方差分析进一步分析应用举例例二(续1)、前面例子中已用单因素方差分析方法分析了广告形式对销售额的影响,结论是不同的广告形式对销售额有显著影响。问题:1、该例子是否满足方差分析条件?2、如果还希望知道具体是哪种广告形式影响明显呢?第32页,共64页,2023年,2月20日,星期一分析:1、方差齐性检验:不同广告形式下销售额总体方差是否相同,是否满足单因素方差分析的前提要求,是应首先检验的问题。第33页,共64页,2023年,2月20日,星期一2、多重比较检验总体上讲,不同广告形式对产品的销售额有显著影响,那么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通过多重比较检验实现。(采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)

检验结果第34页,共64页,2023年,2月20日,星期一多重比较检验分析的结论:从获得最高销售额角度来看,宣传品的效果最差,报纸、广播和体验差异不明显。第35页,共64页,2023年,2月20日,星期一3、趋势检验通过上面的分析,可以清楚地掌握不同地区的销售情况。这里,如果假定不同地区的差异表现在人口密度方面(地区编号小的人口密度高,地区编号大的人口密度低),那么进一步可分析不同地区销售额总体上是否会随着地区人口密度的减少而呈现出某种趋势性的变化规律,进而为市场细分提供依据。4、先验对比检验通过对不同广告形式的多重比较分析可知,在四种广告形式中,宣传品广告的效果是最差的,而其余三种略有差异。这里,可采用先验对比检验方法,进一步对报纸广告的效果与广播和体验的整体效果进行对比分析。第36页,共64页,2023年,2月20日,星期一练习:利用储蓄调查数据进行如下分析:不同性别的储蓄是否不同?(独立样本T检验或单因素方差分析)不同工种的储蓄是否不同?(单因素方差分析)第37页,共64页,2023年,2月20日,星期一7.3多因素方差分析7.3.1多因素方差分析的基本思想

1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合。2、观测变量方差的分解将观测变量总的离差平方和分解为:其中,SST为观测变量的总离差平方和;SSA、SSB分别为控制变量A、B独立作用引起的变差;SSAB为控制变量A、B两两交互作用引起的变差;SSE为随机因素引起的变差。第38页,共64页,2023年,2月20日,星期一其中:第39页,共64页,2023年,2月20日,星期一多因素方差分析离差平方和的分解-例题性别职称基本工资11101411101411104412889129842285912989138481382713866139381388713887248242482424824第40页,共64页,2023年,2月20日,星期一交互作用的理解A1A2B125B2710A1A2B125B273第41页,共64页,2023年,2月20日,星期一3、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果SSA所占比例较大,则说明控制变量A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由控制变量A来解释,即控制变量A给观测变量带来了显著影响。对SSB、SSAB同理。第42页,共64页,2023年,2月20日,星期一7.3.2多因素方差分析的基本步骤提出原假设:各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量交互作用对观测变量无显著影响。计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。第43页,共64页,2023年,2月20日,星期一7.3.3多因素方差分析的基本操作步骤

在利用SPSS进行多因素方差分析时,应首先将各个控制变量以及观测变量分别定义成多个SPSS变量,并组织好数据再进行分析。1、选择菜单Analyze-GeneralLinearModel-Univariate,出现主窗口。2、把观测变量指定到DependentVariable框中。3、把固定效应的控制变量指定到FixedFactor(s)框中,把随机效应的控制变量指定到RandomFactor(s)框中。至此,SPSS将自动建立多因素方差分析的饱和模型,并计算各检验统计量的观测值和对应的概率p值,并将结果显示到输出窗口中。第44页,共64页,2023年,2月20日,星期一第45页,共64页,2023年,2月20日,星期一7.3.4多因素方差分析应用举例利用某企业不同广告形式在不同地区的广告效果(销售额)进行评估的数据,通过多因素方差分析方法对广告形式、地区、广告形式和地区的交互作用给销售额的影响进行分析,进而为制订广告和地区的最优宣传组合方案提供依据。这里,以广告形式和地区为控制变量,销售额为观测变量,建立固定效应的饱和模型。零假设为:不同广告形式没有对销售额产生显著影响;不同地区的销售额没有显著差异;广告形式和地区对销售额没有产生显著的交互影响。第46页,共64页,2023年,2月20日,星期一7.3.5多因素方差分析的进一步分析1、多因素方差分析的非饱和模型

在饱和模型中,观测变量总的变差被分解为控制变量独立作用、控制变量交互作用及随机误差三部分(例:SST=SSA+SSB+SSAB+SSE)。如果研究发现,控制变量的某阶交互作用没有给观测变量产生显著影响,那么可以尝试建立非饱和模型。区别在于将饱和模型中某些部分合并到SSE中,例如两因素非饱和模型为:

SST=SSA+SSB+SSE第47页,共64页,2023年,2月20日,星期一2、均值检验

在SPSS中,利用多因素方差分析功能还能够对各个控制变量不同水平下的均值是否存在显著差异进行比较,实现方式有两种:多重比较检验(PostHoc)和对比检验(Contrast)。多重比较检验的方法与单因素方差分析类似,不再重复。对比检验采用的是单样本t检验的方法。第48页,共64页,2023年,2月20日,星期一检验值可以指定一下几种:

None:SPSS默认。不做对比分析;

Deviation:表示以观测变量的总体均值为标准,比较各水平上观测变量的均值是否有显著差异;Simple:表示以第一水平或最后一个水平上的观测变量均值为标准,比较各水平上的观测变量均值是否有显著差异;Diffeence:表示将各水平上观测变量均值与其前一个水平上的观测变量均值做比较;Helmert:表示将各水平上观测变量均值与其后一个水平上的观测变量均值做比较。第49页,共64页,2023年,2月20日,星期一3、控制变量交互作用的图形分析控制变量的交互作用可以通过图形直观分析。如果控制变量之间无交互作用,各水平对应的直线是近于平行的;如果控制变量间存在交互作用,各水平对应的直线会相互交叉。4、模型分析这里模型分析的主要任务有三个:第一,利用多因素方差分析模型计算观测变量预测值;第二,计算各种残差值,评价模型对数据的拟合程度;第三,对数据中的异常点进行诊断。第50页,共64页,2023年,2月20日,星期一7.3.6多因素方差分析中进一步分析的操作步骤1、建立非饱和模型的操作

SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击Model按钮,出现窗口:第51页,共64页,2023年,2月20日,星期一默认的选项是Fullfactorial,表示饱和模型。此时Factors&Covariates框、Model框以及BuildTerm(s)下拉框均呈不可用状态;如果选择Custom项,则表示建立非饱和模型,且Factors&Covariates框、Model框以及BuildTerm(s)下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中Interaction为交互作用;Maineffects为主效应;All2-way、All3-way等表示二阶、三阶或更高阶交互作用。第52页,共64页,2023年,2月20日,星期一2、均值比较的操作

如果通过多因素方差分析得知某控制变量的不同水平对观测变量产生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较检验方法,则单击PostHoc按钮,选择合适的多重比较检验方法。第53页,共64页,2023年,2月20日,星期一如果采用对比检验方法,则单击Contrasts按钮,默认是不进行对比检验(显示如x1(None));如果进行对比检验,可展开Contrast后的下拉框,指定对比检验的检验值,并单击Change按钮完成指定。第54页,共64页,2023年,2月20日,星期一3、控制变量交互作用图形分析的操作如果希望通过图形直观判断控制变量间是否存在交互作用,则应在主窗口单击Plots按钮。首先选择一个控制变量作为交互图形中的横轴,并将其选择到HorizontalAxis框中;其次,指定在交互图中各直线代表的是哪个控制变量的不同水平,并将其选择到SeparatedLines框中;最后,如果控制变量有三个,由于交互作用图只能反映两控制变量的交互情况,此时第三个变量只能选入SeparatePlots框中,第三个变量有几个水平便绘制出几张交互图。第55页,共64页,2023年,2月20日,星期一第56页,共64页,2023年,2月20日,星期一4、模型分析的操作

SPSS多因素方差模型建立完成后,可以在主窗口中单击Save按钮对模型进行分析,并将分析结果以变量的形式存入SPSS数据编辑窗口中。其中,PredictedValues框中的选项用来计算模型的预测值;Residuals框中的各选项用来计算各种残差;Diagnostics框实现异常值的诊断。各选项具体含义同回归分析。异常值标准:库克距离大于1;杠杆值大于2-3;第57页,共64页,2023年,2月20日,星期一7.3.7多因素方差分析进一步分析应用举例在前面的应用举例中对广告形式、地区对销售额的影响进行了多因素方差分析,建立了饱和模型。分析可知,广告形式和地区的交互作用不显著,可以进一步尝试建立非饱和模型,并进行均值比较分析、交互作用图形分析。第58页,共64页,2023年,2月20日,星期一7.4协方差分析7.4.1协方差分析的基本思想

无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对分析结论的影响。1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,从而更加准确的对控制变量进行分析。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论