第七章 SPSS方差分析1_第1页
第七章 SPSS方差分析1_第2页
第七章 SPSS方差分析1_第3页
第七章 SPSS方差分析1_第4页
第七章 SPSS方差分析1_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章第七章SPSS方差分析方差分析本章内容本章内容7.1 方差分析概述方差分析概述7.2 单因素方差分析单因素方差分析7.3 多因素方差分析多因素方差分析7.4 协方差分析协方差分析7.1方差分析概述方差分析概述7.1.1 7.1.1 方差分析及类型方差分析及类型 7.1.2 7.1.2 方差分析对变量要求方差分析对变量要求7.1.3 7.1.3 方差分析的原理方差分析的原理7.1.17.1.1方差分析及类型方差分析及类型 方差分析方差分析( ANOVA ;analysis of variance)从观测变量的方差入手,研究一个或多个控制变量对观测变量是否有显著影响的一种分析方法。方差分析类

2、型:方差分析类型:单因素、多因素和协方差分析。 7.1.27.1.2方差分析对变量要求方差分析对变量要求一、对控制变量要求一、对控制变量要求单因素方差分析:单因素方差分析:控制变量为一个定类或定序型变量。 注:控制变量的不同取值或水平,称为控制变量注:控制变量的不同取值或水平,称为控制变量的不同水平。的不同水平。多因素方差分析:多因素方差分析:控制变量为两个或以上定类或定序型变量;协方差分析:协方差分析:控制变量为定类或定序型变量,协变量为定距型变量;二、对观测变量要求二、对观测变量要求观测变量为定距型变量;观测变量为定距型变量;对观测变量各总体分布要求对观测变量各总体分布要求:服从正态分布和

3、同方差的假设。观测变量的变动来源于两部分:控制变量影响和随观测变量的变动来源于两部分:控制变量影响和随机因素(抽样误差)影响;机因素(抽样误差)影响;如果控制变量的不同水平对观测变量产生了显著影如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的就不明显,其变动可以归结为随机变量影响造成的。在观测变

4、量各总体服从正态分布和同方差的假设之在观测变量各总体服从正态分布和同方差的假设之上,方差分析的问题就转化为控制变量不同水平上上,方差分析的问题就转化为控制变量不同水平上的观测变量均值是否存在显著差异的推断问题。的观测变量均值是否存在显著差异的推断问题。7.1.3 7.1.3 方差分析的原理方差分析的原理概述小结概述小结方差分析作用:是比较两组及以上样本方差分析作用:是比较两组及以上样本均值;均值;分组依据:控制变量的不同水平;分组依据:控制变量的不同水平;分析工具:分解和比较方差。分析工具:分解和比较方差。7.2 单因素方差分析单因素方差分析7.2.17.2.1单因素方差分析的基本思想单因素方

5、差分析的基本思想7.2.2 7.2.2 单因素方差分析的基本步骤单因素方差分析的基本步骤7.2.3 7.2.3 在在SPSSSPSS中的操作步骤中的操作步骤7.2.4 7.2.4 单因素方差分析的基本结果解读单因素方差分析的基本结果解读7.2.5 7.2.5 单因素方差分析的进一步分单因素方差分析的进一步分析及操作析及操作7.2.17.2.1单因素方差分析的基本思想单因素方差分析的基本思想 l1 1、单因素方差分析:、单因素方差分析:用来研究一个控制变量用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。的不同水平是否对观测变量产生了显著影响。例如:研究不同学历是否对工资收入产生显著影

6、响等。l2 2、适应条件:、适应条件:一个定类或定序型变量对定距一个定类或定序型变量对定距型变量的影响分析。型变量的影响分析。l3 3、明确控制变量和观测变量:、明确控制变量和观测变量:4 4、分解观测变量方差、分解观测变量方差 将观测变量总的离差平方和分解为组间离将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别差平方和和组内离差平方和两部分,分别表示为:表示为: 其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和; SSA SSA为组间离差平方和,是由控制变量不同水为组间离差平方和,是由控制变量不同水 平造成的观测变量的变差;平造成的观测变量的

7、变差; SSE SSE为组内平方和,是由抽样误差引起的观测为组内平方和,是由抽样误差引起的观测 变量的变差。变量的变差。其中:其中:学历学历1 11 11 11 12 22 22 22 22 22 2基本工资基本工资1,0141,014848084808278278898899849848598591,0141,014989989879879879879学历学历2 22 23 33 33 33 33 33 33 33 3基本工资基本工资8798798308301,0441,044866866824824824824824824827827867867867867学历学历3 34 44 44 4

8、4 44 44 44 44 44 4基本工资基本工资827827938938887887887887887887867867847847887887847847867867本科本科专科专科高中高中初中初中totalN4 8 9 9 30 Mean894.50 914.13 863.33 879.33 885.83 各离差平方和的计算-例题问题:学历是否对基本工资影响是否显著5 5、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果组间离差平方在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于和所占比例

9、较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。据此可构造制变量给观测变量带来了显著影响。据此可构造F F统统计量来表示这种比例关系。计量来表示这种比例关系。7.2.2 7.2.2 单因素方差分析的基本步骤单因素方差分析的基本步骤提出原假设:提出原假设:控制变量不同水平下观测变量各总控制变量不同水平下观测变量各总体的均值无显著差异体的均值无显著差异计算检验统计量和概率计算检验统计量和概率P P值值 l进行统计推断:将给定显著性水平与进行统计推断:将给定显著性水平与p p值做比较值做比

10、较,如果如果p p值小于显著性水平,则应该拒绝原假设值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,反之就不能拒绝原假设。 7.2.3 7.2.3 在在SPSSSPSS中的操作步骤中的操作步骤 在利用在利用SPSS进行单因素方差分析时,应注意数据的组织形式。进行单因素方差分析时,应注意数据的组织形式。SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:如下:1、选择菜单、选择菜单AnalyzeCompare meansOne-Way ANOVA,出现窗口,出现窗口2、将观测变量选择到、将观

11、测变量选择到Dependent List框。框。3、将控制变量选择到、将控制变量选择到Factor框。控制变量有几个不同的取值框。控制变量有几个不同的取值表示控制变量有几个水平。表示控制变量有几个水平。 至此,至此,SPSS便自动分解观测变量的方差,计算组间方便自动分解观测变量的方差,计算组间方差、组内方差、差、组内方差、F统计量以及对应的概率统计量以及对应的概率p值,完成单因素值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。方差分析的相关计算,并将结果显示到输出窗口中。7.2.4 7.2.4 单因素方差分析的基本结果解读单因素方差分析的基本结果解读例一、请利用某企业数据,分析在该

12、企业中学历是否对基本工例一、请利用某企业数据,分析在该企业中学历是否对基本工资有显著影响。资有显著影响。例子二、某企业在制订某商品的广告策略时,需要对不同广告例子二、某企业在制订某商品的广告策略时,需要对不同广告形式的广告效果(销售额)进行了评估。请单因素方差分形式的广告效果(销售额)进行了评估。请单因素方差分析方法帮助其进行分析。析方法帮助其进行分析。注意分析步骤:注意分析步骤:明确观测变量和控制变量;明确观测变量和控制变量;明确原假设;明确原假设;利用数据在利用数据在SPSS中进行单因素方差分析,解读结果。中进行单因素方差分析,解读结果。A AN NO OV VA A基本工资11640.2

13、9233880.097.996.410101337.9263897.611112978.229Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.例一例一结论:不同学历对基本工资影响不显著。结论:不同学历对基本工资影响不显著。 Sum of SquaresdfMean SquareFSig.Between Groups5866.08331955.36113.483.000Within Groups20303.222140145.023 Total26169.306143 例二的例二的ANOVA 销售额销售额 结论:不同广

14、告形式对销售额产生了显著影响。结论:不同广告形式对销售额产生了显著影响。7.2.5 7.2.5 单因素方差分析的进一步分析及操单因素方差分析的进一步分析及操作作一一、方差齐性检验、方差齐性检验 1 1、方差齐次性检验:、方差齐次性检验:对控制变量不同水平下各观测变量不对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。同总体方差是否相等进行分析。 2 2、检验的原因:、检验的原因:方差分析的前提是各水平下的总体服从正方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,态分布并且方差相等,因此有必要对方差齐性进行检验, SPSS单因素方差分析中,方差齐性

15、检验采用了方差同质性(单因素方差分析中,方差齐性检验采用了方差同质性(Homogeneity of Variance)的检验方法,其零假设是各水平下观)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同测变量总体方差无显著性差异,实现思路同SPSS两独立样本两独立样本t检验中的检验中的方差齐性检验方差齐性检验(即判断不同水平下,各组的平均绝对离差是否相等(即判断不同水平下,各组的平均绝对离差是否相等)。 问题:问题: 如果方差不具备齐次性,能否进行方差分析?如果方差不具备齐次性,能否进行方差分析?-张文彤spss统计分析基础教程,p262当方差不具备齐次性时,可采用非参数检

16、验方法检当方差不具备齐次性时,可采用非参数检验方法检验不同组样本均值是否存在差异,或进行变量变换验不同组样本均值是否存在差异,或进行变量变换使其满足方差分析条件。使其满足方差分析条件。3 3、方差齐次性检验的操作、方差齐次性检验的操作设置设置OptionOption选项选项 Option选项用来对方差分析的前提条件进行检验,选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。其中:并可输出其他相关统计量和对缺失数据进行处理。其中:Homogeneity of variance test选项实现方差齐性检验;选项实现方差齐性检验;Descriptive选项输出观测变

17、量的基本描述统计量;选项输出观测变量的基本描述统计量;Brown-Forsythe、Welch选项可计算其统计量以检验各组选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是计量而不是F统计量统计量。Means Plot选项输出各水平下观测变量均值的折线图;选项输出各水平下观测变量均值的折线图;Missing Values框中提供了两种缺失数据的处理方式。框中提供了两种缺失数据的处理方式。二、多重比较检验二、多重比较检验 1、作用:、作用:判别控制变量的不同水平对观测变量的影响判别控制变量的不同水平对观测变量

18、的影响程度如何,其中哪个水平的作用明显大于其它水平,程度如何,其中哪个水平的作用明显大于其它水平,哪些水平的作用是不显著的。哪些水平的作用是不显著的。2、原理:、原理:多重比较检验就是分别对每个水平下的观测多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异。著差异。其零假设是相应组的均值之间无显著差异。注意:注意:依据方差齐次性检验结果,选择多重比较方法。依据方差齐次性检验结果,选择多重比较方法。 3、Post Hoc选项用来实现多重比较检验选项用来实现多重比较检验 提供

19、了提供了18种多重比较检验的方法。其中种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性框中的方法适用于各水平方差齐性的情况;的情况; Equal Variances Not Assumed框中的方法适框中的方法适用于各水平方差不齐的情况。在方差分析中,由于其前提用于各水平方差不齐的情况。在方差分析中,由于其前提所限,应用中多采用所限,应用中多采用Equal Variances Assumed框中的框中的方法。多重比较检验中,方法。多重比较检验中,SPSS默认的显著性水平为默认的显著性水平为0.05,可以根据实际情况修改,可以根据实际情况修改

20、Significance level后面的数值后面的数值以进行调整。以进行调整。 SPSS提供的多重比较检验的方法比较多,有些方法适提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条用在各总体方差相等的条件下,有些适用在方差不相等的条件下。其中:件下。其中: LSD方法适用于各总体方差相等的情况,特点是比较方法适用于各总体方差相等的情况,特点是比较灵敏;灵敏; Tukey方法和方法和S-N-K方法适用于各水平下观测变量个方法适用于各水平下观测变量个数相等的情况;数相等的情况; Scheffe方法比方法比Tukey方法不灵敏。方法不灵敏。三、其他检验及

21、操作三、其他检验及操作1、先验对比检验、先验对比检验 如果发现某些水平与另一些水平的均值差距显如果发现某些水平与另一些水平的均值差距显著,就可以进一步比较这两组总的均值是否存在显著,就可以进一步比较这两组总的均值是否存在显著差异。在检验中,著差异。在检验中,SPSS根据用户确定的各均值的根据用户确定的各均值的系数,再对其线性组合进行检验,来判断各相似性系数,再对其线性组合进行检验,来判断各相似性子集间均值的差异程度。子集间均值的差异程度。2、趋势检验、趋势检验 当控制变量为定序变量时,趋势检验能够分析当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体随着控制变

22、量水平的变化,观测变量值变化的总体趋势是怎样的。趋势是怎样的。 3、Contrasts选项用来实现先验对比检验和趋势检验选项用来实现先验对比检验和趋势检验 如果进行趋势检验,则应选择如果进行趋势检验,则应选择Polynomial选项,然后在选项,然后在后面的下拉框中选择趋势检验的方法。其中后面的下拉框中选择趋势检验的方法。其中Linear表示线性表示线性趋势检验;趋势检验;Quadratic表示进行二次多项式检验;表示进行二次多项式检验;Cubic表表示进行三次多项式检验,示进行三次多项式检验,4th和和5th表示进行四次和五次多项表示进行四次和五次多项式检验。式检验。 如果进行先验对比检验,

23、则应在如果进行先验对比检验,则应在Coefficients后依次输后依次输入系数入系数ci,并确保,并确保ci0。应注意系数输入的顺序,它将分。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。别与控制变量的水平值相对应。7.2.6 7.2.6 单因素方差分析进一步分析应用举单因素方差分析进一步分析应用举例例例二(续例二(续1)、前面例子中已用单因素方差)、前面例子中已用单因素方差分析方法分析了广告形式对销售额的影响分析方法分析了广告形式对销售额的影响,结论是不同的广告形式对销售额有显著,结论是不同的广告形式对销售额有显著影响。问题:影响。问题:1、该例子是否满足方差分析条件?、该例子是

24、否满足方差分析条件?2、如果还希望知道具体是哪种广告形式影、如果还希望知道具体是哪种广告形式影响明显呢?响明显呢?分析:分析:1、方差齐性检验:不同广告形式下销售额总体方差、方差齐性检验:不同广告形式下销售额总体方差是否相同,是否满足单因素方差分析的前提要求,是否相同,是否满足单因素方差分析的前提要求,是应首先检验的问题。是应首先检验的问题。T Te es st t o of f H Ho om mo og ge en ne ei it ty y o of f V Va ar ri ia an nc ce es s销售额.7653140.515LeveneStatisticdf1df2Sig.

25、2、多重比较检验、多重比较检验 总体上讲,不同广告形式对产品的销售额有总体上讲,不同广告形式对产品的销售额有显著影响,那么究竟哪种广告形式的作用较明显显著影响,那么究竟哪种广告形式的作用较明显哪种不明显,这些问题可通过多重比较检验实现哪种不明显,这些问题可通过多重比较检验实现。(采用。(采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)五种方法) 检验结果检验结果 多重比较检验分析的结论:多重比较检验分析的结论: 从获得最高销售额角度来看,宣传从获得最高销售额角度来看,宣传品的效果最差,报纸、广播和体验差异品的效果最差,报纸、广播和体验差异不明显。不明显。3、趋

26、势检验、趋势检验 通过上面的分析,可以清楚地掌握不同地区的销售情况通过上面的分析,可以清楚地掌握不同地区的销售情况。这里,如果假定不同地区的差异表现在人口密度方面(地。这里,如果假定不同地区的差异表现在人口密度方面(地区编号小的人口密度高,地区编号大的人口密度低),那么区编号小的人口密度高,地区编号大的人口密度低),那么进一步可分析不同地区销售额总体上是否会随着地区人口密进一步可分析不同地区销售额总体上是否会随着地区人口密度的减少而呈现出某种趋势性的变化规律,进而为市场细分度的减少而呈现出某种趋势性的变化规律,进而为市场细分提供依据。提供依据。4、先验对比检验、先验对比检验 通过对不同广告形式

27、的多重比较分析可知,在四种广告通过对不同广告形式的多重比较分析可知,在四种广告形式中,宣传品广告的效果是最差的,而其余三种略有差异形式中,宣传品广告的效果是最差的,而其余三种略有差异。这里,可采用先验对比检验方法,进一步对报纸广告的效。这里,可采用先验对比检验方法,进一步对报纸广告的效果与广播和体验的整体效果进行对比分析。果与广播和体验的整体效果进行对比分析。练习:练习:利用储蓄调查数据进行如下分析:利用储蓄调查数据进行如下分析:不同性别的储蓄是否不同?(独立样本不同性别的储蓄是否不同?(独立样本T检验或检验或单因素方差分析)单因素方差分析)不同工种的储蓄是否不同?不同工种的储蓄是否不同? (

28、单因素方差分析)(单因素方差分析)7.3 多因素方差分析多因素方差分析7.3.17.3.1多因素方差分析的基本思想多因素方差分析的基本思想 1 1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产变量产生显

29、著影响。例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合。的最优组合。2 2、观测变量方差的分解、观测变量方差的分解 将观测变量总的离差平方和分解为:将观测变量总的离差平方和分解为: 其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA、SSBSSB分别为控制变量分别为控制变量A A、B B独立作用引起的变差;独立作用引起的变差;SSABSSAB为控制变量为控制变量A A、B B两两交互作用引起的变差两两交互作用引起的变差;

30、SSESSE为随机因素引起的变差。为随机因素引起的变差。其中:其中:多因素方差分析离差平方和的分解-例题性别性别职称职称基本工资基本工资1 11 1101410141 11 1101410141 11 1104410441 12 28898891 12 29849842 22 28598591 12 29899891 13 38488481 13 38278271 13 38668661 13 39389381 13 38878871 13 38878872 24 48248242 24 48248242 24 4824824性别 男职工1024.00954.00875.50.932.25基本

31、工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotal性别 女职工.859.00.824.00832.75基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotalTotal1024.00930.25875.50824.00907.38基本工资Mean高级工程师Mean工程师Mean助理工程师Mean无技术职称职称MeanTotal交互作用的理解交互作用的理解A1A2B125B2710A1A2B125B2733 3、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中

32、,如果在观测变量总离差平方和中,如果SSASSA所占比例较大,则说明控制变所占比例较大,则说明控制变量量A A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由控制变量控制变量A A来解释,即控制变量来解释,即控制变量A A给观测变量带来了显著影响。对给观测变量带来了显著影响。对SSBSSB、SSABSSAB同理。同理。7.3.2 7.3.2 多因素方差分析的基本步骤多因素方差分析的基本步骤提出原假设:各控制变量不同水平下观测变量各总体的均值提出原假设:各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量交互作用对观

33、测变量无显著影响。无显著差异,控制变量交互作用对观测变量无显著影响。计算检验统计量和概率计算检验统计量和概率P P值值l给定显著性水平与给定显著性水平与p p值做比较:如果值做比较:如果p p值小于显著性水平,则值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。应该拒绝原假设,反之就不能拒绝原假设。 7.3.3 多因素方差分析的基本操作步骤多因素方差分析的基本操作步骤 在利用在利用SPSS进行多因素方差分析时,应首先将各个进行多因素方差分析时,应首先将各个控制变量以及观测变量分别定义成多个控制变量以及观测变量分别定义成多个SPSS变量,并组变量,并组织好数据再进行分析。织好数据再进行分

34、析。1、选择菜单、选择菜单AnalyzeGeneral Linear ModelUnivariate,出现主窗口。,出现主窗口。2、把观测变量指定到、把观测变量指定到Dependent Variable框中。框中。3、把固定效应的控制变量指定到、把固定效应的控制变量指定到Fixed Factor(s)框中,把框中,把随机效应的控制变量指定到随机效应的控制变量指定到Random Factor(s)框中。框中。 至此,至此,SPSS将自动建立多因素方差分析的饱和模型将自动建立多因素方差分析的饱和模型,并计算各检验统计量的观测值和对应的概率,并计算各检验统计量的观测值和对应的概率p值,并将值,并将结

35、果显示到输出窗口中。结果显示到输出窗口中。7.3.4 多因素方差分析应用举例多因素方差分析应用举例 利用某企业不同广告形式在不同地区的广告效果(销利用某企业不同广告形式在不同地区的广告效果(销售额)进行评估的数据,通过多因素方差分析方法对广告售额)进行评估的数据,通过多因素方差分析方法对广告形式、地区、广告形式和地区的交互作用给销售额的影响形式、地区、广告形式和地区的交互作用给销售额的影响进行分析,进而为制订广告和地区的最优宣传组合方案提进行分析,进而为制订广告和地区的最优宣传组合方案提供依据。供依据。 这里,以广告形式和地区为控制变量,销售额为观测这里,以广告形式和地区为控制变量,销售额为观

36、测变量,建立固定效应的饱和模型。零假设为:不同广告形变量,建立固定效应的饱和模型。零假设为:不同广告形式没有对销售额产生显著影响;不同地区的销售额没有显式没有对销售额产生显著影响;不同地区的销售额没有显著差异;广告形式和地区对销售额没有产生显著的交互影著差异;广告形式和地区对销售额没有产生显著的交互影响。响。7.3.5 多因素方差分析的进一步分析多因素方差分析的进一步分析1、多因素方差分析的非饱和模型、多因素方差分析的非饱和模型 在饱和模型中,观测变量总的变差被分解为在饱和模型中,观测变量总的变差被分解为控制变量独立作用、控制变量交互作用及随机误控制变量独立作用、控制变量交互作用及随机误差三部

37、分(例:差三部分(例:SST=SSA+SSB+SSAB+SSE) 。如果研究。如果研究发现,控制变量的某阶交互作用没有给观测变量发现,控制变量的某阶交互作用没有给观测变量产生显著影响,那么可以尝试建立非饱和模型。产生显著影响,那么可以尝试建立非饱和模型。区别在于将饱和模型中某些部分合并到区别在于将饱和模型中某些部分合并到SSE中,中,例如两因素非饱和模型为:例如两因素非饱和模型为: SST=SSA+SSB+SSE2、均值检验、均值检验 在在SPSS中,利用多因素方差分析功能还能够中,利用多因素方差分析功能还能够对各个控制变量不同水平下的均值是否存在显著差对各个控制变量不同水平下的均值是否存在显

38、著差异进行比较,实现方式有两种:多重比较检验(异进行比较,实现方式有两种:多重比较检验(Post Hoc)和对比检验()和对比检验(Contrast)。多重比)。多重比较检验的方法与单因素方差分析类似,不再重复。较检验的方法与单因素方差分析类似,不再重复。对比检验采用的是单样本对比检验采用的是单样本t检验的方法。检验的方法。检验值可以指定一下几种:检验值可以指定一下几种: None:SPSS默认。不做对比分析;默认。不做对比分析; Deviation:表示以观测变量的总体均值为标准,比较各水:表示以观测变量的总体均值为标准,比较各水平上观测变量的均值是否有显著差异;平上观测变量的均值是否有显著

39、差异; Simple:表示以第一水平或最后一个水平上的观测变量均:表示以第一水平或最后一个水平上的观测变量均值为标准,比较各水平上的观测变量均值是否有显著差异;值为标准,比较各水平上的观测变量均值是否有显著差异; Diffeence:表示将各水平上观测变量均值与其前一个水平:表示将各水平上观测变量均值与其前一个水平上的观测变量均值做比较;上的观测变量均值做比较; Helmert:表示将各水平上观测变量均值与其后一个水平:表示将各水平上观测变量均值与其后一个水平上的观测变量均值做比较。上的观测变量均值做比较。3、控制变量交互作用的图形分析、控制变量交互作用的图形分析 控制变量的交互作用可以通过图

40、形直观分析。如果控制变量的交互作用可以通过图形直观分析。如果控制变量之间无交互作用,各水平对应的直线是近于平控制变量之间无交互作用,各水平对应的直线是近于平行的;如果控制变量间存在交互作用,各水平对应的直行的;如果控制变量间存在交互作用,各水平对应的直线会相互交叉。线会相互交叉。4、模型分析、模型分析 这里模型分析的主要任务有三个:第一,利用多因这里模型分析的主要任务有三个:第一,利用多因素方差分析模型计算观测变量预测值;第二,计算各种素方差分析模型计算观测变量预测值;第二,计算各种残差值,评价模型对数据的拟合程度;第三,对数据中残差值,评价模型对数据的拟合程度;第三,对数据中的异常点进行诊断

41、。的异常点进行诊断。7.3.6 多因素方差分析中进一步分析的操作步骤多因素方差分析中进一步分析的操作步骤1、建立非饱和模型的操作、建立非饱和模型的操作 SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击饱和模型,则应在主窗口中单击Model按钮,出现窗口:按钮,出现窗口: 默认的选项是默认的选项是Full factorial,表示饱和模型。此时,表示饱和模型。此时Factors & Covariates框、框、Model框以及框以及Build Term(s)下拉框均呈不可用状态;如果选择下拉框均呈不可用状

42、态;如果选择Custom项,则表示建项,则表示建立非饱和模型,且立非饱和模型,且Factors & Covariates框、框、Model框以及框以及Build Term(s)下拉框均变为可用状态。此时便下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中可自定义非饱和模型中的数据项。其中Interaction为交为交互作用;互作用;Main effects为主效应;为主效应;All 2-way、All 3-way等表示二阶、三阶或更高阶交互作用。等表示二阶、三阶或更高阶交互作用。2、均值比较的操作、均值比较的操作 如果通过多因素方差分析得知某控制变量的不同水平对观测变量产如果通过多

43、因素方差分析得知某控制变量的不同水平对观测变量产生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较生显著影响,进一步可对各水平间的均值进行比较。如果采用多重比较检验方法,则单击检验方法,则单击Post Hoc按钮,选择合适的多重比较检验方法。按钮,选择合适的多重比较检验方法。 如果采用对比检验方法,则单击如果采用对比检验方法,则单击Contrasts按钮,默认按钮,默认是不进行对比检验(显示如是不进行对比检验(显示如x1(None);如果进行对比);如果进行对比检验,可展开检验,可展开Contrast后的下拉框,指定对比检验的检验后的下拉框,指定对比检验的检验值,并单击值,并单击C

44、hange按钮完成指定。按钮完成指定。3、控制变量交互作用图形分析的操作、控制变量交互作用图形分析的操作 如果希望通过图形直观判断控制变量间是否存在交互如果希望通过图形直观判断控制变量间是否存在交互作用,则应在主窗口单击作用,则应在主窗口单击Plots按钮。按钮。 首先选择一个控制变量作为交互图形中的横轴,并将其选首先选择一个控制变量作为交互图形中的横轴,并将其选择到择到Horizontal Axis框中;框中; 其次,指定在交互图中各直线代表的是哪个控制变量的不其次,指定在交互图中各直线代表的是哪个控制变量的不同水平,并将其选择到同水平,并将其选择到Separated Lines框中;框中;

45、 最后,如果控制变量有三个,由于交互作用图只能反映两最后,如果控制变量有三个,由于交互作用图只能反映两控制变量的交互情况,此时第三个变量只能选入控制变量的交互情况,此时第三个变量只能选入Separate Plots框中,第三个变量有几个水平便绘制出框中,第三个变量有几个水平便绘制出几张交互图。几张交互图。4、模型分析的操作、模型分析的操作 SPSS多因素方差模型建立完成后,可以在主窗口中单击多因素方差模型建立完成后,可以在主窗口中单击Save按钮对模型进行分析,并将分析结果以变量的形式存入按钮对模型进行分析,并将分析结果以变量的形式存入SPSS数据编辑窗口中。其中,数据编辑窗口中。其中,Pre

46、dicted Values框中的选项用来框中的选项用来计算模型的预测值;计算模型的预测值;Residuals框中的各选项用来计算各种残差;框中的各选项用来计算各种残差;Diagnostics框实现异常值的诊断。各选项具体含义同回归分析。框实现异常值的诊断。各选项具体含义同回归分析。异常值标准:异常值标准:库克距离大于库克距离大于1;杠杆值大于杠杆值大于23;7.3.7 多因素方差分析进一步分析应用举例多因素方差分析进一步分析应用举例 在前面的应用举例中对广告形式、地区对销售额的影响在前面的应用举例中对广告形式、地区对销售额的影响进行了多因素方差分析,建立了饱和模型。分析可知,广告进行了多因素方

47、差分析,建立了饱和模型。分析可知,广告形式和地区的交互作用不显著,可以进一步尝试建立非饱和形式和地区的交互作用不显著,可以进一步尝试建立非饱和模型,并进行均值比较分析、交互作用图形分析。模型,并进行均值比较分析、交互作用图形分析。7.4 协方差分析7.4.17.4.1协方差分析的基本思想协方差分析的基本思想 无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有些控制变量很难人为控制,但他们的不同水平确

48、实对观测变量产生较为显些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对分

49、析结论的影响。分析结论的影响。1 1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,从而更加准确的对控制变量进行分析。从而更加准确的对控制变量进行分析。2 2、协方差分析的特点、协方差分析的特点 方差分析中的控制变量都是定性变量(包括定类和定序变量),线性方差分析中的控制变量都是定性变量(包括定类和定序变量),线性回归分析中的解释变量(自变量)都是定量变量。而协方差分析中的控制回归分析中的解释

50、变量(自变量)都是定量变量。而协方差分析中的控制变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。 协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量之间有显著的线性关系。之间有显著的线性关系。3 3、离差平

51、方和的分解、离差平方和的分解 在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立作用引起的、由控制变量交互作用引起的、由协变量引起的和随机变量引作用引起的、由控制变量交互作用引起的、由协变量引起的和随机变量引起的。以单因素协方差分析为例,观测变量的总变差可以分解为:起的。以单因素协方差分析为例,观测变量的总变差可以分解为:4 4、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果在观测变量总离差平方和中,如果SSASSA所占比例较大,则说明控制变所占比例较大,则说明控制变量量A A是引起观测变量的变动主要因素之一,观测变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论