spss5.6方差分析_第1页
spss5.6方差分析_第2页
spss5.6方差分析_第3页
spss5.6方差分析_第4页
spss5.6方差分析_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.6 方差分析方差分析的概念与方差分析过程方差分析的概念与方差分析过程 (一)方差分析的概念(一)方差分析的概念 方差分析是检验两个或多个样本均数间差异是否具有统计意义方差分析是检验两个或多个样本均数间差异是否具有统计意义的一种方法。的一种方法。 1、方差分析原理、方差分析原理 方差分析的基本原理是认为不同处理组的均数间的差别基本来方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:源有两个: (1)随机误差,例如测量误差造成的差异,称为组内差异。用)随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏差平方和的总和表示。记作变量在各组的均值与该组

2、内变量值之偏差平方和的总和表示。记作L组内组内。 (2)实验条件,即不同的处理造成的差异,称为组间差异。用)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和来表示。记作变量在各组的均值与总均值之偏差平方和来表示。记作L组间组间。 L组间、组间、 L组内组内除以各自的自由度得到其均方值即组间均方和组内除以各自的自由度得到其均方值即组间均方和组内均方,均方, MS组间组间、MS组内组内。 一种情况是处理没有作用,即各样本来自同一总体。一种情况是处理没有作用,即各样本来自同一总体。MS组间组间MS组内组内1,考,考虑抽样误差的存在,则有虑抽样误差的存在,则有MS

3、组间组间MS组内组内1。 另一种情况是处理确实有作用。组间均方是由于误差与不同处理共同导致的另一种情况是处理确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同的总体。那么组间均方会远远大于组内均方。结果,即各样本来自不同的总体。那么组间均方会远远大于组内均方。 MS组间组间 MS组内组内。 MS组间组间/ MS组内组内构成构成F分布。用分布。用F值与其临界值比较,推断各样本是否来自相值与其临界值比较,推断各样本是否来自相同的总体。同的总体。 2、方差分析的假设检验、方差分析的假设检验 假设有假设有m组样本,原假设组样本,原假设H0:样本均数都相同,:样本均数都相同, 即即

4、1 2 3 m= , m组样本有共同的组样本有共同的 方差方差2。则。则m组样本来自具有共组样本来自具有共同的方差同的方差2相同的均数相同的均数的总体。的总体。 如果经过计算结果组间均方组内均方得如果经过计算结果组间均方组内均方得FF0.05(f组间,组间,f组内),组内),则则p0.05, 推翻推翻原假设,说明样本来自不同的正态总体,即说明处理造成均值的差异,有统计意原假设,说明样本来自不同的正态总体,即说明处理造成均值的差异,有统计意义。否则,义。否则, F=0.05, 承认原假设,样本来自相同总体,处承认原假设,样本来自相同总体,处理无作用。理无作用。(二)方差分析中的术语(二)方差分析

5、中的术语 1、因素与处理、因素与处理 因素是影响因变量变化的客观条件;处理是影响因变量变化的因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可通称为因素人为条件。也可通称为因素 。在要求进行方差处理的数据文件中均。在要求进行方差处理的数据文件中均作为分类变量出现。作为分类变量出现。 2、水平、水平 因素的不同等级称作水平。因素的不同等级称作水平。 3、单元、单元 在方差分析中在方差分析中Cell指各因素的水平之间的每一个组合。指各因素的水平之间的每一个组合。 4、因素的主效应和因素间的交互效应、因素的主效应和因素间的交互效应 如在研究双因素方差分析问题中,有如在研究双因素方差

6、分析问题中,有A、B两种处理方法,实两种处理方法,实验分为四组,具体方案是:验分为四组,具体方案是: 第一组:不进行任何处理;第二组:进行第一组:不进行任何处理;第二组:进行A处理;处理; 第三组:进行第三组:进行B处理;第四组:处理;第四组:A、B两种处理共同进行。两种处理共同进行。(1)比较第二组的均值与第一组的均值是否有显著差异。)比较第二组的均值与第一组的均值是否有显著差异。(2)比较第三组的均值与第一组的均值是否有显著差异。)比较第三组的均值与第一组的均值是否有显著差异。 这两项研究的是这两项研究的是A、B两因素的主效应。两因素的主效应。 (3)除了比较第四种的均值与第一组的均值是否

7、有显著性差异外,)除了比较第四种的均值与第一组的均值是否有显著性差异外,还要研究还要研究A因素对因素对B因素是否有影响。若因素是否有影响。若A因素对因素对B因素无影响,那因素无影响,那么除采样误差外,第四组与第二组均值之差应该等于第三组均值减么除采样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。否则两因素则相互影响,称之为交互效应。如果交去第一组均值。否则两因素则相互影响,称之为交互效应。如果交互效应存在,说明两个因素不是相互独立的。互效应存在,说明两个因素不是相互独立的。 5、均值比较、均值比较 均值的相对比较是比较各因素对因变量的效应的大小。例如研均值的相对比较是比较各因

8、素对因变量的效应的大小。例如研究究A、B效应之和是否等于它们的交互效应。或研究效应之和是否等于它们的交互效应。或研究A、B的效应是的效应是否相等。否相等。 均值的多重比较是研究因素单元对因变量的影响之间是否存在均值的多重比较是研究因素单元对因变量的影响之间是否存在差异性,例如研究差异性,例如研究1、2、3、4组实验之间是否存在显著性差异。组实验之间是否存在显著性差异。 6、协方差分析、协方差分析 在一般进行方差分析时,要求除研究的因素外应该保证其它条件在一般进行方差分析时,要求除研究的因素外应该保证其它条件的一致。如研究身高和体重的关系时要求按性别分别进行分析。这的一致。如研究身高和体重的关系

9、时要求按性别分别进行分析。这样则可消除性别因素的影响。要消除性别的影响,应该采用协方差样则可消除性别因素的影响。要消除性别的影响,应该采用协方差分析。分析。 (三)方差分析过程(三)方差分析过程 SPSS提供的方差分析过程有:提供的方差分析过程有: 1、单因素、单因素 ANOVA过程过程 单因素单因素 ANOVA过程是单因素简单方差分析过程。它在菜单过程是单因素简单方差分析过程。它在菜单“分析分析 比较平均值比较平均值”过程组中。可以进行单因素方差分析、均过程组中。可以进行单因素方差分析、均值多重比较和相对比较。值多重比较和相对比较。 2、一般线性模型、一般线性模型(简称简称GLM)过程过程单

10、变量: 单因变量、多因素方差分析。多变量:多变量、多因素方差分析。重复测量:重复试验方差分析。方差分量估计:方差成份分析。5.6.1 单因素方差分析 单因素方差分析能检验一个因素在多种方案(称在不同水平)下的均值是否有显著性差异。前提是要求各组样本相互独立,都服从正态分布且方差相同。 例5-6-1 某湖水不同季节氯化物含量测定值如下(e5-6-1.sav),试分析不同季节氯化物含量有无差别? 春:22.6 22.8 21.0 16.9 20.0 21.9 21.5 21.2 夏:19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 秋:18.9 13.6 17.2 1

11、5.1 16.6 14.2 16.7 19.6 冬:19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8操作步骤如下:1、2、根据分析要求指定方差分析的因变量和因素变量。3、按确定按钮(其它按SPSS默认值)结果分析:因F=9.380 , p=0.0000.05,因因此接受方差齐次的假设。此接受方差齐次的假设。单因素方差分析表 在单因素方差分析表中,在单因素方差分析表中,F=3.896, P=0.0140.05, 所以所以1、3培训效应和与培训效应和与2、4培训效应和无明显差培训效应和无明显差异。异。 因因contrast 2: P=0.0950.05, 所以所以1、

12、4培训效应和与培训效应和与3、5培训效应和无明显差培训效应和无明显差异。异。均值的多重比较结果表 在均值的多重比较结果中,由于已接受方差齐次性的假设,在均值的多重比较结果中,由于已接受方差齐次性的假设,所以不必考虑所以不必考虑Tamhane法所得结果。在法所得结果。在LSD法所得结果中,可法所得结果中,可以看出以看出1与与2,1与与3,1与与4,3与与5培训之间的差异显著。而培训之间的差异显著。而1与与5,2与与3,2与与4,2与与5,3与与4,4与与5培训之间的差异不显著。培训之间的差异不显著。均一子集表 在均一子集表中,第一均一子集为在均一子集表中,第一均一子集为2、3、4和和5培训方案,

13、培训方案,说明说明2、3、4和和5培训方案之间无明显差异。第二均一子集为培训方案之间无明显差异。第二均一子集为1和和5培训方案,说明培训方案,说明1和和5培训方案之间无明显差异。培训方案之间无明显差异。 由上面分析可知,利用由上面分析可知,利用Duncan法和法和LSD法得到的结论是法得到的结论是不同的,不同的,LSD侧重于两两均值的比较,而侧重于两两均值的比较,而Duncan是从一个子是从一个子集的概念来说明不同水平间均值的差异情况。集的概念来说明不同水平间均值的差异情况。不同水平的均值分布图5.6.2 一个因变量的多因素方差分析一个因变量的多因素方差分析 本节要研究的是单响应变量多因素方差

14、分析的本节要研究的是单响应变量多因素方差分析的SPSS实现过程,实现过程,特别是单响应变量双因素方差分析问题。特别是单响应变量双因素方差分析问题。 例例5-6-3 设设A、B、C 3台机器生产同一产品,台机器生产同一产品,4名工人操作机器名工人操作机器A、B、C各一天,得日产量数据(各一天,得日产量数据(e5-6-3.sav)如下:如下: 工人机器 1 2 3 4ABC 50 47 47 53 63 54 57 58 52 42 41 48问机器之间、工人之间在日产量上是否有显著差异(问机器之间、工人之间在日产量上是否有显著差异(0.05)?操作步骤:1、2、选择因变量。、选择因变量。3、选择

15、固定因素变量、选择固定因素变量4、根据实际需要选择随机因素变量、协变量、加权变量、根据实际需要选择随机因素变量、协变量、加权变量5、“模型”选项:全因子,包括所有因素变量的主效应和所有的交互效应。全因子,包括所有因素变量的主效应和所有的交互效应。定制,由用户选择因素变量的主效应和交互效应。定制,由用户选择因素变量的主效应和交互效应。平方和平方和: 选择分解平方和的方法。选择分解平方和的方法。在模型中包含截距:选此项,表示截距包括在模型中。在模型中包含截距:选此项,表示截距包括在模型中。6、“对比” 选项:因子框:显示主对话框中选中的因素变量及对照方法。因子框:显示主对话框中选中的因素变量及对照

16、方法。更改对比更改对比: 改变对照方法。改变对照方法。 无无: 不进行均值比较。不进行均值比较。 偏差偏差: 比较因素每个水平的效应比较因素每个水平的效应,选择最后一个或第一个作参考选择最后一个或第一个作参考水平。水平。 简单:因素变量的每一水平都与参考水平进行比较。简单:因素变量的每一水平都与参考水平进行比较。 差值:因素每一水平的效应,除第一水平外,都与其前面各水差值:因素每一水平的效应,除第一水平外,都与其前面各水平的平均效应进行比较。平的平均效应进行比较。 Helmert:因素每一水平的效应,除最后水平外,都与后续的:因素每一水平的效应,除最后水平外,都与后续的各水平的平均效应进行比较

17、。各水平的平均效应进行比较。 重复:对相邻水平进行比较。重复:对相邻水平进行比较。 多项式:多项式比较。多项式:多项式比较。7、“绘图绘图”选项:选项: 它可以一个或多个因素变量为参考作因变量的均值分布图。它可以一个或多个因素变量为参考作因变量的均值分布图。因子:显示主对话框中选中的因素变量。因子:显示主对话框中选中的因素变量。水平轴:横坐标框水平轴:横坐标框单图:分线框单图:分线框多图多图: 分图框分图框8、“事后多重比较事后多重比较”选项选项9、“保存保存”选项:可以将所计算的预测值、残差和检测值作为选项:可以将所计算的预测值、残差和检测值作为新的变量保存在数据集或数据文件中。新的变量保存

18、在数据集或数据文件中。10、“选项”:结果与分析因素变量为机器和工人机器有三个水平:1、2、3,每个水平共有4个观测量。工人有四个水平:1、2、3、4,每个水平有3个观测量。主效应方差分析检验结果 因素因素A:F=29.102,P=0.0010.05, 按按0.05检验水平,拒绝检验水平,拒绝无效假设,可以认为机器之间差异显著。无效假设,可以认为机器之间差异显著。 因素因素B:F=6.985, P=0.0220.05,按按0.05检验水平,拒绝无检验水平,拒绝无效假设,可以认为工人之间差异显著。效假设,可以认为工人之间差异显著。 机器变量均一子集:第一均一子集包含机器的第三水平机器变量均一子集

19、:第一均一子集包含机器的第三水平和第一水平,它们的均数分别为和第一水平,它们的均数分别为45.75和和49.25, P=0.079, 按按0.05检验水平,接受无效假设,可认为机器检验水平,接受无效假设,可认为机器C、A的日产量的的日产量的均数之间无明显差异。均数之间无明显差异。 机器机器B与它们的差异较显著。与它们的差异较显著。工人因素变量均一子集表:工人因素变量均一子集表: 第一均一子集包含工人第一均一子集包含工人2、3、4,它们的均数分别为,它们的均数分别为47.67, 48.33, 53.00, P=0.070, 按按00.05检验水平,接受无效假设,可认为工人检验水平,接受无效假设,

20、可认为工人2、3、4日产量的均日产量的均数之间无明显差异。数之间无明显差异。 第二均一子集包含工人第二均一子集包含工人4、1,它们的均数分别为,它们的均数分别为53.00, 55.00, P=0.335, 按按00.05检验水平,接受无效假设,可认为工人检验水平,接受无效假设,可认为工人4、1日产量的均数之间无明日产量的均数之间无明显差异。显差异。 工人工人1和工人和工人2、3没有出现在同一均一子集中,可以认为它们的均数存没有出现在同一均一子集中,可以认为它们的均数存在显著差异。在显著差异。例5-6-4 某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售数据,希望对广告形式、地区以及广告形式和地区的交互作用是否对商品销售额产生影响进行分析。具体数据e5-6-4.sav1、多因素方差分析的全因子(饱和模型)结论:结论:1、广告形式(、广告形式(X1)对销售额有显著影响。)对销售额有显著影响。2、地区(、地区(X2)对销售额有显著影响。)对销售额有显著影响。3、广告形式(、广告形式(X1)和地区()和地区(X2)对销售额没有显著交互作用。)对销售额没有显著交互作用。4、模型对观测变量(销售额)有一定的解释能力。、模型对观测变量(销售额)有一定的解释能力。5、调整后的、调整后的R2为为0.539,该模型对数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论