SPSS超详细操作:两因素多元方差分析(Two_第1页
SPSS超详细操作:两因素多元方差分析(Two_第2页
SPSS超详细操作:两因素多元方差分析(Two_第3页
SPSS超详细操作:两因素多元方差分析(Two_第4页
SPSS超详细操作:两因素多元方差分析(Two_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS 超详细操作:两因素多元方差分析 (Two医咖会在之前的推文中,推送过多篇方差分析相关的文 章,包括:单因素方差分析 (One-Way ANOVA) 双因素方差分析 (Two-way ANOVA) 三因素方差分析 (Three-way ANOVA) 单因素重复测量方差分析 两因素重复测量方差分析 三因素重复测量方差分析 单因素多元方差分析 (One-way MANOVA) 每种方差分析的应用场景, 以及该如何进行 SPSS 操作和解 读结果,各位伙伴请点击相应的文章链接查看 今天,我们再来介绍一种统计方法:两因素多元方差分析 (Two-way Manova) 。一、问题与数据 某研究者

2、想研究三种干预方式( regular 常规干预; rote 死记硬背式干预; reasoning 推理式干预) 对学生学习成绩 的影响。研究者记录了学生两门考试的成绩:文科成绩 (humanities_score )和理科成绩 ( science_score )。另外, 基于之前的知识,研究者假设干预方式对男女两种性别学生 的效果可能不同。换言之,研究者想知道不同干预方式对学 习成绩的影响在男女学生中是否不同。也就是说,干预方式 和性别两个自变量之间是否存在交互作用( interaction effect )。注:交互作用是指某一自变量对因变量的效应在另一个自变 量的不同水平会不同。在本例中,

3、就是要比较男性中干预 方式对学习成绩的影响和女性中干预方式对学习成绩的 影响。这两个效应就成为单独效应( simple main effects ), 也就是说,单独效应是指在一个自变量的某一水平,另一个 自变量对因变量的影响。因此,交互作用也可以看做是对单 独效应间是否存在差异的检验。在本研究中,共有三个效应:性别的主效应;干预方式的主 效应;性别和干预方式的交互作用。研究者选取 30 名男学生和 30 名女学生, 并将其随机分配到 三个干预组中, 每个干预组中共有 10 名男学生和 10 名女学 生。部分数据如下:二、对问题的分析 使用两因素多元方差分析法进行分析时,需要考虑 10 个假

4、设。对研究设计的假设:1. 因变量有 2 个或以上,为连续变量;2. 有两个自变量,为二分类或多分类变量;3. 各观察对象之间相互独立;对数据的假设:4. 自变量的各个组内,各因变量间存在线性关系;5. 自变量的各个组内,各因变量间没有多重共线性;6. 没有单因素离群值(univariate outliers )与多因素离 群值( multivariate outliers ):单因素离群值是指自变量的各 个组中因变量是否是离群值;多因素离群值是指每个研究对 象( case )的各因变量组合是否是一个离群值;7. 各因变量服从多元正态分布;8. 样本量足够;9. 自变量的各组观察对象之间因变量

5、的方差协方差矩阵相 等;10. 每个因变量在自变量的各个组中方差相等。三、流程图 四、对假设的判断 那么,进行两因素多元方差分析时,如何考虑和处理这 10 个假设呢?由于假设 1-3 都是对研究设计的假设,需要研究者根据研究 设计进行判断, 所以我们主要对数据的假设 4-10 进行检验。(一)检验假设6 :是否存在单因素离群值;假设 7 :各因 变量是否服从多元正态分布 检验单因素离群值时需要检验每一种自变量的排列组合中 是否存在离群值,共有如下 6 种情况:1. 首先要对数据进行拆分(1) 在主菜单点击 Data > Split File. ,如下图:(2) 出现 Split

6、File 对话框,选择 Organize output by groups , 会激活下方 Groups Based on: 框;(3) 将 gender 和 intervention 选入 Groups Based on: 框中, 点击 OK ;2. 运行 Explore 程序,检验离群值并评估正态性;(1) 在主菜单点击 Analyze > Deive Statistics >Explore. ,如下图:(2) 出现 Explore 对话框;(3) 将 humanities_score 和 science_score 选入 Dependent List 中,将

7、id 选入 Label Cases by :框中;(4) 点击 Plots ,出现下图 Plots 对话框;(5) 在 Boxplots 下选择 Dependents together ,去掉 Deive下 Stem-和-leaf, 选择 Normality plots with tests ,点击 Continue ,点击 OK。3检验假设6 :是否存在单因素离群值(1) 下图为输出的箱式图结果。在 SPSS 中,将距离箱子边缘超过 1.5 倍箱身长度的数据点 定义为离群值,用“圆圈”表示,右上标为离群值在数据表中 所对应的行数,以圆点表示;将距离箱子边缘超过 3 倍箱身 长度的数据点定义为

8、极端值(极端离群值) ,用“ * ”表示,右 上标代表离群值在数据表中所对应的行数。在下图中,可以看到两个单因素离群值:a)26 号学生,在推理干预组的一位女学生文科分数高于同组内的;b)57 号学生,在推理干预组中的一个男学生文科分数也是高于同组 内的。(2) 本例中没有出现极端值,为了方便理解,下图是出现极 端值的一个举例的情况。般来说,极端值比离群值更难处理。但是出现离群值时就 应该检查离群值,并决定选择处理方法。本例中虽然存在离 群值,但是为了进行下一步,我们暂且认为不存在离群值。(3) 离群值的处理首先需要确定离群值出现的原因,数据中存在离群值的原因有3 种:1) 数据录入错误: 首

9、先应该考虑离群值是否由于数据录入错 误所致。如果是,用正确值进行替换并重新进行检验;2) 测量误差: 如果不是由于数据录入错误, 接下来考虑是否 因为测量误差导致(如仪器故障或超过量程) ,测量误差往 往不能修正,需要把测量错误的数据删除;3) 真实存在的离群值: 如果以上两种原因都不是, 那最有可 能是一种真实的极端数据。这种离群值不好处理,但也没有 理由将其当作无效值看待。目前它的处理方法比较有争议, 尚没有一种特别推荐的方法。需要注意的是,如果存在多个离群值,应先把最极端的离群 值去掉后,重新检查离群值情况。这是因为有时最极端离群 值去掉后,其他离群值可能会回归正常。离群值的处理方法分为

10、 2 种:1) 保留离群值:对因变量进行数据转换; 将离群值纳入分析,并坚信其对结果不会产生实质影响。2) 剔除离群值:直接删除离群值很简单,但却是没有办法的办法。当我们需 要删掉离群值时,应报告离群值大小及其对结果的影响,最 好分别报告删除离群值前后的结果。而且,应该考虑有离群 值的个体是否符合研究的纳入标准。如果其不属于合格的研 究对象,应将其剔除,否则会影响结果的推论。另外,需要 在结果部分报告对离群值处理的方式。4. 检验假设 7:各因变量是否服从多元正态分布(1) 对于样本量较小( <50 例)的研究,推荐使用 Shapiro-Wilk 方法检验正态性。 当 P&

11、;lt;0.05 (显著性水平为 0.05 时)时,认为不是正态分布。 本例中,共有六种自变量的分类组合和两个因变量,所以会 出现 12 行结果。由于对各因变量进行了 6 次检验,所以新 的显著性水平 =0.05 + 6 = 0.0083 。本例中,由于所有的 值都大于 0.0083 ,所以两个因变量文科成绩和理科成绩服从 正态分布。(2) 不服从正态分布的处理 如果数据不服从正态分布,可以有如下 3 种方法进行处理1) 数据转换: 对转换后呈正态分布的数据进行方差分析。 当 各组因变量的分布相同时,正态转换才有可能成功。对于一 些常见的分布,有特定的转换形式,但是转换后的数据结果 可能较难解

12、释。2) 直接进行分析: 由于多元方差分析对于偏离正态分布有一 定的抗性,尤其是在各组样本量相等或近似相等的情况下, 而且非正态分布实质上并不影响犯 I 型错误的概率。因此可 以直接进行检验,但是结果中需要报告对正态分布的偏离。3) 如果想知道不服从正态分布是否会影响方差分析的结果, 可以比较转换后数据的分析结果和直接进行分析的结果,如 果两个结果是同样的结论,则不需要对因变量进行转换。(二 ) 检验假设 4:自变量的各个组内,各因变量之间存在线 性关系1. 在上述数据拆分的基础上,在主菜单下点击 Graphs >Legacy Dialogs > Scatter/D

13、ot ,如下图所示:2. 出现 Scatter/Dot 对话框,如下图所示;3. 点击 Matrix Scatter ,点击 Define ,出现 Scatterplot Matrix 对话框;4. 将 humanities_score 和 science_score 选入 Matrix Variables :框中,将 intervention 选入 Rows :框中,将 gender 选入 Columans :框中,点击 OK ;5. 在如下结果中可以看到每一种自变量组合里 humanities_score 和 science_score 的散点图,除了两因变 量在推理干预的女学生中的线性关

14、系不是很理想,其他组的 线性关系明显,我们这里接受假设 4。如果不存在线性关系,可以通过 3 种方式进行处理: (1) 对 1 个或多个因变量进行转换; (2) 去除掉不存在线性关系的 因变量; (3) 直接进行分析,尽管统计效能会降低。(三 ) 检验假设 5:各因变量之间是否存在多重共线性1. 在上述数据拆分的基础上,在主菜单下点击 Correlate > Bivariate. ,如下图所示:2. 出现 Bivariate Correlations 对话框,如下图;3. 将 humanities_score 和 science_score 选入 Variables , 点击 O

15、K 。4. 结果如下图所示,可以看到自变量的各个组合中 humanities_score 和 science_score 的 Pearson 相关系数。 理想状态下,在做多元方差分析时, 各个因变量之间应该 存在一定程度的相关关系,但相关性不能太强,如果相关性 太强(高于 0.9 ),则存在多重共线性,多元方差分析的假设 则不再满足。在下表中突出显示的相关系数在 -0.8510.721 之间,因变量 间不存在多重共线性( |r| < 0.9 )。5. 存在多重共线性的处理方法 如果数据具有多重共线性,可以有如下 2 种方法进行处理: (1)删除具有多重共线性的一个因变量,也是最常

16、用的方法; (2)可以通过主成分分析将具有多重共线性的多个因变量汇 总成一个新的因变量,这样做往往是理论上必须保留所有因 变量。(四)检验假设6 :是否存在多因素离群值 多因素离群值是指因变量的组合是异常值。可以通过计算马 氏距离( Mahalanobis distance )来判断某个研究对象是否 为多因素离群值。1. 在主菜单下点击 Analyze >Regression >Linear. 如下图所示:2. 出现 Linear Regression 对话框,将 id 选入 Dependent 框中,将 humanities_score 和 science_sco

17、re 选入 Independent(s) 中,如下图所示;3. 点击 Save ,出现 Linear Regression : Save 对话框,点 击 Distances 下的 Mahalanobis ,即马氏距离, 点击 Continue ,点击 OK4. 在主界面下,可以看到出现新变量 MAH_1 ;5. 选中 MAH_1 变量,右键,选择 Sort Descending ,对新 变量进行降序排列;6. 如下图所示,是对马氏距离降序排列后的数据界面;7. 马氏距离需要根据下表中 Critical Value 进行对比,下表中Critical Value 是在a =0.001时不同变量数对

18、应的卡方分 布的卡方值,由于本例中因变量有 2 个,对应的 Critical Value 为 13.82 ,而本例中马氏距离最大值为 5.21444<13.82 , 所以不存在多因素离群值。8. 如果存在多因素离群值, 首先要确定多因素离群值存在的 原因,原因主要有三种:数据录入错误;测量错误;真实存 在的异常值。处理方法分为 2 种:(1) 保留离群值:1) 将因变量转换成其他形式, 然而转换后的结果比较难解释, 如果选择变换,需要对所有的假设进行重新检验;2) 将离群值纳入分析, 理想情况下, 需要找到一个方法能够 评估离群值对分析结果的影响。可以分别纳入多因素离群值 和剔除

19、多因素离群值进行分析,并对两个分析结果进行比较。 如果两者结论一致,则可以保留多因素离群值。(2) 剔除离群值: 直接删除离群值很简单,是常用的办法。当我们需要删掉离 群值时,应该注意一个离群值可能会掩盖另一个离群值的存 在。所以在删除离群值后,应重新进行对假设的检验。最后 需要在结果中报告删除的离群值和原因。9. 需要去除之前对数据的拆分。在主菜单下点击 Data > Split File. ,如下图所示:10. 出现 Split File 对话框,点击 Analyze all cases , do not create groups, 点击 OK 。五、多元方差的 SPSS

20、操作(一) SPSS 操作1. 在主菜单下点击 Analyze >General Linear Model >Multivariate. ,如下图所示:2. 出现 Multivariate 对话框,将 humanities_score 和science_score 选入 Dependent Variables ,将 gender 和 intervention 选入 Fixed Factor(s) ,点击 Post Hoc ;3. 出现 Multivariate: Post Hoc Multiple Comparisons for Observed Means 对话框

21、,将 gender 和 intervention 选入 Post Hoc Tests for ,在 Equal Variances Assumed 下方选择 Tukey ,点击 Continue ;4. 点击 Options ,出现 Multivariate: Options 对话框,如下 图所示;5. 将 gender 和 intervention 选入 Display Means for: 下方, 并同时选中 gender 和 intervention ,将交互项 gender*intervention 选入 Display Means for: 下方,勾选 Display 下方的 Dei

22、ve statistics 、 Estimates of effect size 和 Homogeneity tests ,点击 Continue ,点击 Paste 。6. 出现如下图所示的语法编辑器页面;7. 找到第 8 行语法: /EMMEANS=TABLES(gender*intervention) ,并在其后加上 空格,加上语法: COMPARE(gender) ADJ(BONFERRONI),如下图所示;注释: COMPARE() 表示主效应的执行命令, COMPARE(gender) 表示会输出 gender 对因变量的主效应, ADJ(BONFERRONI) 是进行主效应间两两

23、比较的命令, 并对 显著性水平进行 Bonferroni 校正。8. 复制 /EMMEANS=TABLES(gender*intervention) COMPARE(gender) ADJ(BONFERRONI) ,并将其黏贴至下 一行,将 gender 改成 intervention ,如下图所示;9. 在主菜单下点击 RUN> All, 如下图所示。(二 ) 检验假设 8:样本量足够 多元方差分析中的样本量足够是指自变量的每组中的例数 要不少于因变量个数,本例中因变量有 2 个,所以自变量每 组中至少有 2 例才能满足样本量足够的假设。在输出的结果 的 Deive Stati

24、stics 表中可以看到每组 10 例,满足条件。(三 ) 检验假设 9:自变量的各组观察对象之间因变量的方差 协方差矩阵相等在输出的结果的 Box's Test of Equality of CovarianceMatrices 表中,如果 P<0.001 ,则违反了协方差矩阵相等 的假设;如果 P>0.001 ,则协方差矩阵相等的假设成立。 本例中, P=0.009>0.001, 所以各组观察对象因变量的方 差协方差矩阵相等的假设成立。大家可能注意到此时的显著 性水平是 0.001 而非 0.05 ,这是由于该检验的敏感性所以下 调了显著性

25、水平。如果检验发现方差协方差矩阵不相等,可以不进行处理,但是需要用 Pillai ' s criteriO统计量而非 Wilks' Lambda,因为 Pillai's criterion 对于不相等的协方差矩阵更稳健。(四) 检验假设 10:每个因变量在自变量的各个组中是否方 差相等。在输出的结果的 Levene's Test of Equality of ErrorVariances 表中,该检验中如果 P<0.05 ,则方差不相等; 如果 P>0.05 ,则方程相等。 本例中, P 值均大于 0.05(分 别为 P=0.750

26、和 P=0.964 ),所以方差相等的假设成立。如果检验发现方差不等,有 2 种方法进行处理: (1)对因变 量进行转换,并重新进行所有的检验; ( 2)不进行处理,并 接受较高的a水平,即犯I类错误的概率可能增大。六、结果解释 在结果解释之前,我们需要先明确几个概念:单独效应、主 效应和交互作用。单独效应( simple effect ):指其他因素的水平固定时,同一 因素不同水平间的差别。 例如,当A因素固定在第1个水平 时,B因素的单独效应为 20 ;当A因素固定在第2个水平 时, B 因素的单独效应为 24。主效应( main effect ):指某一因素的各水平间的平均差别。 例如,

27、当 A 因素固定在第 1 个水平时, B 因素的单独效应为 20;当 A 因素固定在第 2 个水平时, B 因素的单独效应为 24。平均后得到 B 因素的主效应( 20+24 )/2=22 。 交互作用( interaction ):当某因素的各个单独效应随另一因 素变化而变化时,则称这两个因素间存在交互作用。 当存在交互作用时,单独分析主效应的意义不大,需要逐一 分析各因素的单独效应;当不存在交互作用时,说明两因素 的作用效果相互独立,逐一分析各因素的主效应即可。1. 多元方差分析的交互作用的结果(1) 在 Multivariate Tests 表中, Pillai's Trace

28、、Wilks' Lambda 、 Hotelling's Trace 和 Roy's Largest Root 为四个多元统计量, 用于检验组间差异。首先要判断两个自变量之间是否存在交 互作用,最常用的统计量为 Wilks' Lambda ,该检验 P<0.05 时,自变量之间存在交互作用。本例中,交互项的 F=4.046 , P=0.004 , Wilks' A =0.753 ; partial n 2=0.132 , 所以nder 和 intervention 之间存在交 互作用,即干预对学生成绩的影响在男女之间存在差异。(2) 发现交

29、互项对因变量有影响后,我们还需要判断交互项 对哪个因变量有作用。 Tests of Between-Subjects Effects 表实际上是对因变量单独进行一元方差分析的结果。P<0.05 时,自变量对因变量的影响存在统计学意义;P> 0.05时,自变量对因变量的影响不存在统计学意义。本例中,我们看交互项对两个因变量的影响,发现交互项对 文科成绩的影响有统计学意义( P=0.003 ),而对理科成绩的 影响不存在统计学意义( P=0.056 )。2. 单独效应( simple main effect )的结果(1) gender 的单独效应( simple main e

30、ffect )在 Univariate Tests 中输出了在干预的不同组中,学习成绩 在男女中是否存在差异。我们以文科成绩为例, 如下表所示, 可见 Regular( P=0 . 664 ) 和 Rote(P=0.086 )干预组中男女生文科成绩的差异不存在 统计学意义, 在 Reasoning 干预组中男女成绩的差异具有统 计学意义( P=0.002 )。(2) intervention 的单独效应( simple main effect ) 相似的,以文科成绩为例,未发现在女学生中不同干预方式 对文科成绩的影响,但在男学生中不同干预方式对文科成绩 的影响具有统计学意义( P&lt

31、;0.001 )。然而,由于 intervention 是三分类变量,我们如果想知道到 底是那两个组之间存在差异,就需要进行两两比较。下表是 两两比较的结果。对于每科成绩和每种性别,都进行了三种 干预方式的两两比较: regular 与 rote ,regular 与 reasoning , reasoning 与 rote 。下面我们看一下因变量为文科成绩时,在男性中,在 Mean Difference (I-J )列可以看到 regular 组与 rote 组文科成绩 平均值差值为 1.600 ,但是 regular 与 rote 两种干预方式的 比较 P=1.000 ,说明两者之间的差异

32、不具有统计学意义。相似的, 在男性中, reasoning 组与 regular 组的文科成绩平 均值差值为 9.600 ,差异具有统计学意义( P<0.001 )。3. 多元方差分析的主效应(1) Gender 的主效应 如下图突出显示中, gender 对因变量的主效应不具有统计学意义,F=0.900 ,P=0.413 , Wilks' A =0.967 partial n 2=0.033 (2) Intervention 的主效应如下图突出显示中, intervention 对因变量的主效应具有统计 学意义,F=6.220 , P<0.001 , Wi

33、lks' A =0.656 ;partialn 2=0.190 o当多元方差分析的主效应对因变量有意义时,需要解读单因 素分析的主效应结果( univariate main effects ),这部分结 果在 Tests of Between-Subjects Effects 表中。如下图所示,干预方式对文科成绩的影响具有统计学意义 (P<0.001 ),而对理科成绩的影响不存在统计学意义 (P=0.153 )。由于干预方式是三分类变量,我们下面需要看两两比较的结 果。如下图所示,可以看到三种干预方式对文科成绩影响两 两比较的结果。Regular 组和 rote 组的文科

34、成绩差异不具有统计学意义(P=0.896 ), regular 组和 reasoning 组文科成绩的差异具 有统计学意义( P<0.001 ), rote 组和 reasoning 组文科成 绩的差异具有统计学意义( P<0.001 )。七、撰写结论1. 当自变量之间存在交互作用时 运用两因素多元方差分析方法对性别和干预方式对学生学 习成绩(包括文科成绩和理科成绩)的影响进行分析。分析前对方法的假设进行检验:散点图发现自变量的各个组 内,因变量间存在线性关系; Pearson 相关发现两因变量之 间不存在多重共线性( |r|<0.9 );通过箱式图未

35、发现单因素 离群值,通过马氏距离未发现多元离群值( P>0.001 ); Shapiro-Wilk 检验显示两因变量(文科成绩和理科成绩)服 从正态分布( P>0.05 ); Box's M 检验显示自变量的各个 组内两个因变量的方差协方差矩阵相等( P=0.009 ); Levene's 检验显示自变量各个组内因变量方差相等 ( P>0.05 )。 性别和干预方式的交互作用对因变量的影响存在统计学意义,F=4.046 ,P=0.004 , Wilks' A =0.753 partial n 2=0.132 , 即干预对学生成绩

36、的影响在男女之间存在差异。 多元方差分析显示性别和干预方式的交互作用对文科成绩 的影响有统计学意义 (F=6.406, P=0.003 ;partialn 2=0.19,2 )但对理科成绩的影响不具有统计学意义( F=3.034, P=0.056 ; partial n 2=0.10。1 ) 单因素主效应分析显示在男学生中不同干预方式对文科成 绩的影响具有统计学意义( F=17.283, P<0.001;partialn 2=0.390 ),但在女学生中不同干预方式对文科成绩的影响 无统计学意义( F=1.785, P=0.178 ;partial n 2=0.06。2 ) 因此,在男学生中对不同干预组的文科成绩进行了两两比较。 成绩用均值±标准差表示。男生文科平均成绩在常规干预组为 61.40 ± 5.23 ,在死记硬背式干预组中为 59.80 ±5.22 ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论