第6章群体间的差异比较方差分析_第1页
第6章群体间的差异比较方差分析_第2页
第6章群体间的差异比较方差分析_第3页
第6章群体间的差异比较方差分析_第4页
第6章群体间的差异比较方差分析_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第6章6.1方差分析概述6.2一元方差分析6.3二因素方差分析6.4 协方差分析3数据文件“社团.sav”是对高校学生参加社团活动的兴趣调查。调查对象分四个年级:大一新生、其他高年级本科生、硕士生和博士生。用每周参加社团活动的时间来度量对社团活动感兴趣的程度。u经验表明,随着年级的上升,对社团活动的兴趣减弱。因此需要比较这4个年级每周参加社团活动的时间均值是否有差别。u首先进行描述性统计:均数比较并用箱图呈现。u方法一:Explore过程u方法二:Compare MeansMeans过程 Legacy DialogsBoxplotReport参与社团活动的时间年级MeanNStd. Devia

2、tion本科新生23.38402.328其他高年级本科生21.49352.639硕士研究生5.24412.364博士研究生4.09442.321Total13.011609.278先使用Means过程比较组间的均数用箱图呈现不同年级的组间差异u要比较组间的均数,一种方法是通过独立样本的 T 检验进行两两比较,这样需要进行C426次两两比较,即要进行6次独立样本的 T 检验。u 在 T 检验中,是通过显著性(Sig.值)来判断原假设是否成立,显著性0.05代表在5%的错误水平下拒绝或接受原假设。u 进行6次 T 检验会得到6个Sig.值,综合得到的Sig.值为10.956 0.265 ,大于预设

3、的显著性水平0.05。u因此,对于多个分组的比较, T 检验不再适用。u假设4个年级的学生分别来自4个不同的总体,各组的方差都相等,数据服从正态分布,各组的样本都是独立的随机样本。即4组总体的是相同的分布。u通过均值的组间比较得知,按年级划分的4组参加社团活动的均值是不同的。u要回答的问题是:均值的差别是不是由抽样因素造成的?还是因为不同的组在总体上就有不相等的均值?u通过方差分析,能够把样本的方差分解为源于分组因素的部分和源于抽样波动的部分;如果源于分组的方差远远大于源于抽样波动的方差,则有理由认为各组的均值是显著不全相等。也就是说,这些子总体并不是来自同一个有相同均值和方差的大总体,至少有

4、一个子总体来自不同均值的其他总体。u元:指定距的因变量。用方差分析的方法来检验各组中的因变量均值是不是相等;u因素:用来进行分组的变量叫“因素”,如变量“grade”就是因素,通常用因素解释因变量的方差;u水平:因素的取值称为“水平”,如“grade”有4种取值,也就是有4种“水平”;u组内方差:代表本组内各样本取值相对于组内平均值的分布离散程度,它代表了总方差中不能用分组因素解释的部分;u组间方差:代表各组平均值相对于总平均值的分布离散程度,它代表了总方差中可以用分组因素解释的部分。例:需要比较三个班的英语成绩是否有差异。从每个班中随机地抽取5个学生,他们的英语成绩如下表一.从一个班中随机抽

5、取三个学生,每次抽得的学生成绩是不同的,见表二.表一:三个班的样本英语成绩表二:同一个班中抽取的三个样本英语成绩抽样波动引起抽样波动引起的均值的均值差异差异(组内方差(组内方差)抽样波动引起的,还抽样波动引起的,还是总体间存在显著差是总体间存在显著差异呢?(异呢?(组间方差)组间方差)182X 384X 280X 181X 282X 383X 2222211(828084)82311()8282(8082)(8482)413xXXcSXXcc代表组数282,1xXS1、计算组间的变差:对表一可求得组间方差:对第二组同样可求组间方差22211222()()()(1)ccpXXXXXXSc n12

6、23pS22113pS22225 4=302/35 1=1.3611/3xpxpnSFSnSFS第一组:第二组:计算得3、计算F比值2、计算组内的变差:对表一、表二可求得组内方差:u若F 值显著大于1,则说明均值间的差异不能用抽样误差来解释,各组间存在显著差异。u若F 值接近1,则说明各组间差异不明显,均值的差异主要是由抽样误差来造成的。u 方差分析是一种假设检验,运用方差分析时,对参与分析的变量所来自的总体有要求和假设。u数据要求n一个因变量(定距变量)一个因变量(定距变量)n一个或多个自变量(分类变量)一个或多个自变量(分类变量)u基本假设:n独立随机性:每个总体中的样本都必须是独立随机抽

7、样的独立随机性:每个总体中的样本都必须是独立随机抽样的n各总体要求正态分布:各组样本来自正态总体各总体要求正态分布:各组样本来自正态总体n因变量等方差:各组样本中因变量方差在总体水平上相等。因变量等方差:各组样本中因变量方差在总体水平上相等。u方差分析中,n原假设:被检验的每一个总体的均值都是相等的;原假设:被检验的每一个总体的均值都是相等的;n备择假设:这些总体中至少有一个总体的均值与其他总体备择假设:这些总体中至少有一个总体的均值与其他总体的均值有差异。的均值有差异。0121:,nijHYYYHYY ij=u在这样的原假设下进行方差分析:n组内方差的大小不依赖原假设的成立与否,不会受到样本

8、组内方差的大小不依赖原假设的成立与否,不会受到样本均值的影响,是一个相对均值的影响,是一个相对“稳定稳定”的值;的值;n组间方差的估计只有在原假设成立的情况下才正确,否则组间方差的估计只有在原假设成立的情况下才正确,否则组间方差会非常大。组间方差会非常大。u结论n根据组内方差可以看出同一个组内不同案例值的差异程度;根据组内方差可以看出同一个组内不同案例值的差异程度;n根据组间方差可以观察不同组别之间的差异程度。根据组间方差可以观察不同组别之间的差异程度。n如果组间方差远远大于组内方差,就可以拒绝各总体均值如果组间方差远远大于组内方差,就可以拒绝各总体均值之间没有差别这一原假设。之间没有差别这一

9、原假设。u构造F统计量,F统计量服从已知的F分布。n如果各组均值相等的原假设成立,那么组间方差主要由随机如果各组均值相等的原假设成立,那么组间方差主要由随机误差造成,即组间方差的值应接近组内方差,也就是误差造成,即组间方差的值应接近组内方差,也就是F值不值不会太大,且接近于会太大,且接近于1;n如果自变量对因变量造成了显著影响,那么自变量的各因素如果自变量对因变量造成了显著影响,那么自变量的各因素对组间均方差的影响必然远大于随机误差,对组间均方差的影响必然远大于随机误差,F值显著大于值显著大于1。u给出显著性水平,与检验统计量F的概率P值相比较。n如果如果P值小于值小于,则应拒绝零假设,认为自

10、变量的不同水平下,则应拒绝零假设,认为自变量的不同水平下,因变量的总体均值存在显著差异;因变量的总体均值存在显著差异;n如果如果P值大于值大于,则不能拒绝零假设,认为自变量的不同水平,则不能拒绝零假设,认为自变量的不同水平下,因变量的总体均值之间无显著差异。下,因变量的总体均值之间无显著差异。u根据数据“社团.sav”推断不同年级的学生参加社团活动的兴趣是否存在差异。uAnalyzeCompare MeansOne-way ANOVA因变量因变量自变量自变量趋势检验趋势检验多重比较检验多重比较检验等方差性假设成立等方差性假设成立等方差性假设不成立等方差性假设不成立常用的两种多重比常用的两种多重

11、比较方法较方法输出结果选项输出结果选项方差齐性检验方差齐性检验均值图均值图用于各组方差不等用于各组方差不等时的统计指标时的统计指标u第一步:描述性统计结果:表格或箱图u第二步:总体的方差齐性检验。n当样本总量较大,样本中案例个数比较接近时,方差分析当样本总量较大,样本中案例个数比较接近时,方差分析对总体正态分布和等方差性的要求不是很高;对总体正态分布和等方差性的要求不是很高;n当样本容量不大,样本中案例个数差异较大时,方差分析当样本容量不大,样本中案例个数差异较大时,方差分析要求正态总体和等方差性。要求正态总体和等方差性。方差齐性检验的方差齐性检验的原假设:各组方原假设:各组方差相等。差相等。

12、因此,因此,P值大于值大于0.05,方差齐性,方差齐性检验通过。检验通过。u第三步:总体的正态性检验:直方图或Q-Q图。n可以对数据进行拆分,作直方图观察各组的正态性。可以对数据进行拆分,作直方图观察各组的正态性。n也可以用也可以用Explore过程输出过程输出Q-Q图或图或KS检验结果判断。检验结果判断。三个组的正态性检验没有通过。但只要样本量足够三个组的正态性检验没有通过。但只要样本量足够大,非正态性不影响方差分析的结果。大,非正态性不影响方差分析的结果。u第四步:方差分析结果 F值远大于1,说明组间方差远大于组内方差,由于分组造成的差异远超过抽样误差。 P值远小于0.05,因此可以拒绝原

13、假设,而接受备择假设。 因此认为本科新生、高年级本科生、硕士研究生、博士研究生这4个总体的均值是有显著差异的。u第五步:进一步分析多重比较u当方差分析的结果显著,说明4组中至少有一组与其他组不同,但却无法判断到底是哪一组或哪些组之间结果不同,u此时需要进一步运用多重比较来具体考察各组之间的差别。 多重比较的结果发现:除硕士和博士外,其他组别两两之间差异显著。26u 在上例中,我们只考虑了自变量“年级”对因变量“参加社团活动的时间”的影响,如果我们分两个因素“性别”和“年级”考虑对“参加社团活动的时间”的影响,此时的分析用单因素方差分析便无法完成。u二因素方差分析是研究当自变量有两个时,检验各组

14、的均值是否全等。u1、检验假设n当同时考虑年级和性别两个因素时,要检验的假设变为当同时考虑年级和性别两个因素时,要检验的假设变为3个,其中最后一个是两个因素的交互作用是否显著:个,其中最后一个是两个因素的交互作用是否显著:n不同年级的学生平均每周参加社团活动的时间是否全等;不同年级的学生平均每周参加社团活动的时间是否全等;n男女生平均每周参加社团活动的时间是否全等;男女生平均每周参加社团活动的时间是否全等;n用年级和性别进行交互分析后,各组均值是否全等。用年级和性别进行交互分析后,各组均值是否全等。u2、数据要求n要求各组的数据都来自正态分布总体中的随机样本,并且要求各组的数据都来自正态分布总

15、体中的随机样本,并且各组方差恒定。各组方差恒定。u3、主效应与交互效应n在方差分析中,主效应指每个因素单独对因变量的影响。在方差分析中,主效应指每个因素单独对因变量的影响。此例中,年级和性别两个因素构成了两个主效应;此例中,年级和性别两个因素构成了两个主效应;n交互效应指第三个因素(年级和性别交互形成)对因变量交互效应指第三个因素(年级和性别交互形成)对因变量的影响。的影响。参加社团活动的平参加社团活动的平均时间年级因素均时间年级因素的影响性别因素的影响性别因素的影响的影响没有交互效应的情况有交互效应的情况平均年薪起点性平均年薪起点性别因素的影响工别因素的影响工作单位性质的影响作单位性质的影响

16、性别和工作单位性别和工作单位性质的交互效应性质的交互效应u4、检验原理n二因素方差分析也是通过比较组间与组内方差来说明各个二因素方差分析也是通过比较组间与组内方差来说明各个自变量的作用是否显著。自变量的作用是否显著。n二因素方差分析中的组内方差之和是两个自变量交互形成二因素方差分析中的组内方差之和是两个自变量交互形成的各个组内的方差的总和。例如性别和年级的交互中,组的各个组内的方差的总和。例如性别和年级的交互中,组内方差之和要考虑内方差之和要考虑248个组内内部各组均值差异的和。个组内内部各组均值差异的和。u针对数据“社团.sav”,分析年级和性别对参加社团活动时间的影响。nAnalyzeGe

17、neral Linear ModelUnivariatenModel选项卡选项卡选入年级、性别以选入年级、性别以及交互效应的三个及交互效应的三个变量。如果交互效变量。如果交互效应不显著,则回到应不显著,则回到此选项卡去掉交互此选项卡去掉交互效应。效应。nProfile Plots选项卡选项卡:输出均值图输出均值图单击单击Add将输出考将输出考虑交互效应的均值虑交互效应的均值图。图。nOptions选项卡选项卡输出描述性统计量输出描述性统计量方差齐性检验方差齐性检验方差齐性检验通过。方差齐性检验通过。(原假设是各组方(原假设是各组方差相等)差相等)主效应显著主效应显著 交互效应不交互效应不显著显

18、著 n当交互效应不显著时,需要重新指定当交互效应不显著时,需要重新指定model选项卡中的变选项卡中的变量,将交互效应去掉。量,将交互效应去掉。u由于主效应显著,可以做事后比较:Post Hoc事后比较的自变量事后比较的自变量水平应大于三个。水平应大于三个。交互效应并入误差交互效应并入误差项项LSD法进行事后比法进行事后比较的结果。较的结果。u1、针对数据“手机购买.sav”n分析不同年级的同学手机购买动机有无差别?分析不同年级的同学手机购买动机有无差别?n如果同时考虑性别因素呢?如果同时考虑性别因素呢?u2、数据“工资水平.save”统计了不同性别和单位性质的薪资起点。n试分别分析不同单位性质和性别的员工之间薪资是否有所试分别分析不同单位性质和性别的员工之间薪资是否有所不同。不同。n试分析不同单位性质和性别两因素共同作用下的员工试分析不同单位性质和性别两因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论