(5.1.13)-第十章-方差分析社会调查研究方法_第1页
(5.1.13)-第十章-方差分析社会调查研究方法_第2页
(5.1.13)-第十章-方差分析社会调查研究方法_第3页
(5.1.13)-第十章-方差分析社会调查研究方法_第4页
(5.1.13)-第十章-方差分析社会调查研究方法_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章方差分析(定类变量-定距变量)第一节什么是方差分析?什么是方差分析?定类-定距变量的研究,采用方差分析:从内容来说,方差分析是分析或检验多个总体间的均值是否有所不同;从检验所用的方法来说,方差分析则是通过方差来进行检验的。什么是方差分析?1.检验多个总体均值是否相等通过对各观察数据误差来源的分析来判断多个总体均值是否相等2. 变量自变量:一个定类变量--一元方差分析

二个定类变量–二元方差分析

多个定类变量--多元方差分析因变量:一个定距变量什么是方差分析?

(一个例子)管理人员工人技术员3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,11,3,4,4,6,2,3,4,3,5,2,46,4,2,2,3,0,5,3,1,2,1【例】以下是某企业职工家庭赡养人数的抽样调查数据。职工类型共分为三种,分别为管理人员、工人、技术员。试分析职业是否对家庭赡养人数有影响。什么是方差分析?

(例子的分析)检验职业是否对家庭赡养人数有影响,也就是检验三类不同职业的平均家庭赡养人数是否相同设

1为管理人员的平均家庭赡养人数,

2为工人的平均家庭赡养人数,

3为技术员的平均家庭赡养人数,也就是检验下面的假设H0:

1

2

3

H1:

1,

2,

3

不全相等检验上述假设所采用的方法就是方差分析方差分析的基本思想和原理1. 比较两类误差,以检验均值是否相等;2. 比较的基础是方差比;3. 如果系统误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的;4. 误差是由各部分的误差占总误差的比例来测度的.方差分析的基本思想和原理方差分析的基本思想和原理

(两类误差)随机误差在自变量的同一取值下,样本的各观察值之间的差异;比如,企业管理人员中,每个人的家庭赡养人数是不同的;可以将此看作是由于抽样的随机性所造成的,称为随机误差

系统误差在自变量的不同取值下,样本的各观察值之间的差异;比如,管理人员、工人、技术员,他们的家庭赡养人数是不同的;这种差异可能是由于抽样的随机性所造成的,也可能是由于职业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差方差分析的基本思想和原理

(两类方差)组内方差RSS自变量的同一取值下样本数据的方差比如,管理人员中家庭赡养人数的方差组内方差只包含随机误差组间方差BSS自变量的不同取值下各样本之间的方差比如,三种职业类型之间的方差组间方差既包括随机误差,也包括系统误差方差分析的基本思想和原理

(方差的比较)如果不同职业(原因)对家庭赡养人数(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1.如果不同职业对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1.当这个比值大到某种程度时,就可以说自变量的不同取值之间存在着显著差异.方差分析的基本假定方差分析的基本假定yi应服从正态分布对于自变量的每一个取值,其观察值是来自服从正态分布总体的简单随机样本.比如,每种职业的家庭赡养人数必需服从正态分布.等方差性(equalvariance)对总体而言,自变量的每一个取值对应的因变量yi的分布都具有相同的方差.可以把自变量的每一个取值所对应的总体看作一个总体,管理人员总体、工人总体、技术员总体.方差分析中的基本假定在上述假定条件下,判断职业对家庭赡养人数是否有显著影响,实际上也就是检验具有同方差的三个正态总体的均值是否相等的问题.如果三个总体的均值相等,可以期望三个样本的均值也会很接近.三个样本的均值越接近,我们推断三个总体均值相等的证据也就越充分.样本均值越不同,我们推断总体均值不同的证据就越充分.方差分析中基本假定

如果原假设成立,即H0:m1=m2=m3

三种职业的家庭赡养人数的均值都相等没有系统误差这意味着每个样本都来自均值为

、方差为

2的同一正态总体

Xf(X)

1

2

3

方差分析中基本假定

如果备择假设成立,即H1:mi(i=1,2,3)不全相等至少有一个总体的均值是不同的有系统误差这意味着三个样本分别来自均值不同的三个正态总体

Xf(X)

1

2

3

方差分析的分类?一元方差分析:指方差分析中的自变量只有一个定类变量,因变量为定距变量。二元方差分析:指方差分析中的自变量有二个定类变量,因变量为定距变量多元方差分析:指方差分析中的自变量有多个定类变量,因变量为定距变量第二节一元方差分析一元方差分析的步骤提出假设构造检验统计量统计决策:给出,查表得出拒绝域和临界值;计算检验统计量、作出判断提出假设一般提法H0:m1=m2=…=

mk(自变量有k个水平)H1:m1

,m2

,…

,mk不全相等对前面的例子H0:m1=m2=m3职业对家庭赡养人数没有影响H0:m1

,m2

,m3不全相等职业对家庭赡养人数有影响构造检验的统计量为检验H0是否成立,需确定检验的统计量

构造统计量需要计算组平均值全部观察值的总平均值离差平方和TSS构造检验的统计量(计算组平均值

)组内观察值的总和除以组内观察值的总个数计算公式为式中:ni为第i组的样本观察值个数

yij

为第i组的第j个观察值

构造检验的统计量

(计算全部观察值的总平均值

)全部观察值的总和除以观察值的总个数计算公式为构造检验的统计量

(前例计算结果

)构造检验的统计量(计算总离差平方和

TSS-totalsumofsquares)全部观察值与总平均值的离差平方和反映全部观察值的离散状况其计算公式为前例的计算结果构造检验的统计量

(计算组内离差平方和

WSS-wintin-groupssumofsquares)每个组的样本数据与其组平均值的离差平方和反映每个样本各观察值的离散状况,又称组内平方和该平方和反映的是随机误差的大小计算公式为

前例的计算结果W构造检验的统计量

(计算组间离差平方和

BSS-between-groupssumofsquares)各组平均值与总平均值的离差平方和反映各总体的样本均值之间的差异程度,又称组间平方和该平方和既包括随机误差,也包括系统误差计算公式为前例计算的结果构造检验的统计量

(三个平方和的关系)

总离差平方和(TSS)、组内离差平方和(WSS)、组间离差平方和(BSS)之间的关系TSS=WSS+BSS构造检验的统计量

(三个平方和的作用)TSS反映了全部数据总的误差程度;WSS反映了随机误差的大小;BSS反映了随机误差和系统误差的大小.构造检验的统计量(计算方差)各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差.计算方法是用离差平方和除以相应的自由度三个平方和的自由度分别是TSS的自由度为n-1,其中n为全部观察值的个数WSS的自由度为n-m,其中m为因素水平(总体)的个数BSS的自由度为m-1三个方差总方差:总平方和TSS除以自由度后的值,组内方差:组内平方和WSS除以自由度后的值,组间方差:组间平方和BSS除以自由度后的值构造检验的统计量

(三个方差的作用)如果原假设成立,即m1=m2=…=

mk为真,则表明没有系统误差,组间均方与组内均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差.判断自变量的不同取值是否对因变量有影响,实际上就是比较组间方差与组内方差之间差异的大小.为检验这种差异,需要构造一个用于检验的统计量构造检验的统计量

(计算检验的统计量

F)将组间方差和组内方差进行对比,即得到所需要的检验统计量F当H0为真时,二者的比值服从分子自由度为m-1、分母自由度为n-m

的F分布,即构造检验的统计量

(F分布与拒绝域)如果均值相等,F1a

F分布F

(m-1,n-m)0拒绝H0不能拒绝H0F统计决策

将统计量的值F与给定的显著性水平

的临界值F

进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平

,在F分布表中查找与第一自由度df1=m-1、第二自由度df2=n-m

相应的临界值F

若F>F

,则拒绝原假设H0

,表明均值之间的差异是显著的,所检验的自变量对因变量有显著影响若F

F

,则不能拒绝原假设H0

,表明所检验的自变量对因变量没有显著影响一元方差分析表方差来源平方和SS自由度df方差SSF值组间

组内

总和BSSWSSTSSm-1n-mn-1BSS/m-1WSS/n-m一元方差分析的相关比率一元方差分析只告诉我们两个变量之间相关,但是,两个变量之间相关程度到底有多大呢?用相关比率eta2来表示

一元方差的SPSS操作步骤Analyze→Comparemeans→One-wayANOVA步骤二:

确定响应变量确定控制因素参数默认,OK多重比较选项自由度方差分析表F检验,P<0.01效应极显著方差分析中的多重比较目的:如果方差分析判断总体均值间存在显著差异,接下来可通过多重比较对每个水平的均值逐对进行比较,以判断具体是哪些水平间存在显著差异。常用方法备选:LSD法:t检验的变形,在变异和自由度的计算上利用了整个样本信息。Duncan新复极差测验法Tukey固定极差测验法Dunnett最小显著差数测验法等实现手段:方差分析菜单中的“Posthoctest…”按钮步骤一:

同one-wayANOVA步骤二:

选“Posthoctest”勾选多重比较的方法(如LSD、duncan法

确定显著性水平continue方差齐方差不齐方差齐性检验对月平均收入的均值差两两比较,用”*”表示差异显著LSD法Duncan法对月平均收入均值差两两比较,处在同一竖栏为差异不显著,反之则差异显著相关比率与相关系数的异同二者都表示两个变量之间相关程度,区别:相关系数r研究的是

定距-定距

变量间的线性相关程度;要求,不仅是定距变量,而且是线性相关。如果这两个要求有一个不能满足,就用相关比率eta2表示

第三节二元方差分析二元方差分析的三模型理想的独立模型忽略外界干拢因素的影响变量A和变量B之间不存在交互作用理想的具有交互作用的模型忽略外界干拢因素的影响变量A和变量B之间存在交互作用实际的模型考虑外界干拢因素的影响二元方差分析的步骤提出假设对自变量A提出的假设为H0:m1=m2

=

…=mi=…=

ma(mi为第i个取值的均值)H1:mi

(i=1,2,…,a)

不全相等对自变量B提出的假设为H0:m1=m2

=

…=mj=…=

mb(mj为第j个取值的均值)H1:mj

(j=1,2,…,b)

不全相等构造检验的统计量为检验H0是否成立,需确定检验的统计量

构造统计量需要计算总离差平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论