教育统计学 课件第11次-推断统计的基本概念与参数假设检验;第12次-相关分析及其应用_第1页
教育统计学 课件第11次-推断统计的基本概念与参数假设检验;第12次-相关分析及其应用_第2页
教育统计学 课件第11次-推断统计的基本概念与参数假设检验;第12次-相关分析及其应用_第3页
教育统计学 课件第11次-推断统计的基本概念与参数假设检验;第12次-相关分析及其应用_第4页
教育统计学 课件第11次-推断统计的基本概念与参数假设检验;第12次-相关分析及其应用_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学推断统计的基本概念与

参数假设检验学部本科科生课课程

北京师范大学教育学部胡咏梅统计学、描述统计、推断统计假设检验的原理与步骤单样本的t检验两个独立样本的t检验配对样本的t检验3o

统计学是一门收集、整理、显示和推理分析数据的科学,其目的是探

索数据内在的数量规律性。o

简言之,统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

描述统计

推断统计1.统计学的概念

o

描述统计(descriptive

statistics):研究如何整理原始数据资料,描述数

据的全貌的方法

。o目的在于使得杂乱无章的数据更好地显示出事物或现象的某些特征,

有助于说明事物或现象的本质。描述统计的概念

o

集中趋势(算数平均数、加权平均数、几何平均数、中位数、众数等)o

离散趋势(方差、标准差、四分位差、极差、差异系数等)o

数据分布的表与图(频数分布表、分组频数分布表、累计频数分布表、

条形图、饼图、直方图等)描述统计的方法o

推断统计(inferential

statistics):研究如何利用样本数据推断总体特征

的统计学方法。o

严格地说,推断统计是一种依据随机样本数据,从局部推断总体,即对

总体的某些特征进行推断、估计和预测。推断统计学主要包括参数估计

、假设检验和多元统计分析三部分。推断统计的概念o

对于数字特征量的估计(参数估计:点估计、区间估计)o

对于单样本或两个样本的总体特征参数取值特点的假设

(H0

=

μ0

;

H0

:

μ1

=

μ2)o

多个样本所来自的总体均值是否相等(方差分析,ANOVA)o

变量间关联性的预测(相关分析)o

将变量关系模型化(回归分析)o

对未来观察的预测(时间序列分析)o

数据挖掘(如聚类分析、探索性因子分析等)推断统计的方法o

基本概念o

假设检验是根据样本信息来判断总体分布是否具有指定特征的统计推

断方法。2.假设检验的原理与步骤o

基本概念o

根据检验假设时是否需要利用总体分布形态方面的信息,假

设检验可分为参数假设检验和非参数假设检验两大类。o

参数假设检验是在总体分布形态已知时,对总体某个未知参

数值的假设所作的检验。2.假设检验的原理例如,已知某个样本的均值为

μ0

,它来自一个正态总体(

X

~

N(μ,σ

2

)),其中μ未知,问是否有理由说它来自均值为

μ0

的正态总体?检验假设:μ

=

μ0参数假设检验已知两个相互独立的样本,它们分别来自两个正态总体(X1

~N(μ1

,

σ

),X2

~N(μ2

,

σ

)),其中μ1

、σ1

,μ2

、σ2

均是未知数,

能否说这两个总体的均值相等或方差相等?检验假设:μ1

=

μ2

或σ

=

σ22122212参数假设检验非参数假设检验是在总体分布形态未知(其实也不需要知道总体的分布形态)的情况下,对总体分布函数的类型或它的某些特征提出某种假设

所进行的检验。检验某样本所属总体是否服从正态分布;检验两个样本所属总体的分布

是否相同;检验两个样本来自的总体取值的平均状况是否有显著性差异

等等。非参数假设检验o

零假设是关于当前样本所属的总体(在参数值或分布形式方面)与原设总体(在参数值或分布形式方面)无区别的假设。它往往是研究者

根据样本信息期待拒绝的假设。一般用H0表示零假设。o

例如H0:样本所属总体服从正态分布。零假设和备择假设o

备择假设是指与零假设相互对立的假设。它是关于当前样本所属总体(在参数值或分布形式方面)与原设总体(在参数值或分布形式方面)不同的假设。而且它是当否定了零假设之后,应当接受的假设。一般用

H1表示备择假设。o

例如,H1:样本所属总体不服从正态分布。备择假设

o

先建立一个零假设H0

,然后在H0成立的条件下,看看会产生什么样的后果。如果经过一系列正确的逻辑推理和分析计算之后,导致了一个

不合理的现象出现,就有理由认为原先的零假设H0

是错误的,应当否

定H0;如果没有出现不合理的现象,那我们就没有充分的理由否定H0。

所以,就应当接受H0。假设检验的基本思路o

小概率事件在一次试验中不可能发生。

o

如果在一次试验中,小概率事件居然发生了,我们就认为是不合理的现

象,就有充分的理由怀疑其零假设的前提是不正确的,因而应当拒绝零

假设。不合理的现象

o

在统计学中,一般是将概率小于或等于α的事件,称为小概率事件。o

通常规定α=0.05或α=0.01。o

在假设检验中,零假设是否成立与α的大小是有关系的,称α为显著性

水平。小概率事件o

在假设检验中,

“小概率事件”是指样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的显著性水平α

,

这时,就认为小概率

事件发生了。把出现小概率的随机事件称为小概率事件。小概率事件

例8-1:某高校对男、女生每日平均锻炼时间进行统计,分别随机抽取了20名男同学和女同学,他们平均日锻炼时间数据(单位:小时)如下表。(8.

1)(7.16)其中n=20

,即统计量服从自由度为2n-2的t分布。此时,若选定

α=0.05,则对于满足概率

P{|t

|>

/

2

(2n

2)}

=

α

的临界值tα/2(2n-2)

,可查t分布表df=30和df=40时的临界值,并估算出tα/2(38)≈2.025。我们可以计算出:

因为小概率事件“

|t|>2.025”发生了,所以,拒绝H0

:

μ1

=

μ2

,接

受其备择假设

H1

:

μ1

μ2

,即认为该校男女生日平均锻炼时间是有显著

差异的。由式(8.

1)所确定的统计量t的值域{t:|t|>

/

2

(2n

-

2)}我们称之为

H0

:

μ1

=μ2

的拒绝域,它的余集{t:|t

|≤tα

/

2

(2n

-

2)}

被称为H0

的接受域。即当样本统计量t的值落入拒绝域时,我们要拒绝零假设H0

;当样本统计

量t的值落入接受域时,我们要接受H0

,即认为

H0

:

μ1

=

μ2是相容的。拒绝域和接受域

1.建立零假设,如前例

H0

:

μ1

=

μ2

。2.在假定零假设成立的前提下,选择合适的检验方法及检验统计量。3.计算给定样本的统计量值。4.选定显著性水平α

,

查统计量所服从的分布表来确定临界值,从而确定H0

的拒绝域和接受域。5.对H

0

作出判断。将临界值与样本统计量值相比较,若统计量值落在H0

的拒绝域中,则拒绝H0

;若统计量值落在H0

的接受域中,则接受H0。23假设检验的一般步骤o

Analyze——Compare

Means(均值比较)——T

test(T检验)

按不同的比较方式,T

test分为3个子过程:o

One-Sample

T

Test(单样本的T检验)o

Independent-Samples

T

Test(独立样本的T检验)o

Paired-Samples

T

Test(配对样本的T检验)。参数假设检验的SPSS模块单样本的T检验是检验来自正态总体的一个样本的总体均值与一个给定常数之间的差异是否显著,即检验假设

H0

:

μ

=μ0

是否成立,这里μ

、μ0

分别为总体均值和给定的常数。

3.单样本的t检验设

x1

、x2

…,xn

是来自正态总体N(μ,σ2

)

的样本,其中

μ

和σ

均未知。如果假设H0

:

μ

=

μ0

成立,则由(7.8)知,统计量

(8.2)服从自由度为n-1的t分布,其中

X

、S

2

分别为样本均值和样本方差,n

为样本容量。若

|t

|>tα

/

2

(n—1),则拒绝

H0

;若

|t

|≤tα

/

2

(n—1)

,则接受

H0

。3.单样本的

t检验例8-20•8-1.sav•Analyze→Compare

Means→

One-Sample

T

Testo

两个独立样本的T检验是用以检验服从正态分布的且相互独立的两个样本的总体均值之间的差异是否显著的假设检验问题。设有两个服从正态分布的相互独立的总体X和Y,X

~

N

(

μ1,

σ

12

)

,Y

~

N

(

μ2

,

σ

)。分别从这两个总体中抽取两个

随机样本:x

1

、x

2

…,x

n

1

,y

1

、y

2

…,y

n

2

。通过这两个样本的数据信息来推断出两个总体均值差异是否显著的结论,即需要检验假

H

0

:

μ

1

=

μ

2

。224.两个独立样本的t检验在未知两个总体的方差信息时,必须先通过F检验来考察一下两总体方差之间的差异是否显著,即要先对两总体方差进行齐性检验,检验假设

H0

:

σ

=

σ

。22124.两个独立样本的t检验

如果假设

H0

:

σ

=

σ

成立,则统计量S

2

2212方差齐性检验(1)如果其相伴概率p≤

α

,

则拒绝H0

:

σ

=

σ

,即认为两个正态总体的方差差异显著。此时,对于H0

:

μ1

=μ2,我们需要进行方差非齐性下的T检验,构造如下

的t检验统计量:

则上式中的自由度

O

=

如果t统计量的相伴概率p≤α

,

则拒绝H0

:

μ1

=

μ2

;否则,接受H0

.2212方差非齐性下的两个独立样本的T检验

(2)如果统计量F的相伴概率p>α

,

则接受H0

:

σ

=

σ

,即认为两个总体的方差相等。此时,对于H0

:

μ1

=

μ2,我们进行方差齐性下的T检验,

构造如下的t检验统计量:

如果t统计量的相伴概率p≤α

,

则拒绝H0

:

μ1

=

μ2

;否则,接受

H0

。2212方差齐性下的两个独立样本的T检验例8-3某小学对五年级学生开展语文教学改革试验,选取甲、乙两个平行班作试点,每班各25人。甲班用传统的教师讲授的教学方法,

乙班采取学生

自学和师生相互讨论的新的教学方法。一学年后,用同一份试题对两个班

的学生进行语文测验,得到的成绩如下表所示。问:这两种教学方法的效果

是否有显著性差异(α=0.01)?

数据文件8-2.sav

学生语文成绩记为变量score

,分组变量名为tmehod

,其值为“

1”,表

示为传统教学法,其值为“2”

,表示为新教学法(变量值标签为:1=“传统教学法”

,2=“新教学法”)。

Analyze→Compare

Means→Independent

Samples

T

Test

…方差齐性下的两个独立样本的T检验

方差齐性检验(Levene检验):F统计量的值为0.641

,其相伴概率为p=0.427>0.05

。因此,采用两种不同教学方法下学生的语文成绩变量

的方差是齐性的。在T检验结果中应该选择Equal

variances

assumed(假设方差相等)一行的数据作为此例的T检验结果数据(如若

Levene检验结果表明方差非齐性,在T检验结果中应该选择Equal

variances

not

assumed一行的数据作为T检验结果数据)。

t统计量的值为

-2.804

,相伴概率为p=0.007<0.01

,因而拒绝零假设,即得出采用两种教学方法下学生语文成绩存在显著性差异的结论。结论•第二个表格还给出Mean

Difference

两组均值之差,值为-8.480

,即采用新教学法下学生的语文成绩比采用传统教学法的学生的语文成绩高8.480

分。•Std.Error

difference差值的标准误为3.02465

。两种教学方法下学生语文成

绩得分均值之差的95%的Confidence

Interval

of

the

Difference置信区间[-

16.59274

,-0.36726]也列在该表中。结论o

进行配对样本的T检验要求被比较的两个样本具有显著的相关关系,而

且它们的样品能搭配成对。o

一类配对样本是对同一组被试对象在实验前后两次测试所获得的数据;o

另一种配对样本是按某些条件基本相同的原则,经过一一配对而成的两

组被试对象,实施不同的实验处理之后,所得到的两组测试结果数据。5.配对样本的t检验

配对样本的T检验实际上就是比较不同处理的效果差异是否显著,即检验服从正态分布的配对样本的总体均值是否相等,即

H0

:

μ1

=μ2其检验统计量为

其中n为样品对数。X

1、X2

分别为两个样本的均值,S1

、S2

分别为两个

样本的标准差,r

为两个样本的相关系数。如果该统计量的相伴概率p≤α

,

则拒绝

H0

:

μ1

=μ2

;如果p>α

,

则接受

H0

:

μ1

=

μ25.配对样本的t检验(Paired-SamplesT

Test

)o

例8-4

为了检验某种识记方法的效能,对某班15名学生进行了一周的识记训练,他们在接受识记训练前后的识记成绩如下,问这种识记训练

是否真的有效?

(α=0.05)5.配对样本的t检验(Paired-SamplesT

Test

)•数据文件:8-3.sav•学生在参加识记训练之前的测验成绩记为变量prescore

,训练后的测验

成绩记为变量postscore。•待检验的假设为H0

:

μ1

=μ2•Analyze→Compare

Means→Paired→

Samples

T

Test

…46o

单击Options按钮•第一个表格给出了学生在进行识记训练前后的测验成绩变量prescore和postscore的描述性统计量:样本容量N

,样本均值Mean

,样本标准差Std.Deviation以及样本均值的标准误Std.ErrorMean

。从两个样本的均值和标准差数据来看,它们的方差差异不大,而它们的均值有一定差异。这说明采用这种识记

训练后,学生的成绩有一定提高。•第二个表格给出的是识记训练前后的测验成绩之间的相关系数:Correlation=0

.

836

,相伴概率

p=0.000<0.05

,因此可以得出识记训练前后的测验成绩之间存在显著的线性关系的结论。•第三个表格给出的是配对变量差值的T检验结果。均值之差为-6.000

,差值的标准差为8.39217

,差

值的均值标准误为2

.

16685

。差值的95%置信区间下、上限为-10

.64743和-1

.35257

。t统计量的值为-

2.769

,其相伴概率为p=0.015<0.05

。因此,我们应当拒绝零假设,即得出识记训练前后学生的测验成绩存在显著性差异的结论。结论1.试述假设检验的基本思路与一般步骤。2.某高校学生会欲通过调查学生平均每天上网时长了解该校男女学生的业

余生活情况,分别随机抽取了15名男女学生,他们平均每天浏览网页的时间

数据(单位:分钟)如下:试用数据文件“exe8-1.sav”计算能否据此数据就得出男学生与女学生

平均每天浏览网页的时间不相等的结论。作业3.

已知某年级学生的语文成绩X服从正态分布,即X~N

(μ0,σ2

),其中μ0=80,σ2

未知。现从该年级某班随机抽取20名学生的语文成绩,数据如下:

75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,91,95,88,87试用数据文件“exe8-2.sav”检验该班学生的平均语文成绩是否达到80分

(α=0.05)。作业4.为了考察某种阅读训练的效能,从某班学生中随机抽取30名学生对他们

进行阅读测验,然后让他们接受这种阅读训练。经过一段时间的训练后,

又对这30名学生进行了类似的阅读测验,两次测验成绩如下:试用数据文件“exe8-3.sav”检验阅读训练前后的测验成绩是否有显著性

差异(α=0.05)。作业相关分析及其应用学部本科生课程北京师范大学教育学部胡咏梅教育统计学相关概念常用的相关分析方法相关分析的SPSS过程相关分析在教育与心理研究中的应用contentso

确定性关系:

是通常的函数关系

,如圆的面积与半径之间的关系:

S=πr2o

非确定性关系:即相关关系。例如,人的身高与体重之间的关系。一、相关概念o

相关关系o

变量之间的数量关系不十分严格,但却存在某种依存关系

。(如智商与

学生学业成绩的关系)o

不等于因果关系(如数学成绩与物理成绩之间的相关关系)一、相关概念o

相关分析是研究变量间相互关系紧密程度的统计分析方法。即它是研

究两个或两个以上变量之间是否存在相关关系,如果存在相关关系,

其相关的性质(线性相关或曲线相关;正相关或负相关)和程度如何。o

用图示法和计算法来刻画变量之间的相关关系。相关分析

o

相关关系的图示,是用散点在平面直角坐标系中的分布情况,来描述两个变量联系的紧密程度,这种图称为相关散点图,又简称为散点图。图示法散点图o

数据文件9-1.savo

Graphs-Legacy

Dialogs-Scatter/dot

,选择Simple

Scatter

,并单击Defineo

例9-1

已知某校初二一班20名同学某次月考的数学成绩和物理成绩,请绘制出描述数学成绩和物理成绩关系的散点图。在SPSS中绘制散点图o

在数量上表现变量间相关关系的量称为相关量。o

相关系数是描述变量间线性关系程度和方向的相关量,通常用r来表示。o

[-1

,1

]o

r>0正相关

r<0负相关

r=0

零相关计算法二、常用的相关分析方法

o

积差相关法o

等级相关法o

点二列相关法o

二列相关法

积差相关系数(Pearson相关系数)

o

积差相关系数适用于两个变量都是服从正态分布或两个变量服从的分

布是接近正态的对称分布的情形。o

对于scale测度水平(interval

variable/ratio

variable)的变量使用。积差相关系数例9-2对30名小学男教师进行问卷调查,其工作满意度与职业认同感得分

如下,试计算小学男教师职业认同感与工作满意度的相关系数。o

等级相关法是适用于研究具有等级顺序的测量数据(ordinal

variable)

间相互关系的方法。o

Spearman斯皮尔曼等级相关系数\Kendall肯德尔和谐系数等级相关法

斯皮尔曼等级相关系数(9.2)则可采用如下的简化公式计算

式中:Di

=

R

xi

Ry

i(对偶等级之差),n为对偶数据个数。式中R

xi

、Ry

i

分别是xi

yi

的秩,

。如果两个变量的样本数据均无相同秩,或只存在较少的相同秩的情况,斯皮尔曼等级相关系数(9.3)例9-3某大学一年级10名本科新生高考总分与其家庭社会经济地位等级如下。试问学生的高考总分与其家庭社会经济地位之间的关联度如何?学生的高考总分与其家庭社会经济地位之间的斯皮尔曼等级相关系数为

0.205

。这一结果反映学生的高考总分与其家庭社会经济地位具有一定的

正相关性,即一般来说,家庭社会经济地位越高,学生高考成绩也越高。0.205解:将n=10及上表中的数据代入公式,得:o

肯德尔和谐系数是计算多列等级变量相关程度的一种相关量。o

斯皮尔曼等级相关是计算两个等级变量的相关程度的相关量。用于评

价时只适用于两个评分者评价n个人或n件作品,或是同一个人先后两

次评价n个人或n件作品。肯德尔和谐系数

--斯皮尔曼等级相关系数o

肯德尔和谐系数则适用于多列相关的等级数据。o

可以是k个(k>2)评分者评n个人或n件作品,也可以是同一个人先后k次

评n个人或n件作品。通过求得的肯德尔和谐系数,我们可以较为客观地

判断评价结果的一致性程度。肯德尔和谐系数用W表示肯德尔和谐系数,我们分两种情形给出W的计算公式。①

同一评分者无相同等级评定时的W公式

(9.4)式中n是被评的对象数目,k是评分者的人数或等级变量的列数,S是每一

个被评对象所评等级之和Ri

与所有这些和的平均数R

的离差平方和.肯德尔和谐系数

W的变化范围是

0

W

1

。肯德尔和谐系数(9.5)即教师作文1作文2作文3

作文4

作文5

作文6教师1

教师2

教师3

教师4

教师5111212321232335445445645365666Ri61016

21

23

29同一评分者无相同等级评定的情况

教师作文1作文2作文3

作文4

作文5

作文6教师1教师2教师3教师4教师5111112222233333444445555566666Ri51015

2025

30

K个评分者的评价完全一致的情况(W=1)例9-4某高校硕士毕业论文答辩,需要4位答辩评委对5名同学的论文评定

等级,结果如下,试求其评分者的信度。

同一评分者无相同等级评定的情况解:由教育测量学中信度理论知,求评分者的信度

即是求k个评分者对n篇作文评价的一致性程度,因而

我们可以求其肯德尔和谐系数。将上表中的数据代入

公式,可得:即评分者的信度系数为0.813

,表明他们的评定结果

有较大的一致性。

其中k

、n和S的意义与(9.4)式相同.当同一评分者对n个对象的评定出现相同等级时,肯德尔和谐系数的计算公式为同一评分者有相同等级评定的情况(9.6)

mi

为第i个评价者的评定结果中有重复等级的个数,nij为第i个

评价者的评定结果中第j个重复等级的相同等级数。同一评分者有相同等级评定的情况例9-54名专家对5位教师课题成果评定等级的结果见下表,试计算4名专

家对课题成果评价标准掌握的一致性程度。所以,4名专家评定结果的肯德尔和谐系数为0

.676

,

说明专家的评价结果有较大的一致性。同一评分者有相同等级评定的情况

o

如果一个点数列中的点与一个“二分”数列的点存在一一对应的关系,

则称这两个数列为点二列或点双列。o

点二列相关法就是考察连续变量(其观测值为点数列)与“二分”称

名变量之间的相关程度的统计方法。点二列相关法点二列相关是求“二分”称名变量与连续变量之间的相关系数rpq

,其

公式为:rpq

=

(9.8)p表示“二分”称名变量中取某一值的比率;

q表示“二分”称名变量中取另一值的比率;Y

p

表示与p部分相对应的连续变量的观测数据的平均值;

SY

表示连续变量全部观测值的标准差,即

点二列相关法o

点二列相关系数在教育测量研究中常作为是非题的区分度指标。o

试题的区分度是指试题对于被试反应的区分程度和鉴别能力。通常用

某试题的得分与测验总分之间的相关系数来表示。o

是非题的区分度是求一个二分变量(是非题得分)与一个连续变量(

测验总分)的相关系数。

是非题的区分度o

例9-6

某校教育学院100名学生参加大学英语六级测试,其中一道是非题答对的有60人,答错的有40人,该题答对的那些学生的六级考试得分

的平均值为500

,该题答错的那些学生的六级考试得分的平均值475

100名学生六级考试得分的标准差为15

,试求该题的区分度。是非题的区分度解:由题意,答对该题的人数比率p=60/100=0

.6,

答错该题的人数比率

q=40/100=0.4

。Y

p

=500,Y

q

=475,

SY

=

15,将这些数据代入公式,可得:该是非题的区分度为0.816。是非题的区分度o

区分度Do

D

0.4

非常好o

0.30

D

0.39

良好o

0.20

D

0.29尚可,须修改试题o

D

0.

19差,

需被淘汰区分度的评价例9-7

某小学四年级男女学生20人的数学成绩如下表,问数学成绩与性别

是否有关?点二列相关法解:上表中“

1

”代表男生,

“0”代表女生。男生的比率p=

10/20=0.5

,女

生的比率q=

10/20=0.5。F,=80,F,=79,

S,=10.5.所以,20名学生性别与数学成绩的相关系数为0.048

,由于此值接近于0,

因此,20名学生的数学成绩优劣与性别无关。点二列相关法o

二列相关用于考察两个正态变量的相互关系,但是一列是一个连续变量的观测值(等距或等比数据)

,另一列则是一个连续变量人为地按

一定标准划分为两个类别的数据,即人为地被划分成一个二分变量。二列相关法

X

p

表示与p部分相对应的连续变量X的观测数据的平均值;X

q

表示与q部分相对应的

连续变量X的观测数据的平均值;SX

表示连续变量X全部观测值的标准差;Y表示标

准正态曲线下p与q交界点处的纵线高度,求法是:依据|0.5-p|的值,查标准正态分布表

,

P栏中该数值所对应的Y值就是所求的纵线高度。二列相关系数

rb

的计算公式是:

式中:p表示二分变量中取某一值的比率;q表示二分变量中取另一值的比率;(9.9)

二列相关系数在教育测量研究中常作为问答题的区分度指标。问答题的区分度例9-8

下表为10名学生阅读测试总分和其中一道问答题的得分,试求该问

答题的区分度(该问答题满分为10分,得6分或6分以上则认为该题通过)。问答题的区分度解:问答题被人为地划分为通过、不通过两类,

因此,求该问答题的区分度需求二列相关系数rb。p

=5/10=0.5,q=5/10=0.5,Xp=80.6,X

q=64,SX=9.571,查标准正态分布表可

知,

当p=0.5,|p-0.5|=0时,Y=0.399。将这些数据代入式(9.9),可得

所以,该问答题的区分度为1.087,非常高。问答题的区分度o

测度一个称名变量与一个等距变量的相关程度。o

例如测量性别与数学成绩的相关程度。

Eta系数

o

例9-9某小六年级男女学生20人的英语成绩如下表,问英语成绩与性别是否有关?

1”代表男生,

“0”代表女生)o

由题意可知,称名变量

X有两个取值即0和

1

。当

X=0

时,Y的取值包含十个数值,即

79

,77

,63

,92

,58

,88

,82

,78

,91

,80

,这十个取值的均值为78.8;当

X=

1

时,Y的取值同样包含十个数值,即

85

,78,

62

,89

,60

,91

,83

,87

,88

,82

,这十个取值的均值为80.5

。Y的总

平均

Y

为79.65

。通过代入公式,我们可以计算出

Y(学生英语成绩)与

X(性别)的关联程度为0.081

,两者关联度很低,说明学生英语成绩

与性别无关。o

偏相关(partial

correlation)分析是研究在消除第三变量(或其它多个变量)影响之后的两个变量之间相关程度的方法。偏相关分析

ll

偏相关系数(partialcorrelations)

o

偏相关系数:它描述的是当控制了一个或几个附加变量的影响时两个变

量的相关性。例如可以控制工龄的影响,来研究工资收入与受教育程度

之间的相关关系。简单相关系数偏相关系数工资工龄教育2,3

=

(9.

11)式中,r12,3表示在剔除了变量X3

的影响之后,变量X1

与变量X2之间的偏

相关系数;r12表示X1

与X2之间的简单相关系数;r13表示X1

与X3之间的简

单相关系数;r23表示X2

与X3之间的简单相关系数。偏相关系数与公式(9.

11)类似,变量

X1

、X在2剔除变量

X、3

影响之后的偏相关系

数r12

,3用4

以下公式计算:2,34

=

(9.

12)偏相关系数例9-10某高校某班教育学专业本科生共30人,教育学原理(X1)、教育研究方法(X2)、教学论(X3)的考试成绩如下表。试通过该班情况分

析这三门课之间的相关关系。偏相关系数示例

偏相关系数示例

解:由表9-9中的数据,我们可以利用具有统计运算功能(LR)的计算器得出:r12=0.075,r13=0.

144,r23=0.

128

。将这些数据代入式(9.

11),可得

r12,3==0.058类似可计算出:r13,2=

0.144−0.075×0.128

=0.

136r23,

1=

0.128−0.075×0.144

=0.

1191−0.0752

1−0.12821−0.0752

1−0.1442零假设:总体中两个变量间的相关系数为0。SPSS的相关分析过程给出该假设成立时统计量的相伴概率p

。常用公式

如下:

相关系数的显著性检验(9.

13)(9.

14)式(9.

13)是皮尔逊和斯皮尔曼相关系数假设检验t值计算公式。其

中,r是样本相关系数;n是样本量;n-2是自由度。当t>t0.05(n-2)时,p<0.05,则拒绝零假设,否则接受零假设,即总体中两变

量的相关系数为0。相关系数的显著性检验式(9.

14)是偏相关系数假设检验t值计算公式。其中,r是相应的偏相关

系数;n是样本量;k是控制变量的数目;n-k-2是自由度。当t>t0.05(n-k-2)时,p<0.05,则拒绝零假设,否则接受零假设,即总体中两

变量的偏相关系数为0。相关系数的显著性检验o

Analyze的下拉菜单中的Correlate

命令项具有三个相关分析功能子命令Bivariate

,Partial

,Distances

,

它们分别对应着二元变量间的相关分

析、偏相关分析以及距离测度分析的三个SPSS

过程。相关分析的SPSS过程Analyze——correlate——bivariate(二元变量)口打开对话框;口选择两个变量或更多的变量;口Correlationcoefficient栏中3个复选项n

Pearson:连续变量n

Kendall’s

tau-b:两个等级变量n

Spearman

:两个等级变量

(系统将会自动对变量值求秩)口Testof

significancen

Two-tailedn

One-tailed口

Flagssignificantcorrelations:加星号

二元变量的相关过程

o

用SPSS计算小学男教师职业认同感与工作满意度的相关系数。o

数据文件9-2.savo

Analyze-Correlate-Bivariate

…积差相关示例

结果表明,小学男教师的工作满意度和职业认同感的Pearson相关系数为0.781

,不相关的假设成立时的统计量相伴概率近似于0

“**”表示在

0.01的水平上,它们的相关系数有显著意义。o

利用SPSS计算大学一年级本科新生高考总分与其家庭社会经济地位等

级之间的关联度。o

数据文件9-3.sav。o

Analyze-Correlate-Bivariate

斯皮尔曼等级相关示例结果表明,大学一年级本科新生高考总分与其家庭社会经济地位等级之

间的相关系数为0.606

,但不相关的假设成立时的统计量相伴概率为0.063。

因此,该相关系数在0.

1水平上显著,在0.05水平上并不显著。Kendall和谐系数示例

o虽然Correlation

Coefficients

选择栏中有

Kendall

t

tau-b选项,但此选项并不是Kendall

和谐系数,它与

Spearman

相关类似,也是用来测量两个定序变量间的相关

程度。o

SPSS20.0版本中无法给出肯德尔系数的具体数值,因此若要获得

4位答辩评委对5名同学的论文评定等级的评分者的信度,我们可以依次在

SPSS

16.0

中进行如下

操作。o

数据文件o

Analyzecs-KRemlKendall和谐系数示例o

结果表明

Kendall’s

W值为

0.812

,相伴概率为

0.011

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论