教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用

上传人：q*** IP属地：山东上传时间：2024-12-04 格式：PPTX 页数：139 大小：8.15MB 积分：15 举报 版权申诉

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用_第2页

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用_第3页

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用_第4页

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用_第5页

已阅读5页，还剩134页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

教育统计学推断统计的基本概念与

参数假设检验学部本科科生课课程

北京师范大学教育学部胡咏梅统计学、描述统计、推断统计假设检验的原理与步骤单样本的t检验两个独立样本的t检验配对样本的t检验3o

统计学是一门收集、整理、显示和推理分析数据的科学，其目的是探

索数据内在的数量规律性。o

简言之，统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

描述统计

推断统计1.统计学的概念

描述统计（descriptive

statistics)：研究如何整理原始数据资料，描述数

据的全貌的方法

。o目的在于使得杂乱无章的数据更好地显示出事物或现象的某些特征，

有助于说明事物或现象的本质。描述统计的概念

集中趋势（算数平均数、加权平均数、几何平均数、中位数、众数等）o

离散趋势（方差、标准差、四分位差、极差、差异系数等）o

数据分布的表与图（频数分布表、分组频数分布表、累计频数分布表、

条形图、饼图、直方图等）描述统计的方法o

推断统计（inferential

statistics)：研究如何利用样本数据推断总体特征

的统计学方法。o

严格地说，推断统计是一种依据随机样本数据，从局部推断总体，即对

总体的某些特征进行推断、估计和预测。推断统计学主要包括参数估计

、假设检验和多元统计分析三部分。推断统计的概念o

对于数字特征量的估计（参数估计：点估计、区间估计）o

对于单样本或两个样本的总体特征参数取值特点的假设

（H0

:μ

μ0

;

μ1

μ2)o

多个样本所来自的总体均值是否相等（方差分析，ANOVA）o

变量间关联性的预测（相关分析）o

将变量关系模型化（回归分析）o

对未来观察的预测（时间序列分析）o

数据挖掘（如聚类分析、探索性因子分析等）推断统计的方法o

基本概念o

假设检验是根据样本信息来判断总体分布是否具有指定特征的统计推

断方法。2.假设检验的原理与步骤o

基本概念o

根据检验假设时是否需要利用总体分布形态方面的信息，假

设检验可分为参数假设检验和非参数假设检验两大类。o

参数假设检验是在总体分布形态已知时，对总体某个未知参

数值的假设所作的检验。2.假设检验的原理例如，已知某个样本的均值为

μ0

，它来自一个正态总体（

N(μ,σ

)），其中μ未知，问是否有理由说它来自均值为

μ0

的正态总体？检验假设：μ

μ0参数假设检验已知两个相互独立的样本，它们分别来自两个正态总体(X1

~N(μ1

)，X2

~N(μ2

)），其中μ1

、σ1

，μ2

、σ2

均是未知数，

能否说这两个总体的均值相等或方差相等？检验假设：μ1

μ2

或σ

σ22122212参数假设检验非参数假设检验是在总体分布形态未知（其实也不需要知道总体的分布形态）的情况下，对总体分布函数的类型或它的某些特征提出某种假设

所进行的检验。检验某样本所属总体是否服从正态分布；检验两个样本所属总体的分布

是否相同；检验两个样本来自的总体取值的平均状况是否有显著性差异

等等。非参数假设检验o

零假设是关于当前样本所属的总体（在参数值或分布形式方面）与原设总体（在参数值或分布形式方面）无区别的假设。它往往是研究者

根据样本信息期待拒绝的假设。一般用H0表示零假设。o

例如H0：样本所属总体服从正态分布。零假设和备择假设o

备择假设是指与零假设相互对立的假设。它是关于当前样本所属总体（在参数值或分布形式方面）与原设总体（在参数值或分布形式方面）不同的假设。而且它是当否定了零假设之后，应当接受的假设。一般用

H1表示备择假设。o

例如，H1：样本所属总体不服从正态分布。备择假设

先建立一个零假设H0

，然后在H0成立的条件下，看看会产生什么样的后果。如果经过一系列正确的逻辑推理和分析计算之后，导致了一个

不合理的现象出现，就有理由认为原先的零假设H0

是错误的，应当否

定H0；如果没有出现不合理的现象，那我们就没有充分的理由否定H0。

所以，就应当接受H0。假设检验的基本思路o

小概率事件在一次试验中不可能发生。

如果在一次试验中，小概率事件居然发生了，我们就认为是不合理的现

象，就有充分的理由怀疑其零假设的前提是不正确的，因而应当拒绝零

假设。不合理的现象

在统计学中，一般是将概率小于或等于α的事件，称为小概率事件。o

通常规定α=0.05或α=0.01。o

在假设检验中，零假设是否成立与α的大小是有关系的，称α为显著性

水平。小概率事件o

在假设检验中，

“小概率事件”是指样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的显著性水平α

这时，就认为小概率

事件发生了。把出现小概率的随机事件称为小概率事件。小概率事件

例8-1：某高校对男、女生每日平均锻炼时间进行统计，分别随机抽取了20名男同学和女同学，他们平均日锻炼时间数据（单位：小时）如下表。（8.

1）(7.16)其中n=20

，即统计量服从自由度为2n-2的t分布。此时，若选定

α=0.05，则对于满足概率

P{|t

tα

(2n

一

2)}

的临界值tα/2(2n-2)

，可查t分布表df=30和df=40时的临界值,并估算出tα/2(38)≈2.025。我们可以计算出:

因为小概率事件“

|t|>2.025”发生了，所以，拒绝H0

μ1

μ2

，接

受其备择假设

μ1

≠

μ2

，即认为该校男女生日平均锻炼时间是有显著

差异的。由式（8.

1）所确定的统计量t的值域{t:|t|>

tα

(2n

2)}我们称之为

μ1

=μ2

的拒绝域，它的余集{t:|t

|≤tα

(2n

2)}

被称为H0

的接受域。即当样本统计量t的值落入拒绝域时，我们要拒绝零假设H0

；当样本统计

量t的值落入接受域时，我们要接受H0

，即认为

μ1

μ2是相容的。拒绝域和接受域

1.建立零假设，如前例

μ1

μ2

。2.在假定零假设成立的前提下，选择合适的检验方法及检验统计量。3.计算给定样本的统计量值。4.选定显著性水平α

查统计量所服从的分布表来确定临界值，从而确定H0

的拒绝域和接受域。5.对H

作出判断。将临界值与样本统计量值相比较，若统计量值落在H0

的拒绝域中，则拒绝H0

；若统计量值落在H0

的接受域中，则接受H0。23假设检验的一般步骤o

Analyze——Compare

Means（均值比较）——T

test（T检验）

按不同的比较方式，T

test分为3个子过程：o

One-Sample

Test(单样本的T检验)o

Independent-Samples

Test（独立样本的T检验）o

Paired-Samples

Test（配对样本的T检验）。参数假设检验的SPSS模块单样本的T检验是检验来自正态总体的一个样本的总体均值与一个给定常数之间的差异是否显著，即检验假设

=μ0

是否成立，这里μ

、μ0

分别为总体均值和给定的常数。

3.单样本的t检验设

、x2

…，xn

是来自正态总体N(μ,σ2

)

的样本，其中

和σ

均未知。如果假设H0

μ0

成立，则由（7.8）知，统计量

（8.2）服从自由度为n-1的t分布，其中

、S

分别为样本均值和样本方差，n

为样本容量。若

|>tα

(n—1)，则拒绝

；若

|≤tα

(n—1)

，则接受

。3.单样本的

t检验例8-20•8-1.sav•Analyze→Compare

Means→

One-Sample

Testo

两个独立样本的T检验是用以检验服从正态分布的且相互独立的两个样本的总体均值之间的差异是否显著的假设检验问题。设有两个服从正态分布的相互独立的总体X和Y，X

(

μ1,

)

(

μ2

)。分别从这两个总体中抽取两个

随机样本：x

、x

…，x

，y

、y

…，y

。通过这两个样本的数据信息来推断出两个总体均值差异是否显著的结论，即需要检验假

设

。224.两个独立样本的t检验在未知两个总体的方差信息时，必须先通过F检验来考察一下两总体方差之间的差异是否显著，即要先对两总体方差进行齐性检验，检验假设

。22124.两个独立样本的t检验

如果假设

成立，则统计量S

2212方差齐性检验（1）如果其相伴概率p≤

则拒绝H0

，即认为两个正态总体的方差差异显著。此时，对于H0

μ1

=μ2，我们需要进行方差非齐性下的T检验，构造如下

的t检验统计量：

令

，

则上式中的自由度

如果t统计量的相伴概率p≤α

则拒绝H0

μ1

μ2

；否则，接受H0

.2212方差非齐性下的两个独立样本的T检验

（2）如果统计量F的相伴概率p>α

则接受H0

，即认为两个总体的方差相等。此时，对于H0

μ1

μ2，我们进行方差齐性下的T检验，

构造如下的t检验统计量：

如果t统计量的相伴概率p≤α

则拒绝H0

μ1

μ2

；否则，接受

。2212方差齐性下的两个独立样本的T检验例8-3某小学对五年级学生开展语文教学改革试验,选取甲、乙两个平行班作试点,每班各25人。甲班用传统的教师讲授的教学方法,

乙班采取学生

自学和师生相互讨论的新的教学方法。一学年后,用同一份试题对两个班

的学生进行语文测验,得到的成绩如下表所示。问:这两种教学方法的效果

是否有显著性差异(α=0.01)?

数据文件8-2.sav

学生语文成绩记为变量score

，分组变量名为tmehod

，其值为“

1”,表

示为传统教学法，其值为“2”

，表示为新教学法(变量值标签为：1=“传统教学法”

，2=“新教学法”)。

Analyze→Compare

Means→Independent

Samples

Test

…方差齐性下的两个独立样本的T检验

方差齐性检验（Levene检验）：F统计量的值为0.641

，其相伴概率为p=0.427>0.05

。因此，采用两种不同教学方法下学生的语文成绩变量

的方差是齐性的。在T检验结果中应该选择Equal

variances

assumed（假设方差相等）一行的数据作为此例的T检验结果数据（如若

Levene检验结果表明方差非齐性，在T检验结果中应该选择Equal

variances

not

assumed一行的数据作为T检验结果数据）。

t统计量的值为

-2.804

，相伴概率为p=0.007<0.01

，因而拒绝零假设，即得出采用两种教学方法下学生语文成绩存在显著性差异的结论。结论•第二个表格还给出Mean

Difference

两组均值之差，值为-8.480

，即采用新教学法下学生的语文成绩比采用传统教学法的学生的语文成绩高8.480

分。•Std.Error

difference差值的标准误为3.02465

。两种教学方法下学生语文成

绩得分均值之差的95%的Confidence

Interval

the

Difference置信区间[-

16.59274

，-0.36726]也列在该表中。结论o

进行配对样本的T检验要求被比较的两个样本具有显著的相关关系，而

且它们的样品能搭配成对。o

一类配对样本是对同一组被试对象在实验前后两次测试所获得的数据；o

另一种配对样本是按某些条件基本相同的原则，经过一一配对而成的两

组被试对象，实施不同的实验处理之后，所得到的两组测试结果数据。5.配对样本的t检验

配对样本的T检验实际上就是比较不同处理的效果差异是否显著，即检验服从正态分布的配对样本的总体均值是否相等，即

μ1

=μ2其检验统计量为

其中n为样品对数。X

1、X2

分别为两个样本的均值，S1

、S2

分别为两个

样本的标准差，r

为两个样本的相关系数。如果该统计量的相伴概率p≤α

则拒绝

μ1

=μ2

；如果p>α

则接受

μ1

μ25.配对样本的t检验（Paired-SamplesT

Test

）o

例8-4

为了检验某种识记方法的效能，对某班15名学生进行了一周的识记训练，他们在接受识记训练前后的识记成绩如下，问这种识记训练

是否真的有效？

(α=0.05）5.配对样本的t检验（Paired-SamplesT

Test

）•数据文件：8-3.sav•学生在参加识记训练之前的测验成绩记为变量prescore

，训练后的测验

成绩记为变量postscore。•待检验的假设为H0

μ1

=μ2•Analyze→Compare

Means→Paired→

Samples

Test

…46o

单击Options按钮•第一个表格给出了学生在进行识记训练前后的测验成绩变量prescore和postscore的描述性统计量：样本容量N

，样本均值Mean

，样本标准差Std.Deviation以及样本均值的标准误Std.ErrorMean

。从两个样本的均值和标准差数据来看，它们的方差差异不大，而它们的均值有一定差异。这说明采用这种识记

训练后，学生的成绩有一定提高。•第二个表格给出的是识记训练前后的测验成绩之间的相关系数：Correlation=0

836

，相伴概率

p=0.000<0.05

，因此可以得出识记训练前后的测验成绩之间存在显著的线性关系的结论。•第三个表格给出的是配对变量差值的T检验结果。均值之差为-6.000

，差值的标准差为8.39217

，差

值的均值标准误为2

16685

。差值的95%置信区间下、上限为-10

.64743和-1

.35257

。t统计量的值为-

2.769

，其相伴概率为p=0.015<0.05

。因此，我们应当拒绝零假设，即得出识记训练前后学生的测验成绩存在显著性差异的结论。结论1.试述假设检验的基本思路与一般步骤。2.某高校学生会欲通过调查学生平均每天上网时长了解该校男女学生的业

余生活情况,分别随机抽取了15名男女学生,他们平均每天浏览网页的时间

数据(单位:分钟)如下:试用数据文件“exe8-1.sav”计算能否据此数据就得出男学生与女学生

平均每天浏览网页的时间不相等的结论。作业3.

已知某年级学生的语文成绩X服从正态分布,即X~N

(μ0,σ2

),其中μ0=80,σ2

未知。现从该年级某班随机抽取20名学生的语文成绩,数据如下:

75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,91,95,88,87试用数据文件“exe8-2.sav”检验该班学生的平均语文成绩是否达到80分

(α=0.05)。作业4.为了考察某种阅读训练的效能,从某班学生中随机抽取30名学生对他们

进行阅读测验,然后让他们接受这种阅读训练。经过一段时间的训练后,

又对这30名学生进行了类似的阅读测验,两次测验成绩如下:试用数据文件“exe8-3.sav”检验阅读训练前后的测验成绩是否有显著性

差异(α=0.05)。作业相关分析及其应用学部本科生课程北京师范大学教育学部胡咏梅教育统计学相关概念常用的相关分析方法相关分析的SPSS过程相关分析在教育与心理研究中的应用contentso

确定性关系：

是通常的函数关系

，如圆的面积与半径之间的关系：

S=πr2o

非确定性关系：即相关关系。例如，人的身高与体重之间的关系。一、相关概念o

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用

文档简介

温馨提示

最新文档

评论

教育统计学 课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用

文档简介

温馨提示

最新文档

评论

相关文档

教育统计学课件第11次-推断统计的基本概念与参数假设检验；第12次-相关分析及其应用