2025年4月自考00452教育统计与测量押题及答案_第1页
2025年4月自考00452教育统计与测量押题及答案_第2页
2025年4月自考00452教育统计与测量押题及答案_第3页
2025年4月自考00452教育统计与测量押题及答案_第4页
2025年4月自考00452教育统计与测量押题及答案_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计与测量

课程代码:00452

考生须知:

1、参考教材:《教育统计与测量》,高等教育出版社,赵德成主编,2018年版。

2、特殊标记含义:P10代表教材页码第10页;“【】”等标注的代表此处为重点关键词(得分点)。

一、单项选择题+判断题+简答题

1、教育统计学是教育学、心理学与统计学相结合的一门【交叉学科】P42

2、依据统计的功能将教育统计学的内容分为P43

(1)【描述统计】主要研究的问题是,如何把调查得来的数据加以整理、归类、概括和表述,以定量描述样本或总体的特征

(2)【推断统计】主要研究如何通过局部数据所提供的信息推断总体的情况,主要内容有【参数估计、假设检验、方差分析、卡方分析】

3、【桑代克】致力于以心理学与统计学为工具来研究教育问题,促进教育科学化。他撰写了世界上第一本有关教育统计的专著—【《精

神与社会测量学导论》】P43

4、任何测量都必须具备两个基本要素,分别是测量的【单位和参照点】P44

5、测量的参照点P45

(1)【绝对参照点】,如长度和重量测量

(2)【相对参照点】,如温度、海拔高度、学业成就、能力、人格、兴趣测量

6、教育测量的特点:【目的性、间接性、不确定性】P47

7、【桑代克】编制了世界上第一个标准化的教育成就测验。后人将其尊称为教育测量学之父。P48

8、数据的种类P56-57

(1)根据数据的来源,分成:①【计数数据】是以计算个数或次数获得的,多表现为整数。②【测量评估数据】是借助测量工具或评估

方法对事物的某种属性进行评估所获得的数据。③【人工编码数据】是人们按一定规则给不同类别的事物赋予相应的数字后所形成的

数据。

(2)根据测量水平,分成

①【称名数据】如在统计人口信息时,男性可用数字“1”来表示,女性可用数字“0”来表示

②【顺序数据】如根据班级期末考试的成绩可排出班级的第一名、第二名、第三名等

③【等距数据】如温度

④【等比数据】如身高体重

(3)根据数据分布的形式,分成【离散数据和连续数据】

9、数据的特点:【离散性、变异性、规律性】P58

10、对数据进行分类整理的原则:【分类标志应取决于研究目的;每一个分类标志应保持“单向”性】P58

11、【次数分布】是指一批数据中各个不同的数值所出现次数多少的情况,或是指一批数据中各个不同数值所出现的次数情况。P59

12、编制简单次数分布表的主要步骤:【求全距;定组数;定组距;写出组限;求组中值;归类划记;登记次数】。组中值是各组的

组中点在量尺上的数值,其计算公式为:【组中值=(组实上限+组实下限)/2】,例如在次数分布表中,分组区间“70~79”的组中值为

(69.5+79.5)/2=74.5。P59-61

13、【次数直方图】是在坐标轴上由一些高度不一、宽度相等的直方条排列形成的图案。P63

14、累积次数分布图可分为【直方图和曲线图】P65

15、数据向某点集中的趋势,称为集中趋势,在统计学中称其为集中量数。常用的集中量数:P78-82

(1)【众数】:出现次数最多的数值,用符号表示。优缺点:概念简单明了,不受到极端数据的影响。但不稳定,不能做进一步的

代数运算。

��

(2)【中位数】:是指在按大小顺序排列的一组数据中,处于【中央位置】的数,用符号或表示。计算方法:①N为奇数时,序

列号为【(N+1)/2】的数据;②N为偶数时,序列号为【N/2和(N/2)+1的数据和的均值】。

���𝑑

(3)【算数平均数】:是指一组数据的总和除以数据的总个数的商。计算公式:

①一组数据:�;②分组数据:为各组次数;为组中值

�=1�����

�=�=(���)

��

2

例:在一个样本容量为9,平均数为15的样本中,如果样本中新增一个值为45的个案,则新样本的平均数为

解析:根据公式�可得,,新增一个值为的个案,即新样本

�=1����

��

,,新�样=本��=1�=�×�=15×9=13545�=1�=135+45=

(4)【加权平均数】:是指当总体中各部分数据的权数不相等时,根据各部分数据的权数计算出的平均数。计算公式:

180�=10�=180/10=18

�为权重

�=1����

��=�(��)

16、众数�、=1中�位�数、平均数的关系:①当数据呈正态分布时,【】;②当数据呈正偏态分布时,

【】;③当数据呈负偏态分布时,【】

��=��=�

17、用来描述一组数据离中趋势或离散程度的量数即被称为【差异量数】。常见的差异量数:P91-96

�>��>���<��<��

(1)【全距】是指一组数据中的最大值与最小值之差,用符号R表示。计算公式为【】P92

(2)【百分位数】是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。用表示,即为

�=�𝑚�−��𝑑

第p百分位数。比如时,P=50则表示该次数分布表中有10%个案低于50分。中位数为第50百分位数,用表示。【百分

10��

位差】是用两个百分位数之间的差距来描述数据离散程度的差异量数。

�10=50�50

(3)【平均差】是一组数据中每一个数据与该组数据的算术平均数之差的绝对值的算术平均数,常用符号AD或MD表示。计算公式为

�=1��−�

(4)【方差】用符号S2表示,是指一组数据的离差平方的算AD术=平均数,即是各个原始数据与平均数之差的平方和除以总次数所得的商。

计算公式为

�2

2�=1(��−�)

(5)【标准差】是方差的平方根,是一组数据中每个数据与�其=算术平均数之差的平方的算术平均数的平方根,用符号S表示。

�2�2�2

�=1(��−�)�=1���=1��

�==−

18、方差和标准差都具有【可加性】,即在已知多组数据�的方差或标准差�的情况下,�可以计算其总方差或总标准差。P97

19、标准差的性质P98

(1)将全组数据中的每一个原始数据都加上一个相同的常数C后,新数据的标准差不变,与原数据的标准差【相同】

(2)每一个原始数据都乘以一个相同的非零常数C后,新数据的标准差为原有数据的标准差【乘以这个常数C的绝对值】

(3)对每一个原始数据作线性变换,即乘以相同的非零常数C,再加上相同的常数d,新数据的标准差为原有数据的标准差【乘以这个

常数C的绝对值】

20、标准差的应用P99-101

(1)【差异系数】是指数据的标准差与算术平均数的比值,用符号CV表示。差异系数【无单位】,可适用于不同质的数据的研究和比

较。计算公式为

S

(2)【标准分数】C是V原=始X数×据10与0平均数之差除以标准差得到的商,用符号Z表示。计算公式为。标准分数的取值可以为【正数、

��−�

零和负数】Z=S

21、事件的关系P107

【包含关系】:事件A的发生必然会导致事件B的发生,如事件A为“掷出的点数为1”,事件B为“掷出的点数为奇数”

【相等关系】:事件A与事件B是同一个事件,如事件A为“掷出的点数为奇数”,事件B为“掷出的点数为1,3,5”

【事件的和】:事件是由事件A与事件B至少有一个发生而组成的

【事件的积】:事件是由事件A与事件B同时发生而组成的事件

【互斥事件】:事件A与事件B不可能同时发生,如事件A为“掷出的点数为2”,事件B为“掷出的点数为奇数”

【对立事件】:不可能同时发生,但其中一个事件必然会发生的两个事件,如事件A为“掷出的点数为偶数”,事件B为“掷出的点

数为奇数”。【对立事件不等于互斥事件,互斥事件未必对立,但对立事件一定互斥】

3

22、事件的概率P108-110

【古典概率】是指随机事件中各种可能发生的结果及其出现的次数都可以由演绎或外推法得知,而无需经过任何统计试验。具有等可

能性、可知性、有限性的特点。

【统计概率】需要用事件出现的频次与随机试验的总次数之间的比率来推测概率的大小。

【主观概率】是指人们对一些无法重复的试验、只能根据以往的经验,人为确定这个事件的概率。如求一名高中生考入大学的概率。

23、正态分布的性质P116

①正态分布曲线【以μ为对称轴对称分布】

②曲线的坡度由σ决定,【σ越小,曲线越陡峭,σ越大,曲线越平缓】。曲线的中心位置由μ决定,【μ越大,位置越靠右】

③正态分布曲线与横轴所围的【面积为1】

④正态分布为一族分布。所有正态分布都可以通过Z分数转化为均值为0,方差为1的标准正态分布

⑤在正态分布曲线下,标准差与概率存在一定的数量关系。

24、【二项分布】主要应用于离散型随机变量的分布。当二项分布接近正态分布时,成功次数的平均数【】,成功次数的标准

差为【】P118-120

�=��

例:某次考试全部40题都是四选一的选择题,小明随机写答案,理论上小明能答对多少题,标准差是多少?

�=���

解析:答对的概率为p=1/4,答错的概率为q=3/4,因此,

25、【总体】是一个研究中依据研究目的而确定的所有想要研究的个体(或事件)的集合。P124

�=40×1/4=10�=40×1/4×3/4=2.74

26、【参数】是描述总体特性的值,一般用希腊字母表示。【统计量】是描述样本特性的值,一般用拉丁字母表。总体的参数值是唯

一确定的,统计量的值是随着样本的不同而发生改变的。P125

27、【非概率抽样】是指研究者依据自身的经验或抽样方便程度,有目的、主观地选择一部分个体作为样本。常见的非概率抽样有:

【典型调查、重点调查以及方便抽样】P127

28、概率抽样是要求总体中的每个个体都有一定的概率被抽中,遵循【随机性原则】P127

29、任何一个抽样都会存在误差,称为【抽样误差】。抽样误差的来源有:【①抽样方法②样本(抽样)的随机性】。抽样误差是无法

完全避免的,只能尽量加以控制一般来讲,控制抽样误差方法:【①选择适当的抽样方法;②增加样本容量】P127-128

30、常见的概率抽样方法P128-131

(1)【简单随机抽样】:最基本的抽样方法,操作简便,适用性。包括两种方法:【抽签法;随机数法】

(2)【系统抽样】也称等距抽样,将总体的个体按照一定次序排列,以总体和样本容量的比值为间隔,从某一个数开始,按照间隔抽取

个体,组成样本。

(3)【分层随机抽样】:当总体中的个体间差异很大,而且能够根据这些差异将总体分成明显的几个亚群体时,适合采用分层抽样方法。

例如由于男生更喜欢运动,因此在调查大学生的运动时间时应考虑按照男生和女生两个层来进行分层抽样。

(4)【整群抽样】:是指将总体按照一定的规则或标准分成若干个群,然后抽取其中一个或几个群,以这些被选中的群里的所有个体作

为样本。

31、在其他条件都相同的情况下,样本容量越大,抽样误差越小,但【当样本达到一定的容量后,继续增大样本量的必要性不大】。

一般来讲,样本容量【n>30】的样本即可被称作大样本。P131

32、【总体分布】是指总体内个体观察值的次数分布或概率分布。总体分布是不容易直接获得的,需要通过样本信息去推断总体的情

况。【样本分布】是指样本内个体观察值的次数分布或概率分布。【抽样分布】是指在同一总体下,相同样本容量的所有可能样本的

某个统计量观察值的理论概率分布。样本的所有统计量都会有其相应的抽样分布。P132

33、【标准误】:样本平均数分布的变异性,即样本平均数分布的标准差。一般用表示,公式为。标准误的大小会受到【样

本大小和总体标准差】的影响。样本量越大,标准误就越小;总体标准差越低,标�准�误就会越小。�P�13=5�

34、t分布P136

(1)统计学者高赛特提出的

(2)t统计量的公式为

�−�

(3)特征:【①均值为�0=;�②/以�0为中心,是左右对称的单峰分布。③是一簇曲线,它的形态变化与自由度df=n-1的大小有关(与正态

分布曲线的不同之处)。由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近正态分布曲线。④随着自由度增大,t分布逐

渐接近正态分布】

4

35、【参数估计】是通过样本统计量来推断未知总体参数的推论性过程,方法包括【点估计和区间估计】。【点估计】是用某一样本

统计量的值来估计相应总体参数的值。P142

36、最优点估计的标准P142-144

(1)【无偏性】:多个样本统计量的值与总体参数值偏差的平均数为0

(2)【有效性】:通过样本统计量的抽样分布方差来度量

(3)【一致性】:当样本容量n增加,且趋于总体容量N时,样本估计量的值应能够越来越接近它所估计的总体参数值

(4)【充分性】:估计量提供了包含在样本中有关参数的全部信息

37、【显著性水平】是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。【1-α】为置信概率或置信水平。【置

信区间】是指在某一置信水平下,总体参数所在的区域距离或区域长度。P146

38、在样本容量一定的情况下,对总体参数进行区间估计时,提高估计正确概率的和缩小区间估计的范围是【矛盾的】。在统计分析

中,通常是在保证一定置信度的前提下,尽可能提高精确度来达到妥协的目的,即可以通过减小标准误的方式来缩短置信区间的长度。

P148

39、假设检验以【小概率事件】为基本思想,允许研究者利用样本信息,在一定的概率范围内对总体参数或分布的某一假设做出拒绝

或保留的决断。P156

40、在进行假设检验时,我们通常使用的方法是“证伪”。一般将我们不希望出现的假设定为【零假设(也叫虚无假设、原假设)】,

一般用H0表示;通常虚无假设表达的是不存在改变、没有处理效应或者没有差异。与零假设相反的假设称为【备择假设(也叫研究假设、

对立假设)】,一般用H1表示;备择假设陈述了存在改变、有处理效应。P157

41、在概率论中,【小概率事件】是发生概率非常小(基本为零或者接近零)的事件。但是根据墨菲定律,无论事件发生的概率多小,

只要大量重复独立进行,就有发生的可能,这也是小概率事件和不可发生事件之间的区别。P157

42、在进行假设检验时,【同时减少两类错误是矛盾的】。如果降低显著性水平,α取较大的值,那么可以减少不真实假设被保留的

概率,但是也增加了真实假设被拒绝的概率;如果提高显著性水平,α取较小的值,那么可以减少真实假设被拒绝的概率,但是也增

加了不真实假设被保留的概率。P159

43、当显著性水平一定时,【单侧检验临界值的绝对值要小于双侧检验的临界值】,拒绝的概率增加了。P162

44、【独立样本t检验】基于两个独立样本的数据,用来推断两个样本分别所在两个总体的均值是否有显著性差异。P166

45、统计上检验两个或者多个总体的方差是否有显著性差异时,所进行的检验称为【方差齐性检验】,又称为F检验。对于两个独立

样本,如果没有明确其总体方差是否相等时,要进行方差齐性检验。P171

46、在教育实验中,研究者通常会比较实验处理前后同一样本或者相关样本的平均数是否有差异,这就是【相关样本平均数的t检验】

或者说配对样本平均数的t检验,比较的是两个相关样本的平均数差异。P168

47、【方差分析】是由英国统计学家费舍提出的,用于评估两个及以上的总体平均数的差异。例如,探讨不同教学法(讲解法、示例法

和任务法)对学生学习成绩的影响。方差分析主要是通过探究样本数据的变异来源,来衡量总体均值间的差异。P179

48、【因素】即自变量,指我们在研究中感兴趣的一个变量,我们可以通过操纵改变,来探究它对因变量的影响,如教学方法。【水

平】指每一个因素所包含的状态或等级,也就是自变量所取的不同的值,每个因素至少要有两个或两个以上的水平,如父母教养方式

可以分为民主型、专制型、放任型三个水平。P179

49、总体数据的变异可以分为:【组内变异】是由偶然因素引起的;【组间变异】是由偶然因素和处理效应引起的。P181

50、F分布可以用于【方差分析、协方差分析、回归分析】P181

51、方差分析的基本假定:【总体服从正态分布;变异的可加性;方差齐性】P183

52、与方差分析有关的实验设计P183

【完全随机设计】:又称组间设计、被试间设计。将被试分成若干组,每组接受一种处理,不同组的被试接受不同的处理

【重复测量设计】:又称组内设计或被试内设计,每个被试接受所有的实验处理,重复进行测量

【混合设计】:是完全随机设计与重复测量设计的混合

53、【单因素重复测量设计】也称为单因素被试内设计,适用于只有一个自变量。P187

54、【效应大小】:组间平方和占总平方和的比例大小,即数据总的变异在多大程度上是由处理效应引起的。方差分析中常用的效应

值为。是能够被解释的方差的百分比,是处理间变异占总变异的百分比。计算公式为。P194

55、【2相关2关系】是两个或多个变量在数量变化上所呈现出来的规律。P1992

���=���/SST

56、相关的分类P199-200

5

(1)从相关程度的角度划分,分为【完全相关、不完全相关和零相关】

(2)从相关方向的角度划分,分为:①【正相关】:在一定范围内,随着某一变量数值的增大或减小,另一变量数值变动呈现与之相同

的趋势,即同增同减。②【负相关】:在一定范围内,随着某一变量数值的增大或减小,另一变量数值变动呈现与之相反的趋势。P200

57、相关系数r的取值在【-1到+1】之间,有正有负。P200

(1)当r值为正数时,说明两个变量呈正相关

(2)r值为负数时,说明两个变量变量呈负相关

(3)当两个变量完全相关时,r值为【±1】

(4)两个变量相关程度越高,r值就会越接近±1。相反,两个变量相关程度越低,r的数值越接近0

(5)若r值为0,则两个变量【零相关】

58、【积差相关(最常用)】是英国统计学家【皮尔逊】提出的一种计算相关系数的方法,也被称为皮尔逊相关。积差相关描述的是【两

个正态连续变量】之间线性相关的程度和方向。P201

59、【肯德尔和谐系数相关分析】适用于多变量等级资料的相关关系。它常用来表示几个评定者对同一组学生的学习成绩等级评定的

一致性程度。P210-211

60、在相关分析中,对于连续变量与只有两个类别的类别变量(二分变量)的相关分析可以采用【点二列相关分析】P213

61、对于任意两个变量,可利用相关分析来探究两者的关系,但是并【不是任意两个变量都可以进行回归分析】P216

62、一元线性回归分析主要包括以下几个步骤:【建立一元线性回归方程;一元线性回归方程的显著性检验;根据建立的回归方程进

行预测,并确定自变量对因变量的解释力】P217

63、一元线性回归方程:,为因变量预测值,为自变量观测值,【a为截距】,代表的意思是当自变量的值为0时,

因变量Y的预测值为a。【b为斜率】,也称为一元线性回归方程的回归系数,它的含义为当自变量X变化一个单位的时候,因变量预

��=�+�������X

测值Y会随之变化b个单位。P217-218

64、在一元线性回归中,【自变量与因变量的线性相关程度越高,决定系数R2越高,自变量对因变量变异的解释力越强】。P222

65、卡尔·皮尔逊提出的【检验法】,是一种检验计数或次数资料的实际观察频数分布与理论频数分布之间差异是否显著的方法。

检验法是【非参数检验】中常2用的方法。P2272

��

66、在卡方分析中,【实际观察频数与理论频数的差值越大,得到的值越大】,说明两者之间的差异越大,样本所代表的总体分布

与理论假设的分布越不一致。反之,【得到的值越小,则说明统计值2与理论值的差异越小、越接近,实际分布与理论分布越一致】。

两者无差异时,值即为0。P2772

67、卡方分布的自2由度代表实际频数与理论频数的差异中,能够独立变化的个数,【df=C-1】,其中C为类别数。例如硬币实验中共

有2组实际值与理论值的差值(即正面朝上组和反面朝上组),因此其自由度d/=2-1=1。P228

68、检验适用于【离散数据】,其所代表的总体分布是未知的;检验是对【总体分布】的假设检验。P229

69、在2卡方检验中,当某些组别内理论频数过少时,可以采取下列方2法进行处理:【增加样本;改变分组依据;公式校正】P231-232

��

70、【对于连续数据的分布形态是否符合预期也可以通过检验的方法进行判断】,最常用的是对于某组抽样得到的连续数据,检验

其总体分布的形状是否符合正态分布。P2312

71、根据量表在单位和参照点上的不同,量表可以分为P245-246

6

72、教育测量的定义:【广义的教育测量泛指对教育领域内各种事物特征进行定量描述的过程;而狭义的教育测量则指对学生的学业

成就和心理特质进行定量描述的过程】P246

73、教育测量与教育统计的关系:【教育测量是教育统计的基础,有测量所得来的数据,才能做进一步的统计分析。教育统计使教育

测量更加深入,增进人们对事物特征及其发展规律的认识】P248-249

74、【教育评价】是按照一定的价值标准,对受教育者的发展变化及构成其变化的诸种因素进行价值判断的过程P249

75、【测验】是用于定量描述人教育成就或心理特质的一个或一系列任务,其实质上是对行为样本客观的标准化的测量P250

76、题目难度:难度值处于0和1之间,【数值越大】,表示题目的【难度越小】;相反,数值越小,表示题目的难度越大P251

77、依据测验内容,测验分为P252

(1)【智力测验】:1905年,法国人【比内和西蒙】在智力G因素论的影响下,编制了世界上第一个智力测验量表,称为【比西量表】。

目前国内外应用较为广泛的智力测验量表有【斯坦福-比内量表、中国比内测验、韦克斯勒智力量表、瑞文推理测验】

(2)【能力倾向测验】旨在测量个体的潜在才能,以预测个体在将来学习或工作中可能达到的成功程度。1941年【瑟斯通】编制和发

表了世界上第一个能力倾向成套测验—【基本心理能力测验】,主要测量【语言能力、数的能力、知觉速度、推理能力和空间关系认

知能力】

(3)【成就测验】是对个体学习与训练之后知识技能发展水平的测量。这是教育测量领域最为常见,也是最重要的一种测验

(4)【人格测验】对人的行为中起稳定调节作用的心理特质和行为倾向进行测量,以预测个人未来的行为。【自陈量表】是人格测验中

应用最为广泛的一种测验形式。目前比较著名的自陈式人格测验量表有【明尼苏达多项人格调查表(MMPI)、卡特尔16种人格因素量表

(16PF)、艾森克人格问卷(EPQ)、大五人格测试问卷(BFI)】

78、按测量实施方式,测验分为P253

(1)【个别测验】是指一个主试在同一时间只能测量一个被试,面向一个被试施测。个别测验的缺点是费时费力和成本高

(2)【团体测验】指一个主试面向多个被试同时施测的测验。其缺点是【容易产生测量误差,从而影响测验的信度和效度】

79、按测验题目的形式,测验分为P253

(1)【纸笔测验】也叫文字测验,即用文字形式表达,被试一般也用文字作答的测验。文字测验的局限性主要是受【被试受教育程度和

文化背景】的影响。

(2)【操作测验】也叫非文字测验,测验内容是通过图形、仪器、工具、实物、模型等非文字形式表达的,被试只要通过指认或手工操

作向主试提供答案。例如【瑞文推理测验】

80、依据参照标准的不同,测验分为P253-254

(1)【常模参照测验】将被试水平与常模相比较,以评价被试在团体中的相对地位,比如【中考和高考】

(2)【标准参照测验】将被试水平与某个客观不变的绝对标准相比较,以评价被试达成该标准的程度

81、误差可以分为:①【随机误差】是指那些与预测特质无关、由偶然因素引起又不易控制的误差。②【系统误差】是由与预测特质

无关的因素引起,恒定而有规律的误差。随机误差影响【测量结果的稳定性和准确性】,系统误差影响【测量结果的准确性】P255

82、经典测量理论(CTT)假定,观察分数(X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(E),用公式表示为【X=T+E】。

如果将系统误差(I)引入进来,这个公式则转变为【X=V+I+E】,V为有效分数,V和I共同构成了T。P256

83、布卢姆是将教学活动所要实现的整体目标分为【认知、情感、心理运动】三大领域,对认知领域的教学目标进行了更为细致的描

述和例释,将其分为【识记、理解、运用、分析、综合和评价】六个层次P267-268

84、双向细目表的编写步骤:【列出教学内容要点;列出教学目标清单;填写双向细目表】P269

85、【填空、简答、论述、作文】等为主观题。客观题主要包括【选择题、判断题和匹配题】,这种题目要求学生从备选项中选择或

匹配正确的答案。P271

86、一般来说,测验指导语可以包括:【测验的目的;完成测验的可用时间;如何作答;当不确定答案时,是否可猜测;交卷方式】

P274

87、【李克特量表】是评分加总式测验量表最常用的一种。它由美国社会心理学家李克特于1932年首次提出并使用,因而得名。其最

大的特点就是先提供一系列有关陈述,要求被试根据真实情况报告自己同意每一陈述的程度,或每一陈述与自身实际符合的程度。P275

88、鉴别指数处于【-1与1】之间,指数越大,说明区分度越好。题目鉴别指数评价标准为:【①0.40以上:很好;②0.30~0.39:

良好,修改后会更好;③020~0.29:尚可、仍需修改;④0.19以下:差,必须淘汰】P283

89、当题目难度为0.50时,鉴别指数D能达到最大值【1.00】。【中等难度题目的区分度最好】。实际编制测验时,不能让一套测验

中所有题目都保持一样的难度。在测验内部、题目的难度分布要有一定的广度和梯度,使整个测验的难度呈正态分布,且平均水平保

7

持在中等难度上,这样才能有效地将各种水平的人区别开来P284-285

90、【信度】指多次测验结果的一致性程度,即在不同时间,使用同一测验或使用两个平行测验,或者在不同测试条件下,对同一组

被试实施多次测验所得分数的一致性。信度反映了测量过程中所存在的【随机误差的大小】。当前,各种信度的估计主要通过【相关

分析】完成P285

91、【重测信度】指用同一个测评工具对同一组对象施测两次所得结果的一致性程度,其大小等同于同一组对象在两次测验上所得分

数的皮尔逊积差相关。这个相关系数反映了测评数据的稳定性,因而也叫【稳定性系数】P285

92、【复本信度】指用两个平行的测评工具测评同一批对象所得结果的一致性程度,其大小等于同一批对象在两个复本上所得分数的

相关。这个相关系数也叫【等值性系数】P286

93、【评分者信度】指多个评分者给同一批人的答卷进行评分的一致性程度。如果计算评分者信度,应该处于【0.8以上】,属于较

好水平P286-287

94、【同质性信度】也称内部一致性信度,它有两层含义:其一是指同一测评工具中所有题目测的都是同一种心理特质,其二是所有

题目得分之间都具有较高的正相关。P287

95、【效度】是对于一个既定的目标,在做出推论和提供解释过程中测评的有用性程度。常见的效度估计主要是【内容效度估计、构

念效度估计与效标关联效度估计】P289-290

96、【构念效度】指一个测验实际测到所要测量特质或结构的程度P292

97、在教育测量实践中,人们接触最多的通常是测量评估数据,以顺序数据为主。这种分数可以有两种表达形式,分别是【百分制分

数和等级评定分数】P300

98、根据解释基准的不同,可将分数解释分成P302

①【绝对解释】是将个体的原始分数与一个既定的客观标准做比较并予以解释。标准参照测验的分数要采用绝对解释

②【相对解释】是在被试集合中选取一个或多个被试作为基准,然后把各个被试与基准进行比较的解释方法。常模参照测验的结果都

会采用相对解释

③【个体内差异解释】是把被试集合中的各个被试的过去和现在相比较或者把某一个被试的各个侧面相比较的评价方法

99、【安戈夫法】是当前最受欢迎、使用最普遍的一种分数分界点确定方法P303

100、【百分等级】是指在一个群体的测验分数中,得分低于这个分数的人数百分比。百分等级反映了个体在群体中的地位,但其所对

应的分数不是等距的。百分等级只有【顺序性与可比性】,但不具有可加性P305-307

101、标准分数的变式P310

(1)T分数:是【平均数为50,标准差为10】的标准分数

(2)SAT考试分数的公式:【SAT分数=100Z+500】

(3)韦克斯勒质量测验所采用的离差智商,其公式是【IQ=15Z+100】

102、【百分等级和标准分数】是常模分数常见的表达形式。常模资料要明确原始分数与导出分数之间的转换关系。转化表是最简单、

最基本且最常用的常模资料呈现方法P312-313

二、简答题+论述题

1、学习教育统计与测量学的意义P49

答:(1)科学测评学生学习进展,为教育教学改进提供依据

(2)定量分析影响学生学习的因素,寻找有效的改进策略

(3)加强定量分析,推动教育研究走向科学化

2、常用统计分析图及其适用的数据类型P67-72

(1)散点图是用平面直角坐标系上点的散布来表示两种事物之间的相关性及联系模式。常用来描述二元变量的观测数据,例如探究焦虑

程度与数学与考试成绩之间的关系。

(2)线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。线形图更多地应用于连续性数据,适用于描述某种事物在

时间序列上的演变趋势,也可用来描述某一事物随另一事物发展变化的趋势模型。常见的线形图有折线图和曲线图。

(3)条形图是以相同宽度的条形的长短或高矮来表示各个统计事项之间的数量关系。一般用来表示定性数据,每一条表示一种类别的次

数或百分数。

(4)圆形图是以单位圆内各扇形面积占整个圆形面积的百分比来表示统计事项在其总体中所占相应比例的图形。通常被用来呈现具有百

8

分比结构的定性数据。

3、中位数的优缺点及其应用情形P80

答:优点:概念简单明白,容易理解;对排成顺序的数据来说,计算中位数较为容易;不受到极端数据和两端模糊数据的影响。

缺点:不能做进一步的代数运算;缺乏灵敏性;当原始数据靠近中位数附近有重复数据出现时,或观测数据已被分组归类时,则难以

通过简单的计算确定中位数。

应用情形:当需要快速估计一组数据的典型水平时可使用中位数;当一组数据中出现极端数据或数据两端有模糊数据出现时,用中位

数来描述该组数据的集中趋势显得更为客观合理。

4、平均数常用的几种情形P84

答:(1)数据是同质的

(2)每一个数据都是准确、可靠的

(3)需要得到相对精确可靠的集中量数或进一步参与其他运算

5、标准差的优缺点、适用条件P99

答:优点:计算严密;反应灵敏;适合于代数运算

缺点:易受极端数据的影响;易受模糊不清数据的影响

适用条件:两组同质数据的平均数相等或接近时

6、概率的基本性质P110

答:(1)对于事件A发生的概率P(A),有0≤P(A)≤1

(2)必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(φ)=0

(3)如果事件A与事件B为互斥事件,则P(A∪B)=P(A)+P(B)

7、正态分布在教育评价中的应用P117-118

答:(1)确定考试成绩的分数线

(2)确定能力分组的人数

(3)确定测验题目的难易程度

8、区间估计的原理P146

答:区间估计是以样本统计量的抽样分布为理论依据,用样本抽样分布的标准差(即标准误,通常用SE表示)计算总体参数值所在的区

间长度,并解释总体参数值落入该置信区间可能的概率。

9、总体平均数区间估计的步骤P149

答:(1)估计总体平均数

(2)计算标准误

(3)确定置信水平

(4)计算置信区间

(5)解释总体平均数的置信区间

10、假设检验中的Ⅰ类错误和Ⅱ类错误P159

答:(1)Ⅰ类错误,又称拒真错误,是指本该接受H0,却做出了拒绝H0的结论,即拒绝了实际成立的“弃真”错误,其概率通常用α表

示。

(2)Ⅱ类错误,又称取伪错误,是指本该拒绝H0,却做出了接受H0的结论,即接受了实际不成立的“存伪”错误,其概率通常用β表示。

11、控制假设检验两类错误的方法P159

答:(1)选择适当的α水平

(2)合理使用单侧检验和双侧检验

(3)适当增加样本容量

12、假设检验的一般步骤P159-160

答:(1)提出假设

(2)选择检验统计量并计算其值

(3)选择显著性水平并确定临界值

(4)统计决断

9

13、主效应和交互效应P179-180

答:主效应:一个因素的不同水平引起的变异,即一个因素对因变量产生的影响大小

交互效应:当存在两个或两个以上的自变量(因素)时,自变量之间有可能会出现交互效应,表现为一个因素的各个水平在另一个因素

的不同水平上变化趋势不一致

14、F分布的特点P182

答:(1)F分布是一族正偏态的分布。分布曲线随分子、分母自由度的不同而不同。随着分子、分母自由度的增加趋近于正态分布。

(2)F值总为正值,因为是由两个方差之比得到的。

(3)当分子的自由度为1,分母的自由度为任意值时,F值(单侧检验)与分母自由度相同概率的t值(双侧检验)的平方相等。

15、积差相关的适用范围P204-205

答:(1)两个变量都为连续变量且服从正态分布或近似正态分布

(2)两个变量的数据必须是成对的

(3)两个变量的散点图中散点的整体形态大体呈现直线分布

(4)为确保计算出的积差相关系数有意义,变量的样本容量要大于30

16、斯皮尔曼等级相关分析的适用范围P208

答:(1)有一个变量为顺序变量,另一个变量为连续变量或顺序变量

(2)两个变量的数据必须是成对的

(3)斯皮尔曼相关系数的计算对数据整体的分布不做要求,因此样本容量不一定要大于30

(4)当这两个变量都为连续变量时,可以根据研究的目的选择采用积差相关或者斯皮尔曼等级相关,积差相关的关注点在于变量数值的

线性关系,而斯皮尔曼等级相关的关注点在于相关方向的一致性

17、线性回归方程的基本假设P216

答:(1)线性关系假设:线性回归的自变量和因变量之间存在线性相关

(2)正态性假设:因变量Y和线性回归方程预测误差应服从均值为零的正态分布

(3)独立性假设:某一个自变量对因变量的影响不受其他自变量的干扰;一个自变量某个值的预测误差不受到该自变量其他值的影响

(4)误差等分散性假设∶在任意自变量数值下,线性回归方程预测误差也会服从一个均值为零的正态分布

18、卡方分布的特点P228

答:(1)其分布形态呈正偏态,右侧无限延伸,但永不与基线相交

(2)卡方分布形态随自由度的变化而变化。自由度越小,卡方分布的偏度越大,越向左边倾斜。自由度越大并趋于无穷时,卡方分布越

接近于正态分布

19、卡方检验的前提假设P229

答:(1)要求数据分类是互相排斥的

(2)观测值之间需要相互独立

(3)每一组别中的理论频数应在5个以上

20、检验的类型P229-234

答:(1�)拟合优度检验:当使用一种划分依据将实验或观察所得的数据进行分组时,判断实际频数与理论频数是否存在显著差异,抽

样所得的样木在分2布上是否与理论假设分布相一致

(2)独立性χ检验:当有两个乃至两个以上的因素变量作为分组依据时,可以研究两类变量之间的关系,判断两个变量是相互独立的

还是相互关联2的。

21、教育测量与教育评价的区别与联系P249

答:区别:教育测量与教育评价是两种不同的认识活动。教育测量采用量表客观、定量地描述教育领域某种事物的特征,是认识世界

“是什么”的活动;而教育评价是对事物进行价值判断的过程,是一种主观活动,是一种以把握世界意义和价值为目的的活动。

联系:教育测量是教育评价的基础之一,教育测量定量描述了学生的学业成就或其他相关变量,为教育评价(评判教育目标达成程度)

准备了定量数据;教育评价是教育测量的延伸,它在教育测量的基础上,依据教育目标或一定的价值标准对此进行价值判断,使人们

对教育事物的认识更加深入。

22、测验的种类P252-253

答:(1)按测验内容,可以将测验分为智力测验、能力倾向测验、成就测验、人格测验

10

(2)按测量实施方式,可以将测验分为个别测验和团体测验

(3)按测验题目的形式,可以将测验分为纸笔测验和操作测验

(4)按测验结果解释所参照的标准,可以将测验分为分常模参照测验和标准参照测验

23、误差的定义及教育测量误差的来源P255

答:误差是指测量过程中由于欲测量特质以外各种主客观因素引起的一种结果不准确或不一致的测量效应

来源:测量工具;被试;施测过程

24、编制教育测验的基本程序P261

答:(1)明确测量对象和目标

(2)确定测验目的与用途

(3)编辑测验题目

(4)试测和题目分析

(5)合成测验

(6)测验标准化

(7)鉴定测验

(8)编写测验说明书

25、测验标准化的内容P264

答:(1)测验内容的标准化

(2)施测过程的标准化

(3)测验评分与解释标准化

26、编制成就测验的步骤P265-275

答:(1)明确测验目的:常见的测验目的主要有诊断、达标验收、评比与选拔、教学改进;

(2)编制测验细目表:一般要根据课程标准和教学目标编制测验细目表;

(3)选择题目类型:依据阅卷方式的不同可以将测评任务分为客观题和主观题;客观题也能测评复杂能力;选择合适的任务类型;

(4)设计题目:题目与预期成果相匹配;清楚地表述每道题目;题目要适合学生的阅读水平;题目表述不能包含民族、种族、性别或城

乡偏见;避免题目中无意线索;确保每道题目的答案或评分细则没有争议;编写题目和任务的数量要多于最终测验实际使用的数量;

注重对测验题目的检查与修改;

(5)汇编测验:一个完整的测验应提供指导语,然后将所有题目汇编,最后对试卷设计版面和排版。

27、测验细目表的意义P271

答:测验细目表明确了测验内容及其构成,使试题分布合理,覆盖面广,体现重点,是规范命题、确保测验效度的重要手段。无论是

大规模、高利害的关键考试,还是教师在日常教学活动中的自编测验,编制者都需要编制测验细目表,使测验能准确、有效测评学生

在学习中的成就与不足。有合理、清晰的测验细目表,可以有效克服教师命题随意、试题取样不当、题型单调、覆盖面窄或失之偏颇

等弊病。

28、成就测验编制中客观题的优点P271

答:(1)实施容易,学生只需要勾画出正确选项即可,阅卷可以机器阅卷,即使人工阅卷速度也很快

(2)可以设置比较大的题量,一方面可以扩大试题的覆盖范围,另一方面也可以减小猜测对测评的影响

(3)答案唯一、确定,没有争议,能最大限度地克服主观性

(4)排除了书写等无关因素的干扰

29、李克特量表的优点P276

答:(1)容易设计,编制起来相对简单

(2)它在每个维度中都包含多个题目,而且要求题目内部一致性要达到可接受水平,具有较好的信度

(3)便于被试理解和回答,也便于后续的统计和分析

30、难度的含义以及计算方法P282

答:含义:难度是测评题目的难易程度

计算方法:①如果题目是客观题,可以用二分法记分,通常使用通过率来表示难度,公式为P=答对人数/全体被试数

②如果题目是主观题,采用非二分法记分,学生会得到从零到满分之间的一个分数,那么难度通常用平均得分率来计算,公式为

P=

11

平均得分满分

31、区分度的含义以及计算方法P283-284

/

答:含义:区分度指测验题目对被试表现的区分能力

计算方法:(1)鉴别指数法。具体做法是,先按照被试的测验总分由高到低排序,然后选择前27%的被试作为高分组,后27%的被试

作为低分组,分别计算高分组和低分组被试在某道题上的通过率(或得分率),最后计算两个通过率(或得分率)之差,就得到了鉴别指

数,一般用D表示,公式如下:D=PH-PL

(2)题总相关法。即计算被试在某道题上得分与测验总分之间的相关,相关越高,说明题目的区分度越好。如果题目属于主观题,评分

在零至满分之间,是连续的,这种题目题总相关的计算方法通常采用皮尔逊积差相关法。如果题目为客观题,被试得分为二分变量,

或者题目另为主观题,评分是连续的,但被人为分成通过或不通过,则采用二列相关法

32、难度和区分度的关系P284

答:(1)题目太难或太容易,区分度都不好

(2)中等难度题目的区分度最好

33、重测信度分析需要满足的条件P286

答:(1)所测评的教育成就或心理特质必须是稳定的

(2)两次测验之间要间隔一定的时间

(3)在间隔期内被试没有获得相关的学习和训练

34、信度与效度的关系P290

答:(1)测验效度受其信度的制约

(2)信度高是效度高的必要而非充分条件

(3)信度高是好测量的前提,效度高才是好测量的核心特征

35、内容效度的含义及其估计方法P290-292

答:含义:内容效度是指一个测验实际测到的内容与欲测量内容之间的吻合程度

估计方法:(1)分析内容效度主要采用逻辑分析法,也叫专家评判法,其基本思路就是请有关专家判断测验题目与预定测评范围吻合的

程度。(2)有学者也提出了多种采用数据估计内容效度的方法:平行测验法和再测法。

36、专家评判法的步骤P292

答:(1)邀请本领域的测评专家和资深教师,形成专家工作组

(2)明确欲测内容范围,一般从内容和能力两个方面进行分析,最后形成双向细目表,明确每个纲目的题目比例

(3)分析每道题目的效度及整套测验题目的覆盖率、代表性和难度等,对整个测验的有效性做出总的评价

37、效标关联效度的含义及其估计方法P294-295

答:效标关联效度指测验分数与外部效标之间的相关程度。外部效标是衡量一个测验是否有效的外部标准,它独立于测验并可以从实

践中获得我们感兴趣的行为。根据外部效标资料收集时间点的差异,效标关联效度可以分成同时效度与预测效度。同时效度指测验分

数与同时获得的外部效标分数之间的相关。预测效度则指测验分数与随后获得的效标分数之间的相关。效标关联效度的估计需要收集

被试在其他效标测验上的分数,还需要对分数进行匹配和相关分析。

38、建立常模的主要步骤P304

答:(1)要科学抽样,从明确定义的“特定人群”总体中抽取一个容量足够大且具有代表性的被试样本

(2)采用要建立常模的测验,针对常模团体施测。施测过程按照标准化程序严格实施

(3)对收集的数据资料进行统计分析,考察被试与常模团体水平相比处于什么位置或水平,做出相对解释,分析分数的意义

39、标准分数的意义和性质P307

答:意义:(1)标准分是等距数据,可以进行加减运算。

(2)在分数合成时标准分使每种分数的权重相等。有了标准分,对测量数据的挖掘和分析可以更深入。

性质:标准分是以一批分数的平均数为参照点,以标准差为单位的等距量表。标准分不仅具有顺序性,而且具有可加性。它由符号和

绝对值两部分构成正、负符号表示原始分数在平均数之上或之下,绝对值则表示原始分数与平均数的距离。归结起来,标准分还具有

以下性质。其一,标准分与原始分的分布形态相同。标准分实际上只是对原始分数所做的一个线性转换,所以标准分的分布与原始分

的分布形态相同。其二,标准分可以使不同测验分数之间进行比较。任何一组原始分数都可以转换成平均分为0,标准差为1的标准

分,变成等距数据,所以可以在不同测验分数之间进行比较。

12

三、计算题+综合应用题

1、正态分布(标准分数)的应用P117

计算公式

σ

�−�

例:在201Z7=年研究生入学考试中,有60人参加某大学教育测量与评价专业的初试,成绩服从正态分布,平均成绩为320分,标准差

是15分。如果计划12人进入复试,那么进入复试的分数线应该是多少?

解析:进入复试的比例为P=12/60=0.2

上述计算的P值为正态曲线下最右边面积为0.2的部分,此时我们所确定的最低录取分数线与Z=0所形成的面积为0.3。

查表可知,当P=0.3时所对应的Z=0.84。

根据公式,可知σ,将各变量的值代入计算得,即进入复试的分数线为

σ

�−�

2、中心极Z限=定理P134-135X=Z+�X=332.6332.6

如果总体的平均数为μ,标准差为σ,那么样本容量为n的样本平均数分布的平均数为μ,标准差(标准误)为;且当样本容量n趋

于无穷大时,样本平均数的分布也趋于正态分布。当样本容量等于或大于30时,抽样分布就已经接近正态分布了�

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论