特殊儿童教育评估-第三章 心理计量评估基本知识_第1页
特殊儿童教育评估-第三章 心理计量评估基本知识_第2页
特殊儿童教育评估-第三章 心理计量评估基本知识_第3页
特殊儿童教育评估-第三章 心理计量评估基本知识_第4页
特殊儿童教育评估-第三章 心理计量评估基本知识_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 心理计量评估的基本知识心理计量评估的基本知识第一节第一节 信度与效度信度与效度信度和效度是衡量信度和效度是衡量测验性能测验性能的两个重要指标,反应的两个重要指标,反应测验的质量测验的质量。一、信度(一、信度(reliabilityreliability)(一)含义:(一)含义:同一被试者在不同时间内用同一同一被试者在不同时间内用同一测验重复测验重复测量,所得测量,所得结果的一致程度结果的一致程度。是指测量结果的稳定性和可靠性程度。信度只。是指测量结果的稳定性和可靠性程度。信度只受受随机误差的随机误差的影响。影响。理论上:理论上: 真分数真分数 实得分数实得分数 随机误差随机误差信

2、度信度= =真分数方差真分数方差/ /实得分数方差实得分数方差实际中:实际中:一一组受测着在同一个测验上两次施测所取得的两组分数之组受测着在同一个测验上两次施测所取得的两组分数之间的相关系数来表示,这个相关系数为间的相关系数来表示,这个相关系数为信度系数。信度系数。方差是各个数据与其算术平均数的离差平方和的平均数。方差是各个数据与其算术平均数的离差平方和的平均数。信度信度的作用的作用信度信度是测量过程中所存在的随机误差大小的反映。信度低,测量随机是测量过程中所存在的随机误差大小的反映。信度低,测量随机误差大,测量结果就会与真分数发生较大偏离。误差大,测量结果就会与真分数发生较大偏离。信度是衡量

3、一个测验好坏的重要指标之一,测验的信度达到多少才可信度是衡量一个测验好坏的重要指标之一,测验的信度达到多少才可以接受呢?一般来讲,能力与成就测验的信度应该在以接受呢?一般来讲,能力与成就测验的信度应该在0.900.90以上,人格测以上,人格测量信度系数应该在量信度系数应该在0.80 0.80 以上。以上。测量中的系统误差与信度无关。测量中的系统误差与信度无关。(二)检验方法(二)检验方法1.稳定性系数:又称再测信度。使用同一测验,在同样条件下对同一组被试者前后施测两次前后施测两次测验,求两次得分间的相关系数。其大小等于同一组被试在两次测验上其大小等于同一组被试在两次测验上所得分数的积差相关系数

4、。所得分数的积差相关系数。一般是两周到四周较宜,间隔时间最好不超过六个月。一般是两周到四周较宜,间隔时间最好不超过六个月。重测信度使用的条件重测信度使用的条件(1 1)所测量的心理特质必须是稳定的)所测量的心理特质必须是稳定的(2 2)遗忘和练习的效果基本上相互抵消)遗忘和练习的效果基本上相互抵消(3 3)在两次测试时间间隔内,被试在所要测查的心理特质)在两次测试时间间隔内,被试在所要测查的心理特质方面没有其他的学习和练习方面没有其他的学习和练习2. 2.复本复本信度(信度(Alternate-form reliabilityAlternate-form reliability)含义含义与计算

5、与计算是指两个平行测验测量同一批被试所得结果的一致程是指两个平行测验测量同一批被试所得结果的一致程度,其大小等于同一组被试在两个复本测验上所得分度,其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度。数的积差相关系数。计算公式同重测信度。两个复本测验实施的时间不同,复本信度所表两个复本测验实施的时间不同,复本信度所表达的含义略有不同。达的含义略有不同。(1 1)等值性系数)等值性系数如果两个复本测验是同时连续测试的,则称这如果两个复本测验是同时连续测试的,则称这种复本信度为等值性系数。等值性系数的大小主种复本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的

6、题目差别带来的变异情要反映着两个复本测验的题目差别带来的变异情况。况。()稳定性与等值性系数()稳定性与等值性系数如果两个复本测验是相距一段时间分两次测试,如果两个复本测验是相距一段时间分两次测试,则称这种复本信度为稳定性与等值性系数。此时则称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水两个题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。平等方面的差别都会成为测验结果不一致的原因。复本复本信度使用的条件信度使用的条件(1 1)两个测验必须在项目的内容、形式、数量、难易、)两个测验必须在项目的内容、形式、数量、难易、时限、指导

7、语等方面相同或相似。时限、指导语等方面相同或相似。(2 2)两次测验的时间间隔要适当。)两次测验的时间间隔要适当。局限:局限:(1 1)复本法只能减少而不能排除练习和记忆效应。)复本法只能减少而不能排除练习和记忆效应。(2 2)对于许多测验来说要建立复本是非常困难的。)对于许多测验来说要建立复本是非常困难的。3. 3.分半信度分半信度(Split-half reliabilitySplit-half reliability)含义含义与计算与计算是指将一个测验分成对等的两半后,是指将一个测验分成对等的两半后,所有被试在这两半上得分的一致性。所有被试在这两半上得分的一致性。分半信度信度与等值性系数

8、的解释一分半信度信度与等值性系数的解释一样,即可以把对等的两半测验看成是样,即可以把对等的两半测验看成是最短时距内施测的两个平行测验。分最短时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性,半信度描述的是两半题目间的一致性,所以也叫内部一致性系数。所以也叫内部一致性系数。注意题目分半的方法:按题号奇偶性分半、注意题目分半的方法:按题号奇偶性分半、按题目难度分半、按题目内容分半等。按题目难度分半、按题目内容分半等。计算方法与复本信度类似,但被试在两半测计算方法与复本信度类似,但被试在两半测验上得分的相关系数只是半个测验的信度,验上得分的相关系数只是半个测验的信度,所以必须用斯皮尔曼所

9、以必须用斯皮尔曼布朗公式加以校正:布朗公式加以校正: 使用使用的前提条件和范围的前提条件和范围分半信度通常是在只能施测一次或没有复本的分半信度通常是在只能施测一次或没有复本的情况下使用。其中使用斯皮尔曼情况下使用。其中使用斯皮尔曼布朗公式时布朗公式时要求全体被试在两半测验分数的变异数相等。要求全体被试在两半测验分数的变异数相等。当测验无法分成对等的两半时,无法使用。当测验无法分成对等的两半时,无法使用。4. 4.同质性同质性信度(信度(Homogeneity reliabilityHomogeneity reliability)含义含义同质性信度也叫内部一致性系数,它是测验同质性信度也叫内部一

10、致性系数,它是测验内部所有题目间的一致性程度。这里的一致内部所有题目间的一致性程度。这里的一致性有两种含义:一是所有题目都测的是同一性有两种含义:一是所有题目都测的是同一种心理特质,二是所有题目得分之间都具有种心理特质,二是所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。测内容或特质的相同程度。5. 5. 评分者信度评分者信度(Scorer reliabilityScorer reliability)含义含义与计算与计算评分者信度指的是多个评分者给同一批人的答卷进行评评分者信度指的是多个评分者给同一批人的答卷进行评分的一

11、致性程度。对于主观试题,不同的评分者给出的分的一致性程度。对于主观试题,不同的评分者给出的分数是不等的,这样会造成误差,如何降低评分者信度分数是不等的,这样会造成误差,如何降低评分者信度是心理测量的重要任务之一。是心理测量的重要任务之一。二、效度二、效度(validityvalidity)(一)含义效度是指所测量的与所所要要测量的测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。测量的效度既受随机误差的影响,同时也受系统误差的影响。效度是随机误差和系统误差的综合反映。效度是随机误差和系统误差的综合反映。判断一个测量是否有效要从多方面收集证据。判断一个测量是否有效要从多方面收集

12、证据。例如:一个小学数学测验的成绩若同时受到数学能力和语文能力(读懂题例如:一个小学数学测验的成绩若同时受到数学能力和语文能力(读懂题意的能力)的影响,测试结果成绩低,就不能认为实际所要测的数学能力意的能力)的影响,测试结果成绩低,就不能认为实际所要测的数学能力这一心理特质水平不高。这一心理特质水平不高。效度的数学定义效度的数学定义测验分数测验分数 = = 有效分数有效分数 + + 系统误差系统误差 + + 随机误差随机误差测验分数的方差测验分数的方差= = 有效有效分数的方差分数的方差+ +系统误差的方差系统误差的方差+ +随机误差的方差随机误差的方差效度为有效分数的方差与测验分数方差的比效

13、度为有效分数的方差与测验分数方差的比2222tcospeSSSS22ScoStVal 返回返回信度信度是指测试方法不受是指测试方法不受随机误差随机误差干扰的程度,反映干扰的程度,反映测试结果测试结果的一致性和的一致性和稳定性稳定性(consistency, and stability(consistency, and stability) )。效度效度反映反映测试的测试的准确性准确性( (accuracyaccuracy) ),即在多大程度上测量了,即在多大程度上测量了想要测的内容想要测的内容。信度和效度的共同点都是以相关系数来表示其大小的。都是整个运用问卷调查技术进行科研工作的可靠性保证。信

14、度和效度的不同点涉及的误差不同 信度仅考虑随机误差占测验总变异的比例; 效度则还包括与测验无关但稳定的测量误差。研究的角度不同 信度:测量的质量 效度:问卷的质量总而言之,信度和效度相互排斥又相互依存;没有信度就不可能有效度;没有效度,信度就毫无意义;高信度可能带来低效度;高效度也可能带来低信度。举例来说举例来说三、效度的种类1.1.内容效度内容效度2.2.效标关联效度效标关联效度3.3.结构效度结构效度返回返回1. 1.内容效度内容效度(content validitycontent validity)(1)(1)内容效度内容效度的的含义含义 测验项目测验项目对所要测量的内容范围的代表性对所

15、要测量的内容范围的代表性程度程度。估计估计一个测验的内容效度就是确定该测验在多大程度上一个测验的内容效度就是确定该测验在多大程度上代表了所要测量的心理特质。代表了所要测量的心理特质。或者说内容效度就是或者说内容效度就是测验的测题测验的测题对对测验内容测验内容范围范围的代表的代表程度。程度。(2 2)验证验证测验内容效度的一般测验内容效度的一般程序程序以教育测验为以教育测验为例例-专家判断的方法专家判断的方法内容效度的确定方法主要是逻辑分析的方法。其工作思路是请专内容效度的确定方法主要是逻辑分析的方法。其工作思路是请专家对测验题目与原定内容范围的吻合程度作出判断。步骤如下家对测验题目与原定内容范

16、围的吻合程度作出判断。步骤如下:1 1)明确明确测验目的及测验内容的测验目的及测验内容的范围。范围。2 2)编制编制双向细目双向细目表表,确定每个题目所测的内容,并与测验编制者确定每个题目所测的内容,并与测验编制者所列的双向细目表对照所列的双向细目表对照3 3)确定确定每一小格中的测题每一小格中的测题数量。数量。4 4)写出鉴定报告,写出鉴定报告,考察题目对所定义的内容范围的覆盖率、判断考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异等。题目难度与能力要求之间的差异等。双向细目表举例识记识记理解理解应用应用分析分析综合综合评价评价合计合计第一章第一章8210第二章第二章10

17、621028第三章第三章3624722第四章第四章296125640合计合计13271418226100上页上页(3 3)内容效度)内容效度的应用的应用内容效度适合于测验所要测量的内容总体能够明确界定的内容效度适合于测验所要测量的内容总体能够明确界定的情况:情况: 标准参照测验标准参照测验 知识测验、技能测验等教育测验知识测验、技能测验等教育测验 工作表现可以界定的职业心理测验工作表现可以界定的职业心理测验不适合:智力测验,不适合:智力测验,人格测验人格测验内容效度的局限性:内容效度的局限性:1) 1)内容效度缺乏可靠的统计指标,妨碍了测验间的可比性。内容效度缺乏可靠的统计指标,妨碍了测验间的

18、可比性。2 2)内容效度由专家判断,带有主观性。)内容效度由专家判断,带有主观性。3 3)双向细目表难以编制。)双向细目表难以编制。2. 2.效标关联效度效标关联效度(实证效度)(实证效度)(1 1)含义)含义衡量衡量测验有效性测验有效性的一个很重要的方法是看根据的一个很重要的方法是看根据测验测验所作出的所作出的预测预测能否被能否被证实证实,如果一个测验的,如果一个测验的预测结果预测结果与将来与将来实际发生的事情实际发生的事情非非常接近,那么这个测验就是一个好测验。常接近,那么这个测验就是一个好测验。效标关联效度:效标关联效度:指指测验分数测验分数与与效度标准效度标准( (被假设被假设或定义为

19、有效的某种外在标准或定义为有效的某种外在标准) )之间之间的的相关。相关。又又称称准则关联效度准则关联效度。即即根据测验所作出的根据测验所作出的预测预测能否能否被实际的结果所证实被实际的结果所证实。效标效标即效度即效度标准标准: 指独立于测验结果,反映指独立于测验结果,反映测验目的测验目的的行为参照。的行为参照。(2 2)效标关联效度)效标关联效度的类型的类型同时效度同时效度(concurrent validityconcurrent validity) 测验分数与几乎同时获得的效标分数之间的相关测验分数与几乎同时获得的效标分数之间的相关。 例如:在招聘应届毕业生时,可将应聘大学生的面试和笔试

20、综合分数与其在校综合测评成绩(效标)进行相关性分析。预测效度预测效度(predictive validitypredictive validity) 测验分数与随后获得的效标分数之间的相关测验分数与随后获得的效标分数之间的相关。 例如:对于被录用者,可以将招聘测试分数与一段时间(半年或一年)之后的工作业绩考核结果进行比较。若这些人的工作绩效和招聘测试分数呈现密切相关关系时,说明招聘方法是有效的,可以推广到人员甄选与选拔中去。同时效度同时效度主要用于诊断现状主要用于诊断现状,预测效度在于,预测效度在于预测个体将来的行为预测个体将来的行为。返回返回例如,用大学例如,用大学入学考试入学考试来预测被试

21、来预测被试入学后的学习入学后的学习,如果入学考试成绩好的同学,入学后的学校能力强,如果入学考试成绩好的同学,入学后的学校能力强,取得了好的成绩,那么说明大学入学考试是一个好取得了好的成绩,那么说明大学入学考试是一个好测验。这里,测验。这里,被预测的行为,如被试入学后的学习,被预测的行为,如被试入学后的学习,我们称为效标我们称为效标。所谓效标关联效度,是指所谓效标关联效度,是指测验分数测验分数与与某一外部效标某一外部效标间的一致性程度,即测验结果能够间的一致性程度,即测验结果能够代表或预测效标行为的有效性和准确性程度。因为代表或预测效标行为的有效性和准确性程度。因为效标效度需要有实际证据,所以又

22、称为实证效度。效标效度需要有实际证据,所以又称为实证效度。如上例,若大学入学考试能较好地预测大学入学后如上例,若大学入学考试能较好地预测大学入学后的学习成绩,那测验就具有较高的效标关联效度。的学习成绩,那测验就具有较高的效标关联效度。分析效标关联效度的通常作法是对问卷(量表)测量结果与有效标准进行相关分析,相关系数越大表示问卷(量表)的效标关联效度越好,一般认为相关系数在0. 40. 8 比较理想。若为连续型变量,计算Pearson 或Fisher相关系数,若为分类变量,则计算Kendall 或Spearman 等级相关系数。一般而言, 相关系数在0. 40. 8 比较理想。效标与效标测量效标

23、与效标测量估计测验效标关联效度首要条件是必须具有估计测验效标关联效度首要条件是必须具有效标效标(准(准则)。则)。 观念效标:概念观念效标:概念阿斯汀阿斯汀(A. W. AstinA. W. Astin)将)将效标效标 量化量化 效标测量效标测量 如如对于对于大学入学考试这个测验来说,大学入学考试这个测验来说,观念效标观念效标是是“大学学习成大学学习成功功”,而大学学习成绩是,而大学学习成绩是效标测量效标测量。1效标的测量有效性:有效性:高效度高效度 可靠性:可靠性:高信度高信度 客观性:客观性:实用性实用性:方便方便, ,经济经济 2常用的效标学术成就学术成就(智力测验、标准化成就测验的效标

24、)(智力测验、标准化成就测验的效标) 实际工作表现实际工作表现(特殊能力测验、部分智力测验和人(特殊能力测验、部分智力测验和人格测验的效标)格测验的效标)团体差异团体差异(测验分数能将已经知道的团体差异区分(测验分数能将已经知道的团体差异区分开来)开来) 临床诊断临床诊断(人格测验的效标)(人格测验的效标) 特殊训练的成绩特殊训练的成绩(特殊能力测验的效标)(特殊能力测验的效标)等级评定等级评定(人格测验中其他人的评定)(人格测验中其他人的评定) 现有的测验现有的测验返回返回三、效标关联效度估计的方法 相关系数法相关系数法 分组检验法分组检验法 命中率法命中率法 1相关系数法 方法:方法: 积

25、差相关、点二列相关、二列相关、等级相关等积差相关、点二列相关、二列相关、等级相关等 优点:优点: 提供了预测源与效标之间的数量关系;提供了预测源与效标之间的数量关系; 可利用回归方程来预测效标分数。可利用回归方程来预测效标分数。缺点:缺点: 预测源与效标是非线性关系时,会低估效度;预测源与效标是非线性关系时,会低估效度; 不能提供关于取舍正确性的指标。不能提供关于取舍正确性的指标。2分组检验法 基本思想:基本思想: 根据被试在根据被试在准则准则上的行为表现,将他们分为不上的行为表现,将他们分为不同的组别,如果这些组的预测源分数有显著差异,同的组别,如果这些组的预测源分数有显著差异,那么,这个测

26、验的预测效度是较高的。那么,这个测验的预测效度是较高的。步骤:步骤:依据被试在准则上的行为表现进行分组:依据被试在准则上的行为表现进行分组: 成功与失败成功与失败 或或 合格与不合格合格与不合格 两独立样组测验分数的均数差异显著性两独立样组测验分数的均数差异显著性t t检验检验计算重叠量计算重叠量3命中率法 分类决策的正确性分类决策的正确性 ADABCD总命中率AAB正命中率3.构想构想效度效度 一、一、构想构想效度的含义效度的含义 构想构想效度效度(construct validityconstruct validity) 指测验分数在多大程度上测量或解释了某种理论构想。指测验分数在多大程度

27、上测量或解释了某种理论构想。 又译构念效度。又译构念效度。二、确定结构效度的基本步骤二、确定结构效度的基本步骤1 1建立理论框架建立理论框架 2 2提出假设提出假设 3 3检验假设检验假设测验构想效度的方法 1 1逻辑验证法逻辑验证法 根据已有理论,考察测验数据是否符合逻辑推论。根据已有理论,考察测验数据是否符合逻辑推论。如:如:1.1.理论认为智力与年龄成正比。理论认为智力与年龄成正比。 2.IQ 2.IQ分数与学习成绩呈显著相关。分数与学习成绩呈显著相关。2 2考察测验的考察测验的内部一致性内部一致性 内部一致性系数内部一致性系数来评价某个测验构想效度的高低。来评价某个测验构想效度的高低。

28、3 3计算相关系数(效标关联法)计算相关系数(效标关联法) 相容效度相容效度 计算新旧同类测验分数之间的相关。计算新旧同类测验分数之间的相关。区分效度区分效度 计算不同结构的测验对不同特质的测验之间的相关。计算不同结构的测验对不同特质的测验之间的相关。汇聚效度汇聚效度 计算不同结构的测验对同一特质的测验之间的相关。计算不同结构的测验对同一特质的测验之间的相关。4 4因素分析法因素分析法 通过因素分析找到影响测验分数的共同因素,每个测验在共同因素上的通过因素分析找到影响测验分数的共同因素,每个测验在共同因素上的负荷量即每个测验与共同因素的相关,称为测验的因素效度。负荷量即每个测验与共同因素的相关

29、,称为测验的因素效度。第二节 常模 1. 1. 原始分数不能反映考生相对于团体的位置信息原始分数不能反映考生相对于团体的位置信息 王明语文考试王明语文考试8080分,你知道他的班级排名吗?以及班级分,你知道他的班级排名吗?以及班级其他同学的信息吗其他同学的信息吗? 要正确的解释、评价和使用测验的分数要正确的解释、评价和使用测验的分数, ,必须借助于某种参必须借助于某种参照标准才能解释测验分数的含义照标准才能解释测验分数的含义, ,从而作出正确的评价。最从而作出正确的评价。最常用的方法是建立常用的方法是建立常模常模标准。标准。 活动2:常模的概念 常模由标准化样本测试结果计算而来,即某一标准化常

30、模由标准化样本测试结果计算而来,即某一标准化样本的平均数和标准差,样本的平均数和标准差,是一种供比较的标准量数是一种供比较的标准量数。常模的构成要素为:常模的构成要素为:1 1. .原始分数原始分数;2 2. .导出分数导出分数;3 3. .对常对常模团体的有关具体描述模团体的有关具体描述。常模可分为常模可分为组间常模组间常模和和组内常模组内常模两大类。前者有两大类。前者有年级、年级、年龄常模年龄常模,反映不同群体在测验上表现的差异。后者有,反映不同群体在测验上表现的差异。后者有百分等级、标准分数、离差智商百分等级、标准分数、离差智商等常模。等常模。 被试在接受测验后,按照评分标准对其作答被试

31、在接受测验后,按照评分标准对其作答反应直接评出来的分数,叫原始分。反应直接评出来的分数,叫原始分。 导出分是在原始分的基础上,按一定的规则导出分是在原始分的基础上,按一定的规则推导出来的分数,其目的是为了更好、更科学地解推导出来的分数,其目的是为了更好、更科学地解释分数的含义。这种把原始分数转化为导出分的过释分数的含义。这种把原始分数转化为导出分的过程,称作分数转换。程,称作分数转换。原始原始分与导出分分与导出分1.百分等级含义:它是指把一个总体的所有分数按大小顺序排列后,把所有分它是指把一个总体的所有分数按大小顺序排列后,把所有分数按个数等分为数按个数等分为100100等份,这每一个等份对应

32、的百分数就是这个分数分等份,这每一个等份对应的百分数就是这个分数分布的百分等级,而刚好把所有分数个数分为布的百分等级,而刚好把所有分数个数分为100100份的分数值则叫百分位份的分数值则叫百分位数。数。换句话说,百分等级是以百分率的形式来表示一个人的相对等级、即换句话说,百分等级是以百分率的形式来表示一个人的相对等级、即我们将常模样本分成我们将常模样本分成100100等份时这个人所占的等级。等份时这个人所占的等级。百分等级的计算百分等级的计算关键在于确定在常模样本中分数低于某一百分等级的计算关键在于确定在常模样本中分数低于某一特别分数的人数比例,这可以分两种情况:特别分数的人数比例,这可以分两

33、种情况:一种情况是对没有分组资料的数据分布求百分等级,公式一种情况是对没有分组资料的数据分布求百分等级,公式为:为:PR=100-100*(R-0.5)/N其中,其中,R R为排名顺序;为排名顺序;N N为总人数。为总人数。全班全班5050人,小明考了人,小明考了6262分,排名第分,排名第1010,求其百分等级。,求其百分等级。8119100505010100100PR分组的百分等级X=X=原始分数原始分数L=XL=X组所在组下限组所在组下限f=Xf=X组所在组次数组所在组次数F Fb b=X=X组所在组以下各组次数之和组所在组以下各组次数之和i= i=组距组距 N=N=总人数总人数分组区间

34、分组区间次数次数累加累加次数次数556045050556464550940404515313540816303558253023202511Lf5353原始分数原始分数FbFb另一种情况是对有分组资另一种情况是对有分组资料的数据求百分等级。对料的数据求百分等级。对这类资料中任一个分数计这类资料中任一个分数计算百分等级的公式如下:算百分等级的公式如下:评价:百分等级评价:百分等级优点:优点:1. 1.容易计算,容易解释,甚至外行人也能容易计算,容易解释,甚至外行人也能看懂。看懂。2. 2.对于各种测验和各种被试普遍适用。对于各种测验和各种被试普遍适用。缺点:缺少相等单位,属于顺序量表,不能对它缺

35、点:缺少相等单位,属于顺序量表,不能对它进行加、减、乘、除运算,因而使大多数统计分进行加、减、乘、除运算,因而使大多数统计分析无法运用。析无法运用。2.发展量表 (1)(1)年龄年龄量表量表智力智力年龄年龄定义定义:智力年龄智力年龄代表智力水平的年龄,即儿童在年龄代表智力水平的年龄,即儿童在年龄量表上所得的分数。量表上所得的分数。特点特点:智龄单位不保持恒定,一般随年龄而减小智龄单位不保持恒定,一般随年龄而减小。智力年龄计算智力年龄计算: :期坦福一比纳量表,上自期坦福一比纳量表,上自5 5岁组下至岁组下至1414岁组,每组岁组,每组有有6 6个测题,答对每个测题得智龄两个月。个测题,答对每个

36、测题得智龄两个月。(2)年级当量含义:以各年级学生在某份测验上的平均原始分数,作为判断学生学习水平的一个指标。比如:四年级学生中解答问题的平均数为23,则原始分数23相当于4年级的年级当量;4.5就相当于四年级第5个月时的平均成绩。(2) 年级当量使用注意事项1)年级当量不等同于实际水平。2)不同领域中的相同年级当量,并不意味着在这两个领域能力相等。3)年级当量中的连续增长假设是不可验证的。4)年级当量在分数分布高端和低端的人来说,可能有问题。5)年级常模仅适用于测验所涵盖的年级中所教的一般科目,一般不适用于高年级水平。3.3.商数商数比率智商(比率智商(IQIQ)= =智龄智龄 / /实足年

37、龄实足年龄* *100100实足年龄实足年龄= =测验日期测验日期- -出生日期。出生日期。30d/30d/月。月。教育商数(教育商数(EQEQ)= =教育年龄教育年龄/ /实足年龄实足年龄* *100100(1)(1)线性线性转换的标准分数转换的标准分数Z Z分数分数 标准分数是将原始分数与平均数的距离以标准差为单标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表,是最常用的一种等距量表。位表示出来的量表,是最常用的一种等距量表。SXXZ4.4.标准分数标准分数标准分数的性质标准分数的性质 (1 1)任何一批原始分数,转化成)任何一批原始分数,转化成Z Z分数后,平均值为分数后,

38、平均值为0 0,标准差为标准差为1 1。 (2 2)标准分数的单位是相等的,零点是相对的。)标准分数的单位是相等的,零点是相对的。 (3 3)标准分数本身是关于原始分数的一种线性变换,其)标准分数本身是关于原始分数的一种线性变换,其分布形状与原始分数相同分布形状与原始分数相同 (4 4)在一般的情况下,标准分数的取值在)在一般的情况下,标准分数的取值在-3-3到到+3+3之间。之间。评价:线性转换的标准分数线性转换的标准分数优点:优点:1. 1.标准分数是等距量表,能进行进一步统计分析。标准分数是等距量表,能进行进一步统计分析。 2. 2.可以对两个以上的测验分数进行比较。可以对两个以上的测验

39、分数进行比较。举例:某班语文、数学和英语成绩的平均数分别是举例:某班语文、数学和英语成绩的平均数分别是80分、分、70分和分和85分,分,对应的标准差分别是对应的标准差分别是10分、分、15分和分和12分。该班某生三科成绩分别是分。该班某生三科成绩分别是85分、分、82分和分和90分分,问:该生这三科成绩哪一科最好?问:该生这三科成绩哪一科最好? Z语文语文=(85-80)/10=0.5 Z数学数学=(82-70)/15=0.8Z英语英语=(90-85)/12=0.42评价:线性转换的标准分数评价:线性转换的标准分数l缺点:缺点:1. 1.不易理解,外行不易看懂。不易理解,外行不易看懂。l 2

40、. 2.线性转换后的标准分数只能用来比较两个分布形态相线性转换后的标准分数只能用来比较两个分布形态相同的分数,如果分布形态相差很大,仍然不能进行比较。同的分数,如果分布形态相差很大,仍然不能进行比较。非线性转换的标准分数非线性转换的标准分数为了能将来源于不同分布形式的分数进行比较,可使用非为了能将来源于不同分布形式的分数进行比较,可使用非线性转换,将非正态分布转换成正态分布。线性转换,将非正态分布转换成正态分布。 思考:怎样将原始分数转换成正态化的标准分数呢?思考:怎样将原始分数转换成正态化的标准分数呢?原始分数原始分数百分等级百分等级查正态分布表查正态分布表Z Z分数分数正态化的标正态化的标

41、准分数。准分数。标准分数变形标准分数变形 在标准分数在标准分数 Z Z 的应用中,由于标准分数的应用中,由于标准分数Z Z分值过小,分值过小,并往往带有小数和负值等缺陷,在许多情形下直接使用不并往往带有小数和负值等缺陷,在许多情形下直接使用不大合乎人们表示分数的习惯,故通常把标准分数大合乎人们表示分数的习惯,故通常把标准分数Z Z通过线通过线性变换转到更大的标准分数量表上。性变换转到更大的标准分数量表上。 Z Z分数一般转换公式为分数一般转换公式为 T=a+bzT=a+bz a a和和b b为选定的两个常数,为选定的两个常数,Z Z为标准分数,为标准分数,T T为线性变换为线性变换的标准分数。

42、的标准分数。教育与心理测验中的教育与心理测验中的T T分数:分数:T=50+10T=50+10Z Z韦氏智力量表中各分测验的量表分:韦氏智力量表中各分测验的量表分:T=10+3T=10+3Z Z 韦氏智力量表智商(离差智商):韦氏智力量表智商(离差智商):IQ=100+15IQ=100+15Z Z美国大学入学考试报告分数:美国大学入学考试报告分数:CEEB=500+100CEEB=500+100Z Z为出国人员举行的英语水平考试:为出国人员举行的英语水平考试:EPT=90+20EPT=90+20Z Z美国教育测验中心举办美国教育测验中心举办“托福托福”考试:考试:TOEFL=500+70TOE

43、FL=500+70Z Z二、常模标准化二、常模标准化常模标准化是指常模团体具有代表性。常模标准化是指常模团体具有代表性。常模来自一个团体,而非某个个体。常模来自一个团体,而非某个个体。常模团体的界定常模团体的界定常模团体是由具有某种共同特征的人所组成的一个群常模团体是由具有某种共同特征的人所组成的一个群体。通常选择一个能够代表总体的样组,该样组就叫做标体。通常选择一个能够代表总体的样组,该样组就叫做标准化样组,也就是常模团体。它用一个标准的、规范的分准化样组,也就是常模团体。它用一个标准的、规范的分数表示出来,以提供比较的基础。数表示出来,以提供比较的基础。常模团体建立的条件常模团体建立的条件

44、群体的构成必须明确界定群体的构成必须明确界定常模团体必须是所测群体的代表性样本常模团体必须是所测群体的代表性样本样本的大小要适当样本的大小要适当标准化样组是一定时空的产物标准化样组是一定时空的产物为特殊群体制定特殊常模为特殊群体制定特殊常模中国正常人中国正常人SCL-90SCL-90常模常模(N=1388) (N=1388) 因子因子统计统计指标指标躯躯体体化化强强迫迫人人际际敏敏感感抑抑郁郁焦焦虑虑敌敌对对恐恐怖怖偏偏执执精精神神病病状状总总均均分分平均分平均分1.371.371.621.621.651.651.501.501.391.391.481.481.231.231.431.431.

45、291.291.441.44标准差标准差0.480.480.580.580.510.510.590.590.430.430.560.560.410.410.570.570.420.420.430.43全国青年全国青年SCL-90SCL-90常模常模(N=781) (N=781) 因子因子统计统计指标指标躯躯体体化化强强迫迫人人际际敏敏感感抑抑郁郁焦焦虑虑敌敌对对恐恐怖怖偏偏执执精精神神病病状状总总均均分分平均分平均分1.341.341.691.691.761.761.571.571.421.421.501.501.331.331.521.521.361.361.341.34标准差标准差0.45

46、0.450.610.610.670.670.610.610.430.430.570.570.450.450.600.600.470.470.450.45全国部分地区大学生全国部分地区大学生SCL-90SCL-90常模常模(N=4141) (N=4141) 因子因子统计统计指标指标躯躯体体化化强强迫迫人人际际敏敏感感抑抑郁郁焦焦虑虑敌敌对对恐恐怖怖偏偏执执精精神神病病状状总总均均分分平均分平均分1.451.451.991.991.981.981.831.831.641.641.771.771.461.461.851.851.631.631.451.45标准差标准差0.490.490.640.64

47、0.740.740.650.650.590.590.680.680.530.530.690.690.540.540.490.49江西省全日制大学生江西省全日制大学生SCL-90SCL-90常模表(常模表(N=3422N=3422) 因子因子统计统计指标指标躯躯体体化化强强迫迫人人际际敏敏感感抑抑郁郁焦焦虑虑敌敌对对恐恐怖怖偏偏执执精精神神病病状状总总均均分分平均分平均分1.341.341.911.911.821.821.761.761.551.551.651.651.371.371.691.691.521.521.451.45标准差标准差0.370.370.560.560.560.560.57

48、0.570.470.470.570.570.410.410.520.520.450.450.440.44常模团体必须是所测群体的代表性样本常模团体必须是所测群体的代表性样本l常模团体缺乏代表性,会使常模资料产生偏差而影响对测常模团体缺乏代表性,会使常模资料产生偏差而影响对测验分数的解释。验分数的解释。 简单随机取样简单随机取样 等距抽样等距抽样 分层随机取样分层随机取样 两阶段随机取样两阶段随机取样样本的大小要适当样本的大小要适当l依据统计取样的原理,样本愈大则所求得的统计量误差愈依据统计取样的原理,样本愈大则所求得的统计量误差愈小,愈接近总体的统计量。小,愈接近总体的统计量。l在实际工作中,

49、应从在实际工作中,应从经济的或实用的经济的或实用的可能性和可能性和减少误差减少误差这这两方面来综合考虑样本的大小。两方面来综合考虑样本的大小。l总体数目小,只有几十个人,则需要总体数目小,只有几十个人,则需要100%100%的样本。如果总的样本。如果总体数目大,相应的样本也大,一般最低不小于体数目大,相应的样本也大,一般最低不小于3030或或100100个。个。全国性常模,一般应有全国性常模,一般应有2000300020003000人为宜。人为宜。 标准化样组是一定时空的产物标准化样组是一定时空的产物 由于教育、时代变迁等多种因素的影响,几年前所编由于教育、时代变迁等多种因素的影响,几年前所编

50、制的常模可能不再适合,因此常模必须定期地修订,要以制的常模可能不再适合,因此常模必须定期地修订,要以批判的眼光看待旧的常模,并尽可能采用新近的常模。批判的眼光看待旧的常模,并尽可能采用新近的常模。常模建立举例常模建立举例l中国新兵中国新兵SCL90SCL90常模的建立中国心理卫生杂志常模的建立中国心理卫生杂志20002000年年0404期期 l全国大学生全国大学生SCL-90SCL-90新常模构建问题研究中国校医新常模构建问题研究中国校医20092009年年0303期期l3 37 7岁儿童气质量表全国城市常模的建立中国儿童保健杂志岁儿童气质量表全国城市常模的建立中国儿童保健杂志19981998年年0404期期 l中国小学生基本数学能力测试量表常模的建立中国临床康复中国小学生基本数学能力测试量表常模的建立中国临床康复20062006年年3030期期l中学生中学生SCL-90SCL-90信度、效度检验与常模建立中国心理卫生杂志信度、效度检验与常模建立中国心理卫生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论