教育技术学-杨九民--第六章_第1页
教育技术学-杨九民--第六章_第2页
教育技术学-杨九民--第六章_第3页
教育技术学-杨九民--第六章_第4页
教育技术学-杨九民--第六章_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 学习过程和结果的测量与评价学习过程和结果的测量与评价v 第一节第一节 学习过程和结果测量与评价概述学习过程和结果测量与评价概述 v 第二节第二节 有效测量的必备条件有效测量的必备条件 v 第三节第三节 学习过程和结果测量与评价的方法学习过程和结果测量与评价的方法v 第四节第四节 学习过程和结果测量与评价的新技学习过程和结果测量与评价的新技术术 与新方法与新方法v 能够使用自己的语言解释学习测量与学习能够使用自己的语言解释学习测量与学习评价的基本含义,并且能够对其进行分析,评价的基本含义,并且能够对其进行分析,指出二者之间的联系与区别;指出二者之间的联系与区别;v 能够意识到学习测

2、量与评价在教学系统设能够意识到学习测量与评价在教学系统设计中的地位与作用,并且能够在教学系统计中的地位与作用,并且能够在教学系统设计的实践中有意识的运用学习测量与评设计的实践中有意识的运用学习测量与评价的知识;价的知识;v 掌握有效测量的必备条件,并且能够运用掌握有效测量的必备条件,并且能够运用这些条件来判断一个测量是否有效;这些条件来判断一个测量是否有效;学习目标:学习目标:v 掌握学习测评的一些基本方法,并且能够掌握学习测评的一些基本方法,并且能够在教学系统设计的具体实践中运用这些方在教学系统设计的具体实践中运用这些方法;法;v 掌握学习测评的一些新技术与新方法,并掌握学习测评的一些新技术

3、与新方法,并且能够在教学系统设计的具体实践中运用且能够在教学系统设计的具体实践中运用这些新技术与新方法;这些新技术与新方法; v 掌握不同类型知识的测评等等,并且能够掌握不同类型知识的测评等等,并且能够分别对陈述性知识与程序性知识进行测评。分别对陈述性知识与程序性知识进行测评。学习目标:学习目标:v 本章主要介绍学习结果测量与评价的基本本章主要介绍学习结果测量与评价的基本概念、基本功能、有效测量的必备条件以概念、基本功能、有效测量的必备条件以及学习测量与评价的技术与方法等知识。及学习测量与评价的技术与方法等知识。v 本章根据教学系统设计的需要,选择了一本章根据教学系统设计的需要,选择了一些具有

4、重要影响和应用前景的学习测量与些具有重要影响和应用前景的学习测量与评价的新技术与新方法进行了介绍,期望评价的新技术与新方法进行了介绍,期望能够对学习者有所帮助与启发。能够对学习者有所帮助与启发。v 针对教学系统设计人员的具体需要,简要针对教学系统设计人员的具体需要,简要介绍了不同类型知识的测量与评价问题。介绍了不同类型知识的测量与评价问题。学习指导:学习指导:知识地图:知识地图:第一节第一节 学习过程和结果测量与评价的概述学习过程和结果测量与评价的概述v测量与评价的含义测量与评价的含义v测量与评价的功能测量与评价的功能v测量、评价与学习目标测量、评价与学习目标v学习测量与评价的基本原则学习测量

5、与评价的基本原则一、测量与评价的含义一、测量与评价的含义v现代学习测量和评价是在对学习目标、学习过程、现代学习测量和评价是在对学习目标、学习过程、学习结果(现实的或潜在的结果)以及影响学习的学习结果(现实的或潜在的结果)以及影响学习的各种因素做出量(或质)的记述的基础上进行的一各种因素做出量(或质)的记述的基础上进行的一种价值判断活动。种价值判断活动。 v测评的对象测评的对象:教学系统中的一切因素教学系统中的一切因素v学习测量就是对评价对象的现状、属性与规律做学习测量就是对评价对象的现状、属性与规律做出客观的、定性或定量的描述,出客观的、定性或定量的描述,这种描述的结果是这种描述的结果是对测评

6、对象的某些属性分配数值;对测评对象的某些属性分配数值;v学习评价是在学习测量的基础上,对评价对象做学习评价是在学习测量的基础上,对评价对象做出价值判断。出价值判断。一、测量与评价的含义一、测量与评价的含义v我们常用的测验这一术语,既指测量,又指评价。我们常用的测验这一术语,既指测量,又指评价。v 测验是测量一个行为样本的一种系统程序测验是测量一个行为样本的一种系统程序: : “ “行为行为”是指受测者对测验的题目所作的反应是指受测者对测验的题目所作的反应; ; “ “样本样本”则指测验所包含的只是所有题目总体中则指测验所包含的只是所有题目总体中的一个样组,不是全部。的一个样组,不是全部。 “

7、“系统程序系统程序”是指测验在编制、施测和评分等方是指测验在编制、施测和评分等方面均依据确定的法则;面均依据确定的法则;v 一个测验即是一种测量工具或测量量表。一个测验即是一种测量工具或测量量表。 一、测量与评价的含义一、测量与评价的含义v 学习测量借助测量工具或测量量表进行。它学习测量借助测量工具或测量量表进行。它所指向的人的行为方面,通常是由所用的测验所指向的人的行为方面,通常是由所用的测验或量表规定的,其结果则以数值表示。这样,或量表规定的,其结果则以数值表示。这样,测验结果便构成学生及其行为更一般和更全面测验结果便构成学生及其行为更一般和更全面的评价基础。的评价基础。 v 评价指的是根

8、据测验分数作出解释,它超出评价指的是根据测验分数作出解释,它超出上述那种描述而力图确定行为的价值。即评价上述那种描述而力图确定行为的价值。即评价是对测验分数进行估计,并进一步根据这种估是对测验分数进行估计,并进一步根据这种估计作出决定。计作出决定。 一、测量与评价的含义一、测量与评价的含义v测量和评价是密切联系、又相互区别的概念。测量和评价是密切联系、又相互区别的概念。v测量和评价是同一活动的两个不同阶段。测量和评价是同一活动的两个不同阶段。v测量是一种事实描述过程,只对事物的属性赋值;测量是一种事实描述过程,只对事物的属性赋值;评价是一种价值判断过程,是在测量的基础上对事评价是一种价值判断过

9、程,是在测量的基础上对事物的好与差、对与错、优与劣的判断。物的好与差、对与错、优与劣的判断。v测量只能是在评价需要的指导下的事实描述,否测量只能是在评价需要的指导下的事实描述,否则,测量没有任何意义;而评价必须是在测量基础则,测量没有任何意义;而评价必须是在测量基础上的价值判断,否则,评价结果就是空中楼阁,毫上的价值判断,否则,评价结果就是空中楼阁,毫不可信。不可信。 v鞭策和促进学生的学习鞭策和促进学生的学习v促进教师的教学促进教师的教学v鉴定课程计划和作出判断鉴定课程计划和作出判断二、测量与评价的功能二、测量与评价的功能v鞭策学生的学习,确切地说,是要对学鞭策学生的学习,确切地说,是要对学

10、生的进步和他们的最后成绩和成就进行生的进步和他们的最后成绩和成就进行客观检验。客观检验。v鞭策学生的学习是测量与评价的主要功鞭策学生的学习是测量与评价的主要功能。能。(一)鞭策和促进学生的学习(一)鞭策和促进学生的学习促进学生的学习有很多方面:促进学生的学习有很多方面:v评价鼓励教师将自己的目标阐述得清楚明评价鼓励教师将自己的目标阐述得清楚明确,并把自己的期望告知学生。确,并把自己的期望告知学生。 v考试促使学生在测验之前对教材进行复习、考试促使学生在测验之前对教材进行复习、巩固、澄清和综合,在测验过程中对材料巩固、澄清和综合,在测验过程中对材料进行比较与评论。考试的反馈不仅能确证、进行比较与

11、评论。考试的反馈不仅能确证、澄清和校正某些观念,还能明确指出要求澄清和校正某些观念,还能明确指出要求进一步思考和研究的领域。进一步思考和研究的领域。 (一)鞭策和促进学生的学习(一)鞭策和促进学生的学习促进学生的学习有很多方面:促进学生的学习有很多方面:v考试在学校学习中具有重大的激起动考试在学校学习中具有重大的激起动机的作用。机的作用。v学生根据经常获得的外部评价的经验,学生根据经常获得的外部评价的经验,学会如何独立地评价自己的学习结果。学会如何独立地评价自己的学习结果。 (一)鞭策和促进学生的学习(一)鞭策和促进学生的学习v测量和评价为教师提供了他们教学工作的效测量和评价为教师提供了他们教

12、学工作的效果与效率的必要反馈果与效率的必要反馈。v考试的反馈有利于认识需要进一步说明、澄考试的反馈有利于认识需要进一步说明、澄清和评述的领域。清和评述的领域。v考试的反馈,对于诊断个人和集体这两方面考试的反馈,对于诊断个人和集体这两方面的学习困难也是很有价值的。的学习困难也是很有价值的。v此外,客观的考试,对于纠正非正式的评价此外,客观的考试,对于纠正非正式的评价方法的主观性与印象主义也是必要的。方法的主观性与印象主义也是必要的。(二)促进教师的教学(二)促进教师的教学 v测量与评价是检查课程计划,即估计课测量与评价是检查课程计划,即估计课程的特定程序和组织程的特定程序和组织其中包括指定其中包

13、括指定的题材内容、教材与教法的题材内容、教材与教法有什么优有什么优点所必不可少的。点所必不可少的。v测量与评价所提供的数据,对于作出行测量与评价所提供的数据,对于作出行政上的决定,如教材的年级安排和课程政上的决定,如教材的年级安排和课程的最佳序列也有帮助。的最佳序列也有帮助。 (三)鉴定课程计划和作出判断(三)鉴定课程计划和作出判断 测量与评价的局限性:测量与评价的局限性:v认为真正的测量只有在自然科学方面行得通。认为真正的测量只有在自然科学方面行得通。v认为测验分数常常成为测验目的本身,取代了认为测验分数常常成为测验目的本身,取代了知识、能力、学业成就等,导致学生的认知动知识、能力、学业成就

14、等,导致学生的认知动机大为减退,社会所重视的是测验分数和名牌机大为减退,社会所重视的是测验分数和名牌学校的文凭。学校的文凭。 v认为当前流行的测量工具不能测试一些最重要认为当前流行的测量工具不能测试一些最重要的学习结果如认知风格、创造性和对问题敏感的学习结果如认知风格、创造性和对问题敏感性等品质与能力,以及心理表征与信息加工过性等品质与能力,以及心理表征与信息加工过程等。程等。 (三)鉴定课程计划和作出判断(三)鉴定课程计划和作出判断 三、测量、评价与学习目标三、测量、评价与学习目标v 行为目标行为目标(behavioral objectives) v 认知目标认知目标(cognitive o

15、bjectives) (一)行为目标(一)行为目标(behavioral objectives)v 行为目标意指清楚地陈述学生在教学结束时行为目标意指清楚地陈述学生在教学结束时应能做到的事。应能做到的事。 v马杰认为,目标乃是马杰认为,目标乃是“行为型式的描述行为型式的描述”。 他强调,教学的行为目标应陈述得非常明确具体,他强调,教学的行为目标应陈述得非常明确具体,既要说清行为目标中的规定条件,又要说清可接既要说清行为目标中的规定条件,又要说清可接受的最低的作业水准。受的最低的作业水准。v格伦兰论证,在许多情况下,教师应先陈述总格伦兰论证,在许多情况下,教师应先陈述总的目标,然后列出反映总目标

16、的具体行为目标的的目标,然后列出反映总目标的具体行为目标的样本,这不仅有利于测量与评价,而且还能使教样本,这不仅有利于测量与评价,而且还能使教师的思路清楚。师的思路清楚。(二)认知目标(二)认知目标(cognitive objectives)v 布卢姆等人将认知目标按由低到高的层次划布卢姆等人将认知目标按由低到高的层次划分为六级:分为六级: 知识、领会、运用、分析、综合、评价知识、领会、运用、分析、综合、评价v现代认知心理学即信息加工心理学认为人的认现代认知心理学即信息加工心理学认为人的认 知过程即是信息加工过程,信息加工的结果则是知过程即是信息加工过程,信息加工的结果则是习得知识习得知识陈述

17、性知识、程序性知识和策略性陈述性知识、程序性知识和策略性知识知识,所以,现代认知心理学家必然以学生获得,所以,现代认知心理学家必然以学生获得上述三类知识为教学的认知目标。上述三类知识为教学的认知目标。 四、学习测量与评价的基本原则四、学习测量与评价的基本原则v 目的性原则目的性原则v 科学性原则科学性原则v 实践性原则实践性原则第二节第二节 有效测量的必备条件有效测量的必备条件v 效度效度v 信度信度v 代表性代表性v 辨别力辨别力v 可行性可行性一、效度一、效度(validityvalidity) 一个测验的效度是指该测验测量其所要测量一个测验的效度是指该测验测量其所要测量的东西达到了多么好

18、的程度。的东西达到了多么好的程度。 测验的效度是相对的。任何一种测验只是对测验的效度是相对的。任何一种测验只是对一定的目的来说才是有效的。一定的目的来说才是有效的。 v 内容效度(内容效度(content validitycontent validity)v 预测效度(预测效度(predictive validitypredictive validity)v 结构效度(结构效度(construct validityconstruct validity) (一)内容效度(一)内容效度(content validity) v 内容效度是内容效度是指测验的题目在多大程度上代表指测验的题目在多大程度上

19、代表了所想测量的结构概念的整个内容了所想测量的结构概念的整个内容。为此,必须。为此,必须考虑从总体中抽取样本,并对取样是否合适作出考虑从总体中抽取样本,并对取样是否合适作出估计。估计。 v 评价内容效度,一般由学科专家根据所要测评价内容效度,一般由学科专家根据所要测量的心理属性和内容范围的界定,以及各部分内量的心理属性和内容范围的界定,以及各部分内容、认知层次的比重,用分析的方法对测验作出容、认知层次的比重,用分析的方法对测验作出判断。判断。 (二)预测效度(二)预测效度(predictive validity) v预测效度又称效标关联效度,是预测效度又称效标关联效度,是指一个测指一个测验对处

20、于特定情景中的个体的行为进行预验对处于特定情景中的个体的行为进行预测的有效性测的有效性,也就是对我们所感兴趣的行,也就是对我们所感兴趣的行为能够预测到什么程度。为能够预测到什么程度。v与预测效度有关的最重要方面是标准。与预测效度有关的最重要方面是标准。 (三)结构效度(三)结构效度(construct validity) v结构效度结构效度指测验对假设的理论概念或心理属性指测验对假设的理论概念或心理属性测量的有效程度测量的有效程度。v评价结构效度的目的:评价结构效度的目的:在于从心理特性的理论在于从心理特性的理论观点上对测验的结果加以解释和探讨观点上对测验的结果加以解释和探讨。v确定结构效度的

21、方法,一般是根据某种结构理确定结构效度的方法,一般是根据某种结构理论提出各项心理属性或行为的假设结构,编制论提出各项心理属性或行为的假设结构,编制测验,然后以测验结果为依据,运用相关、因测验,然后以测验结果为依据,运用相关、因素分析或实验等方法,验证测验结果是否符合素分析或实验等方法,验证测验结果是否符合上述假设结构。上述假设结构。二、信二、信 度度 v一个测验的信度,是一个测验的信度,是指该测验测量其所要指该测验测量其所要测量的东西前后一致的程度测量的东西前后一致的程度。信度涉及到。信度涉及到测验是否准确可靠的问题。测验是否准确可靠的问题。v测验的信度指标通常也以相关系数表示,测验的信度指标

22、通常也以相关系数表示,所以称为信度系数。所以称为信度系数。v信度系数是同一样本所得的两组资料间的信度系数是同一样本所得的两组资料间的相关,用来作为测量一致性的指标。相关,用来作为测量一致性的指标。 二、信二、信 度度表示心理与教育测验的信度,可用三类系数表示心理与教育测验的信度,可用三类系数:v等值性系数等值性系数(coefficient of equivalence)v稳定性系数稳定性系数(coefficient of stability) v普遍性系数普遍性系数(coefficient of generality) (一)等值性系数(一)等值性系数v平行型测验:与原测验有同样的内容、同平行

23、型测验:与原测验有同样的内容、同类的题目,难度也一样,因而是等值的。类的题目,难度也一样,因而是等值的。 v等值性系数是某测验的两个平行型测验等值性系数是某测验的两个平行型测验(或称替代性测验)在最短时距内施测所(或称替代性测验)在最短时距内施测所得成绩的相关系数。得成绩的相关系数。 v有时没有另一等值测验,可求有时没有另一等值测验,可求“分半信度分半信度”系数。系数。(二)稳定性系数(二)稳定性系数v先用一个测验测量,过一段时间后,再先用一个测验测量,过一段时间后,再用这个测验测量,计算测量与再测量得用这个测验测量,计算测量与再测量得分之间的相关,即可求得稳定性系数。分之间的相关,即可求得稳

24、定性系数。v稳定性系数可定义为同一测验施测两次稳定性系数可定义为同一测验施测两次的相关系数。两次试验的时距可长可短,的相关系数。两次试验的时距可长可短,根据两次测量间隔时间的长短,可得不根据两次测量间隔时间的长短,可得不同数值的信度系数。同数值的信度系数。 (三)普遍性系数(三)普遍性系数v普遍性系数也是对一个测验的测量有多大一致普遍性系数也是对一个测验的测量有多大一致性的估计,但这个测验是由测量同一品质或属性的估计,但这个测验是由测量同一品质或属性的异质的、但有关联的分测验组成的。性的异质的、但有关联的分测验组成的。v异质(异质(heterogeneityheterogeneity)指构成测

25、验的各分测)指构成测验的各分测验是不一致的。验是不一致的。 v普遍性系数是一个测验中许多分测验的测分的普遍性系数是一个测验中许多分测验的测分的平均相关系数。平均相关系数。 三、代表性三、代表性v几乎所有的心理与学习测量都是以几乎所有的心理与学习测量都是以取样取样的原理的原理为根据的。为根据的。v测量的典型的做法是:测量的典型的做法是:选择关于这些内容的一选择关于这些内容的一个样本作为估计该样本所属的总体(或称全域)个样本作为估计该样本所属的总体(或称全域)的基础。的基础。它必须满足两点:它必须满足两点: (1 1)样本必须具有代表性,即适当地代表总体;)样本必须具有代表性,即适当地代表总体;

26、(2 2)在符合代表性和意义性要求的这个限度内,)在符合代表性和意义性要求的这个限度内,样本必须是随机抽取的。样本必须是随机抽取的。 四、辨别力四、辨别力v有效测验的一个显著特征:有效测验的一个显著特征:是最大限度地是最大限度地区分所测量的品质或属性有所不同的个体区分所测量的品质或属性有所不同的个体的能力的能力。这个特征主要取决于测验项目的。这个特征主要取决于测验项目的辨别力(辨别力(discriminingdiscrimining powerpower)。)。v当然在一定程度上,这一特征也要看测验当然在一定程度上,这一特征也要看测验总分的分布,以及该测验是否为集体内的总分的分布,以及该测验是

27、否为集体内的优良者提供了适当的升限优良者提供了适当的升限(ceiling)情况情况而定。而定。 四、辨别力四、辨别力正态分布正态分布 测验分数呈正态分布,那么在量表的两端(即伸测验分数呈正态分布,那么在量表的两端(即伸展出的分数不多的部分)辨别力最大,而在量表的中展出的分数不多的部分)辨别力最大,而在量表的中间(即许多分数集中在一起的部分)辨别力较小。间(即许多分数集中在一起的部分)辨别力较小。 四、辨别力四、辨别力长方形分布长方形分布 测验分数呈长方形分布(量表各点上分数的测验分数呈长方形分布(量表各点上分数的次数相等),那么这个量表全距的辨别力就相等。次数相等),那么这个量表全距的辨别力就

28、相等。 四、辨别力四、辨别力偏态分布偏态分布 测验分数呈呈偏态分布(即分数的分布很不均匀,测验分数呈呈偏态分布(即分数的分布很不均匀,堆积在量表的一端堆积在量表的一端),那么,在分数不多的一端辨别,那么,在分数不多的一端辨别力最大,另一端则辨别力最小。力最大,另一端则辨别力最小。五、可行性五、可行性 除了从理论上考虑以外,还必须考虑各种实际问题,除了从理论上考虑以外,还必须考虑各种实际问题,才能决定测验的可行性。这里考虑四点:才能决定测验的可行性。这里考虑四点:v测验提供的信息有多大意义。测验提供的信息有多大意义。 v可行性测验应当在形式与内容上适合于它所要测量的可行性测验应当在形式与内容上适

29、合于它所要测量的年龄范围内的学生。年龄范围内的学生。v要考虑到测验的费用以及进行测试、记分和解释所需要考虑到测验的费用以及进行测试、记分和解释所需的时间量。的时间量。v评分是否客观,结果的解释是不是直截了当,记分和评分是否客观,结果的解释是不是直截了当,记分和解释要不要特殊训练,测验手册是否提供了试测和记解释要不要特殊训练,测验手册是否提供了试测和记分指导语、常模表以及解释分数。凡此种种问题,均分指导语、常模表以及解释分数。凡此种种问题,均应认真考虑。应认真考虑。第三节第三节 学习过程和结果测量与评价的方法学习过程和结果测量与评价的方法v 标准化学业成绩测验与教师自编测验标准化学业成绩测验与教

30、师自编测验 v 常模参照测验与准则参照测验常模参照测验与准则参照测验v 形成性测验与总结性测验形成性测验与总结性测验v 客观测验与论文式考试客观测验与论文式考试v 测试题的编制测试题的编制一、标准化学业成绩测验与教师自编测验一、标准化学业成绩测验与教师自编测验 所谓成绩测验是指在测量学生经过教所谓成绩测验是指在测量学生经过教学获得的知识、技能和能力水平的测验。学获得的知识、技能和能力水平的测验。 v 标准化学业成绩测验标准化学业成绩测验 (standardized achievement tests) v 教师自编测验教师自编测验 (teachermade tests)(一)标准化学业成绩测验

31、(一)标准化学业成绩测验(standardized achievement tests) v标准化测验标准化测验:经过标准化程序编制的心理与:经过标准化程序编制的心理与教育测验。教育测验。v标准化学业成绩测验标准化学业成绩测验:指由学科专家和测验:指由学科专家和测验编制专家共同按照标准化测验的编制要求特编制专家共同按照标准化测验的编制要求特为受过某种教学或训练的人编制的测验,目为受过某种教学或训练的人编制的测验,目的在于评价经教学或训练后的实际工作表现。的在于评价经教学或训练后的实际工作表现。 v优点优点:具有客观性和可比性:具有客观性和可比性(一)标准化学业成绩测验(一)标准化学业成绩测验(

32、standardized achievement tests) v标准化学业成绩测验:如标准化学业成绩测验:如TOEFL 、HSK(汉语水平考试)。(汉语水平考试)。 v标准化的程序包括:标准化的程序包括: 选取有代表性的材料编成测验的试题;选取有代表性的材料编成测验的试题;选取有代表性的被试进行测试,从而得到有选取有代表性的被试进行测试,从而得到有代表性的一组分数;根据测得分数的统计分代表性的一组分数;根据测得分数的统计分析,求出常模;按照规定程度建立效度与信析,求出常模;按照规定程度建立效度与信度;明确规定施测步骤和记分方法。度;明确规定施测步骤和记分方法。 (一)标准化学业成绩测验(一)

33、标准化学业成绩测验(standardized achievement tests) v标准化学学业成绩测验的基本要求标准化学学业成绩测验的基本要求v标准化学业成绩测验的特点标准化学业成绩测验的特点 v国外常用标准化学绩测验简介国外常用标准化学绩测验简介 1 1标准化学业成绩测验的基本要求标准化学业成绩测验的基本要求 v命题组卷标准化命题组卷标准化 v施测标准化施测标准化v评分标准化评分标准化 v测验分数解释标准化测验分数解释标准化2 2标准化学业成绩测验的特点标准化学业成绩测验的特点与传统测验相比,标准化测验有以下特点:与传统测验相比,标准化测验有以下特点:v试题编制:试题编制:开放型、分散型

34、、经常性开放型、分散型、经常性 v组织施测组织施测 :主观试题同客观试题相结合主观试题同客观试题相结合v评阅试卷:评阅试卷:使用光标阅读器评阅使用光标阅读器评阅 特点是:快速、准确、节省人力特点是:快速、准确、节省人力v分数解释:分数解释:使用标准分使用标准分 3 3国外常用标准化学绩测验简介国外常用标准化学绩测验简介 v 史坦福成就测验史坦福成就测验 (Standford Achievement Test)v关键数学算术诊断测关键数学算术诊断测 (Key Math Diagnostic Arithmetic Test)史坦福成就测验史坦福成就测验(Standford Achievement

35、Test) v史坦福成就测验属于综合性学业成绩考查史坦福成就测验属于综合性学业成绩考查测验,初版于测验,初版于19231923年。年。v该测验纵向上可分为该测验纵向上可分为6 6个不同的级别水平,个不同的级别水平,适用于适用于1 19 9年级学生。年级学生。v横向上包括横向上包括1111个方面的科目内容,如词汇、个方面的科目内容,如词汇、阅读理解、拼字、听理解、词汇学习技能、阅读理解、拼字、听理解、词汇学习技能、语言、数学概念、数学计算、数学应用、语言、数学概念、数学计算、数学应用、社会科学常识和自然科学常识。社会科学常识和自然科学常识。史坦福成就测验史坦福成就测验(Standford Ach

36、ievement Test) v该测验现行版本提供学年初常模和学该测验现行版本提供学年初常模和学年末常模两套常模。年末常模两套常模。v它使用的导出分数有它使用的导出分数有百分等级百分等级、标准标准九分数、年级当量、量表分数、正态九分数、年级当量、量表分数、正态曲线当量曲线当量这五种形式。这五种形式。关键数学算术诊断测验关键数学算术诊断测验(Key Math Diagnostic Arithmetic Test) v该测验初版于该测验初版于19711971年,适用于年,适用于学前儿童直学前儿童直至小学六年级的学生至小学六年级的学生。v测验分为测验分为内容、运算和应用内容、运算和应用三大块。三大块

37、。v测验在测验在总体水平诊断、分块水平诊断、分总体水平诊断、分块水平诊断、分测验水平诊断测验水平诊断和和项目水平诊断项目水平诊断这四个层次这四个层次上对被试进行数学技能诊断。上对被试进行数学技能诊断。(二)教师自编测验(二)教师自编测验(teachermade tests) 教师自编测验:教师自编测验:指教师根据教学需要自行设指教师根据教学需要自行设计与编制作为考察学生学习进步情况的测验。计与编制作为考察学生学习进步情况的测验。 v教师自编测验的特点教师自编测验的特点v教师自编测验的步骤与方法教师自编测验的步骤与方法v教师自编测验应注意的问题教师自编测验应注意的问题1教师自编测验的特点教师自编

38、测验的特点 v测验形式灵活多变,与测验目的完全一致测验形式灵活多变,与测验目的完全一致v测验内容与教材内容高度一致测验内容与教材内容高度一致v测验难度切合学生的实际水平测验难度切合学生的实际水平v测验编制简单快速测验编制简单快速2 2教师自编测验的步骤与方法教师自编测验的步骤与方法v审查测验目的审查测验目的 v制定测验编制计划制定测验编制计划v命题与组卷命题与组卷3 3教师自编测验应注意的问题教师自编测验应注意的问题v教师要深入研究教材,深入调查学生教师要深入研究教材,深入调查学生 v要维护准确稳定的合格标准要维护准确稳定的合格标准 v要客观评价自己的命题技术,合理使用各要客观评价自己的命题技

39、术,合理使用各种题型种题型v要注意总结命题经验,提高命题技术要注意总结命题经验,提高命题技术 v要尽量控制评分误差,防止简单粗糙要尽量控制评分误差,防止简单粗糙v要做一些定量分析研究要做一些定量分析研究二、常模参照测验与准则参照测验二、常模参照测验与准则参照测验 常模参照测验和准则参照测验常模参照测验和准则参照测验v它们不是指测量何种心理或行为特质的它们不是指测量何种心理或行为特质的v它们是它们是指解释测验结果的方式指解释测验结果的方式,即是测验,即是测验后每个受测者所得的分数以何种参照标准予后每个受测者所得的分数以何种参照标准予以解释,从而作出评定。以解释,从而作出评定。v它们二者之间既有联

40、系也有区别。它们二者之间既有联系也有区别。(一)常模参照测验(一)常模参照测验 v在学校里,凡是以学生团体的平均成绩作为参在学校里,凡是以学生团体的平均成绩作为参照标准,就某名学生测分的多少说明其在学生照标准,就某名学生测分的多少说明其在学生团体中的相对位置(或名次)的测验,属常模团体中的相对位置(或名次)的测验,属常模参照测验。参照测验。v常模参照测验的特点:常模参照测验的特点:学生成绩的高低是相对学生成绩的高低是相对的的。 v它着重于学生个人之间的比较,适于区分学生它着重于学生个人之间的比较,适于区分学生的成绩水准,可供选拔、编班、编组之用。的成绩水准,可供选拔、编班、编组之用。 (二)准

41、则参照测验(二)准则参照测验 v准则参照测验:准则参照测验:当一个测验是以某一明确界当一个测验是以某一明确界定的内容范围为基础编制而成,并且其分数定的内容范围为基础编制而成,并且其分数是参照该内容范围所要求的绝对标准进行解是参照该内容范围所要求的绝对标准进行解释,那么该测验被称为准则参照测验。释,那么该测验被称为准则参照测验。v准则参照测验的目的:准则参照测验的目的:在于了解个体在所规在于了解个体在所规定的测量内容上的绝对水平,从而判定该个定的测量内容上的绝对水平,从而判定该个体是否达到了从事此项行为的最低标准。体是否达到了从事此项行为的最低标准。 (二)准则参照测验(二)准则参照测验 v 准

42、则参照测验的项目分析准则参照测验的项目分析 v 准测参照测验的特点及功能准测参照测验的特点及功能 1 1准则参照测验的项目分析准则参照测验的项目分析v内容范围的确定内容范围的确定v测验项目的内容效度分析测验项目的内容效度分析 v测验项目的难度和区分度分析测验项目的难度和区分度分析 测验的预测测验的预测 难度分析难度分析 区分度分析区分度分析2 2准测参照测验的特点及功能准测参照测验的特点及功能v准则参照测验:准则参照测验:在学校里,凡是参照规定的作在学校里,凡是参照规定的作业标准,核对学生的测验得分,评定其是否达业标准,核对学生的测验得分,评定其是否达到标准以及达标的程度如何的测验,属于准则到

43、标准以及达标的程度如何的测验,属于准则参照测验。参照测验。v特点:特点:学生成绩的高低是绝对的,是个别考虑,学生成绩的高低是绝对的,是个别考虑,不是相对的,不是表示他在同辈集体中的相对不是相对的,不是表示他在同辈集体中的相对位置。位置。v功能:功能:能用来考查学生的基础知识与技能的学能用来考查学生的基础知识与技能的学习情况;有助于提高学生学习的目的性,并能习情况;有助于提高学生学习的目的性,并能使教学效果充分地及时地获得反馈。使教学效果充分地及时地获得反馈。 二、常模参照测验与准则参照测验二、常模参照测验与准则参照测验 常模参照测验与准则参照测验各有其特殊功能。常模参照测验与准则参照测验各有其

44、特殊功能。v 如果教师要比较学生之间的学习差异,以采用如果教师要比较学生之间的学习差异,以采用常模参照测验为宜;常模参照测验为宜;v 如果教师要帮助学生达到某学科事先确定的成如果教师要帮助学生达到某学科事先确定的成绩水平,则以用准则参照测验为好。绩水平,则以用准则参照测验为好。 所以选用哪种测验,所以选用哪种测验,取决于教师进行测验与取决于教师进行测验与评价的目的评价的目的,而不是随心所欲的。,而不是随心所欲的。三、形成性测验与总结性测验三、形成性测验与总结性测验 v形成性测验(形成性测验(formative testsformative tests)v总结性测验(总结性测验(summative test

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论