第十三章 教学成效的测量与评价_第1页
第十三章 教学成效的测量与评价_第2页
第十三章 教学成效的测量与评价_第3页
第十三章 教学成效的测量与评价_第4页
第十三章 教学成效的测量与评价_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三章教学成效的测量与评价本章寄语教学中的测量与评价是教学过程中的重要环节,也是教师教学工作效果与效率的反馈。教育的目的在于促进学生行为或行为潜能的变化,因此,教师要善于运用测量的手段来评价教学目标的完成情况,以进一步修订教学内容,改进教学方法,提高学习效果。本章内容第一节教学测量与评价概述第二节有效教学测验的基本要求第三节教学测验的类型及应用第一节教学测量与评价概述教学测量与评价的含义教学测量与评价的功能一、教学测量与评价的含义(一)教学测量与教学测验教学测量(instructionalmeasurement)是考核教学成效的一种方法。它借助一定的心理量表及其操作,对学生的学习成绩(简称学绩)进行探察,并以一定的数量表示。教学测验(instructionaltest)又称学绩测验,即用以测量学绩的量表及操作。学绩测验是教学测量的工具和手段,而教学测量是对学绩测验所得结果的客观描述。

使用教学测量时,应注意以下几个方面:(1)教学测量的目的在于考核教学目标的完成情况。因此,教学测量的目标应与教学目标一致,而不能偏离教学目标。(2)教学测量的对象是学生内在能力与品德等形成状况,不能直接进行测量,只能借助一定的心理量表及其操作间接测量。因此,测量量表的科学性是有效教学测量的前提。(3)教学成效是以学生成绩为直接考察依据的,而学绩是以一定数量来表示的。因此,命题的合理性与评分的客观性是有效教学测量的重要影响因素。(二)教学评价教学评价(instrcutionalevaluation)是依据教学目标,对学绩测验所得测量结果进行分析及解释。它包含两个方面的内容:(1)教学评价必须对学绩测验数据所表明的教学成效做出确切的诊断。(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作提出明确的改进建议。(三)教学测量与评价的关系教学测量与评价是既密切联系,又有明显区别的两个概念。一方面,教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),而不考虑结果的实际意义。教学评价则是对学绩测验所得结果的主观判断(对结果进行分析解释),以了解结果的实际意义。另一方面,教学评价是一种主观判断,但这种主观判断必须以教学测量所得客观描述为依据。教学测量则只有通过教学评价,才能判断这种客观描述的实际意义。不通过评价,测量所获得的结果就没有实际意义。二、教学测量与评价的功能

1.反馈——调节功能

2.激励——动机功能第二节有效教学测验的基本要求测验的效度测验的信度项目的难度与区分度一、测验的效度(一)效度的涵义测验的效度指的是测量的正确性和有效性。它是测验的最重要质量指标。在编制教学测验时应首先考虑其效度要求。效度不是绝对的,而是相对的。任何测验只对一定目的而言有效,对其它目的和用途却不一定有效。另外,由于测验是根据行为样本对所要测量的目标做间接推断,因此,效度只能达到某种程度,不可能全有或全无。(二)效度的类型根据效度侧重的问题不同,可以将其分为三类:内容效度(contentvalidity)构想效度(constructvalidity)实证效度(empiricalvalidity)内容效度内容效度(contentvalidity)是指测验题目对有关内容或行为范围取样的适当性,也就是测验所选的项目是否符合所要测量的东西,其代表性是否适当。要编制具有较高内容效度的测验,必须注意两点:(1)要有一个定义完好的内容范围,即对测量目标应有一个明确的界定。(2)测题对所界定的内容范围应是代表性取样,即要根据教学内容和教学要求的重要性来选择题目,使各方面题目比例适当。构想效度构想效度(constructvalidity)是指测验对某种理论的符合程度,其目的在于用心理学的理论观点对测验结果加以解释及探讨。检验构想效度方法中比较简单和常用的方法有:(1)利用测验的内容效度(2)利用相容效度(3)利用预测效度实证效度实证效度(empiricalvalidity),又称效标关联效度(criterion-relatedvalidity),是指测验对处于特定情境中的个体行为进行预测的有效程度。根据效标资料搜集的时间,实证效度可分为同时效度和预测效度。同时效度与用来诊断现状的测验有关;预测效度与预测将来结果的测验有关。同时效度和预测效度都是考虑测验分数与效标之间的经验关系,所以统称实证效度或效标关联效度。检验测验的实证效度,主要难点在于选取合适的效标。实证效度一般可以通过考察分数与效标的关系来确定。常用的方法是计算两者之间的相关系数。

三种效度之间存在的差异。但实际上,它们之间存在一定的内在联系:内容效度和构想效度是实证效度的保证,又要得到实证效度的支持;考察内容效度和实证效度可以帮助确定构想效度;用于测量某种构想的测验可以作为实证效度的预测源来使用。总之,内容效度、构想效度和实证效度既相互区别,又相互联系。根据不同需要,一个测验可以采用不同的效度。对教学测验而言,主要考虑取样的适当性,也就是内容效度。二、测验的信度(一)信度与信度系数测验的信度又叫测验的可靠性,指的是测量的一致性程度。信度指标通常以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,称为信度系数。

估计信度系数的方法很多,主要的方法有以下几种:

1.再测法

2.复本法

3.分半法

4.同质法

再测法这种方法是用同一被试对同一种测验前后两次施测的测验得分的相关系数表示信度。它反映测验分数的稳定程度,其相关系数又称稳定性系数。复本法这种方法是用同一组被试对两个等值(复本)测验得分的相关系数表示信度。它反映两个复本测验的等值程度,其相关系数又称等值性系数。分半法这种方法是用同一组被试对同一测验对等的两半的测验得分的相关系数表示信度。它是复本法的特例,还可用来估计测验内部的一致性。这种相关系数又称内部一致性系数。同质法这种方法是用测验内部(测量同一特质或属性)不同分测验(异质而有关联的测验题目)之间的相关系数表示信度,估计的是测验题目的同质性或普遍性,其相关系数也称普遍性系数。对于教学测验而言,由于两次测验之间的学习和遗忘不同,所以用稳定性系数来估计其信度不适当。除了成套测验的分测验外,一般学绩测验所测量的均不只一种能力,因此,用同质法来估计信度也不适当。估计学绩测验的信度最常用的是复本法,如果没有复本,也可用分半法。(二)信度的影响因素1.测验长度要提高信度,一般来说,增加长度是一个有效的方法。但必须注意,只有当新增加的题目与原题具有同质性,增长测验才能改进信度。虽然增长测验可以提高信度,但是测验长度须有一定限制,并非越长越好。当长度达到一定限度时,增长测验往往得不偿失,有时会引起学生的疲劳和反感,降低可靠性。

2.测验难度测验难度过大或过小,分数范围都会缩小,信度也会降低。当测题难度过大,超出被试能力水平时,被试对许多项目做随机反应,即瞎猜,则所有被试的总分接近随机分布,因此其信度极低。反之,测题难度太小,几乎所有被试均能正确回答,则分数分布很集中,因此信度也很低。这表明,要使信度达到最高,能产生最广分数分布的难度水平方为合格。3.施测对象施测对象(被试)动机和焦虑的变化,也会影响测验信度,这是测试中最难控制的因素。一般说来,恰当的动机、适度的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而对测验成绩产生积极影响。动机过强,焦虑过高会使工作能力降低,注意力分散,思维变得狭窄而刻板,从而对测验成绩产生消极影响;反之,动机过弱、焦虑过低的被试往往采取满不在乎的态度,从而测验成绩大多较低。4.施测过程测验的环境条件,如通风、室温、采光等条件也会影响到测验的稳定性。室内燥热、考场周围嘈杂、座位拥挤、考场秩序混乱等都会导致测验信度下降。主试错误理解指导语,不按规定严格施测,以及故意制造紧张气氛等也会影响测验的信度。虽然信度和效度都是鉴定测验质量的指标,但两者并不是完全一致的。一般而言,效度高的测验,其信度也一定高;信度高的测验,其效度却不一定高。也就是说,高信度是高效度的必要但非充分条件。三、项目的难度与区分度信度和效度是就整个测验而言的,难度和区分度则是就测验题目(简称项目)而言的。每个测验都包含有许多项目,每个项目都有它的难度和区分度。(一)项目难度项目难度指测验题目的难易程度,通常以答对或通过该项目的人数占应试总人数的百分比来表示。也就是用通过率来表示难度,通过率越高,难度越小。但对于不同测验的题型,计算方法不同。对于是非题,当只有正确或错误两种答案时,可以用通过该题人数的百分比代表难度:P=R/N,其中,P为难度;N为受测总人数;R为通过该题目的人数。对于选择题,如在K个选项中(K>2)只有一个正确答案,则其难度可以在该项目的通过率P的基础上进行矫正,计算公式为CP=(KP-1)/(K-1),其中,CP为矫正后的难度;P为未矫正的难度;K为选项的数量。对于论文型题目,可以用某题的平均分数为依据计算难度:P=M/W,其中,M:全体考生某题的平均得分;W:某题规定的最高得分

项目的难易程度取决于测验目的。为了考查学生对某方面的知识、技能是否掌握(掌握性测验),可以不考虑项目难度。测验要是用于选拔(选拔性测验),应采用难度值接近录取率的项目,0.50左右的难度最合适。对项目的难度特征进行分析,应考虑测验的目的,一般以0.30~0.70为宜。

(二)项目区分度项目区分度,又叫鉴别度,是考核被试作答反应的鉴别程度,反映试题对不同水平被试学生进行区分的特征,是区分学习者对试题回答程度的数量指标。对于不同的测验题型,其计算也有所区别。对于客观性题目,项目区分度的简便计算公式是:D=PH-PL,其中,D为区分度;PH为高分组通过该题的人数占高分组总人数百分比;PL为低分组通过该题的人数占低分组总人数百分比。对于论文性题目,项目区分度可以这样计算:D=(MH-ML)/N(H-L),其中,D为区分度;MH为高分组(总分最高的27%的学生)全体考生该题得分之和;ML为低分组(总分最低的27%的学生)全体考生该题得分之和;N为所有考生总人数的27%;H为该题最高得分;L为该题最低得分。

项目区分度多高合适也和测验目的密切相关。就学绩测验而言,一般要求项目与总分的相关达到0.20以上,高分组与低分组通过率之差达到0.15~0.20以上。一般认为D>0.40,该题非常优良;D<0.19,该题必被淘汰。但是这一标准也并非绝对。一个测验用于选拔,其区分度应该高一些;如果一个测验只是用于考察学生的掌握情况,可不考虑区分度,即使区分度为0,只要该项内容是重要的,今后仍可继续使用。。第三节教学测验类型及其应用教学测验的类型学绩测验的命题测验的评分及结果分析一、教学测验的类型根据测验的目的划分根据教学过程不同阶段选用的测验划分根据教学测验来源划分(一)根据测验目的划分

在学校教学过程中,教学测验可以用来测量和评价学生在一定群体中的等级,如常模参照测验;也可以用来测量和评价学生是否有效地完成了教学目标,如标准参照测验(表1)。表1常模参照测验与标准参照测验比较表1.常模参照测验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论