学业评价的理论与实践课件_第1页
学业评价的理论与实践课件_第2页
学业评价的理论与实践课件_第3页
学业评价的理论与实践课件_第4页
学业评价的理论与实践课件_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学业评价的理论与实践江西财经大学谭光兴教授、博士生导师学业评价的理论与实践江西财经大学几个概念的辨析教育测量:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。教育测量是为了了解学生的发展,尤其是为评定学习成绩而进行的测量活动,这是教育测量最原始的动机。但是,教育测量并不仅仅是评定学生的学习成绩,还要关注学校的教学效果和学生的发展情况,涉及到学生在德、智、体、美、劳及心理素质等方面的内容。几个概念的辨析教育测量:针对学校教育影响下学生各方面的发展,教育评价(educationalevaluation):对学校教育活动和学生学习效果进行测量(定量方法)、描述(定性方法)和作出判断(价值判断)的过程。♫因此,教育评价是建立在教育测量和教育观察基础上的,对学校教育教学活动及其效果进行价值判断的过程。♫这种判断的依据是教育目标及其质量标准。教育评价(educationalevaluation):教育评估(educationalassessment):对学校教育进行测量、观察、描述,有时也作出价值判断的过程。教育评估与教育评价经常混用,但严格来说它们是有区别的,教育评估重点是测量和描述客观事实(重在结果),而教育评价重点是作出价值判断(重在结论)。因此,带有价值判断的教育评估就是教育评价。教育评估(educationalassessment):对教育测量与评价的分类按在教学中运用的时机分,主要有:♫形成性测量与评价,即为及时获得教学信息反馈而采取的一种教育测量与评价方法。教师在教学过程中需要保持对学生学习情况(学习历程、学习特点、学习困难、学习效果等)的了解,以便及时调整自己的教学策略;学生在学习过程中也需要及时了解自己的学习状况,以便修正自己的学习策略。形成性测量与评价就是为此目的而进行的,一般运用在(单元)教学的过程中。教育测量与评价的分类按在教学中运用的时机分,主要有:♫诊断性测量与评价,为了帮助某些学习遇到困难的学生找出发生困难的原因而采取的一种教育测量与评价方法。诊断性测量与评价一般是在形成性测量与评价之后实施,即随时给予个别辅导,在辅导中帮助学生改善学习习惯,克服学习困难,提高学习效率。如果一般的辅导起不到改善学生学习效果的作用,那么就需要诊断性测量与评价来找出其原因。所以,它运用在教学过程中遇到需要诊断问题的时候。♫诊断性测量与评价,为了帮助某些学习遇到困难的学生找出发生♫终结性测量与评价,某一课程教学结束以后,要检验该课程教学达到目标的程度和评定学生该课程的学习成绩,这时就要实施终结性教育测量与评价,通常运用在课程教学结束时。♫按其他方法进行的分类,由于时间关系,不一一加以介绍,有兴趣的老师可以阅读任何一部关于教育测量与评价的著作。♫终结性测量与评价,某一课程教学结束以后,要检验该课程教学学业评价的定义与作用什么是学业评价?♫学业评价是教师或教学管理部门通过各种教育测量与评价手段,对学生的学习能力、学习状况和学习效果作出判断或进行评定的过程。♫学业评价的内容主要是学生的学习方法、学习态度、学习进展,尤其是学习效果,即学习目标的实现情况,学习内容、学习方法的掌握情况以及学习的迁移效果等。学业评价的定义与作用什么是学业评价?♫学业评价的主要目的是,发现教学过程中的问题,以修正教学策略和学习策略;检验教学目标的达成程度;诊断个别学生学习中的困难与问题;评定学生的学习成绩。♫学业评价以教师的评价为主,教学管理部门的评价为辅;学业评价是教师的责任与义务,教师应当自觉地搞好学业评价,教学管理部门有责任做好监督与服务工作。♫学业评价的主要目的是,发现教学过程中的问题,以修正教学策略学业评价对教学起着重要作用,其功能有:♫测量评定的功能。学业评价的直接目的是客观地评定学生的学习成绩,或是为了给学生在校的行为表现一个评价(或等级)。♫事实判断的功能。学业评价过程中需要系统地收集资料,编辑试题,采用各种评价方法,能够客观地判断学生学习的实际状况。学业评价对教学起着重要作用,其功能有:♫价值判断的功能。学业评价的重点是依据教育目标和教学要求,在教育测量和观察的基础上作出价值判断。如果说,事实判断更多的具有写实性,那么,价值判断就更多的具有社会性(或思想倾向性)。♫问题诊断的功能。学业评价为了改善教师的教和学生的学,需要发现教学中的问题,就像医生看病一样。这也是学业评价的重要功能之一。♫价值判断的功能。学业评价的重点是依据教育目标和教学要求,在♫激励学生学习动机的功能。一次有效的测试,可以通过以下几方面直接影响学生的学习:(1)为学生提供短期的学习目标;(2)使学生明确学习内容;(3)使学生了解自己学习中存在的问题;(4)提供有关学习进展的反馈信息。♫激励学生学习动机的功能。一次有效的测试,可以通过以下几方面♫帮助学生记忆和促进迁移的功能。学业评价可以引导学生朝着教学目标努力,克服心理障碍,改善学习状态,自然有助于学生的学习记忆和学习迁移。♫促进学生自我评价的功能。学业评价使学生了解了自己学习中的问题,同时也了解了自己学习中的优点,清楚了自己在同学中的位子,有利于确定自己的努力方向和调整自己的学习策略。♫帮助学生记忆和促进迁移的功能。学业评价可以引导学生朝着教学由于学业评价的功能,我们可以发现学业评价具有以下作用:♫作为教学的指挥棒,引导教师的教与学生的学。♫调动学生的学习积极性,改善学习效果。♫甄别学生的学习能力,评定学生的学习成绩。由于学业评价的功能,我们可以发现学业评价具有以下作用:学业评价的方式与方法测量知识掌握的程度通常用测验的方法,主要用闭卷笔试的方式;测量综合能力的强弱通常用综合测试的方法,主要用问题解决的方式;测量技术能力的高低通常用具体测试的方法,主要用现场操作的方式;测量语言能力强弱通常采用面试的方法,主要用对话的方式。学业评价的方式与方法测量知识掌握的程度通常用测验的方法,主要学业评价常常采用多种方式进行,课程教学的终结性测量与评价通常采用考试,考试不只是闭卷笔试一种方式,应当根据课程的性质和教学要求或教学目标采用适当的方式,有时可以采用多种方式,最后综合评定成绩。通常我们总认为学业评价就是期中或期末考试,而且与集中统一笔试等同起来。其实不然。学业评价常常采用多种方式进行,课程教学的终结性测量与评价通常比如,集中闭卷笔试;集中开卷笔试;单个面试(提问式);小组面试(讨论式);上机考试(知识或技能测试);项目实验(专业基本技能测试);大作业(小论文、小设计、专题综述、综合报告等)。这些都是可以采用的考试形式。考试的关键是制作试卷,根据不同的考试方式,试卷的内容和形式也应有所区别。比如,集中闭卷笔试;集中开卷笔试;单个面试(提问式);小组面上面提到的项目试验和大作业的中具体考试形式就可以看成是不同形式的试卷。试卷的制作要讲究科学性、公平性和简洁性。这些是试卷制作的基本技术要求。上面提到的项目试验和大作业的中具体考试形式就可以看成是不同形学业评价的基本技术要求学业评价的科学性:科学性是指测评结果能准确地反映被测对象的真实情况,达到测评的目的。测评的科学性要求测评方法、测评手段和测评时机都科学合理。主要体现在试卷的信度、效度、难度和区分度上。学业评价的基本技术要求学业评价的科学性:科学性是指测评结果能信度:简单的说就是测验结果的可信程度,就是说考察测验结果的稳定性程度。换句话说,就是多次测验之间的一致性程度。由于测量过程中存在着许多难以控制的因素,每次测量的结果不一定完全相同,存在着随机误差,信度的追求就是为了对随机误差的控制。信度:简单的说就是测验结果的可信程度,就是说考察测验结果的稳但是,教育与心理测量不同于物理测量可以用同一工具反复测量同一个人的同一心理特质,比如,不能在短时间内用同一道数学题去测量同一个人的数学能力。因此,教育测量中常采用以下方法定义信度。

但是,教育与心理测量不同于物理测量可以用同一工具反复测量同一

设X是测量得到的分数,叫做观察分数;T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数,于是

X=T+E

在T与E独立或不相关的条件下,X的方差可以表示成:σX=σт+σE

设X是测量得到的分数,叫做观察分数;T为被试对象在所测特于是信度被定义为:

βхх=σт∕σх

=1-σE∕σх

但是,T一般事前并不知道,因此,上式实际只是一个理论定义,无实际操作价值。为了计算信度,通常采用其它方法。具体计算方法可参考任何一部《教育测量》著作。于是信度被定义为:效度:简单的说就是测量的有效程度,指的是一个测量(考试)实际能够测出其所要测量的特性(目的)的程度。效度一般反映在测量工具的使用是否得当上。比如,我们想要测量一个学生的写作能力,我们应当给这个学生命一个适当的作文题,在规定的时间内让其独立写出一篇作文。而不能给他先阅读一篇短文再让其写出它的中心思想。效度:简单的说就是测量的有效程度,指的是一个测量(考试)实际效度的定义如下:设X是测量得到的分数,叫做观察分数;

T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数。我们把T再分解为目标真分数(V)和非目标真分数(I),于是:

X=V+I+E

效度的定义如下:于是效度被定义为:

λхх=σV∕σх

=1-σI∕σх-σE∕σх

同样,这只是一个理论定义,不具有实际操作意义,真正的效度计算要用其他方法。•

由效度定义可以看出,信度比效度多了一个非目标真分数相关度。可见效度比信度更精细。于是效度被定义为:

一般来说,高效度肯定有高信度,但高信度未必有高效度,而低信度肯定也无高效度。所以,我们的目的是追求高效度,而为此目的必须先追求高信度。影响信度的因素是一些随机因素,所以,为保证高信度必须尽量控制随机因素的干扰。而为了保证高效度,还要排除非目标因素的影响。一般来说,高效度肯定有高信度,但高信度未必有高效影响学业评价的随机因素通常有:Ⅰ命题教师的水平与责任;Ⅱ阅卷教师的水平与责任;Ⅲ考试的方法与纪律;Ⅳ阅卷的方法与纪律;Ⅴ教学管理部门的指导思想。影响学业评价的随机因素通常有:而影响效度的除了随机因素外还有非目标因素。因此,要提高效度,必须先提高信度,然后要提高对教育或教学目标的理解,尽量排除非目标因素进入学业评价行为中。那么,怎样才能提高对教育或教学目标的理解呢?下面提几条原则,其余的自己思考。而影响效度的除了随机因素外还有非目标因素。因此,要提高效度,正确理解党的教育方针和高等教育的教育目的;正确理解本校的教育目标,即人才培养目标;正确理解本专业的教育目标,即专业培养目标;正确理解本课程的教学目标,即了解本课程的教学要求。正确理解党的教育方针和高等教育的教育目的;难度:顾名思义,难度就是被试完成测试的困难程度。一般来说,太难或太容易的试题都不能很好的测试出被试的水平,尤其不能达到选拔和甄别的目的。难度是一个相对概念,是针对不同的被试来说的。因此,难度必须在对被试充分了解的基础上才能恰当地确定。难度可分为题目难度和试卷难度,前者是指某道题的难度,后者是指整个试卷的难度。当然,题目的难度直接影响试卷的难度。难度:顾名思义,难度就是被试完成测试的困难程度。一般来说,太难度可用难度系数来衡量,难度系数的计算有多种方法。Ⅰ以全体被试得分率为难度系数:(1)试卷的难度系数

P=X/y

X为平均实际得分,y为满分。如果得分率低于0.6可认为偏难,如果得分率高于0.9,则可认为偏易。难度可用难度系数来衡量,难度系数的计算有多种方法。

(2)题目的难度系数

P=X/y

此处的X为被试在该道题目上的平均得分,y为该道题目的满分。如果得分率低于0.5,则可视为偏难,高于0.8,则可视为偏易。(2)题目的难度系数

Ⅱ以全体被试失分率为难度系数:计算时只要作如下转换即可

Q=1–PⅢ以两端组被试得分率的均值为难度系数

P=(PH+PL)/2

其中PH、PL分别为高分组和的低组的得分率高分组和低分组分别取最高和最低的27%。Ⅱ以全体被试失分率为难度系数:区分度:即区分被试能力或水平差异的量度。作为学业评价,我们除了要给每位学生的课程学习给出一个分数外,重要的是要分出好学生和差学生来,这样才能有效地调动学生的学习积极性,也有利于社会选拔人才。因此,这个分数应当客观地反映学生的真实水平,不同的水平必须通过不同的分数加以区分。所以,学业评价的区分度同样十分重要。区分度:即区分被试能力或水平差异的量度。作为学业评价,我们除区分度与难度密切相关,太难和太易都不具有很好的区分度。区分度一般通过编制不同难度的试题来实现。所以,将试题分成高难度、中等难度、一般难度和低难度的试题,并按适当比例进行搭配是保证合理区分度的关键。区分度的计算比较复杂,我这里只介绍一种最简单的方法:D=PH-PL

其中PH

、PL分别为高分组和低分组的得分率。区分度与难度密切相关,太难和太易都不具有很好的区分度。区分度判断一个考试是否具有合理的难度和合理的区分度的方法是,将全体被试的得分情况进行统计计算,如果全体被试的得分服从正态分布,均值在75分上下,均方差在12分左右,那么这个考试属于较好的考试,否则,其科学性就要受到质疑。判断一个考试是否具有合理的难度和合理的区分度的方法是,将全体学业评价的公平性:公平性是指在学业评价中任何学生都有同样的机会获得好成绩。保证学业评价的公平性必须做到以下几点:Ⅰ教师不能带有偏见,不能随意给某人加分或给某人减分;Ⅱ教师在命题中应尽量避免试题内容对某些学生有利,而对某些学生不利的情况。学业评价的公平性:公平性是指在学业评价中任何学生都有同样的机

Ⅲ测试的场地、条件、纪律要求应该相同,不能要求不一。

Ⅳ阅卷的时候最好是密封阅卷,避免带有感情色彩。

Ⅴ学业评价应当采用同样的手段,尽量在同一段时间内进行。Ⅲ测试的场地、条件、纪律要求应该相同,不能要求不一。学业评价的简洁性:学业评价的手段应当简便,试卷应当清晰整洁,测试要求和题目分数应当标明。这样可以消除一些不确定性因素的影响,提高测试的信度。要保证学业评价的简洁性,关键是教师要确实负起责任,要对测评内容和手段仔细斟酌。学业评价的简洁性:学业评价的手段应当简便,试卷应当清晰整洁,命题的基本要求我们作为教师最常用的学业评价方法还是考试,而考试最常用的方式是命题考试,无论是平时测验还是期中或期末考试,我们都要制作试卷,一份试卷就是一系列精心编排的试题。所以,制作试卷的主要过程是编制试题的过程,即命题。试题的质量直接影响到学业评价的科学性和公平性。命题的基本要求我们作为教师最常用的学业评价方法还是考试,而考试题可分为:客观性试题和主观性试题。所谓客观性试题,是指评分时具有标准答案和标准分数的试题,无论谁来评分都会得到相同的或基本相同的结果。客观性试题的题型有选择题、是非题、配合题、填空题和简答题。主观性试题就是评分时没有标准答案,评分结果因人而常有较大差别的题,题型有论述题、操作题、作文题、分析题等。试题可分为:客观性试题和主观性试题。各类试题命题时都有一定的要求,下面就其命题原则作一介绍:选择题的命题原则:Ⅰ题干意义完整并能表达一个确定的问题;Ⅱ题干简明;各类试题命题时都有一定的要求,下面就其命题原则作一介绍:Ⅲ题干不要滥用否定结构,要尽可能用正面陈述;Ⅳ诱答项应具有似真性;Ⅴ不能对正确答案有任何暗示;Ⅵ同一份试卷中题与题应当是独立的;Ⅶ选项的文字表述应简洁明了。Ⅲ题干不要滥用否定结构,要尽可能用正面陈述;是非题的命题原则:Ⅰ测试的内容应当有价值,符合教学要求;Ⅱ题目应用于测量理解能力而不能用于测量记忆能力,更不能抄录教科书中的句子。Ⅲ试题是非界限明确,避免模棱两可;Ⅳ一个题目中只能有一个中心问题;Ⅴ题目叙述应清楚,不能使人造成误解;Ⅵ正句和误句的排列要随机化。是非题的命题原则:配合题的命题原则:Ⅰ在同一道题中,各个题干和选项应具有相同或相近的性质,以保证其似真性;Ⅱ选项的数目不能少于题干的数目;Ⅲ题干与选项之间如存在逻辑关系,应按其逻辑顺序编排;(比如,时间或距离的远近、数目的大小、字母的顺序等);配合题的命题原则:Ⅳ要以清晰的指导语指出题干与选项之间的配合关系以及对每个选项可以被选的次数的规定;Ⅴ选项的词语要短,而题干的词语应相对较长;Ⅵ同一道试题不要分散在不同的试卷页上。Ⅳ要以清晰的指导语指出题干与选项之间的配合关系以及对每个选项填空题的命题原则:Ⅰ题意要明确、限定要严格,空白处要填的答案是唯一的;Ⅱ要填的答案应是关键词语,并要与上下文密切相关;Ⅲ同一道题中所留的空白处不要太多(一般不超过两个),以免造成阅读困难;Ⅳ空白不要放在句首;Ⅴ所留空白的空间应当相同,以避免暗示;Ⅵ若答案是数字,应指明单位和数字的精确度。填空题的命题原则:论述题的命题原则:Ⅰ试题是用来测量较高层次的教学目标,比如,理解能力、表达能力、逻辑分析能力等。要求题目表达的主题明确、观点正确、有理论依据;Ⅱ论述的界限清楚,符合考试对象的心理特点和教学要求;Ⅲ答案要有统一的定论,可以分解为答题要点;Ⅳ试题的分量要能在设计的时间内答完。论述题的命题原则:操作题的命题原则:操作题是测量考生操作性技能的试题,一般的计算题、制作题就属于这一类。操作题要求:Ⅰ试题要符合操作程序,关键步骤不能省略;Ⅱ要明确需要测试的关键环节,必要时要加以说明;Ⅲ要给出每一步的评分标准。操作题的命题原则:作文题的命题原则:Ⅰ文体要依目的而定;Ⅱ题目要反映现实生活,有实际意义;Ⅲ选题要符合被试的实际情况,在确定选材和写作意图时要注意公平性;Ⅳ要注意题目大小与测试时间的匹配;Ⅴ要给出合理的评分标准。作文题的命题原则:分析题的命题原则:Ⅰ分析的对象要符合教学大纲的要求和被试的心理特质;Ⅱ必须给出被分析对象的详细情况,指明要分析的内容;Ⅳ分析的材料具有客观的标准且对每个被试是公平的;Ⅴ要给出每一步的评分标准。分析题的命题原则:祝大家工作顺利,事业有成!祝大家工作顺利,事业有成!学业评价的理论与实践江西财经大学谭光兴教授、博士生导师学业评价的理论与实践江西财经大学几个概念的辨析教育测量:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。教育测量是为了了解学生的发展,尤其是为评定学习成绩而进行的测量活动,这是教育测量最原始的动机。但是,教育测量并不仅仅是评定学生的学习成绩,还要关注学校的教学效果和学生的发展情况,涉及到学生在德、智、体、美、劳及心理素质等方面的内容。几个概念的辨析教育测量:针对学校教育影响下学生各方面的发展,教育评价(educationalevaluation):对学校教育活动和学生学习效果进行测量(定量方法)、描述(定性方法)和作出判断(价值判断)的过程。♫因此,教育评价是建立在教育测量和教育观察基础上的,对学校教育教学活动及其效果进行价值判断的过程。♫这种判断的依据是教育目标及其质量标准。教育评价(educationalevaluation):教育评估(educationalassessment):对学校教育进行测量、观察、描述,有时也作出价值判断的过程。教育评估与教育评价经常混用,但严格来说它们是有区别的,教育评估重点是测量和描述客观事实(重在结果),而教育评价重点是作出价值判断(重在结论)。因此,带有价值判断的教育评估就是教育评价。教育评估(educationalassessment):对教育测量与评价的分类按在教学中运用的时机分,主要有:♫形成性测量与评价,即为及时获得教学信息反馈而采取的一种教育测量与评价方法。教师在教学过程中需要保持对学生学习情况(学习历程、学习特点、学习困难、学习效果等)的了解,以便及时调整自己的教学策略;学生在学习过程中也需要及时了解自己的学习状况,以便修正自己的学习策略。形成性测量与评价就是为此目的而进行的,一般运用在(单元)教学的过程中。教育测量与评价的分类按在教学中运用的时机分,主要有:♫诊断性测量与评价,为了帮助某些学习遇到困难的学生找出发生困难的原因而采取的一种教育测量与评价方法。诊断性测量与评价一般是在形成性测量与评价之后实施,即随时给予个别辅导,在辅导中帮助学生改善学习习惯,克服学习困难,提高学习效率。如果一般的辅导起不到改善学生学习效果的作用,那么就需要诊断性测量与评价来找出其原因。所以,它运用在教学过程中遇到需要诊断问题的时候。♫诊断性测量与评价,为了帮助某些学习遇到困难的学生找出发生♫终结性测量与评价,某一课程教学结束以后,要检验该课程教学达到目标的程度和评定学生该课程的学习成绩,这时就要实施终结性教育测量与评价,通常运用在课程教学结束时。♫按其他方法进行的分类,由于时间关系,不一一加以介绍,有兴趣的老师可以阅读任何一部关于教育测量与评价的著作。♫终结性测量与评价,某一课程教学结束以后,要检验该课程教学学业评价的定义与作用什么是学业评价?♫学业评价是教师或教学管理部门通过各种教育测量与评价手段,对学生的学习能力、学习状况和学习效果作出判断或进行评定的过程。♫学业评价的内容主要是学生的学习方法、学习态度、学习进展,尤其是学习效果,即学习目标的实现情况,学习内容、学习方法的掌握情况以及学习的迁移效果等。学业评价的定义与作用什么是学业评价?♫学业评价的主要目的是,发现教学过程中的问题,以修正教学策略和学习策略;检验教学目标的达成程度;诊断个别学生学习中的困难与问题;评定学生的学习成绩。♫学业评价以教师的评价为主,教学管理部门的评价为辅;学业评价是教师的责任与义务,教师应当自觉地搞好学业评价,教学管理部门有责任做好监督与服务工作。♫学业评价的主要目的是,发现教学过程中的问题,以修正教学策略学业评价对教学起着重要作用,其功能有:♫测量评定的功能。学业评价的直接目的是客观地评定学生的学习成绩,或是为了给学生在校的行为表现一个评价(或等级)。♫事实判断的功能。学业评价过程中需要系统地收集资料,编辑试题,采用各种评价方法,能够客观地判断学生学习的实际状况。学业评价对教学起着重要作用,其功能有:♫价值判断的功能。学业评价的重点是依据教育目标和教学要求,在教育测量和观察的基础上作出价值判断。如果说,事实判断更多的具有写实性,那么,价值判断就更多的具有社会性(或思想倾向性)。♫问题诊断的功能。学业评价为了改善教师的教和学生的学,需要发现教学中的问题,就像医生看病一样。这也是学业评价的重要功能之一。♫价值判断的功能。学业评价的重点是依据教育目标和教学要求,在♫激励学生学习动机的功能。一次有效的测试,可以通过以下几方面直接影响学生的学习:(1)为学生提供短期的学习目标;(2)使学生明确学习内容;(3)使学生了解自己学习中存在的问题;(4)提供有关学习进展的反馈信息。♫激励学生学习动机的功能。一次有效的测试,可以通过以下几方面♫帮助学生记忆和促进迁移的功能。学业评价可以引导学生朝着教学目标努力,克服心理障碍,改善学习状态,自然有助于学生的学习记忆和学习迁移。♫促进学生自我评价的功能。学业评价使学生了解了自己学习中的问题,同时也了解了自己学习中的优点,清楚了自己在同学中的位子,有利于确定自己的努力方向和调整自己的学习策略。♫帮助学生记忆和促进迁移的功能。学业评价可以引导学生朝着教学由于学业评价的功能,我们可以发现学业评价具有以下作用:♫作为教学的指挥棒,引导教师的教与学生的学。♫调动学生的学习积极性,改善学习效果。♫甄别学生的学习能力,评定学生的学习成绩。由于学业评价的功能,我们可以发现学业评价具有以下作用:学业评价的方式与方法测量知识掌握的程度通常用测验的方法,主要用闭卷笔试的方式;测量综合能力的强弱通常用综合测试的方法,主要用问题解决的方式;测量技术能力的高低通常用具体测试的方法,主要用现场操作的方式;测量语言能力强弱通常采用面试的方法,主要用对话的方式。学业评价的方式与方法测量知识掌握的程度通常用测验的方法,主要学业评价常常采用多种方式进行,课程教学的终结性测量与评价通常采用考试,考试不只是闭卷笔试一种方式,应当根据课程的性质和教学要求或教学目标采用适当的方式,有时可以采用多种方式,最后综合评定成绩。通常我们总认为学业评价就是期中或期末考试,而且与集中统一笔试等同起来。其实不然。学业评价常常采用多种方式进行,课程教学的终结性测量与评价通常比如,集中闭卷笔试;集中开卷笔试;单个面试(提问式);小组面试(讨论式);上机考试(知识或技能测试);项目实验(专业基本技能测试);大作业(小论文、小设计、专题综述、综合报告等)。这些都是可以采用的考试形式。考试的关键是制作试卷,根据不同的考试方式,试卷的内容和形式也应有所区别。比如,集中闭卷笔试;集中开卷笔试;单个面试(提问式);小组面上面提到的项目试验和大作业的中具体考试形式就可以看成是不同形式的试卷。试卷的制作要讲究科学性、公平性和简洁性。这些是试卷制作的基本技术要求。上面提到的项目试验和大作业的中具体考试形式就可以看成是不同形学业评价的基本技术要求学业评价的科学性:科学性是指测评结果能准确地反映被测对象的真实情况,达到测评的目的。测评的科学性要求测评方法、测评手段和测评时机都科学合理。主要体现在试卷的信度、效度、难度和区分度上。学业评价的基本技术要求学业评价的科学性:科学性是指测评结果能信度:简单的说就是测验结果的可信程度,就是说考察测验结果的稳定性程度。换句话说,就是多次测验之间的一致性程度。由于测量过程中存在着许多难以控制的因素,每次测量的结果不一定完全相同,存在着随机误差,信度的追求就是为了对随机误差的控制。信度:简单的说就是测验结果的可信程度,就是说考察测验结果的稳但是,教育与心理测量不同于物理测量可以用同一工具反复测量同一个人的同一心理特质,比如,不能在短时间内用同一道数学题去测量同一个人的数学能力。因此,教育测量中常采用以下方法定义信度。

但是,教育与心理测量不同于物理测量可以用同一工具反复测量同一

设X是测量得到的分数,叫做观察分数;T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数,于是

X=T+E

在T与E独立或不相关的条件下,X的方差可以表示成:σX=σт+σE

设X是测量得到的分数,叫做观察分数;T为被试对象在所测特于是信度被定义为:

βхх=σт∕σх

=1-σE∕σх

但是,T一般事前并不知道,因此,上式实际只是一个理论定义,无实际操作价值。为了计算信度,通常采用其它方法。具体计算方法可参考任何一部《教育测量》著作。于是信度被定义为:效度:简单的说就是测量的有效程度,指的是一个测量(考试)实际能够测出其所要测量的特性(目的)的程度。效度一般反映在测量工具的使用是否得当上。比如,我们想要测量一个学生的写作能力,我们应当给这个学生命一个适当的作文题,在规定的时间内让其独立写出一篇作文。而不能给他先阅读一篇短文再让其写出它的中心思想。效度:简单的说就是测量的有效程度,指的是一个测量(考试)实际效度的定义如下:设X是测量得到的分数,叫做观察分数;

T为被试对象在所测特质上客观具有的水平,叫做真分数;E是观察分数与真分数之间的差,叫做误差分数。我们把T再分解为目标真分数(V)和非目标真分数(I),于是:

X=V+I+E

效度的定义如下:于是效度被定义为:

λхх=σV∕σх

=1-σI∕σх-σE∕σх

同样,这只是一个理论定义,不具有实际操作意义,真正的效度计算要用其他方法。•

由效度定义可以看出,信度比效度多了一个非目标真分数相关度。可见效度比信度更精细。于是效度被定义为:

一般来说,高效度肯定有高信度,但高信度未必有高效度,而低信度肯定也无高效度。所以,我们的目的是追求高效度,而为此目的必须先追求高信度。影响信度的因素是一些随机因素,所以,为保证高信度必须尽量控制随机因素的干扰。而为了保证高效度,还要排除非目标因素的影响。一般来说,高效度肯定有高信度,但高信度未必有高效影响学业评价的随机因素通常有:Ⅰ命题教师的水平与责任;Ⅱ阅卷教师的水平与责任;Ⅲ考试的方法与纪律;Ⅳ阅卷的方法与纪律;Ⅴ教学管理部门的指导思想。影响学业评价的随机因素通常有:而影响效度的除了随机因素外还有非目标因素。因此,要提高效度,必须先提高信度,然后要提高对教育或教学目标的理解,尽量排除非目标因素进入学业评价行为中。那么,怎样才能提高对教育或教学目标的理解呢?下面提几条原则,其余的自己思考。而影响效度的除了随机因素外还有非目标因素。因此,要提高效度,正确理解党的教育方针和高等教育的教育目的;正确理解本校的教育目标,即人才培养目标;正确理解本专业的教育目标,即专业培养目标;正确理解本课程的教学目标,即了解本课程的教学要求。正确理解党的教育方针和高等教育的教育目的;难度:顾名思义,难度就是被试完成测试的困难程度。一般来说,太难或太容易的试题都不能很好的测试出被试的水平,尤其不能达到选拔和甄别的目的。难度是一个相对概念,是针对不同的被试来说的。因此,难度必须在对被试充分了解的基础上才能恰当地确定。难度可分为题目难度和试卷难度,前者是指某道题的难度,后者是指整个试卷的难度。当然,题目的难度直接影响试卷的难度。难度:顾名思义,难度就是被试完成测试的困难程度。一般来说,太难度可用难度系数来衡量,难度系数的计算有多种方法。Ⅰ以全体被试得分率为难度系数:(1)试卷的难度系数

P=X/y

X为平均实际得分,y为满分。如果得分率低于0.6可认为偏难,如果得分率高于0.9,则可认为偏易。难度可用难度系数来衡量,难度系数的计算有多种方法。

(2)题目的难度系数

P=X/y

此处的X为被试在该道题目上的平均得分,y为该道题目的满分。如果得分率低于0.5,则可视为偏难,高于0.8,则可视为偏易。(2)题目的难度系数

Ⅱ以全体被试失分率为难度系数:计算时只要作如下转换即可

Q=1–PⅢ以两端组被试得分率的均值为难度系数

P=(PH+PL)/2

其中PH、PL分别为高分组和的低组的得分率高分组和低分组分别取最高和最低的27%。Ⅱ以全体被试失分率为难度系数:区分度:即区分被试能力或水平差异的量度。作为学业评价,我们除了要给每位学生的课程学习给出一个分数外,重要的是要分出好学生和差学生来,这样才能有效地调动学生的学习积极性,也有利于社会选拔人才。因此,这个分数应当客观地反映学生的真实水平,不同的水平必须通过不同的分数加以区分。所以,学业评价的区分度同样十分重要。区分度:即区分被试能力或水平差异的量度。作为学业评价,我们除区分度与难度密切相关,太难和太易都不具有很好的区分度。区分度一般通过编制不同难度的试题来实现。所以,将试题分成高难度、中等难度、一般难度和低难度的试题,并按适当比例进行搭配是保证合理区分度的关键。区分度的计算比较复杂,我这里只介绍一种最简单的方法:D=PH-PL

其中PH

、PL分别为高分组和低分组的得分率。区分度与难度密切相关,太难和太易都不具有很好的区分度。区分度判断一个考试是否具有合理的难度和合理的区分度的方法是,将全体被试的得分情况进行统计计算,如果全体被试的得分服从正态分布,均值在75分上下,均方差在12分左右,那么这个考试属于较好的考试,否则,其科学性就要受到质疑。判断一个考试是否具有合理的难度和合理的区分度的方法是,将全体学业评价的公平性:公平性是指在学业评价中任何学生都有同样的机会获得好成绩。保证学业评价的公平性必须做到以下几点:Ⅰ教师不能带有偏见,不能随意给某人加分或给某人减分;Ⅱ教师在命题中应尽量避免试题内容对某些学生有利,而对某些学生不利的情况。学业评价的公平性:公平性是指在学业评价中任何学生都有同样的机

Ⅲ测试的场地、条件、纪律要求应该相同,不能要求不一。

Ⅳ阅卷的时候最好是密封阅卷,避免带有感情色彩。

Ⅴ学业评价应当采用同样的手段,尽量在同一段时间内进行。Ⅲ测试的场地、条件、纪律要求应该相同,不能要求不一。学业评价的简洁性:学业评价的手段应当简便,试卷应当清晰整洁,测试要求和题目分数应当标明。这样可以消除一些不确定性因素的影响,提高测试的信度。要保证学业评价的简洁性,关键是教师要确实负起责任,要对测评内容和手段仔细斟酌。学业评价的简洁性:学业评价的手段应当简便,试卷应当清晰整洁,命题的基本要求我们作为教师最常用的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论