版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章学业成就(chngji)的替代性评价传统意义上的血液成就评价一般是指标准化测验评价。事实上,在学业成就的课堂教学评价中,除了标准化测验评价外,还经常用到替代性测验评价,简称替代性评价。替代性评价是标准化测验评价发展到一定阶段后,针对标准化测验评价的不足而兴起(xngq)的,主要有表现性评价、成长记录袋评价等,其中表现性评价在实际中运用得非常广泛第一节概述(i sh)一、什么是替代性评价(一)替代性评价产生的背景替代性评价最初是针对传统纸笔标准化测验评价方式的不足而提出的。传统的评价方式发展到标准化的阶段,从试题类型到测验操作都已经非常成熟,在教育领域内被广泛应用,为教育事业的发展做出了卓
2、越的贡献。但同时,人们也发现了传统测验和评价的许多不足:(1)传统的教育评价主要通过标准化的考试、写论文等方式进行,内容基本局限在课本内部,从中反映出的学生的知识和技能比较单一,对学生综合应用知识的能力、解决问题的能力、课外作业能力及批判性思维能力等则难以测量;(2)传统评价重视对掌握知识和技能的结果的测量,却无法很好地测量和评价学生掌握知识的过程;(3)传统测验基本上是教条式的统一答案,在很大程度上限制了学生能力的发挥,不利于培养学生的创造性;(4)传统的测验工具本身也存在一定的缺陷,即使是在对学生掌握的知识、技能的评价中也存在一些有待改进的地方,如做选择题,学生就可以猜测;(5)传统测验基
3、本上只针对学生个体的知识和能力,不利于培养学生的合作能力,甚至容易造成学生间的敌对情绪等。正是由于以上不足,人们认识到传统的标准化测验并不能对学生的学业成就进行全面、系统的评价,而替代性评价就是在这种背景下诞生的。(二)替代性评价的含义针对传统标准化测验评价而提出的教育评价改革中出现了多个新的评价方式的名称,如“操作性评价”“真实性评价”“表现性评价”和“替代性评价”等。对于这些评价方式概念的内涵虽有不同的看法,但大家普遍认为它们是构成新的评价体系的基础。本书采用“替代性评价”这一名称,意指任何不同于传统的标准化纸笔测验的评价方法与技术。运用到课堂教学,则指所有非传统标准化纸笔测验的学生学业评
4、价方法。关于替代性评价的含义,至今没有定论。本书综合有关替代性评价的研究,将其概括为以下几点:(1)替代性评价不是以单一的书面标准化试题为基础的,而是基于学生的行为表现(或操作),如表演、展示、口头演说、让学生完成作品或任务等,通过观察、记录等方式对学生进行的评价;(2)替代性评价不是从单一的考试背景,而是从广泛的背景(从教室到家庭到社会生活)中收集信息;(3)收集到的信息不是单一的对标准化试题的反应信息,而是在多种智力活动如言语、数理逻辑、视觉空间、身体动作、音乐等方面显现出来的各方面的表现信息;(4)替代性评价不仅仅注重学生学习结果的评价,更关注学生学习过程的评价;(5)替代性评价的目的不
5、是单纯地给学生一个评价分数或等级,而主要是为了促进学生的学习和发展。根据以上对替代性评价的内涵总结,本书将替代性评价定义如下:基于学生在形式和内容(nirng)上都区别于传统标准化测验的测验任务上的表现,以促进学生发展和提高为目的的评价,都可以叫作替代性评价。本书中给了替代性评价一个非常宽泛的界定,因此只要是符合定义的,都应该算是替代性评价。有关本章内容(nirng),这里先作几点说明。(1)替代性评价不是传统(chuntng)评价方式的替代品,两种类型的评价方式各有其优缺点。(2)替代性评价的种类,目前仍没有统一的划分。就学业成就的评价来说,本书主要介绍表现性评价和成长记录袋评价,概念图评价
6、虽属于表现性评价思想的具体运用,但因其特殊性,本书将单独予以介绍。(3)本书不是将课堂教学方面的替代性评价全部囊括,而是重点介绍目前已经得到认可并被广泛应用的替代性评价方法和思路。(4)本章最后一节还特别介绍了几种评价工具,以供参考。二、替代性评价的特点(一)它是发展性评价发展性教学评价思想是20世纪80年代以来发展起来的一种关于教学评价的理念。它是针对以分等奖惩为目的的终结性评价的弊端而提出的,主张面向未来、以促进学生全面发展为主要宗旨的教学评价。其理论基础是人的全面发展、多元智力理论和建构论。发展性教学评价着力于人内在动力的激发,重视评价对象的自我完善,强调个体间的差异,主张用定性评价去统
7、整和取代定量评价,致力于促进人的完美和自我完善。替代性评价在上述思想上和发展性评价是一致的,因此说替代性评价本质上也是发展性评价,后面本书将详细介绍有关情况,这里不再赘述。(二)它是主体性评价替代性评价(pngji)强调自我教育,主张被评价者主动参与,使“评价(pngji)”这一外因通过被评价者的自我监控这一内因起作用,以达到(d do)个体完善和发展的目的。在这一点上,与主体性评价倡导的“主体自我评估”基本一致。“主体自我评估”是针对传统教育评价中的“他评”而言的,它强调尊重多元价值标准,提倡被评价者主动参与,主张自我监控,其核心为自我教育、自我发展。而这些方面也正是替代性评价所强调的,因此
8、,本书认为“主体性评价”是替代性评价的另一特点。(三)它具有真实性“真实性评价”的原意是学生在完成现实生活中的真实或模拟的任务时会有真实的、原创性的表现,通过对学生的这些“真实表现”进行评价,学生会逐渐取得真实的进步。课堂教学评价中的替代性评价不可能完全设置一种真实的环境来评价学生,但评价者一般会力图模拟生活中的任务,在学生完成这些任务时,学生的表现一般是真实或基本是真实的、原创性的表现。虽然从广义上说,任何不同于传统标准化纸笔测验的评价方法都是替代性评价,但采用现实任务、模拟真实情境来对学生进行评价却是其发展的重要方向,因此,从这个角度上说,替代性评价是具有真实性的。(四)它是过程性评价替代
9、性评价区别于传统评价的一个重要特点就是不仅仅关心结果,还关注整个评价过程,而且评价的重点之一就是过程。传统评价强调根据测量结果给学生下一个结论,而替代性评价则强调学习过程本身的价值,通过评价学生完成整个任务的过程,促进学生解决问题的思维技能、个性品质等的发展和完善。这与“过程性评价”关注的不仅要对学生有“终极”的关怀、又要有“现实”的关怀完全一致,所以本书认为替代性评价也是过程性评价。三、运用替代性评价的意义(一)提高课堂教学的质量从前面的介绍中我们可以看出,与传统评价方法不同,替代性评价方法尊重学生的主体性,强调从评价的过程中学习,调动了作为学习主体的学生的积极性,在对学生评价的同时,也可以
10、对教师进行评价,整个评价同时关注了教师和学生两个方面。师生两方面积极性的调动,无疑会提高课堂教学的质量。(二)引起对教学效果看法的改变 传统教学评价多是对学生作一个笼统的终结性结论,替代性评价则采取多元取向,在承认(chngrn)学生差异的前提下,提供条件,允许学生发挥各自所长,评价最后反馈给学生的不仅仅是一个数字,还包括学生进步与否、在哪一方面进步、如何进步等具体分析。更重要的是,替代性评价注重对整个学习的过程进行评价,这不仅将使人们对学生的学习有一个全面、系统的了解,而且能够改变人们对教学效果这个单一指标的依赖。(三)促进(cjn)对教育评价的研究 替代性评价方法的产生是教育评价领域内的一
11、次改革,从评价的思想(sxing)到具体的形式都与传统评价大相径庭。替代性评价自诞生以来,一直受到人们的欢迎和关注,不仅促进了对课堂教学评价的研究,也促进了对整个教育领域内的评价研究。直到现在,对替代性评价有关问题的研究仍然方兴未艾,这次教育评价领域内的改革所产生的影响将继续下去,并将进一步引起人们对评价的关注及兴趣。(四)促进相应教育教学理论的研究替代性评价产生的理论基础是一些新兴的教育教学理论,如人的全面发展理论、多元智力理论及学习的建构论等。替代性评价的发展,也引起了人们对相应的教育教学理论的反思和研究。随着替代性评价的继续发展,对相应的教育教学理论的研究也会进一步深入和完善。小结替代性
12、评价是针对传统标准化测验评价的不足而提出的,凡在形式、内容或目的上区别于传统标准化测验的评价都可以叫做替代性评价。替代性评价具有强调学生发展、着眼学生主体性、注重评价过程、重视评价任务的真实性等特点,能够引起一系列有关课堂教学观念、理论的变化,是一种方兴未艾的重要的课堂教学评价思想或方式。第二节 表现性评价一、什么是表现性评价(一)表现性评价的含义目前,对课堂教学的表现性评价看法不一。有人认为,通过学生自己给出的问题答案(d n)和展示的作品来判断学生所获得的知识和技能的评价是表现性评价;(李永珺等:新课程评价中的表现性评定, 载教育(jioy)发展研究,2002(12)。)也有人(yu rn
13、)认为,表现性评价是指通过观察学生在完成实际任务时的表现来评价学生已取得的发展成就的评价。(李金亏:语文学习评价研究,35页,西北师范大学硕士学位论文,2003。)现在,一般将斯廷金斯(RStiggins)关于表现性评价的定义视为权威定义,即“表现性评价为测量学习者运用先前所获得的知识解决新异问题或完成特定任务能力的一系列尝试”。(李金亏:语文学习评价研究,35页,西北师范大学硕士学位论文,2003。)以上定义各有不同,但从中可以看出有两个共同点:一是评价中涉及的任务是实际的,不是远离社会真实情境的;二是学生在处理实际任务时必须运用已有的知识、技能,其表现能够反映其真实水平,不是靠猜测得来的。
14、这两点其实也正是表现性评价之所以产生并受到欢迎的原因。综合以上看法,本书认为学业成就的表现性评价是通过完成一些实际的任务,诱导出学生的真实表现,以此评价学生掌握和运用知识和能力的方法。具体来说,就是运用真实的任务或模拟的练习来引发学生真实的反应,由教师或高水平评定者按照一定标准进行直接的观察、评判。表现性评价的形式可以有多种,主要有反应题、书面报告、作文、演说、操作、实验、资料收集、作品展示等。(二)表现性评价的原理面对真实或模拟的任务时,被评价者必须运用已有的知识和技能产生一定程度的创造性方案来解决问题,即建构一种原创性反应,因此,被评价者在这一过程中的表现是真实的或接近真实的,对这一过程的
15、评价也就是评价被评价者真正掌握或运用知识、技能的能力,表现性评价即是运用的这一原理。在表现性评价中,学生要完成的一般是比较复杂的现实或接近现实的任务,往往需要他们综合运用多种知识和技能才能解决,因此解决问题时被评价者依靠猜测或答题技巧的成分较少,所以,运用表现性评价往往能够测评被评价者实际掌握和运用知识、技能的能力。二、表现性评价的类型和特点(一)表现性评价的类型按照不同的标准,可以将表现性评价(pngji)分为不同的类别。目前比较常见的是将表现性评价分为限制型和扩展型两种。表31(美R.L.Linn & N.E.Gronlund: 教学(jio xu)中的测验与评价, 183页,北京(bi
16、jn),中国轻工业出版社, 2003。)列举出了学业成就评价中几种具体的限制型和扩展型任务。限制型表现性任务通常结构性较强,对完成任务所要求的表现容易做出明确描述,相对比较简单,一般集中在专门技能上面。扩展型表现任务则相对较复杂,对任务完成的限制也较少,完成任务过程中更多地涉及多种技能或能力以及较复杂的认知过程,一般包含了对理解能力、问题解决等深层能力的评价。表31表现性任务的类型任务类型具体任务限制型的表现任务大声朗读用外语问路设计一个表格使用一种科学仪器打字扩展型的表现任务建造一个模型收集、分析和评估数据组织观点,创作一种视听作品,一个内容完整的演技创作一幅画和演奏一种乐器写一个具有创造性
17、的小故事限制型和扩展型表现性任务各有优势和局限。相比较而言,限制型表现性任务有比较具体的结构化要求,完成任务需要的时间较少,评分相对容易,一定时间内可执行的任务也就更多,这使得测查内容的覆盖面可以更宽泛些;但另一方面,结构性的要求也使得在完成任务时对学生的限制增多(zn du),学生发挥自主性的余地相应变小,评价学生整合信息和独创性等方面能力的价值也就变小。相反,扩展型的表现性任务则正好可以弥补限制型任务的缺陷,当然限制型任务的优势也正是扩展型任务的缺陷。在实际应用中,教师可以根据需要择优选用限制型或扩展型任务,也可以尝试将两种任务结合起来使用。如,一道以选择题开始的限制型的表现性任务,选择完
18、答案后可以通过让学生解释为什么选择该答案而进行扩展,或者是解释为什么没有选择其他的答案加以扩展。这样(zhyng)就可以知道学生选择了正确的答案,到底(do d)是因为一种合适的理由,还是出于一种简单的猜测。 (二)表现性评价的特点1.它是对学习的直接测量这一点是相对传统的标准化测验而言的。很多情况下,教师通过传统的测验并不能准确判断学生是否真正掌握了所教授的知识和技能,特别是对程序性知识的掌握。因为通过传统测验,教师多是 “推断”到了学生会“做”什么,却不能测到学生是否真正会“做”什么,二者的区别是非常重要的。如,从做选择题这个活动本身教师并不能看出学生对知识、技能的掌握和应用水平,只能从测
19、验的结果来推断学生的学习行为,这是间接评价。而表现性评价则不同,它是通过学生在切实地“做(完成)”一些任务时的行为或表现来进行评价,如在即兴编故事中,教师当场就可以根据学生的行为表现对学生的口头反应能力做评价。因此,我们说表现性评价是对学生学习的直接测量。2.评价本身既是测验(cyn)又是学习活动传统的纸笔测验中,测验往往独立于学习活动,这导致了一些(yxi)无法避免的弊端。如,学习和测验完全脱节,致使学生难以把课堂学习内容和测验内容联系起来,降低了课堂学习质量;测验的反馈滞后,降低了测验所应该起到的作用。而在表现性评价中,学生要在真实或接近真实的环境中解决问题、完成任务,要进行直接地尝试、思
20、考,测验的过程也是学生巩固学习和主动学习的过程。此外,理想的表现性评价是测验与教学的结合,教师完全可以将测验嵌入到课堂中,测验与课堂活动同时进行,测验的同时也是一项积极的学习活动,有效地避免了传统测验的弊端。3.既测量结果(ji gu)又评价过程表现性评价区别于传统测验的另一特点就是它既能对学习结果作出评价,也能对学习过程进行评价。传统纸笔测验则一般只是对学习结果进行测量,而难以对学习的过程进行评价,如,做选择题时学生是真正掌握了知识还是凭猜测选出了正确答案,这个过程无法判断。表现性评价则充分体现了现代学习理论,把学生看作是意义建构的积极参与者,不仅记录学生能够做什么,还要记录学生是如何完成一
21、项任务的,而且更关注后者。表现性评价认为观察“过程”可以判断学生是否具有良好的科学的思维,在整个过程中是否有更好的或创造性的方法出现等,因此评价“过程”比评价“结果”更有价值,并且在表现性评价中常常有对过程进行评价的相应标准。所以,既评价结果又评价过程是表现性评价的又一特点。4.有多重评估功能表现性任务一般较复杂,学生在真实的或模拟的情境中完成任务时,总会不同程度地涉及问题的解决,这就需要学生深入理解和积极思考,因此,通过表现性任务可以较好地评价学生的高级智力技能。另外,实际设计的表现性任务中,很多都要求学生以小组为单位或通过与他人的交流完成,这也要求学生必须具备一定的沟通与合作能力,因此,表
22、现性评价也可以用来评价学生的社会技能,如合作能力、沟通能力、分享等。所以,表现性评价有多重评估功能。5.主观评估 与传统评价的另一个明显不同就是表现性评价的主观性。传统测验的很多题目都有客观的答案或较客观的评估标准,评估可以借助于计算机和扫描仪。而表现性任务一般很少有唯一正确或最佳的答案,而且,往往有多种行为表现或问题解决方案都可以被评定为优秀。这就需要依靠评价者的经验和智慧来进行评判,所以,评估的主观性是表现性评价的一个特点,同时也是不足。三、表现性评价的设计(shj)和运用 表现性评价与传统评价的主要区别就在于所用的测量任务的类型不同。所以(suy),表现性评价能否达到预期的目的、是否成功
23、,很大程度上取决于表现性任务的设计,下面我们就介绍设计表现性任务的原则和具体步骤。(一) 表现性任务(rn wu)的设计1.设计的原则(1)确保评价任务与评价目的的高度相关。表现性评价涉及的任务一般比较复杂,通常也没有客观的标准来衡量任务的合适程度,所以,要保证表现性评价的质量,在设计任务时首先要考虑的就是保证评价任务与评价目的的高度相关。这个原则很好理解,但具体运用过程中要真正做到,却不是很容易。例如,要测量学生的交流能力,交流主题是“关于克隆”,并提供相应资料。对于有些学生来说,“克隆”本身就是一个陌生的东西,理解相关的资料就很费时、费力,所以这个表现性任务在很大程度上测量到的可能是阅读能
24、力,而不完全是交流能力了,我们把这里的“阅读能力”叫做“无关目标”。当然这是一个有点儿极端的例子,但在实际应用中, 这并不是不可能的事。所以,要始终把注意力放在评价的目的上,尽量避免“无关目标”的干扰,保证所设计的任务与评价目的高度相关。(2)关注那些需要复杂智力技能并能反映多方面教学成果的任务。表现性评价是个复杂的过程,教师和学生都要投入大量的时间、精力。因此,本着高成效原则,设计表现性任务时,教师要考虑那些用纸笔测验不能很好地测量到的知识或技能。选择那些能够反映多方面教学成果的内容时,不要过于简单,要在任务的完成过程中尽量涉及问题提出、收集、组织、分析和处理信息等高级思维技能。(3)表现性
25、任务要尽量真实。这里所说的“真实”是指表现性任务应尽量接近实际生活情境中的任务原型。表现性评价的原理就是要用较为真实、复杂的任务引出学生的“原创性”反应来评价,而且评价的主观性也较强。如果所设计的任务距离真实生活情境较远,也就是说仿真程度较低,那就难以保证学生在完成任务过程中能表现出所要测量的知识和技能,也就难以保证评价不偏离目的。因此,所设计的表现性任务一定要尽量真实。譬如法语的口语测验,让学生给法国人当导游即是生活中真实的任务。当然,用这种方式进行评价是不现实的,但我们所设计的任务要尽量接近这样的真实情境,如模拟对话:给出一个主题,让学生进行法语交流,即比较接近真实任务,由此所引出的学生反
26、应也就更接近生活中的真实反应,评价效果也就较好。(4)要考虑评价前后的有关因素和效应。这里所指的是要考虑评价前的有关因素和评价后的一些效应。设计任务前,对学生现有的学业水平、智力水平等应有一个大致的把握,过难或过易都不可取,最好(zu ho)以教育学上所说的“跳一跳,摘桃子(to zi)”为原则来设计。另外,还要考虑评价能够促进以后的学习、教学和学生良好思维的发展(fzhn),尽量减少负面的影响。(5)要求表述清晰、简洁易懂。表现性任务一般是有挑战性的,学生完成任务要投入相当的精力,含糊的语言很容易导致不一致的行为表现,以至于不可能用统一、可靠的方式进行评价。所以,所设计的任务,尤其是指导语,
27、一定要清晰、简洁易懂,既不出乎学生的意料,也不要留有漏洞,会引起歧义的语言,如语文上的同一句话在不同语境下有不同理解等类似情况要坚决杜绝。而且,语言的简洁、易懂也避免了学生在任务的理解上浪费过多精力。举例如下。(美G.D.Borich & M.L.Tombari: 中小学教育评价, 193页,北京,中国轻工业出版社, 2004。)用盒子里的材料,和你们小组的同学一起来做一个和我们课堂上使用的验电器一样的验电器。验电器做好后,用橡皮尺和羊毛布料来完成下面这些问题。A.带电的尺子靠近或远离验电器时,验电器的叶片会怎样变化?解释一下为什么。B.当用带电的尺子去接触验电器,然后用手指去碰验电器时,验电
28、器的叶片会怎样变化?解释一下为什么。C.当带电的尺子靠近验电器的叶片但是不直接接触叶片时,会发生什么样的情况?解释一下为什么。D.用火柴将验电器旁边的空气加热时,验电器带电的叶片会发生什么情况?解释一下为什么。在实验报告单上的相应(xingyng)部分将下面每个问题的情况填写好,预测将要发生的情况。a.你们观察(gunch)到的现象是什么?b.你们(n men)的预测得到验证了吗?c.用课堂上学的知识解释你们观察到的现象。d.画一幅画来表现电能是如何起作用的。这个例子中,学生需要做什么,做完后需要交些什么材料,就描述得很简洁、清楚,学生一看便知。(6)考虑可行性。设计表现性任务要注意的另一原则
29、就是可操作性,即任务的可行性,需考虑人力、财力、物力、空间、时间和设备等方面的因素。在客观条件允许的范围内,还要考虑学生的承受能力,如考虑学生的学业水平、经济水平、身体状况等。2.表现性任务的设计步骤一般而言,表现性任务的设计需要经历以下几个步骤。(1)确定评价目的。在设计原则里谈到了设计表现性任务时必须保证目的和任务的高度相关。教师要完成一个成功的表现性评价,必须先有一个明确的评价目的,只有目的明确,才能保证通过完成所设计的任务测到所要评价的学生的能力和技能。因此,设计表现性任务的第一步就是明确自己的评价目的。也就是说,教师要十分明确通过这次评价你要知道什么,或者说要推论到什么。下面是一个教
30、师所确定的评价目的。李老师的学生刚刚学会了怎样应用十进制数学技能,我想知道他们是否真正掌握了这一知识点。为了能够真正测量出学生是否真正掌握了,我决定设计一个表现性任务来进行评价。通过这次评价我要清楚(qng chu)地知道学生对十进制的掌握达到了什么程度,掌握不好的学生问题出在哪里,基本掌握的学生为什么没有达到灵活运用的程度,掌握好的学生在学习过程中有哪些可取之处。根据掌握程度将学生分为这几类,还有没有其他情况出现。上面例子中对学生(xu sheng)掌握的程度、问题所在、优势是什么等描述得十分具体。在实际应用中,教师就应该像上例中那样将自己的评价目的明确、具体地描述出来。确定评价目的虽然简单
31、,但很重要,在设计表现性任务中必不可少。如果教师只是将评价目的作一个笼统的描述,如我想知道学生是否真正理解了什么是“光合作用(gungh-zuyng)”、是否会用讲过的单词来做作文等,那么,在实际的任务设计过程中就很容易出现任务与目的之间的偏差,往往起不到很好的指导作用。为了保证学业成就评价的质量,建议在大目的确定的情况下,教师应该再进一步细化、具体化,如上例中李老师的评价目的。评价目的确定后最好写出来,形成文字,以便在设计任务的整个过程中,时时刻刻提醒自己。(2)确定评价内容。在评价目的确定后,教师就应该考虑哪些智力技能和社会技能是应该评价的,也就是确定评价的内容。设计表现性评价的目的主要在
32、于评价用传统的测验不能很好地测量的高级智力技能,一般来说,表现性评价测查的是获得和组织信息时的认知过程、问题解决策略的应用以及表达能力等,这其中的每个方面又都可以再次细分。在这个阶段,教师必须弄清楚自己想要评价哪种高级思维或解决问题的能力,这些技能是否符合评价目的。通常可以选取多个高级智力技能,但也不宜过多,最好两至三个,不要超过五个,以免在设计任务时出现偏差,在评估过程中分散精力。在保证主要评价内容的情况下,可以附带一些其他评价内容。举例如下。李老师在确定了自己的评价目的后,依据目的将主要评价内容确定为:获得和组织信息的能力、问题解决策略。其他要评价的技能不是主要的,在设计任务时不作主要考虑
33、。另外,表现性评价常常以小组或其他学习交流的形式进行。这时教师可以考虑评价学生的社会技能,但本章只从学业成就的角度加以探讨,对于学生社会技能的评价,后面章节有详细论述,这里不再赘述。(3)设计任务及任务指导语。在以上两步中,教师对所要设计的任务一般都已有一个大致轮廓,这一阶段就要实际编制表现性任务及任务指导语,这是非常关键的一步。因为主题、目的或学科内容的不同,表现性任务可以有多种形式,无法将其用例子一一列举出来,所以,这里就介绍一些设计任务时所必须考虑和牢记的标准,这对很多教师在编制表现性任务时都会有指导作用。类推程度。它的意思是学生在完成所设计(shj)的任务时的表现能否在类似任务中表现出
34、来,也就是学生的行为表现在不同情境中的类推性。如果在所设计任务上的类推表现程度很高,则说明这一任务抓住了要测量的事物的本质,可以在类似问题中举一反三,那么,这个表现性任务就是可取的,反之则应该放弃。任务适宜度。表现性评价的目的是让学生展示他们在学习过程中发展起来的高级思维能力,如果完成(wn chng)任务的程序和内容非常不合适,学生就难以展示他们的能力。因此,设计的表现性任务必须是新的,但又不能是学生十分陌生的类型,应该是学生曾接触过的,但又不是一模一样的。也就是说活动要有一定的挑战性,既要有一定的难度,但难度也不能太大,也就是任务一定要适宜。多重关注点。它要求表现性任务的完成要能够反映多方
35、面智力技能和教学(jio xu)成果,这与第二步“确定评价的内容”里高级智力技能不宜过多并不矛盾。前者是为了保证任务设计时不偏离目的的必须要求,但实际上表现性评价的设计耗时耗力,在保证主要目的的情况下,一次能兼顾多个目标更好,在设计任务时要充分考虑这一点。在学业成就的课堂教学评价中,要达到多重评价目的,一个理想的方式是将内容和技能通过多个学科结合在一起。可以尝试设计一些复杂的表现性任务,要求学生综合运用数学知识、写作能力、科学知识、艺术能力等来完成。另外,较复杂的任务也会更加吸引学生。如下例。在一个跨学科的单元中涉及刘易斯和克拉克的冒险,一位教师就要求学生仿照刘易斯和克拉克,在旅途中创建一本自
36、己的旅游日记。要求学生假设自己是刘易斯和克拉克,给家里写一封信,记录他们沿途看到的鸟类、树叶和醒目的路标等,并把他们写的东西用图画记录下来。这里就涉及了科学、艺术、写作、社会学等多重关注点。问题解决方式的开放性。表现性评价的一个重要目的是充分展示学生的能力,实现学生的自主性。在解决问题过程中,要允许学生自己选择查找资料的方式(如向专家求助,查阅杂志、百科全书、报纸、科学刊物等)和呈现成果的方式(如录像带、磁带、辩论性文章、口头说明、图表展示、故事、对话等)。尽管它们很耗费学生的时间和精力,但这种方式能让学生感觉到对学习拥有自主权,因而能充分调动学生的积极性,最大程度地展示学生的能力,同样也能将
37、学生最大的优势和不足测量出来。因此,设计的表现性任务要允许学生自由选择解决问题的方式,完成这个任务的方式应该是开放性的,答案应多种多样,不应该是唯一的。换句话说,设计的表现性任务必须允许学生有一定的自主权,为学生展示他们的能力提供足够的时间和资源。指导语是否清楚。整个任务设计完成以后,就要(ji yo)考虑设计指导语,对指导语的要求不多,主要看是否把任务说清楚了,要让学生很容易就能清楚自己要做什么,需要注意些什么。具体可以参考后面的例子。其他要注意的问题。以上几个方面基本包括了设计表现性任务时必须考虑的因素。除此之外,教师在这一阶段还要尽量考虑以下几个问题:学生是把整个评价过程作为课堂学习的一
38、部分,还是把评价任务看成是能够得到分数的东西?这些(zhxi)任务要求学生展示的是否是他们在课堂上学习并练习过的知识和技能?学生能够完成任务主要是教师教学努力的结果,还是学生自己努力的结果?这些问题的澄清可以说明教师所评估的是否是教师和学生都关注和感兴趣的,也可以说明学生的努力程度或教师的教学效果。(4)制订评估规则。任务和任务指导语设计完成(wn chng)后,教师就要考虑制订评估规则了,这也是很重要的一步。评估规则是对表现性评价测验的评分标准和尺度的详细描述。表现性任务的完成一般要求学生有建构性反应,任务的答案一般有多种,没有简单的对与错,对学生的评估其实就是试图评判学生的建构性反应,主观
39、性很强。因此,表现性评价中评估规则的制订就显得非常重要。下面介绍制订评估规则的一般步骤。确定评估标准。评估标准是评估规则中所包含的决定学生反应质量的各种指标。表现性评价中,评估标准的选择非常重要,因为表现性评价在很大程度上是主观评估,评判所依据的具体标准将会直接影响教师对学生反应的评估。如下例中,教师依据组织、用词和表达的清晰程度来给学生的作文评分,与依据拼写、标点、语法来评分,得到的结果肯定不同。关于怎样选取评估标准,斯廷金斯曾有这样的建议:在某项任务没做之前,评估者应想象一下学生较差的行为表现是怎样的。他认为,如果对合理的行为表现没有一个清楚的认识,即什么是差的和出色的表现,那么教师既不可
40、能指导学生如何完成任务,也不可能对他们的行为进行评价。通过对完成任务的清楚认识,选取那些能够反映学生进步的、能够对优秀和较差的表现进行区分的标准,如下例中的标准就很合适。要强调的是,教师千万不能出于时间和精力的考虑,将评估标准限制在一些容易评判的方面(如标点、语法),而忽略了更加重要的方面(即表达的清晰性、知识建构、策略思维等),这样才可以预防将表现性评价变成仅仅对知识的评价,才能公正地反映出学生参加测验所表现出来的能力。另外,评估标准不宜太多,假如指标很多,可以依据重要性将其排序,适当留下几个,其余的全部去掉。 为了评价学生在语文上的综合应用水平,语文教师设计了一次即兴限时作文,为了给学生打
41、分,他选取了以下几个指标作为评估标准:组织、用词、表达的清晰和流畅程度、与主题符合程度。确定整体评价或分项评价。整体评价是在考虑了学生在所有维度上的表现后给学生一个整体的分数或评语,是对整体行为表现水平的描述,多用于评价拓展性书面作业,如写一个故事,或用于评价艺术表演,如跳舞、幽默小品等。分项评价则是对学生在不同评估标准上的表现分别进行评价,如上例中对作文的评价。整体评价方法的优点是速度快,缺点则是在对学生反馈评价结果时很难说清学生的不足或优势在哪里,但有时详细的反馈却是很重要的,尤其是对表现差的学生。相对而言,分项评价法能够提供(tgng)精确的有针对性的反馈。在实际应用当中,可以取长补短,
42、将二者结合起来使用,如,教师可以先对学生的反应进行整体评价,然后(为了提供有针对性的反馈)再对表现较差的学生的反应进行分项评价。制订评估规则。这一阶段牵涉到两个任务(rn wu):评价方式的选择和评价细则的制订。选择评价方式在某种程度上其实就是选择一个合适的评价工具,或者说选择合适的评价方法。表现性评价的内容有多种形态,不同的内容形式需要用不同的评价方式,如,测量学生对知识体系的掌握,在选择评价方式时,用概念图就比用等级量表好,并且由于(yuy)表现性评价的目标有多重性,教师常常可能需要用到不止一种评价方式。因此,具体应用时教师可以根据任务内容、自己的需要等来进行选择。本章最后一节详细介绍了等
43、级量表、核查表等常用的评价方式,每种方法各有其特点,教师可以参考使用。 评价细则是一套用来评价学生的反应和表现的标准。典型的评价细则是对学生表现的言语描述,包括学生在高级的、熟练的、半熟练和初始水平上的所有表现,即描述各评估标准(指标)在不同质量上的标准。如果需要可以赋予每一水平的表现一个分数,如下面给出的例子。教师在制定评价细则时,对于每一条评估标准,学生表现的质量区别到底有何表现,评价细则中都要有具体的描述,至于这种描述要细致到什么程度,则取决于教师自己的需要。评价细则不能令人厌烦,要使用简洁描述说明各种不同反应的质量差异,不但教师使用起来方便,学生也可以运用。另外,如果需要整体评价的,还
44、需要对学生的整体表现制订评价细则。让一年级的孩子按照季节顺序,把四幅有关树的画安排在四个箱子里,并在箱子上写出每个季节的名字。评价细则2分:学生从任意一个季节开始,把画的顺序安排对了。1分:学生开始了任务(rn wu),但是没有完全完成任务。0分:学生没有作出适当(shdng)的反应。将评价细则和评价方式结合起来,就制订出了一套完整的评估规则。如将等级量表评价方式和评价细则结合,就可以产生(chnshng)如下例的评估规则。 三个分别装有水、酒精、盐水的瓶子,要求你把三者区分开,并进行解释。对学生的评价分为四个等级:优秀(4分)、良好(3分)、中等(2分)、较差(1分)。评估规则如下。对方案的
45、解释优秀(4分):完整、清楚、合乎逻辑。良好(3分):本质上是对的,但是不完整或不完全清楚。中等(2分):含糊不清,但是有弥补的余地。较差(1分):与方案无关、不对或没有解释。注意避免评分中的误差。表现性评价的误差一般来自两个方面。第一,评价工具方面的缺陷所导致的误差。这一般是由于评估规则描述得不够清楚引起了评分者的歧义,或评估标准制订得不太确切。第二,人为原因所导致的误差。如,教师容易将所有学生的评价都集中在量表的某个位置上,分数普遍较高、较低或者都停留在中间,这几种误差分别被叫做宽松误差、严格误差和集中误差。另外,还有一种人为原因导致的误差即晕轮效应,通俗地讲就是给评分者平时留下好印象的学
46、生在评价中容易得到高分,反之则分数会偏低。对这两方面的误差,在表现性评价中都要尽量避免。前者需要通过严格制订评估规则来避免,后者除了对评价者进行一定的培训外,还可以采取平均多个教师的评价的方法来避免。(5)考虑实施中的重要事项。任务及评分规则都确定下来了,接下来是考虑如何实施的时候了。为了保证评价的有效性,这里(zhl)有几个重要的问题需要考虑。确定测验规则(guz)。测验规则指测验过程中的一些规则。其中最常考虑的条件有如下几个。时间:给学生多少(dusho)时间来计划、修改及完成任务。参考资料:学生在完成任务时,可以使用何种参考资料(字典、课本、上课笔记、电脑软件)。其他人:学生在测验或完成
47、项目时能否向同学、教师或专家求助。设备:学生在完成任务时能否使用电脑、计算器、拼写检查器以及其他的设施。评估标准:你是否会明确地告诉学生用来评价他们的学习成果或表现的标准是什么。在确定这几个条件时,可以参考以下依据:考虑现实生活中人们在完成这种类型的任务时受到的限制;怎样制订这些规则才能够获取学生的最佳表现。下面给出一个例子(美G.D.Borich & M.L.Tombari:中小学教育评价, 201202页,北京,中国轻工业出版社, 2004。),可以作为参考。李老师的测验规则时间(shjin): 学生可以用午饭前一个小时来准备他们的商店、给商品标价以及制造玩具(wnj)钱。午饭后,每个小组
48、要进行买卖活动的展示。展示的时间大约为10分钟,还包括提问(twn)的时间。参考资料:学生可以使用艺术品、杂志以及任何从家里带来的实物。可以用教室里的字典来检查拼写是否正确。其他人:教师会把全班分成46人的小组。学生要尊重和协助其他组的同学。设备:学生可以用彩色纸和剪刀来做玩具钱,用图画画出用于出售的商品,用个人的计算器来找钱。评分标准:明确告诉学生。如果标价正确和玩具钱清楚准确,学生就会得到5分。展示买卖活动的过程总分也是5分。分数的给法主要看运算的准确性和解释是否清楚。如有额外的表现,或者正确回答同学或教师的问题可以得到总分为2分的奖励。如何保证活动的顺利进行,即要考虑活动进行的全过程。为
49、保证活动顺利进行,一般要考虑以下几方面。组织任务:活动开始时,采用合适的方式向学生描述这次表现性评价以及这次活动的目的和意义;复习学过的相关知识和策略,以帮助他们顺利完成任务;确认学生在开始活动前已经明白了任务的要求。调动积极性:学生的参与程度对表现性评价的质量很重要。活动开始时,要给学生一定的鼓励,以激发他们的好奇心和兴趣。初步指导:在学生独自或分小组活动前,考虑怎样进行解释,如何进行示范。必要的话,也可以考虑用几个具体的例子来引导学生。过程调节:学生开始自由活动之后,要采用一定的方法进行监控,尽量使他们能从错误中学到东西,或在他们完成任务过程中出现混淆或错误概念等现象时,给学生提供过程性的
50、反馈。为便于(biny)监控,可以采取“鱼缸(y n)布局”,即参加者聚集在一间屋的中间,其他学生(xu sheng)和教师从一个更大的、外层的圆圈中进行观察。总结:在快要完成任务时,帮助学生回顾他们学到的东西,在大的学习背景下而不是眼前的任务中解释他们的成就。帮助他们将表现性评价和其他的科目、将来要学习的内容以及课堂外的大千世界联系起来。学生参与到评价中。学生参与到评价中即自我评价。在表现性评价中,大多数教师所用的评价工具同样可以被学生用来判断自己的进步。让学生自评他们的行为,再与教师的评价进行对比是非常有用的。这对学生有很多好处:更好地理解教学目标;促进朝向目标的活动;更有效地诊断优势和不
51、足;发展学生自我评价的技能。如果师生通过讨论进行比较,教师就可以了解每个学生给自己等级评定的理由,并对双方的差别进行有效的沟通。以上内容介绍了设计表现性任务时的步骤,具体设计时,不必完全拘泥于此。表现性任务的形式不拘一格,教师可以根据需要灵活运用。(二) 表现性评价的使用举例前面介绍了表现性任务设计的整个过程以及实施时的注意事项,下面就给出一个具体表现性评价样例(美W.J.Popham: 促进教学的课堂评价, 144、215页,北京,中国轻工业出版社, 2003。),以供参考。 口语交际表现性测验简介无论是在校园内还是校园外,学生日常生活中都要完成(wn chng)许多类型的讲话任务。本表现性
52、测验关注下面几种类型的任务,分别是描述物体、事件和经历,按顺序说明某个操作步骤,在突发事件中提供信息和说服某个人。要完成一个讲话任务,讲话人必须向听话人简短地陈述某些信息。这一过程包括决定要说什么,将信息组织起来、根据(gnj)听话人和场合的情况改编信息、选择传递信息所用的语言,最后正式表达。讲话的效果可以根据讲话人符合任务要求的程度来予以评估。任务(rn wu)样例描述任务:想想你最喜欢的课或课外活动是什么,向我描述一下,让我也了解了解。(某一学科、某一社团或某一运动项目怎么样?)突发事件任务:假设你独自在家,忽然闻到一股烟味,你打电话给消防队,而接电话的正好是我。现在你假装正在和我通话,你
53、要告诉我帮助你所需的各种信息。(直接对我说:从说“你好”开始。)顺序任务:想一想你会烹调什么。告诉我,一步一步地,怎么完成这一过程。(爆米花、三明治或煎鸡蛋怎么样?)说服任务:想想你希望在学校看到的某一转变,比如说校规的变化。假如我就是学校的校长,试着说服我学校应该这样变化。(说说走廊通行的规则或报名选课的程序怎么样?)总任务:在某个课堂活动中,要求学生在同学面前做一个规定内容的口头沟通(即席演讲或精心准备的演讲)。评估标准每次口头沟通根据四个标准进行评价,表达、组织、内容和语言。每个评价标准需要(xyo)考虑23个因素(yn s)。评价标准中的因素,(如有必要)在下面加以说明(解释)。这些标
54、准运用的严格程度随口头沟通(gutng)的性质而变化。例如,评价即席演讲比精心准备的演讲期望要低一些。同时也应该考虑学生的年龄。在考虑每一个评估标准的因素时,你可以使用“合格”和“优秀”来加以区分。合格学生的表现是指与期待的发展或教学进度相一致的水平。因此,从一定意义上说,某一因素“合格”大体意味着学生的表现正处于被期望的等级水平,而“优秀”则意味着学生表现明显超过期待的等级水平。四个标准中的每一个都可以给13分。因此,任何一个演讲都能获得412分的总成绩。尽管这些规则被分解开来加以使用,但如果不考虑每个标准的分数分配,它们还是能被完整地运用。表达口头沟通表达方式的评定依据三个因素,即音量、音
55、速和发音。优秀演讲(3分),所有三个因素至少合格,并且有23个因素为优。熟练演讲(2分),三个因素至少都合格。部分熟练演讲(1分),三个因素不是都合格。组织口头沟通的组织评定依据两个因素,即交流中多个观点间的顺序和相互关系,也就是演讲中观点间的顺序和联系是否清楚。优秀(yuxi)演讲(3分),两个(lin )因素都为优。熟练(shlin)演讲(2分),两个因素至少都合格。部分熟练演讲(1分),只有一个因素合格。内容口头沟通内容评定依据三个因素,即内容的量、内容与指定主题的相关性,以及内容对听众和情境的适应性。优秀演讲(3分),所有三个因素至少合格,并且有23个因素为优。熟练演讲(2分),三个因
56、素至少都合格。部分熟练演讲(1分),三个因素不是都合格。语言口头沟通语言评定依据两个因素,即语法和词语选择。优秀演讲(3分),两个因素都为优。熟练演讲(2分),两个因素都合格。部分(b fen)熟练演讲(2分),只有一个因素(yn s)合格。四、表现性评价运用中要注意(zh y)的问题这里主要是针对表现性评价的优势和不足而言的。(一)最好综合多学科运用表现性评价与传统纸笔测验而言,表现性评价有其独特的优势。它体现了现代学习理论,能测量用其他方法无法测量的复杂的学习结果,能够促进学生的真实的进步。但同时表现性评价又有耗时、费力的特点,完成一个表现性评价往往要相当的时间和精力,由一门学科的一个教师
57、设计完成一个表现性评价,有时会显得浪费,对单科教师而言精力等各方面的投入也太大。所以,在实际中运用表现性评价时,最好是多学科结合,这样不仅可以多个教师集体承担要付出的时间、精力,对学生而言收效也会更大。(二)评估中的问题表现性评价的一个最大的不足就是评估主观。在实际操作时,如果有可能,最好请多位不熟悉学生情况的教师或专家评分,以避免“晕轮效应”;再者,如果对学生的评估有分数,最好对学生的分数进行统计处理,将评分者所带来的误差降到最低。小结表现性评价是指通过完成一些实际的任务,诱导出学生的真实表现,以此评价学生掌握和运用知识、能力的方法。它具有既是评价过程又是学习活动等特点,可以分为扩展型和限制
58、型两类。表现性评价的实施一般要通过表现性任务的设计和使用来完成,其中表现性任务的设计是表现性评价成功实施的关键环节,可以分为确定评价目的、确定评价的内容、设计任务及任务指导语、制订评估规则、考虑实施中的重要事项等几个步骤。第三节成长记录(jl)袋评价一、什么(shn me)是成长记录袋评价(一)含义(hny)成长记录袋(portfolio),来源于意大利语portafoglio,有文件夹、公事包或代表作选集等多重含义,也有人将其译为档案袋、学习档案、档案录或成长记录。成长记录袋在国外的应用已有十多年的历史,但到目前尚未有统一的定义。我们在这里作一个描述性的定义:成长记录袋就是把个人的成果系统地
59、收集起来,放在一个合适的容器如文件夹、档案袋(目前还有软盘、光盘等)里,每过一段时间,根据所收集的内容对学生的进步或进步过程等进行评价,以这样的方式进行的评价就是成长记录袋评价。在课堂教学中,成长记录袋指学生作品的系统收集。通过收集学生成果(如作业、艺术作品等)来反映学生学业水平的增长、长时期的成就以及在特定学业领域的重大成就,并由此来促进学生的学习,这样的评价就是学业成就的成长记录袋评价(portfolio assessment)。另外,我们在这里强调一点,学业成就的成长记录袋不是一个无所不装的大口袋,它所收集的作品应该能够展现学生的成就和进步、能够描述学生学习的过程和方法、能够反映学生学习
60、的情感和态度,可以是学生最好的作品,也可以是反映学生进步的作品,如草稿、预习、考试准备等。(二)原理运用成长记录袋进行评价的原理是让被评价者参与,共同收集被评价者一定时期内有关某一个或几个主题的作品。在这一过程中,由于被评价者的始终参与,可以通过这些连续的作品随时了解自己的进步和在各个阶段的最高成就,了解学习过程中自身的优点和不足,因此,它可以很好地激发被评价者向高水平努力的动机,并由此促进被评价者智力技能、社会技能的发展。再者,评价者也可以通过这些作品看出被评价者的缺陷所在,为下一步计划提供依据。在学业成就评价方面,除了以上功能,如果设计得好的话,成长记录袋还可以反映学生的毅力、努力和意愿等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑拆除吊车租赁合同样本
- 电力工程技术人员招聘合同模板
- 二零二五年度新型城镇化房屋承建合同3篇
- 2025年度戊公司股东股权转让合同3篇
- 二零二五年度文化艺术vi设计制作合同
- 二零二五年度按揭贷款服务与资产评估合同3篇
- 二零二五年度投标保函担保合同范本
- 二零二五年度房屋买卖及贷款担保协议3篇
- 海南职业技术学院《现代信息网络技术》2023-2024学年第一学期期末试卷
- 海南医学院《电子商务理论与实务》2023-2024学年第一学期期末试卷
- 建筑工程施工现场视频监控布置实施方案
- 施工现场节前安全检查表
- 松下vf100变频器使用手册
- 机械设计制造及其自动化实习总结报告——某
- 角的概念推广说课课件.
- 化学元素周期表口诀化学元素周期表口诀
- 压密注浆施工工艺
- 2019-2020学年江苏省徐州市九年级(上)期末英语试卷(解析版)
- 苏教版八年级下《二次根式》单元测试卷(含答案)
- AAEM的应用机理
- 海上试油测试技术0327
评论
0/150
提交评论