




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育评价概念的演变及其影响因素
“教育评估”一词是一个极其复杂和广泛的概念。对教育评估的概念的理解是一个渐进的过程。从历史的角度来看,教育评价概念的内涵在不断扩大、丰富和发展。“教育评价”概念到底发生了怎样的变化?造成这种变化的原因何在?本文力图对“教育评价”概念的演进脉络进行梳理并分析其变化的原因,以期全面、正确地认识当前我国教育评价领域出现的一些问题。一、改性期20世纪30-20世纪80年代之后的考评期20世纪初以来,教育评价领域经历了三个时期:20世纪初的测验时期(testingera)、20世纪30年代之后的评价时期(evaluationera)、20世纪80年代开始的考评时期(assessmentera)。与此同时,教育评价概念也发生了很大的变化。(一)教育评价examunity20世纪初,心理学测量理论和智力理论得到了极大的发展。1904年,英国心理学家斯皮尔曼(Spearman)发表了一篇关于一般智力(generalintelligence)的经典论文。1905年,法国心理学家比奈(Binet)首次发表了智力测验,用来鉴别不同教育需求的儿童。尽管斯皮尔曼和比奈对彼此的论著持有异议,但是智力理论和智力测量发展的相遇,激发了美国那些负责有效管理州立教育体系的人使用智力测验的热情。在英国,随着需要进行小学义务教育的儿童日益增多,人们对“低于正常智力”、难以教育的儿童也日益关注。人们需要筛选出这些“低常儿童”,将其安排到特殊学校。由于进入特殊学校会给学生带来不好的名声,同时特殊学校的运作比普通学校花费更大,因此准确鉴别“低常儿童”显得尤为重要。智力测验则成了确认这些儿童进入特殊学校的重要工具。在美国,智力测验常被用来区分学生的潜能,以安置到不同的学校和能力小组。20世纪前半期,大量来自南欧和东欧的移民对美国的学校体系增加了压力,智力测验也逐渐成为管理学校体系的重要方式。这一时期,“教育评价(educationalevaluation)”一词尚未出现。正如美国著名教育评价专家泰勒(R.W.Tyler)所言,“在1930年我开始使用评价一词,在这之前,一般评估学习常用的术语是考试(examining)和测验(testing)……”94可见,当时将教育评价等同于教育测量和测验。教育评价主要依靠测验达成,以测验为中心。评价的目的主要是选择、认证。(二)教育评价的核心是价值判断20世纪30年代开始,美国兴起的课程改革运动引发了隐含在教育测量实践中更丰富、复杂的评价概念。人们开始对前一阶段进行反思,认为教育评价比测验具有更广泛的任务。教育评价不仅要检测学生的成就,同时也要关注课程内容的质量、学生活动的特征、课程形式的吸引力以及学习的多种结果,而不仅仅是一种结果。为了适应这一需要,泰勒提出了“教育评价”的概念并建构了系统的评价理论体系。泰勒的评价理论深受杜威的影响。杜威指出非传统测量方法的必要性,并特别强调在学生成长和学习过程中要进行测量。泰勒接受了这一观点,把测量作为一个过程来使用,作为一种方法用于课程的改进,评定课程的有价值的目标达成的程度。泰勒在《方案评价的理论基础》一文中指出:“当评价成为教育论述中常用的语词时,它的意义便扩大了,它不再常被用来比较教育处境的事实……”96为了帮助教育工作者将其关注的焦点从测验转到评价上来,泰勒于1934年开展了“八年研究”。一些后续的理论著作深受泰勒评价观念的影响,他们特别强调评价中要以基于目标的测量作为其方法论指导。目标取向的评价对于评价领域的巨大影响持续了几十年。20世纪60年代初,克龙巴赫(Cronbach)建议评价者们重新确定评价的概念——不是根据竞争的成绩,而是作为一个搜集和报告对课程研制有指导意义的信息过程,强调评价的诊断和反馈作用。他于1963年发表《通过评价改进课程》(CourseImprovementthroughEvaluation)一文,引导学界重视对课程与教学实施过程及其相关影响因素的评价,倡导有关评价的改进功能的观念发展。随着评价研究者的反思,教育评价的概念又发生了变化,即阐明评价的核心是价值判断。斯克瑞文(Scriven)是“第一个也是主要的对于价值判断理论做出全面而明确阐述的评价理论家”。斯克瑞文明确指出,评价者最大的失败,就是简单地为决策者提供信息而“将‘做出最后价值判断’的责任推卸给那些非专业人员”。同时,他提出的形成性评价和总结性评价概念成了当时新的旗帜。评价,而不仅仅是测验,开始盛行。总的说来,这一时期是教育评价概念的诞生和形成期。教育评价概念已超越了教育测量、测验的范围。教育评价的目的也由单纯的选择、认证,逐渐扩大到对课程、教学的关注。(三)教育评价的兴起—考评时期(assessmentera)然而,被20世纪30年代开始的课程改革运动激起的宽泛的教育评价概念却未能坚持和继续下去。20世纪80年代以来,在欧美文献中“考评(assessment)”出现的频密度越来越大,超越了“评价(evaluation)”成为使用最频繁的术语。正如艾斯纳(Eisner)指出,“虽然‘评价’一词在美国教育文献中出现的时间并不太久远,但作为较陈旧的词汇,它不再像一度出现过的那样流行。‘考评’一词正温和但却坚定地将它向前推进。”由于学能测验(SAT)成绩的下降,用人单位对教育质量的不满,以及美国的数学成绩在国际上排名落后,人们对原有的教育和评价体系产生了很大的不满。原有的评价概念也不能满足公众讨论实质问题的需要。人们开始探索走向卓越的新途径,意识到教育标准的提升靠的是提高学校的课程质量和处于中介地位的教学的质量。问题不在于决策而在于实践。决策相对来说更容易形成且通常更容易发布。实践却是一个涉及到大量教育工作者,涉及到经费和其他资源投入的事,不可能一蹴而就。好的教学和真实的课程不能靠命令,它们必须是“生长的”。在这一背景下,“考评”这一新术语应运而生,指的是和学习过程相伴的检测、判断、反思和改进的活动。考评需要与生活结成比个人成绩而言更丰富、复杂的联系。这里的个人成绩是指在纯客观背景下,使用不被人左右的纯粹工具测得的。模式需要变化,“考评”一词显示着这一倾向。什么是考评?按照维根斯(G.P.Wiggins)的解释,英文考评一词“assessment”的词根是拉丁动词“assidere”,意即作为评价者的教师“坐在考生旁边”,指的是通过建立师生之间密切的联系,通过师生之间和生生之间的互动来获取信息,分享和解释信息,相互促进共同提高的过程。目前为人们广泛接受的考评概念,即指广泛收集、综合分析并解释信息的过程。测验、评价是其中起作用的部分。测验是一个正式、系统地利用纸笔方式收集信息的过程;评价通常是在收集、综合考评的信息之后进行,即对学生表现的质量、价值或行动过程进行判断的过程。可见,相对于传统的评价概念,考评的概念范畴扩大了。考评包含了价值判断这一评价概念的核心,但是更加关注获得判断依据的过程,关注进行判断之后的反思和改进过程,关注考评过程与课程和教学的交互作用。正如研究者指出,“教育评价”的范式发生了转化,即从最开始的心理测量模型的旧范式转向了“考评是学习过程的一个完整的组成部分”的新范式。尽管心理学测验也可用来支持学习,但是现在研究者的关注点是考评是教和学的过程的一个重要组成部分。这一时期还出现了许多子概念,例如档案袋考评(portfolioassessment)、表现性考评(performanceassessment)、真实性考评(authenticassessment)、促进学习的考评(assessmentforlearning)等。这些子概念的出现旨在支持学习并提供关于学生的详细信息。二、课程与考评的关系以上分析表明,“教育评价”概念从等同于教育测量、测验,扩大到对课程、教学的关注,再到“考评是学习过程的一个完整的组成部分”,发生了很大的变化。那么造成教育评价概念变化的深层原因是什么呢?(一)教育评价对解决“教育问题”的作用从宏观层面来看,教育评价概念的变化是社会政治、经济、文化的力量共同推动造成的。在工业化时代前期和中期,即使是当时的发达国家中,社会需要的多数是非技能型的熟练劳动力。同时,由于教育资源有限,需要通过一定的手段来筛选人才,将那些知识基础和学习潜力比较好的人挑选出来,鼓励其继续深造,知识基础差的,则引导其早日就业。在美国,1910年只有10%的学生读完中学和3%的学生读完大学。这种受过教育的人,在分布上与劳动力的分布极其相似。因应这一需求,教育评价主要就是进行测验、甄别和筛选。随着社会的进步和经济的发展,现代国家急剧地缩小了无需技能的劳动力的比例。新增的职业主要集中在管理、服务、科学和工程等行业。这些职业大多需要中学或中学以上的教育水平,导致对教育的需要迅速增长。在发达国家,经济的发展和社会财富的积累也使可供利用的教育资源大大增加,从普及义务教育到普及高中教育,到目前的大多数青年人都能进入大学学习的现实,使得诊断和发现教学过程中的问题,保证每一名受教育者都得到充分和恰当的发展这一问题变得突出。人们希望教育评价不仅起到甄别和筛选的作用,还起到诊断问题和促进发展的作用。教育评价应该是提供有效的信息,指导教育计划和行动的过程,以帮助所有学生发挥他们的最大潜力并成为有用的人。与此同时,人们对民主和平等的追求也在不断发展,导致原有教育评价概念的基础动摇。具体表现在:支撑传统评价概念的智力测验有两个基本的假定,一是智商分数在儿童的一生中保持不变,二是智力测验是独立于文化的非口头测试。然而,研究者发现人的智商分数会有所变化,与社会环境的因素也密切相关。事实还表明,智力测验对于那些与测验设计者持有的主导文化一致的人更有利。在英国和美国,这就意味着对那些是白人、男性、中产阶级背景的人更有利。因此,通过智力测试来进行公平选择的说法受到了挑战,人们开始关注课程和教学,要求不管是课程的内容,还是考评的内容都要具有公平性,不应存在偏见,应该包容少数民族的文化知识。随着经济的全球化和国际竞争的进一步加剧,国与国之间的竞争更多地表现为人才和创造力的竞争,强化了各国对后备人才资源和教育质量的关注,许多国家都通过考评来检测和促进教育的发展和教育质量的提高。在美国、新西兰、澳大利亚和英国,政府将经济增长与教育表现联系在一起,并且使用考评来帮助决定课程,促进高“标准”的表现,鼓励学校之间的竞争。高科技产业的出现和经济活动中科技的份量的不断增大,要求劳动力市场提供更多的受过良好教育、富有进取心和开创精神、有创见且灵活的工作人员,以加强国家的技术基础。在全球化背景下,所有人都对核心国家的表现感兴趣。对表现指标和表现的国际比较的热情促使政府使用考评来驱动和控制其课程,同时还对教育成就的国际调查投入了大量资金。在社会经济、文化、政治的力量共同推动下,教育评价的概念发生了转变。(二)建构主义学习理论从微观层面来看,评价概念的变化是学习理论发展的必然要求。最早盛行的是行为主义学习理论。该理论对学习内容有两个基本假设:可分解性和非组织性。可分解性是指学习的内容可以分解为众多的基本因素,通过一系列的基本技能的反复训练,使学习者经由熟练进而发展综合能力。因而学习过程是直线式的循序渐进过程,重复是最重要的教学技巧。非组织性指学习内容是非组织的,各种技能一旦被掌握,即具有广泛的可迁移性。在这种观念指导下,标准化测验开始盛行。认知主义心理学的出现对标准化测验的理论基础和实践意义提出了质疑。从认知心理学的角度出发,新学习的知识必须纳入一个不断调整和完善的认知结构,形成概念图式,才能获得意义,进而被掌握。学习也因此摆脱了机械化的束缚。先前的基于条件反射的学习不能提供一种使人们能通过学习来掌握应付环境变化的模式,取得并利用新知识,以及形成和加强人与社会之间的新关系。教育评价领域也取得了共识。例如,泰勒指出,教育评价的最基本的假设与人们对学习者在学习中的角色的看法密切相关。学习应视为学习者发展自己的行为,以更好地适应环境、实现目标的过程。正如一幅漫画所示,某人悄悄地对另一人说,他控制了心理学家,因为每当他一压控制杆,心理学家就会给他食物。泰勒指出,这虽是幽默,却阐明了学习者设计方式控制其经历的环境,而非被动地对课本或测验的要求、惩罚作出反应的可能性。20世纪80年代初兴起了建构主义学习理论,这是继认知主义之后学习理论的又一场重要变革。建构主义学习理论将学习视为个人知识建构和意义建构的过程。学习并非只是简单地记录和解释信息。善于学习者往往具有良好的元认知策略。元认知的重要成分是学习者通过自我考评或自我评价来规划自己的学习。此外,建构主义学习理论描述了一个复杂、多样的学习过程,这就要求考评也要多样化,要对学生的学习和理解的质量、结构进行更深入地检测。总而言之,学习理论的发展越来越关注学生在学习过程中的各种能力的发展,这就要求教育评价在范围、深度上进行更广泛的测评。教育评价的概念也随之发生改变。三、问题和视角鉴往可以知今,溯其渊源才能察其流向。联系当今我国正在进行的教育评价改革,有必要澄清以下几个问题。(一)“assensmen”和“a如前所述,20世纪80年代以来,随着教育评价概念的扩大,随着形成性、过程性的考评越来越多地被应用到教育和其他领域之中,欧美文献中“assessment”出现的频密度越来越大,超越了“evaluation”成为使用最频繁的术语。英文“assess”、“assessment”和“evaluate”、“evaluation”的含义并不完全相等。新版牛津英语字典,“evaluate”的解释是:“formanideaoftheamount,number,orvalueof”即“得出关于…的数或量或价值的认识”。“assess”的解释是“evaluateorestimatethenature,ability,orqualityof”,即“对…的性质、能力和质量做出评定或估计”。可见“evaluate”中着重的是数、量和价值,“assess”着重的是性质、能力和质量。胡森等主编的《国际教育大百科全书》对“assessment(考评)”和“evaluation(评价)”作出区分,认为考评主要是测定学生学习过程中的表现和进步,针对的是学生,是人。评价则更多地指向人以外的事物或事件,如课程、项目、干预因素、教学方法和组织方式等等。为了反映“assessment”和“evaluation”在含义上的差异,港台的文献多用“评估”、“评量”与“assessment”相对应。但中文“估”字给人一种“约略”、“大概”的感觉,和“不太准确”、“较为粗糙”联系在一起,也没有全面“稽核、检查、推求和研究”的意思。“量”字容易给人与量化有关的联想,与“测量”、“量度”等交叉。在国内,“assessment”、“assess”,这一术语过去都被翻译成为“评价”,将其与英文“evaluation”、“evaluate”等同。混淆“assessment”和“evaluation”这两个术语在含义上的差异,在某种程度上导致了人们理解上的偏差,忽略了对被评价对象“性质、能力、质量”的全面检视而只关注数量和价值,更无法和师生间共同分享经历的情景联系起来。为了纠正“assessment”和“evaluation”这两个术语混用的情况,有必要为“assess”和“assessment”寻求一个更为恰当的翻译,于是我们选了“考评”这一术语。中文的“考”字涵义包括了:“稽核”609、“检查、推求、研究”,“评”字的涵义包括了“评议”731、“评论、批评、评判”。把“考”和“评”合起来作为一个词“考评”,可以理解为“通过稽核、检查、推求和研究来对事物进行评论、批评、评判”,这更接近“assess”或“assessment”的含义。“考评”一词不会有这些容易造成误解的联想,而且在中国,早已有“考问”、“考察”、“考课”等等说法,而新版《现代汉语词典》(第5版,2005年出版)已收“考评”一词,动词,考核评议。“考评”听起来也很顺当、很中国化,易为大家接受。使用“考评”这一术语是为了更为准确地反映“assess”或“assessment”所反映的评价理念,而不是为了要取代“评价”这一术语,也不可能取代“评价”。首先是因为我们的辨析只是针对教育领域,针对教学或学习而言,而“评价”这一术语的应用远超出教育教学的领域。其次,这两个术语在涵义上既有重复之处,也有不同的强调:当我们讲教学评价或学习评价的时候,强调的是对教学或学习进行价值判断;当我们讲教学考评或学习考评的时候,强调的是对教学或学习的性质、能力和质量进行检查、推求和研究。为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 印刷服务合同
- 手破碎机设备买卖合同
- 聘用出纳合同增加多场景
- 生产车间承包合同协议
- 机械工程劳务分包合同
- 河北化工医药职业技术学院《中学生物课堂教学技能训练》2023-2024学年第二学期期末试卷
- 广州华立科技职业学院《数据挖掘与决策管理》2023-2024学年第二学期期末试卷
- 宁波卫生职业技术学院《界面化学》2023-2024学年第二学期期末试卷
- 宜春学院《需求工程》2023-2024学年第二学期期末试卷
- 宿州职业技术学院《水质工程学实验》2023-2024学年第二学期期末试卷
- 家校共育之道
- 公司EHS知识竞赛题库附答案
- 社区健康促进工作计划
- 《作文中间技巧》课件
- 2025年度移动端SEO服务及用户体验优化合同
- 中小学《清明节活动方案》班会课件
- 广东省2025年中考物理仿真模拟卷(深圳)附答案
- 新苏教版一年级下册数学第1单元第3课时《8、7加几》作业
- 特殊教育学校2024-2025学年度第二学期教学工作计划
- 宁夏银川一中2025届高三上学期第五次月考数学试卷(含答案)
- 2024年物联网安装调试员(初级工)职业资格鉴定考试题库(含答案)
评论
0/150
提交评论