价值观目标及其评价_第1页
价值观目标及其评价_第2页
价值观目标及其评价_第3页
价值观目标及其评价_第4页
价值观目标及其评价_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 价值观目标及其评价一、价值观的特点及其决定性作用(一)价值观的特点1.主体性人们对成败、得失、善恶等判断的标准取决于主体自身的需要,按个体内心的某种尺度进行评价。任何价值观都只能是一定主体的价值观,一切信念、信仰和理想都只能是什么人的信念、信仰和理想。价值观的主体性通过主体特有的、个性的立场、态度、取向、志趣,特别是评价标准表现出来,往往带有较浓厚的主观性和情感化色彩。“物的价值因人而异,客体的价值依主体而定”,主体性体现了价值观的根本特性。2.稳定性价值观是人们思想认识的深层基础,随人们认知能力的发展逐步培养而成,且往往不易改变,并在人的兴趣、态度、目标、信念、理想和行为上表现出来。在条件

2、不变的情况下,对某个事物好坏的评价及所持有的看法基本不会发生改变,具有相对稳定性和持久性。如,林东是从贫困家庭中长大的孩子,受父母教育观念的影响,他认为向别人借东西或寻求帮助是很伤自尊的事情。因此,在其求学期间,即使再困难他也不愿向他人请求帮忙,总是自己咬紧牙关挺着。如果教师没有让他在这个方面有另一层面的思考,改变这种过于偏激的看法,他会把这种看法一直稳定地延续下去,不会有丝毫改变。3.超知识性所谓超知识性,是指价值观的存在和作用往往在已有知识的范围以外,不是知识所能包含或代替的。构成价值观的信念、信仰、理想等不同于知识、理论和科学,二者有交叉关系,但不重合。人类的知识系统表明人们“知道什么,

3、懂得什么”,而价值观系统则表明人们究竟“相信什么,想要什么”。价值观指导人们在已有知识的基础上,按照人们自己的尺度进行价值选择、定位、定向并采取行动。一般来说,“知道什么”并不等于“就要什么”。4.社会历史性在不同历史时代、不同社会生活环境中,人们的价值观是不同的。在进行价值观评价时,特别要看到教师与学生之间由于生活时代的差异、学生与学生之间由于具体成长环境的不同而可能存在的价值观的差异。同时,太多的教育案例也告诉我们,不同价值观带来的判断与事实真相会有多大的偏离。(二)价值观的决定性作用价值观是非常复杂的心理现象,是一个多维度、多层次的观念系统。它与需要、欲求、兴趣、态度、理想、信仰等有着密

4、切的关系,往往很难对它们作出严格的区分。或许我们可以把这些心理现象都看作是价值观的不同表现形式,只是价值观远比需要、兴趣、态度等概括化程度更高、更广。它不仅是态度的决定因素,也是自我观念和行为的决定因素,在人格中居于核心地位,是整个人格的决定性因素。因此,价值观对个人的行为具有导向作用,支配着人们如何表达自己的情感、态度并左右自己的行为,在宏观上决定了个体是一个什么样的人,会采用什么样的学习和生存方式。二、价值观的评价目标价值观是一个相对宽泛而抽象的概念,在课堂学习过程中对学生的价值观进行评价并非易事。一方面,价值观涵盖领域广,评价目标较难具体化,需要对外显行为进行合理性推断;另一方面,价值观

5、形成或改变所需时间长,影响范围广,不易改变,较难找到有效的改善方法。目前,国内外对价值观评价目标的详细介绍寥寥无几。在课堂教学中,对学生价值观方面的评价,我们认为可以从以下几个方面予以考虑。(一)对知识价值的看法随着科学技术的快速发展,人类进入了知识爆炸时代,学生所面临的学习量越来越大。所学的知识内容与实际生活是否相关、是否具有现实价值和意义,影响着学生对所学知识价值的认识。如果我们的学生费尽心思学到的是些与现实不相干的纯理性化、理想性的东西,在现实中根本找不到它们的价值所在,学生就很有可能形成知识无用的观念。这种观念一旦形成,不仅威胁到切实的教学有效性,更会影响到日后相关的学习活动。因而,了

6、解学生如何看待所学知识的价值具有切实的意义。(二)对学习活动目标的认识目前,很多学生处于为学习而学习的状态之下,对学习活动的目的缺乏明确的意识,或者有的学生对学习活动目标的意义模糊不清,意识混沌。了解学生对学习活动目的的认识情况,可有效改善学生的学习观念,影响相应的学习态度。教师在制定明确学习活动目的的同时,也必须了解学生对该学习目的的认识状况,这样才能真正有效地达成目标。(三)对学业要求的认同目前许多学者的调查结果都显示,当前学生的学业压力非常大,许多学生对学习活动不是向往,而是厌倦和惧怕。其中很重要的一个原因是教师或父母对学生的学业要求过高、过严,抱有太高的期望值,而往往没有考虑学生的本身

7、的情况,特别是他们对自己学业的要求是否与教师、父母认定的要求相同。学生对教师、父母所认定的要求不认同,或者认为不合适、不必要,或者认为根本就不可能达到,这些都会直接影响到他的学习动力、学习行为和学习的实际成效。(四)对培养自我学习能力意义的理解社会越进步,竞争的压力越大,就越需要个体持续不断地进行学习,直到终身学习。这就有必要提升学生的自我学习能力,让他们学会自我管理、自我规划和自我调节。学生对自我学习意义的理解往往决定了其是否愿意进行这方面有意、无意的训练,培养自身主动、独立学习的能力,形成自主学习的习惯,从而对个体的学习行为产生实质性影响。(五)对外在世界的看法无论多小的学生,都生活在社会

8、化的大环境中,也都有自己眼中独特的世界。他们会接触各类媒体、传播网络,接触各类不同品性、生活方式的其他人,从而会形成自己对外在世界的独到看法和稳定的内在观念。外在世界不论积极与否,都会经渗透而影响到学生对学业、自我、人生价值目标的态度,左右他在成长道路上的方方面面。要了解学生的价值观状况,就有必要了解学生对外在世界的真实想法,从而能更好、更有针对性地改善学生的实际情况。三、价值观的评价方法及实施中小学学生的价值观尚未成形,处于懵懂阶段,因此涉及价值观评价的方面不及情感、态度评价那样突出和明显。但正因为如此,教师才更有必要了解、评价学生的价值观,使价值观方面可能存在偏颇的学生尽早转入正轨,从而引

9、导学生逐步形成正确的价值观。因此,对学生价值观的引导、评价是一个不可缺失的环节。关于价值观的评价方法种类繁多,如阿尔波特(Allport)、弗农(Vernon)、林赛(Lindzey)等人在价值观研究中提出的六种理想价值类型,莫里斯(Morris)在“生活方式问卷”中归结出的十三种生活方式等,只是由于这些方法主要适用于大学生甚至成人,对价值观尚未形成的中小学生而言较难理解也不太现实,因而在此就不多加评论。在以下的论述中,我们将就可应用于中小学课堂或学习过程中的一些价值观评价方法予以介绍,以供参考。(一)谈话法对教师而言,谈话法是较为容易而又能有效获得学生价值观方面信息的方法。该方法适用于揭示个

10、体的价值取向及其强度。其中,中小学生的道德价值取向是研究者关注的焦点。我们可以选定时机与被试直接谈话,告诉被试一个完整的有关好人好事的道德故事,然后提问:“张明做了一件好事,是吗?如果是,为什么?如果不是,那他应该怎样做才是对的呢?”研究者应注意观察被试的反应情况及其陈述的理由。另外,我们也可以告诉被试一些不完全的道德事件,然后要求他们补充完整,并告知我们故事中的人物将会怎么做,同时给出理由。以上的提问方式能够揭示个体的价值取向,但通常不能揭示其强度。为评定价值取向的强度问题,研究者应向被试提出一系列反映道德事件可能产生严重不良后果的问题,要求被试回答在每个问题所提的条件内该怎样去做,从而更深

11、层次地了解学生的道德价值取向。(二)专题作业考核法专题小论文就学生经常看到或听到的有关价值观方面的一些有争议性问题,让他们自由选择一项作为题目,写出自己对该问题的看法及相应理由。应用此方法,重点要考查的不是学生对论文写作格式的掌握情况或写作水平,而是从论文内容中了解学生对待该类事情的观点及思维模式,把握学生的价值倾向。例1请根据你自己的理解,任选以下一个内容加以论述,题目自拟,注意在表明自己观点的同时,需要讲明支持自己这种观点的理由。(1)中学生是否应该有上网的自由?(2)女孩的发展前景一定比男孩的差吗?(3)按自主计划学习好,还是跟着老师的教学步子好?除利用专题论述以外,还可用类似阅读理解的

12、方式,让学生在答问中不经意地表述出自己的观点,从而显露出相应的价值取向。例2请仔细看完以下短文后,回答问题。医学科学家大多数都认为吸烟有损吸烟者和那些有规律地被动吸烟的人的健康,有些城市已经通过了禁止在所有公共建筑物内吸烟的法规,还有些人反对这一法规,因为他们认为禁烟违反了个体吸烟者选择的自由。(1)请说明你同意还是不同意内的内容?(2)请说出你的理由支持自己的观点。专题演说专题演说是指让学生就某一特定问题或现象经思考准备后,作出口头表述并发表自己的见解。专题可由教师设定,如,要学生评价“历史学习就是贝多芬,背多分,背了就多分,不需要考虑其他”“成由勤俭,败由奢”等问题,学生也可根据自己的兴趣

13、自由选择演说题目,还可由教师给出相关资料,让学生进行课堂内的讨论和评价。例请根据以下材料,发表自己的看法,可自由阐述理由,准备时间5分钟。只要考第一西西是六年级的学生,聪明活泼,学习认真刻苦,爸爸妈妈都以他为骄傲,其他同学更是佩服他那股用功的劲儿。每每有人问他:“你为什么要那样认真地读书啊?”他都会毫不犹豫地回答:“只要我考第一名,爸爸妈妈就会带我到我想去的地方旅行,我想多考几次第一,走遍我想去的每一个美丽的地方。”说完,他还会美滋滋地憧憬下一个想去的地方。你认为西西的这种想法如何?你赞同他的看法吗?根据以上材料,可以让学生先就资料中主人公的做法发表各自的看法,自由讨论后发表演说,然后可以让他

14、们谈谈自己努力学习的目的与资料中的西西是否相似,就他们努力学习的目的是什么等一系列问题进一步演说。专题演说可以在一定程度上显露出学生在某方面的价值取向,只是有的学生不善言谈,保持沉默,这就较难确定他们的想法,而且在演说过程中,学生很容易言辞激烈,以致夸张或歪曲了自己的真实立场。(三)量表测验法1罗克齐(Rokeach)的“价值观调查表”罗克齐认为,价值观是一种比较持久的信念,这种信念涉及个体的具体行为和目标状态,具有动机功能,不仅是评价性的,也是规范性和禁止性的,对行为和态度具有指导作用。罗克齐把价值观分为工具性价值观和终极性价值观,并于1973年编制出价值观调查表,用来测量工具性价值观和终极

15、性价值观中各种因素的相对强度。在罗克齐的价值观调查表中,工具性价值观有十八种,包括志向、思路开阔、有逻辑性、自我控制、富于想象、有责任感、有礼貌、有知识、能干、欢悦、诚实、宽恕、助人、独立、顺从、干净、鼓励、爱等;终极性价值观也有十八种,包括世界和平、美的世界、国家安全、社会认可、宗教信仰、刺激性的人生、满意的生活、家庭安康、成就感、平等、自由、自尊、愉快、成熟的爱、内在的和谐、快意、智慧、真正的友谊等。(马立骥:心理评估学,215页,合肥,安徽大学出版社,2004。)西南师范大学心理学系黄希庭等人利用罗克齐价值观调查表编制出关于青年的价值观评定量表、青少年自我价值感量表等,有较好的评价效果。

16、2.价值观的等级量表法上海师范大学李伯黍、岑国桢等人在研究学校德育模式时,按照青少年学生价值观形成的一般过程,提出了价值观的等级量表法,也就是利用一个价值观等级量尺来了解学生对某一道德问题的具体价值观念。具体做法是:先由教师或学生一起确定一个道德问题,然后,教师在黑板上画一直线,确定该问题的两个极端意见;接着,教师请每个同学表明自己的观点大概处于直线上的什么位臵,并简要说明理由,以此推断学生的价值观水平。为避免学生由于同伴压力,担心与别人不同而倾向于和他人保持一致的情况发生,教师可以要求学生在纸上写下自己的答案,然后由教师随机抽取答案,填在黑板上的长线上,以了解学生对某类问题的看法。例教师:在

17、今天的主题班会上,让我们一起来思考“人生的价值是什么”这个问题。对每个人来说,这个问题都是至关重要的。大家都知道,由于各人所经历的社会环境条件不同,每个人对人生价值的看法和信念也就有异。例如,有人的人生态度是事事为大众,专门利人;有人则事不关己,高高挂起;有人积极乐观,开拓进取;有人则消极沉沦,自暴自弃。有人认为人生在世,贵在奉献;有人则认为人生道路上,潇洒走一回才不虚此行。有人将人生视作舞台,逢场作戏,或对酒当歌,徒叹人生几何。将这些概括起来就是,人生的目的和价值是什么?人生的意义何在?人应该怎样对待生活?这些都是我们在生活过程中必须回答的问题。你的人生信念是哪一种呢?教师可以在黑板上半部写

18、下“我的人生信念”这个标题,在标题下面画出下图。(四)自编问卷问卷可分为开放式问卷、封闭式问卷以及开放式与封闭式相结合的问卷。实践表明,封闭式和开放式相结合的问卷效果最佳。就价值观评价而言,在封闭式问卷中要求被试对价值选项作出选择,以往的研究方法主要有等级排列法、迫选法、对偶比较法和评定量表法。当前,价值取向问卷的编制最常见的形式有取舍法和等级量表法。1.取舍法这是一种非此即彼的评定形式。每一个句子的左边均列有同意和不同意两个选项,如果同意该命题,就在同意上画圈,否则,在不同意上画圈。同意不同意遇到品德上的问题,最好是去找老师解决。同意不同意男孩应该多帮助女孩,承担更多的责任。2.等级量表法此

19、方法类似于利克特量表的五点量表形式,要求被试对测验项目从非常同意到非常不同意之间的不同价值取向程度中作出合适的程度选择。例在以下每一句左边的空栏里,填上最能表达你观点的字母。A十分同意B有点儿同意C不知道或不敢肯定D有点儿不同意E非常不同意当你遵守纪律时,你觉得自己有点儿迂腐。对他人太和善,就代表了自己很容易被别人欺负。我们永远的苦恼之一是,父母的要求永远高于我们自己的实际水平。我们的学习应该按我们自己的规划进行。此外,利用一些开放式问卷,直接要求学生回答诸如“你的人生目标是什么”“你想做一个什么样的人”等问题,并要求说明相应理由。修订或编制问卷是一项非常复杂的专业性工作,因而在问卷编制过程中

20、要尽量完善地考虑相关问题。一份问卷,从开始设计(或修订引进国外的问卷)到收集资料、得出结果,其间需经过许多步骤。从研究设计的角度来讲,每一个步骤都有一定的要求,并都有可能产生误差。但是,只要我们了解了误差的来源和设计的要求,就有可能将误差降到最低限度。(五)文献分析法(黄希庭、张进辅、李红:当代中国青年价值观与教育,2122页,成都,四川教育出版社,1994。)文献分析法就是利用书面材料的信息来研究价值观的一种方法。文献的范围很广,包括小说、日记、散文、信件、会议记录等。如,文崇一在中国人的价值观中用论语孟子孝经礼记等古籍文献对中国人的价值观进行了描述。据文崇一的分析,论语里“仁”的价值观大概

21、可归纳为以下几点。(1)节制自己,遵从社会规范。如克己复礼,非礼勿视、勿听、勿言、勿动。(2)处处替别人着想。如己所不欲,勿施于人;己欲立而立人,己欲达而达人。(3)用谦和的态度去建立人际关系。如爱人、恭敬、宽大、诚实、敏慧、刚毅等。(4)要勇于实践。如为仁由己,而由人乎哉?我欲仁斯仁至交。内容分析(contentanalysis)是文献分析法的一种特殊类型。文献分析法通常是描述性的,内容分析就是将非数量化的文献转换成用数量表示的资料。在使用这种方法时,研究者首先要确立一套可用于分析文献的相互排斥且穷尽无遗的类别,然后将文献中可以观察到的这些类别的每一类的频数记录下来。这些类别的设计是多种多样

22、的,但类别并非凭空确定,也不是依理论而定,而是通过仔细考察,将要研究的文献根据它们所包含的共同因素予以确定。学业自我的含义及结构(一)学业自我的含义学业自我概念是由自我概念(self-concept)研究的细化而得来的。自我概念是一个人关于自己的观点和看法,是对自我的各方面特点的主观知觉、判断或评价。具体而言,自我概念是指个体通过自我观察、分析外部活动及情境、社会比较和他人的反馈等多种途径形成的对自身生理状况(如外表)、心理特征(如特长、能力)、社会属性等方面的态度、情感和知识的比较稳定的认识,即个体把自己当成像其他事物一样的客观对象所作出的知觉。它具有两个特点:一是他人取向(即受他人影响,在

23、与他人的互动、别人的评价中逐渐形成的自己对自己的看法);二是自我建构(即以个人主观的意识、认知水准以及人生经验为出发点与外界进行互动)。对学业自我的研究有一个过程,随着对自我概念研究的深入,1976年,莎沃森(Shavelson)将一般自我概念划分为学业自我概念和非学业自我概念;1984年,桑(Song)和哈蒂(Hattie)发展了自我概念等级模型,将学业自我概念分成能力、成就和班级三个方面。至此,学业自我概念(academicalself-concept)成为自我概念的重要成分之一。同自我概念相对应,学业自我概念是指学生把自己当做客体,对自己学业方面的主观认识。它包括对自己的学业现状、学习能

24、力与潜能、学习态度、学习兴趣、学习动机、学习方法、归因态度、情感和价值等方面作出的整体的认识与评价。学业自我概念形成于个体的学习过程,并贯穿于终身的学习过程,决定着个体对学习经验的解释、学习经验对个体的意义以及个体对自己在学业上的期望。它不仅能为个体提供自我认同感和连续感、维持有意义的学习行为,从而直接或间接地影响一个人对自己在学业上的态度体验和采取的种种学习行为表现,而且能使个体在面临重要学习任务时能够进行自我调节。(二)学业自我的结构对学业自我结构的划分,目前主要有莎沃森模型、桑一哈蒂(Song-Hattie)模型和马什一莎沃森(Marsh-Shavelson)模型三种。1.莎沃森模型莎沃

25、森等认为自我概念是多种因素的复杂组合,提出了多维度的自我概念结构模型。他们认为个体自我概念因个人经验与互动对象而分化。由于学校生活是每个人青少年时期非常重要的经验来源,学习又是该阶段的生活中心,因此,该模型将自我概念从一般自我概念分解为学业与非学业自我概念,学业自我概念依学科细分为语文、数学自我概念(如图6-1)。(孟晋、张进辅:国外学业自我概念研究进展,载西华师范大学学报(哲学社会科学版),2003(6)。)该模型不仅首次将自我概念进行多层次划分,而且也是首次将学业自我概念从自我概念中分化出来。这个观点得到了研究者的广泛重视,其后的自我概念结构划分都是对该模型的扩展和修正。2.桑哈蒂模型桑与

26、哈蒂对莎沃森模型进行了修正,提出了学业自我概念等级模型。该模型从另一个角度将学业自我概念分为三个方面:能力自我概念、成就自我概念和班级自我概念。其中,能力和成就自我概念进一步细分为数学、语文、社会研究和自然科学四个具体领域(如图6-2)。(孟晋、张进辅:国外学业自我概念研究进展,载西华师范大学学报(哲学社会科学版),2003(6)。)3.马什莎沃森模型马什(Marsh)和莎沃森对莎沃森模型提出了修正。该模型把学业自我概念分为数学和语文自我概念两个大的方面,各种具体学科领域自我概念又分别递属于两者。同时,各种具体学科的自我概念又根据学科的具体内容被进一步划分,比如数学自我概念包括代数、几何和微积

27、分等;语文自我概念包括文学、写作和语法等。需要指出的是,该模型还提出了学校自我概念。学校自我概念不仅包括了语文和数学自我概念的一些内容,还包括了学校的社会性因素(如同伴关系、课余活动等)和其他非核心课程(美术、音乐、体育等)。対具体情境下的行習轴评价-哈蒂的学业自我概自我概念学我念数自概理我念物自概、莎沃森等的I学业自自我概念物我念生自概尹K,:7图我理我念地自概E贸我念经自概臼宵课堂教学评价结果的解释目前关于课堂教学评价结果解释类型的划分几乎没有专门的研究。但就课堂教学评价结果的解释来说,在实际应用中常习惯性地将测验分为传统的标准化测验和非标准化测验,非标准化测验即是前面章节提到的替代性评价

28、测验。因此,在这里照应前面章节,对课堂教学评价结果的解释就从标准化测验和替代性评价测验的角度进行阐述。一、课堂教学中标准化测验结果的解释在课堂教学中,目前已经出现了一些非标准化的测验方式替代性评价测验,但标准化测验仍然是主要的测验方式,应用仍然十分广泛。因此,仍有必要在这里对课堂教学评价中标准化测验结果的解释进行介绍。(一)标准化测验和标准化测验结果解释的概念标准化测验是指对一个既定小组内的所有成员在相同条件下以相同方式进行的考试。(美G.D.Borich&M.L.Tombari:中小学教育评价,242页,北京,中国轻工业出版社,2004。)具体到课堂教学,就是在相同条件下,以相同的题目同时对

29、所有学生进行测试,并以同一标准对学生在测试中的反应作出评估的测验。可以看出,“标准化”强调整个测验过程内在的“一致性”,是个理想化的概念,事实上做到完全的一致是不可能的,如,每个学生的主观状态在测验时就不一样。但在实际的测验中,在排除无关条件的情况下,测验的各种因素是接近一致的,同时这种假定的一致性也为对标准化测验结果解释时进行内部、外部比较提供了基础。下面就阐述什么是标准化测验结果的解释。对标准化测验评估时,一般是依据统一的标准对学生的反应进行评估,最后得到一个分数,通常叫原始分数。一般来说,原始分数所能反映出的信息很少,要深入、全面地了解所测量的学生的实际情况,就要对这个“分数”进一步进行

30、阐释。因此,对标准化测验所得到的原始分数进行阐释的过程就是标准化测验结果的解释。(二)标准化测验与常模常模经常用于社会心理学领域,对其含义界定的说法很多。社会心理学研究者在使用“常模”一词的时候,指的是统管小组成员行为的一组标准行为。(美G.D.Borich&M.L.Tombari:中小学教育评价,241页、242页,北京,中国轻工业出版社,2004。)在课堂教学评价领域,可以界定为作为样本的小组成员在所要测量的特质上的标准的反应或行为。也就是说,常模代表的是在某一个环境下所应该作出的反应,是评价其他对象在同样环境下的表现时所依据的标准。如,在参加学校组织的大型活动时,学校规定应该穿什么衣服、

31、坐在什么位臵、说普通话还是方言等,就可以看作是评价参加活动人员行为的常模。前面阐述过,标准化测验突出的特点就是强调一致性,这就为参照常模来解释标准化测验提供了理论上的可能。事实上,标准化测验通常都是参照常模来进行解释的。虽然并不是所有参照常模进行解释的测验都是标准化测验,但大多数标准化测验都是常模参照型的(美查尔斯杰克逊:了解心理测验过程,64页,北京,北京大学出版社,2000。),有人甚至认为所有的标准化测验都是常模参照测验(美G.D.Borich&M.L.Tombari:中小学教育评价,241页、242页,北京,中国轻工业出版社,2004。)参照常模解释结果的测验。传统的课堂教学评价测验中

32、都含有标准化测验的精神,在对测验结果解释时,一般来说也都是参照常模来进行的,所以这里就重点从参照常模解释的角度对标准化测验结果的解释作出阐述。(三)标准化测验结果解释的方式目前,标准化测验的结果一般来说仍然是一个分数,就是前面所说的原始分数。对测验分数进行解释时,常模不同,对分数的含义所作的阐述也就不同。常见的对标准化测验分数的解释有以下几种。1.以平均成绩为常模的解释这是实际的课堂教学评价中最常见的解释方式。在实际的课堂教学评价中,在对原始分数进行解释时,教师常常将单个学生的测验结果与团体的平均表现进行比较来解释,即把所有参与考试学生的平均分数作为常模,将单个学生的考试分数与总体平均分数加以

33、比较,再对每个学生考试分数的含义进行阐述。如下例。口语测验中,某学生得了92分,从这个原始分数我们并不能看出什么意义,因为我们不知道其他学生的成绩怎样,没有参照标准,就不能说92分是个很高的成绩。如果现在知道了这次口语测验的班级平均成绩为80分,那么教师就可以作出这样的解释:该生的成绩在平均分之上。也就是说该生的口语水平在班级里应该是中等以上水平。到目前为止,以整体平均成绩为常模对测验结果进行解释的方法仍常用于学业成就的评价测验,但教师可以在实际中尝试着运用其他方面的评价测验。2.百分位(1)百分位及百分位对测验结果的解释。在现实生活中,当学生向家长汇报测验成绩时,家长常常会问“有多少学生比你

34、考得好(差)?”这就用到了另一种测验结果的解释百分位,又叫百分等级,即一种相对位臵量数。通俗地讲,百分位就是被试测验分数在团体中所占的位臵,百分位数越大,位臵就越高,说明被试的水平就越好。应用到标准化课堂教学评价测验中,就某一个学生来说,百分位数能反映出在一次测验中有多大比例学生的成绩比该生差(好)。如下例。在一次问题解决能力测验中,50名学生中有40人的测验成绩低于45分,占全部人数的80,因此,45这个分数就可称为处于第80百分位的分数。凡是原始分数为45者,其百分位数就是80。如果有学生得了45分,则有80的学生在这次测验中的成绩比该生差。在实际应用中,教师可以为了方便,使用自己编制的百

35、分位分数常模,如每年固定的学绩测验中,就可以编制百分位分数常模。百分位分数常模使用起来十分方便,对照常模表,马上就可以确定学生成绩所对应的百分位。具体制定百分位分数常模的方法、过程可以参考有关教育、心理测量书籍。表71(美查尔斯杰克逊:了解心理测验过程,66页,北京,北京大学出版社,2000。)是一个学龄儿童百分位分数的假设样本(常模),从表中可以很容易地看出与某一原始分数相对应的百分位分数。表71百分位分数表(假设的范例)百分位DD原始分数(男孩)DD原始分数(女孩)DD原始分数(总体)99DDDDDD63分以上DDDD66分以上DDD73分以上DDDDDD95DDDDDD5862分DDDD

36、6065分DDDD6269分DDDDDD90DDDDDD85DDDDDD80DDDDDDDDDDDDDDDDDDDDDDDD15分或5分以下分或8分以下10分或10分以下8(2)几个特殊的百分位。百分位数是连续的相对位臵量数。在应用中,有几个特殊的百分位数常常被用到,下面就对这几个特殊的百分位数进行逐一介绍。中数。中数就是在百分等级中处于中间点的百分位,即第50百分位。处于这个位臵的成员,有一半的人分数比他差。在课堂教学评价结果的解释中,中数很少单独使用,也很少用来对某个学生的测验结果进行解释,一般是和四分位数一起用于描述整个测验成绩的分布。下面就介绍四分位数。四分位数。第25百分位和第75百

37、分位称为四分位数。四分位数的中间范围是第25百分点与第75百分点之间的原始分之差异,常常与中数一起用于测量分数的分布。如果中数所对应分数较高,四分位数之间段所对应的分数也普遍较高而且分布比较均匀,那么就说明这次测验学生整体成绩较好。如一次测验中的中数及四分位数之间段所对应的分数比历年同期同样测验所对应的分数高,那么就说明这次学生整体考得比较好。(3)百分位的使用范围。在课堂教学评价结果的解释中,百分位对单个学生成绩的解释意义并不十分大,但在需要对整体测验成绩作简单的描述时常常可以用到。另外,百分位在描述整体分数分布时有广泛的使用范围,不仅能用于学业测验,还可以用于非学业成就测验中问题解决的评价

38、测验、情感态度评价测验等。(4)百分位的优缺点。优点。第一,计算简便,常模的制定不难,使用起来非常方便,对照常模表马上就可以查到学生的百分位。第二,对原始分数的分布要求不高。即使学生的成绩不是按照正态分布,也可以用百分位进行解释。缺点。第一,不容易作进一步的统计分析。要在百分位基础上对总体成绩作进一步的分析、整理和描述很不容易,因为百分位不能用于四则运算。第二,用百分位解释原始分数时,只是给出了某一分数水平在总体中的位臵,并未给出关于分数的实际差异信息,如第70百分位和第80百分位的学生实际分数差异是多少,在百分位分数常模表中很难看出。第三,从统计学上来讲,用百分位解释原始分数,实际上是低估了

39、总体分数中两极分数的差异而高估了中间段分数的差异,就是说第95、98百分位和第55、58百分位之间同样都是差3个百分位,但前者之间所对应的分数差异比后者所对应的分数差异大。标准分数(1)一般标准分数。标准分数是以测验分数的平均数为参照点、以标准差为单位来衡量各原始分数在其常模团体中位臵高低的一种评定量表(丁秀峰:心理测量学,126页,开封,河南大学出版社,2001。),又常被叫做Z分数。在课堂教学评价结果的解释中,Z分数的意义有以下几点:第一,由于标准分数是以0平均数为参照点,教师根据Z分数的正负就可以判断某一原始分数在总体分数中的大致位臵,正值说明在平均数之上,负值在平均数之下;第二,可以通

40、过Z分数来比较两个以上的测验分数。假如某学生语文成绩为92分,数学成绩为85分,教师不能说该学生的语文就比数学学得好,因为有可能语文试题简单,整体分数都偏高。但通过Z分数,教师就可以直接用两个Z分数值来进行比较,Z分数高者,在总体成绩中的位臵就高,可以说学得更好些。Z分数应用广泛,教师可以尝试在学业成就、情感、态度各个方面的评价测验中使用Z分数。具体使用时可以参考有关的测量书籍。(2)转换的标准分数。在实际使用Z分数时,因为会有小数或负数出现,常常显得很不方便,为了避免负数和小数,就制订了许多其他的标准分数标准分数系统。常见的有T分数、离差智商、标准九等。就课堂教学评价来讲,离差智商的用处不大

41、,本章就不再介绍,这里主要阐述T分数和标准九在课堂教学评价中的应用。T分数。T分数最初由麦克尔(Michael)于1922年为纪念推孟和桑代克而提出,表达式可写为T=a+bZ,其中的Z即是上述的方法所计算出的可能会有小数点或负数出现的标准分数。在课堂教学评价结果的解释中,T分数除了具有Z分数的一般功能外,主要优点是避免了负数和小数点,更加直观方便。如直接比较T分数的大小,就可以确定相应原始分数在总体分数中的位臵,十分明了。T分数最初是被用于12岁儿童心理测验的常模团体,现在已经广泛用于其他常模团体,这里作一个简单介绍,具体原理可以参见教育、心理测量类书籍。在课堂教学评价结果解释方面,教师可以尝

42、试运用于情感、态度、学业自我等各个方面。标准九。标准九意思是说标准化九级分制。最初由美国选拔飞行员所用,分数从1到9,将整体分为九段,是标准分数系统中的一种。标准九在课堂教学评价中的应用与T分数相似,避免了小数和分数,可以用于对分数的整体情况的解释。它的独特之处就是提供了一个一位数的分数系统,简单明了,使用起来也很方便。标准九原理也与T分数相似,最初用于选拔。课堂教学中,教师可以尝试用于各种测验结果的解释。另外,有分数解释中提到标准十,其原理、用途与标准九相似。(3)标准分数与百分位的综合使用。如上所述,在解释标准化测验结果时,标准分数更适合于对分数整体作出解释,百分位则更适于对单一分数的解释

43、。因此,在具体使用过程中教师可以将二者结合起来,列出对照表(如表72)。(丁秀峰:心理测量学,132页,开封,河南大学出版社,2001。)表72标准十与百分等级范围对应表标准十分109876543百分999485705132178等100989384695031163712的标准分数和某一分数段所占的人数比例,既可以用于整体分数的描述,也可以用于单一成绩的解释,使用起来非常方便。当然,在具体使用时,教师完全可以依据需要制订百分位与标准分的对照表,并附上原始分数。具体的制订可以参见教育、心理测量书籍,这里不再赘述。(4)标准分数的优缺点。优点。第一,标准分数的差异与原始分的差异成比例,所以依据标

44、准分数可以描述原始分数的整体情况。而且,经过转换后的标准分数往往更加直观、明了,使用起来也更方便。第二,因为标准分数是等距的,可以用来作四则运算,在对分数作进一步的统计处理时,得出的结果和原始分数一致,而且标准分数更方便,很适合对数据作一些深层的处理。如用来计算平均数或相关系数等。缺点。第一,因为牵涉到统计知识,对于非专业人员理解上会有困难。对于非专业人员来说,没有一定程度的统计学原理知识,理解标准分数很困难,这也是在课堂教学评价中不常用标准分数直接向学生、家长等反馈的原因。第二,如果原始分数不是正态分布,不宜使用标准分数。如前所述,使用标准分数的一个前提就是原始分数要呈正态分布,这是标准分数

45、使用的必要条件,所以,尽管标准分数有不少优点,但如果不满足分数呈正态分布这一条件,也不宜使用标准分数。其他分数系统除了上面所述的几种参照常模的解释方法外,还有几种常用于解释学业评价测验(或分数)的方法。年级当量。年级当量是把学生的测验成绩与各年级学生的平均成绩比较,看它相当于几年级的水平。这里所说的各年级学生的平均成绩事实上指的是“年级常模”各年级学生在测验中所得分数的平均数和分数的分布情况。也就是说,首先制订某学科学业成绩在各个年级上的常模,然后将学生在该学科上的测验成绩与年级常模比较,如果达到了某年级常模的平均成绩,就说明学生具有相当于这一年级的学业水平,也就确定了年级当量。如下面的例子。

46、对一个学生进行语文测验,其得分与常模上三年级的平均分数相同,那么,他在语文测验上的年级当量就是3。从上例可以看出,年级当量也是参照常模解释的测验分数,常用于解释学业测验,使用起来十分方便。但与其他参照常模的解释不同的是,年级当量一般只用于解释同一学科的测验,而且只有当几个年级同时开设某门课程,课程内容的广度和深度是有系统地发生改变时,才适宜用年级当量来解释被试的测验分数。不同学科之间是不能用年级当量来解释测验分数的。教师在使用时需要注意这一点。(2)教育年龄。教育年龄(educationalage)是模仿智力年龄提出的,是指某年龄学生的平均教育成就。与年级当量类似,拿一个学生的教育年龄与常模相

47、比较,就可以确定一个学生的教育年龄。另外,教育年龄并不涉及实际年龄,这可以用下面的例子来说明。一个学生的教育年龄是9岁,就是说这个学生的教育成就与一般9岁儿童的教育成就相等,与他本身的实际年龄无关。在学业成就课堂教学评价结果的解释中,还常用到学科教育年龄。学科教育年龄即按学科类别将教育年龄划分为语文年龄、数学年龄等,具体可以理解为对某一学科,用标准化测验对同年龄学生团体施测后所得的平均成绩。教师在使用时可以灵活掌握。(四)对标准化测验结果进行解释时需要注意的问题选用恰当的常模多数对标准化测验结果的解释都是参照常模的解释,选取或制订的常模不同,对测验分数的解释会有很大不同,如,用优秀学生常模来解

48、释差生问题解决能力的测验结果就肯定不行,所以选取适当的常模非常重要。在选取或制订常模时,一般来说常模团体的代表性越强越好,容量大的更好。教师在选取或自己制订时一定要注意这两点,否则会出现较大的误差。考虑测验本身的信度和效度在对测验结果进行解释时,除了整个解释的过程要尽量科学严密外,还要考虑一下测验本身的信度、效度。因为如果测验本身存在问题,即使测验结果的解释非常客观科学,也会有误差出现。所以,教师在对测验结果进行解释时,尤其是觉得有较大问题时,要适当考虑一下测验本身的信度和效度。从发展的角度考虑测验结果的解释一般来说,标准化测验的结果都是一个分数,因为是参照常模解释,从某种意义上说,分数对学生

49、是一种终结性的评定。而对于学生的发展进步情况以及努力情况却不容易反映出来,但这些对于学生以后的进步却是很重要的。所以,教师在对标准化测验结果进行解释时,要尽量去平衡这些不足,全面考虑,选择恰当的用语,从发展的角度去解释测验分数。二、课堂教学中替代性评价测验结果的解释前面阐述了课堂教学中标准化测验结果的解释,下面介绍非标准化测验结果的解释。(一)替代性评价测验和替代性评价测验结果解释的概念所谓替代性测验,是指除标准化测验外的所有课堂教学评价测验,这里也简称为替代性测验,如表现性评价测验等。关于替代性评价测验的具体含义、特点等,本书在“学业成就的替代性评价”一章有详细介绍,这里不再重复,只是前面是

50、针对学业成就的评价而阐述的,在这里把替代性评价测验的内涵扩大到所有课堂教学评价测验,包括本书所涉及的所有非标准化的评价测验。替代性评价测验的结果一般是“一个分数”或者“一个等级附带一个分数”,替代性评价测验结果的解释就是对测验后这个分数或等级(加分数)的解释。前面介绍过,替代性测验与标准化测验有很大不同:它强调个体差异,突出学生主体性,不要求一致性。另外,除了试题测试外,替代性测验中更多的是任务完成测验,学生在完成任务过程中会有不同程度的原创性反应,因此,替代性评价测验中学生表现不一,多数测验任务没有固定答案。很显然,一般情况下替代性测验的结果不适合参照常模来解释,所以在这里就介绍另外一种解释

51、测验结果的方法参照“标准”的解释,很多人把参照“标准”解释的测验叫做标准参照测验。(二)替代性评价测验结果的解释:标准参照测验1.什么是标准参照测验标准参照测验是指在和一组规定明确的能力标准对比之下,对被试的测验成绩作出解释而制订的测验。(丁秀峰:心理测量学,133页,开封,河南大学出版社,2001。)可以这样理解,在标准参照测验中,对测验评估的指标不只有一个,而是有很多个,在每个指标上可以有一个分数(或等级),也可以有多个衡量分数(或等级),以这样的评估标准来记分、解释的测验就是标准参照测验。下面给出了一个例子。某教师在评估学生的手工设计时,选取了外型的新颖性、技术含量、做工精致程度几个指标

52、,在每个指标上,教师制订了三个等级并在每个等级上都赋予了分数。外型新颖性方面:外型非常新颖(从没见到过)=3分,外型一般(在别的基础上加工而来)=2分,外型普通(很常见)=1分;技术含量方面:技术含量高=3分,技术含量一般=2分,没有什么技术含量=1分;做工精致程度:做工非常精致=3分,做工一般=2分,做工较差=1分。这就制订了一个系统的评估标准,教师在对手工测验进行评价时,就依据这个标准来进行。从上面所给出的“标准参照测验”的例子中可以看出,对“手工设计”的评估其实就是等级评定。事实上,实际应用替代性测验进行评估时,由于学生的反应各异,不能够像常模参照那样对学生作出比较,很多都是界定一系列的

53、指标对学生的表现进行等级评定,其本质上就是参照“标准”的评估,这在前面“学业成就的替代性评价”一章有详细的陈述,所以也可以说在参照“标准”对替代性测验进行评估解释时,替代性测验就是标准参照测验。这里并不是说替代性评价测验都是参照“标准”来解释的测验,也可以参照常模来解释,但目前替代性测验的解释主要是参照“标准”来进行,所以本章主要从标准参照测验的角度对替代性评价测验结果的解释进行介绍。需要补充的是,上述例子对“手工设计”的评估中,在每个等级上都赋予了一个分值,这是较为常见的等级评定。在实际应用中,等级评定还可以有另外一层含义,就是在每个指标上只给出一个最高分数如10分,但在具体进行评估时,教师

54、可以根据学生表现,在这个分值范围内给学生打分,如5分或8分,这在学业成就测验中很常见,如教师对论述题的打分。以上所述的只是两种赋予分值的方式,虽有所不同,但实质上都是参照标准的评估,这里单独加以补充,以免教师在使用时局限于其中的一种。2.标准参照测验的特点这里所说的标准参照测验结果解释的特点是相对于常模参照测验而言的。相对常模参照的结果来说,标准参照测验的结果解释主要有以下两个特点。(1)标准参照测验的目的。参照常模对测验进行解释一般是为了在全部被试之间作出比较,从而判明被试在总体中的位臵。而参照标准解释测验则是为了将被试的成绩与既定的标准作比较,看看被试是否达到要求或达到了什么样的水平,不在

55、被试之间作比较。如,看看学生是否掌握了实验的操作技术,是否达到了要求,并不需要在学生之间作出比较。这是二者根本的区别,并且由此导致了其他方面的不同。(2)标准参照测验的分数解释。常模参照测验主要使用百分等级、标准分数等相对位臵量数,并且一般不适合对分数作进一步的推断;而标准参照测验的分数则不同,可以作一定的推断,如用大学生的入学成绩预测其在大学一年级的成绩。其实这里所说的是“结果参照测验”分数解释的内容,如果需要,教师可以查阅相关的测量书籍。(三)标准参照测验结果的解释:分数线的确定1.合格分数线的确定前面阐述过,对替代性评价测验结果解释的目的不是在学生之间进行比较,而是看学生是否达到了要求或

56、者是达到了什么样的水平。那么在实际应用中,要衡量学生在测验中的水平是否达到要求或者达到了什么样的水平,最简单也比较实用的方法就是确定一个合适的分数线,凡是达到这个分数线的,就说明该学生在这个测验上合格了,达到了要求或基本达到了要求。如果低于这个分数线,则说明学生还没有掌握应该掌握的知识和技能,没有达到基本要求。下面就来看一下在不同测验中,怎样确定合格分数线。(1)根据“双基度”确定合格分数线。双基指“基本知识、基本技能”,具体到课堂教学中,指的是学科的教学要求。具体地说就是在整个知识传授的过程中,教师要着重“双基”内容的讲解和示范,学生要着重“双基”内容的掌握,凡是能体现“基本知识、基本技能”

57、的教学内容都是学生要重点掌握的内容。那么反映到测验上,越能反映学科“双基”要求的试题或任务,就越能说明该试题或任务就是特定学科最基本、最核心的知识要求,其“双基度”也就越高。从这里可以看出,“双基度”和平时所说的试题难度没有必然的联系,难度高的题目其“双基度”不一定高,难度低的题目其“双基度”也不一定低。所以,这里认为在考查学科内容掌握的测验中,根据“双基度”来确定合格分数线比简单地按照60分来确定更合理。根据“双基度”确定合格分数线的原理和步骤,教师可以查阅相关的测量书籍,下面给出一个根据“双基度”确定合格分数线的例子(丁秀峰:心理测量学,141页,开封,河南大学出版社,2001。以供参考。

58、)某市中学高三学生进行期末数学考试,有40个试题,前35题每题2分,后5题每题6分。经五位教师评估,各试题平均“双基度”指标如下。“双基度”0.90.80.70.50.40.30.1合计题分值2222266题数10107533240则期末数学考试的合格分数线为:E=(10 x0.9+10 x0.8+7x0.7+5x0.5+3x0.4)x2+(3x0.3+2x0.1)x6=57.8根据“双基度”确定测验的合格分数线常用于考查学科内容掌握的测验,也常见于标准化测验。在实际使用时,教师不必拘泥于惯例,完全可以在替代性测验以及非学科内容测验中尝试使用。(2)据“任务难度”和需要测量的“能力目标”确定合格分数线。通过一个测验,教师有时想要了解的是学生对特定内容的掌握程度或者某种能力上所达到的水平,而不是特定内容的掌握与否。上面已经介绍了用“双基度”来确定学科内容掌握与否的测验的合格分数线,而对于在某种能力上所达到的水平或特定内容的掌握程度上,就可以根据测验所用任务的难度和所要测量的能力目标两个维度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论