小学教育心理学第十六章学习结果的测量与评定_第1页
小学教育心理学第十六章学习结果的测量与评定_第2页
小学教育心理学第十六章学习结果的测量与评定_第3页
小学教育心理学第十六章学习结果的测量与评定_第4页
小学教育心理学第十六章学习结果的测量与评定_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小学教育心理学第十六章学习结果的测量与评定1第一页,共四十二页,2022年,8月28日一、什么是学习测量与评定(一)什么是测量和测验 测量是用数学方式对人的行为的描述。 教学过程中的测量是用数学的方式对学生学习行为的描述,主要是借助于测验来进行。 测验是通过一系列的科学程序(如编制题目、施测和评分等)对学生某一方面的学习行为进行测量。(二)什么是评定教学过程中的评定是根据一定的标准对学生的学习行为进行估价的过程。第一节学习评定概述2第二页,共四十二页,2022年,8月28日二、学习测量和评定的主要功能(一)诊断功能(二)反馈与鞭策功能

1.为教师的教学提供反馈信息

2.激发学生的的学习动机(三)管理功能

1.编班分组和升留级的依据

2.职业指导的作用

3.教育科学研究的工具(四)教育心理功能3第三页,共四十二页,2022年,8月28日4第四页,共四十二页,2022年,8月28日

三、教育工作者应具备的测量与评定的知识和能力①理解与清楚地表述教学和管理目标,懂得怎样通过教学和管理活动达到目标,全面了解测量与评定的涵义及评定对教学及管理的意义。②理解有效测量和评定条件,明确自己在编制、选择和使用测量工具时所扮演的角色。③能自行编制日常教学使用的测验,能适当地主持测验并有效地使用测验的结果,以为改进教学和管理之用;能选择适当的标准化测验。④能编制、选择与使用非测验式的测验工具。⑤能综合解释测验的分数和非测验式测量的结果,作出评定。明确各种测验的用途及限制。⑥能根据评定的结果,改进自己的教学和管理工作。此外,对参与评价的人来说,还应有高尚的人格,应当使自己参与的评定工作合乎道德规范,不应使学生或教师感到高度焦虑,损伤他们的自尊心或引起恶性竞争。5第五页,共四十二页,2022年,8月28日

四、学习评定的分类布鲁姆(Bloom,B.S)的分类:

(一)配置性评定一般在各学年、各学期开始时或开始前施行,其目的是要了解学生是否具有达到教学目标所必需的基础知识和技能——学生的准备状态。

(二)形成性评定一般是在教和学的过程中进行的,目的在于了解教学结果,探究教学中所存在的问题的缺陷,以便对教学工作进行调整。

(三)总结性评定一般在学期末进行,目的是了解学生通过—学期的学习,是否达到教学目的的要求,以此作出较全面的总结性评定。6第六页,共四十二页,2022年,8月28日五、有效测验的必要条件(一)效度测验效度是指测量的真实性、正确性,即该测验与所要测量的目标特征相符合的程度。如果一致性高,说明这个测验的效度高,反之则低。效度通常是利用该测验的结果与一个反映测量目标的参照标准(效标)之间的相关来表示,所求得的相关系数即为效度系数。相关系数越大,说明效度越高。—般要求这类测验的效度值应当在0.35至0.60之间。

7第七页,共四十二页,2022年,8月28日(二)信度信度是反映测验分数的稳定性的可靠性的指标,是指测量的前后一致性程度,只有信度高的测验才能够作为一个稳定可靠的测量工具加以应用。国外一般要求学科成绩测验的信度值要在0.90以上。信度值是用相关系数来表示的,又称为信度系数。计算信度系数的方法主要有:①再测法:我们用某一个测验对相同的学生前后施测两次,计算出这两次测验成绩的相关就可得到再测信度;②复本法:这种方法需要编制出两套以上内容、形式、数量、难度等方面都等值的测验,然后根据同一组学生接受两次复本测验的得分计算出相关系数,就可得到复本信度;③分半法:当一种测验没有复本而且只能施测一次的情况下,通常采用分半法来估计信度。这种方法是将一套测验分成对等的两半,根据每个人在这两半试题中的得分所求得的相关系数即为半分信度。在学科测验中,较多的是应用分半法和复本法来计算测验题的信度。8第八页,共四十二页,2022年,8月28日

(三)难度难度是指—套测验中试题的难易程度,这是用来进行题目分析和评价试题的主要指标之一。难度的计算可依据试题形式的不同采用以下两种方法,其公式为:9第九页,共四十二页,2022年,8月28日(四)区分度区分度是测验题目对考生水平鉴别能力的指标,是测验题目能够鉴别受测者水平的程度。区分度的计算多采用相关法,即以考生在某个题目上的得分与总分的相关作为该题的区分度值,相关越高,区分度越好。国外应用在教育上的标准化测验要求优秀题目的区分度在0.30以上,否则就需加以改进或淘汰。(五)可用性即测验在解释学生的能力、知识等方面有多大用处;测验的形式与内容是否适合学生的年龄特征;测验所花的时间和人力是否合适;以及评分是否客观,主持测验是否通过过特殊训练等。如果在这些方面使人不能接受,测验的可用性就低。10第十页,共四十二页,2022年,8月28日一、论文式测验(一)论文式测验的涵义及其试卷的编制和评分

所谓论文式测验,是由教师根据教学内容的要点,择其较重要者出几个试题,让学生用论文的方式,自由地以书面解答问题。第二节常用的测验方法

11第十一页,共四十二页,2022年,8月28日

(二)论文式测验的利弊

1.论文式测验的优点:①命题省时容易②有利于测定学生的思维能力和写作能力③了解学生的学习程度④减少学生情境压力12第十二页,共四十二页,2022年,8月28日2.论文式测验的缺点:①评分的主观性②试题缺少代表性③问题涵义太广泛④易受其他因素干扰13第十三页,共四十二页,2022年,8月28日(二)论文式测验的改进①问题要明确。②采用一些可用较短篇幅回答的问题,以求取样适当。③事先拟好指导评分的规则和标准,其中包括可以接受的答案,并规定出这些答案的比重。④不要因错别字或语法有错误而扣分,除非考试是为测试这些方面而特别进行的。⑤先要阅看几份考卷,以便对考查的性质得到一个一般的观念,并用来检查与修改评分的规则和标准。⑥在评定一份考卷时不要知道答卷者的姓名,同时尽可能在几乎相等的条件下评卷定分,或采取两三个教师合评的方式14第十四页,共四十二页,2022年,8月28日

二、客观测验(一)客观测验的涵义及其与论文式测验的区别

客观测验是用一些非常简单或机械式反应来回答的测验。其中最为人们听熟悉的是填充、正误、多重选择和配对等形式。论文式测验与客观测验在学生学业的评定方面的比较:15第十五页,共四十二页,2022年,8月28日16第十六页,共四十二页,2022年,8月28日17第十七页,共四十二页,2022年,8月28日(二)客观测验项目的形式及其编制

1.编制客观测验的一般原则:①测验要测试学科中的重要内容。②要降低测验项目的阅读难度,除非测验的目的在于测最阅读能力。③一个项目不要为另一个项目的答案提供线索,回答某一特定项目的能力也不依靠前一项目的回答的能力。④必须避免引人上当的问题,诡诈性和欺骗性问题既可能损害测验的真正目的,又可能影响学生的学习风气。⑤测验项目的措词应适当,以便使学生回答问题的内容而不回答问题的形式。18第十八页,共四十二页,2022年,8月28日

2.客观测验项目的形式及其编制①填充②正误③选择④配对19第十九页,共四十二页,2022年,8月28日

(三)客观测验的利弊

1.客观测验的优点①试题涉及教学内容的全部范围。②试题简明扼要,易于回答。③评分客观迅速。

2.客观测验的缺点①命题费时且困难。②偏于零星知识的记忆。③不能确知学生的学习程度。

20第二十页,共四十二页,2022年,8月28日

三、标准测验

标准测验也称标准化测验或标准化考试,是目前国际上广为流行的一种测验方法。它是一种大规模的、具有统一标准的、按照系统的科学程序组织的、并对误差作了严格控制的测验。21第二十一页,共四十二页,2022年,8月28日

四、心理测验

(一)智力测验虽然学业成绩测验也可以测定一些学生的智力,但对学生智力水平的高低,通过教学后智力的发展变化情况的测量,更主要的还是依靠智力测验。目前世界上最流行的两种智力测验是斯坦福一比奈智力测验和韦克斯勒智力测验。

1.斯坦福一比奈智力测验斯坦福一比奈智力测验包括下列各种问题:字义、语言类推问题、适应问题、算术问题、记忆、一般常识、发现错误、图画、空间问题、理解等。智力商数(IQ):智商=智力年龄/实际年龄╳10022第二十二页,共四十二页,2022年,8月28日2.韦克斯勒智力测验韦克斯勒智力测验是美国心理学家韦克斯勒(D.Wechsler)创造的,它是另一个在世界上被广为使用的标准智力测验。它包括韦氏成人智力量表(WAIS)、韦氏儿童智力测验表(WAIS)和韦氏学前儿童智力量表(WPPSI)3种。韦氏量表是运用统计学原理,根据对人的智力的统计规律遵循正态分布这一事实,计算离差智商来表示智力高低的。韦克斯勒假定,人们的智商是以平均数为100和标准差为15的正态形式分布的。因此,其计算智商的公式如下:23第二十三页,共四十二页,2022年,8月28日用这种离差智商,可以确定一个人的智力在同龄人当中的相对位置;诊断出他是智力落后或超常。一般认为智商在70以下属智力落后;130以上可谓智力发展优异。24第二十四页,共四十二页,2022年,8月28日3.综合学业性向测验[1]

综合学业性向测验的目的在于测量学生学习各门学科能力的真实程度。这种测验不仅可以鉴别学生能力的高低,而且也可分析比较学生能力的偏向或在各方面的能力的高低。综合学业性向测验包括分类性向测验(DAT)、美国大学入学测验(ACT)、学业性向测验(SAT)、米勒类推测验(MAT)以及研究生性向测验(GRE)等。[1]李小融、魏龙渝:〈教学评价〉,217页,成都,四川教育出版社,1988。25第二十五页,共四十二页,2022年,8月28日

(二)人格测验

1.自陈人格测验自陈人格测验也称自陈问卷,是指被测者对自己的人格,按自己的意见予以评定的一种方法。最常见的自陈人格测验有:明尼苏达多相人格测验;加利福尼亚人格测验;莫尼问题调查表;卡姆溜人格测验;内外向人格调查表;瑟斯顿性格测验等。

2.兴趣测验兴趣是人对事物的特殊认识倾向。所谓认识倾向,即在认识过程中带有相对稳定的指向、趋向,能够维持较长的时间。较为著名的兴趣量表有:爱德华个人兴趣量表;斯特朗职业兴趣量表;库得职业兴趣量表等。26第二十六页,共四十二页,2022年,8月28日

3.态度测验态度是人们对人、事或物的喜好或厌恶的倾向,与其行为有着密切关系。①态度的倾向,如喜欢与否,肯定与否。

②态度的深度与强度,如喜欢、很喜欢、不喜欢、厌恶。

③态度的中心,指人格心理体系中重要的因素,包括情感、认知和行为因素。

④态度的外显性,态度不能直接测量,但可以通过对人们的言语、行为以及其他方面的表现的测量去推断其态度。常见的与教学有关的态度测验有明尼苏达教师态度测验、各学科态度测验和学习习惯与态度测验等。27第二十七页,共四十二页,2022年,8月28日4.价值测验价值是人们对人、事或物所作的好坏判断。这方面的测验有价值测验、人际价值测验和工作价值测验。

5.行为观察

6.投射人格测验投射人格测验是在测验时向被测者提供—些模棱两可的刺激,让他在不受限制的情况下,自由地做出自己的反应,使其不知不觉地表露出入格特征。即在没有控制的情况下,个人内在因素通过对某些刺激的反应投射出来。作为刺激物的材料有内容模糊的图片、未完成的句子、没有结尾的故事等。属于投射人格测验的有:罗夏墨迹测验、主题统觉测验、儿童统觉测验、文字联想测验和名字完成测验等。28第二十八页,共四十二页,2022年,8月28日一、图示量表第三节常见的几种学习评定量表

29第二十九页,共四十二页,2022年,8月28日

二、形容词量表

这种量表在提出的问题之后,用一组序列化的形容词或修饰短语的方式提供各种不同程度的答案,回答者在每个形容词及短语上画圈或做上记号,以表示自己的评定。例如:极好;很好;,好;尚好;不好。完全同意;同意(或赞成);无所谓;不同意(或反对);完全不同意(或极反对);无法回答。绝对正确;正确;较正确;不正确;极不正确;无法回答。很好;好;可以;不对;糟糕;无法回答。经常;偶尔;完全不。极重要;重要;较重要;不重要;不知道。非常赞成;相当赞成;稍许赞成;难说;稍许反对;相当反对;非常反对。30第三十页,共四十二页,2022年,8月28日三、数值量表数值量表是为了克服形容词量表不能数量化的缺点而出现的一种量表形式,这种量表只是简单地把数字加在形容词量表上,对每—个等级的答案都标上分数。例如:极好(5);很好(4);好(3);尚好(2);不好(1)。完全同意(5);同意或赞成(4);无所谓(3);不同意或反对(2);完全不同意或极反对(1)。绝对正确(5);正确(4);较正确(3);不正确(2);极不正确(1)。很好(5);好(4);可以(3);不对(2);糟糕(1)。经常(3);偶尔(2);完全不(1)。极重要(5);重要(4);较重要(3);不重要(2);不知道(1)。31第三十一页,共四十二页,2022年,8月28日

四、行为量表设计行为量表可按下面的程序进行:首先要求评定者熟悉被评定的教学现象,而且要求他们描述其中的有效行为或无效行为。接着,研究者把这些描述分成相对来说内容较少的种类并给它们命名。作为对分类的检查,也可组织有丰富教学经验的教师或教学专家及教学评价专家再次把上述描述分配到已命名的种类中。然后,评定者把可以有效地分类和评定的那些描述归人一个为各类描述而设置的量表,使用这些对教学行为的描述作为量表的标度。32第三十二页,共四十二页,2022年,8月28日例如:通过教师与学生的接触来评定教师对教学的态度:

——在教师家里召开研讨会。一—愿意在正常的上班时间之外和学生一起活动。一一在办公室和学校的其他地方会见学生。

——乐意占用办公时间与学生交谈。

——勉强安排最少可能的办公时间与学生接触。

——拒绝在课堂之外会见学生。行为量表通常分为3—7个单位或等级,每个等级代表某一教学行为的一个增量。评定者根据任课教师在教学的某一方面的行为的程度不同而在量表的相应等级上做上记号。33第三十三页,共四十二页,2022年,8月28日课堂教学评定量表(一个例子)34第三十四页,共四十二页,2022年,8月28日35第三十五页,共四十二页,2022年,8月28日

五、常见的几种量表形式的变体

(一)加涅1974年设计的“现实一满意等级量表”

加涅等人1974年设计了一种双重目的的“现实一满意等级量表”,以使评定者回答有关每一教学评定项目的两个问题。例如:

1.你如何评定任课教师的语言清晰度?(1)(2)(3)(4)(5)

从不几乎不偶尔时常经常

(问题)(问题)(问题)(问题)(问题)36第三十六页,共四十二页,2022年,8月28日

2.在这个项目中你认为哪个评定是您满意的?(1)(2)(3)(4)(5)

从不几乎不偶尔时常经常

(问题)(问题)(问题)(问题)(问题)

第二问旨在使评定达到某个标准或水平,并对照该标准或水平解释评定者对第一问的回答。37第三十七页,共四十二页,2022年,8月28日(二)多伊尔在1975年提出了一种双重的“评价一重要性量表”1.你怎样评定任课教师对别人观点的接受?(1)(2)(3)(4)(5)

不好尚好好很好很好2.该教师的品质对你有怎样的重要性?(1)(2)(3)

不太重要还算重要非常重要第二问旨在提供一种方法以区分问卷上各种提问的重要性。这种被项目重要性所强调的具体特征评定比起不被强调的评定来说,是全面评价更好的预言者,而且也可以提供—个对正在进行的教学评定项目的有效性的方便估计。38第三十八页,共四十二页,2022年,8月28日

(三)第三种变体与效果评定有关学生可以通过在一门课程开始时完成的一个评定和在该课程结束时的一个类似评定;也可以通过只是在该课程结束时作出的一个双重前一后评定;还可以通过一个下列类型的单一评定,就能够评定他们的学习收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论