




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习结果的测量与评定第一页,共五十页,2022年,8月28日第一节概述(二)什么是评定
1、教学过程中的评定,是根据一定的标准对学生的学习行为进行估价的过程。
2、评定与测量有密切的关系,但也有区别:评定是在测量的基础上作出的,测量是一种客观的描述;评定是一种主观的判断,但主观判断要以客观描述为依据,否则就是武断的判断。第二页,共五十页,2022年,8月28日*2第一节概述二、学习测量和评定的主要功能(一)诊断功能了解学生的学习状况,分辨优劣,诊断学生在知识掌握和能力发展上的不足及问题所在,以便因材施教和个别指导。(二)反馈与鞭策功能
1、为教师的教学提供反馈信息贯穿教学前、教学中、教学后各阶段。
2、激发学生的学习动机第三页,共五十页,2022年,8月28日*3第一节概述(三)管理功能
1、编班分组和升留级的依据
2、职业指导作用
3、教育科学研究的工具(四)教育心理功能
1、激发动机,影响自我意识、情绪和意志
2、影响师生的人格形成第四页,共五十页,2022年,8月28日*4第一节概述三、教育工作者应具备的测量与评定的知识和能力
1、理解与清楚地表述教学和管理目标,懂得怎样通过教学和管理活动达到目标,全面了解测量与评定的涵义及评定对教学及管理的意义。
2、理解有效测量和评定条件,明确自己在编制、选择和使用测量工具时所扮演的角色。
3、能编制、选择与使用非测验式的测验工具。第五页,共五十页,2022年,8月28日*5第一节概述
4、能自行编制日常教学使用的测验,能适当地主持测验并有效地使用测验的结果,以为改进教学和管理之用;能选择适当的标准化测验。
5、能综合解释测验的分数和非测验式测量的结果,作出评定。明确各种测验的用途及限制。
6、能根据评定的结果,改进自己的教学和管理工作。第六页,共五十页,2022年,8月28日*6第一节概述四、学习评定的分类(布卢姆:Bloom)(一)配置性评定
一般是在各学年、各学期开始时或开始前实施,目的在于了解学生是否具有达到教学目标所必需的基础知识和技能——学生的准备状态。(二)形成性评定(诊断——进步评定)
一般是在教学过程中进行的,目的在于了解教学结果,探究教学中所存在的问题的缺陷,以便对教学工作进行调整。第七页,共五十页,2022年,8月28日*7第一节概述(三)总结性评定
一般是在学期末进行,目的在于了解学生通过一学期的学习,是否达到教学目的的要求,以此做出较全面的评定,具有对以后学习的预测作用。普遍采用成绩报告单形式。五、有效测验的必要条件(一)效度第八页,共五十页,2022年,8月28日*8第一节概述
1、测验效度是指测量的真实性、正确性,即该测验与所要测量的目标特征相符合的程度。如果一致性高,说明这个测验的效度高,反之则低。这是测量有效的首要条件。
2、效度通常是利用该测验的结果与一个反映测量目标的参照标准(效标)之间的相关来表示,所求得的相关系数即为效度系数。相关系数越大,说明效度越高。—般要求这类测验的效度值应当在0.35至0.60之间。
第九页,共五十页,2022年,8月28日*9第一节概述(二)信度
1、信度是反映测验分数的稳定性和可靠性的指标,是指测量的前后一致性程度,只有信度高的测验才能够作为一个稳定可靠的测量工具加以应用。国外一般要求学科成绩测验的信度值要在0.90以上。信度值是用相关系数来表示的,又称为信度系数。
2、计算信度系数的方法主要有:第十页,共五十页,2022年,8月28日*10第一节概述(1)再测法:我们用某一个测验对相同的学生前后施测两次,计算出这两次测验成绩的相关就可得到再测信度;(2)复本法:这种方法需要编制出两套以上内容、形式、数量、难度等方面都等值的测验,然后根据同一组学生接受两次复本测验的得分计算出相关系数,就可得到复本信度;第十一页,共五十页,2022年,8月28日*11第一节概述(3)分半法:当一种测验没有复本而且只能施测一次的情况下,通常采用分半法来估计信度。这种方法是将一套测验分成对等的两半,根据每个人在这两半试题中的得分所求得的相关系数即为半分信度。
在学科测验中,较多的是应用分半法和复本法来计算测验题的信度。第十二页,共五十页,2022年,8月28日*12第一节概述(三)难度
1、难度是指—套测验中试题的难易程度,这是用来进行题目分析和评价试题的主要指标之一。
2、难度的计算可依据试题形式的不同采用以下两种方法,其公式为:第十三页,共五十页,2022年,8月28日*13第一节概述(四)区分度
1、区分度是测验题目对考生水平鉴别能力的指标,是测验题目能够鉴别受测者水平的程度。
2、区分度的计算多采用相关法,即以考生在某个题目上的得分与总分的相关作为该题的区分度值,相关越高,区分度越好。国外应用在教育上的标准化测验要求优秀题目的区分度在0.30以上,否则就需加以改进或淘汰。
3、区分度和难度之间有密切的关系。第十四页,共五十页,2022年,8月28日*14第一节概述(五)可用性
即测验在解释学生的能力、知识等方面有多大用处;测验的形式与内容是否适合学生的年龄特征;测验所花的时间和人力是否合适;以及评分是否客观,主持测验是否要经过特殊训练等。如果在这些方面使人不能接受,测验的可用性就低。第十五页,共五十页,2022年,8月28日*15第二节常用的测验方法一、论文式测验(一)论文式测验的涵义及其试卷的编制和评分
1、所谓论文式测验,是由教师根据教学内容的要点,择其较重要者出几个试题,让学生用论文的方式,自由地以书面解答问题。
2、至于试题的深浅,则视教学水平和学生的学习程度而定。回答可以是一个短句,也可以论述一个问题,还可以是在规定的时间内写一篇文章。第十六页,共五十页,2022年,8月28日*16第二节常用的测验方法(一)论文式测验的利弊
1、优点①命题省时容易②有利于测定学生的思维能力和写作能力③了解学生的学习程度④减少学生情境压力2、缺点①评分的主观性②试题缺少代表性第十七页,共五十页,2022年,8月28日*17第二节常用的测验方法
③问题涵义太广泛④易受其他因素干扰(三)论文式测验的改进①问题要明确。②采用一些可用较短篇幅回答的问题,以求取样适当。③事先拟好指导评分的规则和标准,其中包括可以接受的答案,并规定出这些答案的比重。第十八页,共五十页,2022年,8月28日*18第二节常用的测验方法
④不要因错别字或语法有错误而扣分,除非考试是为测试这些方面而特别进行的。⑤先要阅看几份考卷,以便对考查的性质得到一个一般的观念,并用来检查与修改评分的规则和标准。⑥在评定一份考卷时不要知道答卷者的姓名,同时尽可能在几乎相等的条件下评卷定分,或采取两三个教师合评的方式。第十九页,共五十页,2022年,8月28日*19第二节常用的测验方法二、客观测验(一)客观测验的涵义及其与论文式测验的区别
1、客观测验是用一些非常简单或机械式反应来回答的测验。其中最为人们听熟悉的是填充、正误、多重选择和配对等形式。
2、论文式测验与客观测验在学生学业的评定方面的比较:第二十页,共五十页,2022年,8月28日*20第二节常用的测验方法第二十一页,共五十页,2022年,8月28日*21第二节常用的测验方法第二十二页,共五十页,2022年,8月28日*22第二节常用的测验方法(二)客观测验项目的形式及其编制
1、编制客观测验的一般原则:①测验要测试学科中的重要内容。②要降低测验项目的阅读难度,除非测验的目的在于测最阅读能力。③一个项目不要为另一个项目的答案提供线索,回答某一特定项目的能力也不依靠前一项目的回答的能力。
第二十三页,共五十页,2022年,8月28日*23第二节常用的测验方法④必须避免引人上当的问题,诡诈性和欺骗性问题既可能损害测验的真正目的,又可能影响学生的学习风气。⑤测验项目的措词应适当,以便使学生回答问题的内容而不回答问题的形式。
2、客观测验项目的形式及其编制①填充②正误③选择④配对第二十四页,共五十页,2022年,8月28日*24第二节常用的测验方法(三)客观测验的利弊
1.客观测验的优点①试题涉及教学内容的全部范围。②试题简明扼要,易于回答。③评分客观迅速。
2.客观测验的缺点①命题费时且困难。②偏于零星知识的记忆。③不能确知学生的学习程度。第二十五页,共五十页,2022年,8月28日*25第二节常用的测验方法三、标准测验
1、标准测验也称标准化测验或标准化考试,是目前国际上广为流行的一种测验方法。它是一种大规模的、具有统一标准的、按照系统的科学程序组织的、并对误差作了严格控制的测验。
2、标准测验一般由专门的考试机构编制并组织实施,国外教师普遍运用标准测验作为评定教学的工具。第二十六页,共五十页,2022年,8月28日*26第二节常用的测验方法四、心理测验(一)智力测验
1、斯坦福一比奈智力测验
智力商数(IQ):智商=智力年龄/实际年龄*100
2、韦克斯勒智力测验
包括韦氏成人智力量表(WAIS)、韦氏儿童智力测验表(WAIS)和韦氏学前儿童智力量表(WPPSI)3种。第二十七页,共五十页,2022年,8月28日*27第二节常用的测验方法
3、综合学业性向测验综合学业性向测验的目的在于测量学生学习各门学科能力的真实程度。这种测验不仅可以鉴别学生能力的高低,而且也可分析比较学生能力的偏向或在各方面的能力的高低。综合学业性向测验包括分类性向测验(DAT)、美国大学入学测验(ACT)、学业性向测验(SAT)、米勒类推测验(MAT)以及研究生性向测验(GRE)等。第二十八页,共五十页,2022年,8月28日*28第二节常用的测验方法(二)人格测验
1、自陈人格测验
2、兴趣测验
3、态度测验
①态度的倾向,如喜欢与否,肯定与否。②态度的深度与强度,如喜欢、很喜欢、不喜欢、厌恶。③态度的中心,指人格心理体系中重要的因素,包括情感、认知和行为因素。④态度的外显性,态度不能直接测量,但可以通过对人们的言语、行为以及其他方面的表现的测量去推断其态度。第二十九页,共五十页,2022年,8月28日*29第二节常用的测验方法
4、价值测验
5、行为观察
6、投射人格测验第三十页,共五十页,2022年,8月28日*30第三节常见的几种学习评定量表一、图示量表第三十一页,共五十页,2022年,8月28日*31第三节常见的几种学习评定量表二、形容词量表
这种量表在提出的问题之后,用一组序列化的形容词或修饰短语的方式提供各种不同程度的答案,回答者在每个形容词及短语上画圈或做上记号,以表示自己的评定。例如:
极好;很好;,好;尚好;不好。极重要;重要;较重要;不重要;不知道。非常赞成;相当赞成;稍许赞成;难说;稍许反对;相当反对;非常反对。第三十二页,共五十页,2022年,8月28日*32第三节常见的几种学习评定量表三、数值量表
数值量表是为了克服形容词量表不能数量化的缺点而出现的一种量表形式,这种量表只是简单地把数字加在形容词量表上,对每—个等级的答案都标上分数。例如:极好(5);很好(4);好(3);尚好(2);不好(1)。极重要(5);重要(4);较重要(3);不重要(2);不知道(1)。经常(3);偶尔(2);完全不(1)。第三十三页,共五十页,2022年,8月28日*33第三节常见的几种学习评定量表四、行为量表设计行为量表可按下面的程序进行:首先要求评定者熟悉被评定的教学现象,而且要求他们描述其中的有效行为或无效行为。接着,研究者把这些描述分成相对来说内容较少的种类并给它们命名。作为对分类的检查,也可组织有丰富教学经验的教师或教学专家及教学评价专家再次把上述描述分配到已命名的种类中。然后,评定者把可以有效地分类和评定的那些描述归人一个为各类描述而设置的量表,使用这些对教学行为的描述作为量表的标度。第三十四页,共五十页,2022年,8月28日*34第三节常见的几种学习评定量表例如:通过教师与学生的接触来评定教师对教学的态度:
——在教师家里召开研讨会。一—愿意在正常的上班时间之外和学生一起活动。一一在办公室和学校的其他地方会见学生。
——乐意占用办公时间与学生交谈。
——勉强安排最少可能的办公时间与学生接触。
——拒绝在课堂之外会见学生。行为量表通常分为3—7个单位或等级,每个等级代表某一教学行为的一个增量。评定者根据任课教师在教学的某一方面的行为的程度不同而在量表的相应等级上做上记号。第三十五页,共五十页,2022年,8月28日*35第三节常见的几种学习评定量表课堂教学评定量表(一个例子)第三十六页,共五十页,2022年,8月28日*36第三节常见的几种学习评定量表1第三十七页,共五十页,2022年,8月28日*37第三节常见的几种学习评定量表五、常见的几种量表形式的变体
(一)加涅1974年设计的“现实一满意等级量表”例如:
1.你如何评定任课教师的语言清晰度?(1)(2)(3)(4)(5)
从不几乎不偶尔时常经常
(问题)(问题)(问题)(问题)(问题)第三十八页,共五十页,2022年,8月28日*38第三节常见的几种学习评定量表2.在这个项目中你认为哪个评定是您满意的?(1)(2)(3)(4)(5)
从不几乎不偶尔时常经常
(问题)(问题)(问题)(问题)(问题)
第二问旨在使评定达到某个标准或水平,并对照该标准或水平解释评定者对第一问的回答。(二)多伊尔在1975年提出了双重的“评价一重要性量表”1.你怎样评定任课教师对别人观点的接受?(1)(2)(3)(4)(5)
不好尚好好很好很好第三十九页,共五十页,2022年,8月28日*39第三节常见的几种学习评定量表2.该教师的品质对你有怎样的重要性?(1)(2)(3)
不太重要还算重要非常重要第二问旨在提供一种方法以区分问卷上各种提问的重要性。这种被项目重要性所强调的具体特征评定比起不被强调的评定来说,是全面评价更好的预言者,而且也可以提供—个对正在进行的教学评定项目的有效性的方便估计。第四十页,共五十页,2022年,8月28日*40第三节常见的几种学习评定量表2.该教师的品质对你有怎样的重要性?(1)(2)(3)
不太重要还算重要非常重要第二问旨在提供一种方法以区分问卷上各种提问的重要性。这种被项目重要性所强调的具体特征评定比起不被强调的评定来说,是全面评价更好的预言者,而且也可以提供—个对正在进行的教学评定项目的有效性的方便估计。第四十一页,共五十页,2022年,8月28日*41第三节常见的几种学习评定量表(三)第三种变体与效果评定有关
学生可以通过在一门课程开始时完成的一个评定和在该课程结束时的一个类似评定;也可以通过只是在该课程结束时作出的一个双重前一后评定;还可以通过一个下列类型的单一评定,就能够评定他们的学习收获:与本课程第一天的收获相比,你现在怎样评定你对该课程教学内容的掌握了很多多少少多很多现在更差现在更差现在更差现在更好现在更好现在更好第四十二页,共五十页,2022年,8月28日*42第三节常见的几种学习评定量表六、强迫选择量表
流行的强迫选择评定形式由四个要素构成,所有要素对评定者具有同等的吸引力,但是仅有两个要素实际上与某些测量标准有关并被评分。剩下的两个要素因为在区分有效表现与无效表现时没有实验依据,而不被人们重视:
——友好的
——激励人的
——博学的
——善于表达的第四十三页,共五十页,2022年,8月28日*43第三节常见的几种学习评定量表
强迫选择量表的评分是根据评定者的识别要素的总数来决定的。这种量表蕴含着这样一种思想,即因为所有的选择要素对评定者来说都是同等地合乎需要的,都是未知的,都是有效的和可评分的,所以评定者将不能伪造有利的或不利的平定。因此,这种量表比前面所介绍的那些常见的评定量表更能消除评定者误差;而且强迫选择评定与对学生的学习测量之间有明显的相关。第四十四页,共五十页,2022年,8月28日*44第三节常见的几种学习评定量表七、综合评定量表
为了利用论文的传送可靠性和评定的定量特征,一种常用的综合方式是在同一量表或问卷中把各种评定式提问和论文式提问结合在一起。这种方法可以由末尾有1—2个论文式提问的许多评定项目构成;也可以是在开端末尾有1—2个概括评定的基本上是论文式的问卷;还可以是在整个量表或问卷中把论文式提问和评定式提问混合在一起:以使每个评定项目都有一个为进行评论、详尽阐述、提出建议而留出的空白。第四十五页,共五十页,2022年,8月28日*45第四节影响学习测量与评定的心理因素一、学生心理因素的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防火灾消防安全主题班会
- 办公室主任年中工作总结
- 2025年山西省晋中市榆次区一模生物学试题(含答案)
- 民办合肥滨湖职业技术学院《变质岩岩石学》2023-2024学年第二学期期末试卷
- 河南中医药大学《教师职业道德与专业成长》2023-2024学年第二学期期末试卷
- 键盘鼠标操作课件
- 米索前列醇阴道片-药品临床应用解读
- 三江学院《建筑信息模型技术》2023-2024学年第二学期期末试卷
- 四川师范大学《证券投资学实验》2023-2024学年第二学期期末试卷
- 上海工会管理职业学院《医药市场营销》2023-2024学年第二学期期末试卷
- 2025江苏南京市金陵饭店股份限公司招聘高频重点模拟试卷提升(共500题附带答案详解)
- 中国急性缺血性卒中诊治指南(2023)解读
- 人教版三年级下册语文《古诗三首(元日)》练习题(含答案)
- 华为采购管理
- 小学学生一日常规管理
- 基于代际互动视角的农村老年家庭数字反哺机制研究
- 《敏捷项目管理》课件
- 外研版(2025新版)七年级下册英语Unit 1 学情调研测试卷(含答案)
- 专题10 开展心理健康教育 促进身心健康成长-备战2023年中考英语阅读理解时文爆点专题训练(解析版)
- 土壤质地与土壤酶活性-第1篇-洞察分析
- 智联招聘行测题库及答案
评论
0/150
提交评论