教学测量与评价课件_第1页
教学测量与评价课件_第2页
教学测量与评价课件_第3页
教学测量与评价课件_第4页
教学测量与评价课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教学测量与评价第一讲教学测量与评价的含义与作用一、什么是教学测量二、什么是教学评价三、教学测量与评价与关系四、教学测量与评价的作用一、教学测量1.含义教学测量(instructionalmeasurement)是考核教学成效的一种方法。这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。2.在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标。教学目标的例子:n

掌握水势概念、根系吸水的动力和叶片散失水分的原理;了解水分在生命活动中的作用(植物生理学,水分生理)。n

本章要求学生掌握食用菌菌丝体和子实体的形态结构;掌握食用菌的生活史(食用菌栽培,食用菌的形态与生活史)。三维目标1.

知识与技能:即每门学科的基本知识和基本技能。2.过程与方法:即让学生了解学科知识形成的过程、“亲历”探究知识的过程;学会发现问题、思考问题、解决问题的方法,学会学习,形成创新精神和实践能力等。3.情感、态度和价值观:即让学生形成积极的学习态度、健康向上的人生态度,具有科学精神和正确的世界观、人生观、价值观,成为有社会责任感和使命感的社会公民等。(人体生命活动的调节,第四节

激素调节

)1.识记:这是最低等级的认知目标,它指对具体事物和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。比如对专业术语,对日期、事件、人物、地点,对处理具体事物的方式方法,对各种理论等等的记忆。2.理解:这是低层次的理解,以一种语言或一种交流形式被译述或转化成另一种语言或另一种交流形式时的严谨性和准确性为依据,对材料进行初步的重新整理与排列,指出材料包含的意义和趋势。因此理解包括三个心理过程:转译、解释和推断。

3.运用:指在某些特定的和具体的情景里使用抽象概念——只是对所学知识的初步运用,而非综合的、创造性的运用。这些抽象概念可能是以一般的观念、程序的规则或概括化的方法等形式表现出来的,也可能是那些必须记住的和能够运用的专门性的原理、观念和理论。

4

.分析:指将材料分解成各种组成要素或组成成分,弄清各种观念的有关层次,或者明确所表达的各种观念之间的关系,阐明材料各要素的组织原理——即对材料内容组合起来的组织、系统和结构的分析。

5

.综合:指对各种要素或组成成分加工,形成新的结构整体或新的模式;制定出合理的工作计划或操作步骤;确定一套抽象关系,用以对特定的资料或现象进行分类或解释;或者从一套基本命题或符号表达式中演绎出各种命题关系。6.评价:这是认知领域教育目标的最高层次,是指为了特定目的对材料和方法的价值及符合准则的程度作出定量的和定性的判断。准则既可以是内在证据,如逻辑上准确性、一致性等,也可以是外部准则,如相应领域的最高标准等。评价是认知能力的最高水平,是认知行为和情感行为的主要结合点和过渡桥梁。评价综合分析运用理解识记二、教学评价1.含义教学评价(instructionalevaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。它主要包含以下两个方面的工作。(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。评价(估)的功能为家长提供信息为选拔提供信息为学生提供信息为教师提供信息为学校(间)提供信息评价必须要注意的:公平,公正,标准一致,标准清晰如何评价(估)形成性评估和终极性评估常模参照评估与标准参照评估三、教学测量与评价的关系区别:教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),并不考虑结果的实际意义,而教学评价则是对学绩测验所得结果的主观判断(对结果进行分析解释),以了解结果的实际意义。联系:(1)教学评价是一种主观判断,但是这种主观判断必须以教学测量所得的客观描述为依据(2)教学测量也不能脱离教学评价

。教学测量只是对学绩测验结果的客观描述,只有通过教学评价,才能判断这种客观描述的实际意义四、教学测量与评价的功能1.反馈—调节功能对教师对学生2.激励—动机功能对学生对教师第二节

中学生物学测量的命题一、设计双向细目表教师可以根据测验目的及教学目标的需求,以教学目标为横轴,而以教材内容为纵轴,画出一个二维度的分类表,且平均分配好试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编拟成就测验试题的设计蓝图,这样的一个二维度分类表便叫做双向细目表(two-way

specification

table)。典型的双向细目表,如所示。高中生物上学期成就测验的双向细目表教学目标百分比识记

理解

应用

分析

综合

评价

总计教材内容细胞选择

8

4简答

4

2

4

2

226

26%24

24%28

28%22

22%100

100%新陈代谢

选择

4

8简答4

2

3

3生殖发育

选择

2

4

3

3简答

4

45

3生命活动

选择

2

4

6

4调节33简答总

16

31

19

16

10

8百分比

16%

31%

19%

16%

10%

8%教师在设计双向细目表时必须注意:第一,命题的范围在教学过的教材内容范围之内第二,双向细目表边缘小格中的数字,不可以为零,也就是说,双向细目表中列出的教材内容或教学目标不能没有适当的试题。第三,教师可以针对自己的命题及评分的习惯,选定双向细目表中所陈述的测验题型,变化或增减所预拟的试题题数或分值。二、选定测验的题型试题的类型可以分成两大类:选择型试题(客观题)可分为:①

选择题;②是非题;③配合题;④填空题;⑤解释性习题等。填充型试题(主观题)可分为:①简答题;②限制反应题;③论述题等。1.在下列情况下,以使用主观型试题来评价为宜(

1)拟评价学生的创意、组织和综合科学知识或语文表达等比较复杂的成就;(2)拟评测学生对某些科学知识的意见或态度;(

3)拟评测学生分析、应用或评价整体科学概念的能力;(

4)受试人数不多而且试题拟只使用一次或有充足时间阅卷而无足够时间命题:(

5)教师个人在评阅答案时,能明确制订统一的评分标准。2.在下列情况下,以使用客观型试题来评价为宜(1)试题拟重复使用而且受试者人数众多;(2)要求测验结果具有较高信度;(3)评价结果必须尽可能公平、公正;(4)有充足时间命题,而缺乏足够时间阅卷;(

5)教师个人在评阅答案时,无法把握明确而统一的标准。3.下列情况则两类试题均可达到预期目标(1)评价学生的各方面学习成就;(2)考验学生是否了解并能运用科学原理、学说、定律;(3)考验学生应用科学知识以解决问题的能力;(4)考验学生的批判性思维能力:(5)考验学生记忆和运用科学知识的能力;(6)考验学生分析和综合科学知识的能力。二、编拟测验试题(一)编拟试题的一般原则1.试题取材均匀,并具有教材内容的代表性。2.试题的叙述应力求简明扼要,题意明确。3

.各个试题宜彼此独立,互不牵涉,并避免含有暗示答案的线索。4.试题宜有公认的正确答案或相对较佳的答案。5.试题中某些错误,虽不影响答案的选择,也应当避免。6.凡具有争议性的试题,应该注明命题参考资料的来源。7.若要测量学生的高层次认知能力,则试题不一定要有固定答案。8.试题的叙述应重新组织,避免直接抄课文或原来教材。9.试题应重视重要概念或原理原则的了解与应用,要避免偏难琐碎及零碎知识的记忆。10.避免使用与测验无关的叙述,增加作答困难。11.命题不要超过单元教学的评价目标。12.提早命题,以预留时间进行试题审查或修正。13.命题数量尽量多一些,作为备用试题。第三节试卷分析指标及其解读n

一、

考试与试卷分析n

二、

试卷分析方法n

三、

定量分析的主要指标n

四、

定量分析结果的解读n

五、

综合分析规范一

考试与试卷分析1.1考试的分类(1)常模参照性考试:考试的目的主要是在于考查被试者的个体差异,一般用于衡量被试者的相对水平。只有将被试者的得分放到考试所在的团体中,从而直接或间接地以被试者在该团体中的相对等级或相对位置来评估被试者的能力水平。(2)目标参照性考试:也叫标准参照考试,强调的是被试者对考试目标和内容的掌握程度。因而能反映出被试者的绝对水平及在知识掌握上的强点和弱点,并能对被试者在参照标准上的表现做出解释。1.2课程考试n

课程考试是评估学生学习成绩,检验教师教学和学生学习效果的主要形式,是教学过程中不可或缺的环节。n

课程考试目的:对学生学习状况和相关知识掌握程度,教师教学计划的完成程度及效果进行检查

;对学生的学业水平、能力做出判断、区分和解释。1.3试卷分析n

试卷分析:是指对学生考试成绩、试卷信度、效度,试题的难度、区分度,考试命题、试卷编制、阅卷评分等内容进行定量和定性分析,以评价考试质量、反思教与学效果的活动。n

试卷分析是教师教学活动的重要环节,也是教研室的基本工作之一。1.4试卷分析的目的n

评价考试质量,检验考试的可靠性、有效性。通过对考试的信度、效度、试题的难度、区分度等方面作分析,可以判断此次考试的质量。只有有效的、可靠的考试,才能作为评价教学质量或衡量学生学习情况的依据。n

改进考试工作,提高试题和试卷编制质量。通过对试卷一系列指数的分析,能为我们进一步修改试题、编制试卷提供依据,提高编制试卷的技能、技巧,使测验更趋科学;n

获取教与学效果的反馈信息。对试卷的深入分析,能反馈大量的信息,及时发现教与学中存在的问题,便于采取有针对性的措施或建议,改进教学。二

试卷分析方法2.1定量分析方法n

是指通过对试卷和考试成绩的数理统计分析,得出有关试卷的成绩分布、平均分、标准差、试题难度、试题区分度、考试信度、考试效度等数据特征,用以说明试卷命题质量、教师教学和学生学习效果的分析方法。2.2定性分析(综合分析)n

综合分析是指在定量分析数据结果的基础上,结合考试的具体情况,进行归纳、分析、综合、概括,从而得出具有普遍意义的结论的分析方法。n

如结合定量分析数据结果对不同专业考生具体差异,考生在学习中普遍存在的问题,教学中的薄弱环节等进行分析。n

另外,对试卷命题质量中比如题目表述是否科学、文字表述是否正确以及阅卷情况等直接进行定性分析。2.3完整的试卷分析应是定量分析和综合分析相结合n

从教育测量学理论角度看,定量分析的数据是不完全客观的数据,由此产生的定量分析的结果需要通过综合分析来加以判断和解释。n

综合分析是试卷分析的主体,定量分析只能为综合分析提供辅助的参考依据。脱离定量分析过程的综合分析是片面的,没有综合分析的定量分析是教条的。三

定量分析的主要指标3.1成绩分布统计n

(1)成绩频数分布统计表:以5或10分为一个分数段,统计每个分数段包含的学生数,组成成绩的频数分布统计表。n

(2)成绩频数分布图:将该统计表各分数段的中值和该组学生数对应点依次制成条形图,形成中间高两边低的成绩频数分布图。n

(3)成绩分布曲线图:3.2成绩分布曲线图分类(1)正态分布:以平均值为中心,左右两侧频数分布基本对称,靠近均数两侧的频数较多,而距均数两侧较远时,频数逐渐减少。高分或低分考生数量较少,中间部分数量较多,且其分档情况在成绩解释上比较合理。说明测试结果与学生的实际情况一致,各种难度的题目比例合理。n

(2)正偏态分布:

说明试题难度偏高,难度较大的题目比例偏大,或是教与学效果较差。n

呈这种分布的试题有利于将成绩优秀的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩较差的学生区别开。n

(3)负偏态分布:

说明试题难度偏低,难度较低的题目比例偏大,或者教与学的效果较好。n

呈这种分布的试题有利于将成绩较差的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩优秀的学生区别开。n

一套质量较高的试题,理想的考试成绩分布曲线图应该是呈正态分布。n

课程考试作为一种目标参照性考试,学生成绩呈正态或近似正态分布,都是正常、合理的。3.3标准差和极值n

标准差:描述一组分数离散情况的最常用、最可靠的统计量。考试成绩的标准差用来判断考试分数的集中程度。标准差理想控制范围在7-10;n

极值:指考试出现的最高分数和最低分数,极值既是数据完整性的体现,又是数据的关键观察点;课程考试不应出现0或满分的成绩,0分属于异常数据,

出现多个满分则提示较难考题数量严重不足。3.4试题难度(P)n

试题难度(P)是指能够正确回答试题的人数和参加考试的总人数之比,即指某题的通过率和正答率。试题难度系数与试题实际难易程度正好相反。算公式P=平均分

÷分n

一般认为,难度指数P在0.3~0.7之间为合适,低于0.3太难,高于0.7太易,0.5左右最好。关于难度的几个问题:n

难度水平的确定是为了筛选题目。平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。n

难度水平的确定要考虑及格率,防止损伤学困生的自尊心。n

难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。3.5试题区分度(D)n

区分度(D)是指试题区分考生能力的程度,它基于一个假设:即高能考生比低能考生更有可能正确回答试题。n

区分度的取值在-1.0~1.0之间,D值越大,试题的区分能力越强。D>0时,为积极区分;D<0时,为消极区分;D=0时,无区分能力。n

先将分数排序,P1=27%高分组的难度,P2=27%低分组的难度,区分度D=(27%高分组的平均分-27%低分组的平均分)÷满分值。3.6试卷的效度n

效度是指试卷的有效性和准确性程度,它反映的是考试测量到的与所要测量的二者之间的符合程度。n

课程考试主要考虑内容效度。即指选取的具有代表性的样本组成的考试内容是否能够恰当地代表教学内容(教学目标)总体。n

对课程考试而言,试卷效度是决定考试质量的重要因素。但目前还没有一种切实可行的统计方法可以用来合理地计算试题取样的恰当程度。n

目前对效度的评价,大多是由专家或经验丰富的教师依据考试大纲与考试命题的双向细目表对每道试题进行比较分析来作出估计。3.7试卷的信度n

信度是指试卷的稳定性和可靠性程度。将同一份试卷,对同一组参加考试者进行反复测验,所得结果一致,那么这份试卷就具有很高的信度。n

信度系数的计算方法有多种,如稳定性信度系数、等值性信度系数、内部一致性信度系数。学校试卷分析软件采用的是克伦巴赫(Cronbach)α系数法。n

教育测量学理论认为,对于测验专业理论与能力的试卷,其信度应在0.90以上,信度在0.70以下的试卷不宜采用。四

定量分析结果的解读4.1

成绩分布n

偏离正态分布有两种情况,一是试题难度普遍较大,考生得分普遍较低,使得低分端出现高峰,呈正偏态分布;二是试题难度普遍较小,考生得分普遍较高,使高分端出现高峰,呈负偏态分布。n

当考试分数分布呈明显偏态时,可通过改变试题难度的比例加以调整,使之大体上呈正态分布。4.2

试题难度非正常影响因素n

试题质量:超纲,偏题,怪题,有错误,选项迷惑性太差或太强;n

教学有遗漏,或者对重点强调不够;n

学生不努力,或者对知识点掌握不够;n

学生作弊4.3试题区分度n

研究证明,难度系数P越接近0.5,区分度越好;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论