石大中学物理学科教学论教案第7章 物理教学测量与评价_第1页
石大中学物理学科教学论教案第7章 物理教学测量与评价_第2页
石大中学物理学科教学论教案第7章 物理教学测量与评价_第3页
石大中学物理学科教学论教案第7章 物理教学测量与评价_第4页
石大中学物理学科教学论教案第7章 物理教学测量与评价_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章物理教学测量与评价一、教学目标1.知道教育测量的含义与特点,知道教育评价的含义。2.知道教育测量与评价的主要类型。3.知道常用的教育测量方法。4.知道物理测验的编制步骤。5.理解各种集中量、差异量、相关量的意义,会求各种特征量。6.知道正态分布的特征。理解标准分数的含义与性质,会求标准分数。7.理解信度、效度的含义,理解难度、区分度的含义,会计算难度和区分度。8.知道物理课堂教学质量评价的指标。9.理解《普通高中课程标准(实验)》所倡导的评价观。二、教学重点表示测验分数的特征量、标准分数、测验的质量分析(信度、效度、难度与区分度)。三、教学难点教育目标的编制、教育测验的编制和实施。四、教学方法教师讲授五、教学过程第1节物理教学测量与评价概述物理教学测量与评价是教学测量与评价的一般原理和方法在物理学科教学中的应用。为了正确理解和科学应用这些原理和方法,本节对教学测量与评价的基本知识作一简要的概述。一、物理教学测量的概念、特点和方法(一)测量与物理教学测量1.测量的定义和要素我们把测量定义为依据一定的法则,对事物及其属性用数字或符号加以确定的过程。任何一个测量都包括三个要素:(1)事物及其属性。这是测量的对象或目标。(2)法则。(3)数字或符号,数字指1、2、3等,符号指A、B、C等。2.测量的条件任何测量都是依据某种法则,采用一定的程序对具有某种属性的对象给出可以比较的数值的过程。从这个意义上讲,任何测量必须首先满足以下三个条件:(1)等值单位。(2)参照点。(3)准确性和可靠性。3.物理教学测量我们可把物理教学测量定义为:根据一定的客观标准,运用各种手段和统计方法,对物理教学领域内的事物或现象进行严格考核,并依一定的规则对考核的结果予以数量化描述的过程。(二)物理教学测量的特点物理教学测量不同于一般的物质测量,它具有自身的特点。1.间接性教学测量是一种间接测量。这就使得教学测量具有不可消除的系统误差,因为教学测量只能就有关的外显行为取一组样本,不可能是有关行为的全部。因此,样本的选择是否合理,是否有代表性,代表的程度如何,就导致了系统误差的出现。系统误差的大小,将直接影响着测量结果的准确程度。2.随机性在物质的测量中,我们知道,使用同一工具,采用同一种方法,对某一个量进行多次测量,其结果将不完全相等,这是由于测量中存在着随机误差的缘故。3.相对性教学测量的结果,如果不经转化或转换,它只能表明哪个大,哪个小,只能提供一种顺序关系,不能表明大多少,小多少。目前在教学测量中,人们总是不自觉地将测验所得到的分数看成等距的,而且可以进行加减运算。4.目的性物理教学测量是一种具有明确目的的测量。(三)物理教学测量的方法测量不同的内容应该采用不同的测量方法。常用的教学测量方法有观察法、调查法和测验法。1.观察法观察法是在某种条件下,以观察学生的特定行为表现为目标的测量方法。它只适用于难以用纸笔测量的领域,如态度、兴趣、习惯、操作及技巧等方面。观察法常用的评定工具是制定观察评定量表。2.教育调查法教育调查法是在自然条件下,依据一定的计划,有目的对客观事物或现状进行观察、收集、综合等所要了解的情况,以取得数据和资料,最后形成调查报告。教育调查的基本特征在于着重描述现有事件和现象,在自然条件下,收集有关资料。教育调查的主要作用:①了解教育现状,掌握有关动态和信息,为教育决策提供依据;②可以验证某种假设,发现新情况、新问题,提出新见解或新理论。教育调查的步骤:制定调查方案——实施调查和收集数据——整理和分析数据——写出调查报告。制定调查方案的程序及要求如下:(1)确定调查的目的和任务。(2)确定调查的范围及对象。要根据调查的目的、人力、物力和时间等条件来确定调查的范围;根据调查的目的和任务确定调查的对象。调查的范围要清楚,调查的对象要明确,否则会影响调查资料的准确性。(3)确定调查的项目及指标。(4)选择适当调查方式。教育调查的基本方法有表格法、问卷法、谈话法和个案调查法等3.测验法测验法是通过选取具有代表性的一组试题,组成试卷,对学生施测,然后根据解答的过程和结果,从而获得可靠的成绩评定的一种方法。二、教育统计的基本概念(一)次数分布表对一批数据按一定的次序排列并加以分组,编成反映这群数据在各组上出现次数的统计表格,就是次数分布表。1.次数分布表编制的步骤编制次数分布表是数据整理的基本方法,下面我们结合一个实例来说明次数分布表的编制步骤。【例1】一次物理测验之后,某班48位同学的成绩如下。867763789272668775837447838176829769828871676575708277866093718076785795786479826874738476798668(1)求全距(用R表示)。全距是原始数据中的最大值与最小值之差。因此,为了求全距只要求找出这批分数中的最高分数和最低分数,然后相减就得到全距,即R=max{xi}-min{xi}。式中R是全距,max{xi}为这批数据xi中的最大数,min{xi}为xi中的最小数。在本例中,max{xi}=97,min{xi}=47,因此R=97-47=50。(2)定组数(用K表示)。根据全距决定组数(K)。组数就是对这批数据分组的个数。一般而言,组数以10组为宜,多至20组,少至5组。若组数太多,便会失去实行分组化繁为简的作用;若组数太少,又会引起计算结果的失真。组数与数据的个数有关,若数据多时,要分10组以上;数据少时,可分5—10组。(3)定组距(用i表示)。组距就是每一个组内包含的间距,即组距(i)是指每个小组的组上限(即组的终点值)与组下限(即组的起点值)之间的距离。显然,在一批数据中,组距一般是相同的。组数与组距有关,组距越小,则组数越多;组距越大,则组数越少。根据上面的讨论,我们得到全距R、组距i、组数K三者之间的关系即i=或K=根据上式,由全距R、组距i决定组数时,将全距R除以组距后取整数即得组数i。在本例中,全距R=50,若取组距i=5,则组数K=10.(4)列组限。组限是每一组在数尺上的起始点和终止点,即上下限。从最高分或最低分所在的区间上限或下限开始,以组距为单位依次分组。列组限时,相邻两组的起点和终点,即要连接又不要重叠。在本例中,各组限可写成100-96,95-91,90-86,……;或者99-95,94-90,89-85,……等。(5)求出组中值(用m0表示)。组中值是各组的中点值。组中值等于该组的组限右端点与左端点的值的平均数。在本例中,若取99-95,94-90,89-85……为组限,则各组的组中值为97,92,87……(6)归组划记,登记次数(用f表示)。根据上述所列的一种组限,把所有数据逐一归入相应的组内,再统计归入各组数据的个数(称次数或频数),每组的次数用f表示,总次数用N表示。归入各组的次数可用符号或“正”来标记。根据上述数据和步骤,编制成次数分布表如表8-1。从次数分布表可明显地看出下列信息:①大多数学生的成绩在70—85分之间,绝大多数学生的成绩在65—90分之间。②以75—79分的分数段中的人数为最多。有了次数分布表还可以列出累积次数分布表、相对次数分布表、累积相对次数分布表。表8-1次数分布表组限(1)划记(2)次数(3)累积次数(4)相对次数(5)累积相对次数(6)95-9990-9485-8980-8475-7970-7465-6960-6455-5950-5445-49┰┰正正正正正┰正┰正一 一0一22591276310124918303743464747480.040.040.100.190.250.150.130.060.020.000.020.040.080.180.370.620.770.900.960.980.981.00合计4848/1.00/2.次数分布图它是在次数分布表的基础上利用表中的数据找点,描绘而成的图形。从次数分布图可以看出数据间的关系、数据的大致趋势、数据的总体结构以及事物的变化规律,并可进行数据间的比较研究。①次数直方图。它是根据次数分布表而绘制的直方图。它是在直角坐标系中,以横坐标表示分数,以纵坐标表示次数。在横坐标轴上以组距为单位,并标出各组数据的组中值,在纵坐标轴上等距标出次数值。然后,以各组中值为中心,组距为底,各组次数为高,做出矩形,即可得到次数直方图。②次数多边图。凡是可以用直方图表示的数据都可以用次数多边图来表示。同样,横轴表示分数,纵轴表示次数,以每组数据的组中值为横坐标,以各组的次数为纵坐标,描出各点,连接各点成一个折线,就可得次数多边图(在全距以外的次数取作零)。③次数(或相对次数)分布曲线。次数分布曲线是一条折线。这是因为数据的个数较少,且分组的个数也较少的缘故。如果所考虑的分数的个数逐渐增多,组距逐渐变小,而组数逐渐增多时,图中的折线将逐渐变成光滑的曲线,这种光滑的曲线称为次数分布曲线。分布曲线的形状是多种多样的,常见的有正态分布曲线与偏态分布曲线。正态分布曲线是中间高、两边低、左右对称的曲线。曲线的最高峰即次数的最多处是曲线的中间位置。偏态曲线又可分为正偏态曲线(主峰偏向左侧)和负偏态曲线(高峰偏向右侧)。(二)统计的特征量数在教育测量中最常用的统计量数有集中量数、差异量数、相关量数等。1.集中量数集中量数是指在一批数据中,处于比较中间位置的代表数值,它反映大量数据向某点集中的情况。集中量数的形式是多种多样的,譬如算术平均数、中位数、众数等都是集中量数,但最常用的是算术平均数。算术平均数,简称平均数或平均值,它是用来反映一批数据中某种“水平”的集中量数。假定某一批分数有n个,分别用x1,x2,…,xn代表这些分数,则这批分数的算术平均数(用表示)为=(x1+x2+…+xn)=如果数据较多,利用上式求平均数较繁又易于出错。这时,可先把数据归类,编制成次数分布表,然后再用次数分布表求出平均数。若总次数为n,分组的个数为k,各组的组中值分别为xc1,xc2,……,xck,各组的次数分别为f1,f2,……,fk,得=(f1xc1+f2xc2+……+fkxck)=2.差异量数利用平均数,可以用来反映一组数据分布的集中情况,可以进行组间比较。但只有算术平均数这个特征量数是不够的。要了解一批数据的全貌,不但要看它的集中量数,而且要看它们的离散程度。有时两组数据的集中趋势相同,而离散程度不同。(1)平均差平均差是每个数据与总数据的平均数之差的绝对值的算术平均数。一般用符号AD表示。其公式AD=Σ|x-|式中n为数据个数,为平均数。(2)方差若考虑的数据为x1,x2,…,xn,共有n个,我们将各个数据和算术平均值的差称为离均差。即离均差=x-。我们将每个数据的离均差求和离均差之和==-=-n∵=∴离均差之和=0因此,我们不能用离均差之和来表示一批分数的差异程度。为了消除这种影响,我们可以将每个数据的离均差平方以后再求和,即得到2因为我们考虑的数据共n个,∴S2=2S2称为该批分数的方差。(3)标准差方差的平方根就是标准差,即S=式中,S表示标准差,xi为第i个数据,n是数据的总个数。由此可见,标准差就是各数据与算术平均数的离均差的平方和的平均值的平方根。3.相关量数我们把表示两变量之间相关关系密切程度的量称为相关量数。常用的相关量数有积差相关量数、点二列相关量数、等级相关量数等。(1)积差相关量数积差相关量数,一般简称相关系数。它是用来描述两个正态连续变量或可分数据(如百分制记分的分数)之间线性关联程度的一种相关量数。若设x1,x2,……,xn及y1,y2……,yn分别表示两组数据,则变量x与y之间的相关系数用下列皮尔逊积差相关系数公式来计算r=式中,x表示变量x的各观测值;y表示变量y的各观测值;表示变量x的平均数;表示变量y的平均数;Sx表示变量x的标准差;Sy表示变量y的标准差;n表示数据的总个数。(2)点二列相关和二列相关①点二列相关。在二列变量中,当其中一列是可以测量的连续变量,而另一列为“二值变量”(如对与错、男生与女生、合格与不合格)时,表示这两个变量相互关联程度的相关量数称为点二列相关。计算点二列相关的公式为rpq=式中,rpq表示点二列相关系数的符号;p表示二值变量中某一类占的比例;q=1-p表示二值变量中另一类所占的比例;为连续变量中某一类别p那部分(如答对或男生或合格等)相应数据的平均值;为该变量中另一部分即q部分(如答错者或女生或不合格)相应数据的平均值;Sx为连续变量x的标准差。rpq的取值范围为-1≤rpq≤1。②二列相关在二列相关连续变量中,其中一列变量可以人为地分成“二值变量”,如依一定的标准(60分或75分),把学生的考试成绩分成及格与不及格或依一定的标准把人的身体分成健康与不健康等。表示这样两个变量之间关系的相关量数称为二列相关(用rb表示)。二列相关的计算公式是:rb=•式中,y为p的正态分布曲线纵线的高度,可根据p值在标准正态分布表中查到。rb的取值范围为-1≤rb≤1。其余符号的意义同rpq式。(3)等级相关系数当两个变量以等级次序排列或以等级次序表示,两个变量的总体分布不一定是正态分布时,表示这样两个变量之间关系的相关量数称为等级相关(用rR表示)。其计算公式为式中,rR表示等级相关系数;N表示成对数据的个数;D表示两个变量成对数据等级的差数。rR的取值范围为:0≤rR≤1三、物理教学评价概述(一)物理教学评价的定义我们认为,物理教学评价就是依据物理教学目标,通过系统地收集和处理物理教学信息,对物理教学活动过程和成就进行价值判断、并为改进物理教学实践活动提供参考的过程。(二)物理教学评价的功能物理教学评价的功能是多方面的,概括起来主要表现在以下几个方面:1.评定功能2.鉴定功能3.反馈功能4.激励和强化功能5.导向功能6.诊断功能7.教育研究功能(三)物理教学评价的内容1.学生学习的过程和效果(1)知识与技能。如物理概念、规律和基本技能的掌握情况和提高程度。(2)过程与方法。如学生的观察能力、提出问题的能力、做出猜想和假设的能力、收集信息和处理信息的能力。(3)科学情感、态度和价值观的评价。(4)科学、技术与社会的关系。2.物理教师的教学情况(1)备课。对备课的评价主要包括:教学目标、教学内容和教学方法的设计,以及对学生认知能力、基础知识和非智力因素的了解程度。(2)上课。对一堂课的评价主要包括:教学目标、教学内容、教学方法、能力的培养、师生共同活动情况、教学效果等。(3)学习成绩的考查、作业批改、个别辅导等。3.教师的素质情况(1)教学水平。包括物理专业知识、教育教学业务、教学创造性等的水平。(2)教学态度。包括对教育事业、对学生的热爱,对工作的负责精神和积极性。(3)思想修养。包括正确的政治态度,较高的道德修养,教书育人等。4.物理课程和教材的评价如课程目标、内容与实施、评价计划等。(四)物理教学评价的类型1.宏观评价和微观评价从评价对象的角度可分为宏观评价和微观评价。2.绝对评价和相对评价从评价指标性质的角度可分为绝对评价和相对评价。3.诊断性评价、形成性评价和总结性评价从评价目的角度可分为诊断性评价、形成性评价和总结性评价。4.外部评价和内部评价从评价主体的角度可分为外部评价和内部评价。5.定性评价和定量评价从评价方法角度可分为定性评价和定量评价。(五)物理教学评价的原则物理教学评价的原则是指开展评价活动必须遵循的基本要求。1.目的性原则这一原则是指开展教学评价必须明确评价目的,即明确评价的方向,这是使教学评价能充分发挥其导向功能的根本保证。2.客观性原则这一原则是指开展教学评价时,必须采取客观公正、实事求是的态度,不能主观臆断或掺杂个人感情。3.全面性原则这一原则是指评价内容应尽量全面,评价过程应充分搜集有关信息,以防止评价结论的简单化和片面性。4.一致性原则这一原则是指在进行一次评价或同类评价中,要用一致的标准。5.可行性原则这一原则是指教学评价实施必须符合各项制约条件的要求,使评价活动简单易行,切实可行。6.指导性原则这一原则是指评价应与指导紧密结合,以保证评价目的最终实现。(六)物理教学评价的过程评价的过程随评价理论的不同而不同,下面介绍目标到达度的评价过程:1.评价的对象主要解决评价的客体是什么或评价的领域是什么的问题。2.设计评价指标体系所谓指标体系,就是关于被评价对象的全部因素的集合。在实施评价之前,评价者不仅要将评价所依据的目标加以具体化、行为化,而且要规定好各项指标的权重系数以及各项指标的描述和测量方法的选用,即评价工具的选用。3.运用评价工具广泛地收集资料选用效度和信度高的评价工具收集一切与评价有关的资料。4.处理评价资料在评价过程中,评价者是对各个单项指标进行评价的,但如何将这些分数综合成总分?可按不同的评价方法进行分数的综合。如果所使用的评价工具是常模参照测验,则可运用常模表找出与原始分数相应的量表分数。如果所使用的评价工具不只一个,而是几个,每种工具所测量的数值参照点相同,单位相等,则可用加权平均方法求其平均分数。如果被评价的指标是模糊的,可用模糊数学综合评判法来求得综合分数。5.做出评价结论做出评价结论,就是指形成综合判断和分析诊断问题。所谓形成综合判断就是从整体上对评价对象做出定量或定性的综合的意见。第2节物理学业成就的评价一、对学生学业成就评价的基本理念和目标1.评价的基本理念(1)学生的学习评价旨在促进学生的发展(2)既要评价成绩又要评价学生参与学习的机会(3)倡导过程评价,淡化等级评价(4)重视自我评价(5)突出真实性评价2.评价的目标学生学习评价的目的是促进学生在知识与技能,过程与方法,情感态度与价值观方面的发展,发现学生多方面的潜能,了解学生发展中的需求,使每一个学生通过评价都能看到自己在发展中的长处,增强学习的信心。评价应全面客观地反映教学的真实情况,为改进教学提供真实可靠的依据。二、评价的内容和方法(一)评价内容1.对科学探究过程的评价具体评价的内容包括:提出问题、进行猜想和假设、制订计划、设计实验、观察与实验、获取事实与证据、检验与评价、表达与交流等六个方面。对于每一个具体的科学探究活动,可以有重点地选择其中几项,有针对性地制定评价标准。2.对物理知识与技能的评价对物理知识与技能的评价,主要是学生对物理知识的理解力。这种理解力需要学生对物理概念和规律的理解,需要运用知识进行推理的能力。因为没有交流,就不可能辨别学生学到些什么和学生如何进行推理,所以交流是理解力的第3个要素。包括口头交流和书面交流。3.对科学态度、情感与价值观的评价主要依据学生在学习的各类活动中的表现来评价学生在情感、科学态度和价值观方面的现状和变化。要注意观察,做出记录,并和过去的记录进行比较。学生也应该在这些方面反思自己的表现和内心体验。4.对科学技术与社会关系认识的评价要联系实际、创设情景和寻找范例,来评价学生对有关科学、技术与社会问题的关注程度、参与决策的意识以及对科学、技术与社会关系的认识。(二)评价方法学业成就评价采用的评价方法主要有连续观察与面谈、实践活动、书面测试、个人成长记录等方法。1.连续观察与面谈2.实践活动评价3.书面测试4.个人成长记录三、物理学业成就测验的编制编制试卷的一般步骤如下:1.确定测验的目的编制测验必须首先明确测验的目的,是属于目标参照测验,还是常模参照测验,是形成性测验还是诊断性测验。2.确定测验的目标确定测验的目标也就是为达到测验的目的的需要,确定应测量什么,以及测量到什么程度等具体的测验目标,即要确定测验内容的取样范围和测验的行为目标,要对所测量的内容范围和能力要求做出具体规定。3.确定试题的形式试题的形式有客观型试题和主观型试题。一个完整的物理测验,应当包括各种形式的试题,以全面考查学生的认知行为。4.制订命题计划为了科学合理地进行测验,应根据测验的目的和目标,制订命题计划。制订命题计划的目的是:①保证试题是教材内容的代表性样本,且能反映各部分教材的相对重要性,以便使试题取样适当,提高测验的效度和信度;②由于规定了各种知识层次,不同能力试题的分配比例,为使试卷具有合理的难度和区分度提供了依据。5.编制试题编制试题的具体依据:①命题双向细目表;②编制测验的基本原则;③不同题型的具体编制要求。6.集合成测验试卷在编排试题时,试卷的格式、试题的排列顺序,要符合一定的要求;试题的难易排列,要有层次,先易后难。编制测验的试卷,一般应有正题、副题以及补考题等,几份试卷要等价平行。7.试做试卷命就后,教师必须亲自或指定其他教师进行试做,对学生能否按规定的考试时间答完全卷,做出较准确的估计。8.编制标准答案,规定评分标准标准答案要简明准确,评分标准要客观合理,能使分数合理反映考生的水平。以上编制测验的步骤,主要适用于教师的自编测验,至于标准化测验除了要满足以上原则外,还有其它具体要求。四、测量的质量分析与评价(一)信度1.信度的概念是对同一组考生测验成绩的稳定性程度,多次测验所得成绩的一致性程度,是衡量测验质量高低的一个重要指标,这个指标我们称为测验的信度。对信度的理解应注意以下几点:①信度是指测量工具(试卷)所获得结果的可靠性,而不是指测量工具本身的可靠性。②每一个信度估计值,只是指某一特定类型的一致性而不是泛指普遍的一致性。所谓“一致性”包括的种类很多。③对信度的检验完全采用统计的方法。2.信度的估计方法估计信度的方法很多,如表8-3。表8-3估计测验信度的方法比较方法意义程序一致性重测法稳定性量数以相同的测验对同一批考生在不同的时间内测量两次同一测验不同时间所得结果的一致性复本法等值性量数以等值的两个测验在同一时间内测量同一批考生等值的两个测验在同一时间所得结果的一致性重测复本法稳定及等值性量数以等值的两个测验在不同时间内测量同一批考生等值测验在不同时间所得结果的一致性。折半法内部一致性量数实施一次测验,将测验分成等值的两半,计算这批考生在两半测验上所得分数相关性,并用公式加以校正同一测验中在所包含的各试题上所得成绩的一致性库理法实施一次测验,计算每个题目的难易度和考生得分的方差,代入公式α系数法实施一次测验,计算每题的方差和考生得分的方差,然后代入公式上表中前三种方法均需测试两次,并用两次测试结果的相关系数表示信度;而后三种方法是比较常用的方法,可从一次测试中求得信度。(1)分半信度估计①当假定两半测验分数的方差相同时,可用斯皮尔曼—布朗(Spearman—Brown)公式:rS-B=来计算整个测验的信度。式中,rS-B为整个测验信度的估计值,r为半测验的信度。②当两半测验分数的方差不相等时,可用卢朗(Rulon)公式或盖特曼(Guttman)公式直接求得测验的信度rR=1-式中,Sx2为学生在整个测验中总分的方差,Sd2为两半测验分数之差的方差。卢朗公式又可转化为盖氏公式rG=2(1-)式中,Sa2与Sb2分别表示两半测验分数的方差。(2)Kuder—Richardson估计法当试题全为二值性(指答案只有对、错两种情形)的试题且试卷无法分成等效的两半时,可采用Kuder—Richardson公式中之一来估计整个测验的信度。K—R20和K—R21是常用的两个公式。K—R20:=[1-]K—R21:=[1-]式中,n表示测验的题数;p表示某题答对的比率(即难度);q=1-p表示某题答错的比率;pq表示二分值记分题目的方差;Σpq是求和符号,表示所有题目的pq的乘积相加;Sx2表示总分的方差;表示整个测验的平均数。采用K—R20公式估计信度时,当二值性试题的满分值不相同时,均应变成“0—1”型(即答错得0分,答对得1分)后,才能使用此式。而且K—R20要求试题的测量特征相同、难度适中(在0.33至0.7之间),否则,计算结果将有偏低的倾向。K—R21公式要求所有的题目难度相同,否则,计算结果有偏低的倾向。当各试题的难度相差悬殊时,更是如此。对此测验专家又设计了一个校正公式=[1-](3)α系数法在实际测验中,当试题分成两半的等效性无法保证时,且试题为非二值性试题,或一份试卷中既有二值性试题又有非二值性试题时,一般可用α系数法来估计测验的信度,其公式为rα=(1-)式中n表示题数,Si2表示考生在各题上得分的方差,Sx2表示测验总分的方差,i=1,2…,n。3.影响信度的因素(1)试卷的长度(2)受分数分布的影响(3)试题难度的影响(4)评分者的影响(5)命题过程的影响(6)测验实施过程的影响(7)考生本身因素的影响4.目标参照测验的信度—复本估计法B测验A测验通过未通过通过ab未通过cd下面介绍一种常用的估计目标参照测验信度的复本估计法。表8表8-4则rxx=其中a表示两测验中都通过的人数,d表示两测验中都未通过的人数,n表示样本容量。(二)效度1.效度的概念效度是衡量测验结果的有效性或准确性的质量指标,是反映测量结果与所要测量的结果相符合的程度,是一个测验对于它所欲测量的行为特征,能够测量到的程度。根据美国心理学会1974年出版的《教育与心理测验的标准》一书,将测验的效度分为三大类:内容效度、效标关联效度和结构效度。下面主要介绍一下内容效度。2.内容效度(1)内容效度的概念及其意义内容效度是指测验内容对所要测量的内容的代表性程度。也就是说测验的内容范围、材料与所要测量的内容范围、教学目标是否符合,测验中的试题所引起的行为是不是所要测量的属性的明确反应,测验的结果是不是一个具有代表性的行为样本。对内容效度的检验不能用数量化的指标来反映测验内容的有效性程度,它是在某种证据的基础上做出的判断,我们不能由此认为内容效度是不重要的。而实际上测验有效性的核心问题就是保证内容的有效性。除此之外,对于内容效度的理解还必须注意以下几点:①测验的内容包括教学内容和教学目标,所以教学内容和教学目标是内容效度的两个要素。②当我们要以测验结果作为了解一个学生在某一学科的整体表现时,应采用内容效度来评价。③在考虑内容效度时,还要注意避免和表面效度相混淆。所谓表面效度是指一个测验在表面上直觉地认为这个测验的有效性程度。一个具有良好的内容效度的测验必定有良好的表面效度;反过来就不一定成立,某个测验具有良好的表面效度,并不一定能保证其所测量的内容范围及其教学目标具有代表性,亦即并不一定能保证有较高的内容效度。(2)提高内容效度的方法为了使测验的内容具有有效性,在编制测验时,如能遵循下列步骤就可以提高测验的内容效度。①对教材中所包含的内容和教学目标进行系统的逻辑分析,并对所欲测量的内容范围及能力加以界定,在此基础上将各部分的内容和教学目标分类,使之明确化、具体化。②根据各部分内容及教学目标各个层次的重要性,确定其比重。③编制命题双向细目表。细目表要能体现所要考查的内容重点和目标重点以及它们之间的相对重要性。④根据命题双向细目表编制有代表性的试题,并按表中的比例恰当分配试题,组成整个测验。(3)检验内容效度的方法①逻辑判断法。检验内容效度的方法,一般是由本学科的专家或有经验的教师根据测验的目的、测验的内容范围以及各部分内容和教学目标各层次的比重,用逻辑分析的方法,对编拟的试题能否符合命题细目表中的考查内容和考查目标,能否符合细目表中所规定的权数做出判断。符合的程度愈高,内容效度就愈好。在有些情况下,也可以借助下面两种数量化指标来检验内容效度。②相关法。测验的内容效度也可以用反映同一内容范围的两个不同的测验,对同一组被试者施测结果的相关系数表示。若相关程度高,表明测验的内容效度较高;若相关程度低,表明测验的内容效度低。但这种方法在个别情况下,也可能两个测验的取样偏向同一个方面,而造成虚假的高相关。③再测法。对同一组被试者用一个测验的两个复本在某一学科教学或训练前后实施测验,该测验内容的有效性可以由两次测验成绩差异的显著性来加以判断。如果两次测验分数的平均数之差在统计上有显著意义,则表明测验所测量的内容正是教学或训练的内容。3.影响效度的因素(三)难度1.难度的涵义难度是指测验题的难易程度,它是试题对学生的知识和能力水平的适合程度的质量指标。表示难度的数量指标叫做难度指数,用P表示。难度只具有统计意义。在常模参照测验中,要求试题难度适中,即大多数题目的难度在0.3—0.7之间,少数题目可超出这一范围,使整个试卷的平均难度在0.5左右。2.估计难度的方法(1)用试题的答对率(或通过率)计算难度用公式可表示为P=式中,P表示试题难度指数,R表示答对某题的人数,n表示参加测验的总人数。①此方法适用于二值性试题的难度估计。②0≤P≤1。P值越大,试题越容易;P值越小,试题的难度越大。③这里的难度指数实际上是容易度(即通过率或答对率、得分率),真正的难度是指不通过率、答错率或失分率1-P。由于国际上均使用容易度表示难度,而且没有不良的影响,所以我们这里也采用这种表示方法。(2)用考生答对某题的百分比表示难度用公式可表示为P=式中,P表示试题的难度指数,表示所有考生在该题得分的平均数,ω表示该题的满分值。①此方法适用于非二值性试题,如计算题、简答题、论证题等。②P表示试题难度指数。③利用上式也可以估计整个测验的平均难度,这时是考生总得分的平均值,ω是试卷的满分值。(3)用“两端分组法”估计试题的难度用两端分组法来计算试题的难度的步骤是:首先把考生的总分进行由高分到低分的排列;其次从最高分开始向下取27%的考生作为高分组,从最低分开始向上取27%的考生作为低分组;然后计算高分组答对该题的百分比PH,低分组答对该题的百分比PL;最后由下式计算该题的难度。P=3.评判试题难易的一般标准在实际运用中,人们通常把试题的难度划分为5个等级,并以此作为判断难易程度的标准。表8-6评判试题难易的一般标准评判等级难较难一般较易易难度指数0.00--0.190.20—0.290.30—0.590.60—0.790.80—1.004.影响难度的因素一般来说,影响题目难度的主要因素有:①考查知识点的多少。②考查能力的复杂程度或层次的高低。题目中涉及的能力层次越高,题目就越难。③考生对题目(或内容)的熟悉程度。④命题的技巧性(题目中的信息与干扰)。另外,试题的难度与学生的素质(知识、能力水平)有关。(四)区分度1.区分度的涵义试题的区分度是指试题对不同知识和能力水平的考生的区分程度和鉴别能力。若试题的区分度高,则能力强、水平高的考生得分较高;能力弱、水平低的考生得分较低,这样就能把不同程度的考生区分开来,以利甄选。若试题的区分度低,则不论何种程度的考生得分都相差不多,这样的试题区分和鉴别能力较差。2.用“两端分组法”计算试题的区分度这种方法与计算难度的两端分组法相同,只是计算公式不同,它是用统计某题的高分组通过率(或百分比)PH与低分组的通过率(或百分比)PL之差表示某题的区分度,即D=PH-PL式中,D称为区分度指数。-1≤D≤+1。当D=+1时,表示高分组全部答对,而低分组全部答错;反之,D=-1;若两组答对的百分比相同,则D=0。3.评价标准D值越大,试题的区分度越大。艾贝尔(1965)提出了根据区分度指数D值的大小对试题质量进行评价的标准。表8-7区分度指数与试题质量之间的对应关系区分度指数D评价0.40以上非常良好0.30—0.39良好,如能改进更好0.20—0.29尚可,用时需作改进0.19以下劣,必须淘汰或加以修改,以提高区分度五、选择题的选项分析选择题的选项分析是指对选择题后面所提供的几个备选答案进行的统计分析。考查正确答案是否对的太明显,错的答案是否起到了干扰的作用,分析的结果可作为修改试题的依据。其分析的方法是将所有考生的测验总分,从高到低排列,并从高、低两端各取27%(或33%)个测验分数,组成高分组和低分组,然后再根据高分组和低分组的考生对每一个试题的选项人数加以分析。通常情况有以下几种:①高分组全部答对,低分组只有少数人答错。②对于不正确的选项,若高分组和低分组没有一个考生选择,说明选项不具有迷惑性。一般认为选项的迷惑率未达到2%,就应该考虑修改此选项。③对于某一错误选项,若高分组选择人数高出低分组很多,教师应作调查,了解高分组考生选答该选项的原因,由此对该题做出判断。④若对某一错误选项,高分组和低分组几乎所有考生都选择,则可能是试题答案有误或教学上发生错误所致。⑤若高分组和低分组在几个错误选项上选择的比率相当,则很可能由于题目编制不当所致。⑥若高分组与低分组选择正确选项的比率相当,则区分度很低,说明该题所测内容与考生的能力水平无关。⑦若对某题,高分组有大多数人答对,而低分组则无一人答对,则题目太难。⑧若几个选项都有人选择,且正确选项高分组选择的人数多于低分组,几个错误选项低分组选择的人数多于高分组,此题难度适中,区分度较好,此题应当保留。六、学生学业成就的评价的一种质性评价方法:档案袋评定1.档案袋评定的涵义档案袋评定法应用到教育也是汇集学生作品的样本,但它们的目的和内容,是为了展示学生的学习和进步状况。档案袋制作的进程,涵盖了一项任务从起始阶段到完成阶段的整个跨度。档案袋内容的选择或提交,通常是由学生和教师共同决定的。2.档案袋评定的意义档案袋评定的主要意义,在于它为学生提供了一个学习机会,使学生能够学会自己判断自己的进步。3.档案袋评定的类型表8-8档案袋的类型类型构成目的理想作品产生和入选说明,系列作品,以及代表学生分析和评定自己作品能力的反思。提高学习质量。通过一段时间的成长,帮助学习者成为自己学习历史的思索者和非正式的评价者。展示主要由学生选择出来的学生最好和最喜欢的作品集。自我反思与自我选择比标准化更重要。给由家长和其他人参加的展览会提供学生作品的范本。文件根据一些学生的反映以及教师评价、观察、考查、轶事、成绩测验等得出学生进步的系统性、持续性记录。以学生的作品、量化和质性评价的方式,提供一种系统的记录。评价主要由教师、管理者、学区所建立的学生作品集。评价的标准是预定的。向家长和管理者提供学生在作品方面所取得成绩的标准化报告。课堂由三个部分组成:①依据课程目标描述所有学生取得的成绩的总结;②教师的详细说明和对每一个学生的观察;③教师的年度课程和教学计划及修订说明。在一定情境中与家长、管理者及他人交流教师对学生成绩的判断。4.应用举例:物理学习记录第3节物理课堂教学质量的测量与评价一、课堂教学质量检查与评价的意义和特点为能对教师的课堂教学工作做出科学的评价,使之为调控课堂教学工作提供更有价值的教学反馈信息,必须依据课堂教学的客观规律,运用现代测量理论,对课堂教学的各个环节进行综合的检查与评价,并对教师完成课堂教学目标的程度做出科学的判断。课堂教学质量评价是依据课程标准,根据教育学和心理学的理论,对课堂教学目标、课堂教学内容、教学方法、教师的教学素养、教学效果的科学判定。教学评价具有自己的特点。1.测量性2.选择性3.指导性4.促进性5.复杂性6.模糊性二、课堂教学质量评价指标体系的设计评价物理课堂教学质量的指标体系应包括以下几个方面:1.教学内容主要从教学内容的设计和教学信息的传授这两个方面进行考查,其考查内容主要包括:①教学内容的处理。②教学重点和难点的处理。③教材中能力和情感教育因素的挖掘。④物理概念和规律的讲解。⑤联系实际。⑥演示实验的操作和讲解。2.教学方法主要从教学原则的贯彻和教学技巧的运用这两个方面进行考查。其考查内容主要包括:①教学过程中的启发思维。②教学过程中的因材施教。③教师的语言表达。④演示实验的选择和运用。⑤教师的板书、板画。⑥课型的选择和教学环节的安排。3.教学态度主要从课前准备和教学过程中的组织教学这两个方面进行考查。其考查内容包括:①掌握教材的程度。②课堂习题的选择。③课外作业的布置。④教态。⑤教学过程中的时间利用率。⑥课程进度和学生负担。4.教学效果主要从课程标准的3个维度进行考查,其考查内容包括:①学生的学习行为。②学生的学习意识。③课堂教学秩序。④学生对知识的理解。⑤学生学习能力的表现。⑥对情感教育的效果。三、课堂教学质量评价的实施1.依据评价指标体系,制作评价表评价表一般由评价项目(主因素)、评价内容(子因素)和评价等级等部分组成,其中评价项目、评价内容应以评价课堂教学质量的指标体系为依据,由于它们都具有模糊性,因此,作为评判结果的量化指标也应该是模糊的,通常用好、较好、一般、较差、差五个等级作为评判标准。2.搜集和整理评价信息对课堂教学质量实施评价的基本过程是:评定人员首先深入到课堂听课,并认真做好听课记录,然后根据授课情况,在课中或课后对评价表中的评价内容逐一做出评判,即在相应的评判等级空格中打“√”。一般要求对每个具体的评价内容只能选择一个评判等级。最后将各评定人员的评价表收集汇总,进行分类统计,做出评价汇总表。3.确定评价因素的权重在课堂教学质量评价中,由于每个评价因素在综合评价中的地位和重要性是不同的,因此,必须事先对各种评价因素在评价中的地位和重要性做出量化规定,即确定每一评价因素的权重。4.课堂教学质量综合评价的量化处理根据课堂教学评价的这一特征,其综合模糊评价的量化处理步骤是:按照影响课堂教学质量的各因素之间的逻辑关系,先对子因素做出评价,并建立起相应的子因素模糊评价集;然后在此基础上,依据各子因素与相应主因素之间的模糊关系,对各主因素做出评价,并建立起相应的主因素模糊评价集;最后再依据各主因素与课堂教学质量所保持的模糊关系,对课堂质量做出综合模糊评价。四、评价结果的反馈为了充分调动教师的教学积极性,不断改进薄弱环节,根据自我反馈的强化作用原理,要将测量和评价的结果及时反馈给教师个人。评价结果对被评者来说是一个极为敏感的问题,被评者的自尊心、自信心和情绪都会受到评价结果反馈的影响。反馈时要注意方式方法,尽可能避免引起被评者的心理冲突。反馈时要以平等的态度,抱有良好的期望。可采用启发式的反馈方法,引导教师自我认识。有时可只讲等级,只作一分为二定性解释的模糊性反馈和在适当范围内反馈,如个别交谈,回避他人,以防扩散否定的评价结果。如有条件,还可以录像。向被评人反馈意见时,把评议讨论、定量评价和观看录像相结合效果会更好。如果要求学员改进后再录、再放、再评,则会起到强化和提高教师课堂教学技能的作用。总之,要根据不同对象和不同条件采取不同的灵活多样的反馈方式。第4节物理教师的评价一、教师评价的内容和标准1.职业道德这是评价教师是否具备从事教学工作的前提。职业道德包括(1)爱心;(2)正直诚实;(3)公正;(4)上进;(5)奉献/职业热情;(6)健康心态。2.学科知识这是评价教师是否具备从事学科教学的基础。学科知识包括(1)认识科学探究的性质,认识科学探究在科学发展

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论