考试评价分析及诊断基础与实务_第1页
考试评价分析及诊断基础与实务_第2页
考试评价分析及诊断基础与实务_第3页
考试评价分析及诊断基础与实务_第4页
考试评价分析及诊断基础与实务_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE55教育部首都师范大学基础教育课程研究中心“中小学考试评价诊断技术培训与推广工程”项目考试评价诊断技术基础与实务(简略稿)内部资料,仅供实验组成员使用主编臧铁军副主编李奕、郑开义编者张警鹏、郑启跃、李延林、段启章首都基础教育发展研究院2010年5月专题一学校考试需要改革(略)一、考试不要被异化 二、考试与评价三、学校考试是为了改进和指导教学四、考试的根本目的是为了学生进步五、考试也是学习六、考试质量分析不应徒有虚名七、考试分析实践促进学校考试变革八、学会运用考试和分析考试,是教师的职业要求九、正确使用考试和分析考试,是减轻学生负担的可行途径专题二有关考试的基础知识(删减)一、考试命题和考试分析的逻辑联系二、掌握一点考试命题的基本知识(一)考试命题的基本原则(二)深刻认识试题,才能编制好试题1、试题的基本含义测验的基本构成元素是测验题目,也称为测验项目,俗称试题。考试试题是为了实现特定的检测目的,对学生提出要求在有限时间内完成的规定性指令的问题。有人将试题定义为:在教育和心理特质测试中,试题是一个测量单元,它具有刺激情境和对应答形式的规定,它的目的是要获得被试的应答,并根据应答对学生的某些心理特质方面的表现(如知识、能力等)进行推测。(三)编制试卷的一般要求编制试卷和命题前需要对命题工作有一定的思考,拟订命题计划,对命题需要遵循的一些原则性问题要有所规划。主要内容包括两方面,一是对试题和试卷编制的原则要求,具体说明考试的目标和内容范围、考试方法和试题类型、编制试题和组配试卷的要求等;二是对试卷中试题的分布规定,具体规定出考试内容中各部分的试题数量和占分比例,常常需要列成某种形式的表格,如“双向细目表”。(四)试题命制的一般要求1、每一道试题必须涉及一定的内容领域和明确的认知行为或学科能力表现。2、试题考查的应该是学科的重要内容。 3、精心选择题干材料和设计试题情境。4、编制试题的答案与赋分等级。5、要设置恰当的试题难度与区分度结构分布。(五)命制客观题的基本要求1、题干与选项的关系2、题干的编写3、备选项的编写4、选择题的测试特征(六)命制主观题的基本要求1、试题情景材料的选择2、编制试题设问3、制定参考答案与评分标准三、描述考试及考试结果,需要运用相关指标(一)正态分布在概率论与数理统计中认为,连续的随机变量X的概率密度分布函数Y如果服从如下关系式,就说该变量遵守正态分布(也称为高斯分布)。这里和分别是该变量的平均值和标准差。正态分布最早由数学家高斯得到,它广泛适合观测的误差等很多种场合。这个分布可以从某种合理的假设出发而推导出来,所以被认为是理论依据比较充分的概率分布。20世纪科技界流行的一种观点,认为很多自然现象似乎都应当符合正态分布,很多理论工作也是在正态分布的假设上形成的。这些工作提高了正态分布的地位。从理论上看,正态分布具有很多良好的性质。

根据统计学的中心极限定理(如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布),只要学生足够多,他们的水平分布一般应接近于正态分布。1、正态分布曲线下的面积2、分布的偏态总体的次数分布可能是对称的,也可能非对称。偏度就是反映次数分布的非对称程度的偏态指标。(1)以算术平均数与众数或中偏度为0,是正态分布;偏度大于0,称次数分布为正偏态;偏度小于0,称次数分布为负偏态。分布的偏态图像,如下图所示,有正偏态(右向)和负偏态(左向)。3、分布的峰态次数分布曲线与正态分布曲线相比,可能更尖顶,或者更平顶。峰度就是反映次数分布曲线顶端尖峭程度。(二)教育统计分析指标用统计的方法对考试原始资料进行处理,需要使用教育统计的一些基本统计指标。如:总量指标(总人数、总题数、总分数);相对指标(次数分布、比率、累加比率);平均指标(平均分、众数、中位数);变异指标(标准差、方差、标准差系数)等。主要介绍如下。1、平均指标平均指标的数值表现称为平均数,它是在统计中广泛使用的一种综合指标。它反映现象的所达到的一般水平,也反映了总体发布的集中趋势。(1)算术平均数平均数是集中量数中最常见的一种,又分为算术平均数、调和平均数、几何平均数等。教育测量中常用的就是算术平均数(平均分),又称均值。算术平均数的计算公式是:式中,是平均数,是学生分数,是学生数。(2)中位数将所有学生的成绩按照大小顺序排列,居于中间位置的那个数值就是中位数,用表示。(3)众数众数是在学生成绩中出现次数最多的数值,一般用表示。2、变异指标变异指标是反映总体标志值发布特征的另一个重要的综合指标,它反映总体各单位标志值的变异程度,也称为标志变动度。(1)标准差与方差标准差是一种变异指标,反映标志值的离散程度,即是度量数据分散程度。方差即是标准差的平方,两者都是常用的统计指标。标准差一般用表示。标准差的应用较广泛,作为反映总体分布离散特征的代表值,往往应用于描述总体分布状况的其他有关指标的计算中,包括在正态分布、相关分析、回归分析、误差估计、区间估计、推断估计中都有应用。标准差的计算公式为:(2)标准差系数将标准差与相应的平均数对比,就得到标准差系数,用表示。标准差系数可以用于比较不同平均水平的总体的标志变动度的大小。标准差系数的计算公式是:3、相关系数相关系数是在相关分析中得到的量数。在分析两个变量之间联系的密切程度时,即用直线相关分析的方法,求得他们之间的相关系数,以相关系数的大小来表达两个变量之间联系的密切程度。(1)点二列相关系数点二列相关适用题目是0、1记分(或者是二分变量),而测验总分是连续变量的数量资料,其计算公式为:式中,p和q分别是正确率和错误率。(2)积差相关系数在教育统计中,用积差法来测定相关系数的比较多见。积差相关系数的计算:由于该计算公式是通过将各个离差相乘的方法来说明相关程度的,所以通常把它称为“积差法”相关系数公式。积差相关系数也可以用以下公式计算:相关系数r的意义是:相关系数的值域从-1到1,r为正值时,表示x与y之间正相关,即一个变量增加或减少时,另一个变量也相应增加或减少;r为负值时,表示x与y之间负相关,即一个变量增加或减少时,另一个变量却相反地减少或增加;相关系数r的绝对值值愈接近0,x与y之间的直线相关程度愈小;反之,相关系数r的绝对值愈接近1,x与y之间的相关程度愈高。分布相关性意义的形象表达,见下图。一般认为,相关系数绝对值的大小在不同范围时,表达了不同的相关程度:相关系数r的绝对值大小相关程度等于

0完全不相关0.00~0.3

0微弱相关

0.30~0.50低度相关

0.50~0.80显著相关

0.80~1.00

高度相关等于1完全相关,变量x、y之间存在确定的函数关系(三)教育测量的质量指标考试评价分析中要使用几个主要测量指标,如信度、效度,以及项目分析指标难度、区分度。对学生学业的考试测评,经常是通过编制专门的测验来进行。测验是对学生学科教学活动行为的客观和标准化的测量,通过测验的数量化结果,来反映学生的学习成就及其在某学科学习方面的个性心理特征。衡量测验必须具备是可靠的和有效的,才能够保证测验可能是客观的和科学的。在对学生学习的测量中,一般用信度和效度来分别检验考试的可靠性和有效性。1、信度所谓信度是一个反映测验可靠性的指标,它是对测量—致性程度的估计。信度指的是测量结果的稳定性或可靠的程度,亦即测量的结果是否真实、客观地反映了学生的实际水平。信度是任何一个测量的必要条件,一个测验如果是可靠的,它就同时表明即使是重复测验多次,其测量结果都是一致的和稳定的。信度是任何一个测量的必要条件,对于教育测量来说,只有信度高的测量才能成为教育工作有用的工具,否则,测量的结果是不可相信的、无意义的,也就不会是有效的。具体而言,可以从以下三方面来理解测量的信度。首先,信度指实测值和真值相差的程度。测量的目的之一,就是希望通过澜量得到的实测值能够接近事物的真值的大小。由于各种原因,实测值一般不会完全等于真值,两者之差称为测量误差。测量误差越小,测量的信度就越高。其次,信度指统计量与参数之间的接近程度。统计量和参数是统计学中的两个基本概念。统计量是指样本上的各种数字特征(如样本的平均数、标准差等),参数是总体上的各种数字特征(如总体的平均数、标准差等)。统计量越接近参数,这个统计量的可靠性便越高,因此,信度就越高。要知道统计量与参数的接近程度,可以对参数进行区间估计。第三,信度指两次重复测量或等值测量之间的关联程度。如果对同一对象进行两次重复测量或者等值测量后,计算两次测量的相关系数,相关系数越高,说明测量的信度就越高;反之,就越低。信度的计算可以用以下方法:复分相关法:对一次数学测验来说,我们可以把测验材料设计为内容、形式、题数、对应题目的难易程度都相等(实际上是大体相当)的两套试题(A、B卷),每个学生都做这两套试卷,以系统的标准评分,然后计算学生对A、B两卷得分的相关系数,若相关系数较大,则可认为信度高,测验可靠。分半相关法:其思想与复分相关法是一致的。它把一次测验试卷的题目按某种方式(如单、双号或按难度编号等)分成两部分,使这两部分的对应题目的难度一样,题数相等。然后计算学生对试卷所分成的两部分试题之得分的相关系数,当相关系数合乎要求时,认为信度高,测验的可靠性强。α信度系数:当考试题型较多时,可采用克龙巴赫α系数。该系数是从试题数量、学生试题得分的方差、学生总分的方差之间的关系计算得出。2、效度效度是指测量结果的准确性和有效性的程度,是对一个测验所要测量的东西是否被测量到和测量到什么程度的估计,即表明测量是否达到了预期的目的。效度是描述测验有效性的指标,它可以说明该测验的准确性程度。对于任何一种测量来说,效度也是必不可少的条件。测量是否达到了预期的目的,我们可以从以下几方面来理解效度:首先,测量的效度始终是对一定的测量目的而言的。一般而言,任何测量都有某种特定的目的和功能,判断效度的高低,就是判断测验达到目的的程度。如果能正确、真实地测量出所想测量的东西,那么,对这一目的效度是高的;反之,则是低的。其次,测量的效度也是对测量的结果而言的。一种测量工具只有经过实际测量,才能根据出来的结果判断它的效度。所以,也可以把效度理解为测量的结果正确反映所欲测量的特性或功能的程度。第三,一种测量的效度只是高或低的问题。因为,一种测量在编制时,总是针对一定目的而编制的。例如,要测量学生的数学能力,我们不会用语文题目来作为测题,总是会用一些数学题的。因此,学生的数学能力或多或少会反映出来一些,不会毫无反映。换言之,测验结果总有一定的效度,只是效度高低不同罢了。第四,在教育测量中,效度问题比在其他领域的测量更为重要。因为:首先,教育测量的对象大多是精神现象,只能通过对其具有可测性的外部表现(如言语和动作等)的测量,以间接认识其心理活动、心理特征或知识水平等;其次,学生的心理活动、心理特征与其外部表现之间,一般仅具有相关关系而无函数关系,外部行为并不能准确无误地反映某种心理状态。此外,教育测量的对象不是物而是具有主观能动性的人。人能有意识地调节自己的外部行为,掩盖自己的内心活动,这就增加了认识其精神现象的难度。所以,每当进行教育、心理之类的间接测量的时候,必须考虑是否测量到了所要测量的东西,在多大程度上测量到了这些东西。也就是说,必须考虑测量的效度问题。在学业成就测验中,考察其效度,多采用“内容效度”。内容效度指的是测验的内容在多大程度上,可以反映测验的学科性目的,这与学科测验所设计的测验题目有极大的关系。一般用编制的双向细目表来表达内容效度。3、项目指标信度与效度是从整体上对测验的客观性和科学性的考察。为使测验更具有科学性和合目的性,我们还需要对每一个试题进行分析,这种研究称为项目分析,它通过研究题目的难度及其区分度,以综合考察考试的质量。(1)难度难度是反映测验题难易程度的指标,是被试完成题目或项目任务时所遇到的困难程度。定量刻画被试作答一个题目所遇到的困难程度的量数,就叫题目的难度系数,也常称为难度值。难度系数的大小,用全体学生在试题上的平均得分率来表示。计算公式为:式中,是难度系数,是该题目的平均得分,是该题目的满分。难度系数的值域在0~1区间内。难度系数愈接近1,表示试题愈容易,试题难度愈小;反之,难度系数愈接近0时,表示试题愈难,试题难度愈大。编制试题时,要根据测验目的要求来预设试题的难度,以难易适当为好。试题过难或过易,都不利于了解学生的实际水平。(2)区分度区分度是指测验题目对学业水平不同的学生的区分程度或鉴别能力。具有良好区分度的测验,实际水平高的被试应该得高分,实际水平低的被试应该得低分。所以,区分度又叫鉴别力,即试题对于不同水平的被试反应的区分程度和鉴别能力。题目区分度是测验性能的一个重要指标,说明的正是题目对于测验目的来说的有效性程度。区分度的分析方法,大约可以归纳成两类:一为外在效标法,即分析被试在测验题目上的得分与外在客观标准上的表现之间的关系。另一为内部一致性法,即分析被试在测题上的得分与在整个测验总分之间的一致性程度。在实际操作中,主要使用的是后者,从这个意义上说,区分度的实质,就是题分与总分的相关程度。区分度的计算,可以用高低分组法、点二列相关系数法、积差相关系数法。客观题的区分度为点二列相关法:主观题的区分度为积差相关法:高低分组法是将高分组在特定题目上的得分率和低分组在相同题目上的得分率之差,(高分组和低分组人数比例各占总人数的27%),作为题目的区分度。计算公式为:式中,是区分度,和分别是高分组和低分组的得分率;和分别是高分组和低分组在题目上的平均得分,是该题目的满分。区分度的值域范围在一1至+1之间。区分度为正值,称作积极区分;区分度为负值,称作消极区分;区分度为0,称作无区分作用。具有积极区分作用的项目,其区分度越大,区分的效果越好。采用高低分组法计算的区分度的评价标准,一般有以下看法:区分度评价0.40以上优良,试题区分能力非常良好0.30-0.39合格,试题区分能力尚好,如能改进更好0.20-0.29尚可,需修改,试题区分能力较弱0.19以下应淘汰,试题区分能力不好,或改进试题以提高区分度后方可被使用任何测验的目的之一,都是希望能够鉴别学生的实际水平。这实际上也体现了测验的信度和效度在题目上的具体要求。区分度的高低,直接影响到测验的信度和效度。在使用区分度指标时,要注意分析与难度的关系。一般认为,试题的区分度与试题的难度有比较密切的关系。四、考试原始数据需要收集与统计整理(一)考试原始数据的开发1、考试数据信息的收集与整理考试后,将每一个学生的试卷得分数据信息都收集起来,包括每一个小题的得分数据、选择题的具体选项信息等等。越详尽越好。客观题最好用机读卡作答,将读卡机读取的答题信息储存起来。2、编制学生成绩原始数据登记表将学生的考试成绩编制成Excel登记表。在表头标题,标明学校、科目、考试名称;在表中栏目,列入学号(id)、姓名(name)、班级编号(class)、题号(T1、T2…按题号顺序排列);在表心内容格中,具体列入每个小题的选项、得分等等详尽信息。如下Excel表,以备导入数据处理系统:××学校××学科××考试数据登记表收集数据时注意:(1)对考试数据,要用《中国考试分析网》专门的软件进行处理,考试数据必须录入在Excel模板表格中,便于数据分析系统认读。(2)对客观题,录入学生每个选择题的具体选项,或者将机读卡的选项信息直接通过读卡机录入;(3)对主观题,录入具体的得分;(4)一个试题(大题)下,列有几个小题分别计分的,需要录入各个小题的得分。大题合计得分不要录入;(5)一个小题下,设有分别计分的多问,尽可能分别录入每一问的得分;此时小题合计得分也不要录入;(6)卷面总分,不必录入。(二)试题结构分类在对考试数据进行计算机处理之前,需要对试题信息进行分类,提出数据需求,然后经过计算机处理的数据信息,才能够适合于分析与评价的需要。整个试卷的测试功能,是由卷面所有试题具体承担和履行的。每一个试题都具有一定的考查目标,试题的合理组合,形成一个结构比较完备的测试。所以,在分析考试的时候,也就需要对试卷所有的试题进行功能结构性的分类,再整理出相应的考试数据报告,从考试的数量关系中去挖掘和发现考试中所隐藏的教学信息。对每一份学科试卷,均需要学科教师认真地对试题考查目标进行分析,从几个视角对试题进行分类:1、题型结构分类:按客观题、主观题,或者按具体的题型,将所有试题分别归类于各个试题类型中。2、知识结构分类:按学科的知识结构分布关系,根据试题按所考查的主要学科知识特点,将所有的划分到各个学科知识结构组块中去;对于学科内知识综合性较大的试题,也可以单列为特定的组块。3、能力结构分类:按学科能力的考查要求,根据试题主要考查的能力特点,将所有试题归类到各个能力组块中去。具体学科的能力结构分类,可以参照高考《考试大纲》、《考试说明》、《课程标准》、《教学大纲》的要求来制定。4、基础性和发展性层次结构分类:考查基础性内容的试题,主要是针对《课程标准》最低要求来命题,带有更多水平性测试的色彩;考查学生发展性潜在能力倾向的试题,主要是针对选拔性目标来命制的试题,带有更多选拔性测试的色彩。将所有试题归并为这两类结构之中,以透过考试数据的分析,去发现学生在学业成就的基础方面、以及学业的发展潜能方面的测试信息。5、试题其他属性结构的分类:根据考查的目的及其对考试的研究和认识深度,对试题的属性有可能从其他多个角度进行分类,从而得到试题其他属性的结构划分。例:试题的结构划分组块名称组块代码试题题号总分主客观题组块1客观题组块KG1、2、3、4、5、6、7、8、9、10、11442主观题组块ZG36.1;36.2;36.3;36.4;39.2;40.2;56知识结构1知识组块1ZS112、9、10;122知识组块2ZS123、4、5、6、7、8;36.1;323知识组块3ZS131、11、;36.2;39.2;274知识组块4ZS1436.3;36.4;40.2;29认知能力层次1识记RZ12理解RZ211;39.2;133分析综合RZ35;9;36.1;36.2;36.4;40.2;454应用RZ41;2;3;4;6;7;8;10;36.3;425评价RZ56、编制Excel结构分布表将试题的结构划分的内容转换成Excel表,如下。以备导入数据统计分析系统。(三)数据处理在《中国考试分析网》上点击进入系统,用密码登录,导入Excel考试原始数据,再按要求导入试题结构分布Excel表。点击相应输出按钮,系统可自动生成总体(学校及班级)试题及结构的对比分析表。再根据分析者的需要,点击相应按钮,系统可输出相对应试题及其各个结构的详细的数据统计图、分组分析表。(四)考试数据分析统计图表比较完备的考试数据分析图表,包括如下统计表和统计图:1、描述总体属性的图表:总体次数分布图;总体主要分析指标明细表;总分次数分布表;总体各个试题的主要指标明细表。2、描述结构的图表:按题型、知识结构、能力结构、基础性发展性结构,各个相应的组块,都有次数分布表、分布曲线图、分租分布表。3、描述试题的图表:试题难度曲线;试题分租次数分布表;选择题选项分租分布表。对考试的分析与评价,相应需要分层次地进行,逐步深入,形成有价值的分析结论和评价意见。一般分三个层次进行分析:总体分析与评价;结构分析与评价;典型试题的分析与评价。五、考试数据统计图表是发现问题的窗口(一)统计表及其意义统计表是用来表达统计指标与被说明的事物之间数量关系的表格。统计表所反映的数据具有系统、完整、简明、集中的特点,可供使用者查阅,进一步的计算、分析与比较。统计表是用来表达统计指标与被说明的事物之间数量关系的表格。统计表所反映的数据具有系统、完整、简明、集中的特点,可供使用者查阅,进一步的计算、分析与比较。总分分析指标表;次数分布表;分数分布表、选项分析表(选择题、非选择题)1、总分分数分布表总分分数分布表是按照分数大小顺序排列的分组统计表,如下表。分值人数比率累加百分比率100580.70.7991171.52.2981281.63.9971311.75.6961662.17.7951882.410.1942122.712.8932062.615.5……830100610100210100合计7795100利用此表,可以根据需要查阅一些数据信息,比如得到这些信息:(1)查阅60分以上的累计百分比率,知道该学生总体的及格率为86.1%;(2)将全体学生分为四个等第:优秀(85以上)、良好(70~85)、合格(60~70)、不合格(60以下),查阅得到四个等第各自比例分别为:36.5%;35.1;14.5%;13.9%;(3)确定某一录取线,可查阅上线率为多少;或者,根据录取率来确定录取线;(4)在分析中,有时候需要将总体划分为几个组,可以查阅分组区间确定上限、下限;(5)对应某一水平可查阅相应的结构比例,反之,对应一定的结构比例,也可查阅相应所处的水平;(6)利用此表,可以查阅或者计算众数、中位数,计算平均数、标准差;7、以此分布表为基础,可以得到总体分布曲线;等等。2、整卷主要指标明细表考试数据分析中,描述总体在几个基本指标列示在此表中,如果反映总体的基本分布特征状态及测量结果。满分最小值最大值平均数标准差方差难度数学总分150514883.1228.92836.370.55表中,满分150是试卷设定值;最小值5、最大值148是测试结果中的极端值;平均数83.12是全体学生的平均分,是总体的代表水平,也反映总体的分数分布集中趋势是向平均数83.12这一点靠拢;标准差28.92、方差836.37反映总体分数的离散程度;难度0.55表明试卷总体的困难程度,可以认为此卷的平均得分率是55%。有了这些数据,结合考试的性质,可以作出一般的判断。比如,这是高考试卷,可以认为难度比较合适;离散程度达到一定的水平,它的区分功能一定不差;没有得到满分的学生,可见试题对高端的控制还比较紧;等等。如果这是高中会考的试卷,则认为,平均水平不及格,这需要认真分析原因所在;虽然它的区分功能比较好,但作为水平性考试,试题的难度就过大了;最低分只有5分,本是个别现象,但它引起我们再关注低分段的学生的结构比例,查阅总分分布表,观察未达标的学生情况,以及等第分配情况;等等。3、各题主要指标明细表此表列示了试卷所有试题的几个主要指标数据。此表数据更进一步地描述了各个试题的数量特征,此表数据可以引导我们更深入地分析试题的测试结果情况。满分\最大值平均数标准差方差难度区分度k154.002.004.000.80.367(**)k252.392.506.240.48.328(**)k353.732.174.730.75.391(**)k451.692.375.590.34.356(**)k552.472.506.250.49.238(**)k653.902.074.300.78.370(**)k752.852.486.130.57.457(**)k853.362.355.520.67.372(**)t954.791.001.010.96.297(**)t1054.211.823.320.84.480(**)t1154.111.923.670.82.478(**)t1253.312.365.590.66.465(**)t1353.911.893.580.78.484(**)t1452.712.104.420.54.678(**)t15128.333.7714.230.69.754(**)t16138.524.5320.550.66.784(**)t171410.203.9615.670.73.744(**)t18135.553.5512.600.43.717(**)t19144.853.1910.150.35.779(**)t20142.433.2210.390.17.666(**)kgzf4024.398.8077.460.61.751(**)dt23023.046.8146.410.77.811(**)dt38039.8817.45304.360.50.946(**)zgzf11062.9222.79519.290.57.967(**)对上表数据,至少可以有如下分析:(1)各个试题的难度表现情况:最难的试题有t20、k4、t19,比较难的试题有t18、k2、k5,中档题……,较容易的题……;(2)各个试题的区分度表现情况:区分度较小的有k5、t9,……;可以看出,客观题的区分度来得较小,主观题的区分度来得较大;(3)试题的难度分布结构情况:难度在0.4以下,0.4~0.7,0.7以上的各个试题题量及赋分值各是多少……;(4)试题的区分度分布结构情况:区分度在0.2以下,0.2~0.3,0.3~0.4,0.4以上的各个试题题量及赋分值各是多少……;(5)对各个试题的数据信息特征,综合几个指标信息,结合具体的试题设置和设问,可以深入分析为什么会出现这样的情况……;(6)客观题kgt、主观题zgt两个组块的数据分析,能够得到何样的结论……;(7)结合不同的试题所考查的知识内容及其能力要求不同,为什么会出现这样的情况,反映出何样的问题……;(8)如果还能够列示出其他结构组块的数据,又会分析出何样的结论……。4、选择题选项分析表这是针对某一个具体的客观题的数据分析报表,反映出试题的更深入的数据特征。借助此表我们可以更深刻仔细地分析试题的考查结果。表中1~7组,是将全体学生按卷面成绩从低到高排列,对学生总人数等分为七组。第一组是最低分组,第7组的最高分组。打﹡号的选项为正确选项。此表将A、B、C、D四个选项在各组中的分布人数,以及所占的比例都列示出来,便于我们发掘数表中隐含的教学信息。选项\分组1234567总人数比率平均分未答211200170.0068.86*A14317817721326832458118840.3296.41B2071991851511291034110150.1772.31C18413192706031115790.1063.72D30733538940838738621024220.4182.02合计84484484484484484484459081.0083.12对于此表,我们可以作如下分析:(1)正确选项在各个组的分布情况表明,随卷面总分的增加,从1到7组的答对人数不断增加,说明存在较好的内在一致性;(2)正确选项的总体通过率为0.32,其他三个选项的总体分布,分别是0.17、0.10、0.41,说明都有一定的干扰作用,其中,选项D的干扰最大,其选择率已经超过了正确选项;(3)结合试题的选项具体内容,分析为什么会出现这样的分布情况,为什么有那么多的学生选D?特别是第4、5、6、组选D的人数都超过正确选项人数,说明在教学上有关A与D的知识内容理解和掌握上,存在一定倾向性的问题,今后的教学该如何把握……;(4)对B选项的知识内容,干扰作用其次,只是在第7组才明显降低,其教学的启示何在?(5)对C选项的内容,只是在低分段学生存在一定的干扰,中等以上的学生的干扰就比较小,其原因何在?数表所表现的数量关系是学生的学科能力作用的结果,学科教师必须结合自己的学识和教学经验、以及对试题的理解进行分析,数据是死的,只有结合教学内容分析,才能够将数据背后鲜活的教学信息挖掘出来。5、分组分析表此表列示的数据表明是一个主观题的分数分布情况数表。选项\分组1234567总人数比率平均分04582471708968341010760.1855.912836553483723133220.0569.69312610872533322114250.0764.87517742454965470676581040850.6993.25合计84484484484484484484459081.0083.12(1)此题的采分点有三个,分数档次是0、2、3、5。(2)得满分的人数占69%,试题难度居中偏易。具体的难度值,可以查各试题的指标明细表得到;(3)此题得低分的学生主要集中在低分段1、2、3、组学生,中等以上学生一般表现还不错,也有少数高分段学生丢分的,但不存在倾向性的问题;(4)结合试题的具体考查内容和要求,分析为什么学生能够有较好表现,反映出是怎样的学科问题在教学上处理是较好的,其中的经验是什么……;(5)较差的学生表现出的问题,反映在教学上,该如何针对低端学生情况,有所改善教学的措施,值得思考……(二)统计图及其意义统计图是用来表达统计指标与被说明事物之间数量关系的图形,是表现数字资料的一种重要形式。统计图所反映的数量关系具有形象、直观的特点,使人一目了然、便于理解、印象深刻。不同的统计图形适用于不同数据和不同的场合,表达了特定的数量变化关系极其分布特征。但从统计图中通常不能获得确切的数字,因此不能完全代替统计表。考试分析中,总分分布图、次数分布图、难度曲线图等。1、总分分布曲线图总分分布曲线图的横坐标表示卷面总分,纵坐标表示人数,曲线表达了在不同卷面得分的人数多少的分布状态。一般地,当学生人数比较多的时候,总分的分布曲线接近于正态分布。如下图,曲线的总体分布趋势,在稍有偏离对称分布的情况下,显负偏态,低分段的曲线有拖尾巴现象,高分段人数比例相对稍大。2、分数分布图下图是一个直方图,它表达的基本数据意义与上图是一样的,只是图中的直方图形的宽度代表分数分租的组距。此图一般应用于结构组块的分析、试题的分析。3、难度曲线图难度曲线图的横坐标表示卷面总分,纵坐标表示难度。曲线上的点表达了相同卷面得分的学生在该试题的平均难度值,随着卷面总分的分布变化,对应难度值的点就表现为曲线状态。难度曲线表现出:由试题平均难度表达的得分水平,随卷面总分的变化而变化的趋势状态。下图的曲线表明,卷面总分在100以下的学生,在此试题的得分率基本上在0.2左右摆动,此段曲线表现为水平振荡的状态,说明卷面总分在100水平以下的学生,对试题解答的反应基本没有差异;从100分以上开始,曲线随卷面总分的增加逐渐向上扬起,其得分率也逐渐向1靠近;卷面总分达到140分时,该试题的得分率达到1,即回答全部正确。从曲线的变化趋势可以看出,这个试题是选择题,比较难。对卷面成绩110分以下的学生,能够正确回答的人数较少;但此试题对卷面成绩110分以上的学生的区分能力特别强,能够正确回答的学生,对其总分有较大的影响。六、定量分析必须与定性分析结合对统计图、表数据解读与所考查的知识、能力要求以及教师的教学经验和学识结合。解读数据时,一方面是根据数据表达的数量特征与数据关系的差异,去发现其中隐含的教学信息;另一方面是根据教师自己对考试问题的主观经验判断和感觉与考试数据之间的差异,去发现数据实证意义所表达的教学信息。对统计图表的数据报告的解读时,既注意解读指标及数据本身的意义;又要注意挖掘数据之间关系所隐含的教育信息;有时候还要根据分析问题的需要对数据进行适当的加工整理,发掘数据潜在的教育价值。1、数据本身意义的解读考试数据统计图表中的每一个数据,都是某一个指标的指标值。指标是事物某方面属性的名称,指标值表达事物这一属性所达到的水平。比如“平均分”,平均分是一个指标名称,是表达一个群体得分的一般水平的属性;平均分为80分则表达了得分一般水平的程度。对平均分这一指标而言,人们已经约定俗成的认为,60分为合格水平,60分以下为不合格,85以上为优秀。这些约定俗成的看法已经作为隐含的信息潜伏于平均分指标的含义中。在分析平均分是多少时,可以把隐含的信息呈现出来作为判断标准对实际平均分的意义作一些阐释;同时还可以联系群体的得分分布、最高分、最低分等等相关因素来解释实际平均分的意义。在考试分析中,会应用多个指标,例如百分比、累积百分比、难度、区分度、标准差、标准差系数等等。在使用这些指标值时,最好不要简单地说是高是低、或者高多少低多少,可以联系指标本身的含义对指标值大小所表达的意义作诠释。在诠释中一旦我们将指标值大小与相关联的考试定性的信息联系在一起,比如考查的什么内容、试题要求如何、相关知识在教学中是如何被处理、考查的结果教师自己感觉如何等等因素联系起来分析该指标值的大小,你就可以发现这个数据就“活”起来了,不再是一个干巴巴的数字,是个引导我们发现问题、思考问题的关节点,是值得挖掘的消息源。2、数据之间关系的解读(1)分析问题时,注意挖掘几种相关数据图表的信息,结合考查内容和教学经验进行综合分析。(2)通过对一个整体问题中的局部数据的分析对比,结合学科内容挖掘教学信息。(3)善于对某一问题中相关联的几个小问题的数据联系起来分析,发现教学信息。(4)注意合理地对不同群体的同一问题作对比分析(5)注意不同时期的同一问题的变化情况,(6)同一总体的相同问题,在不同时间阶段的数据解读3、对数据的加工和分析方法的应用随着考试评价分析工作的开展,教师们掌握了分析技术后,完全可以进入自主探究的状态,来研究考试,研究学生,研究教学。在分析中可以根据自己探究的需要对数据进行加工,配探究目的对数据进行重新组合,在更深的层面发现和探讨教学问题;或者对不同层次的学生进行类别重新划分,进行差异分析;或者对特殊群体,比如尖子生、学习困难学生作专题分析;或者积累不同年度的学科数据,揭示学科教学与考试的发展趋势问题。还可以将这种分类分析的思想迁移到教育的其他领域,比如对学生的心理健康调查、情绪兴趣调查、学习方法的调研、思维类型的测试等等。《中国考试分析网》提供的数据处理系统能够适应这些分析的需要,具有操作的灵活性。七、考试评价的系统分析方法考试评价是通过对考试实证性数据的分析,以考试数据统计的定量关系分析为基础,结合教师定性的教学经验,从试题命题立意、试题材料、设问方向、学生的心理反应等角度,以理性的科学的分析、判断得出评价结论。考试评价研究构建的定量与定性相结合的研究方法,能够促进教师深化对考试的认识,提升教师的教育测量专业素养,对于研究教学及考试活动,具有示范性和推广应用价值。由学科教师根据考试数据分析统计报告资料,以实证数据为基础,读懂并发现数量变化所反映的考试事实之间联系的信息,同时以自己所掌握的学科教学情况以及学识经验对数据信息进行分析,最终以评价标准为依据对考试现象作出判断。通过考试评价分析的手段,是为了优化教学行为,提高教学质量。对评价分析中发现的问题进行分析诊断的步骤一般是:1、寻找数据分布具体表现所反映出来的问题;2、结合教学要求和教学实际以及学生的学习状况,分析和挖掘教学之所长和可能存在的不足之处;3、客观地分析和比对,明确诊断意见,确定教学调整的措施,制订针对性的解决方案;4、在教学实际中实施调整措施和解决方案,开展教学诊治工作;5、跟踪教学实际,考察教学效果,反馈教学信息,完善教学环节,取得教学成效。考试评价研究实践证明,评价分析思想和研究方法的应用,能够有效促进教师考试评价观念的转变,使得过去以评价指标为依据的“达标性评价”(发现优点的评价),逐步向以促进学生和教师发展、帮助师生寻找问题的“发展性评价”过渡。这种以发现问题、暴露缺点为目的的评价,就如同我们体检时一样,为我们清楚地了解自身状况,解决问题,健康成长提供有益的参考。“暴露问题的评价”中,考试数据的统计图表就是学生的“学习化验单”,教师结合自己的教学经验和学识,分析“化验单”对学生的学习状况得到准确的“学习诊断”,再依据教学要求开出“学习处方”或“教学处方”,在教学实践中进行教学“调理”。过去总是有人说,医生是“专业”,教师只能算是一个“职业”,其义所指是教学缺乏科学性,只限于教学经验层面。如果学校教育实践中能够以考试评价的数据“化验单”为基础对学生学习心智作科学的分析,以此指导教师的教学行为,就体现了教育工作的科学性、专业性。看来,教师的专业性需要科学的教学研究方法为奠基。应用定量与定性的科学方法,避免了仅凭个人经验偏好所形成的偏见,能够客观反映学生的学业水平及其内在结构的不平衡性,较好地实现了对试题、学生水平的分析评价,并折射出教学过程和教学质量问题,得出的评价意见比较客观,具有科学性、针对性,便于科学地改善学科教学实践和帮助学生发展。(一)考试评价分析的一般程序为了实现考试评价分析的目的,考试评价分析工作应遵循一定的逻辑程序:一般而言,拿到考试数据统计图表后,有一个“分析判断诊断教学反馈意见”的工作过程。分析:发现和解读考试数据图表的数量特征,数据之间的关系,以及所表达的问题;判断:与考试标准进行对比,在各个不同的方面对进行总体与总体、整体与部分学生群体进行比较,发现考试的结果的差异性,并结合实际教学对考试现象作出判断;诊断:根据考试现象,确认学生学业成就的优势与不足,结合具体的考试内容及其要求,联系教学与学生实际,对问题的原因提出诊断的意见;教学反馈意见:分析诊断的目的是为了今后改善教学,通过对考试结果的分析和发现问题的所在,提出今后教学该如何改善的意见,对学生发展提出有针对性指导建议,促进实际教学工作得到改善。这是考试评价分析工作的逻辑延伸,是实现考试目的的必要措施。考试数据的统计分析图表报告,就类似于人们看病的“化验报告”;分析、判断、判断过程就类似于医生在分析化验报告和查看症状后,对病情得出的“病情诊断书”;提出教学反馈意见,就类似于医生开的“处方”,有病治病、无病可防,使人们更加健康。(二)考试评价分析的原则有详细的考试数据统计分析报告,它只是提供了考试评价分析的基础条件。我们要善于借助统计数据去发现其中的教育信息。分析中,我们要注意把握基本的分析原则:1、借助于对考试结果数据的统计分析,来进行信息挖掘,是从量的方面来探讨测量数据与学生学业水平的联系。分析中,数据是分析和发现问题的重要基础之一,但不能够仅仅只看数据,将考试数据绝对化。测量本身存在系统误差和随机误差,需要客观地看待考试数据。2、对一个问题进行数据分析时,一般不要仅就一个数据(指标)来分析描述,往往需要使用相关的多个数据(指标)。事物总有多方面属性,用多个指标数据描述,可能更全面。单从某一侧面来诠释,既可能失真,又可能以一概全,还可能掩盖了其他事实。3、在分析中,我们会进行多方面数据的比较。在应用数据进行比较时,一定要注意被比较数据的同质基础。只有反映相同属性的数据才能够进行比较,否则,可能得出不正确的结论。4、一定要采取定量与定性相结合对分析方法。一方面,定量与定性结合的研究方法才是科学的;另一方面,考试分析不可能脱离与考试相联系的定性因素,比如命题思想、考试内容、能力要求、教学背景、学生的学习基础、考试环境等等。离开考试相关的定性因素只孤立地说考试分数多少,是没有意义的,甚至是错误的。所以,教师在考试评价分析中,一定要将定量的考试数据与教师自身的定性教学经验及学科学识相结合起来,才可能是更科学的分析,得出的分析结论才可能是客观的,有建设性的。(三)考试评价分析的程序及报告结构从学校考试评价的分析对象看来,一是对学校或者班级群体的整体学业水平进行分析,二是对学生个体的学业水平进行分析。这两种分析研究的对象不同,但同样都是针对考试及其考试结果这一教育问题作分析,分析工作需要遵循问题本身构成的内在结构层次性。具体地讲,考试评价分析的程序需要从问题的总体、问题的结构、问题的微观三个层面来剖析考试的教育意义:一是从研究对象在考试中的整体表现情况来分析,即总体分析;二是从研究对象在考试的各个内在结构方面(题型结构、知识结构、能力结构等)的表现情况来分析,即结构性分析;三是从研究对象在每个试题(或典型试题)上的表现情况来分析,即典型试题分析。通过三个层面的分析,综合起来形成对问题完整的分析表达;分析中发现问题并给予判断、诊断,发现问题所在,得到分析结论,最终要提出解决问题的办措施,形成完善的教学反馈意见何在建议。这三个部分的分析再加上第四部分的教学建议,就形成完整的考试评价分析报告。1、总体分析学校考试分析的内容主要是对全体学生学业水平进行评价分析,所称的“总体”,是将参加考试的全体学生构成一个整体,作为评价分析的对象。对学生水平进行总体评价,是依据考试大纲、考试说明对学生学业水平、学科能力的要求,参照教学大纲(课程标准)的相关内容,对学生总体在测试中所表现的学业水平及学科能力状况上,进行综合性的评价。在对学校进行“总体评价”部分,一般需要进行以下方面的分析:(1)评价和分析学生的总分分布、等第分布状态所表达的学生水平情况,是否是学生真实水平及教学成果的真实表达,是否符合学生的客观实际;(2)评价和分析学生整体在所测试的内容和能力方面,是否得到应有的展现;(3)分析学生得分率的分布情况及其与学生水平的关系;(4)分析学生总体水平的差异情况,等第分布与学生水平的关系;(5)分析和提炼学生水平在总体状态、生源结构背景、变化趋势、教学影响因素等方面呈现的突出特点。分析中,可以进行对比分析,可以是与上年度对比,也可以结合对不同年级学生或者城区郊区学生水平进行对比分析。分析中要注意学生的整体特点、考试性质、测试功能的差异,依据相应的标准对学生学业水平及教学给予客观的分析和判断。针对学生个体进行考试评价分析时,“总体”的意义就发生的变化,其实就是将学生对一份试卷的所有试题的反应构成一个整体,也就是卷面总分。分析的内容主要针对个体在总体分布中的位置和所居层次,分析其表现情况。注意总分对于群体的相对意义和对于考试标准的绝对意义;注意个体总分在总体分布集中与离散特征背景下的特殊意义;注意总分对于个体自身的发展性意义;注意总分相对于学生平时表现特征的潜在性意义。2、结构分析对于学校或班级群体而言,根据试题结构分类统计图表的数据,分别分析学生整体及不同层次学生对各个类别特点测试的反应情况。结构分析对一个学校、一个班级而言,是特别重要的。它能够帮助我们发现教学方面带有倾向性的教学问题,对改善学校、班级的学科教学能够提供较强针对性的参考信息。具体需要分析如下内容:(1)对学校整体分析同一类别的不同结构组块之间(比如知识分类中的不同知识组块)的数据表现及其差异,如分析各自分布状态和表现、进行相互对比,结合具体考查的内容和要求、以及教学的实际情况,分析隐含其中的教学信息。(2)对学校整体某一组块的分布特征及不同层次学生的表现差异,结合具体考查的内容和要求、以及教学的实际情况,分析隐含其中的教学信息。(3)对同一学校不同班级在分类结构及其结构组块的数据表现及其差异,如分析各自分布状态和表现、进行相互对比,发现各个班级在学科结构方面的相对优势与不足,结合具体考查的内容和要求、以及教学的实际情况,分析隐含其中的教学信息。(4)对一个班级的某一组块的分布特征及不同层次学生的表现差异,结合具体考查的内容和要求、以及教学的实际情况,分析相对优势与不足产生的原因,分析隐含其中的教学信息。对于学生个体而言,其结构分析是指对学生个体在分类结构各个组块所表现的水平进行分析。既分析学生个体在各个结构组块所表现的均衡性,也分析个体与群体各个结构组块平均水平的差异性。提高综合两方面情况对学生学科结构分类方面所表现的优势与不足,发现学生学科心理特质,以便于有针对性地帮助学生实现学科结构均衡发展及调动学生潜能得到最优化的发展。3、通过典型试题分析学生水平通过典型试题来分析学生水平,是选择合适的试题作为载体,分析学生对测试项目的反应表现以揭示学生的学业表现,借助于数据图表所表现的数量关系,凭借学科专家对实际教学状况的把握和教学经验,以便对学生水平和教学质量方面作出分析与评价。结合具体的试题,从学生对命题立意、试题情境、设问的反应作答以及学生答案与参考答案的契合方面,结合考试大纲的要求及实际教学状况等因素,挖掘数据隐含学生考试反应的教学信息,通过观察数据的分布状态,发现学生对试题反应的表现状态及其差异性,对学生在知识掌握、应对学科问题新情境的经验、思维操作等方面进行剖析。通过学生群体的考试分数分布情况和群体中不同层次学生的不同表现,以探索学生的学科能力以及学习心理的状态及其变化,由此对学生的学业水平及学科能力得到判断,有助于深化对学生发展状况的认识。从而把握学生的学科能力,相应地反馈和投射到教学情况,以便教学参考,更有效指导教学,达到改善教学的目的。(1)分析学生对试题立意的反应针对试题的命题立意,从数据上分析学生测试结果在多大程度上体现了命题立意思想的实现;学生的测试反应在多大程度上反映了学生学科能力的本质特征;学生的表现在多大程度上体现了教学改革和考试改革的成果等。分析学生应答试题需要的学科能力是什么,需要怎样的知识复制和再现,还是在理解的基础上需要怎样的提炼、概括、抽象、推理、运算、演绎,还是需要结合试题设置的特定情境分析出知识考点的特殊含义、知识考点间的联系,还是需要对试题的情境进行充分的理解、体验,然后应用所学知识有针对性地整理加工形成答案,还是需要根据试题情境的实际问题,结合自己的实践经验和掌握的有关知识作答。(2)学生对试题情境的反应分析学生面对不同的试题情境,其数据分布有何特征,所反映出的教学信息是什么;对不同的试题情境表现,学生要调动的情境经验是什么,学生的反应敏感如何,差异性表现在何处,体现出学生的能力状况有什么特征;学生对试题情境材料中信息搜集、处理加工和整合能力如何,存在的问题及其原因是什么;不同类型的学生,对试题情境的反应有何差异等。(3)学生对试题设问的反应分析学生对试题设问反应的主要思路如何,数据分布表现与学生解决此问题有何种内在联系;分析学生要借助何种知识或者经验及其迁移,在何种范围、何种程度上形成思路、完成哪些思维操作下的解题步骤,才能达到解答要求。思维操作的过程与解题的步骤是吻合的。完成解题的过程是在思维不断地指导下进行的。有的试题解答要求的思维链条长,相应地解题步骤多或者解题思路的跳跃性大,所需要的时间比较长;有的试题要求的思维链条短,相应地解题步骤少,解题思路简单,所需要的时间就比较短。学生的表现是否存在非正常状态,结合具体的试题内容分析学生的学科思维及解题思路,从中发现存在的问题;对于有层次性的设问,数据表现是否符合应有的梯度;对不同层次要求的试题设问,数据是否有对应的表现,出现的差异性的原因何在,反映出的教学问题是什么;等等。(4)学生正确作答与参考答案之间的契合程度学生在解答问题时就必须得思考,根据试题的情境设计及任务要求设置,回答问题和解题过程的书写表达,要达到什么样的程度才能合乎要求?表达时一定要注意使用规范的学科语言或术语。绝大多数试题设置唯一正确答案的情况下,学生对试题反应作答与答案设置之间存在的差异何在,反映出学生。的问题在哪。在考试实践中,我们很容易发现:对于主观题,学生的实际作答与设计的参考答案之间可能存在差异很大;对于客观题,设置的干扰选项与由题干引发不同学生的不同认知之间有着内在逻辑关系,评价者要善于研究和发现学生对试题作答的认知基础,及其解题思维形成的心智过程,以及实际作答结果与预设参考答案的契合程度。选择典型试题,主要是选择能够较好实现测试功能的试题,比如:能力立意的导向下学生水平得到充分展现的;学生水平的差异性得到了合理表达的;从教学的经验判断与测试结果相比较,差距较大,从而能够发现学生水平和教学可能存在某个薄弱点的;能够反映学生水平或教学存在问题的;学生水平在不同的试题结构上,或者题型结构、或者知识结构、或者能力结构的某方面存在突出的、倾向性的表现的试题;等等。4、教学反馈信息及教学改进建议基于以上三个层次的分析和评价,结合评价依据、高考内容改革的趋势以及教学改革方向,针对考生水平的客观情况,归纳性的提出对今后教学调整的建设性意见,并作必要的分析和说理。通过考试分析得到的教学反馈意见,是为了今后改善教学和促进学生学科能力水平提高的参考意见,可以指出哪些方面是应该肯定的、或者应该发扬的、或者应该改进和调整的、或者应该弥补和加强的等。教学反馈意见的内容,可以涉及到教学指导思想、教学方法、教学环节的、教学内容、学生学科能力的全面发展等不同层面的问题。表达教学反馈意见时,注意建议有据、联系实际、适当分析、拓展指导。教学反馈意见一定来源于考试分析。教学反馈意见一定是通过考试分析折射出的教学问题,然后联系教学实际的状况,进行剖析;反馈意见的分析基础主要在总体评价、结构性评价、典型试题评价部分呈现,在反馈建议中,可以适当地作点分析,但分析不是主要的。教学反馈意见应该对今后的教学改进有具体的指导意见,要有操作性。专题三考试评价为了促进学校改进教学一、教学与考试的共性(删减)(一)教学与考试,都需要将学科知识“心理学化”(二)教学与考试,都需要针对学科最有价值的知识(三)教学与考试,都需要把握学科的本质特征(四)教学与考试,都是师生之间关于学科内容的交互活动二、针对学生群体学业总体水平的考试分析学生水平评价中所称的“总体”,是将所研究的学生群体视为一个整体,作为评价的对象。依据课程标准、或考试大纲、或考试说明中对学生学业水平、学科能力的要求,对学生总体在测试中所表现的学业水平及学科能力状况,进行综合性的评价。在“总体评价”中所关心的问题有:一是要分析学生的总分分布、等第分布状态及其特征,从分布中判断学生水平的情况;二是分析学生整体在所测试的内容和能力方面,是否得到应有的展现,是否符合客观实际,与教师所预期的结果是否相符;三是分析学生总体水平的差异情况,等第分布的差异;四是结合学生的生源结构、学业背景、变化趋势、教学影响等因素,分析形成总体分布的客观原因。分析中,可以进行对比分析,或与历史资料作对比分析。三、针对学生群体知识结构与能力结构的考试分析在考试分析中,对全部试题的考试情况进行分类处理,是一个很重要的分析策略。所谓分类,实质上是将相同属性的事物(试题)归类在一起,同时将不同属性的事物(试题)区分开来。经过对同类事物(试题)相关数据的统计分析,其统计指标的数量特征就能够反映出这类事物(试题)的指标属性特征,能够揭示这类事物(试题)内在属性的规律性。统计学认为,统计的数量关系,反映了事物数量变化的内在规律性。这是我们借助统计分析进行考试评价工作的学理依据所在。划分试题的视角可以是题型结构、知识结构、能力结构等。对试卷分析,教师还可以根据自己对试卷、试题的观察,选择新的视角,如课程模块内容、试题选材、试题是陈题或新题、试题的基础性或发展性等角度对试题进行归类,以发现学生对不同属性试题的反应情况。从学生构成方面,也可以对不同层次的学生进行归类统计,以发现不同类别的学生在各个试题结构方面表现出来的差异性,以便更好地帮助不同层次学生赢得发展。(一)题型结构划分根据试题的题型,对试卷的全部试题进行归类划分(试卷上一般都标示得比较明确),可以划分为客观题、主观题;也可以根据具体的题型对考试数据进行分类处理。(二)知识结构划分将试卷的全部试题按学科的知识结构划分,或者按知识类型划分,比如物理学科分为力学、电学、热学、光学等;或者按教科书模块划分;或者按章节内容划分。还可以根据试题材料来源于课内、课外,或者教师根据试题情况选择自己所关注的观测点对试题考查内容进行划分。教师对本学科知识结构的划分,大家一般都比较熟悉,此处不赘述。(三)能力结构划分学科能力是有结构的,这一观点在心理学得到认同。但对某一具体学科的学科能力到底应该怎样划分它的结构,在学科心理学或学科教学领域却众说不一。在高考实践中,对“能力立意”的命题指导思想越来越被教育界认可,全国统一的《高考考试大纲》对高考学科的能力结构分类,就成为高考学科划分学科能力的主要参照。(四)结构分析方法介绍1、同一总体的不同问题的数据,给予客观的解读

满分最大值平均数标准差标准差系数难度区分度力学555528.8010.910.3510.52.853热学665.152.090.4060.86.375电学515122.289.830.4410.44.793光学10107.543.090.4100.75.500原子物理663.912.860.7310.65.353上表是物理学科考试各个知识组块的相关统计数据。从赋分看,力学、电学占分比重大,符合物理学科知识结构的特点。从难度看:热学的试题难度来得最小,依次是光学、原子物理、力学、电学,因为是高考,考试主要内容的力学、电学难度在0.5左右上下,应属合理的。从区分度看:力学、电学区分度来得比较大,考试的主要内容承担主要的区分功能,也是合理的;区分度最小的是原子物理,其难度居中,比其难和比其易的知识组块的区分度比它都来得大,可见原子物理的区分度数据表现有点奇异。从标准差系数看,只有原子物理的的离散程度最大。从其区分度最小、离散度最大,而此组块就只涉及一个试题,可见原子物理试题所考查的相关知识学生掌握不是太好,特别是高端学生在此题上的反应状态不太理想,可以看到此部分内容没有受到足够的重视,也可能受到原子物理部分占分较少的影响。其实,既然原子物理只考很少的内容,所选择的内容一般是较典型的内容,不会太偏。对高端学生来说,适当多关注一些,就会表现出更大的优势。物理老师还可具体联系考查的内容及教学实际,予以反思。2、同一总体(学校)的不同单位(班级),同一问题的数据解读以下数表是一个学校化学学科考试的数据统计分析(平均得分率)结果。从总分情况看,A、B、C班成绩较好,尤其是A班。如果只是按总分对各个班级进行排队,意义其实不大。A班第一,可能A班学生的来源就是最好的,它应该好。如果我们更关注学科内在结构的数据来分析,无论对哪一个班级,可能都能发现相对的优势或者不足。便于总结发扬或者反思问题所在。比如A班,比较一下数据,就不难发现,该班的“有机化学”部分的考试情况就值得反思,并没有表现出应有的强势,在教学中是一定存在某方面影响因素的。发现问题,解决问题,更能够发挥优势。A班B班C班D班E班F班G班H班总分0.770.680.670.620.640.580.620.62化学概念理论0.610.840.700.670.670.630.600.620.61化学元素化合物0.620.760.660.650.580.620.540.620.58有机化学0.500.520.470.470.580.500.410.550.52化学实验0.680.770.710.730.640.650.620.650.64化学计算0.610.760.670.620.570.610.530.610.55观察能力0.640.780.670.680.600.630.580.620.60实验能力思维能力0.600.740.630.610.570.590.520.580.57吸取新信息解决问题的能力0.560.680.580.570.540.560.470.570.53识记0.680.840.710.700.630.670.630.670.64理解0.620.750.660.640.590.620.540.600.59分析综合0.590.750.630.620.530.610.510.560.54应用0.510.630.540.530.500.520.400.520.503、不同总体的同一类问题,不同时间形态的数据解读2002~2006年组块对比项目、指标\年度2002年2003年2004年2005年2006年组块1难度0.660.530.760.880.89区分度0.3710.270.400.350.367组块2难度0.470.320.460.270.73区分度0.2030.320.320.220.376组块3难度0.350.690.730.190.74区分度0.1970.320.190.060.314组块4难度0.530.350.600.260.53区分度0.1410.150.240.110.227组块5难度0.440.740.480.400.73区分度0.2470.260.210.230.2992、分析其难度和区分度:试题过难的,区分度反而小;试题较容易,区分度反而大。四、通过典型试题的分析发现学生群体的差异性(一)客观题分析实例题目:过氧化氢(H2O2)的水溶液俗称双氧水,在医疗上可作为消毒杀菌剂。每个H2O2分子是由A.氢原子和氧原子组成B.一个氢原子和一个氧原子构成C.氢元素和氧元素组成D.两个氢原子和两个氧原子构成(参考答案:D)1、通常情况下的分析一般情况下,可以得到本题的难度为0.67,区分度为0.4的情况下,可能形成的分析:本题考查的知识点主要涉及到:(1)考查学生是否懂得分子由原子组成的原理;(2)分子式的意义;(3)对元素及原子概念的辨析。这一试题考查的是化学中最基础的知识。分子、原子、元素是中学化学学习中最基础的知识,也是教师在教学中反复强调的内容。题干的内容陈述比较清楚,作了一个联系实际的铺垫,提供“双氧水”、“消毒杀菌剂”等信息,其实与本试题所考查的核心内容没有多大联系;试题设问很明确,强调了“每个H2O2分子”;选项的内容及其表述很明白,没有隐含的思维障碍。分子是由原子构成的,几乎是化学常识,这一试题的难度应该不大,可以看成是一个送分的题目。从考试的结果看,试题的平均得分率为0.67,有三分之一的学生出现错误,成绩并不理想。据此估计:化学学得比较好的学生,此题一般都不会错;只有学习成绩最差的学生,存在答错的可能性;即便有学习成绩好的个别学生答错的,那可能是粗心大意造成的。结合试题的区分度为0.4来看,说明该试题的区分度较好,可以认为试题对学生总体的区分功能较好,也佐证了老师的以上判断,即主要问题,是出现在学习成绩较差的学生身上。以上分析,能够得出基本教学结论:对分子、原子、元素等基本概念的教学和训练基本是成功的;特别中等和中等以上学生对分子、原子、元素等基本概念的掌握,应该是牢固的;今后要关注化学学习较差的学生对这部分内容的学习。以上分析的结论,是否真实可靠?2、基于翔实考试数据的分析:经过对考试数据进行统计分析,可以得到如下统计图表:如果我们对考试原始数据进行收集和整理,就能够统计这个试题的考试数据,得到相应的分数分布、难度曲线、选项分组统计表等。这一题的难度曲线、选项分组表如下:注:难度曲线图中,横坐标是卷面总分,纵坐标是难度值。此图提供了本试题平均得分率随卷面成绩的分布情况,以及不同水平的学生在本试题的不同表现;同时,也表达了随着化学卷面成绩的提高,本试题平均得分率的变化趋势。选项分组统计表中,分组是从低分到高分将全体学生人数平均等分为七组,第1组是卷面总分最低的七分之一的学生,第7组是最高分的七分之一的学生;表中表明A、B、C、D四个选项对应各个组的选择人数,以及对应的总人数、比率等。此表,能够清晰的提供不同等第的学生,在本试题的各个选项上的表现及其分布,隐含有诸多教学信息。数据分析(1)从难度曲线的走向看,在卷面总分20分到50分(卷面总分为80分)这一区间,曲线在难度值0.45左右呈现一个平台,结合总分分布表(此处没有列出),可以查到这部分学生人数占学生总数的27%,基本上属于最差的低分学生;曲线在50分以后上扬;在70分以后又出现平缓趋势。思考与解释:曲线出现一个平台,表明在该区间试题的正确率并不随着卷面总分的提高而有所提高,即在这区间区分作用不大;曲线在50分以后上扬,表明随总分提高,该试题的正确率逐步提高,区分度较好;在70分以后又出现平缓趋势,说明化学卷面得高分的学生,在此题上也有失分的现象。(2)A、B、C、D四个选项,选择率分别是0.03、0.04、0.26、0.67。思考与解释:四个选项的选择分布,说明本题的干扰项主要是C项,A、B两项干扰性很小;由此,四选一的客观题实际就变成二选一,所以出现低分学生在难度值0.45左右的曲线平台;平台的出现,还表明即使是选择了正确选项的,也可能是随机选择的平均概率在发挥作用的结果,即是“猜”的成分,与他们学业水平的提高没有直接的关系,并不一定是他们真正会做该试题。(3)结合难度曲线和数表,第3组开始,曲线上扬,正确率从50%逐渐上升为95%。第3组的错选率为45%、第4组错选率为35%、第5组20%、第6组10%,第7组(成绩最好的尖子学生)中也有4%的学生丢分。思考与解释:如此多的学生丢分,包括化学学习成绩很好的学生在此题上都丢分,是不能单纯用“粗心大意”的审题原因来解释的。由上表数据可知,在最差的第1组学生中,选择A、B选项的人数还较多;越往上走,A、B的干扰越小;错选集中在C选项。C选项对不同层次的学生都存在一定程度的干扰,可见选项C、D之间形成的疑惑,具有一定的普遍性。(4)试题难度系数为0.67。考虑随机选择的因素,在1~7组全体学生中都会有不同程度的存在,可见,真正能够作出正确选择的学生人数比率,要大大低于0.67。思考与解释:为什么对“一个H2O2分子是由两个氢原子和两个氧原子构成”这样简单的提问,有这么多学生不能真正理解,说明这些学生对这一知识掌握的情况不好。(5)四个选项中,A、B两项干扰性较小,主要是C项的干扰,为什么C项的干扰性会如此大?思考与解释:C.项是“氢元素和氧元素组成”,干扰的原因是:回答“每个H2O2分子是由”什么构成,学生分辨不清到底是该回答“元素”,还是该回答“原子”。问题的核心是学生对元素与原子的概念理解及其应用上。3、依据数据,结合老师的学识和教学经验,对试题和学生的分析(1)分析试题设计:试题从宏观角度给出试题情境铺垫,联系双氧水的实际用途,“过氧化氢(H2O2)的水溶液俗称双氧水,在医疗上可作为消毒杀菌剂。”然后话题一转,“每个H2O2分子是由”,从微观的角度提出了化学学科中的最基本的知识问题。试题考查的落脚点——检测学生对组成分子的原子种类和个数的知识点的掌握情况,指明了“每个H2O2分子”,是由什么构成的。这样,试题通过从宏观到微观的情境设计,提升了对简单知识点的考查的难度。近三分之一的答错率,反应出有更多的学生没有能够把握住宏观与微观之间的联系。看来,题干作了一个联系实际的铺垫,提供“双氧水”、“消毒杀菌剂”等信息,并不是与本试题所考查的核心内容没有联系的。(2)试题设置审题障碍,是否应该?有人可能提出质疑:命题中对试题进行近乎“迷惑性”的处理,是不必要的故意“设置审题障碍”。联系中学化学的学科特点,可以看出这种设置符合化学学科的要求。化学是在原子、分子水平研究具体物质的组成、结构、性质及其变化规律的一门自然学科。化学学科区别于初中其它学科的一个很重要的学科特点在于,化学既研究宏观物质的性质及变化反应的现象,又研究物质性质及变化所反应的微观原因。在化学学科中,化学基本概念包含宏观范畴的概念和微观范畴的概念,而这些基本概念就是化学概念理论体系的基础,是整个化学学科知识的基石。而且,无论是宏观物质,还是微观的原子和分子,在化学上都是用特殊的符号,如元素符号、化学式、结构式、方程式等来表示的。这些化学基础知识,均是要求学生掌握的。关注宏观和微观是化学学科的特殊性。正是这种特殊性,要求教师善于帮助学生掌握和辨析化学概念及化学符号在宏观或微观之间的含义,这是学习化学必须掌握的基本知识。从这一意义出发,要求学生理解和掌握基本化学概念和化学符号在宏观或微观情境下的准确意义,是合理的。由此可见,该试题的情境设计,不仅不属于有意设置审题障碍,而是坚持了化学学科的基本特点,考查了化学教学大纲中必须掌握的基本知识。(3)分析和诊断:数据表明,虽然审题疏忽是学生丢分的原因之一,但是,导致三分之一的学生出现错误的主要原因,是学生理解和掌握化学基本概念存在一定的模糊,分辨不清元素与原子概念的意义和使用范围。化学的研究对象既是宏观的又是微观的。教学应该促成学生掌握相应概念、建立宏观和微观思维方式,以面对不同化学问题。学生水平的差异性在这一试题上得到了充分表现。这一试题的测试结果表明:大多数学生对这一知识点的掌握达到了中学化学教学大纲和考试大纲的要求,但是,也有相当一部分学生对化学基本概念的宏观或微观性质认识模糊,其中还包括一部分学习成绩不错的学生。通过对该题的测试分析,可以反映出初中化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论