测试结果的分析与报告_第1页
测试结果的分析与报告_第2页
测试结果的分析与报告_第3页
测试结果的分析与报告_第4页
测试结果的分析与报告_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

测试结果的分析与报告内容提要一.数据的种类及意义二.图表的种类及意义三.图表在反馈报告中的应用一、数据的种类及意义1、原始分数2、能力值3、量尺分数4、表现水平5、指标指数一、数据的种类及意义1、原始分数(CTT)在学生学业质量分析测试中,运用经典测验理论来对学生的学业成绩进行分析,采用考生在题目上的得分求和的方法,给考生能力的估计值。

一、数据的种类及意义2、能力值在学生学业质量分析测试中,运用项目反应理论来对学生的学业成绩进行分析,采用专门的软件对学生的作答进行分析处理后可以得到每一个考生能力的估计值。许多报告中所涉及到的测验分数都是在此能力值的基础上经转换得到。

一、数据的种类及意义3、量尺分数(ScalingScore)

量尺分数是一种具有相等单位的量数。它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。基于项目反应理论转换的量尺分数,不受考生群体和测验题目的影响。等值转换后的量尺分数具有跨年度的可比性。

一、数据的种类及意义2、量尺分数转换方法第一步:先将能力值转换为Z分数第二步:将Z分数转换为设定尺度的量尺分数一、数据的种类及意义2、量尺分数如PISA项目对学科总能力,标定到均值500分,标准差100分的量尺分数;NAEP,GRE课程中心,监测中心3、表现水平大规模学生学业质量测试不仅通过分数描述学生在各个学科上的表现,还根据学生的测试表现将其划分为不同的水平,这就是表现水平。国际上大型测试项目将学生的表现划分为不同的水平,并详细地描述了不同水平的学生能够做什么。(PISA,NAEP)

一、数据的种类及意义一、数据的种类及意义

4、指标指数

背景问卷中对学习压力和学习动机等内容进行了调查,并将这些试题合成了一个平均分。再将此分数经过标准化转换后,分类形成一个指标指数,用来描述在某个方面学生表现的不同程度。二.图表的种类及意义1、直方图2、盒式图3、累积柱状图4、散点图

1、直方图

直方图横坐标表示学生量尺分数的分组,纵坐标表示每组学生人数所占的比例。2、盒式图5%的学生成绩低于此点所对应的分数25%的学生成绩低于此点所对应的分数50%的学生成绩低于此点所对应的分数75%的学生成绩低于此点所对应的分数95%的学生成绩低于此点所对应的分数2、盒式图中间这条线所对应的成绩可以描述学生平均水平的高低

矩形盒子的高度可以描述学生成绩离散程度的大小3、累积柱状图此图表示不同性别的学生在中学数学不同水平等级上的比例。

不同水平所占的比例相加为100%。4、散点图学生总体师生关系与学业成绩的散点图

在同一个图中呈现两组数据,可以描述两个特征(变量)的相关关系程度和方向。三.图表在反馈报告中的应用原则是用最少、最简单的图表清晰地呈现想要重点表达的信息。三.图表在反馈报告中的应用1、总分2、表现水平3、典型试题4、背景问卷1、总分-目前国内报告大多采用的方法1、总分--直方图该图将学生的标准分分为12个分数段,每个分数段间隔为50,每个分数段内图形的高度表示学生在该分数段上的比例。1、总分-盒式图呈现学生某学科总体分布状态的盒式图广泛用在报告中不同区县、不同群体之间的比较上。1、不同区县之间2、不同群体之间1、总分—盒式图(1)不同区县之间(2)不同群体之间1、总分-国际上的做法1、总分-国际上的做法—NAEP1、总分-国际上的做法—PISA1、总分-国际上的做法—TIMSS2、表现水平-国内常用的方法2、表现水平--累积柱状图3、表现水平-国际上的做法3、表现水平-国际上的做法—NAEP3、表现水平-国际上的做法—PISA3、表现水平-国际上的做法—TIMSS4、典型试题-国内常见做法4、典型试题-选择题题目:他思维敏捷,口才又好,说起话来

,真让人羡慕。A七嘴八舌B异口同声C滔滔不绝D有口无心考查能力:理解词义·能理解常用成语的基本意思,并在较复杂语境中恰当运用正确答案:C平均得分率:82.1%给出此题目的考查内容、考查能力、正确答案以及平均得分率;从平均得分率中可看出此类试题的平均难度如何。以柱状图的形式给出每个选择项被选的比例;不同选项被选的比例可说明各干扰项对学生的干扰程度,以提供诊断性的信息。此外,还会对部分典型试题进行内容分析题目:他思维敏捷,口才又好,说起话来

,真让人羡慕。A七嘴八舌B异口同声C滔滔不绝D有口无心这道题目考查学生能理解常用成语的基本意思,并在语境中恰当运用的能力。学生需要在理解成语意思的基础上选择出最符合语境的一项。句中“口才又好”是理解本句语境的关键点,与语境最相符的成语应是选项C“滔滔不绝”。从上海市学生在这道题目中的作答表现来看,有13.1%的学生选择了B,“异口同声”可以形容多个人一起说话,但是题目所给的语境是一个人。选择错误的学生显然没有结合所给语境选择成语。

【例】如图所示,把装饭菜的碗加盖后放入一盆中,盆内盛有一定量的水,将一块纱布铺在碗盖上,纱布的边缘浸入到水中。南方有的地方,夏天用这种方式来延长食物保存的时间。请说明这样做的科学道理。(05辽宁试题)4、典型试题—开放题第一位数字表示正确水平

(1表示部分正确,2表示完全正确,7表示不正确,9表示没有回答)第二位数字表示同一正确水平情况下答案的不同类型(二位制)评分编号说明答案及评分说明正确的回答,6分20提到水蒸发、吸热、降温以及纱布因其边缘浸入水中而保持湿润(或直接提到毛细现象)。例1:纱布的边缘浸入到水中,水会不断地“爬”上纱布,使整块纱布一直保持湿润。然后,水不断蒸发,吸热,降低温度,从而起到保鲜的作用。例2:由于纱布上的水蒸发吸热,使周围的温度降低,这些食物里的热量通过碗盖传到纱布的水上,水蒸发吸热,从而使食物的温度降低。正确的回答,6分………20提到湿润、蒸发、致冷中的两个。例1:水蒸发,吸收热量,降温。例2:纱布保持湿润,使食物降温。例3:纱布上的水蒸发。因为纱布保

持湿润,所以蒸发时间长。29其他正确的回答部分正确的回答,2分………10只提到水蒸发,未说明其可吸热降温例1:水分蒸发,可延长食物的保持期11只提到纱布因其边缘浸入水中而保持湿润(毛细现象)例1:纱布的边缘浸入在水中,水会不断地“爬”上纱布,使整块纱布一直保持湿润。例2:纱布吸水,使整块纱布一直保持湿润。12只提到吸热降温。例1:使碗内温度降低,因而可以长期保存。例2:纱布吸收热量,使食物温度降低部分正确的回答,2分………70用水的比热来解释例1:天热时,因为水吸热多(水的比热大),温度变化不明显,可保持饭菜在一定温度,避免因气温高而变质。例2:水的比热大,吸热本领强,所以使食物降温。71从纱布的阻挡、隔绝角度考虑例1:纱布能减少水蒸气的散失,保持食物湿润例2:能减少食物水分散失,从而延长食物保存时间。例3:纱布隔绝空气,防止食品氧化,抑制细菌生长。例4:纱布可防灰尘、细菌、苍蝇的。通过这种编码方式,除了得到通常做法上的分数以外,我们还得到了学生的丰富作答类型,为教学诊断提供了非常有价值的信息。4、典型试题-国际上的做法4、典型试题-国际上的做法—NAEP4、典型试题-国际上的做法—PISA4、典型试题-国际上的做法—TIMSS5、背景问卷-国内常见的做法5、背景问卷-我们的做法--百分等级柱状图

三年级学生对自己某些学习方法的评价

三年级有26%的学生抓不住学习的重点我喜欢利用小组讨论来学习八年级与三年级相比,更少的学生喜欢利用小组讨论来学习。???学生学习压力的情况

5、背景问卷-

表格鼓励学生猜想并通过各种方法验证猜想或得到结论从不很少有时常常总是区103.029.540.926.5区203.121.449.526.1区302.522.950.723.5区40.31.426.049.422.9区50.54.925.247.621.8区602.29.944.044.05、背景问卷-我们的做法–

散点图学生与英语教师的师生关系与学业成绩的散点图5、背景问卷-国际上的做法5、背景问卷-国际上的做法—NAEP5、背景问卷-国际上的做法—PISA5、背景问卷-国际上的做法—TIMSS标准设定

影响因素分析标准设定:相似事情的不同说法标准(Standards)表现标准(Performancestandards)合格分数(Passingscores)分界分数(Cutscores)阈限(Thresholds)划界分数(Cutoffscores)没有标准设定….…是否“合格”?多少分意味着达到“基本标准”;是否“足够好”,达到了优秀水平。“表现标准”的特点在课程标准下,“表现标准”具有实际的意义;结合题目测试的“内容标准”,“表现标准”具有丰富的内涵;“表现标准”具有跨年度的可比性,相对于传统测验的及格具有相对客观性的特点;“表现标准”具有跨群体的稳定性,不依赖于测试群体的变化而改变。三种常用的标准设定的方法安哥夫(Angoff(1971))书签法(Bookmark(Lewis,etal1996,1998;Mitzel,etal2001))对照组法(ContrastingGroups(Livingston&Zieky,1982))书签法工作过程类似于真正的放置“书签”过程测验中的试题按照难易排列,每一个裁判在认为“刚刚合格的最低能力的考生”可能(三分之二可能)答对的最后一题后放置书签这个题目所对应的考生能力分数就是这个裁判划定的临界分数所有裁判临界分数的平均就得到测验的临界分数广泛使用、有些概念不好理解(RP)需要定义内容标准,并要求在过程中考虑为什么“后一题比前一题难”StdSetting67对照组法裁判对个别考生进行评价步骤定义两个组:肯定(毫无疑义)合格的考生肯定(毫无疑义)不合格的考生计算不同类考生的分数,得到分界分数所有裁判分数的平均作为测验的分界分数很难找到了解学生的合适的裁判分界分数可能并不在某考生群体中对照组中临界分数的确定标准以上标准以下分界点表现水平描述计算“良好”水平学生表现的描述:学生在计算加法和乘法算式题(包括有进位者)时表现良好(如Q2/M1,Q1/M2、Q3/M3、Q1/M1、Q8/M2、Q5/M3)。他们计算减法时的表现也相对较好,但是碰到退位减法时则较多错误(如Q3/M1、Q3/M2、Q4/M3)在四则运算中,学生以除法的计算较弱,在运算时失误较多,特别是在一些有余数或需要“补零”的题目上(例如Q10/M1、Q11/M1、Q10/M2、Q8/M3)。学生在混合运算里常犯的错误是忘记了“先乘除,后加减”的法则(例如Q13/M1、Q12/M2、Q15/M3)。除此之外,他们的表现较好(例如Q8/M1、Q11/M2、Q13/M3)

表现水平描述学生能理解篇章的段落大意。在理解段意方面,如C1第16题第二段是描述“小胖”和“我”相处的情形,C3第14题第二段记述表格捉鱼妈妈的经过,大部分学生都能准确回答这些题目,可见学生能概括篇章的段落大意。学生能理解篇章内容的表面意义。

如C2第14和C2第15题,问及海豚减少的成因和海豚的颜色,学生只需从篇章直接抄录文句,复述“水质差和被船只撞

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论