基于简易式百分等级成长模型的学业增值评价_第1页
基于简易式百分等级成长模型的学业增值评价_第2页
基于简易式百分等级成长模型的学业增值评价_第3页
基于简易式百分等级成长模型的学业增值评价_第4页
基于简易式百分等级成长模型的学业增值评价_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于简易式百分等级成长模型的学业增值评价摘要:教育评价是教育教学的关键环节,其中的增值评价以学生的起点定终点,关注学生的 成长变化,是教育评价中的重点与难点。归纳总结国内现有学业增值评价方法,分析基于分数纵 向比较的方法、基于位次纵向比较的方法、基于最小二乘回归的增值模型和基于分位数回归的增 值模型的应用现状及存在的不足。在此基础上,提出简易式百分等级成长模型,阐述该模型的原 理与操作步骤,并通过某地区6年级毕业生的成绩追踪,初步验证该模型的效用,以期为增值评价 的探索应用提供参考。关键词:教育评价改革;增值评价;百分等级成长模型;增值模型教育评价是教育教学的关键环节,具有导 向、鉴定、诊断等

2、功能。评价的鉴定功能在教育 教学中应用较多,诊断功能却常常被忽视。实际 操作中不乏把排名等同于评价的现象,过分强调 结果,淡化成长过程,忽视学生基础起点。中央 全面深化改革委员会于2020年6月30日审议通 过深化新时代教育评价改革总体方案,指出教 育评价事关教育发展方向,要针对不同主体和不 同学段、不同类型教育特点,改进结果评价,强化 过程评价,探索增值评价,健全综合评价,着力破 除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽 瘴痼疾,建立科学的、符合时代要求的教育评价 制度和机制1。增值评价以起点定终点,考虑学生基础水平 对学生学业成绩的影响,以发展的眼光看待学生 学业表现,对学生成长是一种

3、激励,也有利于进一 步的诊断和精准教学,挖掘高增长水平学生的学 习方式方法,从而不断完善教育教学。现有的增 值评价方法有许多,但科学有效且适合一线实际 应用的少之又少,需要探索适合基层教育评价部 门、学校使用的增值评价方法。本文在总结现有 增值评价方法的基础上,提出简易式百分等级成 长模型,以期能够为增值评价的应用提供参考。1国内学业增值评价方法的应用现状及 存在的问题1.1基于分数纵向比较的方法基于分数的纵向比较包括原始分数和标准 分数的比较,这类方法通过2次测试分数的差值 得到增值结果。基于原始分数的比较在实际应 用中比较常见,尤其在一些欠发达地区,不过使 用者已经认识到这种比较存在测试难

4、度不同的 问题。相对来说,标准分数的比较则考虑到不同 测试的难度值、参与群体的不同等问题。然而, 在实际应用中,虽然教育评价部门、第三方评价 机构均会呈现标准分数,但是多数学校和教师较 少使用。这与中考、高考等高利害性考试仅使用 原始分数,以及学生、家长不了解标准分数有关, 也与教师本身对标准分数不了解有关。原始分数的增值评价简单,但缺乏科学性。 标准分数的增值评价相对科学,但不够完善,实 际测试中前后2次测试分布通常不同,相同标准 分数的含义会存在差异,基于标准分数相减的增 值也存在偏差。如某学生2次测试同为2分,虽 然2次测试距离均值的单位相同,但是2次测试 超越的人数比率是不同的,那么2

5、次测试的标准 分数含义就是不同的。最为关键的是无论是基 于原始分数还是标准分数的比较均未解决不同 水平学生增值空间不一致的问题。1.2基于位次纵向比较的方法基于位次纵向比较的方法包括对排名、百分 等级等的比较。评价者通过2次测试排名、百分 等级之差对学生、学校作出评价。受历史文化影 响,我国对名次历来较为看重,古有科举三甲,今 有高考状元。排名是一种强绩效管理的评价思 路,评价结果简洁、明了,但不可否认这种方式对 学生成长、学校发展存在一定的消极影响,尤其 是弱势学生、学校,每一次测试、排名对于弱势群 体来说都是一次积极性、自信心的打击。基于排 名、百分等级的纵向比较解决了这个问题,它把 评价

6、视角转向过程而不是结果。基于位次纵向 比较的方法在学校、基层评价部门使用较多,该 方法更加突出不同水平学校的增值空间不同这 一现象,高水平学校的名次增长相对分数增长来 说更为困难。1.3基于最小二乘线性回归的增值模型基于最小二乘线性回归的增值模型有一元 线性回归、多元线性回归、多水平线性回归等。 模型的基本计算方法是:在2年的成绩之间建立 线性回归方程,纳入学生家庭社会经济地位、学 校规模等背景信息,根据第一年的成绩预测第二 年成绩,计算该学生预期成绩与实际成绩之间的 差值。如果实际成绩高于预期成绩,该生就取得 了比较满意的增值;相反,则增值的情况不理 想2。此种方法把学校效能从众多的影响因素

7、中 分解出来,计算学校层面的净增长。一些国家、 地区采用此种方法对学生、学校效能进行评价, 如美国的田纳西增值评估系统,我国香港、天津 等地区也构建了用以评估学校效能的增值系 统3-4;但是这种方法需要通过问卷调查等方式收 集学生、学校背景信息,较为烦琐,且统计原理晦 涩难懂、操作复杂,不易在学校或者县(区)级基 层教育评价部门施行。此外,该方法没能解决不 同水平评价对象成长空间不一致的问题,高分学 生增值困难现象突出。1.4基于分位数回归的增值模型学生成长百分等级模型(student growth percentiles, SGP)通过在以往学业水平一致的考生群 体(同类学生)中进行比较来确

8、认每个学生的进 步情况,该模型由Betebenner于2009年提出,并 在美国得到较为广泛的应用河。该模型通过建立 不同百分等级学生分位数回归方程的方式,克服 了传统线性回归不同水平学生成长空间不同的问 题,有效解决了评价的天花板效应(高水平学生成 长空间小)与地板效应(低水平学生退步空间 小);但是该模型需要进行分位数回归计算,大大 限制了其使用范围,因为有回归就会伴随着统计 误差,所以该模型的精度也较少被描述和证实气增值评价将评价视角从结果质量转向过程 质量,关注学校、学生的成长过程,挖掘成长潜 力,激发成长动力。现有增值评价方式各有特 点,基于分数纵向比较的方式简单、直观,基于相 对位

9、次纵向比较的方式便于管理,基于最小二乘 回归的增值评价将学校效能从众多因素中分离 出来。然而上述方法均未解决不同水平学生增 值空间不同、无法直接比较的问题。增值模型应 该对所有水平的学生都是公平的,能够科学地衡 量优等生、中等生及后进生的进步水平。基于分 位数回归的增值评价考虑了不同水平学生增值 空间不一致的问题,但是较为复杂;基于此,笔者 提出简易式百分等级成长模型。2简易式百分等级成长模型基本原理与 统计操作在Betebenner提出的学生成长百分等级模型 基础上,简易式百分等级成长模型取其精华,摒 弃复杂的分位数回归方法,代之以百分等级计 算,对教育行政管理者来说容易理解与接受,便 于一

10、线的教育评价工作者及教师使用。2.1基本原理简易式百分等级成长模型以学生的起点定 终点,通过学生在同类群体中的进步情况对学生 进行评价。若学生进步超过大多数同类学生,则 学生进步较大,反之学生进步较小。举个例子,某年级中有A、B2名学生:学生 A在第一次测试中得到600分(满分650分),处 于年级段第4名,在第二次测试中得到605分,处 于年级段第3名;学生B在第一次测试中得到 320分,处于年级段第350名,在第二次测试中得 到350分,处于年级段第320名。就分数、位次的 进步情况而言,学生B增加了 30分,进步了 30名, 学生A增加了 5分,进步了 1名。从量上来看,似 乎学生B进步

11、更大,但是这对于学生A来说不公 平,因为他的进步空间明显比学生B少得多,这也 是传统相对位次、分数评价的不足。采用简易式百分等级成长模型能有效地解 决这个困扰。简易式百分等级成长模型计算示 意图见图1。第一次测试后,将所有学生成绩从 高到低排序后计算学生百分等级分数,学生A的 百分等级为100;在同为100百分等级的这个群 体中(群体X),学生A在第二次测试的百分等级 为60,说明学生A在同一起跑线的群体中,进步 程度超过了群体X中60%的学生。学生B在第 一次测试的百分等级为5,所属群体为Y;第二次 测试的百分等级为55,超过群体Y中55%的学 生。因此,虽然2位学生都在进步,但学生A的 进

12、步程度更大。第一次测试第二次测试610分;百分等级80群体X(600分:百分等级100)605分;百分等级60( A生)L00分;百分等级50410分;百分等级70群体Y(320分:百分等级5)350分;百分等级55(B生)、20分;百分等级50图1简易式百分等级成长模型计算示意图2.2统计操作简易式百分等级成长模型统计操作有2个主 要步骤:第一步,对学生的第一次测试成绩排序, 计算每个学生的百分等级 辨=100-(100R-50)/N (式中R为某分数在按大小排列的数列中的名次, N是分数的总次数),并将百分等级四舍五入取整, 最终得到的学生百分等级在0100;第二步,将学 生群体分为101

13、个子群体,分别计算各自群体内学 生的百分等级,得到第二次百分等级结果,称之为 进步程度。学校水平的成长变化取该校学生成长 百分等级的中位数,以避免极端值的影响。成长水平的判断采用美国科罗拉多州的分 类标准,以35分和65分为成长水平的评价标准, 成长百分等级在65分以上为成长水平较高,成长 百分等级在35分以下为成长水平较低,成长百分 等级在3565分为成长水平一般8。3简易式百分等级成长模型的初步应用分析3.1数据来源与变量选取选取温州市某区2019届6年级毕业生为样 本,这些学生参加了毕业考试,2年前参加了 4年 级学业质量监测。全区共有62所小学,将学生 6年级第二学期成绩和4年级第一学

14、期成绩关联 匹配后,剔除缺失4年级成绩的学生。为保证学 校层面分析的有效性,选取学生匹配率(每个学 校6年级参与增值评价人数除以学校6年级总人 数)在60%以上的学校,共有58所学校6 021个样 本纳入。4年级测试学科为语文、科学2门,6年级测试学科为语文、数学、英语、科学4门。各学科测 试均按照课程标准的要求由市、区学科专家命 制,测试工具有良好的信效度。3.2模型对比分析表1学校成长百分等级对比分析学校成长百分等级6年级 标准分4年级 标准分标准分 变化学校成长百分等级6年级 标准分4年级 标准分标准分 变化校417485.1883.731.45校35378.4777.351.12校10

15、7385.5883.651.93校535183.3985.04-1.65校367284.9683.091.87校85181.1882.12-0.94校487279.1474.394.75校255177.8878.19-0.31校157181.9378.803.13校455184.0185.77-1.75校117177.9171.486.43校335078.4979.00-0.52校316778.7875.073.71校164975.9874.911.07校396784.0083.110.89校374777.2578.32-1.07校476774.7969.894.90校404773.2472.

16、320.93校136679.7976.593.20校184672.3873.00-0.62用2种方式计算学校成长变化:一是用简易 式百分等级成长模型,二是用学校2次测试标准 分(平均分为80分,标准差为10分)的变化。图2 和表1列出部分学校的计算结果,可以看到简易 式百分等级的计算结果与标准分变化的整体变 化趋势是一致的,成长百分等级越高,标准分增 加越多。成长水平高的,标准分的变化为正,成 长水平低的,标准分的变化为负,成长水平一般 的,标准分的变化正负均存在。从此次收集的数据来看,简易式百分等级成 长模型在一定程度上克服了传统方法的弊端,即 天花板效应。初测成绩较高的学校即使标准分 数增

17、加的不多,其成长水平也与初测成绩较低但 增加分数较多的学校差不多,如校39的初测成绩 为83.11分,后测成绩为84分,增长分值为0.89分, 校47的初测成绩为69.89分,后测成绩为74.79分, 校39与校47的成长百分等级均为67。4简易式百分等级成长模型的优势与不足简易式百分等级成长模型是对增值评价的 积极探索,也是对结果评价的有效补充。它既 有纵向评价的痕迹,学生的成长水平判断是基 于自身前测结果,也有学生间的横向比较,学生 进步程度的判定是在与同一水平学生的对比中 产生的。简易式百分等级成长模型的优势体现在以 下4个方面:第一,增值分数可解释。现有的评价 方式,如原始分数、标准分

18、数的比较存在分数含 义模糊、难以解释的问题。1名学生2次测试结 果相比进步了 3分,这3分的含义是什么?而简 易式百分等级成长模型的评价结果一百分等 级,这个分数的含义是清晰的,1名学生2次测试 后,经过模型计算百分等级为60,表明学生在同 类群体的进步程度超过了 60%的同伴。此外,这 类基于分数纵向比较的方式还涉及分数的垂直 等值问题。第二,增值分数可比较。现有增值评 价方式,如相对位次的比较,会遇到不同水平学 生的成长空间不一致的问题,从第2名进步到第 1名明显要比从第100名进步到第95名难,然而 从进步名次的量来看,一个进步了 5名,而另一名 学生仅仅进步了 1名。简易式百分等级成长模型 克服了该问题,每个学生的进步程度只会与同一 水平的学生比较,而且不同水平学生的成长量纲 是相同的,都是从0100。第三,原理容易理解, 操作简便。基于多水平最小二乘回归的增值评 价模型和基于分位数回归的百

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论