数学学习中常用的量化评价方法课件_第1页
数学学习中常用的量化评价方法课件_第2页
数学学习中常用的量化评价方法课件_第3页
数学学习中常用的量化评价方法课件_第4页
数学学习中常用的量化评价方法课件_第5页
已阅读5页,还剩143页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学学习评价中常用的量化评价方式童莉重庆师范大学数学学院基于TIMSS和PISA的视角数学教育研究的范畴:为什么教和学数学?教和学什么样的数学?怎样教和怎样学数学?教和学数学的效果怎么样?(即:数学教育评价)教学评价(单向线性结构)教学评价(循环往复结构)过去:现在:时代背景:2001年基础教育课程改革纲要指出,课程改革中应:建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生在原有水平上的发展。建立促进教师不断提高的评价体系。强调教师对自己教学行为的分析与反思,建立以教师

2、自评为主,校长、教师、学生、家长共同参与的评价制度,使教师从多种渠道获得信息,不断提高教学水平。建立促进课程不断发展的评价体系。周期性地对学校课程执行的情况、课程实施中的问题进行分析评估,调整课程内容、改进教学管理,形成课程不断革新的机制。 2003年普通高中数学课程标准(实验)在“课程的基本理念”中指出:建立合理、科学的评价体系。现代社会对人的发展的要求引起评价体系的深刻变化,高中数学课程应建立合理、科学的评价体系,包括评价理念、评价内容、评价形式和评价体制等方面。评价既要关注学生数学学习的结果,也要关注他们数学学习的过程;既要关注学生数学学习的水平,也要关注他们在数学活动中所表现出来的情感

3、态度的变化。在数学教育中,评价应建立多元化的目标,关注学生个性与潜能的发展。例如,过程性评价应关注对学生理解数学概念、数学思想等过程的评价,关注对学生数学地提出、分析、解决问题等过程的评价,以及在过程中表现出来的与人合作的态度、表达与交流的意识和探索的精神。对于数学探究、数学建模等学习活动,要建立相应的过程评价内容和方法。2010年全日制义务教育数学课程标准(修改稿)在“课程基本理念”中指出:学习评价的主要目的是为了全面了解学生数学学习的过程和结果,激励学生学习和改进教师教学。应建立目标多元、方法多样的评价体系。评价既要关注学生学习的结果,也要重视学习的过程;既要关注学生数学学习的水平,也要重

4、视学生在数学活动中所表现出来的情感与态度,帮助学生认识自我、建立信心。 2010年国家中长期教育改革和发展规划纲要(2010-2020年) 的“发展任务”中指出:义务教育阶段发展任务之一:提高义务教育质量。建立国家义务教育质量基本标准和监测制度。 高中教育阶段发展任务之一:建立科学的教育质量评价体系,全面实施高中学业水平考试和综合素质评价。 关注评价研究评价实施有效科学的评价“问题驱动”:问题一:什么叫数学学习评价?问题二:数学学习评价的常见类型有哪些?问题三:一个科学合理的评价体系应用包括哪些方面?问题四:常见的数学学习量化评价的误区?问题五:如何保障数学学习量化评价的科学性?问题六:一个好

5、的测量应具有哪些特征?教育评价的含义及发展评价即考试.(自19世纪中叶本世纪30年代)教育评价的第一个时期-“心理测验时期”。教育测量的研究取得了一系列的成果,在考试的定量化、客观化与标准化方面,取得了重要的进展。强调以量化的方法对学生学习状况进行测量。然而,当时的考试与测验只要求学生记诵教材的知识内容,较为片面。无法真正反映学生的学习过程。拉尔夫.泰勒对评价的认识。(本世纪30年代-50年代)教育评价的第二个时期-“目标中心时期”,泰勒(Tyler, R) 提出了以教育目标为核心的教育评价原理,即教育评价的泰勒原理,并明确提出了“教育评价”(education evaluation)的概念,

6、从而把教育评价与教育测量区分开来,教育评价学就是在泰勒原理的基础上诞生与发展起来的。在西方,一般人们都把泰勒称为“教育评价之父”。问题一:什么叫数学学习评价?经常听到老师这样说:在此次数学期末考试中,张三同学考了90分,李四同学考了80分,这是对学生数学学习的评价吗?考试是评价吗?数学学习评价是全面搜集和处理学生数学学习过程中的信息,从而做出价值判断、改进教育决策的过程。师:在此次数学期末考试中,张三同学通过平时的努力,取得了优异的成绩,李四同学与上次考试相比,获得了明显的进步。辨别:评价(Evaluation)与测量(measurement)、评估(Appraise)、评定(Assessme

7、nt)的区别问题二:数学学习评价的常见类型有哪些?诊断性评价、形成性评价、终结性评价相对性评价、绝对性评价、个体内差异评价目标取向评价、过程取向评价、个体取向评价问题三:一个科学合理的评价体系应用包括哪些方面?比如:国际数学学习评价TIMSS和PISA评价体系:评价目标(为什么评)评价对象(评谁)评价内容(评什么)评价方法(怎么评)问题四:常见的数学学习量化评价的误区?(凭经验)如何确定班级中等级评定人数?(错误比较)某生数学期中考试80分,期末考试78分,判断说该生的数学成绩退步了。 或两个考生的总分相同,判断说两学生的成绩相当。(简单化比较)计算每次考试的平均分或及格率.(缺乏过程性比较)

8、就某次考试作分析,缺乏长期的对每个学生的跟踪分析(缺乏成绩背后影响因素的分析)科目原始分数甲乙语文7572数学8596外语9082合计250250考试种类 原始分数 期中考试80期末考试78崔允漷等.,2008.(3)总体抽样样本(所要考察对象的全体) 个体:总体中的每一个考察对象 样本:从总体中抽取的一部分个体叫做这个总体的一个样本 样本容量:样本中个体的数目 抽样方法非随机抽样方便抽样:如访问过路行人。配额抽样:分层非随机抽样。如市场调查,家庭每月消费调查。判断抽样:设计者基于对总体特征的了解,判断选择样本,如物价指数调查。雪球抽样:从起始受查者提供的资讯取得其他受查者,如同性恋调查。随机

9、抽样单纯随机抽象;机械抽样;分层抽样;整群抽样问题:对本班同学对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查方案:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查抽签法抽签法的一般步骤:(1)将总体中所有个体编号(对已经有编号的个体, 可以省略编号的过程);(2)制作与个体编号相同的号签;(3)将号签放在一个箱子中搅匀;(4)按要求随机抽取号签,并记录;(5)将编号与号签一致的个体抽出抽签法的适用范围: 抽签法简单易行,适用于总体中个体数不多的

10、情形 抽签法的制签比较麻烦,如何简化制签过程?随机数表法 制作一个表,其中每个数都是用随机方法产生的,这样的表称为随机数表如何用随机数表来抽取样本?16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33

11、 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28例如选取第8行第9列开始.问题:为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何抽样?6行:7行:8行:9行:10行:16191012073938332134机械抽样(等距抽样): 将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系

12、统抽样(也称为等距抽样) 问题:为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么样的抽样方法恰当?(50个样本)解:抽样过程如下:(1)随机将这1000名学生编号为1,2,3,1000(比如可以利用准考证号);(2)将总体按编号顺序平均分成50部分,每部分包含20个个体(3)在第一部分的个体编号1,2,20中,利用简单随机抽样抽取一个号码,比如是18;(4)以18为起始号,每间隔20抽取一个号码,这样就得到一个容量为50的样本:18,38,58,978,998 如果上述问题中,学生人数是1003,如何进行系统抽样?解:(1)随机将这1003个个体进行编号1,2,3,1003; (2)

13、利用简单随机抽样,先从总体中剔除3个个体(可以随机数表法),将剩下的个体重新编号然后按系统抽样的方法进行系统抽样的步骤:(1)采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等;(2)整个的编号分段(即分成几个部分),要确定分段的间隔k.当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N能被n整除,这时k=N/n;(3)在第一段用简单随机抽样确定起始的个体编号;(4)按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k

14、,第3个编号l+2k,这样继续下去,直到获取整个样本).(1)系统抽样称为等距抽样;(2)注意当N/n不是整数时,要去掉一些个体,可以再用随机数表的方法抽出剔除的个体;(3)系统抽样适用于总体容量较大的情况;(4)系统抽样是等可能抽样注意以下4点: 分层抽样(PPS):將总体按某种性质划分成数个子总体(层),每一层分別按在总体中的相应比例应用简单随机抽样法进行抽样。TIMSS和PISA采用二级或三级PPS抽样方法 (学样抽样、班级抽样、学生抽样)如:重庆市10000名初中毕业生,其中重点中学占20%,普通中学占50%,农村中学占30%。为了解数学成绩,抽取100名进行成绩分析,则应怎样抽样?整

15、群抽样將总体按某种性质划分成数个子总体(群),应用单纯随机抽样法抽选样本群,每一样本群內全查。優點:1.不需完整的個體名冊。2.執行方便,成本較低。 分層隨機抽樣與群集抽樣比較分層抽樣群集抽樣層數較少,層內個體較多群數較多,群內個體較少層間個體差異較大,層內個體差異較小群間個體差異較小,群內個體差異較大所有層中至少都有一單位被選入樣本中只有部分群集被選為樣本分層抽樣只在每層中,選部分個體作為樣本群集抽樣則在被抽選之群集中進行普查或進行再次抽樣目的在減少抽樣誤差,提高樣本估計值之可靠度目的在減低抽樣成本或配合母體底冊成绩分析之Z分数: 以“正态分布理论”为基础正态分布:正态曲线正态分布在测验中的

16、应用(1)将原始分数转换成标准分数(2)确定录取分数线(3)确定等级评定人数(4)品质评定数量化 某生数学期中考试80分,期末考试78分,是否可以说该生的数学成绩退步了?两个考生的总分相同,怎样进行比较?Z分数: 优点:具有可加性;具有可比性;可作 为舍弃异常数据的依据。T分数:T=KZ+C 返回某生数学期中、期末考试对照表考试种类 原始分数 全班平均值 标准差 标准分Z 标准分T期中考试80826.2-0.3218期末考试78756.50.4696成绩分析表科目原始分数全体考生平均分标准差标准分T=10Z+50甲乙甲乙语文757270856.2552.50数学85968565068.33外语

17、908295742.8631.43合计250250149.1152.26问:谁的品质好一些?数学老师A班主任B张三甲丙李四乙乙成绩分析之图表分析: 以直观性较强的统计表与统计图来反映数据资料的特征。1、统计表简单表分组表复合表频数分布表 (1)累积百分比的作用更能说明成绩水平 (2)百分等级分数:累积百分比 * 100;表示比该考生成绩差的考生占考生总数的百分比;(TIMSS与PISA中的应用)思考:名次与百分等级分数(30人的小班中的第十名和120人的大班中的第十名是不是等值的。)20/30=66.7%110/120=91.7%成绩组中值频数累积频数累积百分比50-52.5220.0455-

18、57.58100.2060-62.56160.3265-67.512280.5670-72.57350.7075-77.56410.8280-82.54450.9085-87.53480.9690-92.51490.9895-97.51501.00总和 502、统计图直条图圆形图(扇形图或饼图)直方图线形图多边图累积多边图成绩分析之集中情况分析: 集中量(描述单组数据典型水平或集中趋势的量)集中量:平均数(算术平均数、加权平均数、几何平均数、调和平均数)中位数 原始数据法: 5,7,9,13,15,21,70 (实在数)数据分布过偏(平均数:20) 3,5,7,9,13,15,16,19 (假

19、想数) 频数分布表法:众数以上几种集中量的比较:平均数集中代表性较好,其次是中位数,然后是众数。加权平均数举例:某生平时数学成绩为80分,期中考试成绩为90分,期末考试成绩为95分.按学校规定学期成绩中平时成绩占有20%,期中考试成绩占30%,期末考试成绩占50%.问该生学期总评成绩应为多少分?调和平均数举例:设甲、乙、丙3个学生的解题速度如下:甲生每小时8题、乙生第小时7题、丙生每小时10题。求3 人的平均解题速度。成绩分析之分散情况分析: 差异量(描述单组数据的离散程度的特征量)一组:1,3,5,7,14,60(平均数为15);二组:12,13,14,16,17,18(平均数为15)差异量

20、全距平均差方差标准差差异系数差异系数举例:某市区入学男童(7岁组)体重的平均值为20.37kg,标准差为2.16kg;身高的平均值为113.64cm,标准差为4.04cm。问身高与体重哪个差异大?返回学生甲在初中一学年9次数学考试成绩对照表考试次数123456789原始分868495989289948697百分等级分数604079897783892894平均分83.6 86.289.4888578.18689.284.9标准差9.48.56.98.29.38.26.355.47.8标准分0.25-0.260.811.220.750.961.26-0.591.55某班一学期几次考试的成绩分析表:

21、考试次数平均数标准差5%分数10%分数25%分数50%分数75%分数90%分数95%分数12成绩的集中情况与分散情况的分析可利用SPSS软件进行分析处理SPSS软件简介:早期名称:Statistical Package for Social Science。社会科学统计软件包现在名称:Statistical Products and Services Solutions。统计产品与服务解决方案历史沿革:1970年代即進入市場,早期僅能在主機電腦上執行,1985年推出DOS版,1990年推出Widows版,2002年推出SPSS11.5 for Windows。SPSS的基本作用方式窗口式数据编

22、辑窗口(data editor):对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口 。输出窗口(Viewer):SPSS统计分析报表及图形的输出窗口 利用SPSS做数据分析的一般步骤: 建立SPSS数据文件(定义数据文件结构、录入修改和编辑待分析的数据)分析数据(统计分析之前的数据预处理、统计分析和建模)结果的说明和解释数据和分析结果的保存SPSS菜单和工具栏SPSS的基本对话框:分析案例:成绩分析之相关情况分析: 相关量(描述两组数据的相关程度的特征量)相关量相关系数r(-1r 1)r0,正相关r30公式:举例: 求某班50个学生的某次测验的数学与物理成绩的相关程度.等级相关:条件

23、: 变量以等级次序排列公式:举例:序号数学分数X物理分数YX等级Y等级D1949311002909222.5-0.50.25386923.52.511486703.57-3.512.255728254116707665.50.50.257686579-248667685.52.56.25964689811106160101000N=10 =2610个学生数学分数与物理分数表点二列相关:条件:两变量中有一个是二分变量公式:举例:在某班中随机抽取15名学生的数学期末考试成绩如下.问该次考试成绩与性别的相关程度.性别男 男 男 男 女 男 男 女 女 女 男 女 女 男 男成绩86 91 90 66

24、 58 99 74 88 72 89 62 65 78 67 85 相关条件: 二列变量都是二分变量公式:另一类数据合计录取未录取一类数据男aba+b女cdc+d合计a+cb+da+b+c+d=N运用SPSS作相关分析成绩分析之差异情况分析: 问:两个班的数学成绩是否有显著性差异?假设检验任务:判断差异的原因方法:(反证法)步骤:1、提出原假设(零假设) 2、选择和计算教育统计量; 3、对给定的显著性水平确定临界值 4、将统计量计算的结果与临界值比较,从而决定拒绝还是接受原假设。常用的统计检验方法:假设检验:z检验(两平均数的差异检验)T检验 (两平均数的差异检验)F检验( 两个独立样本的方差

25、齐性检验 ) 检验(对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验. )Z检验:条件:总体标准差已知或N30类型:单总体Z检验:双总体Z检验:T检验:条件:总体标准未知,且N30类型:单总体T检验:双总体T检验:(无关小样本)(相关样本)其中,例:某校历届毕业生数学测验平均分数为66分,标准差为11.7。现以同样的试题测验应届毕业生,并从中随机抽18份试卷,算得平均分为69分。问该校应届与历届毕业生数学测验成绩是否一样?假设检验:1、原假设:假设该校应届与历届毕业生数学成绩无显著性差异,即 u66分;2、计算统计量:3、确定临界值:0.05,临界值1.964、

26、判断:因为1.092.093,有显著性进步)例:在初三年级的学生中随机抽取10名学生,在学期初和学期末进行了两次推理能力测验,成绩分别为79.5分和71分,标准差分别为9.124,9.940,相关系数为0.704.问两次测验成绩是否有显著的差异?( 2.262,有显 著性差异 )例:一次数学考试后,从两个学校分别随机抽取试卷n1=10份和n2=9份,算得的样本修正方差即总体方差估计值为 =236.8, =63.36.问两校这次考试离散程度是否有显著差异?( 3.04,有显著差异)例:从某校高中应届毕业生中抽54人进行体检,健康状况属于良好的有15人,中等的有23人,差的有16人.问该校高中应届

27、毕业生的健康状况好中差的人数比率是否是1:2:1?( 1.70,接受原假设。 )方差分析t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验;实际研究中往往需要对三个或三个以上样本的均值进行差异显著性检验.方差分析的目的:通过分析实验数据中不同来源的变异对总体变异贡献的大小,从而确定自变量的不同水平是否对因变量产生了显著的影响.使用条件:正态分布变异的同质性各个观测值之间是独立的.案例:某研究要比较1、3、5年级小学生识记生字量的年级差异。从小学1、3、5年级分别随机抽取30名被试,先让他们识记15个生字,然后对他们识记过的生字进行回忆测验,并对测验所得分数进行收集。(运用SP

28、SS软件)问题六:一个好的测量应具有哪些特征?经典测量理论(良好测验的特征)信度: 含义:稳定性、可靠性、一致性(无目标) 判断方法 效度: 有效性(实现目标的程度) 判断方法难度: 测验项目的难易程度 判断方法区分度:测验对考生实际水平的区分程度 判断方法信度的判断方法再测信度:测验A1 测验A2(适用于速度测验,而不适用于难度测验的信度计算)复本信度:以两个等值但具体内容不同的量表,在最短时距内,对相同被试先后施测两次 测验A1 测验B1内部一致性系数:同一测验的两个部分(例如分为奇数题和偶数题,或测验的前一半和后一半)得分的相关系数。信度介于0到1之间,低于0.35属于低信度,应拒绝使用

29、;在0.5以上,可认为考试可靠;在0.8以上,可认为考试的信度比较好.适当时距最短时距效度的判断方法:效标关联效度(是指测验分数与作为效标的另一独立测验结果之间的一致性程度。)内容效度(是指测验内容与预定要测的内容之间的一致性程度。逻辑分析法;克龙巴赫法、评分一致性考查法、前后测比较法)构想效度(是指测验成绩能够解释心理学理论上的某种结构或特质的程度。步骤:建立理论结构提出有关测验成绩的假设验证假设)难度的判断方法客观题的方法主观题的方法难度P在0-1之间最易容易适中较难难很难P0.950.850.700.500.300.10章节考试20%40%30%10%高考30%30%20%20%竞赛20

30、%30%30%20%区分度的判断方法得分率求差法:D=PH-PL得分求差法:区分度对题目性能的评价标准: 0. 40 很好。 试卷各题得分分析(平均分、标准差)(七年级某题)在计算机上,为了让使用者清楚、直观的看出磁盘“已用空间”和“可用空间”占“整个磁盘空间”的百分比,那么比较适合的统计图是( ) A、扇形统计图 B、条形统计图 C、折线统计图 D、以上都可以估计难度:0.9(难度:*,区分度:*)考察的核心内容与能力:统计数据的活动,知道事实要考查的子技能: 了解“磁盘空间”常识,回答简单的实际问题涉及的知识要素:统计图题干特征: 给出“磁盘空间”的百分比,用比较适合的统计图表示选择支特征

31、:(1)设四个选项,其中有一个是正确的A;(2)三个错误的选项,B、C、 D 是没有理解“比较适合”的含义。 (七年级某题)某商店一次卖给顾客两台彩电,卖出价都是1500元,其中一台盈利20%,另有一台亏了20%。在这次交易中,这家商店的盈亏情况是() A、亏了125元B、不亏不盈C、盈利125克D、盈亏不能确定。估计难度:难;估计难度:0.4 (难度:*,区分度:*)考察的核心内容与能力:数与代数,非常规问题解决要考查的子技能:能够根据非常规问题中的数量关系,列出方程,求出未知数的值,从而解决实际问题。涉及的知识要素:例一元一次方程、解一元一次方程题干特征:联系实际生活选择支特征:(1)设四

32、个选项,其中有一个是正确的A;(2)三个错误的选项,B、错在将亏了20%和盈利的20%相加减;C属于计算错误;D不能对问题进行具体分析。期待着您的共同讨论、共同研究!谢谢大家!项目反应理论经典测量理论的局限性真实分数=实测分数+误差问题:(1)测量次数够多时,误差才会相互抵消(2)考生得分相同,是否其真实能力也一样?(3)对考试题目的评价(难度、区分度、猜测度等),严重依赖于被测对象。IRT项目反应理论(item response theory)也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察

33、分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用。目的:选取难度适中,区分度高、猜测度低和信息量丰富的试题组成一份考卷或测验卷,考查学生的真实能力。题目特征曲线和信息曲线D=1.702(常数), 表示考生能力水平,a表示题目区分度,

34、b表示题目的难度系数,c表示题目的猜测系数. 表示能力为 的考生答对此题的概率,即正确反应概率.特征曲线拐点处的斜率,即斜率的最大值。表示题目的区分度,它的值越大说明题目对受测者的区分程度越高。 特征曲线上最陡的那一点所对应的值,表示题目的难度。 特征曲线的截距,表示题目的猜测参数,它的值越大,说明不论受测者能力高低,都容易猜对本道题目。 数学学习评价的目的与功能(为什么评价)目的:提供教与学状况的准确信息,促进教与学的改进。(为学生提供信息、为教师提供信息、为家长提供信息、为教育系统提供信息)功能:甄别、选拔 反馈、 诊断、激励、 导向、决策基础教育课程改革纲要指出:改变课程评价过分强调甄别

35、与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。 XX同学此次考试成绩优异或有明显的进步!某某同学基础知识和基本技能掌握不牢或解题时经常粗心大意!王小明同学,本学期我们学习了收集、整理和表达数据。你通过自己的努力,能收集、记录数据,知道如何求平均数,了解统计图的特点,制作的统计图很出色,在这个方面是全班最好的。但你在使用语言解释统计结果方面有一定困难。继续努力,小明! 评定等级:B。数学学习评价的内容(评价什么)学生数学学习评价 数学基础知识与基本技能(“了解、理解、掌握、应用” 与“经历、体验、探索 ”的结合 )数学学习的过程与方法(包括解决问题、数学推理和交流能力等)数学

36、学习情感、态度与价值观(参与数学活动的情况、思考问题、合作交流等)数学学习评价的方法(如何评价)量化的评价方法(是一种力图把复杂的教育现象简化为数量,进而从数量的分析与比较中推断某一评价对象的成效的评价方式)如:测验法、问卷调查法质性评价方法(是以研究者本人作为研究工具,在自然情境下采用多种资料收集方法对现象进行整体性探究,全面充分揭示和描述评价对象的各种特质,以彰显其中的意义,促进理解的一种评价方式)如:观察法、访谈法 教育测量:根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程。教育测量与评价关系:、测量为评价提供依据,是评价信息的主要来源,如无测量提供的资料,评价将失

37、去作价值判断的依据;、测量的结果只有通过评价才能获得实际意义,成为决策者有参考价值的信息。 泰勒原理介绍:(1) what educational purposes should the school seek to attain? “确定教育目标”(2) What educational experiences can be provided that are likely to attain these purposes? “选择教育经验”(3) How can these educational experiences be effectively organized? “组织教育经验”

38、(4) How can we determine whether these purposes are being attained? “评价教育计划”返回布卢姆的教育目标分类系统介绍(1)认知领域(6级):识记、领会、运用、分析、综合、评价(2)情感领域(5级):接受、反应、价值化、组织、价值与价值体系的性格化(3)动作技能领域(6级):反射动作、基础性的基本动作、知觉能力、生理能力、技能动作、有意活动返回 国际数学学习评价简介TIMSS与PISA TIMSS简介PISA简介TIMSS与PISA的区别与联系TIMSS简介TIMSS的含义:是由国际教育成就评价协会(简写为IEA)组织的,原为T

39、hird International Mathematics and Science Study,每四年进行一次,现为Trends in International Mathematics and Science Study的缩写。 TIMSS的特点:是当今世界最大、最广且最严格的国际性评价研究。TIMSS的评价体系测评题与问卷样例 思考:运用TIMSS所收集的数据可进行哪些方面的评价研究?(国家或地区间成绩比较、国家成绩的发展趋势、成绩的性别差异比较、测成绩的影响因素(语言、父母受教育程度、电脑、对数学的态度、到校情况、学校资源、学校氛围)、数学课程与教学的比较(课程标准、教材使用、教学指导

40、方式、家庭作业、数学测验情况)TIMSS的评价体系:评价目的:了解学生对数学和科学课程的掌握情况,对各国数学教育和科学教育的情况进行比较研究 。评价对象:各个国家和地区4年级(不低于9.5岁)和8年级(不低于13.5岁)的在校学生 。评价内容评价方式TIMSS的评价内容:内容领域(content domain)Grade 4: Number(数), Geometric Shapes and Measures(几何图形与测量), Data Display(数据表示) Grade 8: Number(数), Algebra(代数), Geometry(几何), Data and Chance(数据

41、和概率)。 认知领域(cognitive domain) Knowing(理解), Applying(应用)and Reasoning(推理) TIMSS的评价方式:三层次课程模型: 预期课程(Intended Curriculum) ; 实施课程(Implemented Curriculum) ; 达到课程(Attained Curriculum) 评价的方法 “纸笔测试”+“背景问卷”(学生问卷、教师问卷、学校问卷、课程问题) 评价模型: 课程问卷预期课程实施课程达到课程校长、教师问卷测试题、学生问卷PISA简介PISA的含义:PISA(The Programme for Internat

42、ional Student Assessment)是世界经济合作与发展组织(The Organization for Economic Co-operation and Development,以下简称OECD)的一项国际学生评价项目。 PISA的特点:每三年进行一次,每次重点关注点不同。2000年以阅读素养为主,2003年以数学素养为主,2006年以科学素养为主。每三次为一个循环。PISA的评价体系测试题与问卷样例思考一:运用PISA所收集的数据可进行哪些方面的评价研究?思考二:上海2009年参加PISA的结果?PISA的评价体系评价目的:评价学生现实生活和终生学习所必需的知识技能等基本素养

43、的掌握状况,以判断学生是否具备未来生活所需的知识、技能和终身学习的能力 。评价对象:各国和地区15岁的初中毕业生(15岁3个月到16岁2个月年龄段之间完成义务教育的学生) 评价内容评价方式PISA的评价内容:打破了学校课程的限制,按照数学素养的定义,以数量、空间和图形、变化和关系、不确定性为主要内容领域;以再现、联系、反思把解决数学问题的能力分为三组 。再现组:标准化的呈现和定义;常规计算;常规问题解决联系组:模式化;标准问题解决转化和解释;多种明确的方法 反思组:复杂问题解决和呈现;反思和洞察;新颖的数学方法;多种复杂的方法;推广 评价方式:PISA建立在“终身学习”(Lifelong le

44、arning)的动态模型基础之上,认为:终身学习就是一个人在他的一生中不断通过学习获得为成功地适应不断变化的世界所必需的新知识和技能。 评价方法:“纸笔测试”+“背景问卷”(学生问卷、学校问卷、家长问卷、ICT问卷) 上海2009年PISAPISA2009有65个国家和地区参加测评,其中,中国上海152所学校的5115名15岁在校生首次参测,夺行阅读、数学、科学三冠。引起了国际的关注。美国纽约时报2010年12月一则消息(中国在)国家学生水平评测的前茅成绩令(美国)教育家惊诧,曾在里根政府期间教育部任职的切斯特E 费恩甚至说“我感到有点震惊,这让我想到史普尼克”;日本共同社指出,“上海的教育模

45、式引起了全球瞩目”。巴黎法新社指出,“上海青少年有全世界最好的教育”。各国家和地区对中国学生的印象大为改观,不仅认可中国上海教育质量的提升,还纷纷挖掘上海教育经验,充分肯定了上海教育均衡发展政策和新课改的成效。冷思考:(1)上海的成绩能代表中国的成绩吗? (2)成绩背后学生的付出? (3)中国日报2010年11月的一篇报道“中国学生想象力倒数第一,创造力倒数第五”(“钱学森之问”和“诺贝尔奖情结”)平均分和标准差表次数123456789平均分数83.6 86.289.4888578.18689.284.9班级标准差9.48.56.98.29.38.26.355.47.8学生甲在初中一学年9次数

46、学考试成绩对照表考试次数123456789原始分868495989289948697标准分0.25-0.260.811.220.750.961.26-0.591.55TIMSS系列研究是当今世界最大、最广且最严格的国际评价研究,具体体现在以下几个方面:参与国家多。参与TIMSS1995,1999,2003,2007测评的国家和地区数依次为45,38,49,59。较IEA在1980 -1982年组织的第二次国际数学研究的20个国家来说,其数目增加了约一倍.参加测试的学生人数多.如在TIMSS1995,参加测试的学生有50多万,来自15, 000多所学校.涵盖的数学测试内容广。内容领域和认知领域调查的对象范围广.TIMSS系列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论