




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 本文主要研究如何科学地分析和评价学生的考试成绩和试题质量。 本文分两部分,第一部分主要介绍考试成绩的分析及考生学习能力评价,共 分三小节。第一节对学生考试成绩分布类型及其如何描述进行了探讨。针对教育 测量理论对考试成绩的评价习惯运用正态分布模型去进行拟合和统计分析,作者 提出了自己的观点:考试成绩有时呈偏态分布。并从理论及实际数据两方面加以 论证,进一步提出在考试成绩呈偏态分布的情况下,成绩分布的集中指标用算术 平均数描述不一定合适,改用样本中位数进行描述更具有合理性,成绩分布的离 散指标相应可以用半四分位间距进行描述。第二节针对数据分组时样本中位数计 算公式上存在的缺陷:在数据分组和未分组情况下所计算出的样本中位数不一 致。针对此情况,本文提出了对数据分组时样本中位数计算公式的修订意见。第 三节探讨了成绩的可比性,并简要介绍了目前的高考标准分制度,迸一步指出在 学校管理中,可借鉴高考标准分的处理原则,得到比较适合于学籍管理的标准分。 第二部分共分二小节。第一节介绍了目前存在的两种主要测量理论( c t t 和 t r t ) ,即经典测量理论和项目反应理论,分别指出他们的优、缺点和两者之间的 联系。第二节提出在进行题库建设时可利用专家意见给出试题的参数估计,以及 探讨了如何不断对试题难度指标进行修订和校准,给出了试题难度指标的校准公 式和计算程序。 关键词;正态分布,样本中位数,标准分,经典测量理论,项目反应理论,项目 特征曲线,难度系数,区分度。 a b s t r a c t t h i st h e s i si n v e s t i g a t e sh o wt os c i e n t i f i c a l l ya n a l y z ea n da s s e s ss t u d e n t s t e s t s c o r ea n d q u a l i t yo f t e s ti t e m s t h et h e s i si sd i v i d e di n t ot w op a r t s p a r to n ei n c l u d e st h r e es e c t i o n s ,i tm a i n l y d i s c u s s e st h ea n a l y s i so ft e s ts c o r ea n da s s e s s m e n to fp a r t i c i p a n t s l e a m a b i l i t y s e c t i o no n ee x p l o r e st h ed i s t r i b u t i o nt y p e so fs t u d e n t s s c o r e sa n dh o wt od e s c r i b e t h e m i ne d u c a t i o n a lm e a s u r e m e n tt h e o r y , t h ee v a l u a t i o no ft e s ts c o r ei so f t e n s u m m a r i z e da n da n a l y z e db ym e a n so fn o r m a ld i s t r i b u t i o n , t h ea u t h o rp u t sf o r w a r d h i so w ni d e at h a tt e s ts c o i c si ss o m e t i m e si nas k e w e dn o r m a ld i s t r i b u t i o n 1 ti s d e m o n s t r a t e db yt h e o r ya n dd a t a , a n di ti sn o ts oa c c u r a t et od e s c r i b et h ec e n t r a l t e n d e n c yb ym e a n so fa r i t h m e t i cm e a na sb ym e d i a n ,t h ec o r r e s p o n d i n gd e g r e eo f v a r i a b i l i t yo ft h es c o r e ss h o u l db ed e s c r i b e db ys e m i i n t e r q u a r t i l er a n g e ( s i r ) s e c t i o nt w op o i n t so u tt h es h o r t c o m i n g so f t r a d i t i o n a ld e f m i t i o no f m e d i a n :a c c o r d i n g t ot h ed e f i n i t i o n ,m e d i a ni sd i f f e r e n tw h e ni ti sd i v i d e di n t og r o u p sf r o mt h a tw h e ni t i sn o td i v i d e di n t og r o u p s i no r d e rt os o l v et h i sp r o b l e m ,t h i st h e s i sm o d i f i e st h e f o r m u l aa ss a m p l em e d i a na p p r o x i m a t i o nw h e nt h ed a t ai sd i v i d e di n t o g r o u p s s e c t i o nt h r e ed i s c u s s e st h ec o m p a r a b i l i t yo f t e s ts c o r e s ,a n dg i v e sab r i e fi n t r o d u c t i o n t ot h es t a n d a r d i z a t i o no fs c o r e si n c o l l e g ee n t r a n c ee x a m i n a t i o n ,t h e nd r a w i n g i m p l i c a t i o n sf r o mt h i s ,t h ea u t h o rp o i n t so u tt h a t i nc o l l e g em a n a g e m e n t ,t h e s t a n d a r d i z a t i o no fc o l l e g et e s ts c o r e sc a nb eu s e di nt h es c h o o lr o l lm a n a g e m e n t p a r tt w oi sd i v i d e di n t ot w os e c t i o n s s e c t i o no n eg i v e sa ni n t r o d u c t i o nt ot w o m a j o rt h e o r i e so fm e a s u r e m e n t :c l a s s i c a lt e s t i n gt h e o r ya n di t e mr e s p o n s et h e o r y i tp o i n t so u tt h e i rm e r i t s ,s h o r t c o m i n g sa n dt h er e l a t i o n s h i pb e t w e e nt h e m i ns e c t i o n t w o ,a i m i n ga tt h ed e v e l o p m e n to ft e s ti t e mb a n ki nh i g h e rs c h o o l s ,t h ea u t h o rp u t s f o r w a r dh i si d e ao fh o wt om a k eu s eo fe x p e r t s v i e wt ow o r ko u ti t e mp a r a m e t e r e s t i m a t e s ,a n dp o i n t so u tt h a tt h ei n d i c e so fi t e mq u a l i t ys h o u l db ec o n s t a n t l ym o d i f i e d a n da d j u s t e dw h e nt e s ti t e mb a n ki sb e i n gd e v e l o p e d ,a n di tp r e s e n t st h ea d j u s t i n g f o r m u l aa n d c a l c u l a t i n gp r o c e d u r ef o rd i f f i c u l t yi n d i c e so f t e s ti t e m s k e yw o r d :n o r m a ld i s t r i b u t i o n ,s a m p l em e d i a n ,t h es t a n d a r d i z a t i o n o fc o l l e g e t e s ts c o r e s ,c l a s s i c a lt e s t i n gt h e o r y , i t e mr e s p o n s et h e o r y , i t e mc h a r a c t e r i s t i c c u r v e ,d i f f i c u l t yc o e f f i c i e n t ,d i f i e r e n t i a t i o ni n d e x 学位论文独创性声明 本人所里交的学位论文是我在导师的指导下进行的研究工作及取得的研究 成果据我所知,除文中巳羟注明引用的内容外,本论文不包含其他个人巴经发 表或撰写过的研究成果对本文的研究做出重要贡献的个人和集体,均巳在文中 作了明确说明并表示谢意 作者签名:丛i 墨:日期:2 1 生:! ! 工箩 学位论文使用授权声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保留 学位论文并囱国泉主管部门或其指定机构迭交论文的电子版尜纸质版有权将学 位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅有权将学 位论文的内客鳊入有关数据库进行检索有权将学位论文的标题和摘要汇编出 版保密的学位论文在解密后适用本规定 学位论文作者签名:易澎止、 日期:炒p 导师斟:j 职 日期:刊。一1 考试成绩及试题质量的分析与评价 绪论 从人类诞生之日起,教育这实践活动就承担了光荣而又沉重的历史使命, 它使人类世界的进化有了内在的承续性。也正因为如此,教育就成了人类理智探 索的永恒话题。要检验教育的效果,离不开对被教育者的评价,其中最重要的一 环就是采用教育测量的方法来检测教育效果。教育测量,就是运用各种手段和统 计方法对教育者完成教育目标的程度和被教育者学习的成就,给予数量或等级的 描述,并做出科学的判断。从我国古代的科举考试到现在标准化测试,均属于教 育测量的范畴。考试是人类社会特有的一种测量、评定人的知识和技能等个体差 异特征的社会活动。 众所周知,作为对教学过程的评价手段,考试是学校教学管理的重要环节。 它既是对学生学业成功度的考查,也是对教师教学效果的检验,并为教师调整教 学、学生总结学习提供反馈信息,故对教与学起着重要的导向作用。然而,考试 是一项复杂的工程,是一个具有多因素、多变量,有较大信息量通过的多学科的 动态系统。我们必须以教育学、心理学和统计学为基础,运用各种测试方法和手 段,才能进行科学的测定和评价。 在现代教育管理中,人们非常重视利用信息去实施管理。考生的分数就是重 要的“信息源”。通过对考试分数的收集、整理、分析和研究,可为改进教育方 法、提高教学质量提供重要信息,如指导考生学习;依据考试分数对考生的知识、 能力发展倾向进行预测:分析教育或教学质量;为重要的教育决策提供事实根据 或数量化的理论依据等。对考试成绩进行分析,方面,有利于教师检查教学目 标的实现情况和教学措施的实施效果,发现教与学两方面存在的问题,从而不断 改进教学方法和教学手段,提高教与学的质量;另一方面,有利于教师科学地分 析试卷,提高命题质量,加强评分的标准化。因此对考试成绩进行科学地分析非 常熏要。 本文在第一部分首先指出传统的教育测量理论对考试成绩的评价习惯运用 正态分布模型去进行拟合和统计分析,然而通过对正态分布模型的理论探讨和大 量实际数据研究表明,考试成绩有时呈偏态分布,进一步指出在考试成绩呈偏态 分布的情况下,成绩分布的集中指标改用样本中位数进行描述更具有合理性,成 绩分布的离散指标相应可以用半四分位间距来描述。其次,针对数据分组时样本 中位数计算公式上存在的缺陷,本文给出了对计算公式的修订意见,解决了在资 1 考试成绩及试题质量的分析与评价 料分组和未分组情况下样本中位数的位置不相符这一问题。最后,借鉴高考标准 分的处理原则,探讨了在学校管理中如何得到适合学籍管理的标准分。 考试能否真实地反映教师的教学水平和学生对知识技能的掌握程度,关键在 于试卷质量。对试卷进行科学地分析和评价是系统评定教学质量的重要组成部 分,是考查与评定教师教学工作和学生学习情况是否科学的重要手段,也是不断 提高、改进教学工作的重要环节。开展试卷分析一是为了评价考试的质量。一次 考试之后,它的成绩可靠不可靠,有多大的可靠性? 它的目标达到了没有,实现 到何种程度? 哪些试题的质量较好,好在哪里? 哪些试题较差,差在何处? 这些 问题我们可以通过试题分析来进行评价。特别是由于试题提供的材料详尽具体, 除可供定性分析外,还可以进行定量分析,从而得出比其他方法更精确的评价。 因而,试卷分析就成为我们评价考试质量的最重要、最有效的方法。二是为了做 好今后的考试工作。首先,它能够为改进考试设计工作,使之更符合考生实际。 其次,它能够为改进命题工作提供大量信息,提高试题和试卷的编制质量。再次, 如果考试使用的是题库中的试题,那么,对于题库的提高和完善来说,它就是一 次理想的试测。试卷分析对于改进试题的试卷编俸, j - r 作的作用将更直接,价值也 更大。同时,试卷分析也是对评卷等工作的一次检查,有利于提高组织管理工作 质量。三是为了改进教学工作。试卷分析是对试卷中储存的信息进步发掘和利 用,这信息不仅对检查和改进考试工作有重要的价值,对于改进教学工作,提高 教学质量也大有益处。教师可以通过对考试质量的分析,了解考生对教材、教法 的适应情况,诊断教学过程中所存在的问题,以便于调整教学内容和教学方法, 发现每个考生的特点、潜力、适应性、能力等,进行有针对性的教学或进行适应 考生特点的学习指导。一般来说,评价试卷质量的指标为信度和效度,评价试题 质量的指标为难度和区分度,本文主要叙述难度和区分度的估计问题。 本文在第二部分首先介绍了目前主要的两种测量理论( c t t 和i r t ) 中关于 难度和区分度的定义和计算方法,分别指出他们的优、缺点和两者之间的联系, 其次,提出在进行题库建设时可利用专家意见给出试题的参数估计,探讨了如何 不断对试题难度指标进行修订和校准,给出了试题难度指标的校准公式和计算程 序。 考试成绩及试题质量的分析与评价 第一部分考试成绩分析及考生能力估计 考试评价和成绩分布规律对教育科学研究具有重要意义。为更深刻地评价认 知输入过程中诸影响因素的效应,对考试成绩资料的统计分布规律加以研究很有 必要。长期以来,教育测量理论对考试成绩的评价习惯运用正态分布模型去进行 拟合和统计分析( 1 ) ,故通常运用算术平均数和标准差作为成绩分布的集中量 指标和离散指标来进行描述。然而在实际中成绩分布不一定为正态,有时呈偏态 分布。当数据呈偏态分布时,算术平均数x 不能很好地反映平均水平,此时改 用样本中位数m 来考察分析则较为合理。当我们运用样本中位数来描述成绩分布 的集中指标时,成绩分布的离散指标相应可以用半四分位间距进行描述。针对数 据分组时样本中位数计算公式上存在的缺陷,本文给出了对计算公式的修订意 见,解决了在资料分组和未分组情况下样本中位数的位置不相符这一问题。进一 步提出在学校管理中如何借鉴高考标准分的处理原则,从而得到比较适合于学籍 管理的标准分。 考试成绩及试题质量的分析与评价 1 考试成绩的分布及其描述 传统的教育测量理论认为,学生考试成绩的分布一般为正态分布,然而通过 对正态分布模型的理论探讨和大量实际数据研究表明,学生考试成绩分布不一定 为正态,有时呈偏态分布。 例1 :我院某班高等数学成绩分布直方图: 1 0 0 其中;m i n i m u m 4 3 0 0 m a x i m u m q l 9 8 0 075 5 0 g m 9 0 0 08 1 88 5 y x , q 1 为第1 四分位数;q 3 为第3 四分位数;i = 型= - ( 其中,为某科成绩 总分,n 为考生人数) 为算术平均数;m 为中位数。 为检验成绩分布是否正态分布,我们运用k o m o g o r o v s m if f l o v 检验,所得 统计量的值为d = o 1 4 1 ,检验的p 值是 o 0 1 ,由于它小于0 0 5 ,所以在显著性 水平0 0 5 上拒绝正态性假设。 oc丁口oil 考试成绩及试题质量的分析与评价 n o r m a lp r o b a b i l i t yp l o t 考试成绩的分布是否一定符合正态分布规律? 考虑到考试评价和成绩分布 规律对教育科学研究的重要意义,为更深刻地评价认知输入过程中诸影响因素的 效应,对考试成绩资料的统计分布规律加以研究很有必要。 在一般情况下,我们可以假定人的基本心理素质,如智力、内外倾向特征等, 在未经筛选过的社会人群中,其总体分布呈正态( 2 ) 。然而,就教育条件下的具 体学科知识与技能的掌握来说,断定其必然会在学生中呈正态分布,就缺乏充分 理由。 首先,被试者来源具有非随机性。在教育领域,不同的学校和不同类型的专 业设置,对选择学生有不同的标准。例如社会知名度不同的学校,选择学生的智 能标准就不同;我国高等学校的学生都是经过大规模比较性考试精选而来,这样 就造成被试者不是来自随机取样的群体。 其次,即使是同一专业,在不同学校,教学活动的组织、教学设施、师资水 平和学生群体的社会心理气氛等往往不同。而在教学过程中,教师的教育影响与 学生的学习积极性这两个因素起着主导、决定的作用,这与正态变量的形成条件 相距甚远。 再次,考试方式和试题质量直接影响考试成绩及其分布。目前我国高校学生 考试成绩较普遍地存在分数高于实际水平的现象,我们称它为“分数贬值”,这 是分数失控的一种表现,是一种带有倾向性的失控,它使考试分数朝着高于真实 分数的方向偏离。分数贬值在分布上的表现为:成绩分布呈负偏态,平均分数明 考试成绩及试题质量的分析与评价 显偏高;分数集聚于高分段。获优秀成绩的人数有些科目多达学生数的三分之一, 甚至在二分之一以上,而成绩属于低分段的却寥寥无几。造成分数贬值现象的原 因很多,但主要原因在于命题的不科学性、评分标准的随意性和考试方法的单一 性及无针对性。从调查可知,我们的大部分命题属于传统的经验性命题,由任课 教师独立命题,大都采用主观题型,且题型单调、题量少、知识覆盖面窄,故信 度、效度均难以保证。由于教师个人对教学目标和教学基本要求的理解不尽相同, 各人的教学经验也存在差异,因而命题的重点、难度、题型等都有较大的主观随 意性。主观性试题主要缺陷之一就是评分不客观,常常因人而异、因时而异,评 分标准很难掌握,从而影响考试的信度和学生成绩的评定。在考试方法上,单纯 采用闭卷笔试,试题多半考核学生对书本知识的记忆,教师考前圈定考试范围。 教师重点讲解,学生突击背诵。另外,这种现象还与考风不正,教学管理不实行 分数控制,教师责任心不强、投入不足、降低考试标准等有关。 由上所述,学生考试成绩分布并非一定呈现正态。因此对于同一门课的教师 的教学效果或对同一年级各班成绩的评价。用算术平均数x 作为描述成绩数据 的集中量指标,来考察、分析学生的考试成绩有时不一定合适。此时改用中位数 m 来考察分析,则较为合理。在例1 中,均值为8 1 8 ,中位数为8 5 ,由于第一、第 三四分位数分别为7 5 5 和9 0 ,所以有一半人的成绩在7 5 5 和9 0 之间,故用中 位数更能显示数据的分布。如下例所示,学生考试成绩平均分较高,分数集聚于 高分段,分布呈负偏态。 例2 : 我院2 0 0 1 级物理学专业高等数学考试成绩 分数人数 累计人数 4 5 5 0l1 5 0 5 5 2 3 5 5 6 014 6 0 6 526 6 5 7 039 7 0 7 541 3 7 5 8 051 8 8 0 8 5l o2 8 8 5 9 01 44 2 9 0 9 51 75 9 9 5 1 0 0l6 0 在此例中,i :8 2 8 ,m :8 5 7 ,两者数值相差较大,用牙计算结果偏小。 6 考试成绩及试题质量的分析与评价 对于一组数据的全貌,仅用集中量指标来描述远远不够。因为集中量仅描述 了一组数据的平均水平和集中趋势,为此我们引入差异量指标,它表示一组数据 的变异程度或离散程度。差异量越大,表示数据分布的范围越广,越不整齐;差 异量越小,表示数据分布的越集中,变动范围越小。常用的差异量指标有全距、 半四分位间距、平均差、方差、标准差、差异系数等。 当一组数据用样本中位数表示集中量时,相应可以用半四分位间距表示差异 量 3 。因为他们同属于百分位系。半四分位间距简明易懂,计算简便,较少受 两极端数值的影响。半四分位间距是用第3 四分位数与第l 四分位数差的一半作 为离散指标。也就是将一组数据按大小顺序排列或编成频数分布表后,将总频数 分为相等的四段,每段包括总频数2 5 的数据。第1 四分位数是指量表上相应于 第2 5 百分位数的那一点,第3 四分位数是指量表上相应于第7 5 百分位数的那 一点。半四分位间距用q 表示,计算公式为: 9 = 望些 其中q 3 、q j 分别表示第3 四分位数和第1 四分位数 考试成绩及试题质量的分析与评价 2 数据分组时样本中位数计算公式的探讨 在上一节我们指出,学生考试成绩分布不一定为正态,有时呈偏态分布,故 我们改用样本中位数来描述成绩的位置特征。然而我们发现数据分组时样本中位 数计算公式存在一定的缺陷:在数据分组和未分组情况下所计算出的样本中位数 不致。 样本中位数是指把数据资料按大小次序排列后,位于序列中点的这个数。当 样本容量n 为奇数时,第_ n + - 1 个数为样本中位数;当n 为偶数时。第;个数与 第罢+ 1 个数之和的一半作为样本中位数。对已整理成频数分布表的数据,样本 中位数近似计算公式为: = 工+ ;( 三一c j c z , 公式( 2 ) 中l 为样本中位数所在组的下限值,i 为组距,f 为样本中位数所 在组的频数,n 为样本含量,c 为样本中位数所在组的前组累计频数。之是假定 j 样本中位数所在组内各个数值之间,以该数值为间距而均匀分布的。 在大样本的情况下,都是在整理频数分布表的条件下,按公式( 2 ) 计算样 本中位数。然而本人发现样本中位数计算公式存在一些与中位数定义、频数分布 表组限确定原则不相符的问题:公式( 2 ) 对样本容量的奇偶性做出忽略不计的 要求,统统按罢计算样本中位数。但是,公式在实际的运算过程中,却在样本容 量为奇数时,按偶数计算样本中位数;样本容量为偶数时,则按奇数计算,明显 与样本中位数的定义不符。样本中位数所在组内的位次有3 种情况:一是在组内; 二是在组的第l 位;三是在组的末位。现选用三本教科书中的3 个不同例题,按 公式( 2 ) 计算样本中位数来进行分析。 1 、样本中位敦位于组内 1 1 引用文献 4 中例2 11 0 0 名学生1 5 0 0 米跑成绩( 单位:秒) 资料见表1 ,运用公式( 2 ) 计算样本中位数 考试成绩及试题质量的分析与评价 表1 频数分布表( i = 1 6 s ) 注:以下分组为左闭右开区间 组限频数累计频数 2 6 6 l1 2 8 2 34 2 9 8 81 2 3 1 4 1 93 1 3 3 0 2 55 6 3 4 6 2 17 7 3 6 2 1 08 7 3 7 8 69 3 3 9 4 49 7 4 1 0 31 0 0 表2 样本中位数所在组限各数据的位次、间距数与所对应成绩 位次实际间距数位次成绩 3 2o 3 3 0 0 0 ( 下限值) 3 3 1 3 3 0 6 4 3 423 3 1 2 8 3 533 3 1 9 2 3 643 3 2 5 6 3 7 53 3 3 2 0 3 8 63 3 3 8 4 3 973 3 4 4 8 4 0 83 3 5 1 2 4 193 3 5 7 6 4 21 03 3 6 4 0 4 3l l3 3 7 0 4 4 41 23 3 7 6 8 4 5 1 33 3 8 3 2 4 6t 43 3 8 9 6 4 71 53 3 9 6 0 4 81 63 4 0 2 4 4 91 73 4 0 8 8 5 01 83 4 1 5 2 5 11 93 4 2 1 6 5 2 2 03 4 2 8 0 5 32 13 4 3 4 4 5 4 2 23 4 4 0 8 5 52 33 4 4 7 2 5 6 2 43 4 5 3 6 5 7 2 6 3 4 6 0 0 ( 上限值) 9 考试成绩及试厘质量的分析与评价 确定样本中位数所在组。按公式( 2 ) 中的“昙= 半= 5 0 ”表示样本中位 数为该数列中第5 0 名学生1 5 0 0 米跑成绩,从表l 可知样本中位数应在3 3 0 这 一组,该组包括从第3 2 名学生至第5 6 名学生成绩。 1 2 样本中位数所在组内各个数值的分布。由于公式是在假定样本中位数所在 组中2 5 名学生1 5 0 0 米跑成绩是以专= 云1 6 = 0 6 4 的间距均匀分布在3 3 0 的组内, 见表2 。 1 3 样本中位数与所在组下限值的间距数。根据公式( 2 ) :詈一f = 1 0 _ 0 3 1 :1 9 , 表示样本中位数在该组限中的位次从第3 2 位数至第5 0 位数,中间相隔1 9 个位 次。 1 4 计算样本中位数。 l = 3 3 0 + 西1 6 ( 半一3 1 ) 1 9 = 3 4 2 1 6 。 1 5 问题: ( i ) 本例样本容量n = i 0 0 ,按定义样本中位数应为第5 0 名与第5 1 名学生 成绩和的一半( 3 4 1 8 4 ) 。然而根据表2 我们发现公式( 2 ) 实际上是将样本容量 为偶数的样本,按奇数计算的样本中位数,即第5 1 名学生成绩( 3 4 2 1 6 ) ,与样 本中位数的定义不符。 ( 2 ) 公式( 2 ) 样本中位数与下限值的间距数是昙一c = 1 9 。而表2 中的样 本中位数与下限值的实际间距数为1 8 5 ,而不是1 9 ,不符合样本中位数的定义。 2 、样本中位数位于组内第1 位 引用文献 5 数据瓷料,见下表3 。按以上分析步骤,从表3 中可知,样本 中位数在4 7 5 这一组。而且位于组内数值的第1 位( 即第5 1 位) 。由公式( 2 ) 计算样本中位数m = 4 7 5 8 。对照表4 ,发现与上述相同的问题,公式( 2 ) 实际 上是将样本容量为奇数的样本,按偶数计算样本中位数,即第5 1 位和第5 2 位学 生成绩和的一半,即m = 4 7 5 8 5 ( 见表4 ) ,明显与样本中位数定义不符。此外样 本中位数位于该组的第1 位,与下限值的间距数应是0 ,而不是l ,显然公式( 2 ) 样本中位数的位次与下限值的间距数昙一c 也有问题。 1 0 考试成绩及试题质量的分析与评价 表31 0 1 名原地纵跳高度频数表 注:以下分组为左闭右开区间 组限频率累计频数 3 0 o 33 3 3 5 71 0 3 7 0 71 7 4 0 5 1 l2 8 4 4 0 2 25 0 4 7 5 2 17 l 5 1 o 1 78 8 5 4 5 59 3 5 8 o 49 7 6 1 5 31 0 0 6 5 o 11 0 l 1 0 1 表4 样本中位数所在组限各数据的位次与所对应成绩 位次实际间距数位次成绩 5 1o 4 7 6 0 ( 下限值) 5 2 14 7 6 7 5 324 7 8 3 5 434 8 0 0 5 544 8 1 7 5 6 54 8 3 3 5 764 8 5 0 5 874 8 6 7 5 9 84 8 8 3 6 0 94 9 o o 6 11 04 9 1 7 6 2 l l4 9 3 3 6 31 24 9 5 0 6 4 1 34 9 6 7 5 51 44 9 8 3 6 61 5 5 0 0 0 6 7 1 65 0 1 7 6 81 7 5 0 3 3 6 9 1 85 0 5 0 7 01 95 0 6 7 7 12 05 0 8 3 7 2 2 1 5 1 0 0 ( 上限值) 考试成绩及试题质量的分析与评价 3 、样本中位数位于组内末位 引用文献 6 数据资料,见表5 。按以上分析步骤,从表5 中可知,样本中 位数在8 8 1 这一组。从表6 可看出组内1 5 个数值均匀分布在8 8 1 ,8 8 2 l , 8 8 3 3 ,8 9 6 9 的区间内。按公式( 2 ) 计算样本中位数m = - 8 9 8 。对照表6 发现实际计算的样本中位数是第2 6 位学生成绩( 即按奇数计算) ,而且等于该组 限的上限值,明显不符合上限值不在组限内的原则;样本中位数与下限值的间距 数应是1 4 。5 ,而不是1 5 。因此,公式( 2 ) 也同样存在以上两个问题。 表55 0 名学生纵跳摸高成绩频数表 注:以下分组为左闭右开区间 组限 频数 累计频数 8 3 0 1l 8 4 7 ol 8 6 4 91 0 鹋1 1 5 2 5 8 9 8 93 4 9 1 5 1 2 4 6 9 3 2 2 4 8 9 4 9 25 0 5 0 表6 样本中位数所在组限各数据的位次与所对应成绩 位次实际间距数成绩 1 10 8 8 1 0 ( 下限值) 1 2l 8 8 2 l 1 328 8 3 3 1 438 8 4 4 1 548 8 5 5 1 658 8 6 7 1 768 8 7 8 1 87 8 8 8 9 1 9 8 8 9 o l 2 098 9 1 2 2 l 1 0 8 9 2 3 2 2l i8 9 3 5 2 31 28 9 4 6 2 41 38 9 5 7 2 51 4 8 9 6 9 2 61 5 8 9 8 0 ( 上限值) 考试成绩及试题质量的分析与评价 4 、问题分析及修正 4 1 公式( 2 ) 虽然对样本容量是奇数还是偶数做出忽略不计的要求,统统按昙 计算样本中位数。但是,公式( 2 ) 在实际的运算过程中,却在样本容量为奇数 时,按偶数计算样本中位数;样本容量为偶数时,则按奇数计算,明显与样本中 位数定义不符。针对该问题,只需对公式( 2 ) 中的昙改用昙+ 0 5 ,这样就不会 出现上述问题,且符合样本中位数的定义。若n 为奇数,加上0 5 ,则正好等于 数列的中点数冬 ;如n 为偶数,加上o 5 ,则正好等于居中两个数值和的一半。 4 2 公式( 2 ) 中的昙一c 是计算样本中位数与下限值的间距数,假设为m ,然 而实际的计算的间距数是m + l 。这是因为第1 位是下限值,间距数为0 。所以一 只需将公式( 2 ) 中的e 改甩c 一1 ,即将样本中位数的间距数向前移动一位。这 样计算的样本中位数,符合“上限值不在组内的原则”,解决无论样本中位数处 在组内的任何位置( 第l 位或最后l 位) ,都使样本中位数的位次与下限值的实 际间距数完全一致。 4 3 如上所述,对公式( 2 ) 存在的问题进行校正后,最后得出校正后样本中位 数公式: m = 十专( 三+ 。s c t c 。, 将上述文献例题数据代入公式( 3 ) 计算样本中位数的结果,与公式( 2 ) 结果进 行比较见表7 。从表7 可知公式( 3 ) 计算结果与样本中位数定义完全一致,但 比公式( 2 ) 偏低正好半个之单位。 考试成绩及试题质量的分析与评价 表7 公式( 2 ) 、( 3 ) 及定义公式样本中位数计算结果比较 例题 例题l 例题2例题3 公式 样本含量备注样本含量备注样本含量备注 1 0 0 偶数 1 0 l 奇数 5 0 偶数 第5 0 、5j 位 原公式( 1 )3 4 2 1 6第5 1 位数值4 7 5 88 9 8 0 第5 1 位数值 数值和半 第5 0 、5 1 位第2 5 、2 6 位 新公式( 2 )3 4 1 8 44 7 5 0 第5 1 位数值 8 9 7 4 数值和一半数值和一半 第5 0 、5 1 位第2 5 、2 6 位 定义公式 3 4 1 8 44 7 5 0 第5 l 位数值 8 9 7 4 数值和一半数值和一半 i fc6 4o 1 7 0 1 l 原、新公式误差 o 3 2o 0 8o 0 6 以上提出的样本中位数计算校正公式,既能傲到近似准确邋推算样本中位 数,且符合样本中位数的定义和“上限值不在组内的原则”。 考试成绩及试题质量的分析与评价 3 如何得到适合学籍管理的标准分 我国原来一直采用原始分数来报告学生的学习成绩,并作为选拔考试、择优 录取的重要依据。原始分数指通过评定测验直接得到的分数。然而从教育测量学 观点看,原始分制度有以下不足: ( 1 ) 原始分制度没有揭示考生成绩在考生团体成绩中的位置。这个成绩只能 反映该考生的答对率,而不能反映整个考生团体的成绩状况。高考不是达标考试 而是选拔性考试,因此应向考生报告的不是各科的答对率而是他的各科成绩及总 分在考生团体中所处的位置,以便使考生了解他的相对水平,能否被录取。原始 分没向考生报告这主要信息。 ( 2 ) 缺乏可比性。由于各科命题难度不同,导致各科原始分之间不能直接比 较,造成分数解释上的困难。例如1 9 8 8 年理工类某考生化学、数学的原始分都 是8 6 分,这两科的水平大不一样。化学试卷偏难( 全国平均4 6 4 分) 、数学试卷 偏易( 全匡l 平均8 6 2 分) ,则该生化学成绩极好,而数学成绩中等,虽然化学和 数学两者卷面分相等,但考生化学成绩远远高于数学成绩。 ( 3 ) 缺乏可加性。由于各科试卷难易的不同,试卷易的学科得分易,试卷难 的学科得分难,可知各科中的分值是不等的,把各科分值不等的原始分累加得到 总分,j 下如把各种不同币制的钱直接相加一样,这说明由原始分累加计算总分的 方法是不合理的。 为解决上述问题,我国于1 9 9 3 年起在部分省、市普通高校招生中试行“将 原始分数换算为标准分,并公布标准分为录取的依据”,在试验成功的基础上, 参考、借鉴国外的先进做法,原国家教委制定了普通高校全国统一考试建立标 准分数制度实施方案,并逐步推向全国。实施标准分制度是对高考分数解释和 使用的重大改革举措,更是我国教育评价体系的一大完善。标准分是利用正态分 布原理,以平均分为参照点,以标准差为度量单位,把考生的卷面原始分转换成 能刻画其在考生总体中所处位置的一种分数制度。 高考标准分的转换按照国家教育委员会考试中心 1 9 9 5 1 0 号文中的( ( 1 9 9 5 年普通高等学校招生全国统一考试建立标准分数制度试验的实施细则所规定的 办法进行,具体步骤为: 考试成绩及试题质量的分析与评价 ( 1 ) 将所有考生按科目总分从高到低排序 ( 2 ) 计算每一个分数以下的考生占总数的百分比p 。,再将p ,乘1 0 0 后取整( 四 舍五入) ,得百分等级r ,; ( 3 ) 利用p 。查正态分布表得正态分数z ,;。 ( 4 ) 进行线性变换,得标准分r ,其计算公式为: r = zx 1 0 0 + 5 0 0 f 的取值范围为1 0 0 9 0 0 ,超出者分别以1 0 0 和9 0 0 计: ( 5 ) 关于每个考生几科总分:将每一考生各科的,相加得一分数,对这一分 数重复上述( 1 ) ( 4 ) 。 由上可知,在我国现行高考标准分数转换制度下,1 0 0 、 吖,难度系数的变化量b ,n “一矽是九和b ,一6 7 的函 数。若 0 8 , 的值较大,则新的难度系数的变化 量6 ,一 对难度系数的最后结果影响较大,这是合理的。因为当0 较小时,信度 较差,测试结果不太可靠,新的难度系数的变化不应对难度系数的结果有较大的 影响。当r 较大时,信度较好,测试结果可靠,新的难度系数的变化应对难度系 数的结果有较大的影响;当新计算得到的难度系数小于原来的难度系数时,难度 系数的变化量6 7 “一6 7 与前述情况方向相反。此外,当测试次数较少时,即n 较 1 n 考试成绩及试题质量的分析与评价 小时, 较大,则新的难度系数的变化量b ,一对难度系数的最后结果影响较大; 反之, 较小,则新的难度系数的变化量6 ,一 对难度系数的最后结果影响较小, 这说明随着测试次数的不断增大,难度系数将越来越稳定。 算法实现:考虑系统设计的实用性和合理性,将试题的数据结构设置8 个属性, 它们分别为:课程名称、试题编号、题型、试题描述、试题知识点、难度系数、 已测试次数、试题答案。试题的数据结构描述如下: s t r u c tq u e s t i 0 1 1 _ d b l c h a rc o u r s en 锄e ( 3 0 : i n tq u e s t i o n _ i d : i n tq u e s t i o nt y p e : s t r u e tq u e s t i o n _ d e s e r i b ed e s e r i p t i o n : c h a rq u e s t i o n k e y 2 0 : f l o a tq u e s t i o nd i f f ie u l t y : i n tt e s t e d n u m b e r : s t r u c tq u e s t i o n a n s w e ra n s w e r ; t e s tq u e s t i o n : 上述数据结构中,c o u f s e n a m e + q u e s t i o n i d 唯一对应一道试题,在一个 试题库只有一门课程的情况下,仅q u e s t i o n j d 一个字段就是一道试题的唯一编 码,在后面叙述的算法中,都以该字段为关键字。试题描述d e s c r i p t i o n 及试题 答案a n s w e r 两字段的内容较多,结构复杂。因此应先分别定义 q u e s t i o n d e s c r i b e 和q u e s t i o n _ a n s w e r 这两个字段的数据结构。在计算难度系 数的算法中,要对每位测试者的每道试题进行难度系数粗算、区分度系数粗算、 试卷信度计算、难度系数纠偏等处理。因此在测试结束后,首先生成一个包括难 度系数算法必需的各项内容的数组,该数组元素的数据结构描述如下: s t r u c et e s t r e s u l t i n tq u e s t i o ni d : i n tq u e s t i o n _ m a r k : 试题满分值十 i n tt e s t m a r k n : 测试者该题的得分,其中n 为测试者人数 i n tt e s t e dn u m b e r :序该试题己测试的次数,初值设定为1 f l o a tt e m p d i f f i c u l t y ;序该字段保存临时试题难度系数 1 l 一 墨堕壁堕墨堕壁堕兰堕坌塑量堡竺 f l o a tt e s t q f d ;术该字段保存试题区分度木 f l o a tt e s t d i f f i e u l t y ;$ 该字段保存纠偏后试题难度系数 ) d i f f i c u l t y _ c a l c u l a t m j : 定义临时变量:f l o a ts j x d ; 试卷信度 试题难度系数的实现算法援述如下: c a l c u l a t e d d i f f i c u l t y 0 s o r t _ t e s t m a r k ( d if f i c u l t yc a l c u l a t 1 ) ; 将数组d i f f i c u lt y c a l c u l a t e 按t e s t _ m a r k 从高到低排序,为计算区分度做 准备: f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静脉采血操作课件
- 河道砂石分离方案范本
- 桥梁墩柱修复施工方案
- 电焊专项安全培训
- 廊坊燕京职业技术学院《数字技术综合应用》2023-2024学年第一学期期末试卷
- 重庆幼儿师范高等专科学校《现代食品营养与安全自科类》2023-2024学年第一学期期末试卷
- 西藏大学《课件设计含几何画板》2023-2024学年第二学期期末试卷
- 医院收费监管方案范本
- 长春职业技术学院《油藏工程》2023-2024学年第二学期期末试卷
- 牡丹江医学院《计算机组成原理与系统结构》2023-2024学年第二学期期末试卷
- 充电桩行业趋势及市场前景分析报告
- 湖北省孝感市汉川市2023-2024学年三年级下学期语文期中考试试卷
- 奉化市体育特长生初中升高中排球专业考试评分标准
- 2023年甘肃省高等职业教育招生中职升学考试旅游服务类专业基础试题
- 大力弘扬教育家精神加快建设教育强国心得体会6篇
- 考古调查勘探辅助工程方案投标文件(技术方案)
- 2025年法学本科毕业论文评审标准分析
- 电位滴定法课件
- 历年计算机二级MS-Office考试真题题库大全-下(500题)
- 2025年中国防爆型插入式超声波流量计市场调查研究报告
- 污水处理厂运营委托合同
评论
0/150
提交评论