关于考试难度的讨论_第1页
关于考试难度的讨论_第2页
关于考试难度的讨论_第3页
关于考试难度的讨论_第4页
关于考试难度的讨论_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于考试难度的讨论

改革开放的目标是有效提高教育质量。教育质量评价通常以考试数据为客观依据,因此对考试本身的研究尤为重要。考试是教学过程中的重要环节;它由命题、解答、评卷、判定四个连续过程组成。其中,除解答的水平对考试成绩起着决定性作用外,余者也都有不同程度的影响。众所周知,考试难度的大小、评卷要求的松紧,都能左右考试得分的多少。特别是由于难度过小、评卷过松可导致得分贬值,及格率明显上升。之所以能出现这种“高分低质”的现象,是因为以60分为及格分数线,勿需考虑这种得分的质量问题,它只根据得分的数量,就可以判定及格与否。这种只求数量,不顾质量的判定方法是极不合理的,然而,却习以为常,成为天经地仪的标准了。同时,它还造成一种误解:认为及不及格,主要取决于老师,而不是取决于学生。这样就使学生把及格的希望,寄托于老师,一希望命题容易;二希望评卷时老师高抬贵手,而不是立足于自己学习上的刻苦和钻研。考试是一种手段,对衡量学生成绩是致关重要的。因此,必须保证考试所提供的信息是准确无误的,这就要尽量控制各种因素的干扰和影响。只有这样才能使考试成绩,符合教学水平和学生的学习实际,否则将有害于教学质量的提高,也不利于师生关系的改善。在考试范围内,在干扰成绩的诸因素中,考试难度是起主导作用的;而在成绩判定中的不合理现象,则是由60分及格线所造成的。对这两个问题的研究和探讨,不仅是个理论问题,而且也是教学中急待解决的实际问题。一、基质平等:传统考试难度值的变化及意义在教学实践中,考试难度往往包含着两个概念:一是作为个体的试题难度;二是作为总体的试卷难度。两者之间虽然有着因果关系,但在实际应用上却有着很大的差异。作为试题总是应该有一定难度的,而且还应该有一个客观的衡量标准,这个标准,既要具有科学性,又要具有实用价值,否则,将不能发挥其应有的作用。考试难度如何确定?采用哪项指标?各有主张,并无统一见解。试题难度的确定,有的主张用标准分数值,作为其难度值,有的主张以试题难度指数,衡量试题难易的程度,另外还有报告提出,某试题难度值应以学生得分的平均值,除以某试题满分分数,即:难度值越大,难度反而小。以上种种主张,各自概念不同,计算方法也不一。前两者较繁杂,且不便直接应用,后者计算虽简便,但难度大小却与其值相反,这不符合逻辑。我们认为难度值应以答错率表示为宜。通常认为:试题答对率为100%时,无一答错者,标志着试题难度小至极点0%,其值应为0;而相反地答对率为0时,无一答对者,标志着试题难至顶点达100%、其难度值为1。可见试题难度值在0一一1之间,难度大小与其值是一致的。据此,我们认为上记公式,应修订为:难度值越小,说明试题越容易,其值越大则说明试题越难。在教学过程中,凡要考试必然涉及到试卷的难度问题。这种难度既不以卷中诸试题难度之和,也不为其难度之均值所表示,而是习惯于以试卷为单位的总体难度评价,实际上卷面成绩也是用总分体现的,也并不显示各题得分情况。由此可见试卷难度值系总体难度指标。如将试卷视为一个试题时,那么上记修订公式也可用于试卷难度值的计算了。这里我们提出确立试卷难度的概念和指标,是根据考试过程中存在的弊端,认为是有必要的。否则,试卷难度无法实施科学管理,难度也无法控制,“高分低质”的现象,自然就难于避免。试卷难度和试题难度,是两个独立的概念,在实际应用时,两者不能混淆,更不能交叉使用。试卷和试题之难度值在实际应用时,两者的规定范围各有不同,因此,既不可以用试卷的难度值去评价试题的难易程度;又不能用试题的难度值去比较试卷的难度。下面我们还要涉及和具体分析这方面的问题,在此不多赘述。当前,在一些大学的教学中,由于种种因素的干扰,在考试中防止试卷难度偏小的倾向,要比防止试卷难度偏大的倾向,显得更加必要、更加迫切了。据一个系三个年级23门课程的期末考试成绩统计,各年级平均值范围在70—90分之间,其试卷难度值范围在0.3-一0.1之间;成绩的频数分布,较集中于70一80分之间的约占2/3;80—-90分之间约占1/3。(见表1)如表所示,平均成绩在70至80分之间,共有15门课程,其试卷难度值≤0.3>0.2;其余8门课程平均成绩在80至90分之间,其难度值≤0.2>0.1。作为试卷,其难度最大也不能达到0.4,因为难度值为0.4的试卷,平均成绩为60分。按正态分布规律计算,将有半数的考生成绩低于60分。一次考试结果有50%的考生不及格,这不是正常现象;事实上这种情况也是不多见的。由于试卷难度能够左右考试成绩的高低,特别是诸学科之间,试卷难度相差悬殊,会导致各科间的平均成绩和及格率的差异过大。试卷难度值每变动0.1,可使平均成绩变动10分。这样,由于部份学科试卷难度过小,而使得分膨胀,导致各学科之间的平均成绩和及格率相差过大。本文的试卷难度值在0.1—0.3之间,现以0.2为界,将参加考试的1836人次的成绩、及格情况,分别进行统计列表(见表2)。如表所示:试卷难度较小的650人次的应试者中,仅有2人次不及格,而试卷难度较大时,在1186人次当中,则有20人次不及格。经x2检验证明其间存在着极显著的差异,P<0.01。以上分析说明,试卷难度值应该控制在尽量小的范围之内,据本资料分析,可初步确定为0.2—0.3之间,若其值>0.3时,则说明试卷偏难;其值<0.2时,则为试卷偏易。这是提出试卷难度值应该限制在较小的范围内,是为了防止出现高分低质的现象。而对试题则相反,试卷中的各类试题应该是难易兼有的,其难度值的范围不能太小,而应适当扩大,甚至可允许其试题难度在0.1—0.9之间,既可有难度小至0.1的较简单试题,又可有难度大至0.9的比较复杂的拔高题,只不过这两类题不宜过多,多数题的难度值应集中于0.5—0.7之间为宜。综上所述,不难看出试题难度与试卷难度之间、既有概念上的不同,又有应用上的差异;故不能混淆,也不可交叉进行难度的比较和评价。二、正态分布的理论计算值与及其应用按照我国的习惯,各级学校通常采用百分制的60分为及格分数线,这是一个独立的,又是万能的尺度;可用于任何学科,而且使用时勿需对原始考分进行任何统计处理,就可直接判定及格与否。这的确是它方便、适用的一面。然而,它也确实存在着不科学、不合理的一面,这正是其弊端所在。众所周知,考试的原始分数,只是成绩的数量标志,各数量之间是没有联系的、独立的个体。因而,一个人考取60分,不影响别人的考分的高低,别人的考分再高,也不会影响自己及格,这样势必在一个年级,一个班的学习集体中,形成各尽其学、各取其分的分散局面。特别是其中少数学生入大学后,认为在学习上可以松口气了,学习的唯一压力,就是怕不及格,只要考试及格就“万岁”!他们胸无大志、只想混个文凭,而得过且过的混大学。同时,还由于“60分万岁”为他们提供了过多的剩余时间,这些时间不为学习所充填,则必有他为。学习方面的种种不正之风,不正是由此而来吗?!这类学生的数量虽少,但造成的不良影响却很大,应予足够的重视。事物的发生、发展都是有规律的。考试成绩也不例外,在正常情况下,如果命题合理,则学生的考分应该服从正态分布规律。据此,我们把正态分布的面积分配规律的理论计算值,应用于考试成绩之中,现将一个系的某一年级视为总体,对其一门课程的考试成绩进行统计,得其成绩平均值X和标准差σ,计算成绩频数的理论值范围,确定其概率P值。这里我们取,作为界值进行探讨。在正态曲线下,作为总体的成绩频数,在X±1.96σ的范围内占95%;其中诸成绩频数的概率P>0.05;而在X±1.96σ以外的仅占5%,其概率P<0.05。为计算方便可用取代这一界值。这样我们就可以得出:在X±2σ范围内的大多数成绩,根据P>0.05,判定为与均值X之间没有差异;而在此范围之外的成绩中:在以上的高分成绩,据P<0.05,应评为最佳成绩,应予以奖励;而在X-2σ以下的低分成绩,应评为最差成绩,判定为不及格成绩。这样,我们就从理论上可以确定X-2σ的计算值,作为新的及格分数线,我们再结合期末考试的实际成绩,进一步探讨作为及格分数线的实用价值。据统计23门学科的期末考试成绩,在原始成绩的分数中,最高得100分,最低得33分。除其中9科有22名不及格者外,其余14科全部及格(详见表3)。同时可见,考试成绩经统计处理后,显示出各科成绩的平均值X之间的差异和标准差之间的不同。有8门课程成绩的平均值在80分以上,标准差较小、,80分以下有15科,标准差较大,因此,X-2σ之值的范围也较大,最高者76分,最低为48分。显而易见,之值不同于60分及格线,它不是各科统一的、固定的数值,而是来自各科考试成绩的统计结果,而分别确定的、各科固有的及格分数线。判定结果是多数学科分别有1—7名不及格者,少数学科中无不及格者。现将23门课程的1836人次的考试成绩,用上述两种及格分数线判定,其结果有很大的不同(见表4)。用60分判定结果,只有22人次不及格,仅占1.2%,而用判定不及格者,则有49人次占2.7%,这也符合正态分布的理论计算值两种判定结果之间的差异,经显著性检验结果证明,有极显著性。X2=10.47>P0.01(1)6.64,P<0.01。说明这是两种截然不同的判定标准。为讨论应用分数线的实际意义,根据表1频数分布于两端的学科,摘取表3成绩列表如下;(见表5)表中可见,除不同难度之间,成绩统计的各指标相差较大外,对难度大的各学科,两种及格分数识判定结果基本一致,而对难度小的学科成绩判定,则结果相差很大。再将两种标准的判定结果,分别统计如下:(见表6、表7)如表6所示:两组不同难度的成绩,用60分及格线判定时,及格的人次数与不及格的人次数相差很大;10人次不及格者全集中在难度值较大的一组;难度值较小的一组则全获及格。而采用为及格分数线判定时,两组判定结果基本一致,各有9人次不及格,两组之间无差异,X2=0.05<P0.05(1)3.84,P>0.05。可见,尽管由于试卷难度偏小,使考分贬值而达到60分以上,但之值也是水涨船高的,能够纠正这种假象,从而使各科成绩的判定结果,保持相对平衡,可避免“高分低质”现象的发生。(参见表7)三、对考试难度的具体分析本文分析了当前高校教学的一些具体情况,认为要尽快地提高教学质量,必须对考试实施科学管理,这是对教学进行质量控制的重要方面。对考试难度进行了具体分析,指出试题难度和试卷难度系两个不同的概念,各有各的作用,不能将两者混为一谈,并对一种难度值的计算公式进行了修订。同时,还对难度值范围的限定及其实际意义,进行了分析讨论。对60分及格线作了具体分析,指出其弊端所在,特别是其对教学的消极影响,指出“60分万岁”对部分学生“混大学”起到了保护作用。提出用X-2σ之计算值,作为新的及格分数线,它具有以下特点:1.统计的方法依据的问题该分数线具有科学性,不仅仅是因为它的提出是以统计的理论和统计的方法为依据的;而且还因为的计算值,是根据每门课程的考试成绩的实际情况确定的,因此,它是一种针对性很强的、学科所固有的及格分数线,评定结果是准确无误的。2.第1步:改分格,稳定液压该分数线产生于总体成绩,所以能随其好与差而升降。除可控制出现“高分低质”现象外,还可杜绝人情分,过去常有考50多分的学生,几经求情之后,就改为60分及格了。而采用时,改为多少分能保证及格?况且改分还影响总体成绩,导致及格分数线的上升,改分就毫无意义了。当之值确定之后,也不能提分,而且有据可查,便于监督、检查,以保证考试制度的严格实施。3.学习的能力是否有提高该分数线判定及格与否,不取决于老师,而取决于集体和个人的学习水平。这就把一个年级的分散的、各不相关的学习个体有机的联系为一个整体。再满足于60分就不能保证及格了,因为全年级多数人的学习成绩的提高,就使均值上升,标准差σ缩小,之值上升,从而结束了“60分万岁”的局面。究竟多少分万岁就没有底了,这本身就是一种学习压力,为了学习成绩及格,就必须力争上游的学习,还是学习万岁!这对学生的学习主动性、积极性无疑是个很大的推动,对学习成绩较差者则尤为如此。学习上的这种良性循环的形成,必将导致学风的好转和学习质量的不断提高。4.格轴线的使用应用之值取代60分及格分数线,除需进行考试成绩的统计计算外,其余无改变,仍适用于百分制,符

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论