




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、题目难度浅析 余仁胜 题目难度是反映试题特征的一项重要指标。题目难度顾名思义就是题目的难易程度,反映题目难易程度的指标称为题目的难度系数,有时简称为题目难度。根据测量理论的不同,计算难度系数的方法也不同,我们所常见的难度系数主要有题目正确作答率、难度和利用题目反应理论估计的题目难度等。1经典测量理论(CTT)的题目难度的概念题目的难易程度是因人而异的。一个简单的例子是:1+1=?。对所有小学以上水平的人来说,作出正确回答是不言而喻的,但对于一个对数字还不了解的婴幼儿来说,就很难。任何一道试题对于本领域的专家来说是易的,而对于外行来说便是难题。这说明题目难易程度是相对的而不是绝对的。
2、经典测量理论是通过试题的得分率或答对率作为难度定义的,又称为题目的正确作答率。在每次考试以后,为了了解考生对试题的作答情况,需要进行试题分析,其中一项重要内容就是统计本次考试中每一道题有多少考生做对,有多少考生做错,或者说平均得分情况。在这次考试中平均得分高的试题较易,平均得分低的试题较难。为了对各题难易程度进行比较,在题目分析中一般就用题目的得分率或题目的答对率作为比较题目难度的依据,这也就是经典测量理论中题目难度定义。我们用P+表示题目难度,则P+= ,其中R是考生在该题上的平均得分,N是该题的满分。0P+1。其难度值的范围在0-1之间,难度值愈大,表明题目的得分率愈高,试题愈容易,反之,
3、难度值愈小,表明题目的得分率愈低,试题愈难。其优点是意义直观,便于理解,在命题中便于专家控制,在题目分析中,可比较直观地反映各种类型试题得分情况和题目难易程度。其缺点是题目的难度系数与考生样本水平直接相关,考生群体变化、题目的难度系数变化,难以实现题目参数的等值。经典测量理论题目难度是主客观相互作用的结果。主观主要体现为考生群体的水平,客观主要体现在试题考查内容的深度、广度以及问题解决复杂程度。当考生群体水平没有发生变化时,试题间难度值的差异反映试题考查内容的深度和广度的差异或不同;考生群体水平发生变化时,试题难度值反映考生水平的变化或差异。正因为如此,试题难度的预测必须建立在预测群体水平与实
4、考群体水平大体一致的前提下,否则,所估计的题目难度意义不大。 2题目难度与认知层次的关系题目难度和认知层次是衡量试题质量的两个重要指标。它们之间既相互区别又相互联系。题目难度是指试题的难易程度,而认知层次是在认知领域根据诸多教育(考试)目标之间的共同特征或内在联系把教育(考试)目标分类的结果。由此可知,题目难度和认知层次完全是两个不同的概念,切不可将它们混为一谈。这是二者之间的区别。它们之间也有联系。通常我们采用B·S布鲁姆的分类法,把教育(考试)目标置于一种有层次的框架之中,在认知领域,这些层次按照从简单到复杂,由低级到高级的顺序排列。其中,后一个层次比前一个层次包含更复杂、更抽象
5、或更高的要求,或者说,前一个层次是后一个层次的基础,后一个层次是在前一个层次基础上的提高或发展,因此,一般情况下,认知层次高的试题,其难度也较大,或者难度大的试题,其认知层次也较高。这是二者之间的联系。但是,难度和认知层次毕竟不是同一概念。事实上,不同认知层次的试题,特别是相邻认知层次的试题,其难度是相互交叉的。譬如:属于领会类别的大难度试题往往比运用(应用)类别的小难度试题其难度要大,这在考核不同的知识内容的试题中是常见的。综上所述,在命制试题和组配试卷的过程中,难度和认知层次的作用是不可相互替代的,二者缺一不可。 3命题过程中试题难度的控制对于大规模考试而言,比如高考、研究生考试等,保持历
6、年间同一课程的试题难度的稳定是非常重要的,能否有效控制试题难度是命题水平的重要标志。由于在大规模考试中不同年份间考生群体水平是相对稳定的,此时,经典测量理论的题目难度是很有价值的,因为同样试题在不同年份考试中统计的难度值基本一致。我们对研究生数学考试的试题进行过研究,发现同一类型的试题在不同年份或同一年份不同试卷中出现时得分率大致相同,同一试题在不同的试卷中使用得分率基本一致。这说明对于考生水平相对稳定的考生群体而言相同试题的得分率也相对稳定,这是我们命题活动中控制题目难度的理论基础。 由于大规模考试试题保密要求很高,一般不通过普通的试测方法估计题目难度,而是充分利用命题专家组多年命题的经验并
7、参照往年题目难度数据预估各题的难度值,并通过控制试卷平均分的办法,来实现控制整份试卷的试题难度目标。其方法是,首先估计题目的难度值,然后将每题的题分乘以该题的难度,然后相加即得到该卷的估计平均分。如果估计平均分与期望达到的平均分基本一致,则这份试卷难度水平是合格的。不然的话,则通过修改试题,改变试题难度的方法使试卷的估计平均分达到要求。 题目难度的专家估计方法主要有两种,一种是若干专家分别估计,用其平均值作为题目难度的估计值;一种是若干专家在一起共同研究试题,集体估计题目难度。这两种方法各有所长,第一种方法,每个教师可以充分体现自己的思想,估计难度受权威人物的影响小。第二种方法,集体思维,大家
8、在一起把各种可能都考虑到,有效地避免了因个人专业性向和对考生水平估计的偏差的影响。在研究生数学命题中,这两种方法,我们都使用,各有所长,但专家集体估计的精度更高些。 在评估的过程中,专家主要从以下几个方面进行综合考虑,一是题目考查的内容深度、考核能力的层次、完成题目的复杂程度;二是同类试题在以往考试中出现的频次,在教学过程中学生掌握熟练程度;三是考生水平的变化因素。 4经典测量理论题目难度的等值根据上述分析,我们知道题目难度是与考生水平有关的,是难以实现等值的。为了实现题目难度的等值,美国ETS的做法是将其转化到DELTA量表(), (又称为难度)。难度与P+的关系是:=134-1(P+)中,
9、(x)是标准正态分布函数,-1 (x)是其反函数。难度是将正确答对率难度转化为标准难度。-1 (P+)实际上是下图标准正态曲线下面积P+所对应的z值。P+值与难度的对照表如下表所示,从表中可以看出,量表上每下降一个单位相当于正确答对率提高10。难度可以实现等值,具体方法是从题库中选取m道试题(其难度分别记为e1,e2,em)和新的试题构成新的试卷,经测试后,计算出这m道试题的难度(分别记为1,2,m),由此求出两者的回归直线方程:e=a+b。将其它试题的难度带入此公式中,即可得到这些试题的等值的难度,并放入题库中。5题目反应理论(IRT)中题目难度题目反应理论认为:能力水平为的考生群体正确作答
10、难度为b,区分度为a,猜测参数为c的01记分的选择题的概率P()可以用逻辑斯蒂Logistic数学模型表示,即P()=c+ 。这个模型称为三参数逻辑斯蒂模型,假定c为零时,此模型称为两参数逻辑斯蒂模型;假定c为零,且a为常数时,称为单参数逻辑斯蒂模型,又称Rasch模型。在题目反应理论中核心的参数有两个,一个是能力参数,一个是题目难度参数b。题目难度的直观意义是:答对概率为 (若c=0,则答对概率为 的考生群体的能力,就是该题的难度。根据数学模型的定义,能力参数和题目难度参数b定义在同一量表上,且难度参数与考生样本无关。中难度参数不是通过比率(或概率)定义的,而是通过具有某种要求的考生能力定义
11、的,如果一道题很难,要求答对概率达到 的考生群体的能力就越高,则题目的难度就越大。题目反应理论提出了题目信息量和测验信息量的概念,测验信息量是各题信息量之和,各题的信息量与题目难度有直接的关系,当题目难度与考生能力水平接近时题目的信息量最大。因此,利用项目反应理论的题库构造测验时选择难度与考生能力水平相当的试题就可以用最少的题量获得目标要求的信息量,这也就是自适应考试的理论基础。项目反应理论的难度定义与经典测量理论难度定义相比有质的飞跃。项目反应理论回答了经典测量理论一直困惑着人们认识的两个难题:一是题目难度与考生能力水平之间的关系;二是测验信息量与各题信息量之间关系。项目反应理论的发明确实是教育测量理论的重要革命。事物总有两重性,尽管我们非常清楚,项目反应理论是较经典测量理论更为先进的理论,但在我国的考试实践中,目前经
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年环保知识竞赛赛题及答案(共70题)
- 贵州省贵阳市七校2024-2025学年高三下学期联考(三)政治试题(原卷版+解析版)
- 2025届青海省西宁市高三一模语文试题(原卷版+解析版)
- 2025四月份按揭房屋共同管理权终止协议书
- 2025年度一月淘宝虚拟试衣间运营身材数据保密协议
- 二零二五版个人抵押合同范例
- 二零二五草场租赁合同范例
- 二零二五版聘用物业保安人员协议书范例
- 二零二五版建筑工程安全管理协议
- 公司防中毒管理制度
- 健康之道-调养肠道PPT课件2
- 探究土壤酸碱性对植物生长的影响 教学设计
- DL-T 869-2021 火力发电厂焊接技术规程
- 4M1E管理培训课件
- GB/T 16261-2017印制板总规范
- GB 25576-2020食品安全国家标准食品添加剂二氧化硅
- GA/T 383-2014法庭科学DNA实验室检验规范
- 《中华人民共和国农业法》学习
- 注塑工艺培训资料史上最全课件
- 钳工(高级工)职业技能等级认定考试题库(冲刺300多题)
- 大数据和人工智能知识考试题库600题(含答案)
评论
0/150
提交评论