关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网_第1页
关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网_第2页
关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网_第3页
关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于IRT应用于计算机自适应考试的综述_项目反应理论-论文网论文摘要:项目反应理论(Item Response Theory)是一种现在心理测量理论,它是对经典测量理论的补充发展,伴随着计算机发展而被应用于考试题库的建设,测验的编制,项目分析等各个方面,本文将详细介绍IRT在国内外计算机自适应考试(Computerized Adaptive Testing)中的应用,分析它们的异同。论文关键词:项目反应理论,计算机自适应考试1.引言项目反应理论(IRT)又称“潜在特质”理论,于20世纪50年代初正式成立,于20世纪60年代后期,伴随着计算机的发展而快速发展。IRT较经典测量理论来讲,样本独立,

2、可反复测量,又因为理论框架科学,应用范围广泛,是我国测量领域的热点。计算机自适应测量(CAT)是在项目反应理论基础上发展起来的一种新的测验形式。它不同于纸币测验,是以计算机为手段,测验试题的呈现和被试的作答是通过计算机完成,它又不同于一般计算机化测量,而是因人而异选题,根据被试能力水平自动选择试题,及时了解被试能力水平。2.国内应用研究综述我国著名心理学家张厚粲老师是自适应考试的先驱,她首先把IRT引入国内。江西师大“题库理论”组,编写考生智能水平的自适应测验时指出:自适应考试可以在不损害测验的信效度前提下,减少试题题量,缩短测验,提高测验效率。国内最早关于编制自适应测验的文献是出自江西师大。

3、他们编制的高中数学水平测验,用于考察高中毕业生的数学智能水平。江西师大这个课题组还编制了参数估计程序和自适应考试程序。在计算机适应测验选题策略上,2011毛秀珍,辛涛撰文做了全面探讨,选题策略是CAT重要组成部分,关系到策略信效度,效率等。有人在Science发表文章主张谨慎CAT高风险,原因是频繁使用质量较好的项目,会因为被试“分享”而削弱了测验的效率,针对传统的选题策略不足,2012罗芬、丁树良、王晓庆提出了利用区间估计思想,将两级评分推广到多级评分以改进最大信息量选题策略,可以有效降低测验长度,极大降低项目曝光率。制定高效并且安全的选题策略是CAT追求的目标,2011程小扬、丁树良、严深

4、海、朱隆尹针对极大项信息量准则(MIC)和a分层法选题策略的优缺点,对0-1评分下的CAT引入曝光因子的选题策略。在我国自适应测试的计算机软件还是比较少,九十年代开始,全国英语四六级考试委员会,一直致力于项目反应理论的研究与开发。目前IRT已成功应用于CET分数等值处理过程了,基于计算机自适应测试题库也在建设和完善中。3.国外研究国外对于计算机自适应考试研究较早,计算机自适应测验是从比奈的智力测验基础上发展起来的。1971年,Lord在前人基础上提出了“计算机自适应测验”。美国军方在80年代开始应用计算机自适应系统CAST(TheComputerizedAdaptiveScreenTest)。

5、如今在美国,CAT己经用于教育测试、职业测量、人事评测等领域:GRE(GraduateRecordExamination)考试、TOFEL测试、工商管理类研究生入学测试GMAT(GraduateforManagementandAdministrationTest)以及全美护士国家委员会资格测试(NurseNationalCommitteeLicenseTest)等都己经采用了CAT测试方式。日本的职称英语测试系统CASEC是普遍使用的系统,遍布于各大公司,教育部门和政府机构。通常CASEC测试题目不足30个,就能让测试的结果达到90%以上,提高了测试的准确率,也节约了测试时间。在欧美许多国家,

6、CAT已成为教育测试职业测试和认证测试的主要形式。微软的MCSE(微软认证系统工程师)测试也采用了这一种形式。总体来说,计算机自适应考试系统,在美国起步早,发展快,国外部分权威资格认证考试都逐步采用计算机自适应考试。4.研究总结与展望CAT相对传统的纸笔测验,可以施测较少项目就准确测量被试特质,极大提高测验效率。目前国内较多研究集中于CAT的选题策略上,由于测验的精度和安全性相互制约,如何比较,选择最优项目,有待于进一步研究。未来研究应进一步提高选题策略的综合表现、深入探讨多级评分项目和认知诊断。我国引进国外IRT先进理论,坚持独立创新,应用发展较快,但由于受IRT理论模型的局限性和我国传统测

7、试方式、教育模式等因素的影响,基于IRT理论模型的自适应测试在我国实际教学的应用仍处于探索阶段,如何克服IRT理论模型的局限性,并结合教学的实际情况,设计出一种具有较好性能和实际可操作性的自适应测试方法。也有待于进一步努力。参考文献1 罗芬,丁树良,王晓庆,多级评分计算机化自适应测验动态综合选题策略,心理学报.20122 毛秀珍,辛涛,计算机自适应测验选题策略述评,心理科学进展.2011年3 程小扬,丁树良,严深海,朱隆尹,引入曝光因子的计算机化自适应测验选题策略,心理学报.20114 唐小娟,丁树良,俞宗火,计算机自适应测验在认知诊断中的应用,心理科学进展.20125 林健,闰华,武兵,计算机自适应考试理论分析.太原理工大学学报,2004,35(2):222一2236 曾彦钧, 张雅媛, 郭伯臣.基于知识结构之适性诊断测验系统的防猜选题策略.测验统计年刊.20067 Thompson, N. A. A practitioners guide for variable-length computerized classification testing. Practical Assessment,Research & Evaluation.20078 Jason A.Collins,Jim E.Greer,and Sherman X.Huang. Adaptiv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论