




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机化调适性语言测试研究获奖科研报告摘
要:随着计算机的普及和快速发展,信息技术对语言测试形式产生了重要的影响。很显然,计算机适应性语言测试已经成为这一领域最重要的发展方向。本文主要介绍了计算机化调适性语言测试(ComputerizedAdaptiveLanguageTest以下称CALT)的定义。并且分析了CALT的优势及其面临的问题与挑战。并指出,计算机化调适性语言测试因为它符合外语教学改革发展的实际需求,将成为引领外语测试的新方向。
Withthepopularofcomputeranditsrapiddevelopment,informationtechnologyhasasignificantimpactonlanguagetesting.Obviously,ComputerizedAdaptiveLanguageTest(CALT)hasbecomethemostimportantdevelopmentdirectioninthisfield.ThisarticlemainlyintroducesthedefinitionofCALT.Atthesametime,itnotonlyanalyzestheadvantagesofCALTbutalsoanalyzesthequestionsandchallengesitfaced.ItalsopointoutthatbecauseCALTcanmeettheactualdemandofforeignlanguageteachingreform,itwillbecomethenewleadingdirectionofforeignlanguagetesting.
计算机技术的发展不但影响着外语教与学的整个过程,同时也使得语言测试的技术手段和方式发生了重大的改变。语言测试技术已经成为众多研究者关注的新课题。2001年在美国举行的第23届国际语言测试研讨会的主题就是“语言测试与技术”,基于计算机技术所构建的测试新方法——计算机化调适性语言测试成了本次会议的重要议题。计算机化调适性语言测试由于其因材施测、能精确估计考生能力及节省施测时间等显著的优点,正逐步渗透到各类外语测试中去,将引领外语测试发展的新方向。
一、计算机化调适性语言测试的定义
计算机化调适性语言测试源于计算机化调适性测试(ComputerizedAdaptiveTest)(下称CAT),是一种技术上受计算机终端和PC管理的先进的测试语言能力的方法。它是现代语言测试理论与当代多媒体技术相结合的产物,采用项目反应理论为数学模型建立题库,并以此根据题目的各方面信息和受测者的答题情况,从题库中选取符合受测者语言水平的题目进行测试,在最短的时间内迅速准确地估计受测者的语言能力,直到达到预定的测试精度要求。
二、计算机化调适性语言测试的优势
计算机技术的发展和测量学“项目反应理论”的成熟催生了新一代计算机化语言测试——计算机适应性语言测试。这种被称为“量体裁衣”式的测试具有传统的纸笔测试无法比拟的优势,如具有良好的反馈作用,测试的个性化、人性化加强,安全性提高。为每位受试提供适合其语言能力的题目或任务,能够提高他们的兴趣,促使他们发挥最佳水平,从而实现对受试语言能力更准确的测量。例如,基于网络的DI-ALANG融自我评估和诊断性测试为一体,为受试提供个性化的语言能力评估信息。一些新题型得以开发使用,如文章复原法可以用来考察受试在句子和语篇层面的语言理解能力。
比较传统的纸笔考试而言,CALT具有以下的四点优势:
(一)具有人性化和个体性
在传统的考试中,不管考生实际语言能力如何,都必须做大量的固定的试题进行语言考查,需要较多的时间;而在CALT中,后面试题的呈现是以前面答题的反应情况来决定的,或难或易,循序渐进的进行。同时,CALT还可以根据不同的测试对象确定不同的常模,考试的内容、题量因人而异,有针对性的施加测试题目,具有无可比拟的个体性,具有人性化特征,符合外语教学改革的要求。
(二)具有科学性和准确性
效度与信度是语言测试中最重要的两个原则,测试的科学与准确性取决于该测试是否具有高效度和高信度。在传统的测试中,由于不同考生接受同一批题目的测验,语言水平低的考生无法作答难度大的题目,那些难度小的题目对语言水平高的考生又测不出真实水平,测试的效度时而高、时而低,难以把握。CALT则不同,它不但定义了信息函数这一综合质量指标作为科学挑选题目的标准,而且题目函数估计准确,电脑能根据题目相对难度、题型和考生对初始题目应答的整体表现,适度调整出与考生水平相适应的题目。因此,由于测验的信息量最大,也就能最大限度地测算出代表考生实际语言能力的成绩,测试的效度也就最好,实得分数分布与目标分数的分布的拟合度也最好。同时,就信度而言,传统的测试评分往往由人工评判,虽然有统一的参考评判尺度,也难免会因人而异而产生误差。CALT则通常具有良好的稳定性、等值性与客观性,且考生每答对一个试题就会重新估计一次考生的能力估计值,测试之后能马上打印测试结果,各项工作由电脑自行进行,排除了人为的因素,测试成绩公开、公正、公平、真实可靠、准确性高。
(三)具有保密性和安全性
与传统的测试不同,CALT由于對不同的考生施测不同内容,大大地降低了猜题、舞弊的发生,对题库中题目曝光频率的控制与测试数据的层级保密很大程度上都提高了语言测试的安全性。
(四)具有经济性与实效性
比较传统的测试,CALT的题量较少,考试时间短,节省了大量的人力物力,降低了成本。测试之后能立即计分并报告成绩和给出反馈,快捷又实效。除此之外,CALT由于可以调整学生的作答速度与题目难度,测试环境自然、宽松,降低了考生的考试焦虑与挫折感,尤其在口语、听力考试中更益于考生正常发挥自己的真实水平。
这种被称为“量体裁衣”式的测试具有传统的纸笔测试无法比拟的优势,如具有良好的反馈作用,测试的个性化、人性化加强,安全性提高。与其他的考试相比,CALT考试更注重考试过程及其测试精确度的提升。CALT能为每位受试提供适合其语言能力的题目或任务,由此可提高他们的兴趣,促使他们发挥最佳水平,从而实现对受试语言能力更准确的测量。
总之,CALT的优势在于具有明显的渐进性和个体性,即受试者即将面对的试题是以其前面答题情况而定,其题目或难或易,因人而易,循序渐进,具有很强的科学性和准确性。CALT不但以信息函数这一综合质量指标为科学的选题标准,而且题目函数估计准确,能最大限度地测算受试者的实际语言水平,并且具有稳定性、等值性与客观性的特点。CALT安全指数高保密性好,几乎不可能猜题、压题、舞弊。CALT由于题量灵活,时间可长可短,测试后能即时记分并报告成绩,所以说其具有经济性和实效性。
三、计算机化调适性语言测试面临的问题与挑战
现代信息和网络技术为语言测试带来了许多快捷和希望,同时也带来了一些问题和隐患。虽然互联网和电脑技术的普及速度非常快,但目前网络带宽和网络安全还是一个急需解决的问题。在我国有些地区计算机还不够普及,这就给计算机化语言测试的推广带来一定的困难。《教育部关于2013年深化教育领域综合改革的意见》提出要实施高考英语科目一年多次考试。随着“一年多考制度”的推广,必然会遇到同时使用多套试题的情况,随着而来的是试题库建设,现代网络和计算机技术的发展为试题库建设带来诸多方便,但试题库建设和使用涉及多方面的工作。试题参数的确定需要做大量前期工作。试题库的试题需重复使用,在试题使用之后主要问题之一是试题的安全性,如何不让使用过的试题泄露出去,这些需要更多研究和实践。同时为了保证考试的公平,多套同时使用的试卷之间的等值显得尤为重要,如何科学地利用现代技术等值试卷还需进一步进行研究。基于计算机的考试改变传统纸笔考试的一些题型和做法,这些改变对学生有影响,会在一定程度上影响试卷的效度。
而由于CALT研究起步较晚,所依据的理论基础与技术手段有待进一步完善,加之语言测试的特殊性及其与传统测试的差异性等原因,均不可避免地决定了CALT仍存在着诸多的问题:
(一)CALT的评分问题
传统测试中,如果学生不能回答某些问题,可以跳题或者省略,然而在CALT中允许跳题,若选题项没有被计分,学生可跳过题项答题时可能会对题目的安全性有影响。而如果不允许跳题,则是剥夺了学生资助决定做题顺序的自由。
(二)CALT的题项设计问题
在题项的采集上,传统测试在设计上常常根据明确的考试要求来收集某个特定领域不同的知识或者技能题项。而CALT的一般时间上会比传统测试短,很难像传统测试一样根据具体要求来收集题项。它一般是从所有可能的集体要求中随机抽选出。
(三)CALT测试题目中的交际能力问题
外语教学的目的是培养学生的交际能力,测试考生交际能力的高低则通过对语言行为的衡量来判断,即需在交际、环境、话题和目的等语言使用环境中测试考生的语言组织能力与语用能力;但是由于语用背景是具体的,千变万化的,没有固定的模式可寻,难以数字化和信息化,测试结果也只能被看成在考试所设计的背景下的特定的运用外语行为,而非考生在真实外语生活环境下的交际能力。因此,如何锁定测试目标设计出充分体现交际能力的真实测试项目是CALT须解决的棘手问题。
(四)CALT题型与语言测试目标能力关联性问题
不同起始题目与题型的选择对不同目标能力初步估计值的效度也不同,直接影响到目标测试能力的准确定位,起始题目、题型的选择对整个测试过程起着关键的导航作用。考生测试速度与语言能力的关系、CALT对教学的反拨作用、計算机操作熟练程度与测试成绩之间的关系以及如何避免商业化等问题都有待我们外语工作者与软件工程师进一步研究与实践。
曾用强教授在2009年全国英语专业四、八级测试暨计算机技术应用专题研讨会中,作了“计算机化考试的几点思考”为题的发言。他认为目前人们对计算机化考试存在一些误解,主要体现在:计算机化考试就是纸笔考试的计算机化或网络化;计算机网络技术决定了机考的发展;实现多次考试;简化考务工作。计算机化考试一般要经过内容设计、技术开发和实施三个阶段,计算机化考试有它独特的特点和规
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深圳非住宅租赁合同范本
- 船舶运输委托协议合同书
- 渣土品回收协议合同模板
- 股权转让纠纷协议书范本
- 物业业主合作合同协议书
- 海淀区仓储配送合同范本
- 育儿嫂照顾宝宝协议合同
- 舞台租赁协议合同书模板
- 纸板线热板翻新合同范本
- 股东循环转移协议书模板
- 锂离子电池极片辊压工序简介
- GB/T 3683-2023橡胶软管及软管组合件油基或水基流体适用的钢丝编织增强液压型规范
- 七年级上学期历史导言课课件 ( 希沃白板课件+PPT课件)
- 医疗管理制度PDCA培训:提高医院感染管理相关制度的落实率
- 肺结核诊断和治疗指南
- 软件系统售后服务方案
- GB/T 9765-2009轮胎气门嘴螺纹
- GB/T 4623-2014环形混凝土电杆
- GB/T 23806-2009精细陶瓷断裂韧性试验方法单边预裂纹梁(SEPB)法
- GB/T 16823.3-2010紧固件扭矩-夹紧力试验
- GB/T 13785-1992棉纤维含糖程度试验方法比色法
评论
0/150
提交评论