(计算机科学与技术专业论文)基于改进遗传算法的智能组卷系统研究.pdf_第1页
(计算机科学与技术专业论文)基于改进遗传算法的智能组卷系统研究.pdf_第2页
(计算机科学与技术专业论文)基于改进遗传算法的智能组卷系统研究.pdf_第3页
(计算机科学与技术专业论文)基于改进遗传算法的智能组卷系统研究.pdf_第4页
(计算机科学与技术专业论文)基于改进遗传算法的智能组卷系统研究.pdf_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 u i ) c 一 密 级 学校代码 劣j 蒺理歹大穿 学位论文 1 0 4 9 7 题目基王邀进建焦篡选的蟹能组鲞丕统婴究 英文 r e s e a r c ho ni n t e l l i g e n tt e s tp a p e rg e n e r a t i o n 题目 旦垦墨曼亟q 坠! 堡卫! q y 曼鱼q 曼垒堕i 曼尘丝趔煎坠坠一 研究生姓名 指导教师 史杨 姓名 副指导教师单位名称 职称学位 邮编 申请学位级别亟 学科专业名称让篡扭型堂皇堇丕 论文提交日期2 q ! ! 生q 垒旦 论文答辩日期至q ! ! 生堕且 学位授予单位武这理王太堂 学位授予日期 答辩委员会主席垡塞鎏 评阅人塑基 一 塞! 塞基 2 0 1 1 年4 月 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 武汉理工大学或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示了谢意。 签名:起趁 日期:知lj 牲目垫j 1 2 学位论文使用授权书 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的 全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制 手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有 关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息 服务。 ( 保密的论文在 研究生( 签名) :起超 摘要 2 l 世纪,伴随着信息技术和计算机网络的迅速发展和不断普及,其应用领 域也不断拓展,尤其是教育领域的应用,为教育的发展提供了很好的平台,加 快了教育改革。在目前的教育中,考试仍然是衡量教育质量和学生成绩的重要 手段,如何采用一个有效的考试方法,实现教考分离,保证考试的公平公正, 达到考试的目的是有待考虑的问题。在此背景之下智能组卷系统的研究成为一 个重要的研究方向,并被越来越多的教育工作者关注。 组卷问题是一个多目标约束优化问题,智能组卷算法的设计是组卷系统的 核心,直接关系到组卷效率和成卷质量,传统的组卷算法如优先权策略、随机 策略、并行策略和回溯策略等,组卷耗时长,成功率低,生成的试卷无法满足 实际考试的需要,而遗传算法具有自适应全局寻优、智能搜索并且收敛性好等 特性,能更好地适应智能组卷的需求。智能组卷系统的组卷效率和质量完全取 决于试题库的设计和智能组卷算法的设计,本文将组卷算法和试题库相结合, 从试题库抽取满足约束条件的试题组成试卷,实现教考分离,让教师从繁琐的 考试中解放出来,同时也能体现考试的公平公正,反应被试者的真实能力水平。 针对传统遗传算法在全局寻优中容易出现的早熟及收敛速度慢的问题,采用分 组自然数编码策略,克服了二进制编码搜索空间过大和编码长度过长的缺点, 避免了个体解码,提高了求解速度。用该算法解决智能组卷问题,提高了运行 速度,避免了标准遗传算法中容易出现的早熟问题,有较好的健壮性。 在w i n d o w s2 0 0 3s e r v e r + i i s + p h p + m ss q ls e l v 豇 2 0 0 5 环境下,采用浏览器 服务器( 简称b s 结构) 模式进行架构,所开发的系统界面友好、操作简单和 实用性强。实验结果表明,改进的遗传算法有较好的克服早熟的能力,提高了 系统组卷速度,成卷质量高,能够满足用户的实际需求。 关键字:智能组卷,题库系统,遗传算法,分层遗传算法,自适应 i i i a b s t r a c t w i t ht h ei n f o r m a t i o nt e c h n o l o g ya n dc o m p u t e rn e t w o r kr a p i dd e v e l o p m e n ta n d i n c r e a s i n gp o p u l a r i t yi nt h e2 1s tc e n t u r y , i t sa p p l i c a t i o nf i e l da l s oe x p a n d ,e s p e c i a l l y f o rt h ea p p l i c a t i o no fe d u c a t i o n i tp r o v i d eag o o dp l a t f o r mf o rt h ed e v e l o p m e n to f e d u c a t i o n , a c c e l e r a t et h ee d u c a t i o nr e f o r m i nt h ep r e s e n te d u c a t i o n ,e x a m i n a t i o ni s s t i l la ni m p o r t a n tm e a n st om e a s u r ee d u c a t i o nq u a l i t ya n dt h es t u d e n t sg r a d e i ti sa p r o b l e mm u s tb ec o n s i d e r e dt h a th o wt oa d o p ta ne f f e c t i v ee x a m i n a t i o nm e t h o d , r e a l i z et h es e p a r a t i o n , e n s u r ee x a mf a i r , a c h i e v et h ep u r p o s eo fat e s t i nt h i sc o n t e x t , i n t e l l i g e n t - a r r a n g i n gt e s tp a p e rs y s t e mr e s e a r c hb e c o m e sa ni m p o r t a n t r e s e a r c h d i r e c t i o n ,a n da t t r a c t sa t t e n t i o no f m o r na n dm o r ee d u c a t o r s t e s tp a p e rc o n s t r u c t i o ni sam u l t i - o b j e c tr e s t r i c to p t i m i z a t i o np r o b l e m t h ec o r e o ft e s tp a p e rs y s t e mi sc o m p o s i n gt e s tp a p e ra l g o r i t h m i t sd i r e c t l yr e l a t e dt ot h e c o m p o s i n gp a p e re f f i c e n c ya n dt e s tp a p e rq u a l i t y t h et r a d i t i o n a lc o m p o s i n gt e s t p a p e ra l g o r i t h ms u c h a s p r i o r i t ys t r a t e g y , r a n d o ms t r a t e g y , p a r a l l e ls t r a t e g y , r e t r o s p e c t i v es t r a t e g ya n ds oo n , t h e y r et i m ec o n s u m i n ga n dl o ws u c c e s s f u lr a t ef o r c o m p o s i n gt e s tp a p e r g e n e r a t e dp a p e r sc a n n o ts a t i s f yt h en e e d so fp r a c t i c a l t e s t h o w e v e r , t h eg e n e t i ca l g o r i t h mh a st h ef e a t u r e at oa d a p t i v eg l o b a lo p t i m i z a t i o n , i n t e l l e c t u a ls e a r c ha n dn i c ec o n c e r g e n c e , e t c ,w h i c hc a nm e e tt h er e q u i r e m e n to f i n t e l l e c t u a l p a p e rt e s tc o m p o s i t i o nb e t t e r g r o u p i n ge f f i c i e n c y a n d q u a l i t y o f i n t e l l i g e n t a r r a n g i n g t e s t p a p e rs y s t e md e p e n d se n t i r e l y o nt h ed e s i g no f t e s t - q u e s t i o n s - d a t a b a s ea n dc o m p o s i n gt e s tp a p e ra l g o r i t h m i nt h i st h e s i s ,i tc o m b i n e c o m p o s i n gt e s tp a p e ra l g o r i t h ma n dt e s t - q u e s t i o n s - d a t a b a s et oe x t r a c tt e s tq u e s t i o n s a n df o r mat e s tb a n k i ti m p l e m e n t st e a c h i n g - e x a m i n a t i o ns e p a r a t i o na n dm a k e s t e a c h e r sl i b e r a t ef r o mc u m b e r s o m ee x a m i n a t i o n ,a l s oc a l lr e f l e c te x a mf a i r , r e a c t i o n w a st r i e di nr e a la b i l i t yl e v e l w h i l ei tc a nr e f l e c te x a mf a i ra n dt h er a e la b i l i t yo f t e s t e r s a c c o r d i n g t 0t h ep r o b l e m so ft h e p r e m a t u r i ya n dt h e l o ws p e e do f c o n v e r g e n c ei nc l a s s i c a lg e n e t i ca l g o r i t h ma r em a d e i tu s et h eg r o u pn a t u r a ln u m b e r c o d i n gs t r a t e g i e si nt h i sp a p e r , o v e r c o m et h ew e a k n e s so fb i n a r yc o d es e a r c hs p a c e t o ol a r g ea n dl e n g t hc o d i n gt o ol o n g , a v o i dt h ei n d i v i d u a ld e c o d i n go f t i m e ,r a i s e st h e s o l u t i o ns p e e d u s i n gt h i sa l g o r i t h mc a l ls o l v et h ep r o b l e mo fi n t e l l i g e n t g e n e r a t i n g t e s tp a p e ra n di m p r o v es p e e d w h i l ei tc a na v o i dp r e m a t u r i t yo fs t a n d a r dg e n e t i c i v a l g o r i t h m t h es y s t e mh a sg o o dr o b u s t n e s s t h ed e v e l o p m e n te n v i r o n m e n to ft h i ss y s t e mi sw i n d o w s2 0 0 3s e r v e r + i i s + p h p + m ss q ls e r v e r2 0 0 5 i ta d o p t t h eb r o w s e r s e r v e r ( b s ) m o d ef r a m e w o r k t h i s s y s t e m h a s f r i e n d l yi n t e r f a c e ,e a s yo p e r a t i o n a n ds t r o n g p r a c t i c a b i l i t y t h e e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ei m p r o v e dg e n e t i ca l g o r i t h mh a sb e t t e ra b i l i t y t o a v o i dp r e m a t u r i t ya n ds y s t e ms p e e d i tc a nf o r mh i g hq u a l i t yt e s tp a p e rt o s a t i s f y u s e r sr e q u i r e m e n t k e y w o r d s :i n t e l l i g e n t g e n e r a t i n gt e s tp a p e r , i t e mb a n ks y s t e m ,g e n e t i c a l g o r i t h m , h i e r a r c h i cg e n e t i ca l g o r i t h m ,a d a p t i v e v 目录 摘要i i a b s t r a c t i v 第l 章绪论1 1 1 研究背景与意义。1 1 2 国内外研究情况2 1 2 1 试题库的研究现状2 1 2 2 智能组卷算法的研究现状3 1 3 论文的研究工作5 1 4 论文的组织结构5 第2 章智能组卷的基本理论一7 2 1 智能组卷的基本原则7 2 2 智能组卷考试理论概述7 2 1 1 经典测量理论7 2 2 2 项目反应理论8 2 2 3 经典测量理论和项目反应理论的比较1 0 2 2 4 影响试题质量的属性指标1 0 2 2 5 影响试卷质量的指标13 2 3 本章小结1 5 第3 章基于项目反应理论的题库设计研究1 6 3 1 试题库的设计思想1 6 3 2 试题库结构设计1 7 3 3 试题库的初始化操作2 l 3 3 1 试题库初始化的意义2 l 3 3 2 数据库初始化流程及其实现2 2 3 4 本章小结2 6 第4 章基于改进遗传算法的智能组卷的研究2 7 4 1 遗传算法基本原理2 7 4 1 1 基本遗传算法的构成要素2 7 4 1 3 遗传算法的特点2 9 4 2 智能组卷的步骤及其模型3 0 4 2 1 智能组卷的步骤3 1 4 2 2 智能组卷的约束条件及目标函数一3 2 4 2 3 智能组卷的基本思想3 5 4 3 遗传算法的改进3 6 4 3 1 遗传算法的缺点3 6 4 3 2 算法的改进。3 6 4 4 改进遗传算法在智能组卷中的应用3 9 4 4 1 基于h a g a 的智能组卷算法流程图3 9 4 4 2 基于h a g a 的智能组卷算法的设计4 l 4 4 4h a g a 算法步骤及其伪代码4 4 4 5 基于h a g a 的智能组卷算法的分析4 5 4 6 本章小结4 7 第5 章组卷系统实现与评价4 9 5 1 智能组卷系统的分析与设计4 9 5 1 1 智能组卷系统需求描述4 9 5 1 2 智能组卷系统的总体结构5 2 5 1 3 数据库设计5 4 5 1 4 系统成绩统计分析功能设计5 8 5 2 系统的实现与评价5 9 5 2 1 系统开发的环境5 9 5 2 2 系统的实现5 9 5 2 3 系统评价6 5 5 3 本章小结6 6 第6 章总结与展望6 7 6 1 总结6 7 6 2 展望6 8 致谢6 9 参考文献7 0 附录7 3 武汉理工大学硕士学位论文 1 1 研究背景与意义 第1 章绪论 2 1 世纪,伴随着信息技术和计算机网络的迅速发展和不断普及,其应用领 域也不断拓展,尤其是教育领域的应用,为教育的发展提供了很好的平台,加 快了教育改革【1 1 。计算机技术在教育领域的应用有很多,例如,利用多媒体教室 进行教学,利用教务管理系统管理学生的学籍和成绩、管理教师的课表等等, 还有在线考试系统,利用计算机技术促进教学的改革和发展是必须的。在高校 的教育中考试是一个很重要的环节,如何采用个有效的考试方法,实现教考 分离,保证考试的公平公正,达到考试的目的是有待考虑的问题。伴随着国家 对教育发展投入的力度不断加大和全社会信息化水平的不断提高,各级各类学 校基本具备了实现现代化信息管理的物质基础。因此,采用计算机信息系统来 解决教考分离、试卷规范化和标准化的问题是一种行之有效的方法,它不仅可 以将教师从重复的出卷操作中解脱出来,而且还可以提高工作效率,更是各学 校实现考试自动化、管理数字化、信息化的标志。如何从试题库中快速地抽取 一份满足用户要求的试卷是很多教育工作者长期研究的问题。 在目前的教育中,考试仍然是衡量教育质量和学生成绩的重要手段【z j ,通过 在郧阳师范高等专科学校实际的教学和考试过程中发现,现在很多高职高专院 校的考试缺乏规范化、系统化、科学化和智能化,学生在考试之前不能根据自 己的实际情况选择题目进行练习,教师不能根据学生的成绩做出合理的考试分 析,试卷在很大程度上不能反映学生的学习情况,而且现在大多都采用人工组 卷的方式,教师的工作量大,很繁琐,往往- f - j 课程刚考试完又要补考,教师 又要出补考试卷,总是在重复的出卷子,浪费了教学资源,也没有起到很好的 效果;另一个方面,对于毕业生而言,很多学生在外实习,实际情况不允许他 们返校考试,如果能远程在线考试将是一个不错的方式,既能公平公正的考试 也能节约时间。综上,在高职高专院校建立网络考试系统是很有必要的。 在一般的考试系统中,建立试题库系统和组卷过程是整个系统的核心。试 题库是按照一定的教育测量理论建立起来的,首先分析试题的属性,根据试题 的属性初始化试题库。在试题库系统建设中,组卷策略是一个非常重要的环节。 试题库建成后,如果用户进行智能组卷操作,首先要输入相应约束条件的参数 武汉理工大学硕士学位论文 值,然后系统根据参数值抽取试题库中最符合要求的试题,最后生成满足用户 需求的试卷,定义这种参数以及对这些参数进行变换的算法,称之为组卷策略, 常用的组卷策略有优先权策略、随机策略、补偿策略、回溯策略以及遗传算法。 现在利用遗传算法进行智能组卷的研究已经比较广泛,也是一种比较好的智能 组卷方法,本文就是利用改进的遗传算法进行智能组卷操作。根据组卷方式的 不同,可将组卷策略划分为三大类型:自动组卷、人工组卷、半自动组卷p j 。 1 2 国内外研究情况 1 2 1 试题库的研究现状 试题库的发展已经有了较长的发展历史,并且也产生了比较有名的试题库 系统。最早的试题库c t s s 是1 9 6 8 年由i b m 公司和美国洛杉矶学区共同开发的, 它管理美国的历史题库,存储了8 0 0 道试题,能为中学的历史教育提供服务, 相应的作业、测验试题以及课外教辅材料都可以从该系统中生成。该系统能够 利用组卷策略自动抽取试题,生成试题答案,根据学生的测验结果进行评分, 是试题库的最初版本。除此以外,国外还有一些比较著名的试题库系统:布卢 姆理论的试题库和q u e s t i o n m a r kp o c 却t i o n 试题库 相对于国外的试题库,我国的试题库系统发展较晚,由于最近几年我国信 息技术和计算机网络技术的飞速发展,推动了试题库技术的发展,也产生了比 较有代表性的试题库系统 4 1 ,比如2 l 世纪教育网上考试系统,该考试系统提供 了试题库管理模块、用户管理、组卷模块、统计分析模块和系统安全与维护模 块,系统能够按照考试的时间收发试卷,支持在线考试和断电续考,能够自动 阅卷,并且进行成绩分析,最后打印成绩。教育1 2 3 题库系统,从1 9 8 9 年开始, 暨南大学软件工具研究所就致力于试题库系统的研制。还有结构力学试题库, 是在国家教委工科结构力学课程教学指导小组领导下,由清华大学、河海大学、 哈尔滨建筑大学、长沙铁道学院、北方交通大学、西南交通大学、西安建筑科 技大学、湖南大学、高等教育出版社等单位联合研制的,共有6 2 0 0 多道试题, 它采用了试题库通用软件系统,可以根据不同专业、不同考试性质、不同难 度指标进行自动、半自动、人工干预等不同方式的组卷,可供土建、水利、道 桥等专业各层次结构力学考试之用f 5 1 。除了这些有代表性的试题库系统,还有其 他的试题库,总之,我国试题库系统的研究正在不断深入,有了较快的发展。 2 武汉理工大学硕士学位论文 1 2 2 智能组卷算法的研究现状 组卷系统最初是从计算机用于教学开始的,2 0 世纪6 0 年代初,出现了计算 机辅助教学系统,其中包括考试系统、课表编排系统、管理教学系统等。这些 系统的出现,主要是想把计算机技术应用到教学领域,以提高教学水平和教学 质量。目前的组卷系统根据所使用的组卷算法大致可分如下几类:( 1 ) 基于随机 函数或随机变量算法的自动组卷;( 2 ) 基于深度和广度搜索算法的自动组卷;( 3 ) 基于人工鱼群算法的自动组卷;( 4 ) 基于粒子群算法的自动组卷;( 5 ) 基于遗传 算法的自动组卷;( 6 ) 基于项目反应理论的自适应测试;( 7 ) 基于数据挖掘和知识 发现的自动组卷理论,等。 ( 1 ) 基于随机函数或随机变量算法的自动组卷 这种组卷方法根据相应的控制指标,从题库中随机地先后抽取试题,直至 生成一份试卷或无法再从试题库中抽取满足性能指标要求的试题为止。利用这 种方法进行智能组卷比较简单,但是组成的试卷不一定能够满足用户的需求, 成卷效率低,组卷速度慢。 ( 2 ) 基于深度及广度搜索算法的自动组卷 6 1 深度广度回溯试探法是将随机选取法产生的每一状态都记录下来,当搜索 失败时释放上次记录的状态类型,然后再依据一定的规律变换另一种新的状态 类型进行试探,通过不断的回溯试探直到试卷生成完毕或退回出发点为止。由 于它所依据的搜索规律是不变的,因此破坏了随机搜索的特性,而且程序的结 构比较复杂,运行占用系统的内存空间,组卷的速度比较慢,整个算法的全局 搜索能力较差。 ( 3 ) 基于人工鱼群算法的自动组卷【7 】 人工鱼群算法是一种基于模拟鱼群行为的优化算法,该算法对题库进行预 处理后,加快了抽取试题与目标函数运算的速度,但是当题库中试题总数增大 时,预处理的时间开销也将增大,这将影响到整个智能组卷的寻优速度,需要 进一步地提高寻优精度,也需要进一步地缓解扩大种群多样性和缩小寻优空间 之间的矛盾。 ( 4 ) 基于粒子群算法的自动组卷【8 l 粒子群算法是一种被广泛关注的智能算法,是一种基于群智能的优化搜索 算法,在单目标优化问题上粒子群算法具有良好的性能,但它不能直接应用于 多目标问题中,要将粒子群算法应用于组卷系统中,需要将多目标问题转化为 3 武汉理工大学硕士学位论文 单目标问题来求解。可利用灰色关联度来确定粒子群算法的个体极值和全局极 值的选取,实现利用粒子群算法对多目标问题进行优化。 ( 5 ) 基于遗传算法的自动组型9 j 遗传算法( g e n e t i c a l g o r i t h m ,g a ) 是模拟达尔文的遗传选择和自然淘汰的生 物进化过程的计算模型,它是一种很好的优化算法。要用遗传算法解决优化问 题,首先要进行染色体的编码,设置初始种群,然后要确立适应度函数,接着 要进行遗传算法的三个基本操作:选择、交叉和变异操作,循环操作,直到找 到满足条件的最优解。将遗传算法用于解决组卷问题已经得到了广泛的应用, 用户首先给定相应的试卷属性指标参数,系统根据给定的参数,进行智能组卷, 生成满足用户需要的试卷。这种算法组卷的效率高,试卷的质量好,组卷速度 快,系统具有较好的健壮性。 ( 6 ) 基于项目反应理论的自适应测试u o 】 基于项目反应理论( i t e mr e s p o n s et h e o r y ,i r t ) 的自动组卷算法是由最早的 适应性测试发展而来的,在考试的过程中,被试的实际能力水平以及答题情况 系统是不知道的,为了考试的通用性,设置试卷的难度为中等难度,在试题库 中抽取一份难度为中等的题目进行考试,当考生开始答题以后,答完一题对学 生的实际能力进行重新估算,然后从试题库中选择一道难度相当的试题,重复 这个过程直到生成符合用户水平的试卷为止。 ( 7 ) 基于数据挖掘和知识发现的自动组卷理论【】 数据挖掘和知识发现作为一门新的研究领域,涉及到机器学习、模式识别、 统计学、数据库和人工智能等科学。特别是它可被看作是数据库理论和机器学 习的交叉学科。作为一种独立子应用的技术,受到了广泛的关注,有着广泛的 前景,可以应用于商业管理、科学研究、智能决策、故障诊断等方面,当然也 被应用于组卷系统中。 在以上的几种方法中,遗传算法是当前组卷系统中学术研究最多,也是最 前沿的组卷策略,它是借鉴生物界的进化规律演化而来的随机搜索方法。该方 法能解决随机算法的随机性,能从种群中选择更满足条件的个体,具有很强的 智能性。同时,由于遗传算法具有内在的并行性,不会出现回溯试探法计算量 大的问题。许多研究人员对基于遗传算法的试卷生成方法作了深入的研究,取 得了较好的效果。本文也欲采用改进的遗传算法来对组卷系统进行改进。 4 武汉理工大学硕士学位论文 1 3 论文的研究工作 本文在对试题库设计和智能组卷算法研究的基础上,围绕试题库的管理、 用户的管理、数据库的设计、组卷策略和系统的安全维护等方面进行研究工作, 最终将基于改进遗传算法的智能组卷方法应用于智能组卷系统中,实现了智能 组卷。把遗传算法运用到系统中,优化了组卷策略。 主要的研究内容是: ( 1 ) 试题属性的分析 根据统计学的原理对试题的属性进行分析,试题的属性主要包括试题的题 型、题分、题量、难度、区分度、知识点覆盖度和完成时间等等。在智能组卷 的过程中,根据用户给定的试题属性指标从试题库中抽取满足约束要求的试题 组成最终的试卷。 ( 2 ) 试题库的建立 在进行智能组卷之前必须要建立一个便于遗传算法进行组卷操作的试题 库,试题库的没用试题数量要尽量要小,同时要尽量减少组卷时的参数条件。 好的试题库,可以提高系统组卷的效率,能够生成更高质量的试卷。 ( 3 ) 智能组卷模块算法的实现 组卷算法的选取和实现,直接关系到智能组卷系统的成败,是整个组卷系 统的核心。本论文对传统的遗传算法进行改进,运用到智能组卷系统中,并且 最终实现了系统。 ( 4 ) 系统的安全性分析与设计 进入系统之前需要进行用户身份的认证,进入系统后可以按照系统分配的 权限进行相应的操作,另外当系统出现故障或者断电时,允许用户重新登录系 统继续考试,具有一定的安全性。 1 4 论文的组织结构 本文的整体组织结构如下: 第一章是绪论部分,介绍了本文的研究背景与意义,给出了试题库及其组 卷系统的研究状况,在此基础上提出了本文主要的研究工作,最后给出本文的 组织结构。 5 武汉理工大学硕士学位论文 第二章智能组卷的基本理论,首先给出智能组卷的基本原则,接着介绍了 经典和项目反应相关理论,然后给出影响试题质量的属性指标和影响试卷质量 的因素,为后面章节的智能组卷研究提供了理论基础。 第三章基于项目反应理论的题库设计,主要介绍了试题库的设计思想,研 究了试题库的设计,给出了试题库的结构,最后对试题库进行了初始化操作, 给出试题库初始化操作的意义以及操作流程和具体实现。 第四章基于改进遗传算法的智能组卷系统的研究,这是本文的重点,首先 简单介绍了遗传算法,接着研究了智能组卷的步骤及其模型,在此之上,对遗 传算法进行改进,在基本遗传算法中加入了分层思想和自适应算子,提高了运 行速度,使系统有较好的健壮性。将改进的遗传算法应用于智能组卷系统中, 给出相应的算法流程,进行算法的设计,分析算法的性能。 第五章基于改进遗传算法的智能组卷系统的设计与实现,根据以上章节的 研究,对智能组卷系统的整体结构进行分析与设计,进行系统需求描述,给出 组卷系统的总体结构、数据库的具体设计和统计分析功能的设计,初步实现系 统,最后对智能组卷系统进行性能分析和评价。 第六章总结与展望,总结了本文的研究工作,并对今后的研究改进做了展 望。 6 武汉理工大学硕士学位论文 第2 章智能组卷的基本理论 2 1 智能组卷的基本原则 智能组卷是用户输入相应的参数,然后参照一定的组卷原则生成满足用户 需求的试卷。一份合格的试卷,并不是教师随意编制的,而是参照一定的原则 精心编制的,要保证试卷的信度和效度1 1 2 】,通常要满足如下的组卷原则。 ( 1 ) 试卷的难度要适中,根据考试的目的来适当调整试卷的难度,如果考试的 目的仅仅是为了检测知识点的掌握情况,则一般设置知识点的难度系数是0 5 ,; 如果对于一些选拔性的考试可适当地增大难度,否则,可以适当减少难度。如 果试题过难或者过易,会导致试卷的区分度较差,失去考核的意义。 ( 2 ) 要保证试卷中尽量不要出现过多内容相近的试题,这就要使试题的知识点 覆盖面要广,涵盖考试大纲的内容,并且有一定的题量,保证试卷的信度。 ( 3 ) 在保证试卷信度的前提下,还要保证试卷的效度,要根据试卷的知识点的 重要程度和题型题量,合理分配试题的分数。 ( 4 ) 对考试的时间要有一定的限制,比如一般要求考试时间是1 2 0 分钟,对于 一些特殊的考试如计算机等级考试要求9 0 分钟,对研究生考试要求1 8 0 分钟,等 等。根据考试时间的限制来选择适当的题目进行组卷,要求考生在规定的时间 内完成试卷。 ( 5 ) 避免时间间隔较近的考试,尽量不要出现同样的试题,例如,可以规定近 两年之内同样的学科不要出现同样的考试题目,对于相同的知识点可以采用不 同的表示形式,避免学生押题猜题,降低考试的有效性【l 引。 2 2 智能组卷考试理论概述 2 1 1 经典测量理论 经典测量理论是在2 0 世纪初被提出来的,自提出到现在已经一百多年了, 经典测量理论已经相当的成熟,已经有一套相当完整的理论体系,基本假设是 经典测量理论的基础。在试题库的建设中,经典测量理论经常被采用,除了应 用于教育领域,还广泛地应用于各个测验领域,为测验的出题和分析评价给出 7 武汉理工大学硕士学位论文 了比较具体实用的方法。 在现实生活中,我们得到的一组信息,既有真正的信息,又有无关的信息, 在教育测量中将前者称为真分数,后者称为误差。而我们进行教育测量的真正 目的就是得到真分数,排除误差。然而误差的存在,使得直接测量的观察分数 会在一定的范围内浮动。 将真分数表示为t ,误差表示为e ,观察分数表示为x ,期望值表示为,根 据数学上的定义,真分数是观测分数的期望值,用公式t = e :x 来表示,但是根据 这个公式是不能直接测得真分数的,于是提出了其他的模型,观测分数= 真分数 + 误差,耳p x = t + e ,x 和t 之间存在线性关系,其中真分数和误差之间是相互独 立的,而且要求在大量测验中的误差分数统计平均值为零【l 制。 经典测量理论计算公式简单易懂,而且有一系列分析的方法,在教育领域 中有广泛的应用,其优点体现在如下几个方面: ( 1 ) 有一套完整的理论体系,发展比较成熟; ( 2 ) 教育测量理论以基本假设作为理论基础,对实施条件要求较低,应 用较广; ( 3 ) 在运用经典测量理论的过程中,很多方法和原则不断完善; ( 4 ) 建立在简单地数据模型之上,简单易懂,便于普及。 由于在利用经典测量理论进行测试的过程中,要求教师根据实际的学习程 度选择适当难度和知识点范围的试题组织一份试卷供学生考试,这样一份试卷 不能保证难度和区分度达到实际的要求,将试卷给学生考试,只有一部分试题 能够体现自己的真正水平,其他的试题要么太难要么太简单,都不能体现学生 的真实水平,存在着很大的问题。经典测量理论存在以下的缺点: ( 1 ) 测试结果的差别性不大: ( 2 ) 测试水平和测试题目参数之间关系不明确; ( 3 ) 对于各种不同的具体情况适应性差; ( 4 ) 测试的参数过分依赖于实际具体的样本; ( 5 ) 该理论的各个基本概念之间相互制约、相互依赖。 2 2 2 项目反应理论 项目反应理论( 简称肿) 是一种新兴的现代教育与心理测验理论。它起源 于2 0 世纪3 0 年代。1 9 5 2 年美国测量学专家洛德( l o r d ) 在自己的博士论文中 8 武汉理工大学硕士学位论文 首次提出项目反应模型。这标标志着该理论的正式诞生。 项目反应理论是关于被试潜在特质( 能力水平) 与其对测验项目( 题目) 反应之间关系的理论。它的主要研究内容是:首先确定项目特征曲线的形态。 所谓项目特征曲线,就是以支配人某种行动潜在特质的量表分数为自变量,以 被试在试题上正确作答的概率为因变量,所求得的因变量对自变量的回归线。 亦即被试在试题上正确作答概率对其能力水平的回归线。然后,根据项目曲线 的形态写出它的解析式,即以数学形式将被试能力与其对测验题正确作答概率 之间关系表达出来,这就是项目反应模型。可以根据被试在项目上的行为反应 来判断他的能力,也可以根据被试的能力水平来预测他在项目上的反应( 即答 对的概率) 。项目反应理论的核心就是数学模型的建立,以及对模型中各个参数 的估计【15 1 。 项目反应模型有多种,从潜在特质空间维度来说,有单维特质空间模型和 多维特质空间模型;从题目记分角度来说,有二值记分、多值记分、连续记分 模型:从模型中所含参数的数目来说,有单参数、双参数、三参数和四参数模 型,等等。 下面仅简略介绍单维空间二值记分的逻辑斯蒂( l o g i s t i c ) 模型。该模型由 伯恩鲍姆( b i m b a u m ) 于1 9 5 7 年至1 9 5 8 年提出。 逻辑斯蒂模型有单参数、双参数及三参数之分,其函数表达式分别为: prp 卜i e j 南啊河 l + ,v p l , p i p 户五e i 啬矿可1 + ,“l 、” ”l , p i ( 口) _ c ,+ 五号褊 在这里,所( 口) 表示能力为o 的被试在项目i 上正确作答的概率 o 表示被试的能力 鸟表示项目i 的难度参数 p 表示自然对数之底e = 2 7 1 8 2 8 d 表示量表因子o = 1 7 a i 表示项目i 的区分度参数 c i 表示项目i 的伪随机水平参数,习惯称猜测参数 9 武汉理工大学硕士学位论文 上述三个模型中以三参数逻辑斯蒂模型应用最为广泛。 项目反应理论具有如下的优点: ( 1 ) 试卷的难度和区分度与被测者的能力不相关; ( 2 ) 采用非线性模型,减少了参数之间的依赖和制约关系; ( 3 ) 对测试者能力的估计不再依赖于具体的测试样本; ( 4 ) 在进行教育测量的时候,对于不同能力的被测者采用不同的试题 进行测试,这样即提高了测量精度又缩短了测验的时间。 2 2 - 3 经典测量理论和项目反应理论的比较 智能组卷系统主要是要生成满足用户要求的试卷,生成的试卷必须要达到 教育测量的目的,有效的对学生进行考核,根据学生的成绩进行数据分析,对 教师的教学起到促进作用。 经典测量理论虽然经过长期的发展,理论已经比较成熟,但是仍然存在一 些无法突破的问题,相对于经典测量理论,项目反应理论就更优一些,更适合 于广泛的应用。经典测量理论的测试参数和结果过分依赖于被测的具体样本, 而项目反应理论则不再过分依赖具体样本;经典测量理论中,被测者的实际能 力水平依赖于试题的难度,测试的结果不能真正地反应考试者地实际能力,而 项目反应理论则根据每个被测者的不同水平,采用不同的难度的试题进行测试, 相应试卷的难度和被测者的水平相适应,提高了测量的精度;而且前者假设所 有被试者的测量标准误差都相等,这是不太可能的,后者则没有,采用信息函 数来阐述这一问题。并且在题库的建立问题上,项目反应理论优于经典测量理 论,它的参数具有不变性,而且得到的能力估计值具有不变性,但是经典测量 理论参数过分依赖于实际的具体样本,并且测试水平和测试参数之间的关系不 明确。相比之下,项目反应理论所具有的优点是经典测量理论不具备的,这也 是发展至今项目反应理论成为教育测量领域的前沿理论,并得到广泛应用的原 因。本文采用的是项目反应理论来建立试题库系统。 2 2 4 影响试题质量的属性指标 一份试卷是由多道试题组成的,这些试题都存放在试题库中,当用户进行 组卷操作时,输入相应的参数,就可以从试题库中抽取满足用户需求的试题, 最终生成试卷。试题库中的试题都具有自己相应的属性,在进行组卷时,需要 1 0 武汉理工大学硕士学位论文 满足一定的约束条件,并且属性指标的确定直接关系到试卷的质量和组卷的效 率。在测验编制的过程中,为了改善和提高测验的信度和效度,在组成测验之 前,应对每个试题进行分析,称为试题分析。测试题分析工作,除了根据测验 的目的、性质、内容对测题进行分析之外,还应在预备测验的基础上,根据统 计学原理作量的分析,以作为筛选和修改试题的依据。下面主要分析试题的难 度、区分度和效度这三个属性指标【1 6 1 。 l 、试题的难度 试题的难度指的是试题的难易程度。试题难度对于智能组卷是一个非常重 要的属性指标,根据考核对象、考核目的的不同,应该设置不同难度的试题进 行测验,本文考虑的试题难度分为以下五个级别,见下表2 1 所示 表2 i 测题难度系数表 难度级别 难较难中等较易 易 难度系数0 8 1o 每旬8o 4 o 6o 2 0 40 一o 2 由于我们通常的考试试卷都是由几个大题目所组成,每个题目的满分可能 是几分、十几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论