【毕业学位论文】(Word原稿)基于Web的在线考试新型方案设计与研究-远程教育及其网络技术_第1页
【毕业学位论文】(Word原稿)基于Web的在线考试新型方案设计与研究-远程教育及其网络技术_第2页
【毕业学位论文】(Word原稿)基于Web的在线考试新型方案设计与研究-远程教育及其网络技术_第3页
【毕业学位论文】(Word原稿)基于Web的在线考试新型方案设计与研究-远程教育及其网络技术_第4页
【毕业学位论文】(Word原稿)基于Web的在线考试新型方案设计与研究-远程教育及其网络技术_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类编号: 单位代码: 10065 密 级: 学 号: 04206006 研究生学位论文 论文题目: 基于 在线考试新型方案 的 设计与 研究 学 生 姓 名: 谢 延 红 申请 学位级别: 硕士 申请专业名称: 教 育 技 术 学 研 究 方 向: 远程教育及其网络技术研究 指导教师姓名: 王 志 军 专业技术职称: 教 授 提交论文日期: 2007 年 3 月 中 文摘要 要 在线考试系统可以帮助考试主管部门实现考试信息和考试流程的系统化、科学化和自动化管理,提高工作效率,减轻命题、组卷、阅卷、统计分析等繁重的工作量。本研究 隶属于 天津市十一五教育科学规划 重点 课题“ 网络环境下教师教育绩效管理模式及智能化支撑平台开发研究” , 所做的工作是基于 在线考试新型方案的研究、设计与开发。 论文共分七章。第一章介绍了本研究的课题背景及意义,通过分析国内外的研究现状,总结出目前在线考试系统普遍存在的问题;第二章对题库建设理论、教育测量理论以及相关的规范和标准做了研究和分析,作为本研究的重要理论依据;第三章介绍了系统实现的一些关键性技术 及其在本研究中的应用 ;第四章论述了在线考试系统的总体设计与构想,在确定总体设计思想的基础上对系统总体特征进行了设计与分析,提出了在线考试系统的体系 结构模型,并从功能模型、数据库、系统安全性三个方面描述了系统总体设计。第五章详细阐述了在线考试系统实现过程中的几个关键问题及解决方案的设计与实现;这两章是论文研究的核心内容;第六章介绍了在线考试系统的测试过程及调试步骤;最后总结了 本研究 的创新点,提出了今后的研究内容与方向。 本研究所实现的在线考试系统 提供了系统功能模块拆装组合功能 ,使得系统可以作为一个考试系统独立运行 ,也可以适用于网络课程生成系统 ; 自动组卷、手工组卷、自测组卷三种试卷策略创建模式 交相辉映,可 满足不同用户的不同需求;利用 便的实现了多媒体试题的制作,并引入“命题双向细目表”编制试卷蓝图,克服了命题的主观随意性;完备的试卷分析功能,使教师能够全面获取教与学的反馈信息,为新型教学提供依据 ; 系统采用 最新 术, 减轻 了 服务器的负担, 改善 了用户体验。 这是本研究的创新点。 关键词: 在线考试,测量理论,双向细目表,组卷 英文摘要 in a of is a 1 It to a to on of of of at in is of of in in of of in on A of is is in in In of to to it be of of of to in By of of 文摘要 IV of of 录 录 第一章 绪论 . 1 题背景及意义 . 1 内外研究现状和存在的问题 . 2 者所做的主要工作 . 3 第二章 在线考试系统理论依据分析 . 5 库建设理论 . 5 库的定义与特征 . 5 库建设实践程序 . 6 库建设理论对本研究的指导 . 7 育测量理论 . 9 典测量理论 . 9 化理论 . 11 目反应理论 . 12 典测量理论在本研究中的应用 . 15 线考试系统的相关标准与规范 . 15 外 资源建设标准代表 型 . 15 代远程教育资源建设技术规范 . 16 试互操作:信息模型规范 . 17 关标准与规范是本研究系统设计的参照目标 . 18 第三章 系统实现的关键性技术分析 . 19 技术 . 19 务器控件 . 19 面框架 . 20 务与 . 21 本研究的技术主体 . 22 技术 . 22 术简介 . 22 术工作原理与优势 . 23 的一种简便实现方式 . 23 本研究中的应用 . 24 据库技术 . 25 据库技术基本概念 . 25 005 . 26 据库技术在本研究中的应用 . 27 第四章 在线考试系统总体设计与分析 . 28 线考试系统总体设计思想 . 28 线考试系统特征设计分析 . 29 统软件体系结构模型设计 . 30 统功能模型设计 . 31 统数据库设 计 . 33 目录 V 统安全性设计 . 38 务器安全策略设计 . 38 据库安全设计 . 39 用程序安全设计 . 40 第五章 系统关键问题及解决方案设计与实现 . 41 媒体试题的制作 . 41 题的编制原则 . 41 媒体试题的制作 . 42 使用方法简析 . 43 于双向细目表的自动组卷策略 . 44 题双向细目表 . 44 卷参数介绍 . 45 动组卷的设计与实现 . 46 生在线测试功能 . 48 线考试流程设计 . 48 试界面的设计 . 49 键功能设计简析 . 49 生评价功能 . 50 生相对评价 . 50 生绝对评价 . 51 生个体内差异评价 . 51 卷分析功能 . 52 卷分数集中量分析 . 52 卷分数差异量分析 . 53 卷分数分布情况分析 . 54 卷质量分析 . 55 第六章 系统测试与调试 . 58 元测试 . 58 装测试 . 59 统测试 . 59 试 . 60 第七章 结束语 . 61 研究的创新点 . 61 望 . 62 参考文献 . 63 致谢 . 65 攻读硕士学位期间发表学术论文情况 . 66 攻读硕士学位期间科研情况 . 67 攻读硕士学位期间其他奖励情况 . 67 附录 1 数据操作层事务应用实例 . 68 第一章 绪论 1 第一章 绪论 题背景及意义 本研究隶属于 天津市十一五教育科学规划 重点 课题“网络环境下教师教育绩效管理模式及智能化支撑平台开 发研究” 。 作者作为此课题负责人王志军教授的学生有幸参加 “ 智能化支撑平台 网络课程生成系统 ” 子课题 组 , 并 承担 网络课程生成系统 下 的 在线考试系统和离线作业系统的 研发 工作。 网络课程的开发和设计是课程设计 中的 新领域、新概念,也是现代远程教育工程建设的核心和重点。 所谓网络课程就是通过网络表现的某门学科的教学内容及实施的教学活动的综合,它包括两个组成部分:按一定的教学目标、教学策略组织起来的教学内容和网络教学支撑环境,其中网络教学支撑环境特指支持网络教学的软件工具、教学资源以及在网络教学平台上实施的教学活动 1。 显然, 在线考试作为网络课程的一种重要组成子系统,对良好网络教育支持环境的搭建具有 及其 重要 的意义。 现阶段虽然远程教育已经蓬勃地发展起来,但学校与社会上的各种考试基本还是采用传统的考试方式,在这种方式下,通常组织一次考试至少需要经过五个步骤:人工出卷、考生考试、人工阅卷、成绩统计和试卷分析。随着各种考试类型的不断增加和考生数量的不断膨胀,传统考试方式暴露了许多弊端 2: ( 1) 出现不必要的重复劳动,造成人力、物力、财力的浪费;( 2)人工出卷和阅卷错误率高,难以保证成绩的公平性;( 3)存在着考前压题、漏题等不良 现象;( 4)考试时间难以控制;( 5)试卷印刷容易出错,造成不必要的麻烦 。显然,传统的考试方式已经不能适应现代远程教育和知识更新的需求,因此开发一套在线考试系统具有重要 现实 意义 : 1. 在线考试突破了时空限制。在线考试系统突破了传统考试模式的时间、空间限制,有利于组织大规模异地实时考试,可以满足任何授权的考生在规定的时间段内在任意时间和 可用 地点参加考试,大大提高了教学内容和考核方式的灵活性。 2. 在线考试提高了工作效率。在线考试系统减轻了考试主管部门人员尤其是教师在命题、组卷、阅卷、统计分析等方面繁重的工作量,提高 了工作效率。 第一章 绪论 2 3. 在线考试节省财政开支。在线考试真正实现了无纸化办公,节省了纸张、印刷等考核费用。 4. 在线考试更能体现了考核的 客观 公正性。在线考试采用试题库方式提供试卷来源,考前无任何成套试卷,考试时各考生试卷不完全相同,避免了互相参看导致的不公平成绩。自动阅卷等功能增加了考核的透明度,降低了错误出现的概率和教师主观因素的干扰,更能体现考核的 客观 公正性。 5. 在线考试为考生营造了一个个性化的学习环境。在线考试系统为考生提供了丰富的信息资源,除教师制定的试卷外,考生还可以进行自测练习,根据个人的特点和需求制定自测 试卷,为提高自身综合素质打下坚实的基础。 6. 在线考试考核形式多种多样。在线考试中添加了传统 纸质 试卷中极少 、甚至无法 应用 的 图片、声音、动画 等 多媒体形式,能将文字难以描述的东西以多媒体的形式直观的表现出来,有利于考核的准确性和灵活性,减弱考生对考试的抵触情绪。 积极适应信息网络化的发展趋势,利用先进的网络技术、数据库技术和人工智能技术,结合当前网络普及化的大好时机,开发一套基于 B/S 模式的在线考试系统具有深远的意义。 内外研究现状和存在的问题 我国的一些考试机构和学校非常重视在线考试的建设。 1990 年 由国家教委考试中心牵头,召开了国内第一次教育考试题库理论研讨会,探索建立符合我国教育考试实际情况的题库理论和方法 3。目前,基于网络的考试主要 是 面向社会上的培训认证考试和远程教育的考试,开发主流为基于 考试系统。以下介绍几个典型的在线考试系统,以说明国内外的研究现状 45。 北京师范大学研究开发的基于 通用题库系统的两大特点是:( 1)集中管理,由统一权威机构进行维护和管理,任课教师没有自主修订权;( 2)开放使用,通过网络征集试题和组织测试。 全美测评软件系统(北京)有限公司( 一 家提供考试技术和考试内容服务的专业公司, 对中小学信息技术课程定制的校园智能化测试平台 E 考通,支持广域网和局域网操作,考生可以进行网上的互动练习、课外作业和提问;第一章 绪论 3 教师可以进行网上指导、网上批改作业 7。 鹏博士在线考试系统及题库录入系统是一套基于浏览器的易学易用的产品,该系统包括用户管理、试题管理、智能组卷、网上考试、成绩分析等功能,主要缺点是对试卷、试题的分析不够深入,对题库没有维护功能,不利于标准化考试。 科教 2000 网络考试系统是成都北斗星信息技术发展有限公司推出的多功能辅助教学系统,是一个 练习、测试自动化全面解决方案。具有教学题库管理、自动试卷生成、网上测验、网上练习、自动成绩统计等多项功能。但该系统虽对题库进行了扩充,但仍没有淘汰更新机制,也没有将考生从题海战术中解放出来,且分析统计功能较弱 8。 一些高校及科研单位也开发了各类基于 在线考试系统投入实际应用。一些大规模高校的部分计算机学科,特别 是 计算机基础学科也在制作和试用在线考试系统进行无纸化考试,如华中科技大学、上海同济大学等 5。 除研究以上实例以外,作者还采用文献法对在线考试系统的功能设计信息进行调查研究。检索的具体方式 是选择中国期刊网中的中国学术期刊全文数据库和中国优秀博硕士学位论文全文数据库,采用关键字“在线考试”共命中 146 篇, 其中 期刊 124 篇,学位论文 22 篇 ; 采用关键字“在线测评”共命中 4 篇, 其中 期刊 3 篇,学位论文 1 篇 ; 采用关键字 “网络测评”共命中文章 5 篇, 其中 期刊 4 篇,学位论文 1 篇。对文章逐一进行查看,共确定文章 52 篇作为研究对比对象。通过分析案例和研究文献发现目前在线考试已经取得了较大发展 ,但是还存在着很多不完善的方面 ,使得在线考试在短时间内难以取代 传统 的 考试 方式 。现有在线考试系统主要存在着以下问题: ( 1)题 目类型固定,不具备可修改、可扩充性;( 2)试题形式单一,缺乏音频、视频、动画等多媒体试题形式;( 3)组卷方式形式单一,且科学依据不足;( 4)重视考生的考,而忽略考生对试卷的复习与分析;( 5)试卷分析功能不足。 本研究针对上述问题,在借鉴其它系统优点的基础上并结合教学过程和教学管理中的一些实际情况,提出了基于 在线考试新型方案。 者所做的主要工作 经过近两年的调研、设计、编程以及测试, 课题 组共同合作完成了整个网络课第一章 绪论 4 程 生成 系统的研制工作,作者也如期完成了预定目标 成 系统中在线考试和在线作业子系统的研发工作。在整个系统开发过程中,作者做的主要工作有: 1. 系统开发准备阶段: 与课题组成员一起, 通过 专家访谈、教师用户访谈、网络 和文献研究等形式调研国内外网络课程功能模块和网络课程开发现状, 制定系统开发计划。 2. 系统分析阶段:深入研究考试系统相关的题库和教育测量理论,调查现有各种模式的考试系统,借鉴其优点,弥补其缺点,制定需求计划;然后根据需求计划分析考试系统需实现的功能模块和各种可能的制约因素,从而保证系统的完整性、先进性和可扩展性。 3. 系统设计阶段:确定系统的总体设计方案、划分各子系统 功能模型,综合考虑各种制约因素,利用有效的技术手段和方法进行各种具体环节设计,包括系统体系结构设计、功能模块设计、界面导航设计、数据库设计、系统安全性设计以及系统关键问题及解决方案的设计等。其中充分考虑考试系统 功能 模块与网络课程 生成 系统以及其它 子 功能模块的数据共享与协调通信等问题。 4. 系统开发阶段:依据前面的设计,搭建程序开发运行环境,根据详细设计方案进行程序的编写和调试。 5. 系统测试、完善阶段:根据制定的测试计划,依次进行单元测试、集成测试和系统测试,在测试中发现问题,解决问题。同时聘请专家教师对系统进行评价 ,并根据评价意见与建议不断修改完善系统。 第二章 在线考试系统理论依据分析 5 第二章 在线考试系统理论 依据分析 理论和实践是相辅相成、互相促进的,理论指导了人们的实践,而实践又推动了理论的完善与发展。考试系统是一项理论性强,实际意义重大的复杂工程,需要用更多、更实际的理论和方法来指导系统的设计。 库建设理论 题库可以存储试题,又有辅助命题和记录分析考试结 果 的功能。随着题库规模的不断增大,对组卷的智能化、科学化要求越来越高,并需实时统计出考试结果分析数据,因此题库建设理论显 得 尤为重要,是在线考试诸多理论中的根本。 库的 定义与特征 题库是适应考试事业大规模发展,考试过程的科学化、标准化的需要发展起来的,国内外许多教育机构、软件公司都在倾心研究题库。 题库( 按照一定的教育测量理论,在计算机系统中实现的某个学科题目的集合,是在数学模型基础上建立起来 的 教育测量工具 8。题库的任务是拼制不同测量目的的试卷,是考试系统的基础与根本,因此题库应该满足一定的要求 9。 1. 题库中的试题技术参数应当齐备,试题质量要有保证。题库的基本组成单位是单个试题,试题的各项参考技术参数必须统一明确,试题质量要有保证,这样便于用户按 照一定的科学程序,根据试题的技术参数挑选试题,优化组合成符合一定内容、性质、难度等不同要求的优质试卷,使试卷符合预定的各项质量指标,保证考试的可信性和有效性。 2. 题库中题目数量充足,比例结构合理。题量小就难以生成满足特定要求的试卷,也不能满足多次考试的需要。同时题目的比例结构要科学合理,主要指内容范围、能力层次、难 易 比例、题目类型等方面。否则,题库编 制 试卷的各种优越性就难以发挥。 3. 题库中试题必须按科学原则分类、存储,形成有机整体。试题存储的目的在于使用,只有按科学原则把试题系统的组织起来,才能准确、方便、灵活 地检索和第二章 在线考试系统理论依据分析 6 调用。为使信息使用时充分发挥在管理学上的优越性,还应使存储的试题有完备的信息,一般,除试题内容、参考答案、评分标准外,还应包括考核的知识点与目标层次,试题技术参数,使用记录等。 4. 题库必须是动态的。首先,各门学科都在不断地发展变化,因此各学科题库内容也应不断的更新,需及时添加、修改、删除试题。其次,考生水平也在不断提高,这样试题参数和考核能力层次也会有所变化。所以,题库的动态性不但表现在测试内容的更新上,而且还表现在试题统计特征的变化上。题库内容的动态性保证了它能及时灵活的去为社会需要服务,使考试机构 不断积累和扩大命题研究成果。 库建设实践程序 题库建设是一项相当复杂艰巨的系统工程,需要各学科专业人员消耗大量的人力物力协同努力才能完成,不经过充分的认证和缺乏理论指导就进行题库建设的行为是盲目的,势必会造成人力物力财力的浪费。题库建设不仅需要教育测量学理论的指导,还要用系统工程的观念去建设和管理,才能保证题库系统的质量。题库建设一般包括以下几个工作阶段 91011。 1. 试题的编制与汇集 试题编制之前首先要有一个成熟稳定的考试大纲,这个大纲规定的考试性质、内容、目标能力层次、难度、题型 、分量、权重、考试时间等内容要符合考试的对象和用途。考试大纲是命题的依据,题库中的题目必须根据考试大纲进行征集和编写,题目在学科知识方面无可挑剔。审题是保证试题质量的关键,因此一般要组织专人审查、专家组会审后才能入库。题目的编制和汇集是题库建设的关键,关系到整个题库的质量、试卷的质量以及统计评价的准确程度。此阶段应由学科教学人员和心理与教育测量人员共同协作完成,但主要责任应由学科教学人员负责 , 由组织人员进行协调。 2. 试题统计分析 为保证试题的科学性和有效性,所有的试题在有可能的情况下都需经过测试。测试就是把写 好的试题拿到与将来考生相一致的样本中试验以获取题目的技术参数,即对每一道试题都有技术分析,并取得统计参数。试题分析可以了解题目是否达到大纲的要求,作为试题筛选的依据。试题分析还可以确定试题难度、区分度等第二章 在线考试系统理论依据分析 7 技术参数,这些参数在组卷、试题、试卷的统计评价中有重要的意义。试题的分析还要把试题参数进行等值处理,因为不同测验试卷的题目的各项技术参数是与考生团体有关的。同样的题目,在不同的考生团体中会求得不同的题目参数,即它们在不同的量表之中。题目参数的等值处理就是将所有的试题参数统一到同一个坐标系中,以确保试题参数的可 比较性,这样十分有利于题库建设。此阶段应由学科教学人员、心理与教育测量人员以及计算机专业人员协作完成,心理与教育测量人员应居主导地位,由组织人员进行协调。 3. 存储建库 一般题库的规模都比较大,这就 需要 采用紧凑、安全、高效的存储方式,设计一个灵活方便的题库生成以及检索修订程序,以便能方便的管理题库。题库中的试题存储时要有“序”,这个“序”既取决于学科体系结构本身 又 取决于考试性质目的对题库统计特征的要求。题库要采用恰当的标引语言,按照科学的原则与顺序,把试题和应有的信息资料有机地组织起来 12。此阶段应由计算机 专业人员承担,但仍需心理与教育测量人员的配合,组织人员的协调。 4. 动态维护 题库具有动态性,应随着学科内容和考生水平的不断发展变化而变化,决不是一成不变的。动态的维护,就是要经常检查试题的思想性、科学性,根据学科内容和考生水平的发展不断的对题库中的试题做相应的补充、修改和删除工作,及时修正试题的各项技术参数。题库的修订要精心规划,严格执行,考试系统在设计题库的结构时就要考虑到以后的修改和扩充需求,使系统在整体框架不变、能保持系统相对稳定的前提下,具有一定的扩展能力。此阶段更需依赖管理人员的组织协调,并在 学科教 学人员和心理、教育测量人员、计算机专业人员和管理人员 这四种人员的共同努力协作下完成。 库建设理论 对本研究的指导 题库建设是个艰巨的系统工程,整个工作过程必须要有坚实、科学的理论基础。从题库的功能和题库建设的理论依据来看,建立题库不仅涉及教育测量理论,还涉及到多方面的教育教学理论 912,对本研究有重要指导意义的 理论有: 1. 学科体系与教育目标层次分类理论 第二章 在线考试系统理论依据分析 8 如何划分试题学科体系与目标层次以及如何描述题库中试题考核内容,即题库中的试题是用来测量什么,以及试题之间是如何分类和分层的,是命题与征题规 划的基本依据。 本研究中,试题认知度技术参数采用布卢姆关于认知领域的教育目标分类 , 即分为知道、领会、运用、分析、综合 和 评价六个等级。 2. 题型功能与命题技术 题型功能与命题技术理论提供了编制试题的原则和方法,也提供了评价题库结构的根本标准,是题库建设理论的一个重要方面。 本研究中, 一张试卷是由多种题型搭配组成的,如何确定题型及各题型所占比例,如何有效的使用各种题型都是需要考虑的。由于考生解答选择、填空题所需的时间相对较少,即使对于同一内容的试题,也可按照知识和能力的不同侧重点选编不同的试题,变化余地较大。因此 本研究 利用双向细目表规划试卷蓝图,在一定程度上克服了教师 的 主观随意性,同时本研究 推荐 , 在试卷中增加客观试题的比重 以 增加知识和能力的考察面,避免阅卷教师主观因素所造成的评分标准不一致。 3. 题目统计分析技术 题目分析技术是科学地修订、筛选和调取使用试题的重要理论基础。测验题目是否优良,必须有技术参数来说明, 否则 就不能科学地进行试题筛选、修订和调取使用工作。 因此,本研究中各项技术参数均以 列表 形式 呈现 给用户,保证技术参数的全面性。 同时根据试题的通过率及时调整试题参数,保证技术参数的科学有效性。 4. 测验等值 测验等值化的目的是 寻找不同测验形式之间的分数转换关系,把不同测验形式上的分数都转换到同一度量系统上。测验等值本身包括两个方面:考生测验分数的等值和试题参数 的 等值。前者解决考生在不同测验中总分的转换问题,后者解决不同测验上的试题的难度、区分度的对应关系问题。 本研究中考生试卷分数采用原始分数和标准分数两种 表示 方式,使同一试卷内部分数可做相对和绝对评价分析,也使得不同试卷间的分数具有可比性。 5. 试题和试卷的拼合及质量评价。 本研究中, 每次测验后都会 自动对 测验后的分数进行统计分析,获得符合特定考核目的的统计数据如平均分、标准差、分数分 布状态(包括及格率等),以及测量标准误(信度)等。通过 这些 分析 数据 来了解考生对教材、教法的适应情况以及第二章 在线考试系统理论依据分析 9 由此来诊断教学过程中存在的问题,以便调整教学策略。 题库建设与教育理论的联系,还有其他一些方面,即题库建设是学科的综合性应用,当然仍以教育测量、教育统计理论作为主导。 育测量理论 教育测量是根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程,主要用于对考生精神特征的测定。教育测量根据测验目标的不同可以分为学业成就测验、智力测验、能力倾向测验与人格测验。学业成就测验即考生学习效果 的测验,是关于教学目标的考试 13。本研究把“考试”界定为学业成就测验,因此,测量理论完全适用于“考试”这一特殊教育形式。 教育测量理论的发展大体经历了两个阶段, 20 世纪 50 年代以前是经典测量理论阶段; 50 年代以后至今是多种理论并存阶段。除了经典测量理论外,概化理论和项目反应也被广泛接受并运用到测量的实践活动中。 典测量理论 20 世纪 20 年代开始以真分数理论( 代表的经典测量理论( 称 渐发展起来,并传入 我国。 20 世纪 50 年代初期,格里克森出版的心理测验理论标志着经典的心理计量学理论的成熟,后来洛德与诺维克合编的心理测验分数的统计理论将经典测量理论推至顶峰。 1. 经典测量理论的基本内容 911 经典测量理论的特点之一就是各种测验的参数须从考生样本中求得,经典测量理论的基础是真分数模型。所谓的“真分数”其数学上的定义为:测量上被试的真分数是观测分数(或说测量实得分数)的期望值。可以用下式表示: T X ( 2 1) 其中: X 为被试在测验上的实得分数, X 代表 X 的数学期望, T 即被试的真分数。 显然,在此意义上的真分数是不能直接测量得到的,因为据式( 2 1),可将 : 第二章 在线考试系统理论依据分析 10 1 ( 2 2) 从信息论观点出发,可对真分数作出定性的解释:任何一组信息都包含有真正的信息信号和无关的信息(噪音)。心理与教育测量的目的在于获得被试的真正信息,排除无关信息。测量上,真正的信息称为真分数,无 关信息称为误差。因为误差,直接测量而得的观测分数便会在一定范围内波动。经典测量理论的真分数模型对此进行了简单而有效的描述,提出了一系列基本定义和推导。 ( 1) X T E ( 2 3) 其中, X 是被试在测验上的观测分数, T 是被试的真分数, E 为测量误差。此式定义:观测分数是真分数与误差分数之和。 ( 2) ( 2 4) 此式定义:真分数与观测分数的各自平均数相等。 ( 3) E 0 ( 2 5) 此式定义:误差分数的期望值为 0。 ( 4) 0 ( 2 6) 此式定义:真分数与误差分数的相关为 0。 ( 5) 021 ( 2 7) 此式定义:不同测验误差之间的相关为 0。 依据上述的定义,所有有关经典测量理论及方法,所应用的各种公式及定义,均是依据真分数理论的模型推导而来。 基本假设、信度和效度被称为经典测验理论的三大支柱,题目分析和标准化是它的方法体系。在上述理论的基础上,经典测量理论建立了一整套质量指标的计算公式,完善了测验的标准化程序,具有很 大 的使用价值。 2. 经典测量理论的优点与缺点 经典测量理论的优点在于: ( 1) 以弱假设为基础,这些弱假设条件容易被绝大多数测验数据资料所满足。 ( 2) 具有完善的测验理论以及简明的题目和测验统计分析方法,易于掌握和理解。 第二章 在线考试系统理论依据分析 11 ( 3) 我国的教育工作者在实践中加深了对经典测量理论的认识,形成和完善了一套适合我国国情的具体应用方法和应用原则。 经典测量理论的不足主要表现在以下几个方面: ( 1) 经典测量理论的题目参数( 如题目难度、区分度)是通过该题的人数的平均得分率和题分与试卷分的相关计算求得的,所以会受到不同考生样本组能力水平的影响。 ( 2) 在经典测验理论的条件下,题目参数与考生得分是在不同的基础上分别求得的,所以考生能力的估计会由于测验的改变而改变。 ( 3) 经典测量理论中的严格平行测验假设和误差与真分数不相关,在 现实 中不可能实现。 化理论 概化理论的基本观点形成于 20世纪 60年代末、 70年代初。以克龙巴赫 (人的系列论文和论著的问世为标志 ,但正式提出这一理论的是 人在1972 年出版的行为测量的可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论