基于数据挖掘技术_第1页
基于数据挖掘技术_第2页
基于数据挖掘技术_第3页
基于数据挖掘技术_第4页
基于数据挖掘技术_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于数据挖掘技术

的考试评价系统的应用研究答辩人:刘雅惠指导老师:裘国永副教授2005.4陕西师范大学2002级教育硕士论文答辩报告1/12/20231主要内容一、课题研究的背景和现状二、课题研究的目的和意义三、课题研究的主要内容四、课题研究的展望2一、课题研究的背景和现状1.1教育测评的产生和发展1.2教育测评的功能1.3国内外考试分析和评价的现状1.4存在的问题31.1教育测评的产生和发展公元606年,我国隋朝开始的科举制度被认为是教育测量和评价的萌芽。由于历史原因,自恢复高考后才恢复了教育评价的研究和实践。国外是在19世纪开始发展起来的,经历了四个阶段。1、前系统评价阶段:1904年桑代克(美)《心理和社会测量学导论》2、系统评价过渡期(约1930~1957):泰勒测评的目标实现3、系统评价理论化时期(1957-1972):克龙巴赫和斯塔佛比姆强调评价的决策、鉴定和改进功能。4、系统评价专业化时期(1972年至今):强调评价是种“心理建构”过程,提倡价值多元、全面参与和共同建构。

41.2教育测评的功能目标导向功能鉴定功能诊断指导功能反馈调节功能强化激励功能教学提高功能51.3国内外考试分析和评价的现状

教学测验依然是检验教学效果和学生学习情况的主要手段之一。

目前我国中小学对于考试的分析和评价普遍存在以下几种方式。(1)在农村或经济欠发达地区的学校,主要还是手工计算学生总成绩、求均值、排名次等,处理的数据量很有限,因此评价指标也仅限于此。6

(2)在有条件的学校,教师和管理人员熟悉计算机技术后,普遍使用常用的Excel软件进行成绩的常规统计和计算,提高了工作效率。但是几乎很少涉及对试卷质量的分析和评价。

7简单易学、易操作,但是重复劳动太多界面不友好,数据完全开放8(3)在技术成熟的学校中,使用编制的程序软件,也很少有对试卷质量的分析,即使有,对试题的相关度的计算仍是采用传统的统计公式,其缺点是这些公式都要求考试成绩呈正态分布。

9分析项目过于繁琐,没有试题质量的分析101.4存在的问题

(1)重横向比较,轻纵向比较。(2)重总结性测评,轻形成性测评。(3)重考试成绩分析和评价,轻试题质量的分析和评价,在中小学这种现象尤为突出。(4)利用计算机实现考试成绩的统计和分析逐渐普及,但是评价指标的传统算法还有一定的局限性11二、本研究的目的和意义

调整教学侧重点优化教学方法和手段等考试评价系统管理者教师学生检验教学目标的落实,提供决策依据等强化激励学生的优势,转移学习重心到弱势意义:通过考试评价系统建立一套科学合理的计算机分析和评价系统,同时可以节约大量的人力、物力,提高工作效率。为推动本校教育教学信息化管理积累经验。12三、本研究的主要内容3.1基于数据挖掘技术的考试评价系统的理论基础3.2基于数据挖掘技术的考试评价系统的框架组成3.3用实验数据进行测试系统133.1基于数据挖掘技术的考试评价系统的理论基础(1)数据挖掘的概念数据挖掘(DM,DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中发现隐含在数据中的关系,建立模型,提取具有潜在价值、可信、新颖、有效,并能被人所理解的信息和知识的过程。知识发现=数据预处理+数据挖掘+解释评估14(2)教育测量和评价理论

教育测量是对评价对象(教师或学生)的现状、属性与规律做出客观的、定性或定量的描述,这种描述的结果是对测评对象的某些属性分配数值。教育评价就是在教育测量的基础上,对评价对象做出价值判断。

153.2

基于数据挖掘技术的考试评价系统的框架组成数据库服务器SQLServer2000WIDOWSXP试题质量分析和评价模块数据库管理模块学生集体成绩分析和评价模块学生个体成绩分析和评价模块应用程序163.2.1数据管理模块后台数据库(使用SQL语言建立),包括以下7张表:1、考试名称2、考试题型3、考试答案(标准答案)4、班级学号5、考试成绩(某个学生的每道题答案)6、成绩(按题型得到的该大题的得分)7、总成绩(某次考试的总分)前台用户界面:使用BlandC++语言编写相应程序173.2.2试题质量分析和评价模块1、试卷的宏观整体分析和评价指标及其意义:(1)成绩频数分布图

(2)平均分(3)标准差182、项目质量分析和评价方法:数据挖掘技术评价指标及其意义:(1)难易度(2)区分度(3)相关度19(1)难易度

其中Xi表示该大题的某个得分,Yj表示总分的某个分数段,Vij表示该大题分数为Xi且总分为Yj的人数20(2)区分度算法:极端分组法

其中和分别为高分组学生和低分组学生在该项目上的平均得分,H和L分别为该项目的最高得分和最低得分。缺点:分组的比例要根据成绩的总体分布状态来定,一般介于25%~33%之间,结果不够精确,适合一般教学测验中使用。21(3)相关度意义:确定该题得分和考生总分的相关程度,从而间接分析出本次考试学生的薄弱知识点。方法:数据挖掘技术的粗糙集算法波兰数学家Z.Pawlak于1982

年提出了粗糙集(roughset)理论,是一种分析不完整、不确定性数据的新的数学理论。优点:体现了“让数据自己说话”的思想。算法:数据预处理建立数据表属性重要性分析得到决策结果22建立原始数据表确定条件属性Ci(i=1,2,…,m)和决策属性Dj(j=1,2,…,n)计算i=1计算ifi<=m输出结果目的:分析该试卷中哪个大题得分和总分的相关度最大。因此,条件属性集合C={听力,词汇语法,阅读理解,日常交谈,学习技能,写作},为方便表示,记作:C={I,II,III,IV,V,VI}决策属性集合D按照总分排序分为5等,分别为优(10%),良(20%),中(40%),及格(20%),不及格(10%)记作:D={1,2,3,4,5}数据预处理23数据预处理后的表原始数据表243.2.3学生集体考试成绩的分析和评价模块横向比较学生集体成绩评价模块纵向比较例如:比较其平均分、标准差、成绩的分布状态等,进一步还可使用Z检验分析先把成绩经过标准化处理,再比较该集体若干次考试中的均值、标准差等的变化25是一种绝对评价,宜于诊断学生的学习困难,避免排名给学生心理带来的不利影响学生目标参照评价管理者和教师常模参照评价是一种相对评价,发现学生之间的差距,但不宜诊断学生的学习困难3.2.4学生个体考试成绩的分析和评价模块263.3测试结果分布直方图:均值:82.8方差:13.95相关度与难度系数:27四、课题研究的展望1、扩展数据库中每条记录中的信息项,以获取更多的有价值信息及预测信息。

如:增加爱好、获奖情况、父母文化程度等项目。

2、完善记录的连续性。 即记录每次测验成绩,在大的时间跨度上研究学生的发展情况。28小结本研究实现了考试成绩和试卷质量的计算机网络化和自动化的数据分析和简单的结果解释。对于试卷的质量分析和评价部分,采用数据挖掘技术的粗糙集算法,其最大优点是无需知道任何先验信息,真正体现“让数据来说话”,而且当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论