![数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-4/14/9de5875f-e350-4622-91e7-1693852393bc/9de5875f-e350-4622-91e7-1693852393bc1.gif)
![数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-4/14/9de5875f-e350-4622-91e7-1693852393bc/9de5875f-e350-4622-91e7-1693852393bc2.gif)
![数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-4/14/9de5875f-e350-4622-91e7-1693852393bc/9de5875f-e350-4622-91e7-1693852393bc3.gif)
![数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-4/14/9de5875f-e350-4622-91e7-1693852393bc/9de5875f-e350-4622-91e7-1693852393bc4.gif)
![数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-4/14/9de5875f-e350-4622-91e7-1693852393bc/9de5875f-e350-4622-91e7-1693852393bc5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 数据仓库论文数据挖掘论文:基于数据仓库模型在研究生招生管理中的应用研究摘 要:随着招生方式的多元化、自主化以及报考研究生人数的年年增长,导师如何在众多的考生中招录合适本专业发展的考生,以便能够为国家培养出优秀的人才,除了他的入学成绩、必要的复试环节、导师多年来的工作经验等这些重要因素外,还需要对考生各方面的情况进行综合测评,包括考生毕业院校、生源地、年龄。本文的目的是开发出一套合理的模型,全面推进研究生招生工作的信息化进程。本文以某学校研究生招生办公室2004年至2010年的招生、入学、选课、选课成绩数据为例,从应用的角度,以数据仓库技术为基础,利用数据挖掘进行知识发现。关键词:数据仓库;
2、数据挖掘; 招生决策随着社会的发展,竞争的激烈。人们越来越感觉到信息及知识的重要性。目前已经成为知识爆炸的时代,传统的数据库可以实现数据的增、删、改、查的功能,但无法发现数据中的内在联系和存在的规则,因此无法通过目前的数据推测出未来的发展方向。人们希望从这些数据中得到更多的启示,发现隐藏在其中的知识。面对“数据丰富,知识贫乏”的挑战,数据仓库技术应运而生。目前,大部分的高校都建立有自己的管理信息系统,随着时间的推移,也积累了大量的数据,这些数据真实地反映了高校的实际状况。如何充分利用这些数据并从中挖掘出有用的、却常被人们忽视的重要信息,发现一些随各种因素动态变化而产生的管理规则,这对于各高校各
3、个层次的决策管理者而言无疑是个值得关注的问题。一、有关研究生招生管理的相关研究目前在教育领域诸如高校招生生源决策、学生成绩分析、教学质量评测等方面对数据仓库及数据挖掘的应用都有相应研究,其它省份招生管理部门也进行了建立招生考试数据仓库的探索。而研究生招生与普通高校招生还不完全一样,不仅要分析考生的入学成绩,而且还要分析面试成绩,不仅要考虑考生的生源地,还要考虑考生的本科毕业院校,所以不能在简单基础上重新进行需求分析和系统设计,利用数据仓库和数据挖掘开发研究生招生考试决策支持系统是很有必要的。本文的研究内容从技术方面分析,建立招生决策数据仓库,确定了挖掘系统的主题,进行维度的设计划分,把各种不同
4、的源数据进行抽取、转换与加载后导入数据库,形成了数据仓库。使用聚类分析和决策树方法设计开发了数据挖掘的系统模型,对数据仓库中的数据进行了知识挖掘,找到有价值的信息,然后使用这些信息进行预测,希望能够预测出考生的研究方向。从业务流程方面分析,目前研究生招生环节主要分为初试和面试,只有初试分数达到分数线标准的才具有面试资格,目前大部分学校的复试比例 1:1.2,复试一般采用面试加考试的方式。同时考生的成绩一般和入学后的选课成绩有一定的联系,本文研究内容之一便是根据考生的入学成绩预测出其入学后的选课成绩,从而预测该学生在本专业以后的发展前景。本文在深入研究了数据仓库及数据挖掘技术的基础上,对历年研究
5、生招生和管理的成绩进行建模分析,找出一定的规律,并主要使用了决策树和聚类分析算法进行分析。本文的研究意义在于研究生招生是选拔高层次专门人才和拔尖创新人才的重要途径,按照党的十七大提出的建设人力资源强国和创新型国家的要求,深入贯彻落实科学发展观,全面提高研究生选拔质量。结合各专业特点,研究提出科学、合理的招生工作内容体系和标准,体现研究生导师在研究生招生工作中的权利和责任;进一步完善工作方法,规范工作程序。提高生源质量已经成为招生管理部门以及导师面临的重要问题。需要开发出一套合理的模型,为招生管理部门提供依据,为导师提供参考,同时也为考生在复试进行专业选择时作为指导。二、基于数据仓库的研究生招生
6、管理的研究方法本文实现的招生管理挖掘系统综合了以前诸多部门的各种不同的系统,是一个系统的融合,这样做不仅使得管理操作统一、界面相同,更重要的是使得各项不同的数据能够保存在一个数据仓库系统中,共用相同的数据结构,以便更加方便地利用数据挖掘算法进行分析。同时本文采用的决策树和聚类分析挖掘算法是最常使用的挖掘算法,它们高效、简单,能够快速地得出知识信息,并且能够以清楚简单易于理解的方式显示给用户。最后,系统以一个简单的界面提供给使用者,使用者可以采用两种方法进行验证和查询。如果是大量的考生信息,可以采用把考生信息保存在文件中,然后系统将对文件中的每个人的信息进行计算和分析,并把分析结果保存在特定的地
7、方。如果是少量的考生信息,系统提供了输入界面,对学生进行分析。如图1所示。从中可以看出,该系统的数据源来自不同的数据库,根据多种数据源进行数据整合、分析、处理,构造出8个不同的立方体,然后进行etl处理开发,形成数据仓库。核心业务层包括入学成绩管理模块、招生挖掘模块、考试成绩管理模块、招生挖掘预测模块。核心业务层是该系统的主要完成的功能。入学成绩管理模块负责一般的事务性处理工作,主要负责考生的入学成绩及相关的考生信息等;考试成绩管理负责学生入学后的选课和考试成绩;招生挖掘模块是重要的模块,它能根据入学信息和考试信息挖掘出有价值的信息;招生挖掘预测模块能够根据考生的入学成绩预测出该生入学后是否能
8、有较大的发展,以便辅助招生决策。最后,系统通过门户集成发布到内网上,以方便多人能够同时进行工作,提高工作效率,并且可随时随地进行查询。数据仓库主要是满足决策分析的需要,将来自各种数据源的数据存储到数据仓库中,数据围绕决策主题来组织的,并且对数据查询的要求比较高,数据存储量非常大。数据仓库建模采用自上而下的三级建模方式,即概念建模、逻辑建模、物理建模。现在比较流行的建模方式是以信息打包方法为主的概念建模方式,以星型建模方法和雪花建模方法为主的逻辑建模方式,以3nf和星型建模方式为主的物理建模。由于当前正在运行的管理系统都是独立开发的,所使用的数据库多种多样,简单的有excel、access,复杂
9、的如db2,oracle,sqlserver等,这些都是异构数据,数据仓库的构建需要充分考虑到这些原始数据的不同。首先是得到各种不同的数据源。例如,招生信息、院校信息等是从招生办得到,学生考试信息、学生入学信息等是从培养处得到,两种分别是excel和sqlserver格式的。创建数据仓库最重要的一个步骤是将数据从各种操作型数据系统中抽取出来(extracting),排除数据中的数据缺陷,完成一系列转换(transforming)、汇总,最后将数据加载到数据仓库(loading)。如图2所示。三、数据挖掘及实证分析本文分别使用聚类分析和决策树方法设计开发了数据挖掘的系统模型,对数据仓库中的数据进
10、行了知识挖掘,找到有价值的信息,然后使用这些信息进行预测,希望能够预测出考生的成绩。首先使用sqlserver management studio整理好数据,然后利用sqlserver business intelligence development studio 中的相关算法和规则进行部署,接着作出评估解释,并且取一部分数据进行验证,最后用于我们的招生中,为招生提供依据。 business intelligence studio 不仅能够对数据进行挖掘,还能够对挖掘的结果进行评价。根据评价结果得知,决策树的得分为4.08,而聚类分析的得分为1.12,均为理想预测。四、小结对招生管理系统的需
11、求进行了调研,根据不同区域、不同专业进行认真分析,详细完成调研报告,对原始招生管理系统中的数据特点进行了详细的分析、归纳、整理,设计并制定了招生决策数据仓库的方案。研究了数据挖掘的几种常见算法如聚类分析和决策树算法,根据这些算法设计出了数据挖掘的模型,对数据仓库中的数据进行了挖掘,并对系统进行测试,获得了招生决策所需要的关键知识,并把这些知识用于实际的招生管理工作中,以验证其是否能够起到积极的作用。但是目前的考量因素存在比较大的局限性,还需要考虑学生的上学经历,家庭背景,性格特征等方方面面的原因,更多因素考虑在随后二期项目研究中完成。随着数据的进一步获取,后续将对业务数据进行数据挖掘,拓展业务
12、模型功能。数据仓库与数据挖掘在研究生教育管理领域的应用是一个综合复杂的系统工程,招生决策只是其中的一个方面。构建开发一套完整的基于数据仓库的研究生招生决策支持管理系统,将有效地推动招生的深化改革,使高校招生逐步走向信息化、科学化,为国家发现并培养人才。参考文献:1william h.inmon,王志海.数据仓库.机械工业出版社,2006:25402王永红.数据仓库生命周期工具箱:设计、开发和部署数据仓库的专家方法.电子工业出版社,2004:34553安淑芝.数据仓库与数据挖掘.清华大学出版社,2005:21344王彦龙.企业级数据仓库原理设计与实践.电子工业出版社,2004:42455于宗民,刘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届高考英语读后续写说课稿 追车人
- 2025SRV汽化烟道热喷涂合金防护层施工合同
- 2025民间融资合同范本
- 14《母鸡》(说课稿)-2023-2024学年语文四年级下册统编版
- 2025年驾校培训合同范本
- 2025商品购销合同(超市类)
- 2024年五年级数学下册 一 图形的运动(二)1.2画对称图形说课稿 冀教版
- 2024-2025学年高中历史 第一单元 第一次世界大战 第2课 惨烈的四年战事教学说课稿 岳麓版选修3
- 陶土板幕墙施工方案
- 游乐场植物墙施工方案
- 消防器材与消防设施的维护与检查
- 2024年度碳陶刹车盘分析报告
- 四川省绵阳市2025届高三上学期第二次诊断性考试语文试题(含答案)
- 2025年1月 浙江首考英语试卷
- 2025年1月广西2025届高三调研考试英语试卷(含答案详解)
- 质检工作计划书2025质检部工作计划范文
- 《复旦大学》课件
- 《缠论的实战技法》课件
- 承包鱼塘维修施工合同范例
- 耶鲁综合抽动严重程度量表正式版
- 2024年浙江省公务员录用考试《行测》题(A类)
评论
0/150
提交评论