版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 .DOC资料. 摘 要基于数据仓库的高职教务管理系统的设计与实现随着数据库系统的广泛应用,数据规模与日俱增,从大量复杂的业务数据中更加有效的分析提取可用的信息就变得尤为重要。从当前的发展趋势上看,数据处理的侧重点己从传统的业务过程的实现逐步扩展到对业务数据的联机分析处理,并从中得到用于统计和决策的信息,因此决策支持系统便应运而生。数据仓库技术经过多年的发展,已变得比较成熟,近些年,出现了基于数据仓库技术,并运用联机分析处理技术(OLAP)和数据挖掘工具的决策支持系统(DSS)。数据仓库技术、联机分析处理技术和数据挖掘技术的应用,对决策支持系统起到了有力支撑作用,他们的结合成为了决策支持系统研
2、究的热点和重点。本文回顾了数据仓库的结构、数据组织及相关技术的发展,对基于数据仓库的决策支持系统体系结构的理论与难点进行了分析,并对其中的设计方法、实施策略等数据仓库建设方面的关键问题进行研究。通过对系统的分析和设计,提出了符合高职教务管理实际的数据仓库设计和实施方案。成功解决了在数据分散、数据量大、基础环境复杂的环境中数据抽取的问题,并对得到的数据进行转换和清洗,将数据加载到预先定义好的数据仓库模型中。最后以决策需求为基础,从业务分析的角度作为切入点,选用SQL Server 2000构建数据仓库,选用Analysis Services 2000对OLAP应用进行实现。通过本课题研究的工作,
3、建设了科学合理的高职教务管理数据仓库,有效地促进了高职信息化的发展和数据的综合运用能力,使得高职管理和决策的合理性和科学性得到了增强,具有非常现实的意义。关键词:数据仓库;决策支持系统;教务管理AbstractThe Design and Implementation of An Teaching Management System Based on Data WarehouseWith the widespread use of the database system, the scale of data is increasing rapidly, its very important t
4、hat we can extract effective information from a large number of complex business data. In the view of the current development trends, the focus of data processing has developed from the traditional business process to the progressive extension of the business data on-line analytical processing, and
5、to obtain information for statistical decision-making support system will therefore be shipped. Data warehouse technology has been developed for many years, it become more mature in recent years, there has been the system that based on data warehouse ,online analytical processing application (OLAP)
6、and data mining tools, it short for decision support system (DSS). Data warehouse, online analytical processing and data mining technology, decision-making support system has played a strong supporting role, and their combination into a decision support system becomes the focus and emphasis of the s
7、tudy. This paper reviews the structure of the data warehouse, data organization and related technology development, Data warehouse-based decision support system architecture and the difficulties of the theory are analyzed, and one of the design method, implementation strategy the key to building the
8、 data warehouse issues. Through systematic analysis and design meet the Educational Administration proposed the actual data warehouse design and implementation. Successfully resolved in the data dispersion, data volume, complex environments based on environmental issues in the data extraction, conve
9、rsion and data obtained and cleaning, to load data into predefined data warehouse model. Finally, decision-making needs, based on analysis from a business point of view as a starting point, the choice of SQL Server 2000 to build a data warehouse, use Analysis Services 2000 OLAP applications realized
10、. We have built a scientific and rational educational administration data warehouse through this research work, and promoted the development of university information and data on the integrated use of capabilities effectively. The rationality and scientificalness of the University management and dec
11、ision-making have been enhanced, The research is with very real sense. Key words: Data warehouse, Decision Support System, Teaching Management目 录 TOC o 1-3 h z u HYPERLINK l _Toc316031439 摘 要 PAGEREF _Toc316031439 h I HYPERLINK l _Toc316031440 Abstract PAGEREF _Toc316031440 h II HYPERLINK l _Toc3160
12、31441 目 录 PAGEREF _Toc316031441 h I HYPERLINK l _Toc316031442 第1章绪 论 PAGEREF _Toc316031442 h 1 HYPERLINK l _Toc316031443 1.1选题背景及意义 PAGEREF _Toc316031443 h 1 HYPERLINK l _Toc316031444 1.2国内外发展现状 PAGEREF _Toc316031444 h 2 HYPERLINK l _Toc316031445 1.3论文研究内容及意义 PAGEREF _Toc316031445 h 4 HYPERLINK l _T
13、oc316031446 1.4论文安排 PAGEREF _Toc316031446 h 5 HYPERLINK l _Toc316031447 第2章教务决策支持系统的需求分析 PAGEREF _Toc316031447 h 6 HYPERLINK l _Toc316031448 2.1项目情况分析 PAGEREF _Toc316031448 h 6 HYPERLINK l _Toc316031449 2.2项目难点分析 PAGEREF _Toc316031449 h 8 HYPERLINK l _Toc316031450 第3章教务决策支持系统的设计 PAGEREF _Toc31603145
14、0 h 10 HYPERLINK l _Toc316031451 3.1系统总体框架设计 PAGEREF _Toc316031451 h 10 HYPERLINK l _Toc316031452 3.1.1多维数据集创建 PAGEREF _Toc316031452 h 10 HYPERLINK l _Toc316031453 3.1.2数据采集模块 PAGEREF _Toc316031453 h 10 HYPERLINK l _Toc316031454 3.1.3系统开发模块 PAGEREF _Toc316031454 h 10 HYPERLINK l _Toc316031455 3.1.4数
15、据仓库的设计 PAGEREF _Toc316031455 h 11 HYPERLINK l _Toc316031456 3.2数据仓库方案设计 PAGEREF _Toc316031456 h 13 HYPERLINK l _Toc316031457 3.2.1自底向上法 PAGEREF _Toc316031457 h 13 HYPERLINK l _Toc316031458 3.2.2自顶向下法 PAGEREF _Toc316031458 h 13 HYPERLINK l _Toc316031459 3.2.3混合法 PAGEREF _Toc316031459 h 13 HYPERLINK l
16、 _Toc316031460 3.3数据仓库架构结构 PAGEREF _Toc316031460 h 14 HYPERLINK l _Toc316031461 第4章基于数据仓库的教务决策支持系统实施 PAGEREF _Toc316031461 h 16 HYPERLINK l _Toc316031462 4.1业务模型的分析 PAGEREF _Toc316031462 h 17 HYPERLINK l _Toc316031463 4.2业务模型与关系模型的映射 PAGEREF _Toc316031463 h 19 HYPERLINK l _Toc316031464 4.3数据仓库的建设 PA
17、GEREF _Toc316031464 h 20 HYPERLINK l _Toc316031465 4.3.1维表 PAGEREF _Toc316031465 h 20 HYPERLINK l _Toc316031466 4.3.2事实表 PAGEREF _Toc316031466 h 22 HYPERLINK l _Toc316031467 4.4 数据的抽取、转换和装载 PAGEREF _Toc316031467 h 26 HYPERLINK l _Toc316031468 4.5 OLAP 应用程序的开发 PAGEREF _Toc316031468 h 26 HYPERLINK l _
18、Toc316031469 4.5.1 分析立方体的建立 PAGEREF _Toc316031469 h 27 HYPERLINK l _Toc316031470 4.5.2 分析立方体的简单使用 PAGEREF _Toc316031470 h 27 HYPERLINK l _Toc316031471 4.5.3基于Web的OLAP应用程序设计 PAGEREF _Toc316031471 h 28 HYPERLINK l _Toc316031472 第5章 结论与展望 PAGEREF _Toc316031472 h 30 HYPERLINK l _Toc316031473 参考文献 PAGERE
19、F _Toc316031473 h 32 HYPERLINK l _Toc316031474 致 谢 PAGEREF _Toc316031474 h 34第1章绪 论1.1选题背景及意义教务管理工作作为高等学校教学管理的核心工作,负责学生的学位管理、成绩管理、学籍管理;具体指导校教学督导组的工作担负教室调度、全校的排课、全校日常教学的动态管理,组织各院、系、教学部(室)的教学评估;组织各学院、研究所制定各专业的教学大纲、教学计划、培养方案,编制每学期的开课计划,检查执行情况;与各个学院和相关部门配合,对学生的社会实践、实习、生产劳动进行安排,这些工作即琐碎又繁杂。伴随着我国高等教育的深化改革,
20、国家不断加大教育投资。高等教育管理思路出现了百花齐放的局面,无论是从学分制的改革,还是自我管理的实行,再到学生网络选课的实行,我国的教务管理的方方面面都在发生深刻的变化。随着教务管理的不断深化,出现了许多新的管理办法和手段,比如,实时数据报表,信息管理等,这些方法和手段的出现,是教务管理由过去的人工处理转变为了高度的信息化和集成化,充分体现了我国高等教育发展的崭新思路。于此同时,这些新方法和手段的推出,如果以传统的管理模式来进行,将很难达到要求,这时就需要我们利用先进的信息化手段,以网络技术和数据库技术为支撑,充分发挥先进技术的优势,并把这种优势引入到教务管理中。正是这种需求的存在,使得教务管
21、理的系统的开发工作变得尤为迫切,教务管理系统的开发工作在这一需求的推动下,取得了较快发展,各高职通过教务管理的使用,使得教务管理工作取得了长足的进步,办公的效率大大提高,工作也变得更加顺手,教务管理系统的应用还可以使分散的教务数据得到集中管理,对提高管理水平、减轻管理负担有很大的帮助。正是由于教务管理的具有的优势和特点,各个学校都加大了对教务管理系统的开发力度,投入了大量的人力和物力,在较短的时间内,各种教务管理系统便相继开发出来,并得到广泛使用。这些管理信息系统大多都是通过现代的信息化手段,并使用数据技术,实现了各种复杂的功能,并针对教务管理这一特定的领域而开发。这些系统对各个学校的教务管理
22、工作起到了较大的辅助作用,并得到了广大教务管理工作人员的肯定和欢迎。1.2国内外发展现状国外对高职管理信息系统的研究工作开展得较早,早在上个世纪六七十年代,国外变开始了这方面的研究,时至今日,已经比较成熟。由于我国信息技术的相对滞后性,导致我国的教务管理研究工作开展得就比较晚一些,从上个世纪七十年代开始,各个高职才开始教务管理系统的开发工作,尽管经过了多年的快速发展,但由于各个方面条件的制约,我国的教务管理系统与发达国家相比,仍然存在不小的差距,这里既有教务管理观念上的原因,也有信息技术上的原因。概括起来,我国的教务管理信息系统的研究和开发工作大致经历了以下几个阶段。阶段一:探索阶段,时间大约
23、从上个世纪的70年代末到八十年代初。在这个阶段主要以程度各不相同的应用汉字信息处理技术为主要特征;应用某些办公设备;并在此基础上,对局域网技术进行研究,引进局域网设备,并将之应用到有关的软件和系统中,这时的应有主要在很小的局部范围,通过各种设计语言和数据技术的应用,实现单向业务的管理信息系统。阶段二:开创和见效阶段,时间从1986到1992,这一阶段的重要进展表现在由分散开发走向统一规划、有计划的实施;系统建设的标准化、规范化工作开始起步。在这个时期,局域网和pc技术取得了快速发展,其性能不断提高,而且也趋于成熟。各个高职开始研制自己的单机单项业务的系统,在部分高职中,还建立的专门的信息研究机
24、构,在某些高职,还建立的自己的局域网,并取得了较好的效果。阶段三:系统集成发展阶段,时间从1993年到现在。在这一阶段,大型数据库系统、性能卓越的操作系统投入使用。pc机的性价更高,各种高性能的服务器和工作站降级问世,互联网技术和网络产品也日新月异,我国的校园网建设也初见成效,其中具有里程碑意义的是我国教育科研计算机网络的建成并通入使用,我国的教务管理系统开始逐步走向集成化综合化,这些都对我国教务和科研事业的发展起到了积极地促进作用。更值得一提的是,我国教育网的建设是由全国十所重点大学共同完成的,这充分表明我国高职在信息化建设中所取得的成就,这些都推动了我国教务管理的发展,并为教务管理的发展奠
25、定了坚实的基础。近些年来,随着我国教育体制的改革的不断深化,我国教育事业取得了长途发展,在改革的大背景下,在吸取和学习国外优秀的教育、教学模式的前提下,将国内多年的办学经验与国外的教育模式进行有效结合,最终探索出适合中国教育发展的全新的教学模式。伴随国内各个学校办学规模的扩大以及学校招生人数的几何式增加,各学校对于日常的管理工作中的信息量、工作量也带来严峻考验。极大增加学校管理负担。因此,对学校如何进行有效的管理得到了教育主管部门的极大重视。根据国内诸多学校的现有的管理方式,并同时对国际新的思想理念进行融合,如何在校园一体网络的背景下下建设领先的、与国际接轨的业务管理平台,如何提高和加强学校现
26、代化管理水平,成为学校最需要解决的首要问题,也是现阶段各个学校继续实现的紧迫任务。本文设计实现的学校教务管理系统已经从原有的单功能想现在的多功能发展过渡,以及逐步走向学校管理的信息化、标准化、系统化。只有这样才能追赶上发达国家的教育步伐,逐步缩与他们之间的差距。伴随教育机构,尤其是各个学校教务管理系统的飞速进展,一般性的业务系统已经趋于成熟,在这样的背景下,学校的教务管理工作已经不单单满足于对数据的一般性的查询和处理,而且随着系统应用,其数据量也逐年增加,面对大量的数据,迫切需要对这些数据资源进行系统的分析和处理,同时将这些信息进行等价转换,这样才可以使得我们预测学校未来的发展和改革,为决策提
27、供一定的帮助与服务。也正是基于以上原因,对现有的网络资源和教务管理系统进行整合,建设高度信息化和网络化,具有分析和决策能力的系统的新思路和新方法变被迅速提了出来。面对迫切的需求,各个学校都开始了各自的尝试,然而,面对的现实却是,要对现有的教务管理信息系统进行改造,以实现辅助分析和决策时相当困难和复杂的。原因如下:第一,各个学校都存在这各种基于不同应用的专用子系统,比如,排课系统,教师管理系统,科研管理系统,学籍管理系统等,这些系统往往都是不同时期开发的,其应用平台和所运行的环境都存在着较大差别,具有源头多样化、缺乏准确性,主题不突出的特点,而且其数据结构也存在差异,这就给数据的采集和集中管理带
28、来了很大的麻烦。第二,经过多年的积累,各个系统都有很大的数据量,不同的系统的数据很难集成,其数据的访问性能也大大降低,系统的开销也很大。第三,以往开发的子系统主要是面向事务型的,在其基础上开发基于联机分析的辅助决策系统就变得尤为困难。随着数据仓库技术的不断发展,近年来逐步成为了研究的热点话题,在商业应用中得到了广泛的应用,但其应用范围主要集中在商业领域,在其他领域的应用比较少。因此,该数据仓库的设计为基础的教育管理系统是一个学习和探索的过程。由于本系统的研究和开发时间有限,加之缺乏相关经验,系统还存在着不健全的一些地方,有些问题不能准确地解决。主要表现在以下几个方面:首先,优化数据仓库和OLA
29、P多维数据集。应用程序主要是本科层次的发展,学术资料,数据量相对较小,优化的考虑是不够的。尤其是前者,当数据不显示查询优化方案的制定。当涉及到过多的数据量,系统的性能有所下降。其次,现在的SQL Server数据库系统的基本使用方法,以及大量的各类管理信息系统数据库格式和种类,如何实现异构数据源的操作的发展的不同阶段将是一个自动化程度高是一个非常重要的方面。同样,这在数据仓库应用系统,侧重于OLAP应用研究,应用数据挖掘研究不够深入。在系统开发应用程序的数据基本上仍停留在数据挖掘的表面,还没有进行深入的研究工作。这是系统接下来要研究的重点。直白一点地讲,数据仓库其实就是一个堆放所有数据的地方,
30、之所以将数据都堆在一起,就是为了从中间能够找到一些有价值的东西。数据仓库事实上更多的是一个概念,因此,不能把数据仓库想成一些号称属于数据仓库的软件产品。数据仓库在物理上就是一个数据库。相对业务的系统数据库叫做OLTP数据库(一般都是用于业务处理),这种数据库通常叫做OLAP数据库(一般都是用于业务分析)。通过对本课题的具体研究,笔者认为数据仓库的概念就是主要针对下面几个基本需求所产生的:学校的业务系统很多,其业务系统的历史数据是不方便查询。不同的业务系统之间往往管理部门也不同,地域也不同。能不能将这些所有得数据集中起来,再进行筛选看有没有一些有意义的业务规律。数据仓库数据库通常都是很大,因为学
31、校所有的数据集中越多,越会有价值的发现。数据仓库的组成比较繁杂,既有一些业务系统的历史数据,又有财务、人事数据,还要自己建一些数据,例如,教学资源信息、公共假期数据、学校信息等等。数据仓库的概念包含了从业务生产系统进行采集数据的程序,这个程序还不能影响到具体的业务系统运行。(属于 “ETL”过程)数据仓库包括业务系统长期的历史数据。(所谓“ODS”数据)数据仓库包括针对某相业务值(例如学生人数)重新打上标签的业务流水数据。(所谓“事实表”、“维度表”)。数据仓库概念兴许还包含报表生成工具(所谓“BI”工具)。这些工具能够达到几年前所谓DSS(决策分析)的效果。1.3论文研究内容及意义本课题研究
32、意义重大,通过对本课题的研究,我们从理论上与实际上提供一套非常科学的管理方法和系统工具,这二者对各个高职进行全面的数据维护、机器互联分析以及数据挖掘等提供一定意义上的参考。对于高职数据仓库的合理、科学的建设,大大提高了高职管理信息以及数据利用的业务处理水平,增加了系统管理决策的科学性和合理性。最后,还可以将最终的实现结果推广且应到其他领域、其它行业。课题的现实意义重大。本文的研究内容:(1)教务管理现状的分析与研究。(2)对现有数据库技术进行分析与研究。 (3)教务管理系统数据仓库的建立。(4)对数据仓库中的数据进行联机分析。(5)研究和探讨基于数据挖掘知识发现技术的实现。1.4论文安排本文的
33、研究工作主要以数据仓库的建立和决策分析系统的开发为主,全文共分为六章:第一章:绪论,在本章中,阐述了基于数据仓库的高职教务管理系统的课题来源和研究现状,介绍了本文的研究背景和相关的研究内容。第二章:数据仓库技术概述,概述了数据仓库技术的发展历程,概念以及其主要特征,重点介绍了数据仓库的数据管理和组织,对数据仓库的体系结构和数据的仓库的分析做了较为深入的介绍。第三章:基于数据仓库的决策支持系统。在本章的开始,首先分析了现有决策支持系统各类问题的存在,然后对基于数据仓库的决策支持系统的体系架构进行了深入探讨和研究。在本章后半部分,阐述了数据仓库的建库策略以及建库手段。第四章:本文的设计主要基于对教
34、务决策的支持进行了详尽的系统分析,通过有效分析和讨论,抓住项目至高点,同时基于系统的总体框架的设计,对本部分开展了有针对性的设计。第五章:对系统决策支持系统的实施中,首先,对基于数据仓库的业务系统分析的整个过程进行了详细论述。本章还采以关注的对象为条件和基础,采用多维数据对整个数据仓库进行系统、科学地设计,最后对系统数据信息进行OLAP分析处理。第六章:本文总结和系统展望,总结了本文的全天工作,展望系统下一步的开发。第2章教务决策支持系统的需求分析2.1项目情况分析各高职都在不断地对信息化工作进行有益的探索,以求寻找出一条适合自身发展的信息化之路。目前,各个高职都能把丰富教育网络资源和交互式和
35、专业性的校园网资源应用到教学、科研、和管理中来,其中,教务管理作为学校工作的核心,更是走在了信息化的前列,在实际的应用中,把对学生,教师,管理人员的管理有机结合,使得教育质量大大提高。经过多年的积累建设,各高职都已建成了符合自己教学实际的教务管理信息系统,实现了从选、排课管理的课程管理,到学籍管理,成绩管理,考试管理的学生管理,与此同时教师管理、奖惩管理,信息管理,毕业生审核等也取得了一定的成效。使得管理部门的压力得到了很大的缓解。图2.1 高职教务管理图2.2 现有教务管理系统构架随着教务系统的广泛使用,人们已经不再满足于对复杂事物型数据的简化,更加迫切希望对数据进行综合分析和决策分析,然而
36、以目前的事务性教务管理系统很难解决这一问题,其原因在于以下几点: (1)事务处理与分析处理无论在行文模式上,还是在性能上都存在着较大的差异。将处理性能相差很大的两种应用置于同一环境下运行显然是不合适的。(2)拥有正确的全方位的数据是进行数据分析和决策的先决条件,只有有关数据收集得越全面越完整,我们才可能得到的可靠的分析结果。但就目前情况而言,大多数数据都是较为分散的而且还处于非集成的模式下。(3) 对现有数据源中的数据进行转化是动态的数据集成对数据的基本要求,只有达到动态的数据集成才可以把分析结果及时反映给决策者。显而易见,目前的教务管理系统以事务处理为主,不可能具备动态集成的能力。(4)动态
37、数据分析在空间上和时间的广度上对数据的要求都很高,而对于传统的事务处理环境来说,其数据处理只是在一段时间内进行,在这一点上就无法满足分析的要求。(5)在一般情况下,动态数据分析在分析以前,需要综合利用细节数据,而目前,事务处理的教务管理系统,为了提高存储的效率,通常不具备这方面的能力。由于存在以上的问题,所以本文提出在实施过程中将数据仓库技术应用于教务决策系统中,以现有的教务管理系统为依托,对其数据进行分析处理,使得高级教务管理人员对学校的教学情况有比较深入准确的了解,还可以对教学的最新动态进行跟踪监控。通过这一系统,教务管理人员可以比较以往发展的历史和趋势,使资源得到合理的调配。2.2项目难
38、点分析经过普遍调查,发现目前国内的教务管理系统大多还是处于事务管理的实施应用阶段,还没有一套完整的决策分析系统供决策者使用,特别是动态的决策分析系统更是少之又少。通过对国内外的研究应用情况进行分析和比较,我们认为本项目的研究与实现的难点存在于:(1)教务数据量大:对于一个万人校来说,其一个学期的课程信息以及每年的学生信息就超过十多万条,而且经过多年的积累,教务管理所涉及的数据量已达到相当大的规模。仅仅数据库文件的大小就有10G的大小。大量的数据对于数据挖掘算法和服务器性能都提出了较高的要求。(2)数据不完整:由于目前各个高职的教务管理系统是逐步开发使用的,经过了多次的版本升级和更替,不同的系统
39、运行于不同的网络环境,系统的功能和数据的格式也是千差万别,这就使得积累起来的数据是分散的零散的,而且有些时候还是前后不一致的,其完整性规范性一致性比较差。(3)行之有效的使用数据挖掘的方法:是整个系统的核心,包括决定如何产生假设;如何选择合适的工具;如何发掘知识;如何验证发现的知识。就本系统而言,有效使用数据挖掘方法,实现快速分析是本项目研究和实现的困难所在。(4)良好的结果表达形式:具有良好的数据表达方式是我们的最终目的,也是系统开发是否成功的标准,决策分析的目的就是能够为决策者提供直观,便利的分析结果。我们通过对用户的需求进行仔细的分析过滤,得到有价值的信息,并通过良好的人机界面将结果输出
40、,再加之应用生动的表现形式,对结果进行解释和表达,从而达到方便决策者的目的。再有就是系统建立后测评指标的建立,当前针对数据仓库平台为主要评价指标分为两种:(1)TPC-DTPC属于国际组织,它是由像惠普、IBM微软、Sun和其他跨国公司这样的45个成员公司组成。在多个不同类型的应用程序中负责所有的开放式平台,并开发一个更具体的统一,公平的测试标准。联机事务处理系统,TPC-C是一个衡量主要性能指标的数据库,数据仓库系统,测量其数据库的性能指标TPC-D.主要有三个方面的具体因素:第一、系统的描述,第二、查询处理能力,其描述了系统在不同的用户在同一时间的具体查询时,处理能力即流试验结果。换句话说
41、,代表了整个系统的并行处理能力。第三,是描述的性能价格比。理论和现实之间,前面指标数据如果效果较好,而最后一个如果较小的效果会更好。当然,首先是考虑企业不能满足特定需求。每个供应商的TPCC和TPCD详细描述所有码在互联网网页内容的发现。此外,还从微软和其他一些公司的网页,也可以发现TPCD的测试结果。虽然描述了整个系统的并行处理查询请求特定的能力,但并非所有供应商流量测试可以在多用户的状态可以进行。因此TPCD各个供应商有一个明确的选择:要么直接对应的用户一定的条件下流动试验;无论是在第一个具体的单用户状态,根据具体的试验,最后用实测的处理能力的具体指标qppd和流量指标计算公式计算得出qt
42、hd来区分这两者。各种测试的结果表明许多行业存在的问题,事实上,只要tpc-d测试总结下载并打印出来,所以你可以看到在测试时间的流实际数量。流的数量实际上是代表同时提交的查询请求所有用户数。如果属于单用户状态下的测试,只找到一个特定的流。第3章教务决策支持系统的设计3.1系统总体框架设计在前面的章节中,我们曾介绍过现有的较为典型的数据仓库结构模型,而本系统是以数据仓库为基础,所以本系统的总体结构与前面章节介绍的结构类似如图4.1所示,在整个系统中,按其功能分为三个模块:数据仓库和多维数据集创建和管理模块,数据采集模块以及OLAP应用系统开发模块。下面分别介绍各个模块的主要任务:3.1.1多维数
43、据集创建在该模块中,我们选取中间数据库作为数据源,数据仓库以主题创建。根据一定的层次聚合、汇总数据仓库中的数据,以构成信息分析的多维视图。最后,通过以一定的存储模式,将得到的多维视图存储在OLAP服务器中。3.1.2数据采集模块该模块的主要任务是根据已确定的决策分析的主题域采集原有各教务管理系统中的相关业务数据,经过整理后存入数据仓库。在这里我们建立了一个中间数据库,将OLTP数据库上与数据仓库主题有关的数据增量更新到中间数据库,使对OLTP数据库的效率影响降到最低。并在数据采集过程中根据将要建立的多维结构特性调整部分数据。3.1.3系统开发模块满足管理人员决策分析的需求是构建数据仓库的目的。
44、联机分析处理模块的主要职责就是要完成对多维信息的显示分析和处理工作,主要包括对多维数据集成维度信息、层次信息、方体信息、度量信息的显示,从而可以实现对数据立方体的数据浏览;并可以实现对数据的钻取、切片、切块、旋转等多维分析操作,在此基础上提供多种查询方式,查询结果以WEB网页的形式展现,以实现B/S(Browser/Server)形式的联机分析,全面支持决策分析。3.1.4数据仓库的设计业务系统ETL(DTS)原始数据库事实数据库OLAP前端报表。业务系统就是用户的Oracle数据库了,里面有一些业务数据,此外还有一些二进制话单文件。ETL过程就是一堆存储过程(维度的抽取、原始数据的抽取、事实
45、数据的日结),然后通过DTS任务包调度起来。原始数据库就应该是ODS数据库了,负责把数据原封不动的从业务系统抽取过来(部分也经过转化和清洗);出于对SQLServer2000性能的考虑,将每个业务数据表都分成历史表和当前表,当前表根据数据量的情况决定保留数据周期并定时转移到历史表中。事实数据库保存着聚合信息的数据,完成KPI指标的计算,以及维度的抽取工作;同时在进行聚合的同时完成数据清洗工作。其实清洗很简单的,就是对NULL的处理,没有对主外键的判断,维度的处理仅作更新和插入处理,来保证外键数据的匹配。不过 SQLServer2000的性能不是很理想,大于1000万的数据表处理的效果不是很好,
46、只好建了许多了分区表(实际上就是每个月一张数据表,用视图Union起来,这也是微软推荐的方式)。对于业务数据到原始数据的处理,完全采用增量抽取的原则(因为每个表都有了时间点);对于原始数据到事实数据的处理,则增加了一张log表,记录每次抽取的周期、跨度、与当前时间的差距和状态等等。对于OLAP的增量处理也是靠一张日志表决定处理的范围。唯一比较独特的可能是部分业务数据用户可能会更新,需要重新抽取、聚集和OLAP处理,这个时候在处理之前首先删除这段时间的数据,重新抽取、聚集和OLAP处理,当然是靠脚本来完成的。图3.1 系统总体构架项目系统中数据处理流程为:(1)数据采集系统根据己确定的决策分析的
47、主题域,首先将OLTP数据库中所需的数据导入中间数据库。(2)以中间数据库为数据源,对数据进行抽取、转换、清洗等操作后存入数据仓库。(3)通过OLAP工具将数据仓库的数据多层次分类汇总,从而建立多维数据模型,并存储在OLAP服务器中。(4)最后开发OLAP应用系统将数据灵活地呈现给用户。3.2数据仓库方案设计数据仓库就是决策支持系统的基础,是整个决策支持系统的核心,根据系统总体框架设计,本决策支持系统是基于数据仓库的,设计、开发、实施数据仓库将对最终能否实现为用户提供有效的决策支持信息的目标产生影响。数据仓库是一个面向分析型处理的数据环境,这就决定了其设计工作与数据库的设计有着显著的不同,无论
48、是从数据组织,还是从数据处理与传统数据库都有较大的区别。数据仓库的构建是一个不断循环、反馈而使系统不断增长与完善的过程。根据目前的对数据仓库的研究结果,数据仓库设计方案一般分为:233.2.1自底向上法我们从数据的底层开始,第一步先建立数据集市,第二步,将其中的数据集成到数据仓库中,将数据从操作型系统进入预处理层,第三部直接进入独立数据集市。这些数据集市最终集成为全局的数据仓库。因为在建立部门数据集市时只需要较少的人做决策,解决的是较小的问题,因此这种方法的优点是:初期投资小,见效快。但是这种方法同样存在缺点,它的主要确定是缺乏对独立数据集市的构造的控制,对数据集市的集成以及日后集成到全局的数
49、据仓库大为不利。3.2.2自顶向下法与自底向上法不同,在自顶向下法中,首先先建立数据仓库,第一步,利用其中的数据建立一组相关数据集市。这样,数据从操作型系统中进入预处理层,第二步,再去处理斟酌进行数据的集成和转换,第三步,数据被导入数据仓库中,然后进入数据集市。由于全局的数据仓库系统的创建,使得相关数据集市的构建都是以数据仓库中的信息为基础,从而为数据集市技术的使用提供可靠的方法这种方法,其优点是:这是收集、建模和实现最终用户决策支持需求的严格而又普遍的方法。这种方法的缺点是:开发时间长,成本高。3.2.3混合法针对以上两种方法的优缺点,后来人们提出了一种将两种方法优点基于一身的方法,混合法。
50、既能保持自底向上方法一样快速实现和立即应用又可以利用自顶向下方法有计划的战略性的特点。在混合法中,数据仓库的开发采用迭代的方法。在所建立的数据仓库系统中通常都包含直接从预处理层获取数据独立的数据集市。在数据仓库中保存并管理统一的信息模型作为在数据仓库中数据集成的关键。当建立新的独立数据集市或增加一个新的相关数据集市时,就要更新信息模型。它代表了数据仓库系统的唯一信息来源,同时也是创建数据仓库元数据的来源。根据以上阐述和分析的数据仓库构建方法,结合本系统的实际,我们最后采用见效快的自底向上法(见图3.2)。因为在本系统中,所涉及的范围是教务部门的教务相关的信息,该部门作为学校一个的业务部门服务,
51、其业务范围不是很大,信息内容不是很杂,资金投入也比较有限。图3.2 自底向上法由于在系统的开发的过程中,需要考虑到决策支持系统的将来的发展。我们在设计工作中也意识到:所建立的教务部门的数据集市需要按照统一的校级信息模型来设计,并且在实施过程中度量应尽量减少重复,并能够充分考虑到整个学校的最终信息需求,在真正满足用户的原子级需求,使其具有很好的重用性和一致性29。这样才能更好的保证随着更多学校部门的数据集市建立和投入使用,数据集市的联结成为可能,而这些数据集市的集合也就成为将来校级的数据仓库的基础。3.3数据仓库架构结构 ODS层主要负责采集业务系统并保存一定期限内的相关业务数据。当然也可以满足
52、用户对明细数据的查询要求,可以算作明细数据仓库。 数据仓库层 将ODS层经过质量检查、清洗、转换后,形成符合质量要求的公共数据中心。实际上与ODS层差别不大,都是建立以ER为中心的数据关系,方便以后的数据的聚合。 明细数据集市层即前面所说的事实层按主题及KPI指标对数据仓库层数据进行进一步转换,将指标与维度组成数据集市。这是OLAP的数据基础。 聚合数据集市层即OLAP在明细数据集市层的基础上,提供基于联机分析处理(OLAP)引擎的多维分析能力,解决联机分析功能和决策支持要求。 数据展现层按照用户报表要求,提供用户报表界面及预警分发机制。第4章基于数据仓库的教务决策支持系统实施本章,我们在上一
53、章设计的基础上,根据设计方案对系统进行具体的实施工作,在本系统中涉及的具体实施流程如图4.1:图4.1 基于数据仓库的教务决策支持系统实施流程图4.1业务模型的分析对教务决策支持系统的了解至关重要,因为它不仅关系到开发工作是否能够满足用户的实际要求,而且对于充分利用现有资源也起着至关重要的作用,我们只有对现有的系统有了充分的了解,才能为数据仓库的建设做准备,最终做好决策支持的前期工作。对于现有的教务管理系统来说,其业务系统主要包括成绩管理、教师管理、科研管理、课程管理、学籍管理、奖惩管理、信息查询、毕业生审核、考试管理。其中以课程管理的应用最为广泛,涉及院系开课、学生选课、培养计划、课程设置、
54、成绩管理、排课信息、教学测评等方面,往往这些都是学校教学工作的核心工作,涉及的方面较广,不仅关系到教学的安排,学生的培养,教师的管理,而且还与教育目标的完成情况息息相关。在学校的教学管理中,课程管理在其中扮演了十分重要的角色,所以课程管理在教务管理的子系统中一直是比较重要的一个缓解,历来都受到各个学校的重视,也是整个系统的关键所在,它的发展经历了从早期的数据采集,到电脑辅助排课,到现在的全自动排课,可以说现在的课程管理系统无论在系统的成熟度上还是在应用上都已经达到一定的水平,而且经过多年的发展,各个高职已经在实际的应用中积累了项目应用的宝贵经验,并且在应用过程中还积累了庞大的数据资源,这些数据
55、资源对于本系统的开发课程管理系统具有相当的价值。鉴于上述原因,我们在系统实施的开始阶段,决定选取课程管理开发基于数据仓库的管理系统,然后在接下来把开发深入到其他业务模块,最后达到建立高效信息化的大学教务动态决策分析系统的目的。通过图5.2我们可以对现行的教务管理体系有了一定了解,我们可以看到在排课系统中所涉及的主体,首先是上课的学生,教课的老师,以及安排课程的管理人员,还有就是教务处的教学秘书,这四个主体之间是相互关联,互相影响的,在这种关系下,我们要在教务信息化的前提下,来实现对信息的采集和处理工作,建立课程基本数据库,开课、选课、排课数据库,课程成绩数据库,教学方案数据库,教学测评数据库(
56、未在图中显示),个人培养计划信息数据库。图4.2 现行课程管理流程图通过这八个数据库,实现了“教师登记课程组合生成教学方案学生自我规划学习计划院系按照学期开课院系按照学期排课学生根据课程信息选课教学过程教师输入课程成绩学生为教学测评并查看成绩”这个完整的业务流程。4.2业务模型与关系模型的映射在本系统中,我们主要根据对象的不同对所涉及的业务模型进行相应的划分,将排课系统中的业务逻辑以及其所要处理的数据进行有效的整合,这样就可以建立课程管理数据库的关系映射。对模型中的模型进行定义。首先要进行的工作,是对主体的划分,依据上一节的划分方法,在本阶段我们同样将主体分为四个对象。划分出相应的主体后,接下
57、来,根据主题确定主体的内容,通过对现有的课程数据库进行分析,我们可以得出,关于学生这一主题,包括学生的基本信息,如:学生所在的院系,学习的专业,还有就是学生的一些自然信息和个人培养计划信息;在课程主题中,主要包括,教学方案,以及课程的具体信息;在教师主题中,主要包括教师的教课信息(授课院系,授课班级,时间等),还有教师的一些自然信息,及教师所在院系。确定后整个业务模型可以进行一个大体划分,详见图4.3。图4.3 课程管理数据仓库主题边界的划分根据以上的分析,我们可以再次映射出课程管理数据仓库系统的关系模型:在教师与课程两个主题中,其管理可以定义为开设关系、学生与课程两个主题中可以定义为选择关系
58、、在教务处的教学秘书与课程之间,他们是一种安排与被安排的关系。主题的其他关系。图4.4分别简单表示各个主题间的关系模型。图4.4 各个主题间的关系模型经过上述的分析设计工作,整个业务模型就变成了各种关系模型,这些关系模型由一系列的主体相连接,在这样的设计中,我们可以看出,在数据上存在冗余,比如,在以上的主体中,同时存在课程名,学分,学时,于此同时,在数据库的设计上,还存在需要进行的详细分类,整合的部分,比如主题间的关系中就存在一对多,一对一,多对一等关系,这些都需要进行详细的定义,在这里就不再详细进行阐述。经过以上的处理操作,我主体间的关系就已经确定,这样就为下一步工作做好了准备。我们接下来的
59、工作是建立数据仓库。4.3数据仓库的建设4.3.1维表维表是多维分析空间在某个角度上的投影,它主要通过对因素属性的记录来描述事件中包含的诸多因素。在我们所建立的课程管理系统中,涉及多个因素,比如有学生因素、教师因素、时间因素、课程因素等。我们需要为这些因素建立相应的维表,为了体现其特征,需要在记录因素的层次或者其属性特征,为建立多维空间做准备,多维空间的建立是数据仓库建立的关键。在课程管理系统中,我们可以建立多个多维空间,在这里,我们以比较基础的几个为例,进行分析说明。(1)维度计划的详细信息有其自身的课程尺寸(程序级课程类型)。我们不同尺寸的投影分析不同主题的不同意见。图4.5显示了维修方案
60、,并详细定义的水平。图4.5 课程维层次及详细定义 (2)教学单位在课程管理系统的教学单位,是一个重要的维度,维度的不同科目的教学管理部门,分为学院,系部两个层次。图4.6显示的详细规定的教学单位和尺寸水平。图4.6 教学单位维层次及详细定义(3)时间维度时间维度作为课程管理系统中,最基本的层面,其中包括其总的学年、学期2级。图4.7显示的时间维度级别和详细的定义。图4.7 时间维层次及详细定义(4)教师维我们将来自不同层面的教师的问题进行划分,这里主要是为教师,课程相关的特性,所以主要考虑的是分部门这两项。图4.8显示了教师的维和详细定义的水平。图4.8 教师维层次及详细定义4.3.2事实表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版物流服务合同的货物损坏赔偿条款3篇
- 肺嗜酸细胞增多症病因介绍
- 小学课件猫背景
- 肝豆状核变性病因介绍
- 《健康组织与管理》课件
- 学前教育研究方法(课件)
- 2024年度植物墙设计与安装合同3篇
- 肌痛病因介绍
- 《冰川地貌》课件
- 粤教沪科版九年级物理第十二章过关训练课件
- YY/T 0471.2-2004接触性创面敷料试验方法 第2部分:透气膜敷料水蒸气透过率
- LS/T 1224-2022花生储藏技术规范
- GB/T 24969-2010公路照明技术条件
- GB/T 12168-2006带电作业用遮蔽罩
- GB 4351.1-2005手提式灭火器第1部分:性能和结构要求
- 2023年青岛版五年级数学上册知识点归纳及易错题
- 特殊需要儿童教育诊断与评估测试题附答案
- 安全生产十大定律(安全生产培训模板)
- 工程造价装饰预算实习报告-会所装修 工程预算文件编制
- 漆黑的魅影精灵分布图鉴
- 20年准易车工综合3及答案
评论
0/150
提交评论