数据挖掘分析平台 详细设计_第1页
数据挖掘分析平台 详细设计_第2页
数据挖掘分析平台 详细设计_第3页
数据挖掘分析平台 详细设计_第4页
数据挖掘分析平台 详细设计_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘分析平台详细设计履历版本日期变更概要修订人确认人修改标志目录 TOC o 1-5 h z HYPERLINK l bookmark6 o Current Document .概要介绍1目的1 HYPERLINK l bookmark52 o Current Document .系统概述2 HYPERLINK l bookmark54 o Current Document .数据挖掘技术2概述3运行机制4挖掘分析技术4技术规范5 HYPERLINK l bookmark100 o Current Document 4.功能设计6 HYPERLINK l bookmark8 o Curre

2、nt Document 学生工作主题系统6教学工作主题系统12 HYPERLINK l bookmark56 o Current Document 科研工作主题系统20 HYPERLINK l bookmark62 o Current Document 人事工作主题系统23 HYPERLINK l bookmark68 o Current Document 图书主题系统29 HYPERLINK l bookmark70 o Current Document 资产主题系统36 HYPERLINK l bookmark72 o Current Document 资产主题系统39.概要介绍目的经过多

3、年的信息化建设,数字化校园系统中存储了大量的数据。通过数据挖掘平台的搭 建,多种挖掘模型的支撑,为学校提高管理效率、提升服务水平、支撑教学改革、改变管理逃课时间分布A选爆学生大多数在信舍、图书馆A 3、4节逃课学生有39谢凝率下午选课Q 1高级宜词 保索1号出精华学院- 计算机学院V上周低消费766人,占总人数的9%,环比下羟1%组织机构在校生人数低消我人数J占比i变化:平均缰点 学箱人数学新占比前10% 平均侬a3.232510%3.0H网塔工程学院3.232510%3.0S机8工程蜴3.232510%3.0出去学疏3.232510%3.0H3.132510%3.0Ur学与婉计学馥3.132

4、510%3.0“物理国依然3.132510%3.0ng狂ra3.132510%3.0生命科学与农学院3.032510%3.0困计.机科学与技术学院3.032510%3.0EBwM*rrt3.032510%3.0历年学鞘人数与占比本科生/人平均分/分限高分/分最低分/分2642 匚.SB1+10 |1+10 |500 理工类/人平均分/分最高分/分最低分/分1 2642 工1+10 |110 文史类/人平均分/分最高分/分最低分/分2642 1 *101*10今年超出分数线困 分的有8个.相比上一年0加1个,生源质量理工类O文史关O艺术类O体育关人数 平均分用高分最低分高出分数线最多(分)相比上

5、一年平均分各誉分政统D529568600500304-4详修El网络工程学院456578564SOI29-7详情B机城与电气工程学院34255653357428+ 4现去学st33254652257427-7惮情B外国法学院33049950547426 4W今年平均an蟀io%,机st自动化.ikwn 12%人数 调剂率相比上一年机标自3化51410%4工崎管理5008%-7E*i6i+4897% 4历史文化4296%-7生命科学学3895% 4人敢 录取率相比上一年51410%44工商修理5008%-7Z*iSht4897%+4历史文化4296%-7生命科学学3895% 4今年自3BB生录取

6、率平均62%,机械自动化,业录取*43%今年新生侬率97% ,末期学生137人未报到原因分布未报到学生分布专业开设分析 2016-2017学年第一学期 O 2015-2016学年第O 2014-2015学年第一学期 O 2013-2014学年第一学期专业成绩排名排名成绩专业平均成缰公共基S2课专业基础课专业课平均成绩排名变化近几年排台1软件工程6868686802软件工程80808080令23软件工程82828282 304软件工程858S8585 45软件工程86868686 50专业挂科率O彼幺成缰理各专业平均成绩公共基跳课专业基础评专业课平均成绩排名变化近几年排名1软件工程68%68%6

7、8%68%令1e2软件工程80%80%80%80% 2O3软件工程82%82%82%82%4 3O4软件工程85%85%85%85% 45软件工程86%86%86%86%+5O t ri Kn *W BKKV力,A24HM*AM :BO.*TGt 工. M 6,。 B T-Xn ”T”t!高影响力18刊发文分析TMOII KM,FAkV *)“,T4itt*M* A5taMC9BMAM :9,,w二.|fr.”.w”x 1 e,工 BM :,|. |ir _七上J 三 0 e l,o: -k 鼻包 tlfM 士三,* 201S9 - - KIT9 Kewww,二 RWRquwr.zim10B*

8、taWKnAn&mi*ucwmvMiefHuutimBzrigmoeeRMi:*ffizu TMFUtS 4AN ”一*尸 SyMMK?m ,皮“一JWBAKX*WWf*tWH*WBRWZWCll-tt 2012 111 2MOll-m MU-n-M ?0 W-01MU 111 M16Q!Mia joirmai-MWM2-n*oi M-n-OT M-lO*SMkO4计机炊件著作权分析Brgswrt4 cw .EyyMmr:Era E-Mr-se*dFMAxew ,.chum.i9MfJ* WW OKK7 FAU7 力“7 XOWWfKT AXWttKTftMAM : I. 王,|F” .3“

9、I 4.4.人事工作主题系统n仆阳n仆阳2点m*A .6E”*n -, WATTM* /,;*O4 6 4皿 tA Ay t ffifte II T*| ze II Trrt- II w* *1 e |1右/11 彳.t ai *tp ti?r lls e II ?!,2工EASr)WlTMttQtoMCW4 :1OMo4Jj0,oi3sI1:2:0M?一,* ATM -H*Tfl ” 6、4Mt 6MIK*K.H IIBRIWwx x ITZiwe|CMXW: |x* fa| am:| 0 y-xn|txR*K.- |fKzM| 皿| 0Kti wHt I R4* K-M -*444* M4

10、W 9C-M *汁*。 MBdpWJiTer F*rcH*7切分布*U;t7trnCTVltQ,a OK。atw。*,n历旬之历仅升人员ZS(DmIAWtfJl*K0O.扁4Dw-ajiIrx3MA-4T产口 wun BgIkMU4To-3on,JBU-Mr4uaFE4Crllo5srSKXiiDw*jrwron9rU-MDaswTcwaaner*o3Frci”BFonrxM4A-M!B好?,力1rMM*B*Ug*cwxn r*rw 甲j-xff ,=e“,p言 AflW ,人才 KI gE iM. gM “TM*“sk?c| xRse |oct.|j| =1 =曰 0 .xcl Axmidc

11、y/ wq|人x |rc. |“we|rsi| se*.Ml怛I峭啕分哄*M( W- e a f r *r- ram -,aiTWH海出吱11WA dWUJT*fVTVIWAQM洲人ttnwwM封 141%inereWb:t备好ViWwWHA OicKff4l46WCA 二丸8ft9 A G;,m,RWWU.Hi痔,.*4.5.图书主题系统分not HHtWK.aX.3.1.概述.数据层数据挖掘管理系统最底层是数据层,数据层是构建数据仓库的基础。数据层包含各种数据源如 学工系统、教务系统、人事管理系统、科研管理系统、一卡通等所有学校在用信息系统的数据 库。通过建立中间数据库,将OLTP数据库上

12、与数据仓库有关的数据增量更新到中间数据库, 使对OLTP数据库的效率影响降低到最低。.信息层为了解决教学决策及评估等主题中需求目标难以量化的特点,信息层作为数据访问层和源数 据层的桥梁,对数据进行处理,形成不同层次的信息,以便分析层在此基础上建模。信息层 的核心就是与各主题相关的数据仓库。数据仓库通过对数据源的原始数据进行收集、分类、 筛选和抽取形成能够对决策分析提供支持的多重粒度级的数据库,实现对数据源的统一管理 和信息转换。同时为分析层的各种应用提供接口,构造应用于主题分析的更高粒度级的数据 集市,或者直接为数据访问层提供数据支持。信息层通过管理工具对数据仓库进行管理和维 护。以中间数据库

13、为数据源,按分析主题建立数据仓库。最后将数据仓库中的数据按照一定9CT9CT“IHEMWJtTWQ3g LTTW-VW-mxrew f MHWW411 mi-oiNWVLTaMIITK RIW ORIWU 01” “IS 01 rxcu wn tve TOC o 1-5 h z ”7C12,2Mlanj4UTT2M1JOA?OU1MT9SMLM01MCG9-8ass VK rtUM*图书已图9名(5)(败加)Msr*onaMfnrvft aa,T 0*)911 eJMWft KMrIK smsivoiT0 IMTWB Cl63EOSBOB52737 a资产主题系统仅HiCtM况梅,. mum

14、a. m &秆在用设118布1599,0s资产主题系统1KnaIRM7S;二但与金1m1Minrani55*trSV.nqeZfmtMZKTUOIo1l,WYgMT4MTItB 010i川eixautvnJ8ttm*u4oi04Ml M20tO4W*9OT37”他03MI9MM0LMfT9gwumc“13 0106nt*M.HKMl*0JMIJUISOUIKrMrItCNMtfBm0*nKMtRTRRMMt-09S41JM0K2A*x*WWB020川*10必方PSH*hT.*w,g0方式聚合汇总,构成信息分析的多维视图,以一定的存储模式(如模式文件)将这些多维视 图存储在OLAP服务器中。3.

15、分析层分析层由通用分析平台和基于主题的应用分析系统组成。通用分析平台是为了适应决策需求的 不稳定的特点,提供一些基本数据挖掘手段和简单分析模型,这样在很多情况下不必专门的建 立应用分析系统,大大提高了系统的普遍适用性和灵活性。针对复杂且相对稳定的决策需求, 需要从数据仓库抽取数据并建立专题数据集市或是利用已有的数据集市,开发专用的分析系 统。联机分析处理模块实现对多维数据集中立方体信息、维度信息、层次信息、度量信息的显 示;实现钻取、切片、切块,旋转等多维分析操作,提供多种查询方式,查询结果以WEB页 面的形式展现,以实现B/S形式的联机分析,全面支持决策分析。三层结构化的体系结构适应决策挖掘

16、系统需求的特点。三层之间通过数据仓库衔接,有效实现 了数据驱动,并且任何一层的修改、添加或删除功能模块给整体系统的影响都很小。运行机制数据挖掘平台是对学校信息化建设的高阶应用。数据挖掘平台的用户主要有学校领导、各职能部门负责人、各院系负责人、个人服务中需要参与的教职工、学生和家长、系统管理员等,他们对系统的目标分别如下:学校领导:把握数据挖掘平台。各职能部门负责人:具有对本校各学科用户帐号的管理;对本校各学科提交的申报书、 年度建设任务、总结报告的资料审查功能:本校各学科工程申请、评估和验收评审的结果查 询功能。各院系负责人:具有对本学科重点学科工程的申报书、年度建设任务、总结报告的维护 功能

17、;工程申请、评估和验收评审的结果查询功能;学科建设情况的登记功能。个人服务中的教职工、学生和家长:指负责学科建设的学校主管领导,学校领导查询提 供各项数据,及时了解到最新、最直观的学科动态分析,为相关决策提供依据。系统管理员:具有对重点学科建设工程管理中各种基础数据字典的维护功能。挖掘分析技术数据挖掘技术(DM)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们视线不知道的、但是又是潜在的有用信息和知识的过程。由于学校现有业务系统大多为结构化的数据,数据挖掘技术方法主要采用关联分析、聚类分 析、分类、预测、时序模式和偏差分析等。.关联分析(Associat

18、ionAnalysis)两个或两个以上数据项的取值之间存在某种规律性,就称为关联,可以建立起这些数据项的关联规那么。 数据关联是数据库中存在的一类重要的、可被发现的知识,它反映一个事件和其他事件之间的依赖和 关联。如果两项或多项树形之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。.聚类分析(Clustering)聚类是把数据按照它们的相似性归纳成假设干类别,同一类别中的数据距离较小、彼此相似,不同类别 中的数据距离偏大、彼此相异聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据 树形之间的相关关系。在聚类分析法中可以给定距离阈值,各样本按阈值进行聚类。tMaTpII

19、M-wrrMMA)i.moM/iMMMMMHIMgWMMIMOOMFobi ma二 MfrmuuL44k6,91MOMm14oLlflWIMeowm.nHW4mt*KUW/MM1maiIM92o2ja_WTW外IMMwitwIMMlZMZMTMCMOniweMloam.woewm5WT-OM14M36n5oMTT2MM1mA)MOfIM:TTmrm4M3ouiTwwrMITWm34MM9neatm、Xob emWAM.八COBwm3-mmtnMCBMHMflW-MKVTmmwIUU1MAWB2.7SS. 117.745.48wwa X 0.71 AJUWI( A013.24 mvci i 1.

20、50应SQ HenuT学生按消费类型消费习惯分析rmmrw.xu卅汨不21* : 9991 005 Ob 0; M 09 10 11 12 U 14 15 16 P it 19 20 21 22现冬女第216761215538RMHtAttAtW+Att0.71%99.29%05 06 07 06 Ot 10 11 U 11 14 XS lb 17 IS It 20 M 22Q .次K(*;)2183150AiW*Att100.00%4.8.学生个人服务521507110318ITT我的校园专业介绍老乡校友图书借阅课程信息我的消差100我的成绩我和学霸初来乍到聊吧通讯录大学四年精华学院建校于1

21、977年,在校生22094人 校训:为之那么易,不为那么难!引校园百科宿舍楼宿舍楼24前未维护教学接场28 t7未维护餐厅商店m 藏书rfjl教师团队卤i网络工程(运维与平安) TOC o 1-5 h z 国)授课计划0课程通过率B 任选课徘行Q搜索校友老乡e同院系徐贤Q2014级13S21581牛*增Cf2015 级 李*超CT2016 级 刘琪92016 级张欣Q15 62013 级你已借阅1本书籍超越69%的同学推荐阅读数说奥运雄风:数字告诉你的奥运传奇与风云:数字告诉你的奥借阅次运传奇与风云数:20过刊库中级会计专业技术资格考试大 纲.中级会计实务借阅次 建a . 1. 分类(Clas

22、sification)分类是数据挖掘中应用最多的任务。分类就是找出一个类别的感念描述,并用这种描述来构造模型。类别的概念描述代表着这类数据的整体信息、,也就是该类的内涵描述。类的内涵描述分为:特征描述 和区分性描述。特征描述是对类中对象的共同特征的描述。区分性描述是对两个或多个类之间的区别 的描述。. 预测(Predication)预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测,典型 的预算方法是回归分析,即利用大量的历史数据,以时间为变量建立线性或非线性回归方程。预测时, 只要输入任意的时间值,通过回归方程就可求出该时间的状态。.时序模式(Time-Ser

23、iesPattern)时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用一致的数据预 测未来的值,但这些数据的区别是变量所处的时间不同。在时序模式中,需要找出在某个最小时间内 出现比率一直高于某一最小百分比的规那么。这些规那么会随着形势的变化作适应的调整。时序模式中, 一个有重要影响的方法是“相似时序:用“相似时序”的方法,要按时间顺序查看时间事件数据库, 从中找出另一个或多个相似的时序事件。.偏差分析(Deviation)数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差包括很多 潜在的知识,如分类中的反常实例、不满足规那么的特例、观察

24、结果与模型预测值的偏差、量值随时间 的变化等。偏差检测的基本方法是,寻找观察结果与参照值之间有意义的差异。3.1.技术规范技术标准规范系统将严格按照各级有关标准执行,适应高校管理各类数据的处理、保存和交换的需要。遵 循如下通用标准与规范:教育管理信息化标准:国家标准、行业(部)标准、学校自定义标准。系统组件标准化:数据访问服务、信息门户、身份管理、身份平安审计,等组件均采用相应 的国际标准和国家标准,可以与其它符合规范的第三方平台与应用实现对接;提供java/.net/c等 主流语言接口。系统接口标准化:数据访问接口、应用集成接口、身份认证接口均采用相应的国际标准和国 家标准,方便第三方应用的

25、接入;提供java/.net/c等主流语言接口。先进性和成熟性系统采用代表信息化系统开展趋势的主流和成熟技术进行系统架构设计,选用技术先进、产 品成熟的产品建设信息共享系统,保证系统的技术先进性和成熟性,采用J2EE技术框架,符合 国家电子政务技术框架中对于分布式部署的要求。采用业界先进SOA技术框架,提高开发效率, 降低运作、维护本钱,增强系统的核心能力以及日后功能扩展性。跨平台性昨日消费明细9A1 DCH G受忏手一字甘日优秀大学生就业指导1学 分食品科学概论1学优分F秀离散教学A5学良分好1学中现代企业管理分等网络平安基础与平安配置4学 分中等3学中A洪网络系统管理分等毛泽东思想和中国特

26、色社会主义理3学及论体系概论2分格3学及互联网高级技术分格4学及入霹1省侨佥测我学校共有未加 学楂,其中普通 教室380间,可同时四未睾护人学习.LU圉书馆内藏书共计1938970册,图书校园内共有28个大型卷厅,就餐窗口个.校园内运动场地共末睾护平方米,可商铺共计未维护家,能充会有看校园地图/刘晨阳网络工程(运维与安发帖6好友3今日更新0聊吧广场跳蚤市场失而复得向好友聊天刘晨阳2017-03-24 16:14:39的Mg vwwv4.9.教师个人服务教学活动薪资待遇预警信息班级详情科研成果日常生活成绩分析累计公枳金798累计个税700累计保险499.01上月薪资 累计薪资未维护 255000

27、.99累计绩效补助620累计停时费3600累计工资1800消费异常一耳近月留高消费人数舍华肖费人数未统计未统计住宿异常。晚归ASI倡离必战未统计未统计学业异常20162017学年第01学期本学期您共管理0个班级,总计学生数为:0女生男生00管理班级无班级信息软件系统采用JAVA开发技术和N层应用体系结构,因此,数据库服务器系统、Web服务 器系统和应用服务器系统可以运行于包括Windows、Unix、Linux. MacOS等多种系列操作系统 平台上,系统具有良好的可移植性、适应性。系统选择开放的应用平台,采用J2EE技术标准和 XML数据交换格式,J2EE+XML实现了与平台和数据的无关性。跨平台技术开发,实现系统与 操作系统、硬件平台等无关,便于今后系统移植。高易用性操作具有流程化界面、向导式操作、个性化风格。系统操作流程清晰,操作简单,能够准确 反映每一项工作的流程、顺序、步骤,方便使用人员轻松掌握相应系统功能、快速完成相应管理 工作。4.功能设计学生工作主题系统在职期间,您所参与的科研成果如下: TOC o 1-5 h z 0 工程25()学术论文7我的著作1他传利170科研成果1嗡计算机软件著作权0卬正在阅读n累计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论