版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本科课程设计及实验期末成绩评估系统的数据仓库和数据挖掘设计程名称数据挖掘程编号08060116生姓名cwl号2008052251院信息科学技术学院系计算机科学系业软件工程导教师lb师单位信息学院计算机系课时间20102011学年度第 一 学期课 课 学 学 学专 指 教 开2011年 06月20日第 1 章 概述1.1 应用背景和问题的提出在大学生活中,我们大学生在某种程度上还是比较重视自己的课程成绩的。而 有一个期末最终成绩的评估系统,无疑对同学们而言是很有用的。在这个系统中, 只需输入你估计的平时成绩以及表现和期末考试的得分, 就可以预测出最终的成绩。 而这个课程成绩的组成以及得出是怎么样
2、的呢。 这个最终的得分是受到什么影响呢 ? 本论文就以上问题进行了探讨和挖掘。1.2 设计内容的介绍本课程设计主要是探讨和研究在老师给定成绩时考虑的因素,以及这些因素所 占的比例。数据仓库为一份记录着 600 个同学的得分情况的数据,数据挖掘则采用 决策树探究出影响结婚年龄的因素。第 2 章 数据仓库设计2.1 概念模型设计数据仓库里面有一个实体, 也就是成绩 score 。成绩的决定因素有 performance 也就平时表现情况,即根据其在课堂上的活跃程度以及认真听课的情况来给的分, 还有 averscore 就是同学平时的作业得分以及平时测试或者期中测试的平均成绩, 以及期末考试的成绩
3、lasttest 。2.2逻辑模型设计本数据仓库只有一个表,逻辑模型设计如下:idperFermance lastbsstSQcre2.3物理模型设计在数据仓库的物理设计中,主要解决数据的存储结构、数据的索引策略、数据 的存储策略、存储分配优化等问题。物理设计的主要目的有两个,一是提高性能, 二是更好地管理存储的数据。访问的频率、数据容量、选择的RDBM支持的特性和存储介质的配置都会影响物理设计的最终结果。在本数据挖掘中,数据的索引策略 采取的并不是位图索引而是按列索引2.4 OLAP模型设计在本设计中由于案例考虑的并不复杂,所以 OLAP莫型设计也就比较的简单F面的数据是保存在Excel中的
4、。大概的模型设计也就如下图所示目 tt.ils * XD600”週丘94r aBCDE1averscoTeperf erniancelaslizeslsocre2r_ i4629625731 25643594rs9934575L49E5063Gr 1C10315462730495DF48r t233S74739rr a&9455764Wr9WO34S58011io2&4753S712r a72295160131257S4889214r 1339822442151495655475r i&r 15Z554265017162776558213r1了4951706719183031907420r 1
5、9393043Q321二 203561867222C 219125918623二 22&331626724r 237450988525二24333724312&C 254165398427二 2625538670COOTc rrre2.5 OLAP前端展示设计 dbmt坤t 5EL叩24”TS5QLQU8I7L声a inistrator 佃4力5idaver coreperFermancelastteslsocrea462962572背5t旳50376993457q469350寅51003151626304950S4726冏74733&945S7649100别更eoWZ647535711722
6、951601257时889213蓟02244214?S65胡7515為曲2650162776956217斗9517067W3C319D741939304343203561ee7221刃25918&22&3316267第3章数据挖掘分析3.1期末成绩评估系统应用挖掘概述在本系统中,数据仓库采用一个二维表来存储和表示同学们的平时成绩,平时 表现得分,以及期末成绩等属性。数据挖掘则采用关联分析来将二维表中的实例分 开,并探究这些数据所蕴含的规律。3.2数据挖掘实验实验环境Win dows XPMicrosoft SQL Server 2008Microsoft Visual Studio 2008M
7、icrosoft Office 2003 Excel Access数据准备及预处理首先选择数据源,以下几个截图是在做实验时的几个步骤*fc-UB-visr Irai rfti ili*r ellI- lrn| x|Ohoo-e & c D & s:|jirdtioo仗 where- to icopy id-ata toFjLT-uTSI31JdLolp E.ao.kAgjiunb 岳 Z igmh* Uae Wlndaws AutleHflEaitlo n厂 U se SJJ.L S erve p Awtkpeni ica tionLJer riame:PaffiiiMQrd-EtwhVer
8、1 i-Bii 11*323实验内容(输入数据集,选择算法,输出结果,比较分析)(1)建立一个Analysis Services Project的项目,在数据源中输入数据集:说明:以上实验室在实验室做的,由于时间不够,回到宿舍自己安装了中文版的SQL SERVE工具,并完成接下来的实验步骤。算法选择分类的任务是通过分析由已知类别数据对象组成的训练数据集,建立描述并区 分数据对象类别的分类函数或分类模型(也常常称作分类器) 。分类算法有多种,例如,决策树分类算法、神经网络分类算法、贝叶斯分类算 法等。这里需要用的是决策树分类算法。在本挖掘中选择是 关联分析, 分析过程和结果如以下图所示:面是 挖
9、掘模型:a挖握结构W、挖掘11型认槍据模塑杳看器h自挖掘推确握国義爭挖莊根型预测已 务X詰构/TtIflii Mtia刖空Pr edi. d IKeyFr edictFredLdPredict项集:关联规则:*1晁示绘:S曲杲衍做:f提升图:分类矩阵:依赖关系网络图:后来我用回归预测法,得到了一个散点图,说明预测值和实际值是有一定的关联的:j i*LQQ :u挣握统神的轴抠临圈:Tt通过以上的分析,我们得出一个结论,就是期末成绩在最终得分中所占的比例 最大,平时成绩和平时表现的权重差不多,在这个结论中,期末考试的成绩的重要 性,不言而喻,增加期末考试的成绩,最能提高最终成绩,平时成绩和表现的得分 也很重要,但相对权重没有期末成绩大。一个分数高的学生,他的所有成绩都应该 是很高的。参考文献:1 Jamie MacLe nnan, ZhaoHui Ta ng, Bogdan Crivat 著.数据挖掘原理与应用(第 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医师事迹范文(5篇)
- 《环保节能培训》课件
- 办公室产品展会市场分析报告
- 办公环境中小学语文学习的价值
- 《次施工准备工作》课件
- 农业科技系统在医疗健康领域的创新应用
- 2025建筑工程分包合同
- 2025附条件赠与合同 标准版模板全
- 2025中国银行劳动合同范本
- 卷烟配件行业深度研究报告
- 小学体育足球课教育课件
- 《世界经济学课件》课件
- 安全生产知识负责人复习题库(附参考答案)
- 《玉米种植技术》课件
- 2023年聊城市人民医院招聘备案制工作人员笔试真题
- 收费站微笑服务培训
- GB/T 44570-2024塑料制品聚碳酸酯板材
- 雨的形成课件教学课件
- GB/T 16288-2024塑料制品的标志
- 关于健康的课件图片
- 2024-2030年农产品物流行业市场深度分析及竞争格局与投资价值研究报告
评论
0/150
提交评论