数据挖掘课程设计汇本_第1页
数据挖掘课程设计汇本_第2页
数据挖掘课程设计汇本_第3页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本科课程设计及实验期末成绩评估系统的数据仓库和数据挖掘设计课 课 学 学 学 系: 专 指 教 开称号名号 院数据挖掘08060116cwl2008052251信息科学技术学院计算机科学系业师位间软件工程lb信息学院计算机系20102011学年度第二 学期2011年06月20日第1章概述1.1应用背景和问题的提出在大学生活中,我们大学生在某种程度上还是比拟重视自己的课程成绩的。而有一个期末最终成绩的评估系统,无疑对同学们而言是很有用的。在这个系统中,只需输入你估计的平时成绩以及表现和期末考试的得分,就可以预测出最终的成绩。而这个课程成绩的组成以及得出是怎么样的呢。这个最终的得分是受到什么影响呢

2、?本论文就以上问题进展了探讨和挖掘。1.2设计容的介绍本课程设计主要是探讨和研究在教师给定成绩时考虑的因素,以及这些因素所占的比例。数据仓库为一份记录着 600个同学的得分情况的数据,数据挖掘那么采 用决策树探究出影响结婚年龄的因素。第2章数据仓库设计2.1概念模型设计数据仓库里面有一个实体,也就是成绩scoreo成绩的决定因素有performanee也就平时表现情况,即根据其在课堂上的活泼程度以及认真听课的情况来给的分, 还有averscore就是同学平时的作业得分以及平时测试或者期中测试的平均成绩,以及期末考试的成绩lasttesto2.2逻辑模型设计2.3物理模型设计要解决数据的存储构造

3、、略、存储分配优化等问一是提高性能,二是更好本数据仓库只有一个表,逻辑模型设计如下:在数据仓库的物理设计中,主数据的索引策略、数据的存储策题。物理设计的主要目的有两个,地管理存储的数据。访问的频率、数据容量、选择的RDBMS支持的特性和存储介 质的配置都会影响物理设计的最终结果。在本数据挖掘中,数据的索引策略采取的 并不是位图索引而是按列索引2.4 OLAP模型设计在本设计中由于案例考虑的并不复杂,所以 OLAP模型设计也就比拟的简单F面的数据是保存在ExceI中的。大概的模型设计也就如下列图所示2.5 OLAP前端展示设计第3章数据挖掘分析3.1期末成绩评估系统应用挖掘概述在本系统中,数据仓

4、库采用一个二维表来存储和表示同学们的平时成绩,平时 表现得分,以及期末成绩等属性。数据挖掘那么采用关联分析来将二维表中的实例 分开,并探究这些数据所蕴含的规律。3.2数据挖掘实验实验环境Win dows XPMicrosoft SQL Server 2008Microsoft Visual Studio 2008Microsoft Office 2003 Excel Access数据准备及预处理首先选择数据源,以下几个截图是在做实验时的几个步骤A 1.1 id ibvat<* Lise */jndos A«jthenitieal'iohU se SU L 8 erve

5、i Amthert ictionijger name:Pass wardr厂Flffh e-ahti曰1曰匕!=!旧:OHockbu O er slHrmotifeoinSp&eifi ikm litre to 亡茲口并 d-ata to巨冃齐iiimcti onl 鲨QjL biJi MTivr lmi|Liii rl n ri ili t W iJ吕口1_ G&rve-r Malive aieiit 1 0 O< 且uGkErnii小1fie 皿 >ftSurvEJi- Drri pcji t <1 in cl EjM.pur ti cJ*Q>uy

6、需 «nc D 奇 tdlTH& exociuion wqs sugc»a ttful11 T otai Eiroi11 匸ili亡亡亡田皇 XA/arKirbgIn和ali己irg ID a冶 Flow 7sl-IrhitializH-ki 匸d 门厂ueuli口邛壬5 LUU匸鼻£5:Sehina SOL Com man dS uc=&esSetting Source 匚已ulham5uc=£essSett*n口 D eCtf-ialiQnt ConnectionS iLjcos&s/-ahcdatingPi epare fo

7、r E xectMeS nicoesPreexeicuiteSuecesiEMBoubri 口S uccesrECcMiy to d)bo.H:iSutGSM599 roL triisfezriedPcsLue skddMd吕 bDC.D 賀 Et| 旦i-tinfI ix厂五雹n尸BwoitCIOUQ323实验容输入数据集,选择算法,输出结果,比拟分析1建立一个 Analysis Services Projects工程,在数据源中输入数据集:Kl厂 nmrk:5eL-U2!4Loo on to the- s«FverC: IIII III i» Mrink44U.

8、1;rl'Cr3 LJs Wlndo wfIcjstlo nJl Os-e- OL Sts* vuF 疤匸口I e- st <Zoniriectlo«-iOfcHelp-AH说明:以上实验室在实验室做的,由于时间不够,回到宿舍自己安装了中文版的SQL SERVE工具,并完成接下来的实验步骤。324算法选择分类的任务是通过分析由类别数据对象组成的训练数据集,建立描述并区分数 据对象类别的分类函数或分类模型也常常称作分类器。分类算法有多种,例如,决策树分类算法、神经网络分类算法、贝叶斯分类算 法等。这里需要用的是决策树分类算法。在本挖掘中选择是 关联分析,分析过程和结果如以

9、下列图所示:F面是挖掘模型:J型查看蛊厨 穂掘推确性團叢挖捆模型预测TALastLestBUI“U1UII£J Illi, bill !< Jill M4. j f erferniaiiceS acreMi crcs oft_Assoc i ati on_RulftE Fr#di ciKsyPredictPredictPr edict项集:关联规那么:财翊車匚工6££制提升图:分类矩阵:依赖关系网络图:后来我用回归预测法,得到了一个散点图,说明预测值和实际值是有一定的关联的:巨挖捉蚊神的數掘挖靈敬必圈:Tt通过以上的分析,我们得出一个结论,就是期末成绩在最终得分中所占的比例 最大,平时成绩和平时表现的权重差不多,在这个结论中,期末考试的成绩的重要 性,不言而喻,增加期末考试的成绩,最能提高最终成绩,平时成绩和表现的得分 也很重要,但相对权重没有期末成绩大。一个分数高的学生,他的所有成绩都应该 是很高的。参考文献:1 Jamie MacLe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论