




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数据挖掘》课程教学大纲课程代码:090142131课程英文名称:DataMining课程总学时:40讲课:32实验:8上机:0适用专业:信息与计算科学大纲编写(修订)时间:2017一、大纲使用说明(一)课程的地位及教学目标本课程是信息与计算科学专业一门重要的专业选修课,它较详细地阐述了数据分析与数据挖掘理论及使用。本课程以数据挖掘为主要教学内容,讲述实现数据挖掘的各主要功能、挖掘算法和应用,并通过对实际数据的分析更加深入地理解常用的数据挖掘模型。通过《数据挖掘》课程的教学,使学生理解数据挖掘的基本概念和方法,学习和掌握常见的数据挖掘方法。使学生能够借助IBMSPSSClementineModeler,Weka,Python,Matlab,SASEnterpriseMiner等软件工具进行具体数据的挖掘分析,培养学生数据分析与挖掘的能力。(二)知识、能力及技能方面的基本要求要求学生能够理解数据挖掘的工作原理,熟悉数据分析方法,统计方法,优化方法,以及神经网络常用算法的使用,熟悉基本数据分析软件的操作和工作原理,例如常用数据分析软件SPSS,MATLAB等。同时要求学生熟悉数据仓库的概念,要求强化知识获取,信息检索的能力,掌握数据获取的源头。熟练R语言与Python语言或者其他的面向对象语言,熟练操作Mysql,SQL,DB2,Oracle中至少一种数据库。至少熟练一种数据挖掘软件的操作。该课程的知识系统结构围绕培养学生的数据分析与数据挖掘能力涉及的技术要点和技术难点来展开。知识的运用是由课堂讨论、习题、实践环节三大部分组成。教师应培养学生实用的数据挖掘所必须具备的基础知识及相关的理论知识及基本技能。学生应能掌握基本的数据挖掘软件进行应用操作。(三)实施说明要提高学生的基本素质,必须引导学生从被动吸收知识的状态转化到主动索取知识的状态中来。教师在讲解过程中应循序渐进、深入浅出、联系实际、结合实例,才能收到较好的效果。应培养学生良好的数据挖掘思想、方法与技巧,培养初步的算法抽象能力与数据抽象能力。同时注重方法的传授而不纠缠细节。实践永远是学好数据分析与数据挖掘的关键,本课程对学生的动手能力要求较强,应配置相应的课程设计环节。采用“自学+实战+讨论”的方法,激发学生学习的兴趣。要督促并采用一定的方法使学生在课外时间进行大量的实践练习。使学生在编程的训练中,进一步理解面数据挖掘方法的理论,并能将经典的数据挖掘思想应用到实际的数据挖掘问题中,真正掌握数据挖掘的方法。理论授课最好采用多媒体教学方式,上课过程中除了讲清基本理论和基本方法外,还应该在课堂上通过多媒体手段现场演示数据挖掘软件的使用、编写、调试过程。在整个课程的教学过程中,教师应成为学生的导师,指导学生如何学习,还应充当课堂讨论的组织者及引导者,扮演实践环节中应用软件项目开发的负责人。该大纲的实施过程中,应站在培养人才的整体高度上,教师传授的不仅仅是知识,更重要的是如何获取知识。(四)对先修课的要求本课程的教学必须在完成先修课程之后进行。本课程主要的先修课程是《数据库原理》、《概率论与数理统计》,《数据分析》,《面向对象程序设计》《运筹学》。(五)对习题课、实践环节的要求学习数据挖掘必须多上机实践。只有多动手,才能掌握常用的挖掘算法的使用。因此,建议除教学计划安排的习题与实验教学外,教师应该多采用课外实验作为补充,习题和实验相结合,具体实验的多少应根据具体情况灵活运用。本大纲是以实施素质教育为目标制订的,所以对不同专业、不同班级在同一总学时下,执行过程中应有差异。教师要根据具体情况灵活掌握。(六)课程考核方式 1.考核方式:考查(平时成绩+大作业+实验报告)2.考核目标:在考核学生对数据挖掘基本知识、基本原理和方法的基础上,重点考核学生的数据挖掘的应用能力和软件操作能力。3.成绩构成:本课程的总成绩主要由两部分组成:平时成绩(包括作业情况、出勤情况、实验成绩等)占20-30%,期末成绩(考试或大作业成绩)占70-80%。平时成绩由任课教师视具体情况按百分制给出;实验成绩由实验老师参照相关规定按百分制给出,实验无成绩或实验不及格,取消期末考试资格,总成绩直接以不及格计。(七)参考书目《数据仓库与数据挖掘》,周根贵,浙江大学出版社,2004《数据仓库与数据挖掘实践》,李春葆,电子工业出版社,2014《数据挖掘导论》,陈封能编著,人民邮电出版社,2011《基于Clementine的数据挖掘》,薛薇主编,中国人民大学出版社,2012《SPSSModeler数据挖掘方法及应用》,薛薇主编,电子工业出版社,2014《数据挖掘原理与SPSSClementine应用宝典》,元昌安主编,电子工业出版社,2009二、中文摘要本课程的目的是培养学生理解数据挖掘的基本思想及应用,以及对于数据挖掘软件的运用操作能力。课程内容包括数据挖掘的思想及常用算法,以及相关软件操作,如数据仓库知识、数据清洗预处理、分类与预测、聚类分析。另外,学生应该学会使用如SPSSClementine或者weka,Python,MATLAB等数据挖掘工具软件。该课程是信息与计算科学专业的专业选修课程,课程将把前期所学的一些基础课程的进行曲面横向与纵向的穿插使用,为毕业设计等奠定重要的基础,同时也是学生就业时一个重要技能。三、课程学时分配表序号教学内容学时讲课实验上机1数据挖掘导论661.1数据挖掘概述;21.2数据挖掘功能;21.3数据仓库概述,构建;22数据预处理10822.1数据清洗42.2数据集成与转换4实验一数据预处理实验23相关性与关联规则6423.1多种关联规则挖掘23.2从关联分析到相关分析2实验二相关性分析实验24分类与预测121024.1分类与预测的基本知识24.2基于决策树的分类24.3贝叶斯分类,24.4神经网络分类24.5预测方法2实验三决策树分类算法25聚类分析6425.1聚类问题概述25.2K-means算法2实验四K-Means算法实践2合计40328四、教学内容及基本要求第1部分数据挖掘导论总学时(单位:学时):6讲课:6实验:0上机:0第1.1部分数据挖掘概述(讲课2学时)具体内容:理解数据挖掘的概念;第1.2部分数据挖掘功能(讲课2学时)具体内容:了解书绝挖掘功能的分类,既描述性的和预测性的;第1.3部分数据仓库概述,构建(讲课2学时)具体内容:了解数据仓库产生的原因,基本概念,以及数据仓库的体系结构;重点:数据挖掘定义,功能与原理;数据仓库的构建。难点: 数据仓库的构建。习题:深入理解书中关于数据挖掘与数据仓库的关系。第2部分数据预处理总学时(单位:学时):10讲课:8实验:2上机:0第2.1部分数据清洗(讲课4学时)具体内容:1)掌握噪声数据处理;2)掌握不一致数据处理;第2.2部分数据集成与转换(讲课4学时)具体内容: 掌握数据集成处理,掌握数据转换处理;重点:数据缺失的处理,数据集成,数据转换,数据规约与数据离散化。难点:数据集成与转换。习题:讨论数据质量的评估如何依赖于数据的应用目的,给出例子。实验:数据的均值平滑,中值平滑,边界值平滑。(2学时)第3部分相关性与关联规则总学时(单位:学时):6讲课:4实验:2上机:0第3.1部分多种关联规则挖掘(讲课2学时)具体内容:理解多种关联规则挖掘介绍,由频繁项集产生关联规则,熟练Apriori算法;第3.2部分从关联分析到相关分析(讲课2学时)具体内容:熟练掌握从关联分析到相关分析问题,高度关联模式定义;重点:相关分析,Apriori算法流程。难点:挖掘高度关联模式。习题:相关分析应用练习。实验:相关性分析实验;(2学时)第4部分分类与预测总学时(单位:学时):12讲课:10实验:2上机:0第4.1部分分类与预测的基本知识(讲课2学时)具体内容:了解分类基础;了解预测基础;第4.2部分基于决策树的分类(讲课2学时)具体内容:ID3算法;C4.5算法;第4.3部分贝叶斯分类;(讲课2学时)具体内容:理解贝叶斯基本理论,了解朴素贝叶斯的原理和工作过程;第4.4部分神经网络分类;(讲课2学时)具体内容:理解掌握BP算法;第4.5部分预测方法(讲课2学时)具体内容:1)掌握线性与多变量回归;2)熟悉非线性回归;3)了解其他回归模型;重点:决策树分类,贝叶斯分类,预测方法。难点: 决策树分类与预测方法的应用。习题:每个分类应用实践的大作业。实验:实践决策树分类的算法(2学时)第5部分聚类分析总学时(单位:学时):6讲课:4实验:2上机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB32/T 3545.2-2020血液净化治疗技术管理第2部分:血液透析水处理系统质量控制规范
- DB32/T 3514.3-2019电子政务外网建设规范第3部分:IPv4域名规划
- DB31/T 855-2014公共汽(电)车动态信息发布服务基本技术要求
- DB31/T 668.6-2012节能技术改造及合同能源管理项目节能量审核与计算方法第6部分:炉窑系统
- DB31/T 615-2012冷却塔循环水系统富余能量回收利用的评价方法
- DB31/T 519-2010道路隧道空气污染物净化设备净化效果的评价方法
- DB31/T 478.10-2011主要工业产品用水定额及其计算方法第10部分:食品行业(冷饮、饼干、固体食品饮料)
- DB31/T 1377.5-2022实验鸡和鸭第5部分:遗传质量控制
- DB31/T 1072-2017资源综合利用产品评价方法和程序
- DB31/ 874-2015重点行业反恐怖防范系统管理规范第4部分:涉外港口设施
- 水系锌离子电池市场分析报告-培训课件
- 国家开放大学(财务报表分析)形考1-4
- 空白教案模板(表格形式-已排版)
- 工程经济学项目经济评价案例分析
- 最全深圳市工改工案例分析
- 在市财政系统警示教育暨作风建设大会上的讲话
- 《管理信息系统》课程设计报告范文
- GB∕T 37821-2019 废塑料再生利用技术规范
- 测量学地形图的基本知识培训讲义PPT(讲解)
- 自控实验三线性定常系统的稳态误差
- 特种设备作业人员考试中心质量管理手册(共31页)
评论
0/150
提交评论