数据挖掘教学大纲_第1页
数据挖掘教学大纲_第2页
数据挖掘教学大纲_第3页
数据挖掘教学大纲_第4页
数据挖掘教学大纲_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘教学大纲一、基本信息英文名称:Data Mining课程编号:063211505课程类别:专业课课程性质:选修课学时:32 (理论学时:32) 学分:2适用对象:软件工程专业先修课程:数据库、Java程序设计开课单位:计算机学院使用教材:1王振武.数据挖掘算法原理与实现.北京:清华大学出版社,2017.主要参考书:1Jiawei Han. HYPERLINK /s?wd=%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E6%A6%82%E5%BF%B5%E4%B8%8E%E6%8A%80%E6%9C%AF&tn=44039180_cpr&fenlei=mv6q

2、uAkxTZn0IZRqIHckPjm4nH00T1dBnyRznhmsPADsuyD4nWIW0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnWRvrjR1rjcz t _blank 数据挖掘概念与技术. HYPERLINK /s?wd=%E6%9C%BA%E6%A2%B0%E5%B7%A5%E4%B8%9A%E5%87%BA%E7%89%88%E7%A4%BE&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4

3、nH00T1dBnyRznhmsPADsuyD4nWIW0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnWRvrjR1rjcz t _blank 机械工业出版社20152林字.数据仓库原理与实践.北京: HYPERLINK /s?wd=%E4%BA%BA%E6%B0%91%E9%82%AE%E7%94%B5%E5%87%BA%E7%89%88%E7%A4%BE&tn=44039180_cpr&fenlei=mv6quAkxTZn0IZRqIHckPjm4nH

4、00T1dBnyRznhmsPADsuyD4nWIW0ZwV5Hcvrjm3rH6sPfKWUMw85HfYnjn4nH6sgvPsT6KdThsqpZwYTjCEQLGCpyw9Uz4Bmy-bIi4WUvYETgN-TLwGUv3EnWRvrjR1rjcz t _blank 人民邮电出版社,2003二、教学目标数据挖掘是软件工程专业的一门具有重要工程价值的前沿专业课程,是人工智能研究方向的一个重要分支。旨在让学生掌握大数据分析的常用方法,培养他们通过合适的数据分析方法,获取隐藏在数据深层次内部不易被察觉的某些数据之间关系的能力。本课程的教学目的是使学生了解数据挖掘的基本概念和基础知识;掌握

5、应用数据挖掘的基本原理、技术和方法;具备熟练使用数据挖掘方法进行问题分析和程序设计的能力;具备不同数据挖掘方法的性能评估能力;能够应用成熟的数据挖掘技术解决实际工程问题。课程目标及能力要求具体如下:课程目标1:了解数据挖掘的基本概念以及其各种数据挖掘算法的基本原理;掌握常用的数据挖掘算法特点和使用场景;能够运用数据挖掘方法分析复杂软件工程问题,并建立解决问题的基本思路和方案。课程目标2:能够使用数据挖掘的基本方法进行具体工程问题解决方案的分析;使用数据挖掘常用算法进行方案的实验设计,验证方案的可行性。表1 课程目标对毕业要求的支撑关系毕业要求毕业要求指标点课程目标对毕业要求的支撑关系3、设计/

6、开发解决方案3-1 解决方案构思能够运用软件工程专业知识和数学知识,确定解决复杂软件工程问题的基本思路和方案。课程目标14、研究4-2 方案调研与实验设计能够针对复杂软件工程问题,收集、分析与解释已存在的相关产品、模型、系统方案、开源软件等资料,根据对象特征选择研究路线,确定适当的软件架构,设计实验方案。课程目标2三、课程内容、教学要求及评价方式1.课程内容、要求与评价方式通过指导学生学习与课程目标相对应的课程内容,实现课程目标的达成。评价方式包括:课后作业、专题、期末考试。各课程目标的教学方式与评价方式详见表2。表2 课程知识单元、要求与评价方式对应关系表序号知识单元知识点教学要求教学方式评

7、价方式推荐学时支撑课程目标1绪论数据挖掘的概念、发展历史、研究内容、应用热点、常用的技术和工具1.了解数据挖掘的概念和发展历史;2.了解数据挖掘的研究内容应用热点讲授期末考试212数据预处理数据预处理的目的、数据清理、数据集成和数据变换、数据规约、特征选择和提取1.理解数据预处理的目的;2.掌握数据清洗常用方法;3.掌握数据集成和数据变换常用方法;4.掌握数据规约常用方法;5.掌握特征选择和提取常用方法讲授期末考试213关联规则挖掘关联规则的基本概念、Apriori算法原理、Apriori应用实例分析、Apriori源程序分析、Apriori算法的特点和应用场景理解关联规则的基本概念;掌握Ap

8、riori算法原理;了解Apriori特点和应用场景;能够将Apriori应用于实践,解决具体工程问题讲授课后作业;期末考试21、24决策树分类算法决策树分类的基本概念、ID3和C4.5算法原理、ID3和C4.5算法实例分析、ID3和C4.5算法源程序分析、ID3和C4.5算法的特点和应用理解决策树分类的基本概念;掌握ID3和C4.5算法原理;掌握ID3和C4.5的特点和应用;能够将ID3和C4.5算法应用于实践,解决具体工程问题讲授课后作业;期末考试41、25贝叶斯分类算法贝叶斯分类的基本概念、贝叶斯分类算法原理、贝叶斯分类算法实例分析、贝叶斯分类算法源程序分析、贝叶斯分类算法的特点和应用1

9、.理解贝叶斯分类的基本概念;2.掌握贝叶斯分类算法原理;3.掌握贝叶斯分类的特点和应用;4.能够将贝叶斯分类算法应用于实践,解决具体工程问题讲授课后作业;期末考试41、26人工神经网络算法BP神经网络的基本概念、BP神经网络算法原理、BP神经网络算法实例分析、BP神经网络算法源程序分析、BP神经网络算法的特点和应用1.理解BP神经网络的基本概念;2.掌握BP神经网络算法原理;3.掌握BP神经网络的特点和应用;4.能够将BP神经网络算法应用于实践,解决具体工程问题讲授课后作业;期末考试41、27支持向量机支持向量机的基本概念、支持向量机原理、支持向量机实例分析、支持向量机的特点和应用1.理解支持

10、向量机的基本概念;2.掌握支持向量机算法原理;3.掌握支持向量机的特点和应用;4.能够将支持向量机应用于实践,解决具体工程问题讲授期末考试21、28K-means聚类算法K-means聚类算法的基本概念、K-means聚类算法原理、K-means聚类算法实例分析、K-means聚类算法源程序分析、K-means聚类算法的特点和应用1.理解K-means聚类的基本概念;2.掌握K-means聚类原理;3.掌握K-means聚类的特点和应用;4.能够将K-means聚类算法应用于实践,解决具体工程问题讲授课后作业;期末考试21、29K-中心点聚类算法K-中心点聚类算法的简介、K-中心点聚类算法原理

11、、K-中心点聚类算法实例分析、K-中心点聚类算法源程序分析、K-中心点聚类算法的特点和应用1.理解K-中心点聚类的基本概念;2.掌握K-中心点聚类原理;3.掌握K-中心点聚类的特点和应用;4.能够将K-中心点聚类算法应用于实践,解决具体工程问题讲授期末考试21、210神经网络聚类算法:SOM神经网路聚类算法SOM的简介、竞争学习算法基础、SOM算法原理、SOM算法实例分析、SOM算法源程序分析、SOM算法的特点和应用1.理解SOM算法的基本概念;2.掌握SOM算法原理;3.掌握SOM算法的特点和应用;4.能够将SOM算法应用于实践,解决具体工程问题讲授期末考试41、211数据挖掘的发展Web挖

12、掘、空间数据挖掘、流数据挖掘、数据挖掘与可视化技术1.了解Web挖掘现状和发展前景;2.了解空间数据挖掘现状和发展前景;3.了解流数据挖掘现状和发展前景;4.了解数据挖掘与可视化技术现状和发展前景讲授专题;期末考试41授课方式: (1)讲授;(2)实验;(3)上机;(4)现场演示评价方式:课后作业:包括在线学习、在线作业、纸质作业、电子作业等;课堂测验:包括纸质、上机两种;专 题:包括报告、硬件设计、程序设计、算法设计、方案设计等;期中考试:包括试卷、上机;实 验:有实验报告、实验过程考核(实践操作、原理提问)、实验结果;期末考试:包括试卷、上机。课程评价计算表3 课程目标与评价依据占比关系表

13、课程目标评价占比评价项目课程目标1课程目标2期末考试6080%20%课后作业30100%-专题报告10-100%合 计1007822表4 各考核环节所占分值比例及考查重点课程成绩构成及比例考核环节考查点课程目标分值期末考试100分占总成绩的60%基础知识1数据挖掘的概念、研究内容、功能、常用的技术和工具;数据挖掘的发展现状和前景:Web挖掘、空间数据挖掘、流数据挖掘、以及数据挖掘的可视化。140专业知识2数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、K-means聚类算法。140问题分析3使用K-中心点聚类算法、神经网络聚类算法:SOM进行实际工程问题

14、的分析、设计能力;以及最终解决工程问题的能力。220课后作业100分占总成绩的30%作业1使用关联规则进行相关工程问题的分析能力,以及将算法Apriori应用到具体工程实践分析中,对具体问题进行关联规则分析的能力。21002使用决策树分类原理进行相关工程问题的分析能力,以及将ID3或C4.5算法应用到具体工程实践分析中,应用决策树分类的能力。3使用贝叶斯分类原理进行相关工程问题的分析能力,以及将贝叶斯分类算法应用到具体工程实践分析中,应用贝叶斯分类的能力。4使用人工神经网络原理进行相关工程问题的分析能力,以及将人工神经网络算法应用到具体工程实践分析中,设计神经网络的能力。5使用K-means聚

15、类原理进行相关工程问题的分析能力,以及将K-means聚类算法应用到具体工程实践分析中,进行样本聚类的能力。专题100分占总成绩的10%专题评价1Web挖掘的发展现状、发展前景以及将来的具体工程用途。11002空间数据挖掘的发展现状、发展前景以及将来的具体工程用途。3流数据挖掘的发展现状、发展前景以及将来的具体工程用途。4数据挖掘可视化的发展现状、发展前景以及将来的具体工程用途。五、考核方式与成绩评定办法考核方式:期末考试(60%),课后作业(30%),专题(10%)。成绩评定办法如下所示。课后作业评分标准采用在线作答方式,在规定的时间内完成电子作业,按照题目规定的分值进行计算总成绩,在线电子

16、作业总共5次,最终成绩取5次作业的平均值。专题评分标准观测点80 - 100分60 - 79分40 - 59分0 - 39分得分完成进度(权重0.1)提前完成按时完成延时完成补交10基本概念掌握(权重0.3)概念清晰,分析得当主要概念清晰,但部分分析有误部分概念清晰,分析中有明显的知识漏洞基本概念不清晰30技术方案在应用领域的合理性(权重0.5)数据挖掘技术方案在应用领域中逻辑合理,思路清晰数据挖掘技术方案的主要思路、过程正确数据挖掘技术方案部分可行数据挖掘技术方案不可行50完成态度(权重0.1)书写工整、清晰,符号、参考文献、格式等按规定执行书写清晰,主要符号、参考文献、格式等按规定执行能够辨识,部分符号、参考文献、格式等按照规定执行不能辨识,符号、参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论