《数据挖掘》教学大纲_第1页
《数据挖掘》教学大纲_第2页
《数据挖掘》教学大纲_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据挖掘》教学大纲一、课程目标《数据挖掘》是大学本科计算机类学生开设的一门专业课程,旨在让学生熟悉数据挖掘分析和知识挖掘方法的思想与技术,掌握重要的数据挖掘基本理论,具备利用数据挖掘来解决实际问题的能力。本课程主要讲授数据挖掘的基本概念,原理、方法和实现技术,具体包括:(1)常用的Python数据挖掘工具的使用(2)数据探索方法(3)数据的预处理方法(4)分类和预测模型(5)集成学习技术(6)聚类分析模型(7)关联挖掘技术(8)时间序列处理技术(9)异常检测模型(10)智能推荐技术此外,要求学生掌握基本的Python语言设计能力,利用numpy、pandas,matplotlib等包进行数据分析的能力。本课程的先行课程包括:《Python程序设计》。二、教学内容和安排本教材建议的学时安排如下,总计72学时。序号内容知识点建议学时(讲授/实践)1绪论1.1数据挖掘概述3/01.2数据挖掘的一般流程1.3数据挖掘环境的配置2Python数据挖掘模块2.1Numpy6/32.2Pandas2.3Matplotlib2.4Scikit-learn3数据探索3.1数据对象和特征3/03.2数据统计描述3.3数据可视化3.4相关性和相似性度量4数据预处理4.1数据集成3/34.2数据清洗4.3数据变换4.4数据规约5特征选择5.1特征选择概述3/05.2过滤法5.3包装法5.4嵌入法6基础分类模型及回归6.1基本理论6/66.2朴素贝叶斯分类器6.3K近邻分类器6.4决策树*6.5人工神经网络*6.6支持向量机6.7模型的性能评价*6.8案例:信用评分模型6.9回归7集成技术7.1基本的集成技术3/37.2随机森林*7.3提升树*7.4案例:电信客户流失预测7.5类别不平衡问题8聚类分析8.1聚类的基本原理6/38.2K-means算法8.3聚类算法的性能评价指标8.4DBSCAN算法层次聚类模型*8.5GMM聚类算法9关联规则分析9.1概述6/39.2Apriori算法生成频繁项集9.3FP-growth算法*9.4E-clat算法*9.5案例:网上零售购物篮数据分析10时间序列挖掘10.1时间序列挖掘概述6/310.2时间序列预处理10.3平稳非白噪声序列建模10.4非平稳序列建模10.5基于Python的实现*10.6案例:基于ARIMA模型的销售额预测11异常检测11.1基于统计的异常检测方法3/011.2基于聚类的异常检测方法*11.3孤立森林方法12*智能推荐*12.1智能推荐概述0/0*12.2基于用户的协同过滤技术*12.3基于物品的协同过滤技术**12.4非负矩阵分解总计总学时:72

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论