《数据挖掘》课程教学大纲_第1页
《数据挖掘》课程教学大纲_第2页
《数据挖掘》课程教学大纲_第3页
《数据挖掘》课程教学大纲_第4页
《数据挖掘》课程教学大纲_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据挖掘》教学大纲一、课程基本信息课程名称数据挖掘DataMining课程编码SEM223221030开课院部经济管理学院课程团队数据挖掘与智能决策教学团队学分3.0课内学时52讲授40实验12上机0实践0课外学时0适用专业工程管理授课语言中文先修课程程序设计(Python)、线性代数、概率论与数理统计、运筹学、管理统计学课程简介(限选)本课程是工程管理专业学生必修的一门重要的学科基础课。课程主要讲授数据挖掘标准流程和典型机器学习算法,介绍Python数据挖掘与应用。通过本课程的学习,学生应了解数据挖掘标准流程,理解数据挖掘的基本概念和方法,掌握数据挖掘相关模型的基础理论知识;针对数据挖掘的分类、聚类、关联分析等问题,能对数据进行有效的预处理,选择合适的算法并进行参数调优,进行数据分析与挖掘以获得智能决策支持信息;掌握专门面向机器学习的Python包Scikit-learn,能够通过Python编程进行具体的数据挖掘,具备数据分析和挖掘的能力。Thiscourseisanimportantcompulsorybasiccourseforstudentsmajoringinengineeringmanagement.Thecoursemainlyteachesdataminingstandardprocessesandtypicalmachinelearningalgorithms,andintroducesPythondataminingandapplication.Throughthestudyofthiscourse,studentsshouldunderstandthestandardprocessofdatamining,andunderstandthebasicconceptsandmethodsofdatamining,masterthebasictheoreticalknowledgeofdataminingrelatedmodels.Focusingontheclassification,clustering,associationanalysisandotherissuesofdatamining,studentsshouldknowhowtoeffectivelypreprocessthedata,selecttheappropriatealgorithmandperformparametertuning,andconductdataanalysisandminingtoobtainintelligencedecisionsupportinformation.StudentsshouldmasterthePythonpackageScikit-learnwhichisspecificallyusedformachinelearningandbeabletododataanalysisandminingwithPythonprogramming.负责人大纲执笔人审核人二、课程目标序号代号课程目标OBE毕业要求指标点任务自选1M1目标1:理解数据挖掘的基本概念和流程,掌握数据挖掘相关算法的基础理论知识是2.62.62M2目标2:针对具体数据挖掘问题,能选择合适的算法,进行Python编程,数据分析与挖掘以获得智能决策支持信息是3.53.5三、课程内容序号章节号标题课程内容/重难点支撑课程目标课内学时教学方式课外学时课外环节1第1章第1章数据挖掘概述本章重点难点:数据挖掘的概念、数据挖掘的流程及主要任务课程思政:遵纪守法,尊重个人隐私/////21.11.1数据挖掘简介数据挖掘的需求和基本定义,应用案例讨论M12讲授、讨论1自主学习31.21.2数据挖掘的流程数据挖掘涉及的领域,数据挖掘的流程,数据挖掘的主要任务,常见的数据挖掘软件M12讲授、讨论1自主学习4第2章第2章数据的理解与预处理本章重点难点:数据对象与属性类型、数据的基本统计描述与可视化、数据预处理方法////52.12.1数据对象与属性类型数据对象与属性术语表达,标称属性、二元属性、有序属性、数值型属性M21讲授1自主学习62.22.2数据的基本统计描述与可视化集中趋势的度量,离散度的度量,数据的图形描述与可视化M21讲授1作业72.32.3数据预处理方法数据清洗,数据整合,数据缩减,数据变换与离散化M22讲授1自主学习8第3章第3章模型评价与选择本章重点难点:交叉验证、超参数选择、数据挖掘方法比较////93.13.1旁置法估计训练和测试集合的划分,预测性能的置信区间,旁置法、交叉验证、留一交叉验证法、自助法,验证集与超参数选择M12讲授1作业103.23.2数据挖掘方法比较T检验比较,损失函数,分类模型评价指标,成本计算,回归性能指标M12讲授1自主学习11第4章第4章贝叶斯网络本章重点难点:朴素贝叶斯分类器、贝叶斯网络学习算法////124.14.1朴素贝叶斯分类器类别型朴素贝叶斯分类器、高斯朴素贝叶斯、多项式朴素贝叶斯M22讲授1作业134.24.2贝叶斯网络贝叶斯网络定义,贝叶斯网络学习算法的构建,K2,TANM22讲授1自主学习14第5章第5章决策树本章重点难点:决策树常用算法、剪枝////155.15.1决策树常用算法OneR算法,连续性数据离散化方法,ID3算法,C.5算法,CART算法M21讲授1作业165.25.2决策树剪枝方法预剪枝,后剪枝,后剪枝的两种方式,剪枝的原则M21讲授1自主学习175.35.3集成学习装袋法、提升法、随机森林M22讲授1自主学习18第6章第6章聚类分析本章重点难点:K-Means聚类、层次聚类,DBSCAN聚类////196.16.1K-Means聚类相似度测度,K-Means聚类算法,对变量的预处理,K-Means聚类的提升M21讲授1作业206.26.2层次聚类层次聚类的特点,类别层次合并的方法,聚类数目的确定M21讲授1自主学习216.36.3DBSCAN聚类DBSCAN聚类方法的基本参数、基本概念和算法,聚类质量的评价M22讲授1自主学习22第7章第7章关联规则挖掘本章重点难点:覆盖算法、Apriori算法////237.17.1覆盖算法:建立规则规则与树,覆盖算法,规则与决策列表M22讲授1自主学习247.27.2Apriori算法产生频繁项集,寻找频繁项集,依据频繁项集产生关联规则,高效地生成规则,关联规则测度指标M22讲授1作业25第8章第8章线性模型本章重点难点:线性回归模型正则化项,logistic回归,感知机的线性分类////268.18.1线性回归模型线性回归模型表达及求解,正则化项对应的算法,logistic回归模型表达及求解M22讲授1自主学习278.28.2感知机感知机的线性分类,Winnow的线性分类M22讲授1自主学习28第9章第9章神经网络本章重点难点:误差逆传播算法,全局最小与局部最小,深度学习////299.19.1多层神经网络神经元模型,多层神经网络,误差逆传播算法,全局最小与局部最小M22讲授1自主学习309.29.2深度学习卷积神经网络,循环神经网络,深度学习流行框架M22讲授1自主学习31第10章第10章支持向量机本章重点难点:支持向量机的模型求解、核函数的应用,支持向量回归////3210.110.1支持向量机分类间隔与支持向量,对偶问题,核函数,软间隔与正则化M22讲授1作业3310.210.2支持向量回归基于线性和非线性核函数的支持向量回归M22讲授1自主学习34实验1实验1:分类问题—银行理财产品电话销售预测针对于银行有关客户个人信息、通话过程、以往销售活动等因素的数据,进行描述性分析,选取合适的特征,构建合理的模型,并根据分类准确度等指标和工具评估模型的预测效果。M24上机2撰写报告35实验2实验2:聚类分析—网络零售客户聚类通过对网络零售客户个人信息的聚类,发现客户群的特征,以实现对目标客户的准确理解和客户定位,便于后期针对不同特点的客户采用不同的营销策略。M24上机2撰写报告36实验3实验3:预测问题—工业蒸汽量预测选择经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。M24上机2撰写报告四、考核方式序号考核环节操作细节总评占比1平时作业1.每周布置1道题目。2.成绩采用百分制,根据作业完成准确性、是否按时上交、是否独立完成评分。3.考核学生对电力拖动自动控制系统基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力题型主要有作图、分析和计算题。15%2实验1.本课程12个学时实验,共3次实验。2.成绩采用百分制,根据实验完成情况评分。3.考核学生对机器学习算法包Scikit-learn的应用能力,针对不同的数据挖掘问题,进行数据分析与挖掘以获得智能决策支持信息。15%3结课报告考核学生能够应用数据挖掘的相关理论方法,对数据进行科学的加工和分析处理,提供决策支持并进行阐述和交流的能力:1.从业务需求出发,解析为合适的数据挖掘问题,能对数据进行有效的预处理和统计性描述。2.针对数据挖掘的分类、聚类、关联分析等问题,能够选择合适的算法并进行参数调优,进行数据分析与挖掘。3.将数据挖掘结果进行解释和可视化,能够获得智能决策支持信息。40%4课堂表现随机检查学生上课精神状态、回答问题情况10%5线上互动使用雨课堂随堂测验,主要考核学生对数据挖掘基本知识的掌握,学生综合运用所学知识分析问题、解决问题的能力,题型主要有简答题、选择题、填空题、计算题等。20%五、评分细则序号课程目标考核环节大致占比评分等级1M1平时作业30%A-按时提交作业,数据挖掘和模型算法等基本知识点理解无误。B-按时提交作业,数据挖掘和模型算法等基本知识点理解存在少量错误。C-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在少量错误。D-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在错误。E-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在大量错误。2M1课堂表现20%A-回答问题积极,数据挖掘和模型算法等基本知识点理解无误。B-回答问题积极,数据挖掘和模型算法等基本知识点理解存在少量错误。C-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在少量错误。D-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在错误。E-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在大量错误。3M1线上互动50%根据雨课堂导出的测试成绩标准化评价[A,B,C,D,E]=[90-100,80-89,70-79,60-69,0-59]4M2实验40%A-按时提交实验报告,能正确地进行Python编程,算法性能优秀,能得到较好的数据分析与挖掘结果。B-按时提交实验报告,能进行Python编程,但算法性能不好,能得到数据分析与挖掘的结果。C-不按时提交实验报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果。D-不按时提交实验报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果。E-不按时提交实验报告,不能正确地进行Python编程,得到的数据分析与挖掘结果错误。5M2结课报告60%A-按时提交结课报告,能正确地进行Python编程,算法性能优秀,能得到较好的数据分析与挖掘结果。B-按时提交结课报告,能进行Python编程,但算法性能不好,能得到数据分析与挖掘的结果。C-不按时提交结课报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果。D-不按时提交结课报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果。E-不按时提交结课报告,不能正确地进行Python编程,得到的数据分析与挖掘结果错误。评分等级说明:[A,B,C,D,E]=[90-100,80-89,70-79,60-69,0-59];六、教材与参考资料序号教学参考资料明细1图书|DataMining:ConceptsandTechniques(英文版第三版),JiaweiHan,机械工业出版社,2014.07,ISBN:9787111374312.(*主教材)2图书|机器学习,周志华,清华大学出版社,2016.01,ISBN:9787302423287.3MOOC|Python快速入门,张敏,泰迪云课堂.4期刊论文|UCIrvineMachineLearningRepository,Dua,D.,UniversityofCalifornia,School

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论