![《大数据分析与挖掘》课程教学大纲(2022年-2023年)_第1页](http://file4.renrendoc.com/view/fd5129a78b43c291025e43cb4a5ac531/fd5129a78b43c291025e43cb4a5ac5311.gif)
![《大数据分析与挖掘》课程教学大纲(2022年-2023年)_第2页](http://file4.renrendoc.com/view/fd5129a78b43c291025e43cb4a5ac531/fd5129a78b43c291025e43cb4a5ac5312.gif)
![《大数据分析与挖掘》课程教学大纲(2022年-2023年)_第3页](http://file4.renrendoc.com/view/fd5129a78b43c291025e43cb4a5ac531/fd5129a78b43c291025e43cb4a5ac5313.gif)
![《大数据分析与挖掘》课程教学大纲(2022年-2023年)_第4页](http://file4.renrendoc.com/view/fd5129a78b43c291025e43cb4a5ac531/fd5129a78b43c291025e43cb4a5ac5314.gif)
![《大数据分析与挖掘》课程教学大纲(2022年-2023年)_第5页](http://file4.renrendoc.com/view/fd5129a78b43c291025e43cb4a5ac531/fd5129a78b43c291025e43cb4a5ac5315.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022年-2023年最新大数据分析与挖掘课程教学大纲一、课程基本信息课程代码:16054103课程名称:大数据分析与挖掘英文名称:Bigdataanalysisandmining课程类别:专业选修课学 时:48(理论课:32,实验课:16)学 分:3适用对象:软件工程专业、计算机科学与技术考核方式:考查先修课程:多媒体技术、程序设计、软件工程 二、课程简介本课程从大数据挖掘分析技术实战的角度,结合理论和实践,全方位地介绍基于 Python语言的大数据挖掘算法的原理与使用。本课程涉及的主题包括基础篇和实战篇两 局部,其中基础篇包括:数据挖掘基础,Python数据分析简介,数据探索,数据预处 理
2、和挖掘建模;实战篇包括:电力窃漏电用户自动识别,航空公司客户价值分析,中医 证型关联规那么挖掘,基于水色图像的水质评价,家用电器用户行为分析与事件识别, 应用系统负载分析与磁盘容量预测和电子商务网站用户行为分析及服务推荐。本课程不是一个泛泛的理论性、概念性的介绍课程,而是针对问题讨论基于 Python语言机器学习模型解决方案的深入课程。教师对于上述领域有深入的理论研究 与实践经验,在课程中将会针对这些问题与学员一起进行研究,在关键点上还会搭建 实验环境进行实践研究,以加深对于这些解决方案的理解。通过本课程学习,目的是 让学生能够扎实地掌握大数据分析挖掘的理论与应用。This course in
3、troduces the principle and application of big data mining algorithm based on Python language comprehensively from the perspective of big data mining analysis technology practice, combining theory and practice. This course covers two parts, the basic part and the practical part. The basic part includ
4、es: basic data mining, introduction to Python data analysis, data exploration, data preprocessing and mining modeling. Practical article included: electric power leakage automatic identification of the user, airlines customer value analysis, TCM syndrome association rule mining, based on water quali
5、ty evaluation of color image, household electrical appliances2022年-2023年最新(五)教学方法与手段课堂讲授、多媒体教学。第十一章应用系统负载分析与磁盘容量预测(一)目的与要求1 掌握时间序列模型在实际问题中的使用。(二)教学内容第一节:背景与挖掘目标第二节:分析方法与过程1 数据抽取;2-数据探索分析;3数据预处理;4模型构建。第三节:上机实验(三)重点与难点重点:背景与挖掘目标,时间序列模型的学习,模型构建。难点:模型构建。(四)思考与实践.用其他的方法进行平稳性检验,如游程检验、自相关系数分析?.采用其它的方法进行模型定
6、阶?(五)教学方法与手段课堂讲授、多媒体教学。五、各教学环节学时分配教学环节教学时数课程内容讲课习题课讨 论课实验其他教 学环节小计第一章22第二章22弟二早22第四章426第五章426弟八早426102022年-2023年最新第七章426第八章426第九章224第十章222第十一章222合计321648六、推荐教材和教学参考资源教材:张良均等,Python数据分析与挖掘实践M。机械工业出版社,2022. 公什+? 等节节1 Magnus Lie Hetland, Python基础教程M,人民邮电工出版社,2022. Wes McKinney,禾U用Python进行数据分析M.机械工业出版社5
7、 2022. 3 JiaweiHa,数据挖掘概念与技术M,机械工业出版社,2022.七、其他说明大纲修订人:周锋 修订曰期:大纲审定人:周雅兰审定日期:112022年-2023年最新user behavior analysis and event identification, load analysis and application system disk capacity prediction and e-commerce website user behavior analysis and recommendation service.This course is not a gene
8、ral theoretical, conceptual introduction, but rather an in-depth discussion of problem solving based on the Python language machine learning model. Teachers have in-depth theoretical research and practical experience in the above areas. In the course, they will study these problems together with stu
9、dents, and build experimental environment for practical research on key points to deepen their understanding of these solutions. Through the study of this course, students are expected to master the application of big data analysis and mining. 三、课程性质与教学目的本课程是软件工程和计算机科学与技术专业的选修课。大数据分析与挖掘是从大 量数据中挖掘出隐含
10、的、先前未知的、对决策有潜在价值关系、模式和趋,并用这些 知识和规那么建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。大 数据分析作为大数据时代的核心技术,必将成为高校数学、计算机等专业的重要课程 之一。通过学习本课程,要求学生到达:.掌握大数据分析的基本理论、技术。.掌握目前大数据分析典型的应用场景。.掌握如何分析数据、解决问题、完成相关研究的方法。.具有创新和独立思考意识。四、教学内容及要求基础篇第一章数据挖掘基础( 目的J与要;1 掌握数据挖掘的基本概念;2理解数据挖掘的基本任务;3了解数据挖掘的操作过程;(二)教学内容第一节:某知名连锁餐饮企业的困惑。第二节:从餐饮服务到
11、数据挖掘。第三节:数据挖掘的基本任务。第四节:数据挖掘建模过程。.定义挖掘目标2022年-2023年最新.数据取样.数据探索.数据预处理.数据建模.模型评价第五节:常用的数据挖掘建模工具。(三)重点与难点重点:数据挖掘的基本任务,数据挖掘建模过程。难点:数据挖掘建模过程。(四)思考与实践.什么是数据挖掘?.数据挖掘的基本任务是什么?.数据挖掘的基本建模过程是什么?(五)教学方法与手段课堂讲授、多媒体教学。第二章Python数据分析简介(一)目的与要求.掌握Python平台的搭建;.掌握Python的基本数据结构;. 了解Python数据分析工具。(二)教学内容第一节:搭建Python开发平台1
12、 所要考虑的问题;2基础平台的搭建。第二节:Python使用入门1 运行方式;2-基本命令;3-数据结构;4库的导入与添加。第三节:Python数据分析工具Numpy;Scipy;Matplotlib;Pandas;StatsModels;2022年-2023年最新Scikit-Leam;Keras;Gensim 0第四节:配套资源使用设置(三)重点与难点重点:搭建Python开发平台,Python数据分析工具。难点:Python数据分析工具。(四)思考与实践.不同的操作系统在搭建Python平台时,有何不同?. Python的2.X版本与3.X版本的异同?(五)教学方法与手段课堂讲授、多媒体
13、教学。第三章数据探索(一)目的与要求1 -掌握数据质量分析工具;2-掌握数据特征分析工具;3.了解Python主要探索函数。(二)教学内容第一节:数据质量分析1 -缺失值分析;2-异常值分析;3一致性分析。第二节:数据特征分析1 分布分析;2比照分析;3-统计量分析;4周期性分析;5,贡献度分析6相关性分析。第三节:Python主要数据探索函数1 -基本统计特征函数;2拓展统计特征函数;3统计作图函数。(三)重点与难点重点:数据质量分析,数据特征分析;2022年-2023年最新难点:数据特征分析。(四)思考与实践.脏数据包含哪些情况?.分布分析、比照分析、统计量分析、周期性分析、贡献度分析和相
14、关 性分析分别是什么?它们有何作用?。(五)教学方法与手段课堂讲授、多媒体教学。第四章数据预处理(一)目的与要求1 掌握数据清洗方法;2-掌握数据集成方法;3-数据数据变换方法;4-了解数据规约。(二)教学内容第一节:数据清洗1 -缺失值处理;2-异常值处理。第二节:数据集成1 实体识别;2-冗余属性识别。第三节:数据变换.简单函数变换;.规范化;.连续属性离散化;.属性构造;.小波变换。第四节:数据规约.属性规约;.数值规约。第五节:Python主要数据预处理函数(三)重点与难点重点:数据清洗,数据变换。难点:数据清洗和数据变换。(四)思考与实践.有哪些常用的数据清洗方法?2022年-202
15、3年最新.常用的数据变换方法是什么?。(五)教学方法与手段课堂讲授、多媒体教学。第五章挖掘建模(-)目的与要求.理解分类与回归预测算法;.理解聚类分析算法;.理解时间序列处理算法的原理;.掌握离群点检测算法。(二)教学内容第一节:分类与预测.实现过程;.常用的分类与预测算法;.回归分析;.决策树;.人工神经网络;.分类与预测算法评价;. Python分类预测模型特点。第二节:聚类分析.常用聚类分析算法;. K-Means聚类算法;.聚类分析算法评价;. Python主要聚类分析算法。第三节:关联规那么.常用关联规那么算法;. Apriori 算法。第四节:时序模式.时间序列算法;.时间序列的预
16、处理;.平稳时间序列分析;.非平稳时间序列分析;. Python主要时序模式算法。第五节:离群点检测.离群点检测方法;.基于模型的离群点检测方法;2022年-2023年最新3.基于聚类的离群点检测方法。(三)重点与难点重点:分类和回归预测算法,关联规那么算法和时间序列算法。 难点:机器学习的原理为本章的难点。(四)思考与实践什么是有监督模型?什么是无监督工程?机器学习算法的应用场景有哪些? (五)教学方法与手段课堂讲授、多媒体教学、上机实验。实战篇第六章:电力窃漏电用户自动识别 (-)目的与要求.掌握分类算法在实际应用中的使用。(二)教学内容第一节:背景与挖掘目标第二节:分析方法与过程1234
17、1234.数据抽取;.数据探索分析;.数据预处理;.构建专家样本;.模型构建;.上机实验。(三)重点与难点重点:背景与挖掘目标,模型构建。难点:模型构建。(四)思考与实践.其它领域,如汽车销售行业在税收上也存在少开发票金额、少计收入 等问题,如果使用数据挖掘方法识别偷漏税的纳税人?(五)教学方法与手段课堂讲授、多媒体教学、上机实验。第七章航空公司客户价值分析(-)目的与要求.掌握聚类算法在实际应用中的使用。(二)教学内容2022年-2023年最新第一节:背景与挖掘目标第二节:分析方法与过程.数据抽取;.数据探索分析;.数据预处理;.模型构建。第三节:上机实验(三)重点与难点重点:背景与挖掘目标
18、,模型构建。难点:模型构建。(四)思考与实践.在本章的分析基础之上,对客户流失问题进行深入的分析。(五)教学方法与手段课堂讲授、多媒体教学、上机实验。第八章中医证型关联规那么挖掘(-)目的与要求.掌握关联规那么算法在实际中的应用。(二)教学内容第一节:背景与挖掘目标第二节:分析方法与过程.数据获取;.数据预处理;.模型构建。第三节:上机实验(三)重点与难点重点:背景与挖掘目标,模型构建。难点:模型构建。(四)思考与实践1.利用Apriori关联规那么算法,分析中医证型系数与病程阶段、转移部 位和确诊后几年发现转移3个指标的关联分析。(五)教学方法与手段课堂讲授、多媒体教学。第九章基于水色图像的水质评价(-)目的与要求1 .掌握支持向量机模型在实际应用中的使用。2022年-2023年最新(二)教学内容第一节:背景与挖掘目标第二节:分析方法与过程1 数据预处理;2-模型构建;3,水质评价。第三节:上机实验(三)重点与难点重点:背景与挖掘目标,模型构建。难点:模型构建。(四)思考与实践.如何在Pytho
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年新教材高中历史 第10单元 改革开放与社会主义现代化建设新时期单元小结与测评同步说课稿 新人教版必修《中外历史纲要(上)》001
- 二零二五年度外汇市场分析及交易策略咨询合同
- 2025至2030年中国活接头管件数据监测研究报告
- 二零二五年度二手车抵押交易合同样本
- 2024-2025学年八年级历史上册 第10课 新文化运动说课稿2 北师大版
- 2024-2025学年新教材高中历史 第四单元 资本主义制度的确立 第8课 欧洲的思想解放运动教学说课稿 新人教版必修《中外历史纲要(下)》
- 3《鸿门宴》次要人物分析 说课稿 2023-2024学年统编版高中语文必修下册
- 2025至2030年学校专用供水设备项目投资价值分析报告
- 2025至2030年中国人胎素补水保温护理组合数据监测研究报告
- 2025至2030年中国三声道功率放大器数据监测研究报告
- 第3课+中古时期的西欧(教学设计)-【中职专用】《世界历史》(高教版2023基础模块)
- 山东省济宁市2023年中考数学试题(附真题答案)
- 班组建设工作汇报
- 供应链金融与供应链融资模式
- 工程类工程公司介绍完整x
- 板带生产工艺热连轧带钢生产
- 关键工序特殊过程培训课件精
- 轮机备件的管理(船舶管理课件)
- 统编《道德与法治》三年级下册教材分析
- 国际尿失禁咨询委员会尿失禁问卷表
- 运动技能学习中的追加反馈
评论
0/150
提交评论