《数据分析与挖掘》教学大纲_第1页
《数据分析与挖掘》教学大纲_第2页
《数据分析与挖掘》教学大纲_第3页
《数据分析与挖掘》教学大纲_第4页
《数据分析与挖掘》教学大纲_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据分析与挖掘》教学大纲适用范围:202X版本科人才培养方案课程代码:09150811课程性质:专业选修课学分:3学分学时:48学时(理论32学时,上机16学时)先修课程:高等数学、线性代数、概率论与数理统计、Python应用基础后续课程:文献阅读与论文写作适用专业:商务经济学开课单位:经济学院一、课程说明《数据分析与挖掘》是商务经济学专业的一门专业选修课。该课程旨在为学生系统地传授数据分析与挖掘的核心知识和实操技能。通过这门课程的学习,学生将深入了解数据分析的流程、数据获取的途径、探索性数据分析的方法以及数据预处理的技巧。同时,课程还将重点介绍数据挖掘算法的基础理论,帮助学生掌握数据挖掘的基本原理和技术。为了使学生更好地理解和应用所学知识,课程还结合了大量相关案例,通过理论讲解与实操练习相结合的方式,提高学生的实际操作能力。通过课程学习,学生将能够熟练掌握基本的数据分析方法和常用工具,为日后独立完成日常数据分析与挖掘工作打下坚实的基础。二、课程目标通过本课程的学习,使学生达到如下目标:课程目标1:全面掌握商务数据分析的基本概念,深入理解Python数据分析的基础知识。具体涵盖数据获取的方法、探索性数据分析的技巧、数据预处理的重要性以及数据挖掘算法的基本原理。熟悉数据分析与挖掘的主要方法,如分类与预测、聚类分析、时序预测、关联规则挖掘和智能推荐等。通过系统学习,建立起坚实的数据分析与挖掘知识体系,为后续的实践应用奠定理论基础。课程目标2:能够熟练运用Python语言进行数据探索、数据预处理以及各类数据分析与挖掘操作。通过贴近生活的场景案例,如O2O优惠劵、超市零售、餐饮企业等,学会将知识点与真实案例相结合,进一步掌握数据分析与数据挖掘的流程和技能。通过不断的实践练习,能够独立完成日常数据分析与挖掘工作,提升解决实际问题的能力和撰写数据分析报告的能力。课程目标3:通过了解数据分析的相关国家发展方向、行业政策以及知识产权,增强对数据分析行业的认识和理解。遵守数据分析师的职业准则与素质要求。树立环保意识、法律意识以及工匠精神。培养安全生产意识、职业道德、技能宝贵观念、科学探索精神、独立思考能力和思辨能力等,全面提升综合素质。三、课程目标与毕业要求《数据分析与挖掘》课程教学目标对商务经济学专业毕业要求的支撑见表1。表1课程教学目标与毕业要求关系毕业要求指标点课程目标支撑强度2.问题分析2.3能根据相关经济学和管理学的基本原理并结合文献研究比较不同的解决方案,分析商务经济活动的影响因素,最终获得有效结论。课程目标2:能够熟练运用Python语言进行数据探索、数据预处理以及各类数据分析与挖掘操作。通过贴近生活的场景案例,如O2O优惠劵、超市零售、餐饮企业等,学会将知识点与真实案例相结合,进一步掌握数据分析与数据挖掘的流程和技能。通过不断的实践练习,能够独立完成日常数据分析与挖掘工作,提升解决实际问题的能力和撰写数据分析报告的能力。M4.研究4.2能够根据对象特征、研究方法和技术路线,运用市场调研、数据挖掘、统计分析、模拟仿真等方法设计解决方案并获取相关数据。课程目标1:全面掌握商务数据分析的基本概念,深入理解Python数据分析的基础知识。具体涵盖数据获取的方法、探索性数据分析的技巧、数据预处理的重要性以及数据挖掘算法的基本原理。熟悉数据分析与挖掘的主要方法,如分类与预测、聚类分析、时序预测、关联规则挖掘和智能推荐等。通过系统学习,建立起坚实的数据分析与挖掘知识体系,为后续的实践应用奠定理论基础。课程目标2:能够熟练运用Python语言进行数据探索、数据预处理以及各类数据分析与挖掘操作。通过贴近生活的场景案例,如O2O优惠劵、超市零售、餐饮企业等,学会将知识点与真实案例相结合,进一步掌握数据分析与数据挖掘的流程和技能。通过不断的实践练习,能够独立完成日常数据分析与挖掘工作,提升解决实际问题的能力和撰写数据分析报告的能力。H4.3能够综合多学科专业知识对各种商务数据和实证结果进行分析和解释,获得研究商务经济复杂问题合理有效的结论。课程目标2:能够熟练运用Python语言进行数据探索、数据预处理以及各类数据分析与挖掘操作。通过贴近生活的场景案例,如O2O优惠劵、超市零售、餐饮企业等,学会将知识点与真实案例相结合,进一步掌握数据分析与数据挖掘的流程和技能。通过不断的实践练习,能够独立完成日常数据分析与挖掘工作,提升解决实际问题的能力和撰写数据分析报告的能力。M5.使用现代工具5.2能够选择与使用恰当的工具和软件,对复杂商务经济问题进行分析、计算与设计。课程目标2:能够熟练运用Python语言进行数据探索、数据预处理以及各类数据分析与挖掘操作。通过贴近生活的场景案例,如O2O优惠劵、超市零售、餐饮企业等,学会将知识点与真实案例相结合,进一步掌握数据分析与数据挖掘的流程和技能。通过不断的实践练习,能够独立完成日常数据分析与挖掘工作,提升解决实际问题的能力和撰写数据分析报告的能力。课程目标3:通过了解数据分析的相关国家发展方向、行业政策以及知识产权,增强对数据分析行业的认识和理解。遵守数据分析师的职业准则与素质要求。树立环保意识、法律意识以及工匠精神。培养安全生产意识、职业道德、技能宝贵观念、科学探索精神、独立思考能力和思辨能力等,全面提升综合素质。M注:表中“H(高)、M(中)”表示课程与相关毕业要求的关联度。四、教学内容、基本要求与学时分配1.理论部分理论部分的教学内容、基本要求与学时分配见表2表2教学内容、基本要求与学时分配教学内容教学要求,教学重点难点理论学时上机学时对应的课程目标1.商务数据分析与挖掘概述1.1数据分析基础概念1.2数据挖掘概述1.3数据分析与挖掘流程1.4商务数据分析与挖掘应用场景1.5数据分析与挖掘常用工具教学要求:使学生了解商务数据分析的基础知识,了解数据挖掘,掌握数据分析与挖掘流程,了解商务数据分析与挖掘常见应用场景,了解数据分析与挖掘常用工具。重点:数据分析与挖掘流程。难点:数据分析与挖掘流程。21、32.数据探索2.1数据校验2.2数据特征分析教学要求:使学生掌握一致性分析的方法、缺失值分析的方法、异常值分析的方法、描述性统计分析的方法、分布分析的方法、对比分析的方法、周期性分析的方法、贡献度分析的方法、相关性分析的方法。重点:Python中数据质量分析的方法、数据特征分析方法。难点:常用的Python基本统计分析和作图函数。421、2、33.数据预处理3.1数据清洗3.2数据变换3.3数据合并教学要求:使学生掌握重复值、缺失值、异常值处理方法,掌握数据规范化和离散化的方法,掌握独热编码的方法,掌握多表合并的方法,掌握分组聚合的方法。重点:Python中数据清洗、数据变换、数据合并的方法。难点:数据变换。441、2、34.分类与回归4.1实现过程4.2常用的分类和回归算法4.3回归分析4.4决策树4.5分类与回归算法评价4.6常见的分类与回归算法4.7综合案例-O2O优惠券个性化投放教学要求:使学生了解常用的分类与回归算法,掌握回归分析的原理,掌握决策树算法的原理,掌握分类与回归算法的评价方法,分析O2O优惠券使用的背景和数据,熟悉O2O优惠券使用预测的分析步骤与流程。重点:分类算法的应用场景,决策树的原理与应用,分类与回归算法评价。难点:分类与回归模型在实际案例中的应用。421、35.聚类5.1常用的聚类分析算法5.2K-Means算法5.3聚类分析算法评价5.4常用的聚类分析算法5.5综合案例-信用卡高风险客户识别教学要求:使学生了解常用聚类分析算法,掌握K-Means聚类算法的原理,掌握聚类分析算法的评价方法,分析信用卡高风险客户识别背景和数据,应用聚类算法熟悉信用卡高风险客户识别的步骤与流程,重点:应用K-Means聚类算法对无标签数据进行聚类分析,提取数据特征,对聚类结果进行特征分析。难点:根据案例用K-Means聚类算法对根据信用卡客户数据进行客户分群,对聚类结果进行特征分析的方法。421、2、36.关联规则6.1常用关联规则算法6.2Apriori算法原理与实现6.3综合案例-零售商品购物篮分析教学要求:使学生了解Python主要关联规则算法,掌握Apriori算法的原理。重点:应用python实现Apriori算法,熟悉购物篮分析的实现流程与步骤。难点:关联规则模型在实际案例中的应用。421、2、37.时间序列7.1时间序列分析方法和模型7.2时间序列的预处理7.3平稳时间序列分析7.4非平稳时间序列分析7.5常见的时序模式算法7.6综合案例-金融服务机构资金流量预测教学要求:使学生了解Python主要时序模式算法,掌握时间序列预处理的方法,了解平稳时间序列分析,掌握非平稳时间序列分析。熟悉金融服务机构资金流量预测的步骤与流程,掌握数据平稳性的检验和处理方法,以及白噪声检验,掌握ARIMA模型对资金流量进行预测,掌握对ARIMA模型的检验。重点:时间序列数据预处理方法,数据平稳性的检验和处理方法,以及白噪声检验,非平稳时间序列分析。难点:用ARIMA模型对资金流量进行预测,掌握对ARIMA模型的检验。421、2、38.智能推荐8.1常见的智能推荐算法8.2智能推荐模型评价8.3协同过滤推荐8.4基于流行度的推荐8.5综合案例-电视产品个性化推荐教学要求:了解Python主要智能推荐算法,掌握智能推荐模型的评价方法,掌握协同过滤推荐算法的原理。分析电视产品个性化推荐的背景和数据,熟悉电视产品个性化推荐的步骤与流程,了解基于物品的协同过滤算法,了解基于流行度的推荐算法。重点:熟悉基于物品的协同过滤算法和基于流行度的推荐算法,构建推荐模型,掌握推荐系统的评价方法,对构建的推荐模型进行模型评价。难点:构建用户画像标签,构建推荐模型,对构建的推荐模型进行模型评价。421、2、39.数据分析报告9.1初步认识数据分析报告9.2数据分析报告的准备与撰写流程9.3数据分析报告的结构9.4撰写数据分析报告的注意事项教学要求:使学生掌握数据分析报告的写作原则,掌握数据分析报告的撰写流程,掌握数据分析报告的结构,掌握撰写数据分析报告的注意事项。重点:熟练编写数据分析报告。21、2合计32162.上机部分上机部分的教学内容、基本要求与学时分配见表3表3上机内容与学时上机项目上机内容和要求上机学时对应的课程目标1.数据探索上机内容:通过案例练习利用python进行数据分析的指标和方法。上机要求:掌握不同数据分析方法和实现。21、22.数据预处理上机内容:通过案例练习利用python进行数据清洗、集成、规约。上机要求:掌握数据缺失值、异常值的处理方法,掌握数据集成和规约的方法。41、23.分类与回归上机内容:通过综合案例利用python进行数据分类、回归预测。上机要求:掌握回归分析的原理,决策树算法的原理,分类与回归算法的评价方法。22、34.聚类上机内容:通过综合案例利用python进行k-means聚类分析,并评价聚类结果。上机要求:掌握k-means聚类算法原理与应用,使用Scikit-learn包实现数据聚类,掌握聚类分析算法的评价方法。22、35.关联规则上机内容:通过综合案例利用python进行关联规则分析。上机要求:掌握关联规则分析应用场景,Apriori算法原理与应用,熟悉购物篮分析的实现流程与步骤。22、36.时间序列上机内容:通过综合案例利用python进行时间序列分析。上机要求:熟悉金融服务机构资金流量预测的步骤与流程,掌握数据平稳性的检验和处理方法,以及白噪声检验,掌握ARIMA模型对资金流量进行预测,掌握对ARIMA模型的检验。22、37.智能推荐上机内容:通过综合案例利用python进行智能推荐。上机要求:熟悉基于物品的协同过滤算法和基于流行度的推荐算法,构建推荐模型,掌握推荐系统的评价方法,对构建的推荐模型进行模型评价。22、3合计16五、教学方法及手段本课程紧密围绕OBE教学理念,坚持以学生为中心,注重理论与实践的有机结合。在教学过程中,充分利用现代网络资源,结合多媒体课件和实际项目应用案例,全面提升学生的学习效果和实操技能。理论讲授环节,采用学习通、大学慕课等网络资源,为学生提供丰富多样的学习材料和互动平台。这些资源不仅涵盖了课程的基础知识和核心概念,还包含了大量的案例分析和前沿研究成果,有助于学生深入理解数据分析与挖掘的原理和应用。同时,配合多媒体课件进行课堂讲授,通过图表、动画等形式直观展示复杂的数据结构和算法流程,提高学生的学习兴趣和理解能力。上机实践环节,选取实际案例作为教学素材,让学生在模拟的工作环境中体验数据分析与挖掘的全过程。通过动手实践,学生可以亲身感受理论知识的实际应用,检验自己对内容的理解程度,并在实践中不断提升自己的技能水平。此外,还注重与学生的互动交流。课下,通过微信、钉钉或面谈等方式及时解答学生的疑问,了解学生的学习进度和困难,并根据学生的反馈调整教学策略,确保每个学生都能得到充分的关注和指导。六、课程资源1.推荐教材(1)黄恒秋.Python金融数据分析与挖掘实战[M].北京:人民邮电出版社,2020.(2)python数据分析与挖掘实战[M].北京:清华大学出版社,2021.2.参考书(1)喻梅.数据分析与数据挖掘[M].北京:清华大学出版社,2018.(2)陈红波.数据分析从入门到进阶[M].北京:机械工业出版社,2019.(3)伊恩·古德费洛.深度学习[M].北京:人民邮电出版社,2017.(4)周志华.机器学习[M].北京:清华大学出版社,2016.(5)黑马程序员.数据分析思维与可视化[M].北京:清华大学出版社,2019.3.期刊(1)计算机学报.中国计算机学会与中国科学院计算技术研究所.(2)统计与决策.湖北省统计局统计科学研究所.(3)计算机仿真.中国航天科工集团公司第十七研究所.(4)模式识别与人工智能.中国自动化学会;国家智能计算机研究开发中心;中国科学院合肥智能机械研究所.(5)Data&KnowledgeEngineering,ElsevierScience.4.网络资源(1)国家统计局/(2)UCIMachineLearningRepository/ml/index.php(3)wind经济数据库/NewSite/edb.html(4)CSMAR经济金融数据库/七、课程考核对课程目标的支撑课程成绩由过程性考核成绩和期末考核成绩两部分构成,具体考核/评价细则及对课程目标的支撑关系见表4。表4课程考核对课程目标的支撑考核环节占比考核/评价细则课程目标123过程性考核课堂表现10(1)根据课堂出勤情况和课堂回答问题情况进行考核,满分100分。(2)以平时考核成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√√442作业10(1)主要考核学生对各章节知识点的复习、理解和相关技术的掌握程度,满分100分;(2)每次作业单独评分,取各次成绩的平均值作为此环节的最终成绩。(3)以作业成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√73小组任务10(1)根据每次小组任务内容单独评分,满分100分;(2)每次小组任务单独评分,取各次成绩的平均值作为此环节的最终成绩。(3)以小组任务成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√64上机20(1)根据每个上机的上机操作完成情况和上机报告质量单独评分,满分100分;(2)每次上机单独评分,取各次上机成绩的平均值作为此环节的最终成绩。(3)以上机成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√√785期末考核50(1)期末考核总成绩为100分,以成绩乘以其在总评成绩中所占的比例计入课程总评成绩。(2)主要考核数据准备与处理、数据分析常用方法、数据挖掘算法、撰写数据分析报告等内容。(3)考试形式可采用课程小论文、综述报告(调查报告)、大作业设计等。√√√202010合计:100分384121八、考核与成绩评定1.考核方式及成绩评定考核方式:本课程主要以课堂表现、作业、小组任务、上机、期末大作业等方式对学生进行考核评价。考核基本要求:考核总成绩由期末考核和过程性考核成绩组成。其中:期末考核成绩为100分(权重50%),考试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论