




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数据挖掘与统计应用》教学大纲课程编号:121063A课程类型:□通识教育必修课□通识教育选修课□学科基础课□专业核心课☑专业提升课□专业拓展课总学时:48讲课学时:32实验(上机)学时:16学分:3考试类型:☑考试☑考查适用对象:经济统计学统计学数学与应用数学(金融方向)专业□是☑否适合作为其他专业学生的个性化选修课先修课程:统计学、计算机基础一、教学目标该课程是针对统计学院所有专业本科学生开设的,其特点是不以数学理论和推导为主,而是在学生了解数据挖掘的基本概念和基本理论的基础上,介绍典型数据挖掘方法的基本思路和算法,教会学生能够利用数据挖掘软件分析实际数据。本课程主要以国际通用权威数据挖掘软件为主要教学工具,以实际工作中的数据进行实训教学。达到的教学目标是:增强学生实际动手解决问题的能力,学会利用数据挖掘软件处理实际数据。目标1:应用专业知识,解决数据分析问题 目标2:可以建立统计模型,获得有效结论 目标3:掌握统计软件及常用数据库工具的使用目标4:关注国际统计应用的新进展目标5:基于数据结论,提出决策咨询建议目标6:具有不断学习的意识 目标7:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有扎实统计专业学识,坚韧奋斗进取品格的社会主义新青年。二、教学内容及其与毕业要求的对应关系本课程重点讲授常用数据挖掘算法,包含联机数据分析与数据仓库、数据预处理、探索性数据分析、变量选择以及关联、聚类、分类、异常值侦测、时序等经典数据挖掘算法。其理论部分只介绍这些方法的基本思路与算法,授课的重点在于每一种挖掘算法,包括:每种算法的基本思路、应用前提、算法评判标准、软件的实现及输出结果的理解和解释,并能给出结论;介绍数据挖掘软件的应用,主要以一种数据挖掘软件并结合实际数据进行分析。以多媒体的课件讲授为主,同时上机,上机完成每种方法的练习。采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占30%。三、各教学环节学时分配以表格方式表现各章节的学时分配,表格如下:教学课时分配序号章节内容讲课实验其他合计1数据探索与预处理42
62模型结果评估61
73决策树41
54关联规则61
75聚类分析31
46Logistic回归31
47神经网络41
58数据挖掘软件介绍(SASEM)64
10合计3612048四、教学内容第1章 数据探索与预处理1.1 数据范围和分布标准化(了解)1.2 数据可视化(了解)1.3 缺失值插补(理解与掌握)1.4 属性变量的处理(掌握)1.5 变量的筛选(掌握)课程思政切入点:通过探索数据,培养学生的探索精神。第2章 模型结果评估2.1 概述(了解)2.2 分类规则评估面面观(理解)2.3 误分率(掌握)2.4 收益矩阵(掌握)2.5 评估两分类的规则(掌握和应用)2.6 评估多分类的规则(掌握和应用)2.7 常用模型评估和比较准则(应用)课程思政切入点:通过对错误分类细分中的两类错误分析,培养学生平衡对立矛盾的思想。第3章 决策树3.1 树的建模过程(理解)3.2 树的常用算法(掌握)3.3 树在数据挖掘中的应用(应用)3.4 决策树案例分析(应用)课程思政切入点:通过决策树的讲解,可以使学生进一步了解人类大脑进行决策的步骤。第4章 关联规则4.1 概述(了解)4.2 市场购物篮分析(理解)4.3 使用关联规则节点(了解)4.4 理解关联规则(理解)4.5 非二元变量的关联分析(掌握)4.6 负关联分析 (掌握)4.7 序列关联分析(理解)4.8 关联规则案例分析(应用)课程思政切入点:通过关联规则的学习,培养学生用联系的观点看待各种问题。第5章 聚类分析5.1 背景(了解)5.2 距离度量(理解)5.3 聚类方法(掌握)5.4 变量聚类(理解)5.5 实践中的考虑(了解)5.6 聚类案例分析(应用)课程思政切入点:通过聚类分析中差异度的讲解,培养学生对事物间差异进行度量的能力。第6章 Logistic回归6.1 传统Logistic回归简介(了解)6.2 数据挖掘中Logit判别的其他考虑(了解)6.3 logistic回归案例分析(掌握与应用)课程思政切入点:通过对Logistic回归中风险最小化的分析,培养学生在实际工作学习和生活中管控风险的能力。第7章 神经网络7.1 神经网络简介(了解)7.2 神经网络基本组成(理解)7.3 训练神经网络(掌握)7.4 模型复杂性 (掌握与应用)课程思政切入点:通过对神经网络的学习,使学生进一步了解人类大脑的运作机理。第8章 EnterpriseMiner介绍8.1 EM数据挖掘概述(了解)8.2 使用项目进行数据挖掘(了解)8.3 建立流程图(掌握)8.4 流程图逻辑组织(掌握)8.5 节点中的通用特征(理解)8.6 数据结构示例(应用)8.7 流程图示例(应用)课程思政切入点:通过流程图的学生,培养学生在面临问题时解决问题的规划逻辑能力。教学重点、难点:第二~七章为重点内容,第二章为难点内容课程的考核要求:全面掌握数据挖掘常用算法并综合运用数据整理和分析方法复习思考题:大数据背景下,数据挖掘与数据分析的区别与联系?数据可视化与统计挖掘如何结合?数据挖掘在实际工作中的重要作用如何?五、考核方式、成绩评定本课程一般按闭卷、开卷或论文方式考核,卷面一般占70%,考勤与平时作业一般占30%。六、主要参考书及其他内容数据挖掘导论,陈封能,斯坦巴赫,库玛尔著.范明,范宏建等译,人民邮电出版社2011年第2版HandbookofStatisticalAnalysisandDataMiningApplications.RobertNisbet,JohnElder,andGaryMinerTheElementsofSta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆政法学院《中国传统文化经典著作选读》2023-2024学年第二学期期末试卷
- 淮北师范大学《细胞生物学专题》2023-2024学年第二学期期末试卷
- 惠州卫生职业技术学院《食品工程制图》2023-2024学年第二学期期末试卷
- 山西省吕梁市交城县2025届数学三下期末检测试题含解析
- 石家庄工程职业学院《管理系统工程》2023-2024学年第二学期期末试卷
- 江苏省苏州市常熟市2024-2025学年六年级下学期小升初数学考前押题卷含解析
- 上海大学市北附属中学2025年高考信息卷语文试题含解析
- 黑龙江省牡丹江管理局北斗星协会达标名校2025届下学期初三语文试题第一次质量检测试题考试试卷含解析
- 山东省枣庄八中东校2024-2025学年高三第二次质量监测物理试题含解析
- 永善县2025届三下数学期末经典模拟试题含解析
- 高二生物-2025-2025学年高二年级下册期中生物试卷
- 第19课 清朝君主专制的强化-2024-2025学年七年级历史下册互动课堂教学设计宝典
- 2 含有两级的混合运算(教学设计)-2023-2024学年二年级下册数学人教版
- 天然气工程施工组织设计方案
- 电机与电气控制技术(第3版)(微课版)(AR版)授课计划
- 实验活动7 粗盐中难溶性杂质的去除课件-2024-2025学年人教版化学九年级下册
- 2025年开封大学单招职业技能测试题库必考题
- 班级管理措施与学生心理健康
- 高中主题班会 扬中国精神承青年担当团课课件-高一上学期爱国主义教育主题班会
- 《淋巴瘤基础知识》课件
- 滴滴新手司机培训
评论
0/150
提交评论