版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、商业智能与数据挖掘课程教学大纲课程代码:ELBU2025课程性质:跨专业选修课授课对象:工商管理、电子商务、市场营销、经济、会计等专业开课学期:秋总 学时:36学时 学 分:2学分讲课学时:18学时 实验学时:0学时 实践学时:18学时指定教材:课程讲义参考书目:Carlo Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making, Wiley, 2009Johannes Ledolter, Data Mining and Business Analytics with R, Wiley
2、, 2013Michael J. Crawley, The R Book (2nd Edition), Wiley, 2013杰弗里 D. 坎姆 (Jeffrey D. Camm) 等 著,商业数据分析,耿修林,宋哲 译,机械工业出版社,2017约翰尼斯·莱道尔特 (Johannes Ledolter) 著,数据挖掘与商务分析:R语言,宋涛 等 译,机械工业出版社,2016教学目的: 企业信息化经历几十年的发展,已经由最初的提高效率逐渐向改善业务决策质量的智能商务发展。大数据的热潮更是推波助澜,引领商业智能与数据挖掘向纵深方向前进。本课程力图权衡理论与实践,依托R语言来完成商业智能与
3、数据挖掘的实践分析任务,定位于对商业分析方法感兴趣的高年级学术。主要教学目标包括:1. 介绍商业智能与数据挖掘的方法论和相关概念;2. 掌握数据挖掘的实践操作(基于R语言);3. 理解商业智能和数据挖掘的在运营管理和决策支持中的应用。第一章 商业智能概论 课时:1周,共2课时教学内容第一节 商业智能简介 一、课程简介 介绍课程主要内容,授课方式,课程安排,学习目标,考核方式及注意事项 二、商业智能的基本概念 商业智能的定义商业智能的简史商业智能行业动态商业智能的架构商业智能系统的组成部分商业智能与企业决策 三、商业智能与道德 第二节 R语言简介 一、R语言概述 二、R语言的运行环境 三、R语言
4、的帮助实践内容第三节 R语言入门 一、R的下载和安装 二、R的运行 三、RStudio软件熟悉 四、R语言软件包的获取、安装及加载 要点:熟悉软件基本规则,掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. 商业智能的目标是什么?2. 商业智能系统的组成部分有哪些?3. R语言的特点有哪些?第二章 R语言基础 课时:2周,共4课时教学内容第一节 R语言介绍 一、命令行/语句 二、R函数 三、R语言的帮助 四、R软件包 第二节 R语言基本操作 一、运算符 二、变量第三节 数据结构 一、数据类型 数值型、整数型、逻辑型、复数型、字符型 二、数据结构 向量、矩阵、列表、数据框、数组、因子
5、 第四节 数据读写 一、工作目录 二、读取数据 三、写入数据实践内容第五节 R语言基础练习 一、运算 数学运算、逻辑运算、函数运算 二、向量 创建向量、访问向量元素、向量运算 三、矩阵 创建矩阵、访问矩阵元素、矩阵运算 四、列表 创建列表、访问列表元素 五、数据框 创建数据框、提取数据、添加列、添加行 六、数组 创建数组、访问数组元素 七、因子 创建因子 八、工作目录 获得当前工作目录、重设工作目录 九、读取数据 读取CSV数据,读取文本数据,读取Web数据,读取Excel文件 十、写入数据 写入CSV文件、写入文本文件、写入Excel文件思考题: 1. R语言中数据类型有哪些?2. R语言中
6、数据结构有哪些?第三章 数据准备 课时:1周,共2课时教学内容第一节 数据及模型 一、数据的概念 二、模型概念 三、模型建构 四、模型分类 描述性分析模型、预测性分析模型、规范性分析模型 第二节 数据准备 一、数据整合 子任务:收集数据、选择数据、集成数据 二、数据清洗 子任务:处理缺失值、减少数据噪声、消除不一致性 三、数据变换 子任务:标准化数据、离散化数据、构建新属性 四、数据约简 子任务:减少属性数量、减少记录数量、平衡倾斜数据实践内容第三节 R语言中的数据预处理 一、数据整合 合并数据框、数据选择、数据排序 二、数据清洗 检查是否存在缺失值、删除含缺失值的记录、添加新属性、添加标准分
7、数 三、数据变换 四、数据约简 主成分分析五、数据预处理中的常用函数要点:熟悉数据准备的目标及步骤,掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. 商业智能数量解析囊括了哪三大类模型?2. 数据准备的步骤有哪些?第四章 数据探索 课时:1周,共2课时教学内容第一节 数据探索的基本概念 一、数据探索 三个阶段:单变量分析、双变量分析和多变量分析 二、数据可视化 可视化工具、应用 第二节 单变量分析 一、分类变量 统计量、可视化分析工具 二、数值变量 统计量、可视化分析工具第三节 双变量分析 一、分类变量和分类变量 二、数值变量和数值变量 三、数值变量和分类变量第四节 多变量分析
8、一、统计分析 二、可视化分析实践内容第五节 R语言中的数据探索 一、R语言绘图基础 绘图参数 符号、线条与颜色 标题、坐标轴与图例 图形的组合 二、单变量分析 统计描述条形图/柱状图、直方图、箱线图 三、双变量分析分类变量和分类变量:交叉表、堆积条形图、簇状条形图 数值变量和数值变量:协方差、相关系数、散点图 数值变量和分类变量:箱线图 四、多变量分析 协方差矩阵、相关矩阵、散点图矩阵要点:熟悉数据探索的目标及步骤,结合例题帮助学生掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. 数据探索的三个阶段分别是什么?2. 数据可视化的目的是什么?第五章 统计推断 课时:1周,共2课时教
9、学内容第一节 统计推断的基本概念 一、估计问题 点估计 区间估计 二、假设检验 第二节 参数估计 一、基本概念 估计、估计量、估计值二、点估计 均值估计、方差估计 三、区间估计 置信水平、置信区间第三节 假设检验 一、基本概念 原假设、备择假设、假设检验的基本步骤、潜在错误 二、单样本假设检验 三、双样本假设检验 四、方差分析实践内容第四节 R语言中的参数估计 一、点估计 样本平均值、样本标准差、样本比例 二、区间估计 均值的区间估计、比例的区间估计第五节 R语言中的假设检验 一、单样本假设检验 单样本检验函数 二、双样本假设检验 双样本检验函数 三、方差分析第六节 R语言中的概率分布 一、概
10、率分布的相关函数二、正态分布 三、t分布要点:熟悉统计推断的目标及步骤,结合例题帮助学生掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. 统计推断的问题可以分为哪两大类?2. 参数估计的两种基本形式分别是什么?3. 假设检验的结论可能存在哪些潜在错误?第六章 回归分析 课时:1周,共2课时教学内容第一节 线性回归的基本概念 一、回归模型和回归方程 二、估计的回归方程 三、最小二乘法 四、简单线性回归模型的拟合效果 第二节 多元回归模型 一、多元回归模型和多元回归方程 二、估计的多元回归方程第三节 回归推断分析 一、统计推断 二、推断分析的必要条件 三、总体回归关系检验 四、回归参
11、数检验 五、不显著自变量处理 六、多重公线性 影响、方差膨胀因子、补救措施第四节 分类自变量 一、虚拟变量 二、多个类别变量的处理第五节 非线性回归模型 一、多项式回归 二、交互作用实践内容第六节 R语言中的回归分析 一、简单线性回归 相关函数、获取拟合效果、回归诊断分析 二、多元回归 三、分类自变量 四、交互作用要点:熟悉回归分析的基本步骤,结合例题帮助学生掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. 多元回归中如何处理不显著的自变量?如何评估拟合效果?2. 多重共线性可能带来什么样的影响?补救措施有哪些?第七章 时间序列分析与预测 课时:1周,共2课时教学内容第一节 时间
12、序列的基本概念 一、时间序列的定义 二、时间序列的类型 三、时间序列的构成要素 四、简单线性回归模型的拟合效果 第二节 时间序列的预测模型 一、对时间序列建模 二、预测模型的评估 预测误差、预测精度第三节 时间序列预测分析方法 一、移动平均法二、指数平滑法三、双重指数平滑法四、三重指数平滑法第四节 回归预测分析 一、线性趋势回归分析二、带有季节性效应的回归分析三、因果关系的回归分析实践内容第五节 R语言中的时间序列分析 一、时间序列数据 创建时间序列对象 绘制折线图 分解时间序列构成要素二、移动平均法三、指数平滑法四、多元回归要点:熟悉时间序列分析的基本步骤,结合例题帮助学生掌握基本操作 注意
13、:对于学生遇到的问题随时讲解 思考题: 1. 时间序列的构成要素有哪些?2. 如何评估预测模型?3. 如何选择合适的预测模型?第八章 分类 课时:2周,共4课时教学内容第一节 数据挖掘的基本概念 一、数据挖掘的内涵与基本步骤二、数据挖掘中的三大类数据集三、监督学习四、无监督学习 第二节 分类模型 一、基本概念二、分类模型的构建三、分类模型的类型四、分类模型的评估五、分类模型的估计方法第三节 分类算法 一、k最近邻算法二、线性判别分析三、逻辑回归四、决策树五、支持向量机六、人工神经网络七、贝叶斯分类法实践内容第五节 R语言中的分类算法 一、k最近邻算法二、线性判别分析三、逻辑回归四、决策树五、支
14、持向量机六、人工神经网络七、贝叶斯分类法要点:熟悉分类的目标与分类模型的评估,结合例题(如:鸢尾花分类、信贷审批等经典问题)帮助学生掌握常用算法 注意:对于学生遇到的问题随时讲解 思考题: 1. 数据挖掘中有哪几类数据集?2. 监督学习和非监督学习的区别是什么?3. 分类模型如何评估?4. 常用的分类算法有哪些?第九章 聚类 课时:1周,共2课时教学内容第一节 聚类模型 一、基本概念 二、聚类方法的类型 划分聚类方法层次聚类方法基于密度的方法基于网格的方法三、相似度(或距离)测量 数值属性的相似度测量 二元属性得相似度测量 第二节 划分聚类方法 一、K均值聚类(K-means)第三节 层级聚类
15、方法 一、凝聚方法二、分裂方法三、相似度(或距离)测量最短距离法最长距离法平均连接法质心连接法Ward距离法实践内容第五节 R语言中的聚类算法 一、划分聚类方法:K-means二、层次聚类方法 凝聚方法分裂方法要点:熟悉聚类的目标,结合例题帮助学生掌握常用算法 注意:对于学生遇到的问题随时讲解 思考题: 1. 分类和聚类的主要区别是什么?2. 聚类模型如何评估?3. 常用的聚类算法有哪些?第十章 关联规则 课时:1周,共2课时教学内容第一节 关联规则挖掘 一、基本概念 目的与应用 二、关联规则的结构 支持度置信度提升度 三、关联规则的过滤 第二节 Apriori算法 一、基本思想 二、频繁项集
16、的识别实践内容第三节 R语言中的关联算法 一、Apriori算法要点:熟悉关联规则挖掘的目标,结合例题帮助学生掌握常用算法 注意:对于学生遇到的问题随时讲解 思考题: 1. 如何计算关联规则的支持度、置信度和提升度?2. 如何过滤关联规则?3. 如何通过Apriori算法识别频繁项集?第十一章 文本挖掘 课时:1周,共2课时教学内容第一节 文本挖掘 一、基本概念 目的与应用 二、自然语言处理 三、文本挖掘的基本步骤 步骤1:建立语料库 (Corpus) 步骤2:创建词项-文档矩阵 步骤3:提取知识 第二节 情感分析 一、基本概念 目的与应用 二、情感分析的基本步骤 步骤1:情感检测 步骤2:N
17、-P极性识别步骤3:目标识别步骤4:收集和聚合 三、常用文本挖掘与情感分析的软件与工具实践内容第三节 R语言中的文本挖掘 一、情感分析要点:熟悉文本挖掘的目标,结合例题帮助学生掌握常用算法 注意:对于学生遇到的问题随时讲解 思考题: 1. 文本分析的基本步骤有哪些?2. 情感分析的基本步骤有哪些?第十二章 Web挖掘 课时:1周,共2课时教学内容第一节 Web挖掘 一、基本概念 目的与应用 二、Web挖掘的分类 Web内容挖掘 Web结构挖掘 Web使用模式挖掘 三、Web分析度量 第二节 社交分析 一、社交网络分析 目的与应用 社交网络的构成要素社交网络图 社交网络分析度量 二、社交媒体分析
18、 目的与应用 三、多模式情感分析实践内容第三节 R语言中的Web挖掘 一、社交网络分析 网络构建 网络可视化 网络分析度量 要点:熟悉Web挖掘的目标,结合例题帮助学生掌握基本操作 注意:对于学生遇到的问题随时讲解 思考题: 1. Web挖掘可以分为哪几大类?2. 社交网络的分析度量有哪些?第十三章 最优化问题 课时:1周,共2课时教学内容第一节 最优化问题 一、基本概念 二、规范性/指导性分析三、约束条件与目标函数 第二节 线性优化模型 一、建立最优化模型的基本步骤二、极大值问题三、极小值问题四、线性规划的几种特殊情况多个最优解无可行解无界问题五、敏感性分析第三节 整数线性优化模型 一、纯整数线性规划二、混合整数线性规划三、0-1整数线性规划实践内容第四节 R语言中的最优化求解 一、线性优化 二、整数线性优化要点:熟悉最优化求解的基本步骤,结合例题帮助学生掌握常用函数 注意:对于学生遇到的问题随时讲解 思考题: 1. 建立线性优化模型的基本步骤有哪些?2. 线性优化中的敏感性分析是什么? 考核方式:成绩包括四个部分,平时成绩10%,实践作业20%,小组项目20%,期末考试成绩50%。具体内容如下:1. 平时成绩包括出勤,课堂表现,讨论和活动参与等,占总成绩10%;2. 实践
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年牛津上海版七年级生物下册月考试卷含答案
- 2025年外研版三年级起点九年级历史上册阶段测试试卷含答案
- 2025年粤人版八年级地理上册阶段测试试卷
- 2025年粤教版九年级地理上册月考试卷含答案
- 2025年人教版必修2历史下册阶段测试试卷
- 2025年华东师大版高三历史下册月考试卷含答案
- 2025年统编版2024高三历史上册阶段测试试卷
- 2025年度婚礼摄影服务合同范例汇编4篇
- 2025年度木门产品售后服务与客户满意度调查合同3篇
- 二零二五版绿色生态泥水工程分包合同(含雨水收集利用)4篇
- 道路沥青工程施工方案
- 《田口方法的导入》课件
- 内陆养殖与水产品市场营销策略考核试卷
- 医生给病人免责协议书(2篇)
- 公司没缴社保劳动仲裁申请书
- 损伤力学与断裂分析
- 2024年县乡教师选调进城考试《教育学》题库及完整答案(考点梳理)
- 车借给别人免责协议书
- 应急预案评分标准表
- “网络安全课件:高校教师网络安全与信息化素养培训”
- 锂离子电池健康评估及剩余使用寿命预测方法研究
评论
0/150
提交评论