版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘技术Data mining technology课程代码:08410228学分:3学时:56 (其中:讲课学时:40实验学时:16 )先修课程:数据库原理及应用、概率论与数理统计、统计分析软件基础适用专业:信息管理与信息系统、工商管理、物流 统计、市场营销教材:数据挖掘技术与应用,陈燕,清华大学出版社,2016年8月第二版一、 课程性质与课程目标(-)课程性质本课程是信息管理与信息系统专业学生必须掌握的专业课程,本课程与与信息 专业培养目标密切相关,既涉及信息系统相关理论,更是对信息管理的具体实现有 详尽阐述。是培养本专业学生掌握决策支持技术的重要课程。本课程以数据挖掘的 基本概念和基
2、本方法为主要内容,以方法的应用为主线,系统叙述数据挖掘的有关 概念和基础知识,使学生掌握数据挖掘的基本概念,基本方法和应用背景。本课程的任务,主要是要求学生能对数据挖掘的基本方法和基本概念有整体的 了解,掌握数据挖掘结构化数据源数据仓库的原理和方法,掌握OLAP联机分析的基 本概念、原理。数据挖掘技术理论中,系统学习数据挖掘概述、分类算法、聚类算 法、关联规则算法及相应典型算法的算法描述及分析等。对当前数据挖掘的新技术 流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘要有所 了解,对可视化技术要有一定的掌握。通过课程学习学生应对数据挖掘的关联规则, 分类方法,聚类方法有深入的掌握,
3、并能够在软件开发过程中熟练掌握这些方法加 以应用。(二)课程目标1.知识方面课程目标1:数据挖掘所需数据源的相关理论知识:数据库里操作型数据转变为数 据仓库里分析型数据理论、数据仓库数据采集、多维数据分析。课程目标2:预测模型的基础理论、OLTP与OLAP、OLAP与DM相关理论知识:OLTP 与OLAP概念与区别,OLAP与DM概念与处理逻辑区别。课程目标3:数据挖掘相关技术知识:分类算法、聚类算法、关联规则算法及相应 典型算法的算法描述及分析。数据挖掘的新技术流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘。课程目标4: R语言相关技术知识:R语言使用基础、R语言数据探索理论、
4、R语言 数据分析理论与R语言数据处理、R语言数据挖掘建模。(二)能力与素质方面课程目标5:通过课程学习,加强学生数据源的组织能力,具有将前期课程所学数 据库基础知识深化数据仓库的能力,培养学生了解数据源的基本素质。课程目标5:通过课程学习,使学生掌握OLTP与OLAP、OLAP与DM相关理论知识和 思维方式,培养学生比较高的IT运用素质。课程目标7:通过课程学习,使学生掌握经典数据挖掘技术,了解较新的数据挖掘 技术,从而培养学生有一定的数据挖掘能力和素质。课程目标8:通过R语言的学习,使学生具有较高的数据挖掘实战能力,从而使学 生具有较高的数据分析和数据挖掘素质。(三)课程目标与专业毕业要求指
5、标点的对应关系本课程支撑专业培养计划中毕业要求指标点如下:毕业要求1:系统地掌握经济管理科学、信息技术和信息管理的基本理论与政策、 知识与技能毕业要求2:能够熟练运用信息化工程理论发、方法与工具毕业要求3:能进行信息系统规划、分析设计、实施毕业要求4:具备在政府、企业信息化过程担任管理信息化咨询,信息系统运维管理和信息化项目评价能力毕业要求6:具有独立开发信息系统能力,信息系统运管操控能力与创新能力毕业要求9:能承担软件公司的信息系统开发、实施指导与监理工作毕业要求10:能承担信息中心的信息管理工作与培训机构的教育工作课程目标毕业要求指标目标1目标2目标3目标4目标 5目标6目标 7目标8毕业
6、要求1LLLLLL毕业要求2LLLLLL毕业要求3LLLLLLLL毕业要求4LLL毕业要求6LLL毕业要求9MMMMMMMM毕业要求10LLLLL三、课程内容及要求(按章撰写)第一章数据挖掘概述(-)教学内容 数据仓库和数据挖掘定义与解释:数据仓库的定义与解释、数据挖掘的定义与解释;数据仓库系统的相关技术:数据仓库系统相关技术之间的关系、数据仓库系统模式; 数据仓库系统中多维数据组织的形式化定义与描述;数据挖掘方法与研究体系:数 据挖掘系统的发展与结构、数据挖掘的相关技术与工具、数据挖掘应用及发展;商 务智能系统。(二)教学要求掌握:DW、DM基本概念理解:数据仓库系统相关技术之间的关系了解:
7、商务智能系统(三)重点与难点.重点DW、DM基本概念.难点DB中数据与DW中数据区别第二章数据采集、集成与预处理技术数据采集的对象;数据集成技术与方法:异构数据集成的设计与实现;数据预处 理技术与方法:数据清理的方法、数据融合的方法、数据变换的方法、数据归约的 方法;基于样本数据划分的通用数据挖掘模型系统;中间件技术:中间件技术的定 义与作用、中间件技术在数据仓库系统中数据采集的应用。(二)教学要求掌握:ETL基本概念理解:数据仓库数据处理技术(三)重点与难点.重点ETL.难点数据仓库与ETL第三章多维数据分析与组织多维数据分析概述:联机分析处理的定义和特点、联机分析处理的评价准则、多维 数据
8、分析的主要概念;多维数据模型与结构:多维数据的概念模型、多维数据的逻 辑模型、多维数据的物理模型;多维数据分析应用与工具:多维数据分析的基本操 作维、多数据分析的工具及特点:从联机分析处理到联机分析挖掘:联机分析挖掘 形成原因、联机分析挖掘概念及特征。(二)教学要求掌握:OLTP与OLAP基本概念、多维数据分析理解:OLAP与联机分析挖掘关系了解:多维数据模型与结构(三)重点与难点.重点OLTP、OLAP基本概念、多维数据分析.难点OLAP与DM关系第四章分类算法初步分类概念;分类方法;决策树算法:ID3算法、C4. 5算法;贝叶斯分类;粗糙集 方法:粗糙集模型扩展、粗糙集与其他不确定信息处理
9、理论的关系;遗传算法; 其他分类算法。(二)教学要求掌握:分类概念、掌握聚类和分类区别理解:粗糙集、决策树算法了解:其他分类算法(三)重点与难点.重点分类概念.难点ID3算法第五章聚类算法分析聚类分析概述:聚类分析概念、聚类分析中的数据类型;聚类分类;划分方法:K means算法、Kmedoid算法;层次方法:BIRCH算法、CURE算法;密度方法:DBSCAN 算法、OPTICS算法;网格方法:STING算法、Wavecluster算法;基于标量化III的 聚类统计算法:数学描述、计算方法、文本数据、应用实例;其他聚类算法。(二)教学要求掌握:聚类分析概念、K-means算法、层次方法理解:
10、基于标量化III的聚类统计算法了解:其他聚类算法(三)重点与难点.重点聚类算法.难点具体算法实现(SPSS、R)第六章关联规则模型及应用关联规则的基础理论:关联规则的定义与解释、关联规则在知识管理过程中的作用; Apr iori关联规则算法:关联规则算法的相关概念、关联规则算法的流程、基于 Apriori算法的关联规则算例;改进的Apriori关联规则方法:动态存储空间的构 建、快速产生强项集的算法流程、改进算法的时间复杂性分析;Apriori关联规则 方法的实例。(二)教学要求掌握:关联规则的基础理论:Apriori关联规则方法理解:关联规则算法的流程了解:商务智能系统(三)重点与难点.重点
11、Apriori关联规则方法.难点具体算法实现(SPSS、R)第七章粗糙集方法与应用粗糙集理论背景介绍:粗糙集的含义、粗糙集的应用及与其他领域的结合;粗糙集 基本理论:知识与不可分辨关系、不精确范畴、近似与粗糙集、粗糙集的精度和粗 糙度、粗糙集的粗等价和粗包含;基于粗糙集的属性约简:知识的约简和核、知识 的依赖性度量和属性的重要度;基于粗糙集的决策知识表示:基于粗糙集的决策知 识表示方法、粗糙集在规则提取中的应用算例。(二)教学要求掌握:粗糙集理论理解:数据仓库系统相关技术之间的关系了解:商务智能系统(三)重点与难点.重点粗糙集理论等.难点粗糙集在规则提取中的应用算例第八章遗传算法与应用遗传算法
12、基础理论:遗传算法概述、遗传算法特点;遗传算法的应用领域和研究方 向:遗传算法的应用领域、遗传算法的研究方向;遗传算法的基础知识:遗传算法的 相关概念:遗传算法的编码规则、遗传算法的主要算子、遗传算法的适应度函数; 遗传算法计算过程和应用:遗传算法计算过程、遗传算法参数选择、遗传算法实例 应用。(二)教学要求掌握:遗传算法基础理论理解:遗传算法的编码规则了解:遗传算法的应用领域和研究方向(三)重点与难点.重点遗传算法基础理论.难点遗传算法实现第九章R语言数据分析与数据挖掘R语言相关技术知识:R语言使用基础、R语言数据探索理论、R语言数据分析理论 与R语言数据处理、R语言数据挖掘建模。(二)教学
13、要求掌握:R语言使用基础、R语言数据探索理论理解:数据仓库系统相关技术之间的关系(三)重点与难点.重点R语言使用基础、R语言数据探索理论.难点R语言数据分析理论与R语言数据处理、R语言数据挖掘建模第十章数据挖掘的新技术及其应用流数据挖掘技术、高维聚类算法、分布式数据挖掘、业务活动监控挖掘技术、业务 活动监控预测模型。(二)教学要求掌握:流数据挖掘技术、高维聚类算法、分布式数据挖掘基本概念理解:业务活动监控挖掘技术 了解:业务活动监控预测模型 (三)重点与难点.重点数据挖掘新技术理论.难点实际应用分析四、教学形式与学时分配章学时分配讲课实验上机课外小计第一章数据挖掘概述2第二章数据采集、集成与预
14、处理技术2第三章多维数据分析与组织2第四章分类算法初步4第五章聚类算法分析42第六章关联规则模型及应用44第七章粗糙集方法与应用4第八章遗传算法与应用42第九章R语言数据分析与数据挖掘128第十章数据挖掘的新技术及其应用2合计4016注:课外学时按相关专业培养计划列入表格。五、本课程开设的实验项目编号实验项目名称学时类型要求备注1回归分析与相关分析数据挖掘-SPSS (银行风险分析案例)2综合性必做2聚类数据挖掘-SPSS (中国城市空气质量聚类、 中国城市地理经济聚类分析)2综合性必做3决策树-SPSS2综合性必做4神经网络-SPSS2综合性必做5R语言数据探索与数据处理72综合性必做6R语言数据探索与数据处理-22综合性必做7分类分析、聚类分析-R2综合性必做8关联规则:Apriori-R2综合性必做合计16六 课程考核考核方式或途径考核要求考核权重备注平时作业30.1实验80
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度电气设备安装与维修合同
- 总经理聘请合同模板
- 房地产代理合同范文:委托与代理
- 代理合同:房地产估价委托协议书
- 广告业务经营权转让合同
- 产品责任保险合同专业版解析
- 自动化机器租赁协议
- 2024装修工程转包合同范本
- 年度长期合作协议范例
- 全面购销合同模板珍藏
- 君子自强不息课件
- 2022人教版高二英语新教材选择性必修全四册课文原文及翻译(英汉对照)
- WDZANYJY23低压电力电缆技术规格书
- 抗高血压药物基因检测课件
- 医院管理医院应急调配机制
- (公开课)文言文断句-完整版课件
- 小学生性教育调查问卷
- 医院感染管理质量持续改进反馈表
- 旅游行政管理第二章旅游行政管理体制课件
- 学生岗位实习家长(或法定监护人)知情同意书
- 卫生院关于召开基本公共卫生服务项目培训会的通知
评论
0/150
提交评论