《知识发现与数据挖掘》教学大纲_第1页
《知识发现与数据挖掘》教学大纲_第2页
《知识发现与数据挖掘》教学大纲_第3页
《知识发现与数据挖掘》教学大纲_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、知识发现与数据挖掘教学大纲课程编号:0040706英文名称:Knowledge Discovery and Data Mining学时/学分:32/2适用学科(专业):计算机软件与理论、计算机技术开课教学单位:计算机科学与技术系第一主讲人:段勇 第二主讲人:杨威 第三主讲人:于霞 执笔:段勇 一、预修课程现代数据库系统、高级人工智能二、课程性质与任务1课程性质: 本课程是计算机软件与理论、计算机技术专业的选修课。2课程任务: 了解:数据挖掘领域发展趋势和主要应用,数据挖掘技术最新进展和前沿成果,数据挖掘的OLAP技术,复杂数据类型的数据挖掘技术等。掌握:数据预处理方法,包括数据清理、数据规约和

2、数据变化等,数据仓库的概念和构建方法,多维数据模型,数据立方体技术等。重点掌握:知识发现与数据挖掘的基本概念和基本理论,挖掘大型数据库的关联规则方法,贝叶斯分类技术,神经网络分类技术、K均值聚类方法、模糊聚类方法等。三、课程教学内容1.课程的主要内容知识发现与数据挖掘是一门新兴的学科,在很多重要的领域有着广泛的应用。本课程以数据预处理、数据仓库设计、数据挖掘、知识发现过程为主线,主要介绍知识方法和数据挖掘的基本概念、原理、方法和技术,具体包括:数据预处理基本方法,多维数据模型表示方法,数据仓库设计方法,关联规则挖掘方法,数据分类方法,数据聚类方法,复杂数据类型挖掘技术等。通过课程的学习,使学生

3、对数据挖掘过程有整体认知能力;掌握知识发现与数据挖掘的基本理论;了解数据挖掘技术研究的主要问题,发展趋势和应用领域;掌握设计数据仓库的基本思想和构建方法;熟悉关联规则分析、分类、聚类等主要数据挖掘方法;并能够运用所学知识解决实际工程问题,进而提高学生的创新能力。2.讲授内容章节第1章 绪论本章主要内容包括:知识发现和数据挖掘的产生和发展,数据挖掘与相关学科的关系,数据挖掘的主要研究对象,数据挖掘的功能和应用领域,知识发现和数据挖掘的主要问题;应重点掌握:知识发现和数据挖掘的基本概念和执行过程。第2章 数据预处理本章主要内容包括:数据预处理工作在知识发现和数据挖掘中的作用和必要性,数据挖掘的基本

4、数据类型以及数据预处理方法。应重点掌握:基本的数据规约方法、数据汇总方法、数据清理方法、数据集成与变换方法。第3章 数据仓库与数据挖掘的OLAP技术本章主要内容包括:数据仓库的基本概念,构成数据仓库的多维数据模型,数据仓库的系统结构和实现过程。应重点掌握:数据仓库的设计思想和构建方法,数据立方体的基本操作,基本的OLAP技术,如何对数据仓库进行数据挖掘工作。第4章 挖掘频繁模式、关联和相关本章主要内容包括:关联规则挖掘思想,关联规则的基本概念,频繁项目集成挖掘方法,以及关联规则挖掘的最新进展。应重点掌握:频繁项目集、关联规则、支持度、置信度等概念,Appriori属性,频繁项目集的生成方法,A

5、ppriori关联规则挖掘算法,Appriori的改进算法。第5章 分类与预测本章主要内容包括:数据挖掘的分类与预测方法,分类的基本概念和主要步骤,常用的分类与预测方法。应重点掌握:分类器的构造方法,数据分类的步骤,贝叶斯分类方法,神经网络分类方法等。第6章 聚类本章主要内容包括:数据挖掘的聚类方法,聚类的基本概念和主要步骤,常用的聚类方法。应重点掌握:聚类的基本原则,基于划分的聚类方法,基于神经网络的聚类方法,模糊聚类方法。第7章 复杂类型的数据挖掘本章主要内容包括:复杂数据对象的多维分析,空间数据库挖掘,多媒体数据库挖掘,时序数据和序列数据挖掘,web挖掘,文本数据库挖掘等。四、学时分配表

6、(以章节为单位、以2学时为基本学时)教学章序及内容学时分配讲授讨论/习题第一章 绪论 第一节 数据挖掘技术的产生和发展第二节 知识发现和数据挖掘的概念第三节 数据挖掘的对象2第四节 数据挖掘的功能第五节 数据挖掘的主要问题11第二章 数据预处理第一节 数据类型第二节 为什么要进行数据挖掘预处理2第三节 描述数据汇总第四节 数据清理2第三章 数据仓库与数据挖掘的OLAP技术第一节 什么是数据仓库第二节 多维数据模型第三节 数据仓库的系统结构2第四节 数据仓库实现第五节 从数据仓库到数据挖掘11第四章 挖掘频繁模型、关联和相关第一节 关联规则的基本概念第二节 频繁项目集成挖掘方法2第三节 挖掘各种

7、类型的关联规则第四节 基于约束的关联挖掘2第五章 分类与预测第一节 分类的基本概念及步骤第二节 贝叶斯分类2第三节 神经网络分类2第四节 模糊分类方法第五节 与预测有关的问题2第六章 聚类第一节 聚类概念第二节 划分聚类方法2第三节 基于神经网络的聚类方法2第四节 模糊聚类方法2第七章 复杂类型的数据挖掘第一节 复杂数据对象的多维分析第二节 空间数据挖掘第三节 其他复杂类型的数据挖掘2课程复习及答辩11合计293五、考核方式及要求1.平时成绩 20%根据学生上课出勤情况、课堂表现、回答问题情况给出平时考核成绩,对于缺席3次以上者,取消期末考核资格。2.论文及答辩 80%该部分成绩由学生期末提交

8、的论文及答辩情况综合给出。其中论文成绩主要考核论文的完整性、创新性、研究深度、格式规范性等;答辩可分组进行,分自述和提问两个环节。六、教材及参考书教材:1.数据挖掘概念与技术,Jiawei Han, Micheline Kamber著机械工业出版社,2007 参考书:1.数据挖掘导论,Pang-Ning Tan, Michael Steinbach, VipinKumar著人民邮电出版社,2006.2.数据挖掘原理与算法,毛国君,段丽娟等.清华大学出版社,2004.本项目需要开发的医院协同管理平台包括用户和组织机构、信息发布平台和工作流管理系统三部分。组织机构构建采用图形化的工具定义组织机构图,能以图形化的方式为各个机关部门及医院建立树状组织机构图及横向的虚拟组织架构图,组织机构图要能显示使用者的职责、职称及从属关系等。管理者根据工作流使用者在不同工作流程中需要完成的任务,为其赋予角色。与组织机构相结合,建立权限控制和管理体系,确保系统用户对系统资源的访问受到保护和控制。信息发布子系统用于实现系统新闻、通知公告、项目信息等的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论