《数据仓库与数据挖掘》理论教学大纲_第1页
《数据仓库与数据挖掘》理论教学大纲_第2页
《数据仓库与数据挖掘》理论教学大纲_第3页
《数据仓库与数据挖掘》理论教学大纲_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据仓库与数据挖掘》理论教学大纲(PrincipleandPracticeofDataAnalysis)课程代码:0600083总学时:48学时(其中:讲课33学时、实验15学时)先修课程:《C程序设计语言》、《数据库系统原理》、《JAVA程序设计》一、课程的性质、目的与任务本课程是数据科学与大数据技术专业的一门专业课。通过本课程的学习,使学生初步掌握数据分析的基本概念,了解数据分析的定义和功能以及数据分析的主要步骤和具体实现方法,初步掌握数据分析的算法。学习本课程后,能够实现简单的数据分析应用、了解数据分析的具体操作过程,以及数据分析的发展动态。掌握如何正确地运用数据分析方法来解决实际问题。二、教学基本内容与基本要求1.基本内容从应用的角度介绍数据分析的概念、原理、算法和技术,提供丰富的真实案例。主要包括:数据分析基本知识,数据分析的实际意义,数据预处理方法,常用分类方法,关联规则分析方法,常用聚类方法,文本分析方法,数据分析在日常社会生活方面的应用。2.基本要求数据分析是从大量的数据中抽取出未知的、有价值规律或知识的过程。通过本课程学习,使学生掌握现代数据分析和知识发现方法的思想与技术,了解数据分析的基本理论,掌握重要的数据分析方法,掌握如何利用流行的数据分析工具软件实现数据分析和知识发现,使学生具有基本的数据分析能力。三、教学内容及学时分配教学内容教学要求重点(☆)难点(Δ)学时安排备注第一章数据分析导论1.数据分析概述2.数据分析功能3.数据分析过程4.数据分析应用CCBC☆0.5第二章数据预处理1.SPSSModeler基本操作2.数据描述3.数据清理4.数据集成和变换5.数据归约BBCCC☆☆0.50.5SPSSModeler数据分析数据质量的探索基本描述分析变量分布的探索两分类变量相关性的研究两总体的均值比较变量重要性分析BBCCCB☆☆10.51第四章数据分类预测1.数据分类概述2.决策树方法3.贝叶斯方法BAA☆☆Δ0.543第五章人工神经网络1.人工神经网络算法概述2.B-P反向传播网络3.B-P反向传播网络的应用CBB☆Δ0.53.51第六章数据关联分析1.数据关联分析概述2.关联分析基本方法3.关联规则挖掘方法改进BAC☆Δ0.530.5第七章数据聚类分析1.数据聚类分析概述2.K-Means聚类及应用BA☆Δ0.53.5第八章文本挖掘1.文本挖掘简述2.文本挖掘方法3.中文摘要方法4.文本内容监管5.文本信息检索BAABB☆☆Δ0.51.510.50.5合计33(教学要求:A—熟练掌握;B—掌握;C—了解)四、建议实验项目及学时分配序号实验项目名称实验学时内容提要实验要求实验类型1SPSSModeler初步和数据读入2对SPSSModeler有初步的了解,能够构建一个简单的数据流。掌握SPSSModeler中各种数据的读入。理解和掌握变量的类型以及变量的实例化。加深对数据挖掘概念的理解和掌握,培养使用数据挖掘解决各种实际问题的能力。必做验证2SPSSModeler变量和样本的管理2了解SPSSModeler中数据的合并——纵向合并、横向合并。掌握SPSSModeler的变量值重新计算。掌握SPSSModeler的变量类别值的调整。掌握SPSSModeler中样本的分类汇总和数据的重新组织。必做验证3SPSSModeler数据的基本分析2了解SPSSModeler中数据的基本描述和质量探索。对SPSSModeler的变量分布进行初步探索。掌握SPSSModeler的两分类变量分布相关性的操作。了解SPSSModeler的量总体均值比较的操作。掌握SPSSModeler中变量重要性的分析方法。必做验证4SPSSModeler的决策树3掌握决策树C5.0算法的应用,加深对C5.0算法的理解。了解SPSSModeler的C5.0的推理规则、交叉验证。必做设计5人工神经网络BP网络2加深对人工神经网络基本原理的理解。理解和掌握BP网络及其学习算法。掌握SPSSModeler的BP网络模型。必做验证6数据关联分析Apriori算法2加深对关联分析原理的理解。加深对Apriori算法的理解。掌握SPSSModeler中Apriori模型的使用方法。必做设计7数据聚类分析K-Means算法2加深对聚类分析原理的理解。加深对K-Means算法的理解。掌握SPSSModeler中K-Means模型的使用方法。必做设计合计15五、教学方法与教学手段1.教学方法:数据仓库与数据挖掘是一门理论与实践并重的课程,因此,采用课堂理论教学与课程实验教学相结合的方法。通过对知识点、典型案例的分析讲解,上机实验指导、课堂讨论和课后答疑等方法,培养学生思考问题、发现问题和解决问题的能力。2.教学手段:采用课堂讲授、板书、多媒体课件和操作演示等相结合的教学手段。六、建议教材与参考书目1.建议教材:《SPSSModeler数据挖掘方法及应用(第3版)》,薛薇,电子工业出版社,2019年11月。2.参考书目:①《数据挖掘技术及应用》,刘世平,高等教育出版社,2010年1月。②《数据挖掘概念与技术(第2版)》,(加)JiaweiHan、MichelineKamber著,范明、孟小峰译,机械工业出版社,2007年3月。③《数据挖掘原理与算法(第2版)》,毛国君、段立娟、王石、石云,清华大学出版社,2005年7月。④《数据挖掘原理与技术》,张云涛、龚玲,电子工业出版社,2004年4月。七、成绩评定本课程为考查课。期末笔试占总成绩的50%,平时作业、考勤占总成绩的20%,实验占

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论