版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据挖掘(Big Data Mining)课程代码:5251058学分:3学时:48(其中:课程教学学时:32,实验学时:16)先修课程:数据库原理、概率论与数理统计、SAS软件基础适用专业:计算机科学与技术教材:Oracle数据库应用与实践,方巍,文学志编著,清华大学出版社,2014年8月第1版开课学院:计算机与软件学院一、课程性质与课程目标(一)课程性质大数据挖掘是高等工科院校计算机类相关专业的一门专业选修课程。本课程主要介绍本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应用。(二)课程目标课程目标包括知识目标和能力目标,具体如下:课程目标1:能够针对相关问题选取合
2、适的数据挖掘算法分析数据,通过对比做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。课程目标2:提高对生活、学习和工作中产生的大数据的分析和处理能力。(三)课程目标与专业毕业要求指标点的对应关系本课程支撑专业培养计划中的毕业要求指标点4.2和5.2。毕业要求指标点4.2:具有计算机软硬件及系统相关的工程基础能力,能够针对计算机领域相关问题进行实验验证与实现,能够利用理论分析手段对实验数据进行解释与对比分析,给出实验结论。毕业要求指标点5.2:在计算机领域复杂工程问题的建模、模拟或解决过程中,能够使用恰当的技术、软硬件及系统资源和研发工具,提高解决复杂工程问题的能力和效率。课程目
3、标毕业要求指标点课程目标1课程目标2毕业要求11.3二、课程内容及教学要求(按章撰写)本课程教学内容包括:数据挖掘的基本理论、常用挖掘算法及其应用。本课程基本要求是:理解数据挖掘的基本概念和方法,掌握数据挖掘算法基本原理及其实现,并能借助算法对数据进行分析和处理。学生能够借助SAS Enterprise Miner软件工具进行具体数据的挖掘分析,从中获取有价值的信息。第1章数据挖掘导论(一)教学内容1. 数据挖掘发展概述。2. 数据挖掘功能。3. 数据挖掘系统。(二)教学要求1.了解数据挖掘基本概念。2. 了解数据挖掘发展历程。3. 熟悉数据挖掘的基本功能。4. 了解数据挖掘系统及分类。(三)
4、重点与难点1. 重点数据挖掘功能。2. 难点数据挖掘系统应用。第2章数据预处理(一)教学内容1.数据清洗:噪声数据处理、不一致数据处理。2.数据集成与转换。(二)教学要求 1. 熟悉噪声数据处理方法。2. 熟悉不一致数据处理方法。3.了解数据集成方法。4. 了解数据转换方法。(三)重点与难点1.重点数据清洗方法。2.难点数据转换方法。第3章分类与预测(一)教学内容1. 分类与预测基本知识。2. 分类:基于决策树的分类、贝叶斯分类、支持向量机分类、神经网络分类、预测方法。(二)教学要求1. 掌握分类的基础知识。2. 掌握预测的基础知识。3. 理解常用分类和预测方法。(三)重点与难点1.重点支持向
5、量机分类方法。2.难点神经网络分类方法。第4章聚类分析(一)教学内容聚类分析基础与应用:K-Means聚类方法、K-中心点聚类方法。(二)教学要求1. 掌握K-Means聚类方法原理、实现及应用。2. 掌握K-中心点聚类方法原理、实现及应用。(三)重点与难点1.重点K-Means聚类方法。2.难点K-中心点聚类方法。三、本课程开设的实验项目编号实验项目名称学时类型要求支撑的课程目标1演化分析2综合必做课程目标12数据清洗2综合必做课程目标13数据集成与转换2综合必做课程目标14基于决策树的分类2综合必做课程目标1,25贝叶斯分类2综合必做课程目标1,26支持向量机分类2综合必做课程目标1,27
6、KMeans聚类算法2综合必做课程目标1,28K中心点聚类算法2综合必做课程目标1,2实验1:演化分析1. 实验目的及要求1)熟悉演化分析的基本方法;2)掌握演化分析软件使用方法。2. 实验主要内容使用SAS软件对数据集进行演化分析。3. 重难点SAS软件使用方法。实验2:数据清洗1. 实验目的及要求1) 掌握噪声数据处理方法;2)掌握不一致数据处理方法。2. 实验主要内容使用SAS软件分别对噪声数据和不一致进行处理。3. 重难点噪声数据的处理。实验3:数据集成与转换1. 实验目的及要求1) 掌握数据集成方法;2)掌握常用数据转换方法。2. 实验主要内容使用SAS软件分别完成数据的集成和转换。
7、3. 重难点数据转换。实验4:基于决策树的分类1. 实验目的及要求1) 掌握ID3算法原理与实现;2)掌握C4.5算法原理与实现。2. 实验主要内容分别使用ID3算法和C4.5算法对给定的训练数据集创建决策树。3. 重难点C4.5算法创建决策树。实验5:贝叶斯分类1. 实验目的及要求1) 掌握贝叶斯算法分类原理;2)掌握贝叶斯算法的实现及应用;2. 实验主要内容基于给定的训练样本集使用贝叶斯分类算法对给定数据进行分类。3. 重难点贝叶斯分类准则。实验6:支持向量机分类1. 实验目的及要求1) 掌握支持向量机的基本原理;2)熟悉支持向量机代码;3)掌握k-交叉验证法选取最佳参数方法。2. 实验主
8、要内容从网上下载支持向量机代码和实验数据集,完成训练和测试过程。3. 重难点k-交叉验证法选取最佳参数方法。实验7:KMeans聚类算法1. 实验目的及要求1)掌握KMeans聚类算法原理;2)熟悉KMeans聚类算法代码及应用。2. 实验主要内容对给定的实验数据集,使用KMeans聚类算法完成聚类操作。3. 重难点聚类中心的更新及误差准则函数计算。实验8: K中心点聚类算法1. 实验目的及要求1)掌握K中心点聚类算法原理;2)掌握K中心点聚类算法代码及应用。2. 实验主要内容对给定的实验数据集,使用K中心点聚类算法完成聚类操作。3. 重难点中心点替换代价计算。注:本课程为专业方向课,授课对象
9、为大三学生,实验类型主要包括验证性和设计性实验,均需要提交实验报告,实验报告主要包括实验目的、实验内容、预习内容、实验步骤、实验结果以及总结。实验评价内容和评分细则参见附录1。四、学时分配及教学方法章教学形式及学时分配主要教学方法支撑的课程目标课堂教学实验上机课程实践小计第1章数据挖掘导论88讲授、自学课程目标1第2章数据预处理8614讲授、自学、演示课程目标1,2第3章分类与预测8614讲授、演示、自学、讨论、实验课程目标1,2第4章聚类分析8412讲授、演示、自学、实验课程目标1,2合计321648注:1.课程实践学时按相关专业培养计划列入表格; 2.主要教学方法包括讲授法、讨论法、演示法
10、、研究型教学方法(基于问题、项目、案例等教学方法)等。五、课程考核 1. 课程考核方式包括期末考试、平时作业和实验情况考核。考核形式考核要求考核权重备注平时作业及阶段测试课后完成1015个习题,主要考核学生对每节课知识点的复习、理解和掌握度,计算全部作业的平均成绩再按15%计入总成绩;可让学生查阅资料,了解本课程相关技术发展情况,自主学习并完成。15%根据平时作业得分取平均值或结合平时测试情况实验完成8个实验,主要训练学生应用所学知识构建实验系统,并进行实验的能力,最后按15%计入课程总成绩。15%评分细则见附录1课程论文课程论文的70%计入课程总成绩。其中考核对算法原理的理解和分析占90%;
11、考核能针对个人或职业发展的需求,采用合适的方法,自主学习,适应发展占比10%。70%参照综述论文撰写格式提交课程论文六、参考书目及学习资料1. 张云涛、龚玲著,数据挖掘原理与技术,电子工业出版社,2004。2. 陈京民编著,数据仓库与数据挖掘技术,电子工业出版社,2002。3. 林杰斌主编,数据挖掘与OLAP理论与实务,清华大学出版社,2003.1。4. 朱明编著,数据挖掘,中国科学技术大学出版社,2002.2。5. Richard J. Roiger, Michael W. Geatz 著,翁敬农译,数据挖掘教程,清华大学出版社,2003。6. David Hand, Heikki Mann
12、ila, Padhraic Smyth著,张银奎、廖丽、宋俊等译,数据挖掘原理,机械工业出版社,2003。七、大纲说明1. 主要采用多媒体教学手段,主要知识点板书与多媒体相结合,多种教学手段综合运用。2. 课后共需完成近15道习题作业,以评价学生对所学内容的理解和应用情况。附录1:实验考核方式及评分细则本实验以考查为主,考核的内容包括实验过程的表现(其中包含分析与解决问题的能力)、实验报告的质量等。分析与解决问题的能力采用提问和现场操作的方式进行。实验成绩中出勤、预习占10%,实验过程表现占60、实验报告及思考题占30。成绩组成考核/评价环节分值考核/评价细则对应的毕业要求指标点出勤、预习10%出勤状况,预习评价10能按时到勤,遵守实验规定,不损坏实验设备(占5%);能够预习,并理解实验原理及目的(占5%)。4.2实验过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《通信电子线路》2022-2023学年期末试卷
- 淮阴师范学院《健身气功》2023-2024学年第一学期期末试卷
- 黄山学院《导游业务》2021-2022学年第一学期期末试卷
- 淮阴师范学院《新世纪文学批评》2023-2024学年第一学期期末试卷
- 小菜籽课件教学课件
- 淮阴师范学院《国际贸易理论与实务》2023-2024学年第一学期期末试卷
- 淮阴工学院《汽车运用工程1》2022-2023学年第一学期期末试卷
- 淮阴师范学院《编译原理》2021-2022学年第一学期期末试卷
- 淮阴工学院《园艺植物栽培学3》2022-2023学年第一学期期末试卷
- DB2102T+0114-2024海鲜预制菜产业园区建设指南
- 2024年中考历史九年级上册重点知识点复习提纲(部编版)
- 眼科门诊经营方案
- 《声声慢(寻寻觅觅)》
- 智慧小区建设售后服务方案
- 软件使用授权书
- Unit1KnowingMeKnowingYou如何写读后感课件高一下学期英语
- 脑卒中后吞咽障碍患者进食护理(2023年中华护理学会团体标准)
- DB21T 2885-2023居住建筑节能设计标准
- 压覆矿产资源调查评估规范
- 2023秋二年级上册《小学生数学报》数学学习能力调研卷
- 项目三婴幼儿皮肤疾病预防与照护
评论
0/150
提交评论