下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据分析方法与应用课程教学大纲课程代码:090542008课程英文名称:Big Data Analysis: Methods and Applications课程总学时:40 讲课: 40 实验: 0 上机: 0适用专业:应用统计学大纲编写(修订)时间:2017.6一、大纲使用说明(一)课程的地位及教学目标本课程是应用统计学专业的一门专业课,通过本课程的学习,可以使学生学会选用适当的方法和技术分析数据,领会大数据分析方法和应用,掌握复杂数据的分析与建模,使学生能够按照实证研究的规范和数据挖掘的步骤进行大数据研发,为就业与继续深造打下必要而有用的基础。(二)知识、能力及技能方面的基本要求1.
2、基本知识:掌握数据挖掘流程、随机森林树的回归算法、基于预测强度的聚类方法、朴素贝叶斯分类、高维回归及变量选择、图模型等。2. 基本能力:要求能在真实案例中应用相应的方法。3. 基本技能:掌握复杂数据的分析与建模。(三)实施说明1. 本大纲主要依据应用统计学专业2017 版教学计划、应用统计学专业专业建设和特色发展规划和沈阳理工大学编写本科教学大纲的有关规定并根据我校实际情况进行编写的。2. 课程学时总体分配表中的章节序号在授课过程中可酌情调整顺序,课时分配仅供参考。打“ * ”号的章节可删去或选学。3. 建议本课程采用课堂讲授、讨论相结合的方法开展教学,通过讨论等方式强化重点,通过分散难点,使
3、学生循序渐进的掌握难点。4教学手段:建议采用多媒体等现代化手段开展教学。(四)对先修课的要求本课程的先修课程:应用多元统计分析。(五)对习题课、实践环节的要求通过案例讲解算法,鼓励学生演示分析思路和分析收获,使学生有机会诊断问题,并学会选用适当的方法和技术分析数据。(六)课程考核方式1 考核方式:考查2考核目标:在考核学生基础知识、基本技能,基本能力的基础上,重点考核学生的分析能力、解决实际问题能力。3成绩构成:本课程由平时成绩和结课报告的质量评定优、良、中、及格和不及格。(七)参考书目:大数据分析:方法与应用,王星编,清华大学出版社,2013.二、中文摘要大数据分析方法与应用是高等学校应用统
4、计学专业的一门选修的专业课。本课程着重介绍了统计学习、数据挖掘和模式识别等领域的各种大数据分析方法。课程主要内容包括大数据分析概述、数据挖掘流程、随机森林树、基于预测强度的聚类方法、贝叶斯分类和因果学习、高维回归及变量选择、图模型等。通过本课程的学习,使学生学会选用适当的方法和技术分析数据, 领会大数据分析方法和应用,掌握复杂数据的分析与建模,提高学生分析问题解决问题的能力。 本课程将为毕业设计奠定基础。三、课程学时分配表序号章节名称学时讲课实验上机1第1章 大数据分析概述221.1大数据概述、数据挖掘的产生与功能222第2章 数据挖掘流程662.1数据挖掘流程概述222.2离群点发现222.
5、3不平衡数据级联算法223第3章有指导的学习663.1有指导的学习概述、K-近邻223.2决策树223.3随机森林树224第4章无指导的学习664.1聚类分析224.2基于预测强度的聚类方法224.3聚类问题的变量选择225第5章贝叶斯分类和因果学习665.1贝叶斯分类、决策论与统计决策论225.2线性判别函数和二次判别函数225.3朴素贝叶斯分类、贝叶斯网络226第6章高维回归及变量选择886.1线性回归模型226.2模型选择226.3广义线性模型226.4高维回归系数压缩227第7章图模型667.1图模型基本概念和性质227.2协方差选择227.3指数族图模型、谱聚类22合计4040四、教
6、学内容及基本要求第1部分大数据分析概述总学时(单位:学时):2讲课:2实验:0上机:0具体内容:了解大数据、了解数据挖掘的产生与功能。重点:数据挖掘的内涵和功能难点:数据挖掘与相关领域之间的关系。第 2 部分 数据挖掘流程总学时 ( 单位:学时):6 讲课 :6 实验 :0 上机 :0具体内容:了解数据挖掘流程;掌握离群点检测。重点:局部离群点算法。难点:不平衡数据级联算法。第 3 部分 有指导的学习总学时 ( 单位:学时):6 讲课 :6 实验 :0 上机 :0具体内容:掌握决策树相关概念;掌握随机森林树算法。重点:分类回归树、决策树的剪枝。难点:随机森林树的回归算法。第 4 部分 无指导的学习总学时 ( 单位:学时):6 讲课 :6 实验 :0 上机 :0具体内容:掌握各类聚类分析方法,聚类问题的变量选择。重点:基于预测强度的聚类方法。难点:高斯成对罚模型聚类,各类异方差成对罚模型聚类。第 5 部分 贝叶斯分类和因果学习总学时 ( 单位:学时):6 讲课 :6 实验 :0 上机 :0具体内容:掌握贝叶斯分类、朴素贝叶斯分类;理解统计决策论。重点:朴素贝叶斯分类。难点:线性判别函数和二次判别函数。第 6 部分 高维回归及变量选择总学时 ( 单位:学时):8 讲课 :8 实验 :0 上机 :0具体内容:掌握线性回归模型、广义线性模型;掌握高维回归系数压缩算法。重点:广义线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业厂房石棉瓦安装协议
- 物流企业出纳岗位聘用协议
- 二零二四年环保设备制造与安装合作协议3篇
- 沙漠绿化造林施工合同
- 油气管线测量设备租赁合同
- 公路加油站施工劳务合同
- 2024年度旅游服务清包承包合同
- 2024个性化KTV装修项目合作合同书版B版
- 2024年个体购买协议标准格式
- 商务区路面改造协议
- 中央空调维保工作实施方案
- (高清版)外墙外保温工程技术标准JGJ144-2019
- 新人教版3三年级数学上册全册教案【表格版】
- 主动脉球囊反搏术(IABP)监测及护理
- 算法导论第三十四章答案
- 国开计算机应用基础(本)形考学习过程表现
- 机械毕业设计(论文)-小型绞肉机的设计【小型家用电动绞肉机】
- 浅谈农村小学《道德与法治》课程的现状及策略
- 行道树设计存在的问题及建议
- 井冈山介绍PPT革命圣地井冈山
- 收支管理业务内部控制流程图
评论
0/150
提交评论