《大数据统计分析与R语言》课程教学大纲_第1页
《大数据统计分析与R语言》课程教学大纲_第2页
《大数据统计分析与R语言》课程教学大纲_第3页
《大数据统计分析与R语言》课程教学大纲_第4页
《大数据统计分析与R语言》课程教学大纲_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《大数据统计分析与R语言》教学大纲适用范围:2020版本科人才培养方案课程代码:08150431课程性质:专业选修课学分:4学分学时:64学时(其中:理论48学时,实验16学时)先修课程:高等数学,线性代数,概率论与数理统计后续课程:适用专业:数据科学与大数据技术等专业教材:沈刚编著,R语言基础与数据科学应用,人民邮电出版社,2018开课单位:计算机科学与技术学院一、课程的性质与任务课程性质:本课程是数据科学与大数据技术等专业的专业选修课。课程任务:R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘.R语言除了在统计研究领域具有很高的应用外,也越来越受到其他面向数据的工作者的欢迎,其强大的绘图和图表功能更是“无与伦比”。R占用内存少,运算速度快,而且开源,因此它现已成为大数据时代数据分析的一项必备技能。本课程的开设正是为了满足同学们处理和分析各种复杂数据的需求,除了重点介绍R语言的基本编程规则和方法外,在简明扼要地阐述统计和数据挖掘方法的基础上,讲述与之相对应的R包的实现,并通过生动的实例练习加强R语言的应用。本课程可作为需要进行数据处理和分析的各专业学生的选修课,目的在于让学生熟练掌握R语言的基本编程方法,并在此基础上使用R包来预处理、可视化和分析数据,使得学生掌握用现代前沿的统计和数据挖掘方法处理各种复杂数据提供必备的编程技能。二、课程的教学目标(一)知识目标了解R语言与大数据统计分析的概念、R语言的基础知识、统计分析的算法核心,了解数据挖掘统计分析是新时代对人才的新要求。(二)能力目标培养团队合作的能力,追求思维碰撞;学会主动思考、思辨;培养自主学习的能力。(三)素质目标通过课程思政的引入明白工匠精神和精益求精的重要性。具备大数据思维,从数据挖掘与统计分析的角度分析未来的发展趋势,主动适应社会发展,成为国之重器,做对社会对国家有用之人。三、课程的基本内容及要求(一)引言1.课程教学内容(1)R的起源和发展;(2)安装与运行R系统;(3)安装与使用包;(4)工作空间管理;(5)R语言的集成开发环境RStudio。2.课程重点难点重点:熟悉R语言的集成开发环境RStudio。难点:工作空间管理的理解和应用。3.课程教学要求(1)了解R语言的基本特点和应用场景;(2)掌握R语言开发环境的安装和配置;(二)数据与运算1.课程教学内容(1)基础知识;(2)数据类型与数据表示;(3)基本运算;2.课程重点难点重点:数据类型与数据表示;难点:R语言基本运算。3.课程教学要求(1)了解并熟悉R语言数据表示方法;(2)掌握R语言基本运算方法。(三)程序设计基础1.课程教学内容(1)控制流;(2)函数设计;(3)编程规范与性能优化。2.课程重点难点重点:控制流;难点:函数设计。3.课程教学要求(1)理解并熟练掌握控制流;(2)掌握函数设计方法。(四)类与对象1.课程教学内容(1)面向对象程序设计方法;(2)S3S4类;(3)引用类;(4)继承。2.课程重点难点重点:理解并运用继承。难点:掌握引用类。3.课程教学要求(1)了解R语言面向对象设计方法;(2)理解并掌握类的构建。(五)数据结构与数据处理1.课程教学内容(1)向量;(2)矩阵与数组;(3)数据框;(4)因子列表;(5)数据导入和导出;(6)数据清洗。2.课程重点难点重点:向量和矩阵的表示及运算。难点:数据框的应用。3.课程教学要求(1)理解向量和矩阵的表示及运算;(2)掌握数据框的应用。(六)绘图与数据可视化1.课程教学内容(1)基本图形与绘图函数;(2)调整绘图参数;(3)其他自定义元素;(4)描述性统计图。2.课程重点难点重点:基本图形与绘图函数。难点:绘图参数及自定义元素。3.课程教学要求(1)了解基本图形与绘图函数;(2)掌握绘图参数和自定义元素的设定。(七)统计与回归分析1.课程教学内容(1)定性数据与定量数据;(2)数据的数值度量;(3)概率分布与假设检验;(4)回归分析。2.课程重点难点重点:回归分析。难点:概率分布与假设检验。3.课程教学要求(1)了解概率分布与假设检验; (2)掌握基于R语言的回归分析函数和调用参数。(八)统计机器学习1.课程教学内容(1)特征空间与距离;(2)聚类算法;(3)分类算法;(4)集成学习2.课程重点难点重点:聚类和分类算法。难点:集成学习。3.课程教学要求(1)理解并掌握R语言的聚类和分类算法; (2)掌握集成学习方法。(九)神经网络与深度学习1.课程教学内容(1)基本原理;(2)感知器模型;(3)深度神经网络;2.课程重点难点重点:神经网络基本原理。难点:深度神经网络。3.课程教学要求(1)掌握神经网络基本原理; (2)了解深度神经网络。四、课程学时分配教学章节理论实践(验)讨论、习题一、引言2二、数据与运算4三、程序设计基础4四、类与对象6五、数据结构与数据处理64六、绘图与数据可视化84七、统计与回归分析84八、统计机器学习64九、神经网络与深度学习4总计4816五、课程考核与权重比例考核方式:本课程采用过程化考核手段,主要以作业评价、课程视频、课堂表现、课内实验、平时测试、上机考试等方式对学生进行考核评价。考核基本要求:考核总成绩由作业评价、课程视频、课堂表现、课内实验、平时测试、上机考试等过程性评价成绩组成。其中:作业评价、课程视频、课堂表现、课内实验、平时测试等过程性评价成绩为100分(占评价权重的40%),期末上机考试成绩为100分(占评价权重的60%)。五、课程资源库Peter,Dalgaard编著,《R语言统计入门》,人民邮电出版社,2014年05月卡巴科弗(RobertI.Kabacoff)著,《R语言实战》,人民邮电出版社,2016年5月王国胤编著,《大数据挖掘及应用》,清华大学出版社,2017年6月吕云翔编著,《大数据基础及应用》,清华大学出版社,2016年12月Team,R.Core."R:Alanguageandenvironmentforstatisticalcomputing."(2013):201.Ihaka,Ross,andRobertGentleman."R:alanguagefordataanalysisandgraphics."

Journalofcomputationalandgraphicalstatistics

5.3(1996):299-314.杨霞,吴东伟.R语言在大数据处理中的应用[J

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论