版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《大数据统计分析与R语言》教学大纲适用范围:202X版本科人才培养方案课程代码:08150431课程性质:专业选修课学分:4学分学时:64学时(理论48学时,实验16学时)先修课程:Python程序设计后续课程:大数据综合创新适用专业:数据科学与大数据技术开课单位:计算机科学与技术学院一、课程说明R语言是一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘.R语言除了在统计研究领域具有很高的应用外,也越来越受到其他面向数据的工作者的欢迎,其强大的绘图和图表功能更是“无与伦比”。R占用内存少,运算速度快,而且开源,因此它现已成为大数据时代数据分析的一项必备技能。本课程的开设正是为了满足同学们处理和分析各种复杂数据的需求,除了重点介绍R语言的基本编程规则和方法外,在简明扼要地阐述统计和数据挖掘方法的基础上,讲述与之相对应的R包的实现,并通过生动的实例练习加强R语言的应用。本课程可作为需要进行数据处理和分析的各专业学生的选修课,目的在于让学生熟练掌握R语言的基本编程方法,并在此基础上使用R包来预处理、可视化和分析数据,使得学生掌握用现代前沿的统计和数据挖掘方法处理各种复杂数据提供必备的编程技能。二、课程目标通过本课程的学习,使学生达到如下目标:课程目标1:了解并掌握R语言与大数据统计分析的概念、R语言的基础知识、统计分析的算法核心,了解数据挖掘统计分析是新时代对人才的新要求。课程目标2:培养团队合作的能力,追求思维碰撞;学会主动思考、思辨;培养自主学习的能力。小组合作完成设计开发解决方案,系统模块化完成大数据分析的数据预处理、建模、分析、可视化等阶段。课程目标3:通过课程思政的引入使学生明白工匠精神和精益求精的重要性。能够选择与使用恰当的工具对数据科学与大数据技术领域复杂工程问题进行预测与模拟。主动适应社会发展,成为国之重器,做对社会对国家有用之人。三、课程目标与毕业要求《大数据统计分析与R语言》课程教学目标对数据科学与大数据技术专业毕业要求支撑见表1。表1课程教学目标与毕业要求关系毕业要求指标点课程目标支撑强度1.工程知识1.1掌握数学、自然科学、工程基础、数据科学与大数据技术专业知识,并能够用于理解与描述大数据技术领域的复杂工程问题。课程目标1:了解并掌握R语言与大数据统计分析的概念、R语言的基础知识、统计分析的算法核心,了解数据挖掘统计分析是新时代对人才的新要求。H3.设计/开发解决方案3.1能够针对大数据应用系统设计与开发满足特定需求的模块或算法。课程目标2:培养团队合作的能力,追求思维碰撞;学会主动思考、思辨;培养自主学习的能力。小组合作完成设计开发解决方案,系统模块化完成大数据分析的数据预处理、建模、分析、可视化等阶段。H5.使用现代工具5.2能够选择与使用恰当的技术、资源、现代工程工具和信息技术工具,对数据科学与大数据技术领域复杂工程问题进行预测与模拟。课程目标3:通过课程思政的引入使学生明白工匠精神和精益求精的重要性。能够选择与使用恰当的工具对数据科学与大数据技术领域复杂工程问题进行预测与模拟。主动适应社会发展,成为国之重器,做对社会对国家有用之人。H注:表中“H(高)、M(中)”表示课程与相关毕业要求的关联度。四、教学内容、基本要求与学时分配1.理论部分理论部分的教学内容、基本要求与学时分配见表2。表2教学内容、基本要求与学时分配教学内容教学要求,教学重点难点理论学时实验学时对应的课程目标1.R语言引言1.1R语言的起源和发展1.2安装和运行R系统1.3安装和使用包1.4工作空间的管理1.5Rtudio的使用1.6R语言与数据科学教学要求:了解R语言的基本特点和应用场景;掌握R语言开发环境的安装和配置;重点:熟悉R语言的集成开发环境RStudio。难点:工作空间管理的理解和应用。21、2、32.数据与运算2.1基础知识2.2数据类型与数据表示2.3基本运算2.4数据类型转换与R中常见的数据结构教学要求:使学生了解并熟悉R语言数据表示方法;掌握R语言基本运算方法。重点:数据类型与数据表示。难点:R语言基本运算。41、2、33.程序设计基础3.1控制流3.2函数设计3.3变成规范与性能优化教学要求:使学生理解并熟练掌握控制流;熟练掌握函数设计方法。重点:控制流的使用方法以及相关应用场景。难点:函数设计和封装以及函数设计的优化。41、2、34.类与对象4.1面向对象程序设计方法4.2S3\S4类4.3引用类4.4继承教学要求:使学生了解面向对象特性在R语言数据分析工程中的体现。了解掌握S3类S4类和引用类的区别于联系。掌握面向对象设计方法和类的构建。重点:理解继承的特性并灵活运用继承难点:掌握引用类。641、2、35.数据结构与数据处理5.1向量5.2矩阵与数组5.3数据框5.4因子列表5.5数据导入和导出5.6数据清洗教学要求:使学生了解掌握向量和矩阵的表示及运算;灵活运用数据框,在数据分析案例中理解数据框的重要性。重点:向量和矩阵的表示及运算。难点:数据框的应用。641、2、36.绘图与数据可视化6.1基本图形与绘图函数6.2调整绘图参数6.3其他自定义元素6.4描述性统计图教学要求:使学生了解基本图形与绘图函数;掌握绘图参数和自定义元素的设定。重点:向量和矩阵的表示及运算。难点:数据框的应用。841、2、37.统计与回归分析7.1定性数据与定量数据7.2数据的数值度量7.3概率分布与假设检验7.4回归分析教学要求:了解概率分布与假设检验;掌握基于R语言的回归分析函数和调用参数。重点:向量和矩阵的表示及运算。难点:数据框的应用。81、2、38.统计与机器学习8.1特征空间与距离8.2聚类算法8.3分类算法8.4集成学习教学要求:理解并掌握R语言的聚类和分类算法;掌握集成学习方法。重点:聚类和分类算法。难点:集成学习。641、2、39.神经网络与深度学习9.1基本原理9.2感知器模型9.3深度神经网络教学要求:掌握神经网络基本原理;了解深度神经网络。重点:神经网络基本原理。难点:深度神经网络。41、2、3合计48162.实验部分实验部分的教学内容、基本要求与学时分配见表3。表3实验项目、实验内容与学时实验项目实验内容和要求实验学时对应的课程目标1.R语言基础语法应用实验内容:R语言基础语法与函数设计。实验要求:熟悉R语言的集成开发环境RStudio,掌握工作空间管理的理解和应用;理解并熟练掌握控制流,掌握函数设计方法。41、2、32.数据文件的读写和处理实验内容:使用R语言对数据文件进行读写和预处理。实验要求:理解向量和矩阵的表示及运算,掌握数据框的应用。41、2、33.R语言的数据可视化实验内容:R语言的数据可视化应用。实验要求:了解基本图形与绘图函数,掌握绘图参数和自定义元素的设定。41、2、34.R语言的回归分析方法及决策树算法实现实验内容:R语言对数据的建模分析。实验要求:了解概率分布与假设检验,掌握基于R语言的回归分析函数和调用参数,理解并掌握R语言的聚类和分类算法。41、2、3合计16五、教学方法及手段本课程以课堂讲授为主,采用启发式、讨论式教学和案例教学等,促进学生积极思考,开发学生的潜能,培养学生思考问题、分析问题和解决问题的能力;以“少而精”为原则,精选教学内容,精讲多练;安排习题课,巩固课堂所学知识;结合学习通超星平台,中国大学慕课网,哔哩哔哩视频网站等视频资源提供灵活的自主的学习方式。六、课程资源1.推荐教材(1)沈刚.R语言基础与数据科学应用[M].北京:人民邮电出版社,2019.(2)刘鹏等.R语言[M].北京:清华大学出版社,2019.(3)丰士昌.零基础学R语言数学计算、统计模型与金融大数据分析[M].北京:清华大学出版社,2018.2.参考书(1)李庆华、周青.R语言数据分析与数据挖掘应用(微课视频版)[M].北京:清华大学出版社,2021.(2)卡巴科弗(RobertI.Kabacoff).R语言实战[M].北京:人民邮电出版社,2016.(3)王国胤.大数据挖掘及应用[M].北京:清华大学出版社,2017.(4)刘顺祥.R语言数据分析、挖掘建模与可视化[M].北京:清华大学出版社,2021.3.期刊:(1)Team,R.Core.R:Alanguageandenvironmentforstatisticalcomputing.(2013):201.(2)Ihaka,Ross,RobertGentleman.R:alanguagefordataanalysisandgraphics.
Journalofcomputationalandgraphicalstatistics
5.3(1996):299-314.(3)杨霞,吴东伟.R语言在大数据处理中的应用[J].科技资讯,2013,(23):19-20.(4)刘培宁,韩笑,杨福兴.基于R语言的NetCDF文件分析和可视化应用[J].气象科技,2014,42(04):629-634.(5)牛艳芳,邓雪梅,陈伟.数据科学工具之R语言在审计数据分析中的应用探索[J].中国注册会计师,2016,(09):93-97.4.网络资源:(1)R语言官方网站./.(2)R语言博客社区..(3)世界程序员交流社区..七、课程考核对课程目标的支撑课程成绩由过程性考核成绩和期末考核成绩两部分构成,具体考核/评价细则及对课程目标的支撑关系见表4。表4课程考核对课程目标的支撑考核环节占比考核/评价细则课程目标123过程性考核课堂表现17.5(1)根据课堂出勤情况和课堂回答问题情况进行考核,满分100分。(2)以平时考核成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√√7.555实验12.5(1)根据每个实验的实验操作完成情况和实验报告质量单独评分,满分100分;(2)每次实验单独评分,取各次实验成绩的平均值作为此环节的最终成绩。(3)以实验成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√√52.55作业20(1)主要考核学生对各章节知识点的复习、理解和掌握程度,满分100分;(2)每次作业单独评分,取各次成绩的平均值作为此环节的最终成绩。(3)以作业成绩乘以其在总评成绩中所占的比例计入课程总评成绩。√√√5105期末考核50(1)卷面成绩100分,以卷面成绩乘以其在总评成绩中所占的比例计入课程总评成绩。(2)主要考核R语言基础语法,R语言面向对象程序设计,R语言数据处理与可视化,机器学习核心算法等内容。(3)考试题型为:数据分析程序设计大作业。√√2525合计:100分42.517.540八、考核与成绩评定1.考核方式及成绩评定考核方式:本课程主要以课堂表现、实验、作业、期末大作业等方式进行考核评价。考核基本要求:考核总成绩由期末大作业成绩和过程性考核成绩组成。其中:期末大作业为100分(权重50%),类型为大数据建模分析;课堂表现、实验、作业等过程性考核成绩为100分(权重50%);过程性考核和大作业分值分配与教学大纲各章节学时成比例。2.过程性考核成绩的标准过程性考核方式重点考核内容、评价标准、所占比重见表5。表5过程性考核方式评价标准考核方式所占比重(%)100>x≥9090>x≥8080>x≥7070>x≥60x<60课堂表现35积极参与教学活动,踊跃回答问题,准确率大于90%。认真参与教学活动,回答问题准确率大于80%。偶尔参与教学活动,回答问题准确率大于70%。上课不认真,偶尔参与教学活动。上课不认真,不参与教学活动。作业40作业完整,思路清晰,准确率大于90%。作业完整,准确率大于80%不交作业2次以内,准确率大于70%.不交作业4次以内,准确率大于6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度海上救援物资运输保险合同样本3篇
- 2024版农副业承包合同书模板2份
- 2024年环保型挖掘机买卖及售后服务合同细则3篇
- 2025年度绿色环保型小区商业街物业管理服务协议3篇
- 2024浙江企业无固定期限劳动合同纠纷处理机制3篇
- 2024版股权激励合同的绩效考核标准2篇
- 二零二五年分公司承包经营合同生态保护责任书3篇
- 二零二五年度白酒年份酒拍卖代理合同3篇
- 二零二五年度新能源产业股权收购合作协议3篇
- 水利工程施工质量控制及防治措施
- 继电保护试题库(含参考答案)
- 《榜样9》观后感心得体会四
- 《水下抛石基床振动夯实及整平施工规程》
- 2025年云南大理州工业投资(集团)限公司招聘31人管理单位笔试遴选500模拟题附带答案详解
- 现代学徒制课题:数字化转型背景下新型师徒关系构建研究(附:研究思路模板、可修改技术路线图)
- 风电危险源辨识及控制措施
- 《教师职业道德与政策法规》课程教学大纲
- 9.2溶解度(第2课时)-2024-2025学年九年级化学人教版(2024)下册
- 安徽省合肥市包河区2023-2024学年三年级上学期语文期末试卷
- 2024版食源性疾病培训完整课件
- 《住院患者身体约束的护理》团体标准解读课件
评论
0/150
提交评论