《数据科学的统计基础》课程教学大纲_第1页
《数据科学的统计基础》课程教学大纲_第2页
《数据科学的统计基础》课程教学大纲_第3页
《数据科学的统计基础》课程教学大纲_第4页
《数据科学的统计基础》课程教学大纲_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-7-《数据科学的统计基础》教学大纲课程编号:121424A课程类型:□通识教育必修课□通识教育选修课eq\o\ac(□,√)学科基础课□专业核心课□专业提升课□专业拓展课总学时:64讲课学时:48实验(上机)学时:16学分:4考试类型:eq\o\ac(□,√)考试□考查适用对象:数据科学与大数据技术□是eq\o\ac(□,√)否适合作为其他专业学生的个性化选修课先修课程:微积分、线性代数、概率论一、教学目标本课程是针对统计学院数据科学与大数据技术专业本科生开放的学科基础课,是一门系统讲授数据科学与大数据的研究与应用中所必备的统计学知识的课程。本课程旨在使学生理解并掌握统计思想、基本概念、主要原理和常用方法,同时使学生对数据科学的统计学与传统统计学的区别加以认识,为学习后继数据科学课程奠定必要的统计学思想和方法基础。目标1:学会基本的数据处理方法,能完成日常的数据处理工作。目标2:学会简单的统计模型,并能将实际问题模型化。目标3:学会使用简单的统计软件,能使用软件进行日常统计分析。目标4:能运用数据分析,完成简单的总结分析报告。目标5:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有扎实统计专业学识,坚韧奋斗进取品格的爱国青年。二、教学内容及其与毕业要求的对应关系本课程的主要内容涵盖:数据的收集、探索性分析与可视化;数据的相关性与因果性;数据的重抽样与降维;频率统计与贝叶斯统计;点估计、区间估计和假设检验中的统计概念、理论与方法;数据挖掘、推断与预测中统计原理、评价标准和常用方法。其中,点估计、区间估计和假设检验,以及对数据科学中的统计学思想的理解和应用是本课程的重点和难点内容。教学中主要采用讲授法为主,讲练结合的方式。要求学生做到课前预习课后练习,做好每章的课后习题。作业计入平时成绩。本课程考核方式以笔试、闭卷方式进行,期末卷面成绩占总成绩的60%,期中测验成绩占总成绩的20%,平时成绩占总成绩的20%,平时成绩主要以平时作业、课堂考勤、课堂讨论发言等情况综合评定。三、各教学环节学时分配以表格方式表现各章节的学时分配,表格如下:教学课时分配序号章节内容讲课实验其他合计1数据科学引论6062数据探索性分析6283随机性、相关性和相依性6284数据降维及数据重抽样6285频率估计:估计与置信区间6286假设检验82107贝叶斯统计6288实例研究448合计4816064四、教学内容第一章数据科学引论什么是数据科学(理解)数据科学中的统计学(理解)R语言基础(掌握)教学重点、难点:本章的重点是数据科学及数据科学中所需要的统计学。课程的考核要求:理解数据科学的统计学与传统统计学的差别。课程思政切入点:(1)统计学的发展历程与我国科技的发展;2.统计素养与职业道德。第二章数据探索性分析数据的来源(了解)描述性统计(掌握、应用)数据可视化(掌握、应用)教学重点、难点:本章的重点是数据的描述性方法,利用描述性统计实现数据的可视化。课程的考核要求:掌握描述性统计方法,能够运用R语言实现数据的可视化。课程思政切入点:(1)样本的代表性要好,考察问题要全面;2.如何正确认识数据的误差,生活中的一些统计数据如何正确看待。第三章随机性、相关性和相依性数据的随机性(理解)相关系数和相关矩阵(掌握)数据的伪相关(理解)教学重点、难点:相关系数和相关矩阵的计算。课程的考核要求:掌握数据的相关系数计算公式。第四章数据降维及数据重抽样充分统计量(掌握)主成分分析(掌握、应用)因子分析(掌握、应用)奇异值分解(理解)数据重抽样方法(理解)教学重点、难点:本章的重点是常见的数据降维和重抽样方法。课程的考核要求:掌握充分统计量的概念,掌握主成分分析和因子分析的基本原理并能进行实际应用,理解常见的数据重抽样方法的做法。第五章频率估计:估计与置信区间课程思政切入点:(1)主成分相关的,有重复,所以工作中如何不做重复工作,交叉的处理。2.因子得分作评价,要注意评价的适用性,评价一个人或事物如何设计评价的准则。点估计(掌握)区间估计(掌握)估计的评价标准(掌握)教学重点、难点:区间估计的思想和计算方法。课程的考核要求:掌握矩估计、极大似然估计和区间估计的思想和计算方法,并能够对估计的效果进行评价。课程思政切入点:(1)估计区间的宽窄受各种因素影响,不用降低置信水平,缩小区间,让人感觉估计的更准,诚实做人。2.如何看待置信水平,无法做出置信水平100%的区间,要求我们谦虚,不能百分百保证区间有用。第六章假设检验假设检验的基本概念(理解)假设检验的基本思想(掌握)两类错误(掌握)显著性水平(掌握)多重假设检验(掌握)教学重点、难点:假设检验的基本思想、步骤,第一类错误和显著性水平。课程的考核要求:掌握假设检验的基本步骤,原假设设立的方法。课程思政切入点:(1)如何看到原假设,评价别人第一印象的重要性,学会正确评价别人。2.如何看待两类错误,任何事情都有两面性。第七章贝叶斯统计贝叶斯基本思想(理解)先验分布和后验分布(掌握)MCMC算法(掌握)贝叶斯推断(掌握)教学重点、难点:贝叶斯统计的思想,后验分布的计算方法,MCMC算法进行贝叶斯估计和推断。课程的考核要求:掌握后验分布的计算方法,应用MCMC算法进行贝叶斯估计和推断。第八章实例研究(理解、应用)教学重点、难点:通过实际数据,运用R语言编程与演示,了解、学习并运用本课程涉及到统计学概念、方法和理论解决数据科学中的实际问题。复习思考题:1.数据科学中所需要的统计学知识有哪些?2.如何进行矩估计和极大似然估计?3.如何理解区间估计的置信度和假设检验的置信水平?4.贝叶斯统计与经典统计学的区别?五、考核方式、成绩评定本课程考核方式以笔试、闭卷方式进行。课程成绩评定采用综合评定方式,期末卷面成绩占总成绩的60%,期中测验成绩占总成绩的20%,平时成绩占总成绩的20%,平时成绩主要以平时作业、课堂考勤、课堂讨论发言等情况综合评定。六、主要参考书及其他内容[1]James,G.,Witten,D.,Hastie,T.,Tibshirani,R.AnIntroductiontoStatisticalLearningwithApplicationsinR.纽约:Springer.2013年2月[2]Wasserman,Larry.AllofStatistics:AConciseCourseinStatisticalInference.纽约:Springer.2004年9月[3]M.H.DeGroot,M.J.Schervish.ProbabilityandStatistics.英国:Pearson.2011年1月[

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论