Python数据分析与可视化教学大纲_第1页
Python数据分析与可视化教学大纲_第2页
Python数据分析与可视化教学大纲_第3页
Python数据分析与可视化教学大纲_第4页
Python数据分析与可视化教学大纲_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《Python数据分析与可视化》课程教学大纲课程代码:学分/学时:3/48课程类型:必修/开课对象:先修课程:开课单位:执笔人:核准院长:一,课程地性质,目地与任务《Python数据分析与可视化》是软件工程专业中地一门数据分析入门课程,该课程介绍了Python语言在数据分析方面地应用,依据数据分析地步骤,从数据预处理,分析,可视化等方面介绍了数据分析地方式,并通过六个完整地数据分析实例进展有关学问地学习。主要内容包括Python根底学问介绍,数据预处理,数据分析根底工具NumPy,处理构造Pandas,数据分析与学问觉察,scikit-leam实现数据分析,Matplotlib交互式图表绘制以及六个完整实例。依据数据分析地根本流程循序渐进地学习数据分析学问,并使用Python编程进展实战操作。试验局部通过完整数据分析实例地学习,帮助学生更好地把握数据分析技能,做到理论与实践相结合,方法与应用相结合。本课程除要求学生掌握数据分析地根底学问与有关Python库使用,更重要地是要求学生把握理论与实践结合地学习方式,为更深入地学习打下良好地根底。二,学习内容及教学根本要求数据分析概述与根本概念〔4学时〕掘地关系;了解机器学习与数据分析地关系;了解数据分析地根本步骤,即数据收集,数据地概念与内容;了解Python在数据分析领域所具有地优点。Python根底学问〔4学时〕地开展史;了解Python及Pandas,scikit-learn,Matplotlib地安装;把握PythonPythonPython地重要性,Python用方法,注释地使用方法,Python语法学问;了解Pandas,scikit-learn,Matplotlib等重要Python库;了解Jupyter交互式数据科学与科学计算开发环境。数据预处理〔4学时〕解数据质量标准评估地完整性,全都性,准确性与准时性4个要素。了解数据清洗地概念及方式,包括缺失值地处理,噪声数据地处理,不全都数据地处理与特别数据地处理;了解数据地特征选择,特征构建与特征提取。NumPy数据分析根底工具〔4学时〕了解NumPy库地作用;把握多维数组对象ndarray地使用,包括ndarray地创立,ndarray地索引,切片与迭代,ndarray地shape地操作,ndarray地根底操作等。Pandas处理构造化数据〔4学时〕了解Pandas库地作用与特色功能;了解Pandas中Series与DataFrame构造;把握Series对象地创立,访问与操作;把握DataFrame对象地创立,访问与操作;把握基于Pandas地Index对象地访问操作;了解Pandas地有关数学统计与计算工具;了解Pandas地数学聚合与分组运算。数据分析与学问觉察〔4学时〕KApriori算法,FP-Tree算法,PrefixSpan算法;了解聚类分析地概念;了解K均值算法与DBSCAN;了解回归分析地根本概念与常用方法。scikit-leam实现数据地分析〔4学时〕scikit-learn地分类方法,回归方法与聚类方法,分类方法包括Logistic回归,SVM,最近邻分类器,决策树,随机梯度下降,高斯过程分Lasso,贝叶斯岭回归,决策树回归,高斯过程回归与最近邻回归,聚类方法包括 K-means,Affinitypropagation,Mean-shift,Spectralclustering,Hierarchicalclustering,DBSCAN与Birch。Matplotlib——交互式图表绘制〔4学时〕了解Matplotlib地作用;把握Matplotlib中地根本布局对象地建立;把握修改图表样式,修改装饰项与添加注释地方法;把握根底图表地绘制,包括直方图,散点图,柱状图,折线图与表格;了解使用Matplot3DMatplotlib与Jupyter结合使用地方法。10.试验〔16学时〕教学说明及教学根本要求见《Python数据分析与可视化》试验教学大纲。三,教学方法本课程教学方法以教师为主导地启发式讲授教学法为主,争论〔提问〕辅,并结合争论〔提问〕式教学,以及结合课外学习地教学方法。.本课程概念较多,因此教学形式以讲授方式为主。本课程拟承受多媒体PPT地教学方程中留意各个学问点地关联性,以使学生更好地理解课程内容。.对课程中关键性概念,设计思想方面地问题可辅以课堂争论地形式。四,课内外教学环节及根本要求483216周〔2学时〕;16个学8周〔2学时〕。课外学习要求:.带着问题主动地听课。.课后要复习,有余力地学生复习时还应阅读参考资料,认真整理课堂听课笔记。.要求学生课外自主学习,学生课外阅读地参考资料以本大纲所列参考资料为主。五,考核内容及方式如下:.寻常成绩占30%,主要考察作业地完成程度,理论课与试验课地出勤率,试验课地考试结果。其中作业占10%,试验占15%,出勤率占5%。.期末成绩占70%,承受考试地考核方式。考试承受闭卷形式,题型为选择题,正确/错误题,填空题,简答题,以及应用题。六,持续改进学中缺乏处进展改进,并在下一轮课程教学中改进。七,建议及参考资料建议:[1]吕云翔,李伊琳主编.Python数据分析与可视化[M].北京:,2021.2《Python数据分析与可视化》试验教学大纲学习内容及教学根本要求.Python地安装与使用〔2学时〕了解Python地安装方法;了解Python在本课程中起到地作用;把握Python地基础PythonPython语法学问等;把握使用Python编写并运行简洁程序地力量。.数据分析有关工具地安装与使用〔2学时〕地根本功能与安装方式;把握多维数组对象ndarrayPandasscikit-learn库地使用方式;了解Matplotlib地根本功能与安装方式;把握Matplotlib库地使用方式;把握修改图表样式,修改装饰项与添加注释地方法;把握根底图表地绘制方法;.实战:影评数据分析与电影推举〔2学时〕了解本实例中对数据地采集与处理;使用pandas对用户评分数据与电影信息数据进行初步分析;了解用户评分统计信息地查看方式与有关图表地绘制方式;了解电影评分分布地查看方式与图表绘制方式;了解使用协同过滤算法实现电影推荐地方法。.实战:汽车贷款违约地数据分析〔2学时〕续变量与分类变量地缺失值处理;了解模型建立与模型评估,包括承受回归模型进展数据分析,承受决策树模型进展数据分析,承受随机森林模型优化决策树模型等。.实战:Python表格数据分析〔2学时〕了解openpyxl地背景与安装方式;了解如何使用openpyxl创立工作簿;把握使用openpyxl从Excel工作簿中读取,迭代访问,修改与插入数据;了解为Excel工作簿添加openpyxl读取到地数据转为Dataframe对象地方式;了解绘制数据列直方图,有关性矩阵与散布矩阵地方式,并能够将可视化结果插入Excel工作簿;.实战:利用手机地购物评论分析手机特征〔2学时〕了解利用Kaggle猎取本实例地数据地方式;了解数据地筛选过程;了解词袋算法〔CountVectorizerTF」DF〕CountVectorizerk均值提取数据;了解使用spaCy进展名词提取与使用TextBlob进展情感分析地方法,并依据数据生成柱状图。.实战:基于k近邻模型推测葡萄酒种类地数据分析与可视化〔2学时〕了解k近邻模型地工作原理;了解k近邻模型地初步建立方式;了解数据归一化地方NumPy

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论