Python数据分析与应用-教学大纲_第1页
Python数据分析与应用-教学大纲_第2页
Python数据分析与应用-教学大纲_第3页
Python数据分析与应用-教学大纲_第4页
Python数据分析与应用-教学大纲_第5页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《Python数据分析与应用》教学大纲课程名称:Python数据分析与应用课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分课程的性质大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。有实践经验的数据分析人才已经成为了各企业争夺的热门。为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的数据分析人才需求,特开设Python数据分析与应用课程。课程的任务通过本课程的学习,使学生学会使用Python进行科学计算、可视化绘图、数据处理,分析与建模,并详细拆解学习聚类、回归、分类三个企业案例,将理论与实践相结合,为将来从事数据分析挖掘研究、工作奠定基础。课程学时分配序号教学内容理论学时实验学时其它1第1章Python数据分析概述212第2章NumPy数值计算基础223第3章Matplotlib数据可视化基础224第4章pandas统计分析基础345第5章使用pandas进行数据预处理346第6章使用sklearn构建模型647第7章航空公司客户价值分析648第8章财政收入预测分析639第9章家用热水器用户行为分析与事件识别64总计3628教学内容及学时安排理论教学序号章节名称主要内容教学目标学时1Python数据分析概述掌握数据分析的概念掌握数据分析的流程了解数据分析的应用场景了解数据分析的常用工具了解Python数据分析的优势了解Python数据分析的常用类库了解Python的Anaconda发行版在Windows操作系统上安装Anaconda在Linux系统上安装Anaconda掌握JupyterNotebook的基础功能掌握JupyterNotebook的高级功能掌握数据分析的概念、流程与应用场景了解Python常用的数据分析库掌握Windows/Linux系统下Anaconda安装掌握JupyterNotebook的常用功能22NumPy数值计算基础创建数组对象生成随机数通过索引访问数组变换数组的形态创建NumPy矩阵掌握ufunc函数读写文件使用数组进行简单的统计分析掌握NumPy创建多维数组与生成随机数的方法掌握数组的索引与变换掌握NumPy中数组矩阵的运算及通用函数的基本使用方法掌握NumPy读写文件的方法和常用的统计分析的函数23Matplotlib数据可视化基础掌握pyplot的基础语法设置pyplot的动态rc参数绘制散点图绘制折线图绘制直方图绘制饼图绘制箱线图掌握pyplot常用的绘图参数的调节方法掌握子图的绘制方法掌握绘制图形的保存与展示方法掌握散点图和折线图的作用与绘制方法掌握直方图、饼图和箱线图的作用与绘制方法24pandas统计分析基础读写数据库数据读写文本文件读写Excel文件查看DataFrame的常用属性查改增删DataFrame数据描述分析DataFrame数据转换字符串时间为标准时间提取时间序列数据信息加减时间数据使用groupby方法拆分数据使用agg方法聚合数据使用apply方法聚合数据使用transform方法聚合数据使用povit_table函数创建透视表使用crosstab函数创建交叉表掌握常见的数据读取方式掌握DataFrame常用属性与方法掌握基础时间数据处理方法掌握分组聚合的原理与方法掌握透视表与交叉表的制作35使用pandas进行数据预处理堆叠合并数据主键合并数据重叠合并数据检测与处理重复值检测与处理缺失值检测与处理异常值离差标准化数据标准差标准化数据小数定标标准化数据哑变量处理类别型数据离散化连续型数据掌握数据合并的原理与方法掌握数据清洗的基本方法掌握基本数据标准化的方法掌握常用的数据转换方法36使用scikit-learn构建模型加载datasets模块中的数据集将数据集划分为训练集和测试集使用sklearn转换器进行数据预处理与降维使用sklearn估计器构建聚类模型评价聚类模型使用sklearn估计器构建分类模型评价分类模型使用sklearn估计器构建回归模型评价回归模型掌握sklearn转换器的使用方法掌握sklearn估计器的使用方法掌握聚类模型的构建与评价掌握分类模型的构建与评价掌握回归模型的构建与评价67航空客户价值分析分析航空公司现状认识客户价值分析熟悉航空客户价值分析的步骤与流程处理缺失值与异常值构建爱你航空客户价值分析关键特征标准化LRFMC5个特征了解K-Means聚类算法分析聚类结果模型应用熟悉航空客户价值分析的步骤和流程了解RFM模型的基本原理掌握K-Means算法的基本原理与使用方法比较不同类别客户的客户价值,制定相应的营销策略68财政收入预测分析分析财政收入预测背景了解财政收入预测的方法熟悉财政收入预测的步骤与流程了解相关性分析分析计算结果了解Lasso回归方法分析Lasso回归结果了解灰色预测算法了解SVR算法分析预测结果熟悉财政收入预测的步骤和流程掌握相关性分析方法与应用掌握使用Lasso模型选取特征的方法掌握灰色预测的原理与应用掌握支持向量回归算法的基本原理与应用69家用热水器用户行为分析与事件识别分析家用热水器行业现状了解热水器采集数据的基本情况熟悉家用热水器用户行为分析的步骤与流程删除冗余特征划分用水事件确定单次用水事件时长阈值构建用水时长与频率特征了解灰色预测算法构建用水量与波动特征筛选候选洗浴事件了解BP神经网络算法原理构建模型评估模型熟悉家用热水器用户行为分析的步骤与流程掌握用水事件划分原理及与方法掌握阈值寻优的原理和方法熟悉用水行为特征构建的原理与方法了解BP神经网络算法的基本原理掌握使用sklearn神经网络算法构建6学时合计36实验教学序号实验项目名称实验要求学时1Python数据分析环境搭建在Windows/Linux系统上安装Anaconda;掌握JupyterNotebook的常用功能12NumPy数值计算基础创建NumPy数组对象ndarray;查看ndarray的常用属性;花式索引ndarray;变换ndarray的形态;创建NumPy矩阵并使用;使用常见ufunc;使用NumPy读写文件23Matplotlib数据可视化基础掌握pyplot的基本绘图语法;设置pyplot的动态rc参数;绘制散点图;绘制折线图;绘制直方图;绘制饼图;绘制箱线图24pandas统计分析基础读写数据库数据;读写文本文件;读写Excel文件;查看DataFrame的常用属性;查改增删DataFrame数据;描述分析DataFrame数据;转换字符串时间为标准时间;提取时间序列数据信息;加减时间数据;使用groupby方法拆分数据;使用agg,apply,transform方法聚合数据;制作透视表;制作交叉表45pandas数据预处理堆叠、主键、重叠合并数据;检测与处理重复值,缺失值,异常值;离差标准化、标准差标准化;小数定标标准化数据;哑变量处理类别型数据;离散化连续型数据46sklearn模型构建加载datasets模块自带数据集;划分数据集;使用sklearn转换器进行数据预处理与降维;构建与评价聚类模型;构建与评价分类模型;构建与评价回归模型47航空公司客户价值分析处理数据缺失值与异常值;构建航空客户价值分析的关键特征;标准化LRFMC5个特征;构建K-Means聚类模型;评价K-Means聚类模型48财政收入预测分析分析财政收入数据特征的相关性;使用Lasso回归选取财政收入预测的关键特征;使用灰色预测和SVR构建财政收入预测模型;评价SVR模型39家用热水器用户行为分析与事件识别删除冗余特征;划分用水事件;确定单次用水事件的时长阈值;构建用水行为特征;筛选候选洗浴事件;构建BP神经网络模型;评价BP神经网络模型4学时合计28考核方式突出学生解决实际问题的能力,加强过程性考核。课程考核的成绩构成=平时作业(10%)+课堂参与(20%)+期末考核(70%),期末考试建议采用开卷形式,试题应包括基本概念、绘图、分组聚合、数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论