版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python数据分析与应用:从数据获取到可视化全书教学设计完整版课程名称: Python数据分析 授课年级: 2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第1章 数据分析概述计划学时2学时内容分析近些年,随着网络信息技术与云计算技术的快速发展,网络数据得到了爆发性地增长,人们每天都充斥在庞大的数据群体中,这一切标志着人们进入了大数据时代。在大数据环境的作用下,能够从数据里面发现并挖掘有价值的信息变得愈发重要,数据分析技术应运而生。数据分析可以通过计算机工具和数学知识处理数据,并从中发现规律性的信息,以做出具有针对性的决策。教学目标及基本要
2、求了解数据分析的背景及应用场景掌握什么是数据分析以及数据分析的流程会创建Python环境,使用Anconda管理Python包会使用Jupyter Notebook认识常见的数据分析工具教学重点掌握什么是数据分析以数据分析的流程会创建Python环境,使用Anconda管理Python包会使用Jupyter Notebook教学难点会创建Python环境,使用Anconda管理Python包会简单使用Jupyter Notebook教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(了解数据分析的背景及应用场景、掌握什么是数据分析以及数据分析的流程,会创建Python环境、使
3、用Anconda管理Python包)一、创设情境,导入数据分析应用场景教师通过提问学生问题,引出数据分析应用场景。教师提问学生问题,例如问题是:大家知道哪些场合用到了数据分析?它们对数据进行怎样的分析?教师进行总结:在营销、医疗、零售等方面都会经常使用数据分析,通过对大量的数据进行分析得出数据的具体特征。什么是数据分析?数据分析是指从大量看似杂乱无章的数据中提炼出有用的数据,以找出研究对象的内在规律。明确本节课的学习目标,让学生带着目标去听课。要求学生了解数据分析的背景和应用场景要求学生熟悉数据分析的基本流程要求学生熟悉Anconda的安装和管理Python包二、进行重点知识的讲解教师根据课件
4、,讲述数据分析的背景和应用场景。当产生海量的数据后,使用数据分析可以从中获取潜藏的有价值信息,在营销、医疗、零售等方面经常使用数据分析对数据进行潜在价值的挖掘。教师根据课件,讲述数据分析的流程。数据分析是基于商业目的,有目的地进行收集、整理、加工和分析数据,提炼出有价值的信息,整个过程大致可以分为:1.明确目的和思路、2.收据收集、3.数据处理、4.数据分析、5.数据展现。教师根据课件,介绍Anconda的安装及使用。Anconda是一个可以便捷获取和管理包,同时对环境可以统一管理的发行版本,它包含了conda、Python在内的超过180个科学包及其依赖项。三、归纳总结,布置作业/随堂练习(
5、1)回顾上课前的学习目标,并对本节课的重要知识点进行总结。带领学生总结本课内容:了解数据分析的背景及应用场景、掌握什么是数据分析以及数据分析的流程、会安装使用Anconda。教师安排学生课上完成章节课后习题,并针对一些难以理解的题目进行讲解。(3)使用博学谷系统下发课后作业。第二课时(Jupyter Notebook的使用、认识常见的数据分析工具)一、回顾上节课的内容,继续讲解本课时的Anconda的使用教师对学生们的疑问进行统一答疑。教师根据课件,讲解Jupyter Notebook的使用。在上一节中已经讲解了如何Anconda,接下来,我们可以使用Anconda中自带的Jupyter No
6、tebook进行数据分析操作。教师根据课件,讲解其他常见的数据分析工具。Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力。我们的课程用到的库包括NumPy、Pandsa、Matplotlib、Seaborn、NLTK等。明确学习目标要求学生会使用Jupyter Notebook要求学生熟悉其他的数据分析工具二、进行重点知识的讲解教师根据课件,讲述如何启动Jupyter Notebook。教师根据课件,对Jupyter Notebook进行界面介绍。教师根据课件,介绍Jupyter Notebook的基本使用。教师根据课件,其他常见的数据分析工具。三、归纳总结,布置
7、作业/随堂练习回顾上课前的学习目标,并对本节课的重要知识点进行总结。教师提问学生本节课需要掌握的知识点,包括Jupyter Notebook的使用、其他数据分析工具,并对学生的回答进行补充和总结。教师安排学生课上完成章节课后习题,并针对一些难以理解的题目进行讲解。使用博学谷系统下发课后作业。思考题和习题见教材第1章配套的习题教学后记Python数据分析与应用:从数据获取到可视化教学设计课程名称: Python数据分析 授课年级: 2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第2章 科学计算库NumPy计划学时5学时内容分析NumPy作为高
8、性能科学计算和数据分析的基础包,它是本书介绍的其它重要数据分析工具的基础,掌握NumPy的功能及其用法,将有助于后续其他数据分析工具的学习。教学目标及基本要求认识NumPy数组对象,会创建NumPy数组熟悉ndarray对象的数据类型,并会转换数据类型掌握数组运算方式掌握数组的索引和切片会使用数组进行数据处理熟悉线性代数模块和随机数模块的使用教学重点认识NumPy数组对象,会创建NumPy数组创建NumPy数组ndarray对象的数据类型整数索引和切片的基本使用布尔型索引的基本使用数组的转置和轴对称将条件逻辑转为数组运算检索数组元素随机数模块教学难点花式索引的基本使用布尔索引的基本使用将条件逻
9、辑转为数组运算教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(认识NumPy数组对象,创建NumPy数组、ndarray对象的数据类型)创设情境,引入Numpy(1)教师通过介绍科学计算库,引出NumPy数组对象通过对NumPy的介绍,引出NumPy数组对象ndarray。同时介绍ndarray对象中常用的属性,如ndarray.shape(2)教师根据课件,讲解如何创建NumPy数组。对数组对象进行介绍完之后,带领学生使用array()、zeros()、ones()、empty()、arange()函数实现创建NumPy数组。(3)教师根据课件,介绍ndarray对象的
10、数据类型。使用name属性获取ndarray对象的数据类型,然后罗列出NumPy中的数据类型,最后讲解使用astype()方法转换类型 (4)明确学习目标要求学生了解NumPy的数组ndarray对象要求学生掌握如何创建NumPy数组要求学生掌握如何查看数据类型及转换数据类型进行重点知识的讲解认识NumPy数组对象NumPy中最重要的一个特点就是其N维数组对象,即ndarray对象,该对象具有矢量算术能力和复杂的广播能力,可以执行一些科学计算。不同于Python标准库,ndarray对象拥有对高维数组的处理能力,这也是数值计算中缺一不可的重要特性。使用不同的方法创建NumPy数组首先使用arr
11、ay()函数创建第一个NumPy数组,并对该数据进行简单讲解,接着分别使用zeros()、ones()、empty()、arange()函数创建NumPy数组。ndarray对象的数据类型在创建NumPy数组之后,使用name属性查看数组对象的数据类型,并演示使用astype()方法将该对象的数据类型进行转换。三、归纳总结,布置课后作业 回顾上课前的学习目标,并且对本节课需要掌握的知识点进行总结。教师带领学生总结本节课的内容,包括什么数组对象、创建NumPy的方法、ndarray的数据类型。布置随堂练习,检查学生掌握情况。根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学
12、生出现的问题进行解决。 使用博学谷系统下发课后作业。第二课时(数组运算、ndarray的索引和切片)回顾上节课讲解的知识,继续讲解本节课的知识教师讲解上一课时的课后作业。回顾上节课所学习的知识,由上一课时的知识点引出本课时内容。在上一节中介绍了如何创建NumPy数组、如何查看数据类型以及转换数据类型。接下来,引出对NumPy数组进行更深入的讲解,数组的运算和nadarray的索引和切片操作。明确学习目标要求学生熟悉数组运算的规则要求学生掌握ndarray索引和切片的操作进行重点知识的讲解教师根据课件,讲述数组运算常见的操作。在数组运算中常见的操作有矢量化运算、数组广播、数组与标量间的运算。教师
13、根据课件,讲述矢量化运算的规则。在NumPy中,大小相等的数组之间的任何算术运算都会应用到元素级,即只用于位置相同的元素之间,所得的运算结果组成一个新的数组。教师根据课件,讲述数组广播的规则。数组在进行矢量化的运算时,要求数组的形状是相等的。当形状不相等的数组执行算术计算的时候,就会 出现广播机制,该机制会对数组进行扩展,使数组的shape属性值一样,这样就可以进行矢量化运算。教师根据课件,讲述数组与标量间的运算规则。大小相等的数组之间的任何算术运算都会将运算应用到元素级,同样,数组与标量的算术运算也会将那个标量值传播到各个元素。讲解ndarray的索引和切片并引出整数索引和切片的基本使用。n
14、darray对象支持索引和切片操作,并通过简单的示例演示ndarray对象使用整数索引和切片。教师根据课件,讲述花式索引的基本使用。花式索引是NumPy的一个术语,是指用整数数组或列表进行索引,然后再将数组或列表中的每个元素作为下标进行取值。教师根据课件,讲述布尔型索引的基本使用。布尔型索引值的是将一个布尔数组作为数组索引,返回的数据是布尔数组中True对应位置的值。三、归纳总结,布置课后作业 (1)回顾课前学习目标,对本节课的内容进行总结。教师带领学生总结本节课要掌握的内容:数组运算的几种规则,ndarray的索引和切片操作。(2)布置随堂练习,检查学生学习状况。根据博学谷和随堂练习资源,给
15、学生布置随堂练习,根据学生的完成情况,了解学习的学习理解状况,根据学生反映的问题,进行解答。(3)使用博学谷系统下发课后作业。第三课时(数组的转置和轴对称、NumPy通用函数、利用NumPy数组进行数据处理)回顾上节课讲解的知识,继续讲解本节课的知识教师讲解上一课时的课后作业。回顾上节课所学的知识,由上一课时知识点引出本课时内容。回顾上节中的数组运算与ndarray的索引和切片,在本节中将会讲解数组的转置和轴对称、NumPy通用函数、利用NumPy数组进行数据处理。明确学习目标。要求学生掌握数组转置和轴对称要求学生熟悉NumPy的通用函数要求学生掌握利用NumPy数组进行数据处理进行重点知识的
16、讲解教师通过示例演示数组的转置和轴对称。数组的转置是指将数组中的每个元素按照一定的规则进行位置变换。教师通过示例演示NumPy通用函数。示例举出几个常用的函数进行演示,并对教材中罗列的函数进行简单说明。教师通过示例演示,NumPy常用的数据处理操作。NumPy中常用的数据处理操作有将条件逻辑转为数组运算(where()函数)、数组统计计算(sum、max.)、数组排序(sort()方法)、检索数组元素(all()、any()函数)、唯一化及其他集合逻辑(unique()函数)三、归纳总结,布置课后作业 (1)回顾数组的转置和轴对称、NumPy的通用函数以及使用NumPy数组进行数据处理,最后本
17、节课的内容进行总结。(2)使用博学谷系统下发课后作业。第四课时(线性代数模块、随机数模块)回顾上节课讲解的知识,继续讲解本节课的知识教师讲解上一课时的课后作业。回顾上节课所学的知识,由上一课时知识点引出本课时内容。回顾上节中的数组转置和轴对称、NumPy通用函数以及使用NumPy数组进行数据处理。明确学习目标。要求学生熟悉线性代数模块要求学生掌握随机数模块进行重点知识的讲解教师通过示例演示线性代数模块。线性代数是数学运算中的一个重要工具,它在图形信号处理、音频信号处理中起非常重要的作用。numpy.linalg模块中有一组标准的矩阵分解运算已经诸如逆和行列式之类的东西。教师通过示例演示随机数模
18、块的使用。与Python的random模块相比,NumPy的random模块功能更多,它增加了一些可以高效生成多种概率分布的样本值的函数。三、归纳总结,布置课后作业 (1)对本节课的内容进行总结。(2)使用博学谷系统下发课后作业。第五课时(上机练习)上机练习主要针对本章中需要重点掌握的知识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:(练习教材中示例代码)形式:单独完成上机二:(完成案例酒鬼漫步)形式:单独完成思考题和习题见教材第2章配套的习题教学后记Python数据分析与应用:从数据获取到可视化教学设计课程名称: Python数
19、据分析 授课年级: 2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第3章 Python常用语句计划学时7 课时内容分析Pandas是一个基于NumPy的Python库,专门为了解决数据分析任务而创建的,它不仅纳入了大量的库和一些标准的数据模型,而且提供了高效操作大型数据集所需的工具,被广泛地应用到很多领域中,包括经济、统计、分析等学术和商业领域。教学目标及基本要求Pandas的数据结构分析Pandas索引操作及高级索引算术运算与数据对齐数据排序统计计算与描述层次化索引读写操作案例北京高考分数线统计分析教学重点Pandas的数据结构分析Pan
20、das索引操作及高级索引算术运算与数据对齐数据排序统计计算与描述层次化索引读写操作教学难点Pandas的数据结构分析Pandas索引操作及高级索引层次化索引读写操作教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(Series,DataFrame,索引对象)一、创设情境,导入Pandas教师介绍新的数据分析工具Pandas,并引出Pandas索引操作。Pandas是一个基于NumPy的Python库,专门为了解决数据分析任务而创建的,它不仅纳入了大量的库和一些标准的数据模型,而且提供了高效操作大型数据集所需的工具,被广泛的应用到很多领域中,包括经济、统计、分析等学术和商业领
21、域。教师根据课件,介绍Pandas中常用的两种数据结构。在Pandas中常用的两种数据结构分别是Series和DataFrame,Series是一种一维的数据结构,而DataFrame是一种二维的数据结构。教师根据课件,介绍Pandas索引对象。Pandas中的索引都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。明确学习目标要求学生掌握Series要求学生掌握DataFrame要求学生熟悉索引对象二、进行重点知识的讲解教师根据课件,介绍SeriesSeries是一个一维数组对象,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据与之相关的索引
22、两部分构成。教师根据课件,介绍DataFrameDataFrame是一个二维数组对象,它每列的数据可以是不同的数据类型,与Series的结构相似,DataFrame的结构也是由索引和数据组成的,不同的是,DataFrame的索引不仅有行索引,还有列索引。教师根据课件,介绍索引对象Pandas中的索引对象都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。三、归纳总结,布置作业/随堂练习回顾上课前的学习目标,并对本节课的内容进行总结。 教师总结本节课需要掌握的知识点,包括Series、DataFrame、索引对象。使用博学谷系统下发课后作业。第二课时(重置索引、索引
23、操作、算术运算与数据对齐)一、回顾上节课的内容,继续讲解本课时的索引操作和算术运算与数据对齐教师对学生们的疑问进行统一答疑。通过示例代码,回顾总结上节课内容,继续讲解本节内容。明确学习目标要求学生掌握重置索引要求学生掌握索引操作要求学生熟悉算术运算与数据对齐二、进行重点知识的讲解教师根据课件,讲述重置索引操作。Pandas中提供了一个重要的方法是reindex(),该方法的作用是原索引和新索引进行匹配,也就是说,新索引含有原索引的数据,而原索引数据按照新索引排序。如果新索引中没有原索引数据,那么程序不仅不会报错,而且会添加新的索引,并将值填充为NaN或者使用fill_value()填充其他值。
24、教师根据课件,讲述Series和DataFrame其他的索引操作。通过索引位置获取数据、通过索引名称获取数据、使用切片获取数据、获取不连续数据。教师根据课件,讲述算术运算与数据对齐。Pandas执行算术运算时,会先按照索引进行对齐,对齐以后进行相应的运算,没有对齐的位置会用NaN进行补齐。其中,Series是按行索引对齐的,DataFrmae是按行索引、列索引对齐的。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结。教师带领学生总结本节课需要掌握的内容,包括重置索引和索引操作。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生
25、出现的问题进行解决。 使用博学谷系统下发课后作业。第三课时(按索引排序、按值排序、常用的统计计算、统计描述)一、回顾上节课内容,继续讲解本节课的内容教师对学生们的疑问进行统一答疑。回顾总结上节课内容,讲解数据排序和统计计算与描述知识。在上节课中,介绍了Pandas的索引操作和算术运算与数据对齐,接下来,将介绍数据排序和统计计算与描述。明确学习目标要求学生掌握按索引排序要求学生掌握按值排序要求学生熟悉常用的统计计算要求学生熟悉统计描述二、进行重点知识的讲解教师根据课件,讲述数据排序按索引排序。Pandas中按索引排序使用的sort_index()方法,该方法可以用行索引或者列索引进行排序。教师根
26、据课件,讲述数据排序按值排序。Pandas中按值排序使用的sort_values()方法。教师根据课件,讲述常用的统计描述计算。通过几个简单的示例演示常用的统计描述方法,如max、min、sum等。教师根据课件,讲述统计描述。如果希望一次性输出多个统计指标,比如平均值、最大值、最小值、求和等,则我们可以调用describe()方法实现,而不用再单独地逐个调用相应的统计方法。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结教师带领学生总结数据排序的方法。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。使用博
27、学谷系统下发课后作业。第四课时(认识层次化索引、层次化索引操作、读写文本文件)一、回顾上节课内容,讲解本节内容教师讲解上节课作业,并对学生的疑问进行统一答疑。回顾上节课的内容,讲解本节课新的知识点。本节课主要的新内容有认识层次化索引,层次化索引操作,以及读写文本文件。明确学习目标要求学生熟悉层次化索引要求学生掌握层次化索引的操作要求学生掌握读写文本文件操作二、进行重点知识的讲解(1)教师通过图例引出什么层次化索引。当Pandas的Series或DataFrame对象只有一层索引时,可称其为单层索引,而层次化索引则可以理解为单层索引的延伸,即在一个轴方向上具有多层索引。根据示例,讲解创建层次化索
28、引的几种方法(from_tuples()、from_arrays()、from_product())。(2)教师根据课件,讲解层次化索引的操作?常用的层次化索引操作有选取子集操作、交换分层顺序、排序分层。 (3)教师讲解完层次化索引的知识,讲解Pandas读写数据操作。在对数据分析时,通常不会将需要分析的数据写入到程序中,而是以文件或数据库的形式保存,所以接下来介绍Pandas中的读写操作。在本节中主要讲解Pandas的读写文本的操作to_csv、read_csv、read_table三、归纳总结,布置作业 (1)回顾学习目标,对本节课的内容进行总结。 教师带领学生总结本节课的内容,内容包括了
29、解层次化索引、掌握层次化索引的操作、以及文本文件的读写操作。 (2)使用博学谷系统下发随堂练习,检测学生对课堂内容的掌握情况。第五课时(读写Excel文件、读取HTML表格数据、读写数据库)一、回顾上节课内容,讲解本节内容教师讲解上节课作业,并对学生的疑问进行统一答疑。回顾上节课的内容,继续讲解读写数据的其他操作。本节课主要的新内容有读写Excel文件、读取HTML表格数据、读写数据库、案例实现。明确学习目标要求学生掌握读写Excel文件要求学生掌握读取HTML表格数据要求学生掌握读写数据库二、进行重点知识的讲解(1)教师通过介绍excel文件的格式,引出使用Pandas读写Excel文件。P
30、andas中提供了对Excel文件进行读写操作的方法,分别为to_excel()和read_excel()。(2)教师根据课件,讲解读取HTML表格数据。通过以网上某个表格数据进行实时读取引出使用read_html()读取表格数据。 (3)教师根据课件,讲解读写数据库数据。对于存储在数据库中的数据,Pandas提供了read_sql()函数用来读取,同时也提供了用于写入数据库的to_sql()方法,教材中以mysql为例演示使用to_sql和read_sql 读取数据库数据。三、归纳总结,布置作业 (1)回顾学习目标,对本节课的内容进行总结。 教师带领学生总结本节课的内容,内容包括掌握读写Ex
31、cel、读取HTML表格数据、读写数据库。 (2)使用博学谷系统下发随堂练习,检测学生对课堂内容的掌握情况。第六课时(上机练习)上机练习主要针对本章中需要重点掌握的知识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:( 练习教材中的示例代码)形式:单独完成第七课时(上机练习)上机练习主要针对本章中需要重点掌握的知识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:(练习教材中的示例代码)形式:单独完成上机二:(完成案例北京高考分数线统计分析)形式:单独完成思考题和习题见教材
32、第3章配套的习题教学后记Python数据分析与应用:从数据获取到可视化教学设计课程名称: Python数据分析 授课年级: 2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第4章 数据预处理计划学时6 课时内容分析前期采集到的数据,或多或少都存在一些瑕疵和不足,比如数据缺失、极端值、数据格式不统一等问题。因此,在数据分析之前需要对数据进行预处理,包括数据的清洗、合并、重塑与转换。Pandas中专门提供了用于数据预处理的很多函数与方法,用于替换异常数据、合并数据、重塑数据等。教学目标及基本要求掌握数据清洗掌握数据合并掌握数据重塑掌握重命名轴索引
33、熟悉离散化连续数据了解哑变量处理类别型数据完成案例预处理部分地区信息教学重点掌握数据清洗掌握数据合并掌握数据重塑掌握重命名轴索引完成案例预处理部分地区信息教学难点掌握数据清洗掌握数据合并掌握数据重塑掌握重命名轴索引教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(空值和缺失的处理、重复值的处理、异常值的处理)一、创设情境,导入为什么要使用数据清洗教师通过生活中的举例,引出数据清洗的知识。例如问卷调查信息,在获取这些数据后并不能立即用于分析,而是需要将这些数据进行一些清洗操作。数据清洗常用的操作常的数据清洗操作包括空值和缺失值处理、重复值的处理、异常值的处理等。明确学习目标要
34、求学生掌握空值和缺失值的处理。要求学生掌握重复值的处理要求学生掌握异常值的处理二、进行重点知识的讲解教师根据课件,讲述空值和缺失值的处理。Pandas提供了一些用于检查或处理空值和缺失值的函数,其中,使用isnull()和notnull()函数可以判断数据集中是否存在空值和缺失值,对于缺失数据可以使用dropna()和fillna()方法对缺失值进行删除和填充。教师根据课件,讲述重复值的处理。Pandas提供了两个函数专门用来处理数据中的重复值,分别为duplicate()和drop_duplicates()。其中,前者用于标记是否有重复值,后者用于删除重复值,它们的判断标准是一样的,即只要两
35、条数据中所有条目的值完全相等,就判断为重复值。教师根据课件,讲述异常值的处理。异常值指样本中的个别值,其数值明显偏离它所属样本的其余观测值,这些数值是不合理的或错误的。要想确认一组数据中是否有异常值,常用的检测方法有3原则和箱形图,对于检测出的异常值可以使用replace方法进行替换。三、归纳总结,布置作业/随堂练习回顾上课前的学习目标,并对本节课的内容进行总结。 教师总结本节课需要掌握的知识点,包括空值和缺失值的处理、重复值的处理、异常值的处理。使用博学谷系统下发课后作业。第二课时(更改数据类型、轴向堆叠合并、主键合并数据)一、回顾上节课的内容,继续讲解本课时的知识教师对学生们的疑问进行统一
36、答疑。回顾总结上节课内容,继续介绍本课时的内容。上节课介绍了数据清洗的内容,接下来,本节课继续介绍数据清洗内容以及数据合并操作。明确学习目标要求学生掌握更改数据类型的方法要求学生掌握轴向堆叠合并要求学生掌握主键合并数据二、进行重点知识的讲解为什么要更改数据类型?在处理数据时,可能会遇到数据类型不一致的问题,例如通过爬虫采集到的数据都是整型的数据,在使用数据的时希望保留两位小数点,这时需要将这些数据的类型转换为浮点型。针对这种问题,既可以在创建Pandas对象明确指定数据类型,也可以使用astype和to_numberic进行转换。教师根据课件,讲解数据合并轴向堆叠数据的操作。在对数据进行整合时
37、,经常会用到数据合并。接下来,介绍常用的几种数据合并操作。concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并。教师根据课件,讲解数据合并主键合并数据的操作。主键合并类似于关系数据库库的连接方式,它是根据一个或多个键将不同的DataFrmae对象连接起来,大多数是将两个DataFrame对象中的列作为合并键,Pandas主键合并方式使用merge()函数实现。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结。教师带领学生总结本节课需要掌握的内容,包括更改数据类型、轴向堆叠数据、主键合并数据。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源
38、,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。 使用博学谷系统下发课后作业。第三课时(根据行索引合并数据、合并重叠数据、重塑层次化索引)一、回顾上节课内容,继续讲解数据合并内容以及数据重塑中的重塑层次化索引教师对学生们的疑问进行统一答疑。回顾总结上节课内容,继续介绍数据合并的知识以及数据重塑的知识。在上节课中,介绍了更改数据类型的方法以及数据合并的两种方法。明确学习目标要求学生掌握根据行索引合并数据、要求学生掌握合并重叠数据要求学生掌握重塑层次化索引二、进行重点知识的讲解教师通过示例代码,讲述join()方法的使用。join()方法能够通过索引或指定列来连接DataFr
39、ame。教师通过示例代码,讲述combine_first()方法的使用。在处理数据的过程中,当一个DataFrame对象中出现了缺失数据,而这些缺失数据我们希望使用其它DataFrame对象中的数据填充,这时可以通过combine_first()方法为缺失数据填充。教师通过示例代码,讲述stack()和unstack()方法的使用。Pandas中重塑层次化索引操作主要是stack()和unstack(),前者表示将数据的列“旋转”为行,后者表示将数据的行“旋转”为列。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结教师带领学生总结join()、combine_first()、stac
40、k()、unstack()的使用方法。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。使用博学谷系统下发课后作业。第四课时(轴向旋转、重命名轴索引、离散化连续数据、哑变量处理类别数据)一、回顾上节课内容,继续讲解本节课的内容教师讲解上节课有难度的作业,并对学生的疑问进行统一答疑。回顾上节课的内容,继续介绍数据重塑的操作以及数据转换的部分操作。在上节课中,介绍了数据合并和数据重塑的操作,接下来,继续介绍数据重塑的操作以及数据转换的操作。明确学习目标要求学生掌握轴向旋转操作要求学生掌握重名轴索引的操作要求学生熟悉离散化
41、连续数据要求学生了解哑变量处理类别数据二、进行重点知识的讲解教师通过教材中的示例,引出轴向旋转的操作。在Pandas中pivot()方法会根据给定的行索引或列索引重新组织一个DataFrame对象。教师通过设定需求,引出重命名轴索引的使用。Pandas中提供一个rename()方法来重名列索引或行索引。教师通过教材中的示例,引出离散化连续数据。有时候我们会碰到这样的需求,例如,将有关年龄的数据进行离散化(分桶)或拆分为“面元”,直白来说,就是将年龄分成几个区间。 Pandas 的cut()函数能够实现离散化操作。教师根据课件,讲解哑变量处理类别型数据。哑变量又称虚拟变量、名义变量,从名称上看就
42、知道,它是人为虚设的变量,用来反映某个变量的不同类别。使用哑变量处理类别转换,事实上就是将分类变量转换为哑变量矩阵或指标矩阵,矩阵的值通常用“0”或“1”表示。三、归纳总结,布置作业 (1)回顾学习目标,对本节课的内容进行总结。教师带领学生总结数据重塑和数据转换操作。 (2)使用博学谷系统下发随堂练习,检测学生对课堂内容的掌握情况。第五课时(上机练习)上机练习主要针对本章中需要重点掌握的知识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:(练习教材中的示例代码)形式:单独完成第六课时(上机练习)上机练习主要针对本章中需要重点掌握的知
43、识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:(练习教材中的示例代码)形式:单独完成上机二:(完成案例预处理部分地区信息)形式:单独完成思考题和习题见教材第4章配套的习题教学后记Python数据分析与应用:从数据获取到可视化教学设计课程名称: Python数据分析 授课年级: 2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第5章 数据聚合与分组运算计划学时4 课时内容分析Pandas提供了用于分组与聚合操作的一系列方法,具体包括分组方法groupby()、聚合方法agg()、
44、转换方法transform()、应用方法apply(),掌握了这些方法的使用,便可以有效地提高数据分析的效率。教学目标及基本要求了解分组聚合的原理掌握通过groupby()方法将数据拆分成组数据聚合分组级运算完成案例运动员信息的分组与聚合教学重点掌握通过groupby()方法将数据拆分成组数据聚合分组级运算教学难点掌握通过groupby()方法将数据拆分成组数据聚合分组级运算教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(分组与聚合的原理、通过groupby()方法将数据拆分成组)一、创设情境,引入分组聚合原理分组与聚合的原理通过示例说明分组聚合原理,例如,某公司用Exc
45、el工具统计了全体员工的体检套餐信息,当财务核对想体验机构支付的总费用时,由于每种套餐的价格不同,所以需要将全体员工按照套餐类型进行分组,把每种套餐的总人数计算出来,再计算总费用就比较简单,这个过程中用到的思想就是分组聚合。掌握使用数据聚合方法数据聚合,一般是指对分组中的数据执行某些操作,比如求平均值、求最大值等,并且操作后得到一个结果集,这些实现聚合的操作称为聚合方法,Pandas中提供了用作聚合操作的agg()方法。明确学习目标要求了解分组聚合的原理要求学生掌握通过groupby()方法将数据拆分成组二、进行重点知识的讲解教师根据课件,讲述分组与聚合的原理。分组与聚合是数据分析中比较常见的
46、操作。在Pandas中,分组是指使用特定的条件将源数据划分为多个组,聚合是在这里指的是,对每个分组中的数据执行某些操作(如聚合、转换等),最后将计算的结果进行整合。分组聚合的过程大概分为三步,按照图5-1图例讲解。教师根据课件,讲述通过groupby()方法将数据拆分成组。根据分组聚合的步骤,讲解数据拆分groupby()操作。三、归纳总结,布置作业/随堂练习回顾上课前的学习目标,并对本节课的内容进行总结。 教师总结本节课需要掌握的知识点,包括分组聚合的原理、通过groupby()方法将数据拆分数据、使用内置统计方法聚合数据。使用博学谷系统下发课后作业。第二课时(使用内置统计方法聚合数据、面向
47、列的聚合方法)一、回顾上节课的内容,继续讲解本课时的知识教师对学生们的疑问进行统一答疑。回顾总结上节课内容,继续介绍本课时的内容。上节课介绍了分组与聚合的原理、groupby拆分数据、使用内置统计方法聚合数据等。接下来,本节课继续介绍数据聚合的面向列的聚合方法,以及分组级运算的数据转换方法。明确学习目标要求学生掌握使用内置统计方法聚合数据要求学生掌握面向列的聚合方法二、进行重点知识的讲解教师通过示例代码,讲解使用内置统计方法聚合数据。在Pandas中的统计方法中,比如用于最大值和最小值的max()和min(),这些方法常用于简单地聚合分组中的数据。教师通过示例代码演示,面向列的聚合方法。当内置
48、方法无法满足聚合要求时,这时可以自定义一个函数,将它传入给agg()方法实现对Series或DataFrame对象进行聚合。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结。教师带领学生总结本节课需要掌握的内容,包括面向列的聚合方法和分组级运算的数据转换。布置随堂练习,检查学生掌握情况。根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。 使用博学谷系统下发课后作业。第三课时(数据转换、数据应用)一、回顾上节课内容,导入数据应用的操作教师对学生们的疑问进行统一答疑。回顾总结上节课内容,介绍分组级运算的数据应用操作。明确学习目标要求学生掌握数据
49、转换的操作要求学会掌握数据应用的操作二、进行重点知识的讲解教师根据课件,讲解数据转换操作。在使用agg()方法进行聚合运算时,返回的数据集的形状(shape)与被分组数据集的形状是不同的,如果希望保持与原数据集形状相同,那么可以通过transfrom()方法实现。教师根据课件,讲解数据应用操作。当某些作用与分组的操作,既不适合使用agg()方法进行聚合时,也不适合使用transform()方法进行转换时,便可以让apply()方法派上用场了。apply()方法的使用是十分灵活的,它可以在许多标准用例中替代聚合和转换,另外还可以处理一些比较特殊的用例。三、归纳总结,布置作业回顾学习目标,对本节课
50、的内容进行总结教师带领学生总结字典的使用。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。使用博学谷系统下发课后作业。第四课时(上机练习)上机练习主要针对本章中需要重点掌握的知识点,以及在程序中容易出错的内容进行练习,通过上机练习可以考察同学对知识点的掌握情况,对代码的熟练程度。上机一:(练习教材示例代码)形式:单独完成上机一:(完成案例运动员信息的分组与聚合)形式:单独完成思考题和习题见教材第5章配套的习题教学后记Python数据分析与应用:从数据获取到可视化教学设计课程名称: Python数据分析 授课年级:
51、2018年级 授课学期: 2018学年第一学期 教师姓名: 某某老师 2018年09月09日课题名称第6章 数据可视化计划学时6 课时内容分析通常,大部分数据是以文本或数值的形式显示的,它们不仅无法很好地展示数据之间的关系和规律,而且给人十分鼓噪的感觉。因此,我们可以借用一些图形工具,采用更直观的方式传达与沟通信息,正如那句“字不如表,表不如图”所言。由此可见,数据可视化对于数据分析而言是很有必要的。Python中提供了一些数据可视化的工具,比如Matplotlib、Seaborn、Bokeh等。教学目标及基本要求了解什么是数据可视化熟悉常见图表类型的特点熟悉Seaborn库的基本使用了解Bo
52、keh库的基本使用教学重点熟悉常见图表类型的特点掌握Matplotlib库的基本使用熟悉Seaborn库的基本使用教学难点掌握Matplotlib库的基本使用教学方式教学采用教师课堂讲授为主,使用教学PPT讲解教学过程第一课时(什么是数据可视化,常见的图表类型,数据可视化的工具)一、创设情境,导入数据可视化概念教师根据课件提出的程序需求,引出数据可视化的概念。数据可视化是指将数据以图表的形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。明确学习目标要求了解数据可视化的概念要求学生熟悉常见的图表类型要求学生了解数据可视化的工具二、进行重点知识的讲解教师根据课件,讲述数据可视化的概念。
53、数据可视化是指将护具以图表的形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。教师根据课件,讲述常见图表类型。常见的图表有直方图、折线图、条形图、饼图、散点图、箱线图教师根据课件,讲述数据可视化的工具。常用的数据可视化库有Matplotlib库、Seaborn库、Bokeh库三、归纳总结,布置作业/随堂练习回顾上课前的学习目标,并对本节课的内容进行总结。 教师总结本节课需要掌握的知识点,包括数据可视化的概念、常见的图表类型、数据可视化工具。使用博学谷系统下发课后作业。第二课时(Matplotlib绘制图表中的通过figure()函数创建画布、通过subplot()函数创建单个子图、
54、通过subplots()函数创建多个子图、通过add_subplot()方法添加和选中子图)一、回顾上节课的内容,继续讲解本课时的知识教师对学生们的疑问进行统一答疑。回顾总结上节课内容,继续介绍本课时的内容。上节课介绍了什么是数据可视化、常见的图表类型、数据可视化的工具。本节内容讲解Matplotlib绘制图表通过figure()函数创建画布通过subplot()函数创建单个子图通过subplots()函数创建多个子图通过add_subplot()方法添加和选中子图明确学习目标要求学生了解pyplot模块中的Figure对象要求学生掌握通过subplot()函数创建单个子图要求学生掌握subp
55、lots()函数创建多个子图要求学生掌握add_subplot()方法添加和选中子图二、进行重点知识的讲解教师通过示例代码,讲解figure()函数的使用。在pyplot模块中,默认拥有一个Figure对象,该对象可以理解为一张空白的画布,用于容纳图表的各种组件,比如图例、坐标轴。如果不希望在默认的画布上绘制图形,则可以调用figure()函数构建一张新的空白画布。教师通过示例代码,讲解通过subplot()函数创建单个子图。很多时候,我们希望在同一个画布上绘制多个图形,而不是在多个画布中绘制多个图形。Figure对象允许划分为多个绘图区域,每个绘图区域都是一个Axes对象,它拥有属于自己的坐
56、标系统,被称为子图。subplot()函数会将整个绘图区域等分为“nrows(行)*ncols(列)”的矩阵区域,之后按照从左到右、从上到下的顺序对每个区域进行编号。其中,位于左上角的子区域编号为1,依次递增。教师通过示例代码,讲解subplots()函数创建多个子图。如果希望一次创建一组子图,则可以通过subplots()函数进行实现。subplots()函数会返回一个元祖,元祖的第一个元素为Figure对象(画布),第二个元素为Axes对象(子图,包含坐标轴和画的图)或Axes对象数组。教师通过示例代码,讲解add_plot()方法添加和选中子图。要想创建子图,除了使用pyplot模块的函
57、数之外,还可以通过Figure类的add_plot()方法添加和选中子图。三、归纳总结,布置作业回顾学习目标,对本节课的内容进行总结。教师带领学生总结Matplotlib绘制图表的常用操作。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。 使用博学谷系统下发课后作业。第三课时(添加各类标签、绘制常见图表、本地保存图形)一、回顾上节课内容,继续介绍本课时的内容教师对学生们的疑问进行统一答疑。回顾总结上节课内容,继续讲解Matplotlib的其他操作。回顾上节内容的通过figure()函数创建画布、通过subplot(
58、)函数创建单个子图、通过subplots()函数创建多个子图、通过add_subplot()方法添加和选中子图。讲解本节内容:添加各类标签、绘制常见图表、本地保存图形。明确学习目标要求学生掌握添加各类标签要求学生掌握绘制常见图表要求学生掌握本地保存图形二、进行重点知识的讲解教师根据课件,讲解各类标签,并演示常用标签。例如title()、xlabel()、ylabel()等。教师根据课件,讲解绘制的图表,并演示常用的图表。matplotlib.pyplot模块中包含了快速生成多种图表的函数。教师根据课件,讲解本地保存图形的操作。使用savefig()函数演示将生成的图表保存到本地。三、归纳总结,
59、布置作业回顾学习目标,对本节课的内容进行总结。 教师总结本节课需要掌握的添加各类标签、绘制常见图表、本地保存图形。布置随堂练习,检查学生掌握情况。 根据博学谷和随堂练习资源,给学生布置随堂练习,检测学生的掌握程度,并对学生出现的问题进行解决。使用博学谷系统下发课后作业。第四课时(Seaborn绘制统计图形、Bokeh交互式可视化库)一、回顾上节课内容,继续介绍本课时的内容教师对学生们的疑问进行统一答疑。回顾总结上节课内容,由上节课的内容引出本课时的知识。在上节课中,我们介绍了Matplotlib库的操作,接下来,介绍另外的可视化库Seaborn与Bokeh库。明确学习目标要求学生了解可视化数据
60、的分布要求学生熟悉分类数据绘图要求学生了解Bokeh库要求学生熟悉通过Plotting绘制图形二、进行重点知识的讲解(1)教师根据课件,讲解什么是Seaborn库。Seaborn基于Matplotlib核心库进行了更高级的API封装,可以轻松地画出更漂亮的图形,而Seaborn的漂亮主要体现在配色更加舒服,以及图形元素的样式更加细腻。(2)教师根据课件,讲解可视化数据的分布。当处理一组数据时,通常先要做的就是了解变量是如何分布的。对于单变量的数据来说,采用直方图或核密度曲线是个不错的选择,对于双变量来说,可采用多面板图形展现,比如散点图、二维直方图、核密度估计图形等。针对这种情况,Seabor
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度山西省高校教师资格证之高等教育法规真题练习试卷B卷附答案
- 2024年大、中容量数字程控交换机项目资金需求报告代可行性研究报告
- 2024年机械治疗及病房护理设备项目资金申请报告代可行性研究报告
- 幼儿园校舍安全排查自查报告范文
- 2024年产品保修服务协议文本
- 2024年专用液化气运输服务协议范本
- 2024年建筑效果设计方案协议模板
- 2024年二手车销售协议:全面细化
- 仓库租赁与承包协议范本2024年适用
- 出口业务协议样式2024年专业
- 教科版科学二年级上册全册教案(完整版)
- 院长行政查房科主任汇报
- 人教鄂教版小学科学六年级下册全册分层练习
- 情感纠纷案件调解协议书
- 孔明灯的知识与制作课件
- 安徽省江南十校2023-2024学年高一上学期12月分科模拟联考数学试题(解析版)
- 建筑工地施工组织与管理课件
- 风电场项目施工进度计划及保证措施
- 《心理调适方法》课件
- 2024-2023-2024年中考语文三年真题分类汇编(全国版)21记叙文 试卷(含答案解析)
- 材料科学与自然辩证法
评论
0/150
提交评论