Python数据分析与可视化项目实战 课件 项目3、4 Matplotlib之大学招生数据展示、Pyecharts之数据可视化高阶_第1页
Python数据分析与可视化项目实战 课件 项目3、4 Matplotlib之大学招生数据展示、Pyecharts之数据可视化高阶_第2页
Python数据分析与可视化项目实战 课件 项目3、4 Matplotlib之大学招生数据展示、Pyecharts之数据可视化高阶_第3页
Python数据分析与可视化项目实战 课件 项目3、4 Matplotlib之大学招生数据展示、Pyecharts之数据可视化高阶_第4页
Python数据分析与可视化项目实战 课件 项目3、4 Matplotlib之大学招生数据展示、Pyecharts之数据可视化高阶_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目背景项目准备项目分析项目实现项目拓展2023年2月,教育部等五部门印发了《普通高等教育学科专业设置调整优化改革方案》(以下简称《改革方案》)。文件提出,到2025年,优化调整高校20%左右学科专业布点,新设一批适应新技术、新产业、新业态、新模式的学科专业,淘汰不适应经济社会发展的学科专业;各高校为主动服务国家战略、区域经济社会发展需要,不断优化专业结构,设置符合办学定位和办学特色的专业。大学生高职教育是指在高等教育层次中,专门为普通高中毕业生提供的职业技能教育,旨在培养具有高素质职业技能和较好的综合素质的高素质技能型人才。大学生高职专业设置要满足产业发展需要和地方经济社会发展需求,紧密结合当地经济发展实际增设专业,对就业率过低、不适应社会需求的专业,高校应谨慎增设、及时调减。

分析高校的专业录取情况,是专业设置调整优化的依据之一,本项目通过对某行业院校每年专业的入学人数、录取分数分析、生源地、性别结构等分析,学习用Matplotlib绘制折线图、饼图、柱状图、组合图的相关知识项目背景项目准备项目分析项目实现项目拓展1.matplotlib

简介Python绘图库众多,各有其特点,其中Matplotlib是一个Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过Matplotlib库,开发者仅需要几行代码,便可以生成折线图(plot())、柱形图(bar())、饼图(pie())等。Matplotlib中的基本图表包括元素:X轴和Y轴、水平和垂直的轴线、X轴和Y轴刻度、刻度标示坐标轴的分隔,包括最小刻度和最大刻度、X轴和Y轴刻度标签、表示特定坐标轴的值、绘图区域、实际绘图的区域。2.对统计结果可视化下面以统计各学院2016~2018年入学的学生人数为例,绘制折线图。利用query查询数据,并利用groupby分组统计各学院2016、2017、2018年的入学学生人数,Matplotlib支持利用查询结果直接生成折线图,利用plot()即可绘制。3.解决分组统计中汉字显示问题

如果你是第一次使用matplotlib输出图形,可能会遇到分组统计中的汉字列无法正常显示的情况,解决方法为安装simhei.ttf字体,具体操作过程请扫描二维码项目背景项目准备项目分析项目实现项目拓展项目背景4、折线图系统默认生成的折线图中的线条不知道对应哪一年的数据,而且也不够美观,如果想要进一步美化,就要理解折线图的画法。折线图是一种以变化的曲线来反映数据变化的简单图形,也是一种典型的直角坐标图。理论上,折线图是需要一系列形如(x,y)的坐标点,以此表达此类数据序列,我们一般通过列表即可完成。一个列表存放x轴数据,一个列表存放y轴数据,然后根据x轴和y轴在列表中的数据即可确定数据点,然后再用直线连接这些数据点即可组成一条变化的曲线。

项目准备项目分析项目实现项目拓展项目背景5、美化折线图5.1绘制折线图折线图是一种以变化的曲线来反映数据变化的简单图形。也是一种典型的直角坐标图,所以折线图理论上是需要一系列形如(x,y)的坐标点,表达此类数据序列,我们一般通过列表即可完成。一个列表存放x轴数据,一个列表存放y轴数据,然后根据x轴和y轴在列表中的数据即可确定数据点,然后再用直线连接这些数据点即可组成一条变化的曲线画一个简单的折线图非常简单,只要三步即可。步骤1:导入matplotlib中的画图工具包pyplot步骤2:利用plot画出图线步骤3:利用show把图显示出来项目准备项目分析项目实现项目拓展项目背景5.2认识折线图中的参数python是面向对象的,同样利用matplotib画图从面向对象的角度更容易理解。●创建Figure对象可看成是一个画布。有了画布之后,才能在上面画各种图。●添加Axes对象即想画的图。那么这个图肯定要包含许多信息,比如曲线、坐标轴、标题、图例、注释等。这些就是Axes对象包含的属性,它们也是各种对象。●在Axes对象中添加显示的内容或元素●对Figure、Axes中的元素进行修饰项目准备项目分析项目实现项目拓展项目背景6、学习其他常见图形的绘制6.1柱形图柱形图,又称长条图、柱状统计图、条图、条状图、棒形图,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图的参数有:Bar:x轴显示的数据,y轴显示的数据,柱子的颜色,柱子宽度,柱子的透明度width:设置bar中宽度color:设置柱子的颜色alpha:设置透明度,值在0-1之间。项目准备项目分析项目实现项目拓展项目背景6.2饼图饼状图是数据可视化中常见的一种类型,能够直观地表示各类别在总体中所占的比例。用pie()方法进行绘制饼图,Pie(各个饼块的尺寸,每个饼块的标签,各饼的颜色,饼块内标签)。其中,用labels表示每个饼块的标签,字符串列表。默认值为None。colors表示每个饼块的颜色,类数组结构,颜色会循环使用。默认值为None,使用当前色彩循环。autopct表示饼块内标签。None或字符串或可调用对象。默认值为None。如果值为格式字符串,标签将被格式化,如果值为函数,将被直接调用。另外还可以用pctdistance表示饼块内标签与圆心的距离。浮点数。默认值为0.6,autopct不为None该参数生效。shadow表示饼图下是否有阴影。布尔值。默认值为False。labeldistance表示饼块外标签与圆心的距离。浮点值或None。默认值为1.1。如果设置为None,标签不会显示,但是图例可以使用标签。项目分析项目实现项目拓展项目背景项目准备1、绘制折线图画一个简单的折线图非常简单,只要三步即可。步骤1:导入matplotlib中的画图工具包pyplot步骤2:利用plot画出图线步骤3:利用show把图显示出来项目分析项目实现项目拓展项目背景项目准备2、修饰折线图——设置背景色、标签等在2.3中对Sale表每个人的实发工资绘制了折线图,下面对该折线图设置背景色、标签等效果。其中:lfig.set_facecolor('skyblue')

表示将画布背景色设置为天蓝色。lfig.add_axes([0.1,0.2,0.7,0.8])

表示设置坐标轴。lplt.xlabel("人员",{"color":"green","fontsize":15})

表示将横坐标轴的标签文字显示为“人员”,文字设置为绿色,字体大小为15号。lplt.ylabel("薪水(元)",{"color":"green","fontsize":15})

表示将纵坐标轴的标签显示为“薪水(元)”,文字设置设置为绿色,字体大小为15号。lplt.title("员工薪水",{"color":"yellow","fontsize":20})

表示设置图表的标题为“员工薪水”,文字设置设置为黄色,字体大小为15号。项目分析项目实现项目拓展项目背景项目准备3、增加图例、文字和注释等说明可以使用legend(labels,title)来给图形加上图例,参数labels可以设置图列线条名称。参数title可以设置图例标题,使用plt.text(x,y,s)把文本添加到指定坐标轴上。text为注释文本内容,xy为指向坐标点,xytext为文本坐标位置,arrowprops可以设置箭头样式。项目分析项目实现项目拓展项目背景项目准备4、柱形图在数据分析中,经常会做统计分析,例如要展示每个学院人数的柱形图,需要利用count()统计人数,特别注意的是学院的人数是统计生成的新字段,无法直接将值传递给参数,因此在调用值时,需要创建一个新的DataFrame来存储结果,然后将统计的索引值分别传给两个字段。5、折线图与柱形图如果要对每个专业的入学成绩的最高、最低和平均分做统计,并进行直观呈现,可以用柱形图展示每个专业录取的平均分数,折现图展示入学成绩的最高、最低分。项目分析项目实现项目拓展项目背景项目准备1、调用表中数据绘制折线图项目分析项目实现项目拓展项目背景项目准备2、修饰折线图——设置背景色、标签等项目分析项目实现项目拓展项目背景项目准备3、增加图例、文字和注释等说明项目分析项目实现项目拓展项目背景项目准备3、柱形图项目分析项目实现项目拓展项目背景项目准备4、折线图与柱形图项目分析项目实现项目拓展项目背景项目准备5、饼图项目分析项目拓展项目背景项目准备项目实现4、生成组合图生成组合图通常可以用axes手绘子图,用subplot创建网格子图、用GridSpec绘制多子图,由于GridSpec用法较为复杂,这里重点讲解xes手绘子图和subplot创建网格子图。4.1plt.axes:手绘子图创建轴的最基本方法是使用plt.axes功能。在默认情况下,这会创建一个填充整个图形的标准轴对象。plt.axes有一个可选参数,它是图坐标系中四个数字的列表。这些数字表示[left,bottom,width,height]在图形坐标系中,其范围从图的左下角的0到图的右上角的1。项目分析项目拓展项目背景项目准备项目实现4.1plt.axes:手绘子图创建轴的最基本方法是使用plt.axes功能。在默认情况下,这会创建一个填充整个图形的标准轴对象。plt.axes有一个可选参数,它是图坐标系中四个数字的列表。这些数字表示[left,bottom,width,height]在图形坐标系中,其范围从图的左下角的0到图的右上角的1。项目分析项目拓展项目背景项目准备项目实现4.2Subplot()创建网格子图绘制多个子图的组合,也可以利用python的matplotlib包下的subplot函数,该函数可以将多个子图放在同一个画板上,并且每个图的大小默认一样。其格式为:项目分析项目拓展项目背景项目准备项目实现plt.subplot(2,2,1)表示将画板划分为2行2列,然后取第1个区域。那么第几个区域是怎么界定的呢?这个规则遵循行优先数数规则。比如说4个区域:1234项目分析项目拓展项目背景项目准备项目实现总结本项目重点学习了使用Matplotlib绘制折线图、柱形图、饼图,以及同一横坐标的柱形图与折线图的组合,为了使可视化效果更加丰富,通过一个画布中绘制多个子图的方法的讲解,让学生们更加。项目背景项目准备项目分析项目实现项目拓展项目背景项目分析项目实现项目拓展项目背景项目准备项目分析项目实现项目拓展项目背景项目准备项目分析项目拓展项目背景项目准备项目实现项目背景项目准备项目分析项目实现项目拓展在信息时代飞速发展的今天,每天都在产生海量数据,如何从这些海量数据中快速发现和获取有用信息并直观的展示出来,最常用的方法就是数据的可视化。数据可视化的方案有很多,可根据实际使用场景来选择。在市场中,它帮助企业分析市场趋势、消费者行为和产品销售情况;在医疗领域,它用于监测和分析流行病学数据、病人记录和医疗资源分布;在城市规划和交通领域,它帮助城市决策者分析人口密度、交通流量和资源利用情况,从而指导城市的发展和改善交通运输系统;在环境保护与可持续发展中,数据可视化有助于监测和评估环境参数,如气候变化、空气质量和能源消耗。不难发现,数据可视化在各个领域都扮演着不可或缺的角色。Python中的PyEcharts不仅可以绘制基本的图表,还可以绘制一些更加清晰、美观、有效地传达与沟通信息的树形图、3D图表、热力图、地图类的图表。对于日常的python可视化过去用的都是Matplotlib可视化图表,虽然可视化增加了效率,但仍然有不足之处,那就是无法交互的静态式图表。而今天介绍的Pyecharts是经过网页渲染的可视化、可交互的web页面图表,拥有更好的时间选择或者维度选择进行交互,从而得到动态图表。项目背景项目准备项目分析项目实现项目拓展项目背景1安装PyEcharts并体验Echarts是百度开源的一个数据可视化JS库,主要用于数据可视化。PyEcharts是一个用于生成Echarts图表的类库,使用PyEcharts可以生成独立的网页,也可以在flask、Django中集成使用。PyEcharts实际上就是Echarts与Python的对接。使用PyEcharts之前需要先安装PyEcharts库。可以使用命令:pipinstallpyecharts,安装完毕后,使用importpyecharts就可以绘制图像了。项目背景项目准备项目分析项目实现项目拓展项目背景2.1.认识python造数神器-Faker库在测试绘图效果的过程中,大家通常会遇到一个问题,那就是如何快速批量的生成数据?为此Python提供了第三方库Faker解决了这个问题。Faker是一个生成伪造数据的Python库,通常用于测试或填充数据库中的伪数据。2.2认识Faker自带的数据集合Faker()除了可以根据属性来随机生成一些数,还自带了数据集项目分析项目实现项目拓展项目背景项目准备3.绘制仪表盘图仪表盘形似汽车车速表、油表,属于拟物化图形,总体为一个圆形开口的表盘及分段刻度,可以比较直观的向用户展示数据分析的结果。在仪表盘中都有颜色区分,不同的颜色表示不同的数据区间,也叫做临界值。仪表盘图的常用于项目实际完成率、销售额比例、用户转化率等。绘制仪表盘图,可以通过以下步骤:步骤1:创建仪表盘对象Gauge();步骤2:设置数据系列名称及数据集;步骤3:设置图表标题title;步骤4:通过render()方法将仪表盘渲染为html或者直使用render_notebook()输出。项目分析项目实现项目拓展项目背景项目准备3.2玫瑰图

玫瑰图全称南丁格尔玫瑰图,是英国护士和统计学家弗罗伦斯·南丁格尔发明的,又名为极区图。玫瑰图是一种圆形的直方图,既有饼图的特征,也有直方图的特征。

在Python中,可以使用pyecharts库中Pie绘制玫瑰图,.add()里增加需要展示的数据集、radius参数中可以设置内半径和外半径,center参数中可以设置圆心横坐标、纵坐标。rosetype参数用于设置是否展示成南丁格尔玫瑰图,默认None(不展示成玫瑰图)。其中,rosetype有“radius”和“area”两种模式radius模式:用扇形圆心角展现数据的百分比,通过半径展现数据大小。根据数据的变化调整radius参数中的内半径和外半径值,改变图形的展示范围,使图像更协调美观。area模式:所有扇形圆心角相同,仅通过半径展现数据大小。项目分析项目实现项目拓展项目背景项目准备3.3词云图云图是通过“关键词云层”或“关键词渲染”的方式,对文本数据中出现频率较高或权重较大的“关键词”进行可视化的展示,便于读者直观领略文本数据的主旨和核心内容词云是一种文本数据可视化的工具,它可以突出显示文本里的重点单词。词云图的常用场景有用户画像词云图、文档关键字词云图、舆论热词词云图等。在Python中,可以使用pyecharts库中的WordCloud绘制词云,首先了解WordCloud中的参数及其功能项目分析项目实现项目拓展项目背景项目准备3.4雷达图雷达图(RadarChart)又称戴布拉图、蜘蛛网图。图形以一点为中心,每一变量维度为一极坐标轴,n个维度即形成n轴的由内向外放射状图形,形似蜘蛛网。图形的基本构成如图4-10所示:项目分析项目实现项目拓展项目背景项目准备雷达图常常用于某个对象的多维度数据,维度一般是四到八个。比如在上图中对比某产品在功能、风格、品质、品牌、价格等维度的分布对比。雷达图通常应用在财务状况综合评价、用户画像、员工评分等场景。在Python中,可以使用pyecharts库中的Radar()绘制雷达图,add_schema负责雷达图的设置,其中,Pyecharts雷达图的参数配置如见表4-4所示。项目分析项目实现项目拓展项目背景项目准备3.5漏斗图斗图是一种可以展示数据流入和流失的图表,通常由多个矩形组成,每个矩形代表一个阶段,矩形的宽度代表数据的数量。漏斗图的最上面一层是最初的数据来源,最下面一层是最终的结果。漏斗图主要用于展示数据的流失情况,可以帮助我们找出数据流失的瓶颈和原因。项目分析项目实现项目拓展项目背景项目准备3.6热力图热力图,又名相关系数图。根据热力图中不同方块颜色对应的相关系数的大小,可以判断出变量之间相关性的大小。两个变量之间相关系数的计算公式为:

公式中,ρ表示相关系数,Cov表示协方差,E表示数学期望/均值

公式中,ρ表示相关系数,Cov表示协方差,E表示数学期望/均值。值得注意的是,该相关系数只能度量出变量之间的线性相关关系;也就是说,相关系数越高,则变量间的线性相关程度越高。项目分析项目实现项目拓展项目背景项目准备3.7日历图日历图适合用来展示与时间有关的数据,能清晰地看出每个月份、每个星期的数据变化。经常用于绘制月度热图日历、季度热图日历、年度热图日历。项目分析项目实现项目拓展项目背景项目准备3.8轮播图轮播图是一款经典、酷炫的可视化图形,可以按时间线轮播数据图可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论