


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在Pyth on中,将数据可视化有多种选择,正是因为这种多样性,何时选用何种方案才变得极具挑战性。本文包含了一些较为流行的工具以与如何使用它们来创建简单的条形图,我将使用下面几种工具来完成绘图示例:?Pandas?Seabor n?ggplot?Bokeh?pygal什么是 Matplotlib ?Matplotlib 是众多Python可视化包的鼻祖。其功能非常强大,同时也非常复 杂。你可以使用Matplotlib去做任何你想做的事情,但是想要搞明白却并非易事。我不打算展示原生的Matplotlib 例子,因为很多工具特别是 Pan das和Seaborn是基于Matplotlib的轻量级圭
2、寸装。Pandas首先,导入模块并将数据读入budget DataFrame,将数据排序并取前10条。import pandas as pdbudget = pd.read_csv("mn-budget-detail-2014.csv")budget = budget.sort('amount',ascending=False):10我们将在所有示例中使用一样的 budget数据,下面是其中5条:categofy11 tunamourit46ADM 1 NISI RAT IONCapitol Renovaiiori and 曳estor日bon Conwue
3、d12B3DODOO1UNIVERSIT¥O£ MINNESOTAumreapoits.Laboraioiy Renovaiwn567000007®-IUMAI4 SERVICESMinne:a Security hospiial - St. Peter&63170000UNIVERSITY OF MINNESOTAHbghef Education Asset Preservatron and RepOc42500000壽WINIMESOTA STATE COLLEGES AMD UNIVERS17IESHotter Education Asset Pre
4、seation and Repiac42500000现在,调整展示风格为更美观的默认设置,并创建图表:pd.options.display.mpl_style = 'default'budget_plot = budget.plot(kind="bar",x=budget"detai门,title="MN Capital Budget - 2014", legend=False)上述代码使用detail列的数据完成了创建图表的主要工作,同时展示了title并移除了 lege nd。下面是将图表存为png格式的代码:fig = b
5、udget_plot.get_figure()fig.savefig("2014-mn-capital-budget.png")根底图表看起来不错,理想情况下,我想对y轴再做一些格式化,但是这样做需要使用matplotlib 的一些功能。虽然现在的图表已是完美可用的可视化图表了, 但是仅仅通过pan das是不可能完成更多定制的。Seabor nSeaborn是一个基于matplotlib的可视化库。它旨在使默认的数据可视化更加悦目。它还旨在简化复杂图表的创建,可以与 pan das很好地集成。标准导包与读取数据:sns.set_style("darkgrid&q
6、uot;)bar_plot = sns.barplot(x=budget"detail",y=budget"amount",palette="muted",x_order=budget"detail".tolist()plt.xticks(rotation=90)plt.show()正如你所看到的,我必修使用matplotlib 旋转x轴的标题以便可以正常地阅读。从外观上看,图表看起来不错。理想情况下,我想格式化y轴上的刻度,但我不知道在不使用matplotlib 中的plt.yticks的情况下,如何实现格式化。
7、ggpiotggplot与Seaborn类似,也是基于 matplotlib 并旨在以简单的方式提高 matplotlib可视化的视觉感染力。它不同于seaborn是因为它是ggplot2 为R语言准备的一个端口。基于这个目标,一些API的接口虽然不是很pythonic但是功能很强大。继续导包并读取数据:import pandas as pdfrom ggplot import *budget = pd.read_csv("mn-budget-detail-2014.csv")budget = budget.sort('amount',ascending=F
8、alse):10现在让我们通过连接几条ggplot命令来构造图表:p = ggplot(budget, aes(x="detail",y="amount") +geom_bar(stat="bar", labels=budget"detail".tolist() +ggtitle("MN Capital Budget - 2014") +xlab("Spending Detail") +ylab("Amount") + scale_y_continuous
9、(labels='millions') +theme(axis_text_x=element_text(angle=90)print p这似乎看起来有些奇怪-尤其是使用print p来显示图表。但是,我发现这样相对简单明了。要弄清楚如何将文本旋转90度以与如何将x轴上的标签排序,确实要做些深入 的挖掘。我发现最酷的功能是scale_y_continous,它可以使标签更美观。如果你想将图表保存为图片,使用ggsave可以很轻松地办到:ggsave(p, "mn-budget-capital-ggplot.p ng")如下图是最终的图片,我知道灰色可能有点多,
10、但是毫不费时就可以给它添些色 彩。BokehBokeh不同于之前的3个库,它不依赖于 matplotlib并且实现的是面向现代浏览器的可视化。它的目标是实现交互式的web可视化,所以我的例子非常简单。导包并读入数据:import pandas as pdfrom bokeh.charts import Barbudget = pd.read_csv("mn-budget-detail-2014.csv")budget = budget.sort('amount',ascending=False):10bokeh不同的一方面是我需要明确列出我绘图需要的值。de
11、tails = budget"detail".values.tolist()amount = list(budget"amount".astype(float).values)现在我们可以绘图了。下面的代码将会实现在浏览器中展示包含图表的HTML页面,如果想用作其他展示,可以保存其png格式的副本。bar = Bar(amount, details, filename="bar.html")bar.title("MN Capital Budget - 2014").xlabel("Detail"
12、).ylabel("Amount")bar.show()下面是png格式的图片:正如你所看到的,图表是非常干净的。我没有找到一种更简单的方式来格式化y轴。Bokeh有很多功能,但在本例中我并未深入探索。PygaiPygal用于创建svg格式的图表,如果安装了正确的依赖,也可以保存为png格式。svg文件在创建交互式图表时非常有用,同时我也发现,使用此工具可以非常 容易地创建独特而又极具视觉感染力的图表。导包与读取数据:import pandas as pdimport pygalfrom pygal.style import LightStylebudget = pd.re
13、ad_csv("mn-budget-detail-2014.csv")budget = budget.sort('amount',ascending=False):10我们需要创建图表类型并做一些根底设置:bar_chart = pygal.Bar(style=LightStyle, width=800, height=600,legend_at_bottom=True, human_readable=True,title='MN Capital Budget - 2014')有趣的一点是human_readable,它可以很好地格式化数据,
14、所以大多数情况下, 这个功能“很管用。现在我们需要向图表中添加数据,这是与pan das集成地不是很紧凑的地方,但是就本次的小数据集来说,可以直接添加数据。数据量很大时,性能可能会是一个问 题。for index, row in budget.iterrows():bar_chart.add(row"detail", row"amount")接下来,将文件渲染为svg和png格式:bar_chart.render_to_file('budget.svg')bar_chart.render_to_png('budget.png')我觉得svg的展示效果确实很好,我很喜欢看起来独特且赏心悦目的风格。同时 我也发现,我们可以相对容易地弄清楚使用此工具时,哪些可以实现,哪些不能实 现。我鼓励大家下载svg文件,并在浏览器中感受图表的互动效果。Pandas对于简单的图表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宁夏医疗卫生编制-中药类历年考试真题库-含答案解析
- 互联网+创新宝宝护理
- 安徽省合肥市三十五中2025年高三第二次模拟考试化学试卷含解析
- 慢性肾衰竭护理
- 地理-黑龙江省齐齐哈尔市2025届高三下学期第二次模拟考试(齐齐哈尔二模)试题和答案
- 酒店客房服务与管理
- 心理语言学课件
- 第3章 标志中的图形设计
- 教学常规管理包括哪些内容
- 导医服务礼仪培训
- 2024-2025学年二年级语文下册统编版第三单元基础达标卷(单元测试)(含答案)
- DB37T 4834-2025高速公路集中养护工作指南
- 2024年全国单招护理专业综合题库
- 2025年土木工程业务能力试题及答案
- (一模)2025年广州市普通高中毕业班综合测试(一)历史试卷
- 江门2025年广东省江门市新会区教育系统招聘事业编制教师188人笔试历年参考题库附带答案详解-1
- 2024年10月成都市金牛区人民政府西华街道办事处公开招考1名编外人员笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2024年四川公务员《行政职业能力测验》试题真题及答案
- 2025年开封大学单招职业倾向性测试题库含答案
- 2025年福建鑫叶投资管理集团有限公司招聘笔试参考题库含答案解析
- 《围术期麻醉管理策略》课件
评论
0/150
提交评论