7.3 数据的可视化_第1页
7.3 数据的可视化_第2页
7.3 数据的可视化_第3页
7.3 数据的可视化_第4页
7.3 数据的可视化_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7.3数据的可视化学习内容7.3.1折线图7.3.2条形图7.3.3饼图7.3数据的可视化pandas结合matplotlib库,可以将数据以图表的形式可视化,反映出数据的各项特征。pandas数据的可视化的实现底层依赖于matplotlib,使用该框架前,必须先安装并导入它。可以使用conda直接安装matplotlib,语法如下:1condainstallmatplotlib或者使用pip安装,语法如下:1pipinstallmatplotlib7.3数据的可视化pandas提供了生成各类图表的plot()方法,通过参数来配置标题,网格,样式等,更加方便和简洁。表7.3.1plot()方法的常用参数序号参数说明1xx轴的数据,指数据框的行标签或者位置参数2yy轴的数据,指数据框的列标签或者位置参数3kind绘图类型,字符串类型,取值如下:'line':折线图,默认'bar':条形图。stacked为True时为堆叠的柱状图'barh':横向条形图'hist':直方图(数值频率分布)'box':箱型图'kde':密度图,主要对柱状图添加Kernel概率密度线'density':密度图'area':与x轴所围区域图(面积图)。Stacked=True时,每列必须全部为正或负值,stacked=False时,对数据没有要求'pie':饼图。数值必须为正值,需指定Y轴或者subplots=True'scatter':散点图。需指定X轴Y轴'hexbin':蜂巢图。需指定X轴Y轴'hexbin':蜂巢图。需指定X轴Y轴7.3数据的可视化表7.3.1plot()方法的常用参数(续)序号参数说明4title图的标题,其值为字符串或列表5grid图是否有网格,默认为False,没有网格。若设置为True,表示有网格6subplots设置图中是否有子图,默认为False,没有子图。若设置为True,表示画子图。7layout子图的行列布局,设置为(row,column),row表示行数,column表示列数8figsize子图的大小,设置为(width,height),width表示为宽度,height表示为高度。9legend子图的图例,布尔值,默认为True,表示显示图例。如果设置为False,表示不显示图例。10style指定图的线条等样式,取值如下:style=':',虚线style='-.'虚实相间style='--'长虚线style='-'实线(默认)style='.'点style='*-'实线,数值为星星style='^-'实线,数值为三角形11autopct设置饼图百分比,可以使用格式化字符串或者format方法。7.3数据的可视化7.3.1折线图折线图可以展示数据随时间的变化,适用于显示在相等时间间隔下数据的趋势,例如每月的销售数据,每日的气温变化,每小时的股票交易量等等。在折线图中,一般x轴表示时间,y轴表示要展示数据的数值。案例:已知北京2019年每月的气温数据(data/北京2019气温数据.xlsx),利用DataFrame对象的plot()方法绘制折线图的代码如下所示:01importpandasaspd02df=pd.read_excel('data/北京2019气温数据.xlsx')03df7.3数据的可视化7.3.1折线图04importmatplotlib.pyplotasplt05plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码06plt.rcParams['axes.unicode_minus']=False#图中坐标轴“负号”显示不全07df.plot(x='月',y='平均最高气温(℃)',grid=True,title='北京2019年平均最高气温变化')绘制平均最高气温变化的折线图:7.3数据的可视化7.3.1折线图同时绘制平均最高气温和最低气温变化的折线图:08df.plot(x='月',y=['平均最高气温(℃)','平均最低气温(℃)'],grid=True,title='北京2019年平均气温变化',style=['^-','*-'])7.3数据的可视化7.3.1折线图绘制平均最高气温和最低气温变化的折线图子图:09df.plot(x='月',y=['平均最高气温(℃)','平均最低气温(℃)'],subplots=True,layout=(1,2),figsize=(10,2),grid=True,title='北京2019年平均气温变化',style=['^-','*-']))7.3数据的可视化7.3.2条形图条形图,又称柱形图,是一种以长方形的高度(长度)为变量的统计图。DataFrame对象的plot()方法绘制条形图主要设置kind='bar'。案例:已知北京2019年每月的气温数据(data/北京2019气温数据.xlsx),绘制北京2019年平均最高气温变化的条形图:01importpandasaspd02df=pd.read_excel('data/北京2019气温数据.xlsx')03df04importmatplotlib.pyplotasplt05plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码06plt.rcParams['axes.unicode_minus']=False#图中坐标轴“负号”显示不全07df.plot(x='月',y='平均最高气温(℃)',kind='bar',grid=True,title='北京2019年平均气温变化')7.3数据的可视化7.3.2条形图08df.plot(x='月',y=['平均最高气温(℃)','平均最低气温(℃)'],kind='bar',grid=True,title='北京2019年平均气温变化')同时绘制平均最高气温和最低气温变化的条形图:7.3数据的可视化7.3.2条形图09df.plot(x='月',y=['平均最高气温(℃)','平均最低气温(℃)'],kind='barh',grid=True,title='北京2019年平均气温变化')绘制平均最高气温变化的条形图(横向):7.3数据的可视化7.3.2条形图10df.plot(x='月',y=['平均最高气温(℃)','平均最低气温(℃)'],kind='bar',subplots=True,layout=(1,2),figsize=(10,2),grid=True,title='北京2019年平均气温变化')同时绘制平均最高气温和最低气温变化的条形图子图:7.3数据的可视化7.3.3饼图以某公司人员数据(data/人员.xls)为例,绘制学历构成饼图01importpandasaspd02df=pd.read_excel('data/人员.xls')03df.head()04importmatplotlib.pyplotasplt05plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码06#按学历分组,并统计各组的数量df2=df.groupby(['学历'],as_index=False).count()07df2.drop(['月薪'],axis=1,inplace=True)#删除'月薪'列08df2.columns=['学历','数量']#修改df2的列标签09df2饼图常常用来显示数据各个部分占总体的百分比,例如男女性别的百分比,工资收入各项的百分比等等。利用DataFrame对象的plot()方法绘制饼图主要设置kind='pie'。7.3数据的可视化7.3.3饼图10df2.plot(x='学历',y='数量',kind='pie',autopct='%.0f%%',fontsize=14,legend=False)#绘制饼图11df2.index=['大专','本科','硕士']

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论