数据可视化课件:有关关系的可视化_第1页
数据可视化课件:有关关系的可视化_第2页
数据可视化课件:有关关系的可视化_第3页
数据可视化课件:有关关系的可视化_第4页
数据可视化课件:有关关系的可视化_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

有关关系的可视化在关系中寻求什么关联性(圆点、探索更多的变量、气泡)分布(老式分布图表、有关分布的柱形、延续性的密度)

对照和比较4.本章主要内容1.2.

3.D

当某个数量增加时,另一个数量是否会减少?

它们之间是因果关系还是关联关系?群体彼此之间是存在交叠还是互不干涉?D

关联性可以帮助我们根据某一已知指标来预测另一指标。7.1

在关系中寻求什么7.2

关联性——散点图(探索更多的变量)图.

散点图矩阵的基本框架优势在于一次比较3个变量:D

x轴D

y轴D

气泡的面积7.2关联性

气泡图图.

气泡图的基本框架直方图Hist()用一系列宽度相等、

高度不等的长方形来表

示数据分布7.3

分布matplotlib.pyplot.hist(x,

bins,

range,

density,weights,

cumulative,

bottom,

histtype,**kwargs)参数说明(部分):Dx→作图所用的数据,一维数组,多维数组可以扁平化后再作图

Dbins→直方图的柱数,可选项,整数、序列或字符串型。默认10

Drange→

指定直方图数据的上下界,默认包含绘图数据的最大值和最小值

(范围)Ddensity→布尔值,如果为"True”,将y轴转化为密度刻度,默认为None

Dweights→为每个数据点设置权重Dcumulative→布尔值,是否需要计算累计频数或频率,默认为False

Dbottom→为直方图添加基准线,数组型,默认为noneDhisttype→直方图类型,

分为bar,barstacked,step,stepfilled。默认为bar主要用于反映原始数据分布的特征,也可以进行多组数据分布特征的比较。盒须图(箱形图Range

分位差。内距IQR

Inter-

Quartile,四盒须图变种可以水平或者垂直绘制盒须图变种2D

Box

Plot

Relplot

Rangefinder

Box

Plot

Bag

Plot值,默认值为False。可选参数。D

sym:离群点的默认标记符号,详解flierprops参数。类型为字符串,默认值

为'None'。可选参数。取值为''隐藏离群点,取值为'None'时,取值为'b+’。D

vert:箱体的方向,当取值为True时,绘制垂直箱体,当取值为False时,绘

制水平箱体。类型为布尔值,默认值为True。可选参数。D

whis:箱须的位置。类型为浮点数或浮点数二元组,默认值为1.5。

可选参数。matplotlib.pyplot.boxplot(x,

notch,

vert,

patch_artist,

whis,

widths,

labels,**kwargs)D

x

:输入数据。

类型为数组或向量序列。必备参数。D

notch:控制箱体中央是否有V型凹槽。当取值为True时,箱体中央有V型凹

槽,凹槽表示中位数的置信区间;取值为False时,箱体为矩形。类型为布尔1.

切尔诺夫脸谱图(Chernoff

Faces)D

根据数据,将多个变量一次性展现在人脸的各个部位上,例如耳朵、头发、眼睛、鼻子等7.4

对照和比较(多变量比较)

图.

2008—2009赛季NBA前50位得分手的切尔诺夫脸谱图•也称为网络图、蜘蛛图、星图、

蜘蛛网图,是一种表现多维数据

的图表。•将多个维度的数据量映射到坐标

轴上,

每一个维度的数据都分别

对应一个坐标轴,

这些坐标轴以

相同的间距沿着径向排列,并且

刻度相同。•网格线通常只作为辅助元素,

坐标轴上的数据点用线连接起来就形成了一个多边形。2.

雷达图(Radar

Chart,Spider

Chart)

多组多维对比-多雷达链D

两款手机的综合表现雷达图:matplotlib

库polar(

)函数:matplotlib.pyplot.

polar(theta,

rp

**kwargs)D

theta:旋转角度D

r:每个标记到圆心的距离D

kwargs:关键字参数集合网格线设置函数:matplotlib.pyplot.thetagrids(angles=None,

labels=None,

fmt=None,

**kwargs)D

通过色差、亮度来展示数据的差

异,直观了解点位的聚集情况,

易于理解。D

热力图尤其关注分布。D

热力图可以不需要坐标轴,其背

景常常是图片或地图。3.

热力图(Heat

Map)杭州房租热力图,用于显示杭州市房租价格分布Dseaborn.heatmap(data,

vmin,

vmax,

cmap,

annot,

fmt,

linewidths,

xticklabels,

yticklabels,

**kwargs)D

根据data传入的值画出热力图,一般是二维矩阵D

vmin设置最小值,

vmax设置最大值D

cmap换用不同的颜色D

center设置中心值D

annot

是否在方格上写上对应的数字Dfmt

写入热力图的数据类型,默认为科学计数,

d表示整数,

.1f表示保留一位小数D

linewidths

设置方格之间的间隔D

xticklabels,yticklabels填到横纵坐标的值。可以是bool,填或者不填。可以是int,以什么间隔填,可以是list4.

平行坐标图(Parallel)DDD一种用来呈现多变量关系,或者高维度数据的可视化技术。纵向是属性值,横向是属性类别。为了反映变化趋势和各个变量间相互关系,

往往将描述不同变量的各点连接成折线。一、基于Pandaspandas.plotting.parallel_coordinates(frame,

class_column,

cols=None,

ax=None,

color=None,

use_columns=False,

xticks=None,

colormap=None,

axvlines=True,

axvlines_kwds=None,

sort_labels=False,

**kwarg

s)参数:Dframe:

DataFrame

D

class_column:str

包含类名的列名。

Dcols

:列表,可选。

要使用的列名列表。

返回:类

matplotlib.axis.Axes二、基于Pyecharts的Parallel-value:表示坐标轴的类型为连续型数值型数据,坐标轴上的刻度间距会按照数据范围和

坐标轴长度自动计算。-category:表示坐标轴的类型为离散型类别数据,坐标轴上的刻度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论