




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
有关关系的可视化在关系中寻求什么关联性(圆点、探索更多的变量、气泡)分布(老式分布图表、有关分布的柱形、延续性的密度)
对照和比较4.本章主要内容1.2.
3.D
当某个数量增加时,另一个数量是否会减少?
它们之间是因果关系还是关联关系?群体彼此之间是存在交叠还是互不干涉?D
关联性可以帮助我们根据某一已知指标来预测另一指标。7.1
在关系中寻求什么7.2
关联性——散点图(探索更多的变量)图.
散点图矩阵的基本框架优势在于一次比较3个变量:D
x轴D
y轴D
气泡的面积7.2关联性
—
气泡图图.
气泡图的基本框架直方图Hist()用一系列宽度相等、
高度不等的长方形来表
示数据分布7.3
分布matplotlib.pyplot.hist(x,
bins,
range,
density,weights,
cumulative,
bottom,
histtype,**kwargs)参数说明(部分):Dx→作图所用的数据,一维数组,多维数组可以扁平化后再作图
Dbins→直方图的柱数,可选项,整数、序列或字符串型。默认10
Drange→
指定直方图数据的上下界,默认包含绘图数据的最大值和最小值
(范围)Ddensity→布尔值,如果为"True”,将y轴转化为密度刻度,默认为None
Dweights→为每个数据点设置权重Dcumulative→布尔值,是否需要计算累计频数或频率,默认为False
Dbottom→为直方图添加基准线,数组型,默认为noneDhisttype→直方图类型,
分为bar,barstacked,step,stepfilled。默认为bar主要用于反映原始数据分布的特征,也可以进行多组数据分布特征的比较。盒须图(箱形图Range
又
称
为
分位差。内距IQR
Inter-
Quartile,四盒须图变种可以水平或者垂直绘制盒须图变种2D
Box
Plot
Relplot
Rangefinder
Box
Plot
Bag
Plot值,默认值为False。可选参数。D
sym:离群点的默认标记符号,详解flierprops参数。类型为字符串,默认值
为'None'。可选参数。取值为''隐藏离群点,取值为'None'时,取值为'b+’。D
vert:箱体的方向,当取值为True时,绘制垂直箱体,当取值为False时,绘
制水平箱体。类型为布尔值,默认值为True。可选参数。D
whis:箱须的位置。类型为浮点数或浮点数二元组,默认值为1.5。
可选参数。matplotlib.pyplot.boxplot(x,
notch,
vert,
patch_artist,
whis,
widths,
labels,**kwargs)D
x
:输入数据。
类型为数组或向量序列。必备参数。D
notch:控制箱体中央是否有V型凹槽。当取值为True时,箱体中央有V型凹
槽,凹槽表示中位数的置信区间;取值为False时,箱体为矩形。类型为布尔1.
切尔诺夫脸谱图(Chernoff
Faces)D
根据数据,将多个变量一次性展现在人脸的各个部位上,例如耳朵、头发、眼睛、鼻子等7.4
对照和比较(多变量比较)
图.
2008—2009赛季NBA前50位得分手的切尔诺夫脸谱图•也称为网络图、蜘蛛图、星图、
蜘蛛网图,是一种表现多维数据
的图表。•将多个维度的数据量映射到坐标
轴上,
每一个维度的数据都分别
对应一个坐标轴,
这些坐标轴以
相同的间距沿着径向排列,并且
刻度相同。•网格线通常只作为辅助元素,
将
坐标轴上的数据点用线连接起来就形成了一个多边形。2.
雷达图(Radar
Chart,Spider
Chart)
多组多维对比-多雷达链D
两款手机的综合表现雷达图:matplotlib
库polar(
)函数:matplotlib.pyplot.
polar(theta,
rp
**kwargs)D
theta:旋转角度D
r:每个标记到圆心的距离D
kwargs:关键字参数集合网格线设置函数:matplotlib.pyplot.thetagrids(angles=None,
labels=None,
fmt=None,
**kwargs)D
通过色差、亮度来展示数据的差
异,直观了解点位的聚集情况,
易于理解。D
热力图尤其关注分布。D
热力图可以不需要坐标轴,其背
景常常是图片或地图。3.
热力图(Heat
Map)杭州房租热力图,用于显示杭州市房租价格分布Dseaborn.heatmap(data,
vmin,
vmax,
cmap,
annot,
fmt,
linewidths,
xticklabels,
yticklabels,
**kwargs)D
根据data传入的值画出热力图,一般是二维矩阵D
vmin设置最小值,
vmax设置最大值D
cmap换用不同的颜色D
center设置中心值D
annot
是否在方格上写上对应的数字Dfmt
写入热力图的数据类型,默认为科学计数,
d表示整数,
.1f表示保留一位小数D
linewidths
设置方格之间的间隔D
xticklabels,yticklabels填到横纵坐标的值。可以是bool,填或者不填。可以是int,以什么间隔填,可以是list4.
平行坐标图(Parallel)DDD一种用来呈现多变量关系,或者高维度数据的可视化技术。纵向是属性值,横向是属性类别。为了反映变化趋势和各个变量间相互关系,
往往将描述不同变量的各点连接成折线。一、基于Pandaspandas.plotting.parallel_coordinates(frame,
class_column,
cols=None,
ax=None,
color=None,
use_columns=False,
xticks=None,
colormap=None,
axvlines=True,
axvlines_kwds=None,
sort_labels=False,
**kwarg
s)参数:Dframe:
DataFrame
D
class_column:str
包含类名的列名。
Dcols
:列表,可选。
要使用的列名列表。
返回:类
matplotlib.axis.Axes二、基于Pyecharts的Parallel-value:表示坐标轴的类型为连续型数值型数据,坐标轴上的刻度间距会按照数据范围和
坐标轴长度自动计算。-category:表示坐标轴的类型为离散型类别数据,坐标轴上的刻度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- YY 0459-2025外科植入物丙烯酸类树脂骨水泥
- 新疆北庭希望环保科技有限公司吉木萨尔县25万吨-年危废处理利用项目(2)环评报告
- 某著名企业DeepSeek系列09DeepSeek政务应用场景与解决方案
- 工业废水处理与绿色工艺技术
- 工业废气治理技术与方法探讨
- 工业大数据的分析与应用
- 工业建筑设计及自动化机电系统
- 工业污染防治与绿色制造技术分析
- 工业网络通信协议与技术标准
- 工业生产中的设备优化管理
- 2025年北京丰台区九年级中考二模英语试卷试题(含答案详解)
- 新生儿收治流程规范与实施
- T/CBMCA 017-2021建筑用覆膜钢板
- 《重症监护病房的临终关怀和姑息治疗指南》解读
- 2025年初中地理会考试卷
- 中国钛基复合材料行业市场前景预测及投资价值评估分析报告
- 2024年江苏省无锡市中考历史真题(原卷版)
- 三级营养师考试复习重点题(附答案)
- 重庆市沙坪坝区2023-2024学年四年级下学期语文期末试卷(含答案)
- 安全领导力与执行力经典培训课件
- 四年级数学下册 六 运算律第4课时 乘法的分配律教学设计 苏教版
评论
0/150
提交评论