基于R语言数据可视化类别数据可视化课件_第1页
基于R语言数据可视化类别数据可视化课件_第2页
基于R语言数据可视化类别数据可视化课件_第3页
基于R语言数据可视化类别数据可视化课件_第4页
基于R语言数据可视化类别数据可视化课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、贾俊平数据可视化 R 语言Chap 3 类别数据可视化3.1 条形图及其变种3.2 树状图3.3 马赛克图及其变种3.4 关联图和独立性检验P值图3.5 气球图和热图3.6 南丁格尔玫瑰图3.7 金字塔图3.8 饼图及其变种条形图及其变种 树状图马赛克图及其变种关联图和独立性检验P值图气球图和热图南丁格尔玫瑰图金字塔图饼图及其变种 Chap 3 类别数据可视化Chap 3简单条形图帕累托图并列条形图堆叠条形图不等宽条形图脊形图条形树状图矩形树状图马赛克图马赛克图变种关联图独立性检验P值图气球图热图玫瑰图金字塔图饼图和扇形图环形图和弧形 3.1 条形图及其变种条形图(bar plot)是用一定宽

2、度和高度的矩形表示各类别频数多少的图形主要用于展示类别变数据的频数分布绘制条形图时,各类别可以放在X轴(横轴),也可以放在Y轴(纵轴)类别放在X轴的条形图称为垂直条形图(vertical bar plot)或柱形图,类别放在Y轴的条形图称为水平条形图(horizontal bar plot) 简单条形图和帕累托图条形图 3.1 条形图及其变种【例3-1】graphics中的barplot函数绘制的条形图 简单条形图和帕累托图简单条形图例题分析 3.1 条形图及其变种【例3-1】sjPlot包中的plot_frq函数绘制的条形图 简单条形图和帕累托图简单条形图例题分析 3.1 条形图及其变种帕累

3、托图(Pareto plot)是将各类别的频数降序排列后绘制的条形图以意大利经济学家V.Pareto的名字命名的帕累托图可以看作简单条形图的一个变种,利用该图很容易看出哪类频数出现得最多,哪类频数出现得最少。 简单条形图和帕累托图帕累托图 3.1 条形图及其变种 简单条形图和帕累托图帕累托图【例3-1】barplot函数绘制的帕累托图 3.1 条形图及其变种绘制两个类别变量的条形图时,可以使用原始数据绘图,也可以先生成二维列联表再绘图根据绘制方式不同有并列条形图(juxtaposed bar plot)和堆叠条形图(stacked bar plot)等并列条形图中,一个类别变量作为坐标轴,另一

4、个类别变量各类别频数的条形并列摆放;堆叠条形图中,一个类别变量作为坐标轴,另一个类别变量各类别的频数按比例堆叠在同一个条中使用barplot函数默认绘制堆叠条形图,设置参数beside=TRUE可绘制并列条形图。使用DescTools包中的BarText函数、plotrix包中的barlabels函数可以给条形图添加标签 并列条形图和堆叠条形图 3.1 条形图及其变种 并列条形图和堆叠条形图例题分析【例3-1】使用barplot结合BarText函数绘制的条形图 3.1 条形图及其变种 并列条形图和堆叠条形图例题分析【例3-1】使用sjPlot包中的sjp.xtab函数可以也绘制的条形图 3.

5、1 条形图及其变种 并列条形图和堆叠条形图例题分析【例3-1】使用epade包中的bar.plot.ade函数绘制的3D条形图。默认参数beside=TRUE,绘制并列条形图,设置beside=FALSE可绘制堆叠条形图 3.1 条形图及其变种 并列条形图和堆叠条形图例题分析【例3-1】使用epade包中的bar.plot.ade函数绘制的3D条形图。默认参数beside=TRUE,绘制并列条形图,设置beside=FALSE可绘制堆叠条形图 3.1 条形图及其变种 不等宽条形图和脊形图用一个变量各类别条形的宽度表示样本量,另一个类别变量的各类别以并列或堆叠的方式绘制条形图脊形图(spine

6、plot)是根据各类别的比例绘制的一种条形图,它可以看作堆叠条形图的一个变种,也可以看作马赛克图的一个特例。绘制脊形图时,将某个类别各条的高度都设定为1或100%,条的宽度与观测频数(样本量)成比例,条内每一段的高度表示另一个类别变量各类别的频数比例 3.1 条形图及其变种 不等宽条形图例题分析【例3-1】使用ggiraphExtra包中的ggSpine函数绘制不等宽条形图。使用ggiraphExtra包时,需要同时加载ggplot2包 3.1 条形图及其变种 脊形图例题分析【例3-1】使用graphics包中的spineplot函数、vcd包中的spine函数、ggiraphExtra包中的

7、ggSpine函数等均可以绘制脊形图。以性别与满意度、网购次数与满意度为例,由graphics包中的spineplot函数绘制的脊形图 3.1 条形图及其变种 脊形图例题分析【例3-1】使用ggiraphExtra包中的ggSpine函数绘制按第3个类别变量分面的脊形图 3.2 树状图 树状图将各类别的层次结构画成树状图的形式,称为树状图(dendrogram)或分层树状图有条形树状图和矩形树状图,可以看做是条形图的另一个变种主要用来展示各类别变量之间的层次结构关系,尤其适合展示3个及3个以上类别变量的情形(也可以用于展示两个类别变量) 3.2 树状图 条形树状图例题分析【例3-1】使用plo

8、trix包中的plot.dendrite函数和sizetree函数可以绘制出不同式样的树状图。plot.dendrite绘制的条形树状图 3.2 树状图 大小树状图例题分析【例3-1】使用sizetree函数可以绘制出另一种形式的树状图,称为大小树(size tree)或规模树 3.2 树状图 矩形树状图例题分析【例3-1】矩形树状图(treemap)是将多个类别变量的层次结构绘制在一个表示总频数的大的矩形中,每个子类用不同大小的矩形嵌套在这个大的矩形中。嵌套矩形表示各子类别的频数,其大小与相应的子类频数成比例。使用treemap包中的treemap函数可以绘制树状图 3.2 树状图 矩形树状

9、图例题分析【例3-1】矩形树状图(treemap)是将多个类别变量的层次结构绘制在一个表示总频数的大的矩形中,每个子类用不同大小的矩形嵌套在这个大的矩形中。嵌套矩形表示各子类别的频数,其大小与相应的子类频数成比例。使用treemap包中的treemap函数可以绘制树状图 3.3 马赛克图 马赛克图马赛克图是用矩形表示列联表中对应频数的一种图形图中嵌套矩形的面积与列联表相应单元格的频数成比例也可以用于二维表的可视化,可视为条形图的一个变种其变种形式有:筛网图、瓦片图、双层图等 3.3 马赛克图 马赛克图例题分析【例3-1】使用graphics包中的mosaicplot函数、vcd(可视化类别数据

10、)包中的mosaic函数和strucplot函数可以绘制马赛克图 3.3 马赛克图 马赛克图例题分析【例3-1】使用mosaic函数或strucplot函数可以绘制形式多样的马赛克图 3.3 马赛克图 马赛克图的变种筛网图使用sieve函数可以绘制筛网图(sieve plot)该图可用于展示二维列联表或多维列联表,图中矩阵的面积与相应单元格的观测频数成比例,每个矩形中的多个小正方形(网格)表示该单元格的观测频数,网格的密度表示观察频数与期望频数的差异 3.3 马赛克图 马赛克图的变种筛网图例题分析【例3-1】由sieve函数绘制的筛网图 3.3 马赛克图 马赛克图的变种瓦片图和双层图例题分析【

11、例3-1】使用tlie函数可以绘制瓦片图(tile plot)。该图生成一个矩形网格矩阵,其中每一个矩形的面积(宽度或高度)与相应单元格的观测频数成正比。使用doubledecker函数可以绘制双层图(doubledecker plot),该图展示了一个类别变量与另一个类别变量的依赖关系 3.3 马赛克图 条件马赛克图例题分析【例3-1】使用vcd包中的cotabplot函数可以创建条件马赛克图 3.4 关联图和独立性检验的 P 值图 关联图分析列联表中行变量和列变量关系的两种图形关联图就是展示行变量和列变量差异的图形。它将图形以RC的形式布局,列联表中每一个单元格的观测频数和期望频数用一个矩

12、形表示如果一个单元格的观察频数大于期望频数,矩形将高于基线;如果一个单元格的观察频数小于期望频数时,矩形则低于基线 3.4 关联图和独立性检验的 P 值图 关联图二维关联图例题分析【例3-1】使用graphics包中的assocplot函数可用于绘制二维列联表的相关图 3.4 关联图和独立性检验的 P 值图 关联图多维关联图例题分析【例3-1】使用vcd包中的assoc函数可以创建多维列联表的关联图 3.4 关联图和独立性检验的 P 值图 独立性检验的 P 值图关联图只是大概判断两个类别变量是否独立,难以得出确切的结论对于多个类别变量,如果要分析任意两个变量之间是否独立,可以使用Pearson

13、卡方检验该检验的原假设是:二维列联表中的行变量与列变量独立。如果检验的P值较小足以拒绝原假设,则表示行变量与列变量不独立,或者说二者之间具有相关性独立性检验的P值图则列出Pearson卡方检验的P值 3.4 关联图和独立性检验的 P 值图 独立性检验的 P 值图例题分析【例3-1】使用sjPlot包中的sjp.chi2函数可以绘制多个二维表的Pearson卡方独立性检验的P值矩阵 3.5 图气球图和热图 气球图气球图是用气球大小表示数据的图形,它画出的是一个图形矩阵,其中每个单元格包含一个点(气球),其大小与相应数据的大小成比例气球图可用于展示由两个类别变量生成的二维列联表,也可以用于展示具有

14、行名和列名称的其他数据绘图的数据形式是一个数据框或矩阵,数据框中包含至少三列,第1列对应第1个类别变量,第2列对应第2个类别变量,第3列是两个类别变量对应的频数或其他数值 3.5 图气球图和热图 气球图例题分析【例3-1】使用ggpubr包中的ggballoonplot函数可以绘制气球图 3.5 图气球图和热图 气球图例题分析【例3-1】使用ggpubr包中的ggballoonplot函数可以绘制气球图 3.5 图气球图和热图 气球图例题分析【例3-2】(数据:data3_2.csv)表3-1是2017年北京、天津、上海和重庆的人均消费支出数据 3.5 图气球图和热图 热图热图是用颜色的饱和度

15、(深浅)表示数值大小图形可以绘制成矩形的形式,用每个矩形的颜色饱和度表示二维表中每个单元格对应的数值大小也可以将矩形转换成极坐标,绘制出圆形的热图 3.5 图气球图和热图 热图例题分析【例3-1】使用ggiraphExtra包中的ggHeatmap函数不仅可以绘制静态热图,设置参数interactive=TRUE还可以绘制动态交互热图。图中的X轴为一个类别变量,Y轴为另一个类别变量,如果还有第3个类别变量,可以将其作为分面变量。使用ggiraphExtra包时,需要同时加载ggplot2包 3.5 图气球图和热图 热图例题分析【例3-1】使用ggiraphExtra包中的ggHeatmap函数

16、不仅可以绘制静态热图,设置参数interactive=TRUE还可以绘制动态交互热图。图中的X轴为一个类别变量,Y轴为另一个类别变量,如果还有第3个类别变量,可以将其作为分面变量。使用ggiraphExtra包时,需要同时加载ggplot2包 3.5 图气球图和热图 热图例题分析【例3-2】 3.6 南丁格尔玫瑰图 玫瑰图南丁格尔玫瑰图(Nightingale rose diagram)是在极坐标下绘制的一种条形图,又称极区图(polar area diagram)。、玫瑰图由英国护士和统计学家弗罗伦斯南丁格尔(Florence Nightingale)所发明,她自己称这类图为鸡冠花(coxc

17、omb),用于表达战地军医院季节性的死亡率普通的条形图是在直角坐标下绘制的,玫瑰图则是在极坐标下绘制的,它使用弧形的半径长度表示数据的大小,每个类别的数据在极坐标中用一个扇形表示,扇形的大小与类别的频数成比例 3.6 南丁格尔玫瑰图 玫瑰图例题分析【例3-2】使用ggplot2包中的coord_polar函数可以将条形图转化成玫瑰图 3.6 南丁格尔玫瑰图 玫瑰图例题分析【例3-2】使用ggplot2包中的coord_polar函数可以将条形图转化成玫瑰图 3.6 南丁格尔玫瑰图 玫瑰图例题分析【例3-2】使用ggplot2包中的coord_polar函数可以将条形图转化成玫瑰图 3.7 金字

18、塔图金字塔图金字塔图(pyramid chart)是一种特殊的塔状条形图,主要用于展示不同性别和不同年龄组的人口分布状况,因此也称为人口金字塔图(population pyramid chart)绘制金字塔图时,通常将人口数或人口百分比作为X轴,将不同年龄组作为Y轴,不同年龄组内的人口数或百分比绘制成背靠背的条形图金字塔图可用于展示不同年龄组中男性和女性人口的分布状况,也可以用于展示两个不同国家之间的人口年龄分布的差异,或展示不同时间点的人口年龄的分布 3.6 金字塔图 金字塔图例题分析【例3-3】2010年中国第6次人口普查的年龄和性别构成数据 3.8 饼图及其变种饼图饼图(pie chart)是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各类别的频数占总频数的百分比,对于研究结构性问题十分有用使用R基础安装包graphics中的pie函数、ggiraphExtra包中的ggPie函数、DataVisualiza

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论