




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十一章第十一章 多变量的可视化分析多变量的可视化分析 第一节第一节 引言引言 第二节第二节 折线图分析法折线图分析法 第三节第三节 条形图分析法条形图分析法 第四节第四节 散点图分析法散点图分析法 第五节第五节 雷达图分析法雷达图分析法 第六节第六节 星座图分析法星座图分析法 第一节第一节 引言引言n众所周知,图形是我们直观了解、认识数据的一种可视化手众所周知,图形是我们直观了解、认识数据的一种可视化手段。假设能将所研讨的数据直接显示在一个平面图上,便可段。假设能将所研讨的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图以一目了然地看出分析变量间的数量关系
2、。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实践问题中,多变量数据的维数通常又都大于且在许多实践问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪那么如何用图形直观表现三维以上的数据呢?自上世纪70年年代以来,多变量数据的可视化分析研讨就不断是人们关注的代以来,多变量数据的可视化分析研讨就不断是人们关注的一个问题。一个问题。n从研讨的成果来看,主要可以分为两类从研讨的成果
3、来看,主要可以分为两类:n一类是使高维空间的点与平面上的某种图形对应,这种图形一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;能反映高维数据的某些特点或数据间的某些关系;n另一类是对多变量数据进展降维处置,在尽能够多地保管原另一类是对多变量数据进展降维处置,在尽能够多地保管原始信息的原那么下,将数据的维数降为始信息的原那么下,将数据的维数降为2维或维或1维,然后再在维,然后再在平面上表示。例如前面引见的主成分分析方法、因子分析方平面上表示。例如前面引见的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅引见法、多维尺度法等就属于此类
4、方法。这里仅引见5种适用而种适用而有效的多变量可视化方法。有效的多变量可视化方法。 n表表11.1是我国华北地域是我国华北地域5个省市个省市2003年城镇居民家庭平均每人年城镇居民家庭平均每人全年消费性支出的六项目的数据,下面分别用全年消费性支出的六项目的数据,下面分别用5种可视化方种可视化方法对数据进展分析。法对数据进展分析。n思索微机的普及运用,本章主要引见思索微机的普及运用,本章主要引见5种图形的制造方法,种图形的制造方法,图形的制造那么经过电脑实现。折线图、条形图、矩阵散点图形的制造那么经过电脑实现。折线图、条形图、矩阵散点图在图在SPSS中制造,雷达图和星座图那么在中制造,雷达图和星
5、座图那么在EXCEL中实现。中实现。n 表表11.1 华北华北5省市城镇居民家庭消费性支出省市城镇居民家庭消费性支出第二节第二节 折线图分析法折线图分析法n折线图是将多个样品观测数据以折线的方式表示在平面图中折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示景象在时间上的变化趋势、景象的分配的大小,常用于表示景象在时间上的变化趋势、景象的分配情况和两个景象之间的依存关系等。情况和两个景象之间的依存关系等。n折线图的作图原理如下:折线图的作图原理如下:n 1作平面坐标系,横
6、坐标取作平面坐标系,横坐标取p个点,表示个点,表示p个变量,纵个变量,纵坐坐n 标表示变量取值。标表示变量取值。n 2对给定的样品观测值,在对给定的样品观测值,在p个点的纵坐标上标出相应个点的纵坐标上标出相应的的n 变量取值。变量取值。n 3将表示将表示p个变量取值的点衔接成一条折线,即得到了个变量取值的点衔接成一条折线,即得到了表表n 示一个样品观测数据的折线,示一个样品观测数据的折线,n次观测可绘出次观测可绘出n条折条折 线,构成多变量折线图。线,构成多变量折线图。 n在在SPSS中作折线图的方法如下:中作折线图的方法如下:n 1将原始数据输入将原始数据输入SPSS中。留意数据的组织方式要
7、像中。留意数据的组织方式要像图图11.1那样。即把不同地域当成变量,而把支出目的当成观那样。即把不同地域当成变量,而把支出目的当成观测。测。图图11.1 作折线图时的数据组织方式作折线图时的数据组织方式 2选择菜单项选择菜单项GraphsLine,翻开,翻开Line Charts对话框,对话框,如图如图11.2。在对话框上方的三个选项用于选择折线图的方式,。在对话框上方的三个选项用于选择折线图的方式,由于是这里是多变量作图,所以选择由于是这里是多变量作图,所以选择Multiple。在对话框下。在对话框下面的三个选项中选择面的三个选项中选择Value of individual cases。单击
8、。单击Define按钮,翻开按钮,翻开Define Multiple Line对话框。对话框。 图图11.2 Line Charts对话框对话框 3在在Define Multiple Line对话框中,将代表不同地域的对话框中,将代表不同地域的5个变量移入个变量移入Lines Represent列表框中,将代表支出目的的变列表框中,将代表支出目的的变量量variable移入移入Variable框中。单击框中。单击OK按钮,即可作出按钮,即可作出如图如图11.4所示的折线图。从图中可以清楚地看出北京市几乎所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省那么几乎每项支出都是
9、最低各项支出都排在第一,而山西省那么几乎每项支出都是最低的。的。 图图11.3 Define Multiple Line对话框对话框图图11.4 折线图折线图第三节第三节 条形图分析法条形图分析法n条形图是由假设干平行条状的矩形所构成,而以每一个矩形条形图是由假设干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。的高度来代表数值的大小。n按图按图11.1所示的方式在所示的方式在SPSS中组织好数据后,条形图的制造中组织好数据后,条形图的制造步骤如下:步骤如下:n 1选择菜单项选择菜单项GraphsLine,翻开,翻开Bar Charts对话框,对话框,该对话框与图该对话框与图11.
10、2所示的所示的Line Charts对话框有一样的选项。对话框有一样的选项。在对话框上方的三个选项用于选择条形图的方式,由于是这在对话框上方的三个选项用于选择条形图的方式,由于是这里是多变量作图,所以选择里是多变量作图,所以选择Clustered。在对话框下面的三个。在对话框下面的三个选项中选择选项中选择Value of individual cases。单击。单击Define按钮,翻按钮,翻开开Define Clustered Bar对话框。对话框。 n 2在在Define Clustered Bar对话框中,将代表不同地域的对话框中,将代表不同地域的5个变量移入个变量移入Bars Repr
11、esent列表框中,将代表支出目的的变列表框中,将代表支出目的的变量移入量移入Variable框中。单击框中。单击OK按钮,即可作出如图按钮,即可作出如图11.5所示所示的条形图。的条形图。 图图11.5 条形图条形图n可以发现,折线图和条行图的作图过程几乎一样,作图原理可以发现,折线图和条行图的作图过程几乎一样,作图原理也大同小异,折线图是以折线的高低来表示变量的大小,条也大同小异,折线图是以折线的高低来表示变量的大小,条形图是以矩形的高低来表示变量的大小。形图是以矩形的高低来表示变量的大小。n从图从图11.5也可以得出与折线图同样的结论:北京市各项支出也可以得出与折线图同样的结论:北京市各
12、项支出都比较高,而山西省各项支出都比较低。都比较高,而山西省各项支出都比较低。第四节第四节 散点图分析法散点图分析法n散点图又称分布图,它是以点的分布反映变量之间相关关系散点图又称分布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图那么是一种反映多个变量之间相的可视化方法。矩阵散点图那么是一种反映多个变量之间相关关系的二维散点图。关关系的二维散点图。n利用利用SPSS制造矩阵散点图的步骤如下:制造矩阵散点图的步骤如下:n 1在在SPSS中按图中按图11.6的方式组织数据,即把支出目的当的方式组织数据,即把支出目的当成变量,而把不同地域当成观测。成变量,而把不同地域当成观测。 图图
13、11.6 作散点图时的数据组织方式作散点图时的数据组织方式 2选择菜单项选择菜单项GraphsScatter,翻开,翻开Scatter plot对话框对话框,如图如图11.7。该对话框用于选择散点图的方式。选定。该对话框用于选择散点图的方式。选定Matrix,即矩阵散点图即矩阵散点图 ,单击,单击Define按钮,翻开按钮,翻开Scatter plot Matrix对对话框,如图话框,如图11.8。 图图11.7 Scatter plot对话框对话框图图11.8 Scatter plot Matrix对话框对话框 3在翻开的在翻开的Scatter plot Matrix对话框中,将食品、穿着、
14、对话框中,将食品、穿着、居住三个变量移入居住三个变量移入Matrix Variables列表框中,将标志变量列表框中,将标志变量region移入移入Label Cases by列表框中。列表框中。 4点击点击OK按钮,得到如图按钮,得到如图11.9所示的矩阵散点图。所示的矩阵散点图。 从图从图11.9可以看出,河北、山西、内蒙古在居住和食品消费支可以看出,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间存出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在穿着支出方面较低,与最低的河在一定的线性关系。天津在穿着支出方面较低,与最低的
15、河北接近,与最高居住支出构成鲜明对比。北京那么除在居住北接近,与最高居住支出构成鲜明对比。北京那么除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古那么在穿着支出方面仅次于北京,显示出某种特殊消内蒙古那么在穿着支出方面仅次于北京,显示出某种特殊消费特征。费特征。 图图11.9 矩阵散点图矩阵散点图 n另外,还可以作三维立体散点图。只需在另外,还可以作三维立体散点图。只需在Scatter plot对话框对话框图图11.7中选择中选择3-D选项。在跳出的选项。在跳出的3-D Scatter plot对话框对话框中将食品、穿着、居住
16、三个变量分别移入中将食品、穿着、居住三个变量分别移入X Axis、Y Axis和和Z Axis列表框中,将标志变量列表框中,将标志变量region移入移入Label Cases by列表列表框中。单击框中。单击OK按钮,那么作出图按钮,那么作出图11.10所示的三维立体散点所示的三维立体散点图。图。n矩阵散点图不仅可以在二维平面上同时反映多个变量数值,矩阵散点图不仅可以在二维平面上同时反映多个变量数值,而且可以用于直观反映多个变量间能否存在某种关系。与三而且可以用于直观反映多个变量间能否存在某种关系。与三维立体图相比,有着更好的可视性。比较图维立体图相比,有着更好的可视性。比较图11.9与图与
17、图11.10不不难看出这一点。难看出这一点。 图图11.10 三维立体散点图三维立体散点图 第五节第五节 雷达图分析法雷达图分析法n雷达图是一种较为常用的多变量可视化图形。在雷达图中,雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它本人的数值轴,每个数值轴都是从中心向外每个变量都有它本人的数值轴,每个数值轴都是从中心向外辐射。由于图形就好似雷达荧光屏上的图像,故称其为雷达辐射。由于图形就好似雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。图。又像蜘蛛网,所以也称蛛网图。n雷达图的作图方法:雷达图的作图方法:n 1作一圆,并按变量的个数作一圆,并按变量的个数p将
18、圆周分成将圆周分成p等分。等分。n 2衔接圆心和各分点,将这衔接圆心和各分点,将这p条半径连线依次定义为条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。各变量的坐标轴,并标以适当的刻度。n 3对给定的一次观测值,将每个变量值分别标在相应对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把的坐标轴上,把p个点相连就构成了一个个点相连就构成了一个p边形,边形,n次观测值次观测值就可画出就可画出n个个p边形。边形。 n例如,根据表例如,根据表11.1中的数据,调用中的数据,调用EXCEL图表导游,选择雷图表导游,选择雷达图,然后按图表导游提示,即可制造出如图达图,然后按图表导游提示,即可
19、制造出如图11.1117所示所示的雷达图。图的雷达图。图11.5画出了北京、天津和河北的雷达图,从图画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出构造有较大差别。北京人均消费可以看出,三省市消费支出构造有较大差别。北京人均消费支出的各项目的都高,对应面积最大的六边形,其次是天津,支出的各项目的都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在穿着和交通、通讯支出方面那么与河北接京较为接近,而在穿着和交通、通讯支出方面那么与河北接近。其他支出方面三地存在较大差别。利用雷达图的外形、近。其他支出方面三地存在较大差别。利用雷达图的外形、面积大小,可以对样品进展初始分类分析。面积大小,可以对样品进展初始分类分析。n为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,详细的分配方法要结合分析的问题而定。例如可将重要的,详细的分配方法要结合分析的问题而定。例如可将要对比的目的分布在左、右或上、下方,以便
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45169-2025增材制造金属制件残余应力声束控制法
- GB/T 45142-2025海洋溢油污染生态修复监测和效果评估技术指南
- GB/T 45221-2025化学品EASZY试验利用转基因tg(cyp19a1b:GFP)斑马鱼胚胎通过雌激素受体检测内分泌活性物质
- 乡村地基出售合同范本
- 2025年铁岭考货运从业资格证
- 2025年永州货运从业资格证怎么考试
- 加工合同范本道客
- 买车库出售合同范本
- it购销合同范本
- 医院业务合同范本
- 经济法学学习通超星期末考试答案章节答案2024年
- 浙江宁波前湾控股集团有限公司招聘笔试题库2024
- 结构化学(PDF电子书)
- 产科腹部四步触诊要点
- 第10课 人类社会及其发展规律-【中职专用】2024年中职思想政治《哲学与人生》金牌课件(高教版2023·基础模块)
- SLT 478-2021 水利数据库表结构及标识符编制总则
- 2024年春学期人教版小学道德与法治六年级下册教学计划附教学进度表
- 深度学习视角下“尺规作图”教学策略
- 2024 年袋鼠数学竞赛 等级E(中国区)
- 2024年南京旅游职业学院单招职业适应性测试题库汇编
- 2024-2030中国半导体阀门及管接头市场现状研究分析与发展前景预测报告
评论
0/150
提交评论