用魔镜进行可视化实验_第1页
用魔镜进行可视化实验_第2页
用魔镜进行可视化实验_第3页
用魔镜进行可视化实验_第4页
用魔镜进行可视化实验_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用魔镜进行可视化实验【实验原理】数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。常见的数据可视化类型有柱状图、饼图、气泡图、标签云等。(1) 柱状图也称条图(英文:bar graph)、长条图(英文:bar chart)、条状图,是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。图柱状图示例(2) 饼图       饼图显示一个数据系列中各项的大小与各项总和的比例。饼图中的数据点显示为整个饼图的百分比。图饼图示例(3) 标签云    &

2、#160;  标签云(Tag Cloud)是用以表示一个网站中的内容标签。标签的排列顺序一般依照字典排序,按照热门程度确定字体的大小和颜色。这样,依照字典或者热门程度来寻找信息便成为可能。图5.2.3标签云示例【实验内容】D3.js是业内主流的可视化开发工具。魔镜基于D3.js开发,具有良好的易用性。通过本实验的学习,可以学会使用魔镜可视化工具,对数据进行各种可视化操作,掌握柱状图、饼图等常见的可视化类型。【实验指导】案例1:教育行业数据分析实践一、案例背景和需求本案例通过一个定量研究学生成绩分布的数学模型,该模型假设学生成绩取决于校内外活动情况,从而查看各省、各高校、学生各科目成绩

3、情况。在这里要对某个学校或者对一个城市的教育水平进行评估,魔镜将通过不同城市的不同学院、学生考试分数及学生参与校内外活动情况等多个维度来分析并制作仪表盘。通过分析,可以从时间维度上看到不同时期的教育水平情况。 二、分析方法本案例的数据如下图所示:1.确定问题 本案例主要分析各省不同年级、不同学校、不同科目考试成绩,并分析学生参与的不同活动类型是否影响学生成绩。2.分解问题分解问题和数据,将大问题分解成小问题。通过回答小问题,即可解答大问题。本案例问题较明确:学生成绩是否受学生活动影响?3.评估问题评估影响问题的各方面因素,如本案例问题,影响因素可能有省份、班级、活动类型。4.总结问题不仅能够将

4、问题剖析,并能提供决策性建议的数据分析才是有价值的数据分析。(二)分析过程1.新建项目,命名为“学生成绩分析”,如下图所示,并选择EXCEL数据源,点击“下一步”。2.连接数据源“考试分数.xlsx”,进入数据预览页面,将“学生编号” 、“教师编号”、“班级”设置为字符串类型,点击“保存”,上传数据源。3.进入“数据处理”页面,点击“快速设置”,一键自动生成业务分组,如下图所示。4.拖拽“城市”、“分数”到行、列中,并设置分数表达式为平均值,点击图表库-地图,视图区即出现地图图形效果。点击字段“分数”设置可视化为标记类型为“圆形”,并设置颜色为红色。将报表命名为“各城市学生平均分数情况”,如下

5、图所示。5.拖拽数据区“学生编号”、“考试科目”“分数”分别到行、列,点击图表区列表,切换到列表格式。将报表命名为“学生各科目平均分数情况”。如下图所示。拖拽数据区“日期”、“考试科目”、“分数”分别到行、列中,并设置日期的聚合方式为“月”,分数表达式为“平均值”。设置线条的线条类型、线条粗细、编辑颜色,如下图所示。 鼠标移动到仪表盘左侧,调整仪表盘,对于图表排版进行编辑,如下图所示。6.调整完毕,形成第一张仪表盘。点击导航栏“设置”,如图9-11,编辑仪表盘名称为“学生成绩概况分析”,如下图所示。 最终仪表盘见如下图所示。这个仪表盘主要查看学生成绩的总体概况,通过分析可以看到沈阳、哈尔滨地区

6、的平均成绩高于其他城市。整体来看,阅读的成绩高于数学、科学,成绩的高峰在2012年1月份。7.再建一张仪表盘,主要分析各活动类型的学生成绩。如图9-14所示,拖拽数据区“活动类型”、“分数”分别到行、列中,选择图表库柱形图。点击列下三角图标,选择降序排列,如下图所示。 将报表命名为“按学生活动类型学生成绩情况”,如下图所示。8.新建图表“同年级参与社会活动学生占比”,拖拽 “年级”、“活动类型”到行,“学生”到列中,点击图表库饼图。如下图所示。9.新建图表“不参与社会活动学生考试成绩”,拖拽“考试科目”到行,“分数”到列中,点击图表库区域图,拖拽“活动类型”到筛选器,点击字段名,从列表中勾选“

7、不参与”类型,如下图所示。 最终形成的仪表盘如下图所示。这个仪表盘可以看到,参加不同类型学校活动的学生数目情况,及相关成绩整体情况,以及各科目的详细情况。四、总结通过分析得出,阅读科目的成绩普遍高于数学和科学,科学这个科目在2012年3月份下降幅度很大,成绩平均值在7677分。通过这个分析会发现学生普遍喜欢阅读多于数学和科学。10年级校内外活动人数比例很大,不参与活动的学生成绩高于校内学生会、社团类型,参与校外兼职的学生成绩排名最低。可见,学生校内外活动情况是在影响学生成绩的。案例2:人力资源行业数据分析实践一、案例背景和需求本案例主要分析了各大行业热门职位需求,以及分析各行业人员跳槽因素以及

8、占比,学历在行业中的比例分析,还特别针对互联网行业,对其职位、学历、薪资、跳槽情况做出了具体的分析。对于企业来说,看到这样的数据,会使其对比发现制定更好的管理制度,对于求职者来说,他们对自己的行业有一个更好的选择和以及规划短期未来发展方向。二、大数据分析方法及过程2.1原始数据 本案例的原始数据如下图所示。2.2 研究的问题 1)各个行业人员变动比例以及跳槽占比如何; 2)各个行业热门职位的需求指数变化趋势如何; 3)加班带给企业的和员工的利与弊以及加班与跳槽和薪水之间的关系分析; 4)对热门行业互联网行业的人员变动以及热门职位的需求指数的原因分析; 5)分析薪资、学历对互联网行业人力资源的波

9、动影响比例; 6)分析互联网行业指数较高的热门职位需求指数;2.3 实施步骤 1)新建项目,命名为“人力资源市场分析”,并选择EXCEL数据源,点击“下一步”,如下图所示。 2)连接数据源“人力资源.xls”,进入数据预览页面,点击“保存”,上传数据源,如下图所示。 3)进入“仪表盘”页面,点击“新建图表”,拖拽数据区“行业”、“2014指数”、“2016指数”分别到行、列中。切换到区域图格式,可以自定义设置区域图类型和颜色。如下图所示。 通过上图可以看出2014年以及2016年各个行业人力需求指数对比分析,大多数行业还是呈上升趋势! 4)拖拽数据区“职位”、“2016指数”分别到行、列中,选

10、择条形图格式,如下图所示。 通过上图分析看出2016年各个行业的热门职位包括前端开发工程师和运营经理。 5)拖拽“行业”、“加班占比”到行、列中,点击图表库-更多百分比圆环图,视图区即出现百分比圆环图形效果,如下图所示。 通过上图可以看出互联网行业行业的加班幅度还是相对而言比较大的。 6)拖拽数据区“行业”、“加班占比”“是否跳槽”分别到行、列,点击图表区列表,切换到线图格式。将报表命名为“各个行业加班与跳槽占比”。如下图所示。 通过对行业以及职位加班和是否有跳槽打算进行分析,发现需求量较大的互联网行业加班与跳槽成正比。 7)拖拽数据区“学历”、“学历占比”分别到行、列中。切换到区域图格式,设

11、置面积类型曲线面积图。如下图所示。 通过上图分析发现互联网行业大军中本科学历占比较大,其它分别是专科和硕士。整体来看,互联网行业对人才的需求较大,当然不难看出互联网行业人力波动也较为明显。下面针对互联网行业的人力资源做简单分析: 1)拖拽数据区“职位” 、“2014指数”、“2016指数”分别到行、列中。将“职位”拖入到筛选器,筛选互联网行业热门职位,切换到散点图格式,如下图所示。 通过分析互联网行业2014年和2016年人力需求占比,发现需求较大的是前端工程师。 2)拖拽数据区“学历” 、“职位”、“学历占比”分别到行、列中。将“学历”拖入到筛选器,筛选本科,切换到饼图格式,如下图所示。 通

12、过上图分析发现,互联网行业中各大热门职位当中本科学历占比情况! 3)拖拽数据区“学历” 、“职位”、“月薪”分别到行、列中。将“学历”拖入到筛选器,筛选本科与专科,切换到饼图格式,如下图所示。 通过上图对本科和专科进行了对比分析,发现本科学历薪资普遍高于专科. 4)拖拽数据区“行业” 、“跳槽因素”、“是否跳槽”分别到行、列中。将“行业”拖入到筛选器,筛选互联网行业,切换到饼图格式,如下图所示。 通过对上图分析比较发现,互联网行业的员工跳闸主要原因是公司管理。 5)拖拽数据区“职位” 、“月薪”分别到行、列中,切换到饼图格式,如下图所示。 6)拖拽数据区“职位” 、“2016指数”分别到行、列中。将“职位”拖入到筛选器筛选出互联网热门职位“前端工程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论