商务数据可视化 第1章_第1页
商务数据可视化 第1章_第2页
商务数据可视化 第1章_第3页
商务数据可视化 第1章_第4页
商务数据可视化 第1章_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章绪论商务数据可视化思维导图MindMapping数据的采集和清洗1.11.1数据的采集和清洗第1章绪论在开始分析数据,进行数据可视化之前,需要完成两个关键的任务:数据的采集和数据的清洗。接下来的两小节将会对这两个关键任务进行详细地解释与阐述。数据的采集又称为数据的收集,就是指通过各种工具和方法,获取需要数据的过程,为以后数据的分析和数据可视化提供直接的依据和素材。第1章绪论1.1数据的采集和清洗1.1.1数据的采集数据采集的来源有很多种方式,比如内部数据可以通过公司自有的数据库进行获取。外部数据在如今更易收集,比如可以通过公开的出版物或者搜索引擎快速找到需要的数据,一些专业的数据可以从国家或地方统计局的网站,行业组织的官方网站或行业信息网站获得。本节将会对数据的采集进行详细地解释与阐述,以采集国家统计局数据为案例讲解数据采集。第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤一:从web导入数据打开Excel2016,新建一个工作簿,在菜单中找到数据这一栏,点击自网站,从Web获取数据,见图1-1图1-1从Web导入数据第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤二:新建web查询点击以后,会弹出一个新建Web查询窗口,在地址这一栏输入想要跳转的网址,在这里选取了国家统计局中第四次全国经济普查公报中的数据,按地区分组的单位情况,见图1-2,网址如下:/tjsj/zxfb/201911/t20191119_1710340.html。图1-2新建web查询第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤三:导入报表输入网址跳转以后,网站会显示出黄色箭头,单击选中报表,然后单击导入,见图1-3。图

1-3导入报表第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤四:选择导入的位置点击导入以后,会弹出一个窗口指导你导入数据,可以在窗口改变你想要导入数据的位置,见图1-4。图1-4选择导入的位置第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤五:刷新数据一般网上的数据都是实时更新的,因此我们需要通过数据刷新来获取最新的数据,一般有两种方法,点击数据中的全部刷新,见图1-5,或者选中任意数据单元格,右击鼠标设置“数据范围属性”,见图1-6。图1-5刷新数据图1-6数据范围属性第1章绪论1.1数据的采集和清洗1.1.1数据的采集步骤六:实时更新数据点击数据范围属性后,将刷新控件中的前三项勾选,在点击右下角的确定,这样数据就会实时更新了,见图1-7。图1-7实时更新数据第1章绪论1.1数据的采集和清洗1.1.2数据的清洗当我们完成了数据的采集,可以看出网上的数据实际上是纷繁复杂的,因此数据不是导入就可以使用的,还需要我们通过数据清洗来选出我们所需要的数据,这样做出来的数据可视化才有它存在的意义。数据清洗一般有三种方法:数据工具法、高亮排序法和函数法。图1-8成功导入的数据第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:工具数据法步骤一:选中想要数据清洗的完整数据表,完整数据表见图1-9。找到菜单中的数据一栏,找到数据工具中的删除重复项,见图1-10。图1-10点击数据工具中的删除重复项图1-9完整数据表第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:工具数据法步骤二:点击删除重复项以后,会跳出一个窗口,在窗口里可以选择需要删除重复项的列,勾选“数据包含标题”选项,可以显示数据列的标题,见图1-11。点击确定会跳出一个提示框,表示删除重复项成功,见图1-12,删除之后的效果图见图1-13。图1-11选择并删除重复项图1-12成功删除重复项图1-13删除之后的效果图第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:高亮排序法步骤一:选中想要删除重复项的值,选择开始菜单里的条件格式选项,找到其中的重复项并点击,见图1-14,点击以后可以看到跳出一个设置格式的窗口,并且有重复项的数据格已经标红,高亮显示,见图1-15。图1-14选中想删除重复项的列图1-15设置单元格格式第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:高亮排序法步骤二:全选数据表,在菜单中找到数据一栏,点击排序和筛选里的排序按钮,见图1-16。图1-16对数据表排序第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:高亮排序法步骤三:因为刚才我们选择的是A列,所以我们要在弹出的排序窗口里添加列的主要关键字A列、排序依据为单元格颜色,次序选择刚才选择的颜色,把它们排在顶端,方便我们删除重复项,见图1-17。完成以后结果如图所示,见图1-18,随后可以根据自己的需要删除或修改。图1-17选择关键字和排序依据图1-18排序结果展示第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:函数法步骤一:新增一列用来放置COUNTIF()函数所计算出来的值,通过COUNTIF()函数能知道关键字的个数,当它的关键字个数大于1的时候,说明这一项有重复项,见图1-19。图1-19新增一列放置函数值第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:函数法步骤二:光标停留在B4内,输入“=COUNTIF(A:A,A4)”,按下回车,会计算出函数值,这个式子表示从A列到A列,计算有A4这个数据格里的值的单元格的个数。我们可以看到A4单元格中的值是“广西”,计算出来的函数值表示A列中单元格中的值为“广西”的单元格的个数共有几个,从而查找出重复项,见图1-20。图1-20计算函数值第1章绪论1.1数据的采集和清洗1.1.2数据的清洗:函数法步骤三:长按数据格右下角的方点下拉,可以依次计算每一行的函数值,计算完以后可以通过点击在菜单中找到数据一栏,点击排序和筛选里的排序按钮,随后进行关于函数值的排序,见图1-21。图1-21关于函数值对数据表排序数据可视化概述1.21.2数据可视化概述第1章绪论数据可视化是以图形、图表或其他视觉格式表示数据或信息。它能更容易地看到数据的趋势和模式。数据可视化通俗地来讲就是将抽象数字的集合转换为读者或者观众能快速掌握和理解的形状和形式。随着大数据的兴起,我们需要解释越来越多的数据。因此数据可视化不仅对数据科学家和数据分析人员很重要,而且对于任何职业中的数据可视化都很有必要。无论从事的是金融、营销、技术、设计或其他领域,基本都需要可视化数据。1.2.1可视化认知(1)柱状图柱状图是最常见的数据可视化图表之一,它是显示不同数据集之间的比较中,最简单也是最历史悠久的方法。柱状图包括水平x轴的数据标签,在垂直y轴上显示测量的指标或值。y轴通常从0开始,与图表中最大的测量值高度相同。图1-22柱状图一般来说,数据可视化基本用图表来进行展示。一些最常见的数据可视化图表包括但不仅限于:第1章绪论1.2数据可视化概述1.2.2数据可视化图表(2)折线图折线图适合二维的大数据集,旨在显示随时间变化的趋势、进度或变化。因此,当数据集是连续的,而不是充满断点的时候,折线图能发挥出它最大的效果。与柱状图相同,x轴表示数据标签,而测量值在y轴上。图1-23折线图第1章绪论1.2数据可视化概述1.2.2数据可视化图表(3)饼图饼图常用于统计,显示一个数据系列中各项的大小与各项所占的比例。饼图中的数据点显示为整个饼图的百分比。使用饼图,可以比较值、测量每个值的组成以及分析数据分布。饼图表示一个静态数字,这些在数字营销中特别有帮助,比如市场份额、营销支出、客户统计、设备使用情况等等。图1-24饼图第1章绪论1.2数据可视化概述1.2.2数据可视化图表除了以上阐述的三类最常见的可视化图表以外,还有很多其他的可视化图表,比如条形图、散点图、圆环图、旭日图、树状图、箱线图、雷达图、热力图等等,这些图表在后面的章节都会一一详细地介绍其绘制及应用(1)了解你的受众。要通过受众来确定你做数据可视化的风格和形式。(2)明确自己的目标。在构建数据报表、图表和视觉效果之前,必须设定好目标,才能有的放矢地去寻找数据,并制作可视化效果。(3)选择正确的图表类型。要成功有效地呈现需要的数据,必须为特定项目、受众和目的选择正确的图表。(4)利用色彩理论。在制作数据可视化的时候,需要保持整个数据可视化过程中保持配色方案一致,适用清晰的对比度来区分元素。1.2数据可视化概述1.2.3数据可视化原则第1章绪论Excel可以用图表对任何一组数据进行图形表示。图表是数据的可视化表示,Excel为使用者提供了许多图表类型,使用者可以选择适合所选数据的图表类型或者可以使用Excel推荐图表选项查看自定义为数据的图表,选择其中一种。通过选中想要做成图表的数据,点击推荐的图表,Excel会生成几种适合你的数据的图表,见图1-26,图1-27。第1章绪论1.2数据可视化概述1.2.4Excel数据可视化的形式图1-26推荐的图表图1-27插入图表接下来本书会用一个简单的例子进行Excel数据可视化形式的展示,用来直观地讲述没有数据可视化和进行数据可视化的区别。先来看没有数据可视化的表格,见图1-28,当表格数据量更多的时候,很难一眼看出这些数据的规律,因此要进行数据可视化。第1章绪论1.2数据可视化概述1.2.4Excel数据可视化的形式图1-28未进行数据可视化的表格选中表格,点击工具栏里的“推荐的图表”,选择合适的图表进行生成,能很轻松地完成图表的生成,见图1-29。第1章绪论1.2数据可视化概述1.2.4Excel数据可视化的形式图1-29数据可视化图表从图表中可以很清楚地看出每个季度的目标利润和实际利润的差距,这就是Excel数据可视化的形式,通过对特定数据进行合适的可视化处理,从而形成直观、一目了然的数据可视化形式,其他图表的数据可视化形式会在后面的章节中详细叙述。商务应用案例1.31.3商务应用案例1.3.1案例一:销售数据的预处理【背景材料】:本案例采用“2021年1—2月份商品零售数据”进行销售数据的预处理的演示,如图1-30所示。图1-302021年1-2月份商品零售数据第1章绪论1.3商务应用案例1.3.1案例一:销售数据的预处理【分析过程】:步骤一:首先对数据进行清洗,通过数据-数据工具-删除重复值,删除数据表中重复的值,见图1-31。图1-31删除重复值后的数据第1章绪论1.3商务应用案例1.3.1案例一:销售数据的预处理步骤二:对数据表进行缺失值查找和填充,在开始菜单中的查找与选择选项下选择空值,选出的空值对表格数据的表达不造成影响,即未发现重复记录,见图1-32。图1-32空值查找和填充第1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论