




免费预览已结束,剩余15页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
_2018年 6 月 7 日目录一、题目4二、数据4三、可视化工具(哪一种,选择原因)4四、可视化方案或可视化实现过程41、导入数据并进行规范化42、数据连接与整理43、将地理信息与地图进行结合54、设置相关参数55、可视化方案5五、可视化结果51、交战阵营可视化62、人口统计可视化83、死亡人数可视化94、时间顺序可视化115、人口损失情况可视化13六、体会15精品资料一、 题目在的可视化课程结束的同时中,本人也开始了数据可视化的大作业的工作。大作业是对前面学过的数据可视化技术的一个总结、回顾和实践。在开始设计前,本人回顾以前所学的内容,明确了本次作业设计所要用到的技术点,成功完成了可视化期末大作业。大作业要求从网络上下载一组数据(自行获取),选择一种可视化工具(Excel、Tableau、Matlab、Echarts等),设计一种可视化方案实现该数据的可视化,并做适当的数据分析(或挖掘)。二、 数据本次实验中,我设计的是关于第二次世界大战的数据可视化。原数据为两张表,分别存储了各个国家的人口牺牲情况与各个国家相互之间的战争具体时间、阵营、以及事件。其中国家数据来源于维基百科中World War II casualties词条下的表格,具体网址为:/wiki/World_War_II_casualties#cite_note-187。而关于时间、阵营与事件的数据来源于维基百科的World War II词条下方的信息,具体网址为:/wiki/World_War_II。两张表之间都以excel形式存在,在导入Tableau数据库的时候,建立两表的关系并对表进行说明。本人在建立过程前引入了一些编号变量,可以进行无视。下面是部分数据截图,具体数据见随文档上交的excel文件。三、 可视化工具(哪一种,选择原因)在这次的作业中本人选择的可视化工具为Tableau,选择该工具主要有以下原因:1、快速创建交互式绘图。使用Tableau的拖拽式界面,可以在几分钟内创建许多漂亮的可视化。这个界面可以操作无穷尽的变化,可以轻松解决项目。 2、交互式仪表盘。得到结果后可以简单的与结果进行交互,得到更加直观的结果。3、实时的连接,在对原数据进行修改后,简单的刷新数据库就可以对全部的可视化结果进行修改。4、提供多种的可视化方法,不仅限于Excel的简单图,Tableau可以容易的与地图进行连接,构建更加直观的图像。也可以直接选择不同的可视化方法,观察其中的优劣。 5、Tableau简单易学,可以快速掌握,简单的得出还算漂亮的图像。四、 可视化方案或可视化实现过程1、 导入数据并进行规范化选择导入excel文件,然后整理文件的格式,让系统可以正常识别。2、 数据连接与整理把excel表中的表和详细描述进行连接,然后清除掉多余或者无用的项,整理后的数据见下图:图4-1:交战情况表图4-2:国家状况表3、 将地理信息与地图进行结合把地理信息同具体的地图进行结合,在地图上解释原来数据中的地理信息。4、 设置相关参数设置相关的参数,通过参数来确认相关的阈值,以及形成数据桶,更好的进行分类操作。5、 可视化方案1)对交战国战前、战时、战后的情况进行可视化,使用颜色区别阵营。2)对交战国的人口与人口死亡率进行可视化,同时用不同的颜色标识死亡率大小。3)对交战国具体的死亡人数进行可视化,用颜色深浅标识人数多寡。4)对交战国总人口死亡情况进行可视化,设置阈值识别牺牲多寡,同时使用不同颜色标示不同阵营与状态的牺牲人数。5)对交战国具体事件与开战事件进行可视化,要求可以清楚的分辨开战时间的长短与具体事件的先后。6)对以上可视化内容,要求可以突出显示每一个交战国的具体情况。也可以根据阵营或其他分类方法进行突出显示。五、 可视化结果1、 交战阵营可视化使用了地图的模式,把每一个国家与对应的版图进行连接,其中比较麻烦的是有部分国家政治环境发生了一些变化,导致国家的消失(如苏联、英联邦和南斯拉夫)因此要使用其他的方法重现。下面是本人的阵营图界面:下面是具体的操作演示与分析:战前,1939年前的世界秩序,可以看到,一战中利益受损国从一战中走出,开始积极向周围小国开战,各大利益集团利益开始冲突。在欧洲,爆发了意识形态冲突,一战中失去了领土的战败国积极的对外扩张,法西斯注意在战败国中间传播。十月革命后成立的苏联也积极对外进行意思形态的输出,同时希望夺取原来属于沙皇俄国的遗产。西班牙意识形态斗争异常剧烈,从而爆发了内战。非洲,意大利积极对外扩张,希望一雪二十年前惨败与埃塞俄比亚的耻辱,而亚洲大部分利益都掌握在欧洲国家手中,对此不满的日本企图夺取东亚的利益,一场大战一触即发。战时,1939年到1943年的世界秩序,可以看到,轴心国势力达到顶峰,世界笼罩在黑暗之中,同时中立的美洲国家加入了世界大战。欧洲大陆几乎被法西斯占据,只有苏联仍然坚持,西班牙内战中右翼政府上台,欧洲形势到了最危急的时候。然而苏联力挽狂澜,在1943年完成了攻守互换。日本在东亚如入无人之境,横扫东南亚的英美荷殖民地,剑锋直至印度。然而日本低估了美国的工业能力,最后丧失了制海权。于此同时中国也加入了同盟国,正式加入了第二次世界大战。战后,1945年以后的世界秩序,可以看到轴心国势力完全磨平,剩余两大阵营瓜分了轴心的势力范围,并且在东亚开始了新一轮的意识形态竞争。同时因为战争导致欧洲国家力量减弱,各个殖民地独立行动也轰轰烈烈的展开了。欧洲战场,苏联力挽狂澜,意大利忽然反水,美英诺曼底登陆。轴心国势力别瓜分。正如丘吉尔所说,一道横跨欧洲的铁幕拉开了。但由于牺牲过与巨大,欧洲没有发生继续的战争。亚洲,日本投降,远东的利益又一次别掌握,然而由于宗主国实力的减弱,轰轰烈烈的民族解放运动在南亚开始了。而东亚则成了苏联与美国博弈的舞台,意识形态的战争在这里再次开战。2、 人口统计可视化在这个部分设置两个数据桶,把人口总数放入人口数据桶,死亡率放入死亡率数据桶,然后用大小标识国家人口多少,用颜色深浅标识死亡率高低,具体结果如下所示:下面是本人的操作与分析可以看到,下图中战争中别占领的国家,人口伤亡率普遍高于没有被占领的国家。尤其是德国东线战场上的国家,人口死亡率相当惊人。如下图所示,人口死亡率低于10%的国家明显标注出来,其中主要包括美洲国家、西线战场的国家、英国殖民地以及人口基数较大的国家。下图是人口死亡率高于10%的国家。主要包括苏联成员国,东线战场国家以及德国本身。结合上面的分析,可以得到,海上交战的国家人口死亡率较低,亚洲的人口大国人口因为人口基数较大死亡率次低,而欧洲战场上主要陆上交战国,如德国、俄罗斯、波兰,人口死亡率极高。3、 死亡人数可视化在该界面中主要标识了不同国家的具体死亡人口数目,使用颜色深浅来标识数据的大小情况。具体情况见下面的分析操作:下面是按照士兵战死数目,可以看到欧洲西线战场上双方死伤惨重,接下来就是远东的亚洲战场上,中国与日本这两个人口大国之间也是士兵牺牲数量较多的国家。下面是按照军事行动导致平民死亡的人数,可以看到大部分都是领土别入侵的国家与人口基数较大的国家。不过要注意的是轴心国的数据普遍偏小。下面是按照疾病与饥荒导致平民死亡的数据,可以看到排名靠前的都是人口基数大的国家或者欠发达国家。下面是士兵失踪数目,其中俄罗斯数据包括全部苏联失踪人数。失踪人员可能是临阵脱逃或者关如集中营死亡。这个数据真的有点玄乎,俄罗斯作为苏联一员军事行动中死亡的士兵约6百万,然而全苏联失踪人数竟然达到1千4百万。各国都是失踪人数大于牺牲士兵数,这真的很怪。下面是全体人口的死亡数,其中我把失踪人数也算入了死亡人数,按照大众的说法是不应该计入失踪人数的,但我还是加上了失踪人数,因为都过去那么多年了,失踪人员假如生还也应该死了,他们的人生因为战争而改变,到最后都生死不明,于是我加上了他们。从上述数据可以看出不同国家的具体人口牺牲数目使用颜色深浅可以让数据更加直观。同时这个数据也是很有问题的,轴心国平民中因为饥荒或者军事行动死亡的人数为零或很少,而且士兵失踪数目也过于巨大;这都是原本数据的不可信点。可以发现,法国、意大利人口基数大早早投降,因此死亡人口低。而苏联,波兰、中国德国等国家人口死亡率极高。因此,人口基数越大、战争持续时间越长、被入侵本土的国家人口死亡率就高。4、 时间顺序可视化这里可以通过时间来对二战中的大事件进行梳理,可以突出表达有关国家的具体事件。在事件部分采用了地图散点图,而持续时间用了树状图的平铺图。下面是具体的页面:如下图所示,可以高亮的显示具体国家的情况。下面就高亮了全部有关于轴心国方日本的时间情况:此时,只要再高亮同盟国方的具体情况,就可以看见具体的两国之间的情况了,鼠标放到点上会显示具体情况。还可以拖动右上角的时间条对时间进行梳理。下面是关于这方面的分析:上面是轴心国主要国家:德、日、意三国的各自作战情况图,可以看到,二战中的轴心国交战主要依据地缘政治,德国负责欧洲,意大利负责北非,日本负责亚太地区。详细情况可拖动时间表显示,具体情况可以在工作表中操作。5、 人口损失情况可视化按照可视化方案,设计了这一份人口损失情况的可视化。其中包括各国的具体情况与世界情况的对照,可以突出显示具体的国家,下图中高亮了中国的信息:具体界面如下图所示,左边是柱状图显示的死亡率图与死亡人口总数图,其中超过阈值(12%的人口死亡率与1百万的人口死亡数)的标记为红色。右边是全世界不同国家的具体情况,用不同的颜色表明了不同的阵营。下面是具体情况的分析报告与演示,先展示全部轴心国死亡人数的情况,可以看到,左边的人口除德国以外没有其他国家,再看右边,人口死亡数与人口死亡率中考前的两个深灰色原点是德国和日本,而平民死亡人数都没有高亮的圆圈。再展示全部同盟国死亡人数的情况,可以看到,左边的人口中标红的为中国、印度与美国。再看右边,人口死亡数与人口死亡率中普遍较低,而平民死亡人数除最高的中国之外没有其他较高的数据点。最后是苏维埃联邦和其他别占领的国家,他们在二战中付出了巨大的牺牲,其中平民死亡与人口死亡率都是排在前列。1945年8月5日,战争结束。这场战争中交战方都付出了巨大的代价,特别是苏联、同盟国主要国家、德国以及被轴心国占领的国家;也给世界带来了巨大的灾难,希望人类引以为戒,战争不再发生。以上就是全部我的全部相关分析。 六、 体会在本次的期末作业中,我根据网上收集的二战数据,完成了关于二战情况的可视化作业,虽然较为简单,同时并不完善,但是我也在实践中收获了很多,得到了以下体会:在搞大作业的时候,我才开始学习tableau,由于对于这一款软件的不了解,没有使用有关算法进行数据挖掘,只是简单的把数据可视化了而已。在实战中,主要参考了给的模板例子,同时查阅网上的资料,在试验中掌握技术,最终得到了成果。同时我也了解了数据一致化的重要性,从晚上得到的数据千奇百怪,总是有种种问题。在本次作业中主要遇到的数据不一致问题有国家名称的不统一,事件城市名称多值,以及人数栏中出现字符串等,都要进行修改,因此数据的一致性是相当重要的。最后体会最深的还是认识到自己能力与软件的能力。本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 无锡学院《英语国家社会与文化一》2023-2024学年第二学期期末试卷
- 唐山海运职业学院《随机过程及其应用》2023-2024学年第二学期期末试卷
- 天津铁道职业技术学院《药理学》2023-2024学年第二学期期末试卷
- 山东省武城县联考2025届初三第二学期5月练习语文试题试卷含解析
- 上海市松江区第七中学2025年初三(下)第一次中考模拟英语试题含答案
- 山东英才学院《建筑识图与制图》2023-2024学年第二学期期末试卷
- 宁夏艺术职业学院《医学影像设备安装与维修学实验》2023-2024学年第二学期期末试卷
- 内江职业技术学院《生物医用材料》2023-2024学年第一学期期末试卷
- 西安市东仪中学2025年高三八校联考数学试题(四)含解析
- 宿州职业技术学院《音乐剧目排练与创编》2023-2024学年第二学期期末试卷
- 大车司机劳务协议书
- 知识产权监管培训课件
- 油田节能降耗技术-全面剖析
- 广西钦州市钦州港经济技术开发区中学2025年初三第二学期第一次区模拟化学试题含解析
- 全国统一卷试题及答案
- 银行防抢防暴课件
- 水电工程验收单
- 妇科护理标准化管理
- 兰州2025年中国农业科学院兰州畜牧与兽药研究所招聘16人笔试历年参考题库附带答案详解
- 《哈哈镜笑哈哈》名师课件2022
- 冷却塔使用维护说明书
评论
0/150
提交评论