数据可视化在中医用药分析中的应用及改进策略研究_第1页
数据可视化在中医用药分析中的应用及改进策略研究_第2页
数据可视化在中医用药分析中的应用及改进策略研究_第3页
数据可视化在中医用药分析中的应用及改进策略研究_第4页
数据可视化在中医用药分析中的应用及改进策略研究_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章前言1.1研究背景可视化的理论思想诞生于15至17世纪,自此人们对数据可视化的早期探索正式开始;18世纪,数据可视化实现了初期的发展,各类图标在人们的视野中出现;19世纪前期,由于工业的迅速发展,人们开始发现数据在经济发展中的作用,19世纪后期,随着第一次工业革命,数据可视化收到了人们广泛关注,它的发展迎来了首个黄金时期,图表和图形等被广泛应用到人们的生产与生活中;20世纪前期;早期的数据可视化表达方式已经满足了当时的需求,因而对于图表、图形表达的研究没有进一步发展下去;20世纪中后期直至今天;科技迅猛发展,以信息科学与技术为代表的第三产业的不断发展,数据可视化技术展现出新的生机与活力,开始进入高速发展阶段,并取得了明显进步,越来越多的应用到了生产与生活中来。目前,数据可视化的展示方式已超过30种,每一种特定的方式都有它的用处。正因为数据可视化的方法不断发展进步,我们已经不局限于柱状图和饼状图。数据可视化有很多好处,但他们往往因为缺乏理解而有所不足。需要我们进一步进行研究和探索。随着医学的不断发展,我国传统中医得到了长足发展,不断融入最新的科学技术,与时俱进。数据可视化技术在中医用药分析中起到了极大的作用,越来越多的中医用药数据分析通过数据可视化来实现,简化步骤、提高效率,是促进中医进步的重要动力。1.2研究意义随着不断增长的信息量,要求人们需要具备更加快捷的信息处理方式,所以人们对数据可视化的需求也大大增加。如今,有三十多种可视化数据的方式,每种特定方式都有其用途。随着可视化方法的不断发展,我们不再局限于条形图和饼图。数据可视化有很多好处,但是由于缺乏了解而常常受到限制。在某些情况下,同一张上的图表上内容过多可能会导致整个图表纷繁纷杂,不便于人们直观的去理解和使用。我们可以采取用的呈现数据的方式有很多,但在大多数情况下只有少数几种适用。本文从数据可视化技术研究和发展的背景入手,对数据可视化技术的国内外研究现状进行了介绍,对数据可视化与中医的相关性进行了分析,对近些年来所实现的成果做了介绍。通过R语言实现数据可视化技术在中药分析中的灵活、适当的应用,以提高可视化技术在中药分析中的使用率,为知识的传播与交流提供新的途径,增强知识密度,提高决策和解决问题的能力。探索中医药与可视化的相关性,分析其在中医药领域的应用,实现可视化技术与中医药分析的更好结合,为中医药的发展提供更多线索,研究多样的数据可视化展示方式,为中医可视化技术的发展提供技术支持。1.3国内外研究现状数据可视化技术是为了改进科学计算和辅助处理大量数据而诞生的,随之创建了第一个数据可视化视图,伴随着信息技术的快速发展,产生了大量的没有经过科学处理的数据,由于信息过于冗杂,数据大都没有办法获得适当采用。1987年,美国科学基金协会在一次专题讨论会上提出“科学计算可视化”理论,一门崭新学科就此诞生,从此,国内外掀起了数据可视化的热潮,国内也逐步把数据可视化技术与各行各业相联系,中国传统中医也顺应时代发展的潮流融入到了数据可视化的领域中来。诺维萨德大学(2019)进行了对Pacs设计中数据可视化技术的实证研究[1]。圣保罗大学(2018)在信息可视化领域的发现:用于距离信息的用户辅助投影技术[2]。俄勒冈大学(2018)的研究人员讨论了数据分析用于模拟、可视化和数据分析的数据简化技术方面的发现[3].纽约大学(2018)以图书馆为主导开创了“数据可视化诊所”,开创了数据可视化技术中的新概念、新思路[4]。孟洪宇等人(2018)从数据可视化技术的发展历程入手,对信息和知识可视化在本源、理论根本、目的、数据可视化目标、描述目标、方法、参与者类型和互补方法等方向进行对比[5]。单琪媛等人(2019)根据近年来国内和国际中药质谱可视化分析技术的研究资料,对质谱数据的可视化技术包括在中药分析中的具体应用进行详细介绍[6]。许茜等人(2019)基于当前大数据的发展现状对医学数据分析的可视化进行了进一步的探索。杨慧等人(2018)从医学可视化图像与可视化技术的专利目前的发展状况入手对医学图像可视化技术进行介绍,并结合各阶段专利申报量和重要申报人探究了该项技术的专利情况,并对专利的研究前景和研究趋势做出总结[7]。

1.4论文主要研究内容本文的主要研究内容是对数据可视化的研究背景、研究意义和种类进行讨论,对常用的展示方式进行讨论,进一步探索在将数据可视化技术应用到中医用药分析过程中对可视化展示方式的选择,在综合先前的研究结果的基础上,将调查研究法、学术研究法、信息研究法和实验法等研究方法与文献研究法相结合,通过对中医用药分析的数据可视化展示方式进行研究,使得人们掌握和分析中医用药数据更加直观、便捷。1.5关键问题及解决方法本文关键问题是如何在实验过程中选择合适的数据可视化的展示方式和如何对选择的可视化展示方式进行合理的处理,选择合适的数据可视化展示方式并不容易,每个图表都有其优点和局限性,同一类图表中也会有不同的分类,需要我们恰当的应用。例如,柱状图分为一般柱状图、分组柱状图、堆积柱状图、横线柱状图、双向柱状图等。通过对中医用药分析中产生的数据进行分析,采用不同的数据可视化展示方式,比较不同数据可视化展示方式的优缺点,着重注意图表的细节部分,采用合理的处理方式,提出相应的改进的策略与方向。1.6论文组织结构本文总共分为6个章节,第1章是论文的前言,详细的介绍了本文的研究意义和背景说明本文完成的意义在于探索中医药与可视化的相关性,并分析其在中医用药范围内的应用及思想理论成果,目的是为我国传统中医发展和进步探索更多的新思路、新技术、新方法;第2章是数据可视化与中医的相关性分析,详细介绍了数据可视化在中医中的应用,进行数据可视化和中医的相关性分析为下一章展示方式的分析做了理论准备;第3章进行了数据可视化分析中常用展示方式的优缺点对比,通过举例直观的展示了不同展示方式的效果与优缺点;第4章是基于R语言数据可视化技术的实现,通过R语言实现中医用药数据分析的可视化展示,对采用的可视化展示方式进行分析和总结。第5章是数据可视化展示方式的改进策略研究;最后是结语,总结全文并提出了未来的展望和可视化技术的展示方式在今后的发展方向。第2章数据可视化的介绍以及在中医领域的应用2.1数据可视化技术2.1.1介绍数据可视化技术是指通过信息技术,以图表的形式将数据简明的呈现出来,并进行交互处理的理论、方法和技术[8]。它可以通过图表对大量的数据进行分析和处理,体现信息模型、变量之间的关系和变化方向,方便人们对信息的获取和利用,便于人们快速的进行决策,加强人和各类数据的联系,探究包含在其中的客观规律。数据可视化技术中最根本的观念是把数据库中的每一项拆分为单个变量,变量的总和组成一个可视化的图表。2.1.2数据可视化技术的主要特点(1)人机交互,读者可以更加便利地与数据进行交互和处理;(2)多维展示,可以从多个维度看到目标变量的属性,并且可以根据他们各自的特点,对其归类、排列、组合和展示[9];(3)可视化展示,数据可以根据需求制作成不同样式的图表来进行展示[10]。2.2数据可视化技术和中医的相关性分析数据可视化技术中的概念和方法与中医有着密不可分的联系:数据可视化技术能够对海量的中医信息进行分析,进而详细的分类和整理,把医学数据进行可视化展示,有利于更好的对医学信息进行解读和对未来将会产生的信息进行估计。同时中医在我国发展历史悠久,信息的体量也会十分庞大,体系之多,信息之杂,是人无法简单的用肉眼去进行辨别分析的,给医学者进行医学研究和用药分析等带来了极大的困扰,但是通过采用数据可视化技术,为我们研究庞大信息中的内在关联和其所含的价值提供了便利,使中医用药更加合理和适当。数据可视化技术对研究对象知识类型的分类。第一类是显性知识型,第二类是隐形知识型。他们在中医研究中起到了不同的作用,第一类为中医基本原理等的掌握,望、闻、问、切四种诊察疾病方法后信息的收集与整理,用药的判断和采纳,遣方用药思路,经络治疗配穴方法等,数据可视化技术可以将数据转化为方便人们理解的图形,便于医者进行信息理解和新思路的开创。第二类为我国中医的传承起到了重要作用,中医在历史经验和思路中存在着大量的隐性知识信息,而这些宝贵的信息由于太过庞大不利于我国中医的传承、发扬与进步,数据可视化可以把第一类知识类型转化为第二类知识类型,提高人们对中医隐形知识的关注度,为中医的传承提供了新途径、新方法,进一步方便了医学研究者的对病情的分析与判断。我国的传统中医在不断的发展中形成了规模大、内容完善的理论体系,包含了复杂且繁多的知识与信息。例如,传统中医基本原理所包含的数据可视化技术的对象以及与之相关联的基本概念,存在着大量的一维信息;传统中医的阴阳调和中又蕴含着二维信息;脏腑位置以及体表投影的相关性展现的是统一体的观念,同时也从另一方面展现了三维映射的关联;中医基础原理中所涉及到的的精、气、血、津液学说等都是多维信息的表现。2.3数据可视化技术在中医中的应用Flash的使用使中医藏象理论系统的可视化教学方式发生了改变[11];中医藏象理论历史悠久,其理论渊源于我国传统文化,具有非常丰富的历史文化内涵,内容十分广泛,严谨又复杂。Flash能够生动形象的展示中医理论内涵;通过对教学方法的不断研究与创新改革教学方法使中医能够生动、轻松地理解“藏象理论”的抽象性和含糊不清的知识,使它更具有准确性和系统性。基于CiteSpaces对中医体质学说知识图谱进行可视化分析和展示[12]:它的目的是对“中医体质”进行系统的文献计量学和视觉分析,探寻40多年来中医体质的发展变化情况,对需要我们去重点关注的方向和未来的发展趋势进行研究与讨论。采用的方法主要是以1975年至2017年CNKI收集的所有相关文献为对象,进行定量分析。同时,使用CiteSpace5.1对文献中的机构和关键字进行共现分析,并绘制相关的视觉图。结果,总共查询到了了5882篇文章,通过定量分析,访问了一个高产机构和代表性研究人员及其团队,通过视觉分析,“中医体质识别”,“糖尿病”和“危险因素”是其中出现次数最多。结论:图谱引领了这一领域的发展趋势,并找到了研究热点,研究疾病的治疗方法和危险因素是今后体质研究的重要方向。中国古代中医传统针灸铜人的可视化探索[13]:3D激光扫描为解决针灸铜人等文化遗产单一的数字保护手段,经验不足,传播力弱的问题提供了新手段新方法,这种方法又分为3D可视化和VR技术的数字化方法。以穴位青铜针灸举例说明,它第一次将3D激光扫描技术用于数据采集和3D模型的建立。其次,XML语言被应用于中医用药知识的表现和储存。同时,他们对二次误差度量和渐进网格算法进行优化用于自动生成针灸铜人多分辨率简化模型。最后,使用Unity引擎研发了一套VR针灸青铜人互动显示系统,可以实现3D场景中穴位,经络,常见病等中医知识的快速可视化和互动查询,为历史文物和非物质文化遗产的数字保护和传播提供参考。基于脉搏脉冲信息获取的中医脉诊数字化与可视化研究[14]:脉诊信息模糊不清,无法量化和主观判断,对保持中医诊断的客观性造成了困难。目前,中国传统脉息诊断仪的类似特征是在一维记录脉压波动信号。因此,获得的脉冲诊断信号的特征参数不足以完全体现传统脉冲中包含的所有信息。在文献综述和脉搏诊断经验总结的基础上,本研究运用现代科学技术手段,研究了中医脉搏诊断信息采集的关键技术。本文突破了仅从“脉冲位置和脉冲数”分析单个信号特征参数的缺点。在理论和技术的指导和支持下,成功实现了多维脉冲信息的同步采集,并着重强调了“脉冲形状和脉冲电位”的信息采集和表达。在数字仿真和重构四个脉冲诊断属性的基础上,触觉信息可视化的阶段性工作已经初步完成。第3章数据可视化的主要展示方式和中医药特点分析3.1引言数据可视化展示是指通过借助抽象化的技术手段,将复杂的数据用图表的方式呈现,有效的可视化背后的主要原则是能够突出你要表现的核心问题,根据观众的需求和接受程度,对数据实现精确的呈现,并且传造出能够清晰传达信息的而可视化结果,本章的主要工作是进行数据可视化分析中常用展示方式的对比和优缺点分析。3.2基本图形分析1.条形图,又称条形统计图优点:可以清楚的反映数量,便于比较。缺点:统计的类别比较少,比较单调。简介:条形图是长度的单位,代表着数量的多少,根据数量的多少绘制成不同长度的直条,然后按顺序排列这些直条。从条形图可以很容易地看到各种数字。条形图通常称为条形图,也称为条形图或直条形图。分类:条形统计图分为:单式条形统计图和复式条形统计图,前者只表示1个项目的数据,后者可以同时表示多个项目的数据。频数:频数是数据分布在不同区域内的个数。频率:频数与数据总和的比例为频率,频率×100%就是百分比。举例:图3-1条形图2.饼图优点:能够清楚的表示各个部分占总体的比例情况。缺点:肉眼对面积大小不敏感。简介:饼图是统计学中的常用图表,往往只有一个数据系列,区域的大小代表了再综合中的比率。分类:饼图和三维饼图;复合饼图和复合条形图;单独的饼图和单独的三维饼图:单独的饼图显示每个值相对于总值的大小,同时强调每个值。分离的饼图可以以三维格式显示。这样,扇面可以手动拉出。举例:图3-2年龄分布饼图3.直方图优点:更直观的传递过程质量状态信息;在对质量的变化进行研究之后,我们可以控制过程的状态,并决定将我们的精力更多的集中在提高质量上。缺点:无法轻松的找到问题的重点现象。简介:直方图,又称质量分布图,是一种统计报表图形,其数据分布由一系列不同高度的垂直条纹或线段来表示。横轴常用于表示数据的类型,纵轴常用于表示数据的分布。直方图是对连续变量概率分布的估计,由卡尔·皮尔逊首次提出。这是一个条形图。要建立直方图,首先要分割数值范围,简单地说就是将整个数值范围划分不同的区间,然后计算每个区间中数值的多少。直方图也可以被归一化以显示“相对”频率。举例:图3-3直方图4.树状图优点:比较直观,易于理解。缺点:不适用于较大范围的情况。介绍:树形图,也叫树状图。树图是数据树的图形表示形式,它以父-子层次结构组织对象。分类:为根据分支,关系可以被表示,其具有二维和三维维度。数量分类学中用于表型分类的树形图称为现象图,与系统推理相混合的树形图称为分支图进行区分。表型树图是根据群体分析绘制的,而系统树图是由计算机根据模拟的假设字符进化方向绘制的。举例:图3-4聚类树状图5.网状图优点:明确表达事物之间的逻辑关系,选定关键工作和关键路径。缺点:进度状况不能一目了然,绘图难度和修改工作量很大,应用要求高,绘图识别困难。介绍:网状图是一种具有网络形状的图形化模型,因此被称为网状图。网状图通常用来表示事物之间的联系程度。分类:双代号网状图使用箭头线表示一个活动,活动的名称写在箭头线上。箭头表示活动的结束。单代号网状图用圆圈表示单个网状图中的一个活动,并在圆圈中写上该活动的名称。箭头线用于表示相关活动之间的前后次序,没有其他含义。由于它的活动只能用一个符号表示,所以它被称为单代码网状图。举例:图3-5网状图3.3中医药信息特点分析我国中医药信息具备三大特点:1.传统性我国传统中医发展历史悠久,数量巨大,大量的中医用药数据在历史的发展中得以保留,自战国时期直至建国以前有记录的中医药书籍就超过一万多种,而在民间广泛流传的不同时期的不同版本更是接近四万种,同时还存在着无法实际考证的书籍,如此庞大的数据体量带来的是难以考证和无法处理。中药药方分析困难,对未来中医发展的延续性造成了阻碍。2.民族性我国有56个民族,各个民族都在长期的历史发展中形成了各自的文化,中医药也在各民族的努力中不断发展,但恰恰由于各民族文化差异,中医用药方法也出现了差别,收集整理工作成为了极为重要的部分。3.世界性随着世界医疗水平的发展,我国传统中医进入到了国际化的阶段,中医用药数据需要经过合理的处理和加工才能更便于国际化的发展。3.4小结上述展示的可视化展示方式中,最常用的是条形图和饼图,它们的结构都十分简单,即使读者不具备较高的知识水平也能够轻松阅读。结合我国传统中医目前的发展现状,根据上述几类数据可视化展示方式的优缺点分析,大多数可视化方式都能够应用到中医用药分析中,但是根据中医用药数据的特点,比较适合采用的有条形图、网状图、树状图等,它们既能对中医用药中的数据比例、使用频次进行展示,又能明显的展示出各类中药材之间的联系。第4章基于R语言数据可视化技术的实现4.1引言数据可视化的本质是将大量的数据进行合理的规划和处理,使数据的表现形式由复杂到简单,其根本意义是利用数据做出决策。可视化的工具种类较多,本文是基于R语言进行数据可视化技术的实现,通过R语言实现中医药数据分析的可视化展示。4.2可视化工具介绍R语言被使用于统计计算、绘制图表、数据挖掘的软件中,它的创始人是新西兰奥克兰大学。目前由R语言开发核心团队开发,在数据统计分析、绘图等领域的应用广泛。R软件的语言环境能够为用户的个性化设计提供极大的便利,并且是免费、开源的软件,再国内和国外广受欢迎。R语言的三大绘图系统:基本绘图系统(BasePlottingSystem):需要事先计划;能够直接地及时反映绘图与分析数据的逻辑图+修饰常用于绘制2D图。Lattice绘图系统(LatticePlottingSystem):简单的成图方式适用于观察变量之间的交互:ggplot2绘图系统(ggplotwPlottingSystem):能够把图和数据之间进行分离。4.3实验数据本实验数据来源于中药抗病毒方药数据平台,包含726种中药药品,36种针对病毒性肺炎的方剂,本文选取其中15种药品进行数据可视化展示,根据他们的药物组合、关联规则、药物频次,以柱状图、网状图、树状图为例进行可视化分析。表4-1关联规则No.中药名称置信度1桔梗,金银花,杏仁->连翘12金银花,杏仁,桔梗->连翘13石膏,杏仁->麻黄14麻黄,石膏->杏仁15石膏,甘草,杏仁->麻黄16石膏,杏仁,甘草->麻黄17麻黄,桔梗->杏仁18麻黄,甘草->杏仁0.93759甘草,麻黄->杏仁0.937510桔梗,甘草->杏仁0.90909111甘草,桔梗->杏仁0.90909112桔梗,金银花->连翘0.913金银花,桔梗->连翘0.914前胡->杏仁0.88888915石膏->麻黄0.88888916石膏->杏仁0.88888917生石膏,金银花->杏仁0.88888918麻黄,生石膏->杏仁0.88888919陈皮->金银花0.87520生石膏->杏仁0.85714321鱼腥草,生石膏->杏仁0.85714322生石膏,鱼腥草->金银花0.85714323金银花,大青叶->连翘0.85714324甘草,石膏->麻黄0.857143表4-2药物频次No.中药名称用药频次1杏仁352甘草283金银花274麻黄255连翘246桔梗197鱼腥草168生石膏149大青叶1010前胡911北沙参912板蓝根913石膏914葶苈子915陈皮84.4实验过程本文主要采用的工具包主要有tidyverse包、ggplot2包、networkD3包、stringr包、picante包、ape包。1.柱形图:name2<-"pinci.txt"pinci2<-read.table(name2,sep="\t",header=1)view(pinci2)data_pinci2<-data.frame(pinci2)data_pinci2<-data_pinci2[c(1:15),]ggplot(data_pinci2,aes(data_pinci2$药物名称,data_pinci2$频次))+geom_bar(stat="identity",aes(fill=data_pinci2$药物名称))+labs(x="药物名称",y="频次",fill="药物名称")ggsave(file="药物频次.png")2.网状图:name_guize<-"guize.txt"guize1<-read.table(name_guize,sep="\t",header=1)#View(guize1)data_guize<-data.frame(guize1)data_guize1<-data_guize%>%mutate(长度=str_length(data_guize$药物关联规则),药物1=str_sub(data_guize$药物关联规则,1,3),药物2=str_sub(data_guize$药物关联规则,1,3),药物3=str_sub(data_guize$药物关联规则,1,3),关联药物=str_sub(data_guize$药物关联规则,1,3))#view(data_guize1)data_guize1$药物1[c(1)]<-c(str_sub(data_guize$药物关联规则,1,3)[c(1)])for(iin1:length(data_guize1$长度)){if(data_guize1$长度[i]==22){data_guize1$药物1[c(i)]<-str_sub(data_guize$药物关联规则,1,3)[c(i)]data_guize1$药物2[c(i)]<-str_sub(data_guize$药物关联规则,7,9)[c(i)]data_guize1$药物3[c(i)]<-str_sub(data_guize$药物关联规则,13,15)[c(i)]data_guize1$关联药物[c(i)]=str_sub(data_guize$药物关联规则,19,22)[c(i)]}elseif(data_guize1$长度[i]==16){data_guize1$药物1[c(i)]<-str_sub(data_guize$药物关联规则,1,3)[c(i)]data_guize1$药物2[c(i)]<-str_sub(data_guize$药物关联规则,7,9)[c(i)]data_guize1$药物3[c(i)]<-NAdata_guize1$关联药物[c(i)]<-str_sub(data_guize$药物关联规则,13,16)[c(i)]}elseif(data_guize1$长度[i]==10){data_guize1$药物1[c(i)]<-str_sub(data_guize$药物关联规则,1,3)[c(i)]data_guize1$药物2[c(i)]<-NAdata_guize1$药物3[c(i)]<-NAdata_guize1$关联药物[c(i)]<-str_sub(data_guize$药物关联规则,7,10)[c(i)]}}#View(data_guize1)data_guize2<-tibble(药物=list(c(data_guize1$药物1,data_guize1$药物2,data_guize1$药物3)),关联药物=list(rep(data_guize1$关联药物,times=3)))#View(data_guize2)networkdata<-data.frame(data_guize2$药物[[1]][!is.na(data_guize2$药物[[1]])],data_guize2$关联药物[[1]][!is.na(data_guize2$药物[[1]])])simpleNetwork(networkdata,zoom=T,fontFamily="黑体",fontSize=20,width=1200,height=500,linkColour="black",nodeColour="black",linkDistance=200)3.树状图:data_shu<-data_pinci2view(data_shu)s(data_shu)<-data_shu$药物名称data_shu1<-hclust(dist(data_shu),method="median")plot(data_shu1,hang=0.3,cex=1,xlab="药物名称",ylab="频次",main="聚类树状图")plot(as.phylo(data_shu1),type="fan")4.5实验效果柱形图图4-1柱形图2.网状图图4-2网状图树状图图4-3树状图4.5实验总结(1)柱状图:对这十五种药品的使用频次采用的是柱状图的表现形式,并采用了不同的色彩使它们之间的差异更加明显,可以直观的看出杏仁的使用频次最多而陈皮的使用频次最少。(2)网状图:对这十五种药品的关联规则采用的是网状图的表现形式,呈网状表现出来,很容易让人发现其中的焦点,可以直观的看出与杏仁的相关的药品最多而与陈皮、大青叶、前胡、黄麻相关药品的使用频次最少。(3)树状图:对这十五种药品的频次采用的是聚类树状图的表现形式,呈树状表现出来,很容易让人对其进行分类,可以直观的看出哪几类能够分为一组,同时可以根据自己的需求进行分群。柱状图和树状图擅于展示各类药品之间的数量关系,能够十分简洁明了的将药品的频次表现出来,通过不同的颜色加深视觉效果也进行了引导性的分类,柱状图由于自身的简洁性也便于进行标注,方便对比,具有普适性。网状图则擅于表现各个药品之间的关联程度,但是较为复杂,需要具备一定的知识背景。实验所展现的可视化展示方式,是十分基础的展示方式,仅能够满足人们的正常使用,如果对数据可视化展示方式有更高的要求则需要进一步的优化。数据可视化展示方式改进策略研究5.1引言可视化展示方式的选择决定能否将数据良好的呈现,而一个好的可视化展示方式,在科技快速发展的今天也会逐渐暴露出缺陷,可视化视图的改进就变得尤为重要,一个好的视图能够吸引人们的注意力,促进深入理解,快速帮助人们进行决策,本章从可视化视图入手进行改进。5.2改进策略1.对比数据可视化使比较更容易,并使我们能够直观地看到两个不同的数据集之间的差异。但是仅仅将两张图表并排放置进行比较并不一定能实现这个目标。在实际操作中,它可能会变得更加混乱。方法:(1)尽可能地包括零基线。从零基线开始虽然不是很折线图的必备要素,但如果它提供了更多的比较背景,则应该包括在内。如果数据中呈现出的较小波动是有用的,可以通过截断比率来凸显差异。(2)选择最优的可视化展示方式。如果对视觉一致性有一定的需求,需要让读者更方便的进行比较。我们就需要从折线图、条形图等便于比较的图表中进行选择。我们要始终把便于读者的比较和了解放在第一位。图4-4饼图和条形图效果对比2.颜色在可视化展示中,颜色是突出视觉效果的良好工具。需要我们恰当的使用,避免分散注意力,误导读者的情况发生。我们要灵活的将颜色运用于可视化展示方式的设计之中。方法:(1)同一类型的数据尽量采用近似的色彩表示。如果您在条形图上描述一年之中各个月份的销售情况,应当使用相对单一颜色。但是如果你把去年的销售和今年的销售在分组表中进行比较,应该每年采用不同的颜色。同时还可以使用红色等鲜艳颜色来突出重点。(2)要注意数字颜色的使用。红色代表一般代表负数,绿色则一般代表正数,要注意此类颜色在日常中的使用场景。(3)确保颜色之间能够形成鲜明对比。如果颜色太相似,例如:黑色与深褐色,藏蓝色,则很难去做区分。反之,减少采用色彩形成鲜明对比的组合,如白色、黑色或绿色、紫色。(4)选择适当的颜色。有些颜色的显示效果比其他颜色更为突出,它们所展示的数据的重要程度就出现了差异。我们一般会将颜色的使用限制在六种以内。图4-5不同色彩饼图效果对比3.复制数据要与副本相结合,为图表的建立提供帮助,在大多数情况下可视化与复制的相互影响的。方法:不需要过多解释。子标题、标注和图表标题不要与副本中已经出现的事实重复,图表和图标的标题要清晰简明,便于阅读。减少不必要的深刻和复杂。(2)正确使用标注。标注存在的意义不在意填补空白。应当正确利用标注突出相关信息或其他背景信息。避免使用分散注意力的字体或元素进行标注。需要强调的部分,采用粗体或斜体文本其中的一种达到着重强调的目的。图4-6不同标注效果对比图5.3小结可视化的展示不以复杂精美为目的,而是要以突出想要表现的主题为原则,以简洁大方、清晰明了为目的,可视化展示方式的改进要具有针对性,要深入理解数据之间的关系,选择合适的图表,对图表中字体颜色的选择也要经过考量,在正确的理解数据后,就可以决定那种可视化方式更加合适。结语随着大数据的不断发展,人们对数据的依赖程度越来越高,日常所接触的数据量也越来越大,不论实在哪一个行业数据可视化技术将会尤为重要,中医是我国的传统医学,是我们宝贵的财富,我们要采取更加先进的技术手段为中医的发展提供便利。数据科学家面临的最大问题是如何创造价值,并根据每天流入的大量数据做出决策[4]。数据可视化可以在中医用药数据挖掘中加深对中医药分析的理解,增加对中医用药组合和品读分析的速度和深度。而R语言作为一个开源的软件,容易获得各种优秀的包,具有强大的数据分析和绘图功能,为人们对数据的处理和数据可视化展示提供了极大的便利。本文以在中国抗病毒方药数据平台上搜集的数据为例,做出了柱形图、网状图、树状图三种图形,图形简洁明了,能让人迅速抓住关键,做出判断。同时在改进策略中提出了多种方式对可视化展示方式进一步优化,人们根据自己不同的需求设计个性、简洁的图形。本文仍然存在着许多不足之处,例如:可视化的展示方式不够美观精细,存在着许多瑕疵,采用的可视化展示方式不够全面,仍需要不断地探索。同时,数据可视化展示方式受个人主观因素影响较大,如需具有普适性,还需要进行广泛而深入的调查和研究。

HYPERLINK电脑文件整理懒招从来都是不会经常整理文件的,不过时间一长,众多的文档分布在硬盘的各个角落,用目录进行整理保存,工作量大、查看起来也不方便且还会浪费不少的磁盘空闻;用压缩工具打包,尽管可以节约空间但是却无法直接编辑修改或查看压缩包中的文件。这些招,懒人怎么会用,他们自有妙招!再多再乱的文件也能整理得井井有条,关键是不费力哦!

懒招1,自动提取乱中取胜

小张起初将照片、Office文档、电影、音乐等文件一股脑地存放在某一个磁盘分区,刚开始文件少使用起来倒也方便,但随着时间的推移,文件数量剧增,每次找所需的文件都要瞪大眼睛,不过有了MY文档管理器(下载地址:)就不用担心了。

第一步,下载MY文档管理器,解压到任意目录,直接双击其中的可执行性文件即可使用。依次单击“节点操作→添加节点”,分别添加多个节点,如“办公文档”、“电影”等分类,这样做的目的是方便归类。

第二步,在小张的F盘中的TEST目录下有众多的RM、MP3、JPG、DOC、TXT格式的文件,现在他要把JPG格式的文件提取到“照片”类别中。依次单击“系统配置→文件过滤”选项,打开Dialog对话框,输入“*.doc”,单击“添加”按钮,意思是过滤掉所有类型为“.DOC”的文件。然后按照同样的方法,将“*.txt”、“*.rm”、“*.MP3”一一添加进来。

第三步,双击左侧窗格中的“照片”节点,然后依次单击“记录操作→导入记录树”命令,在打开的对话框中单击浏览按钮,打开“F:\test”目录,单击“确定”按钮之后就可以将格式为JPG的文件提取出来并添加到“照片”节点中了。

懒招2,不同的电脑统一的管理

小张是电爱的Fans,工作之余常常为杂志写稿,他写完的和正在处理的稿件一般都存在一个稿件文件夹里。不过时间一长,家里的电脑(PC1)和单位的电脑(PC2)上都有这个文件夹。时常需要通过移动硬盘(U盘)在两台电脑之间传递,使用和管理都很不方便。不过他现在用优盘就可以统一管理了。

第一步,将上文提到的那个MY文档管理器解压后直接拷贝到优盘上。把优盘插到PC1上,并运行软件,依次单击“记录操作→导入记录树”命令,在随后弹出的对话框中设置好“稿件”文件夹的根目录,将“导入深度”设置为“5”,单击“确定”后,稍等片刻,软件就把PC1上的“稿件”导入到MY文档管理器中。

小提示:通过这种方式导入到程序中的仅仅是文件的路径、文件名等属性信息,并不是文件本身。

第二步,把优盘插到PC2上,按照同样的方法导入PC2上的“稿件”文件。以后要编辑“稿件”里的文件,你自己根本不用记住哪台电脑的哪个路径,只要把优盘插入到电脑,运行MY文档管理器,就可以直接编辑了。

第三步,为方便在异地使用,小张决定为当前正在处理的稿件增加一个副本。在需要异地处理的稿件上右键单击,选择“复制文件到(自动添加副本)”命令,在弹出的对话框中将保存目录设置为优盘上的某个目录即可。这样,就可以在优盘上编辑PC1或PC2的稿件了。

小提示:对于PC1、PC2上的同名文件,MY文档管理器以不同的磁盘号+文件路径来标识文件记录,因此,对于不同电脑上的同名文件,甚至是路径和文件名完全相同的文件,程序也可以准确识别哪个是哪个。

懒招3多种文件批量移动

要将文件管理得井然有序,就免不了要进行复制、删除、移动等等操作,如果一个个进行操作,工作量是非常巨大的。这时我们就需要借助于BelvedereAutomated(下载地址:.com/assets/resources/2008/03/Belvedere%200.3.exe)进行批量操作了。例如我们想把“F:\test”目录中的所有照片移动到F盘中的“北京游照片”目录中,可以按以下方法进行。

第一步,建立“F:\test”目录后在“rule”一栏中,单击“+”按钮,建立一个规则。在“Descriptior”文本框中为当前规则起一个名字如“批量整理移动”。单击第一个下拉列表,在这里可以选择Name(文件名)、Extension(扩展名)、Size(大小)等进行操作,这里选择扩展名“Extension”。单击第二个下拉列表,在这里设置的是操作条件,有is(是)、isnot(不是)、contains(包含)等操作可供选择,这里选择的是“is”。接下来,在最后的文本框中输入图片文件的扩展名,示例中是“JPG”。定义的规则合起来的意思就是“扩展名是JPG”。

第二步,在“Dothefollowing”区域设置操作动作,单击第一个下拉列表进行操作动作的选择,有“Movefile(移动)、Renamefile(重命名)、Deletefile(删除)”等动作可供选择,我们要批量移动,那就选择重命名“Movefile(移动文件)”。接下来,单击后面的按钮选择“F:\北京游照片”目录。

第三步,规则设置完毕,单击“Test”按钮应用规则,程序即可一次性地将所有扩展名为“JPG”的图片文件移动到“F:\北京游照片”目录中了。

懒招4提纲挈领一点即得

在前面几大懒招的帮助下,你电脑里的文件应该已经有点类别了吧。如果从此想告别懒人的生活,那就要养成管理文件的好习惯了。

第一步,在你保存资料的电脑分区中,要接类别建立多个文件夹,可以按用途分为:学习、娱乐、暂存、工作、下载,在娱乐下又可以建立二级目录:电影、歌曲、动画等。也可以按照常见的文件性质进行分类,例如分为:图片、电影、电子书、安装文件等,当然也可以按照你的需要再建立二级目录,以后每有文件需要保存就按这个类别保存到相应的目录。

第二步,虽然现在已经把文件分门别类存放了,但时间长了,目录太深,一层一层查找也很麻烦的,在EXCEL里建一个目录就可以统一管理了。运行EXCEL后,新建一个表格,然后按照我们的分类方式隔行输入:图片、电影、电子书,在图片分类下再建立二级目录名,例如明星、汽车、壁纸等。

第三步,右键单击“图片文字”,选择“超链接”,在弹出的对话框中选择电脑里图片目录文件夹,单击“确定”后EXCEL里的“图片”文字就变成彩色。用同样的方法为一级目录的“电影、电子书”和二级目录的“明星、汽车、壁纸”等添加超链接。然后将这个EXCEL文件命名为文件目录,保存到桌面上,以后打开这个文档,直接单击相应的文字,比如单击“壁纸”,就可以切换到壁纸文件夹了。

小提示:如果要更改某个超链接,直接右键单击该文字,选择“编辑超链接”就可以了。本人的电脑分类原则简述如下。

硬盘的第一层(请在自己的件夹中右键“按组排列”查看)

第一位字母表示A生活娱乐B教学C工作D安装程序

第二位字母表示只是流水号

AA影视

AB音乐

AC阅读

AD图片

AE相册

生活娱乐

BA计算机

BB英语

BC运动

BD游戏攻略

BE衣食住行

BF文艺

教学

CA管理制度

CB流程图

CC程序文件

工作

DA娱乐

DB其它

安装程序

硬盘的第二层(进入“AA影视”的文件夹举例)

第一位字母表示只是流水号

第二位字母表示只是流水号

AA电影

BA电视剧

CAMTV

硬盘的第三级(进入“AA电影”的文件夹举例)

第一位字母表示A动作片B剧情片C动画片

第二位字母表示A未看过B已看过

AA导火线

AB尖峰时刻

动作片

BA独自等待

剧情片

CB机器猫

CB狮子王

动画片

利用“字母排序”和“按组排列查看”可以使文件查看和存放简洁明了,结合自己资料的特点和实际需求,给自己定一个分类原则并严格执行。个人电脑资料的资源会得到高效而充分的利用。电脑文件管理八条小技巧

在电脑的内部,在电脑的桌面上,在“资源管理器”中,充斥着无序与混乱,这种虚拟的混乱极大地影响了电脑的性能和我们办公的效率,当大家面临这个问题时,通常认为硬盘空间又不够了,电脑性能又不跟不上了,需要再换一台新的电脑了。事实上,我们真正需要的是坐下来,好好花时间将电脑里的文件真正管理起来,会为自己日后省下更多的时间。

文件管理的真谛在于方便保存和迅速提取,所有的文件将通过文件夹分类被很好地组织起来,放在你最能方便找到的地方。解决这个问题目前最理想的方法就是分类管理,从硬盘分区开始到每一个文件夹的建立,我们都要按照自己的工作和生活需要,分为大大小小、多个层级的文件夹,建立合理的文件保存架构。此外所有的文件、文件夹,都要规范化地命名,并放入最合适的文件夹中。这样,当我们需要什么文件时,就知道到哪里去寻找。

这种方法,对于相当数量的人来说,并不是一件轻松的事,因为他们习惯了随手存放文件和辛苦、茫无头绪地查找文件。

下面,我们将帮你制订一套分类管理的原则,并敦促您养成好的文件管理习惯。以下是我们总结出的一些基本技巧,这些技巧并不是教条,可能并不适合你,但无论如何你必须要有自己的规则,并坚持下来,形成习惯。

一、发挥我的文档的作用

有很多理由让我们好好地利用“我的文档”,它能方便地在桌面上、开始菜单、资源管理器、保存/打开窗口中找到,有利于我们方便而快捷地打开、保存文件。我们可以利用“我的文档”中已有的目录,也可以创建自己的目录,将经常需要访问的文件存储在这里。至于“我的文档”存储在C盘,在重装系统时可能会误删除的问题,可以在非系统盘建立一个目录,然后右击桌面上的“我的文档”,选择“属性”。在弹出的“我的文档属性”窗口中,单击目标文件夹下的“移动”按钮,然后在新的窗口中指定我们刚创建的文件夹。重装系统后再次执行以上操作,再重新指向此文件夹即可,即安全又便捷。

小提示:如果你使用Windows2000/XP,则移动“我的文档”文件夹时,其下的所有文件会自动移过去,但如果你使用Windows9x,则需要手工将C:MyDocuments下的所有文件手工移到新指定的文件夹中,否则可能会丢失数据。

二、建立最适合自己的文件夹结构

文件夹是文件管理系统的骨架,对文件管理来说至关重要。建立适合自己的文件夹结构,需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论