版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析与可视化概述2022/8/20第1页,共46页。1认识常用的数据可视化工具目录认识数据分析2认识Power BI3第2页,共46页。广义数据分析:指依据一定的目标,通过统计分析、聚类、分类等方法发现大量数据中的目标隐含信息的过程。广义数据分析包括狭义数据分析和数据挖掘。掌握数据分析的概念第3页,共46页。狭义的数据分析:指根据分析目的,采用对比分析、结构分析、相关分析和描述性分析等分析方法,对收集的数据进行处理与分析,提取有价值的信息,发现数据中隐藏的关系,最终得到一个特征统计量结果的过程。数据挖掘:是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过应用聚类模型、分类模
2、型、预测模型和关联规则等技术,挖掘潜在价值的过程。掌握数据分析的概念第4页,共46页。掌握数据分析的概念第5页,共46页。掌握狭义数据分析的流程第6页,共46页。需求分析一词来源于产品设计,主要是指从用户提出的需求出发,挖掘用户内心的真实意图,并转化为产品需求的过程。产品设计的第一步就是需求分析,也是最关键的一步,因为需求分析决定了产品方向,错误的需求分析可能导致在产品实现过程中走入错误方向,甚至对企业造成损失。需求分析也是数据分析环节的第一步,也是非常重要的一步,决定了后续的分析方向和方法。数据分析中的需求分析的主要内容是,根据业务、生产和财务等部门的需要,结合现有的数据情况,提出数据分析需
3、求的整体分析方向、分析内容,最终和需求方达成一致意见。掌握狭义数据分析的流程1. 需求分析第7页,共46页。数据获取是数据分析工作的基础,是指根据数据分析的需求获取相关原始数据的过程。数据获取主要有两种途径:直接来源与间接来源。 直接来源通常指来源于本人或者第一方获取的第一手数据,包括但不限于业务记录、调查结果和实验结果等等。 间接来源指来源于他人获取的第二手数据,基于别人的调查或实验的结果,通常由一些权威的公司或政府部门提供。数据可能由不同种类的载体提供,包括Excel文件,Web数据和数据库等。在数据分析过程中,具体使用哪种数据获取方式,依据需求分析的结果而定。掌握狭义数据分析的流程2.
4、数据获取第8页,共46页。数据预处理是指对数据进行数据集成、数据清洗、数据变换和数据归约,并用于分析建模这一过程的总称。数据集成可以将多张互相关联的数据合并为一张。数据清洗用于修整数据中包含的不完整数据、含噪声数据和不一致数据。数据变换则可以通过规范化、逆透视列等技术处理数据,将数据转换成适合于分析的形式。数据规约通过字段规约、数据提取与数据泛化,在尽可能保持数据原貌的前提下,最大限度地精简数据 量,满足后续数据可视化与建模的数据要求。在数据分析的过程中,数据预处理的各个过程互相交叉,并没有明确的先后顺序。掌握狭义数据分析的流程3. 数据预处理第9页,共46页。数据建模是指建立数据间的逻辑关系
5、和进行数据操作的过程。数据建模通过建立表间关系处理多个数据表的链接关系。建模中的数据通常存储在表、列与度量值中。其中,新产生的“计算列”与“计算表”为直接引用其它列数据或其它表数据的运算结果,而度量值则是存放在一定的筛选条件下对数据源进行聚合运算结果的单个数据。掌握狭义数据分析的流程4. 数据建模第10页,共46页。数据建模中排序将数据按照期望的顺序进行排列,能够在后续的可视化步骤中更好的展示数据关于序列的变化规律。而分组则能将数据进行分段切割,用于展示数据不同间隔间的差异。掌握狭义数据分析的流程4. 数据建模第11页,共46页。数据可视化定义:通过图表直观的展示数据间的量级关系,其目的是将抽
6、象信息化为具体的图形,将隐藏于数据中的规律直观地展现出来。通过数据可视化可进行的分析包含对比分析、结构分析、相关性分析、描述性分析等。常用的类型:条形图、柱形图、散点图、折线图、饼图、环形图、瀑布图、漏斗图、地图等。需要选择合适的图表进行可视化展示。掌握狭义数据分析的流程5. 数据可视化第12页,共46页。部署是指将数据分析结果与结论应用至实际生产系统的过程。根据需求的不同,部署阶段可以是一份包含了现状具体情况的数据分析报表,也可以是将分析模型部署在整个生产系统。在多数项目中,数据分析师提供的是一份数据分析报告或者一套解决方案,实际执行与部署的是需求方。掌握狭义数据分析的流程6. 数据部署第1
7、3页,共46页。客户分析主要是根据客户的基本数据信息进行商业行为分析。步骤如下:首先界定目标客户,根据客户的需求、目标客户的性质、所处行业的特征以及客户的经济状况等基本信息,使用统计分析方法和预测验证法分析目标客户,提高销售效率。其次了解客户的采购过程,根据客户采购类型、采购性质进行分类分析,制定不同的营销策略。了解数据分析应用场景1. 客户分析(Customer Analytics)第14页,共46页。最后还可以根据已有的客户特征进行客户特征分析、客户忠诚分析、客户注意力分析、客户营销分析和客户收益率分析。通过有效的客户分析能够掌握客户具体行为特征,将客户细分,使得运营策略达到最优,提升企业
8、整体效益等。了解数据分析应用场景1. 客户分析(Customer Analytics)第15页,共46页。囊括产品分析、价格分析、渠道分析、广告与促销分析这4类分析。产品分析主要是竞争产品分析,通过对竞争产品的分析制定自身产品策略。价格分析又可以分为成本分析和售价分析。成本分析的目的是降低不必要成本。售价分析的目的是制定符合市场的价格。渠道分析是指对产品的销售渠道进行分析,确定最优的渠道配比。广告与促销分析则能够结合客户分析,实现销量的提升、利润的增加。了解数据分析应用场景2. 营销分析(Sales and Marketing Analytics)第16页,共46页。社交媒体分析是以不同的社交
9、媒体渠道生成的内容为基础,实现不同社交媒体的用户分析、访问分析和互动分析等。用户分析主要根据用户注册信息、登录平台的时间点和平时发表的内容等用户数据,分析用户个人画像和行为特征;访问分析则是通过用户平时访问的内容分析用户的兴趣爱好,进而分析潜在的商业价值;互动分析根据互相关注对象的行为预测该对象未来的某些行为特征。同时,社交媒体分析还能为情感和舆情监督提供丰富的资料。了解数据分析应用场景3. 社交媒体分析(Social Media Analytics)第17页,共46页。大规模网络安全事件(例如,2017年5月席卷全球的WannaCry病毒)的发生,让企业意识到网络攻击发生时预先快速识别的重要
10、性。传统的网络安全主要依靠静态防御,处理病毒的主要流程是发现威胁、分析威胁和处理威胁,往往在威胁发生以后才能做出反应。新型的病毒防御系统可使用数据分析技术,建立潜在攻击识别分析模型,监测大量网络活动数据和相应的访问行为,识别可能进行入侵的可疑模式,做到未雨绸缪。了解数据分析应用场景4. 网络安全(Cyber Security)第18页,共46页。设备管理同样是企业关注的重点。设备维修一般采用标准修理法、定期修理法和检查后修理法等方法。标准修理法可能会造成设备过剩修理,修理费用高检查后修理法解决了修理费用成本问题,但是修理前的准备工作繁多,设备的停歇时间过长。目前企业能够通过物联网技术收集和分析
11、设备上的数据流,包括连续用电、零部件温度、环境湿度和污染物颗粒等无数潜在特征,建立设备管理模型,从而预测设备故障,合理安排预防性的维护,以确保设备正常作业,降低因设备故障带来的安全风险。了解数据分析应用场景5. 设备管理(Plant and Facility Management)第19页,共46页。物流是物品从供应地向接收地的实体流动,是将运输、储存、装卸搬运、包装、流通加工、配送和信息处理等功能有机结合起来而实现用户要求的过程。用户可以通过业务系统和GPS定位系统获得数据,使用数据构建交通状况预测分析模型,有效预测实时路况、物流状况、车流量、客流量和货物吞吐量,进而提前补货,制定库存管理策
12、略。了解数据分析应用场景6. 交通物流分析(Transport and Logistics Analytics)第20页,共46页。身份信息泄露及盗用事件逐年增长,随之而来的是欺诈行为和交易的增多。公安机关、各大金融机构、电信部门可利用用户基本信息、用户交易信息和用户通话短信信息等数据,识别可能发生的潜在欺诈交易,做到提前预防、未雨绸缪。以大型金融机构为例,通过分类预测对非法集资和洗钱的逻辑路径进行分析,找到其行为特征。聚类分析方法可以分析相似价格的运动模式。例如对股票进行聚类,可能发现关联交易及内幕交易的可疑信息。关联分析可以监控多个用户的关联交易行为,为发现跨账号协同的金融诈骗行为提供依据
13、。了解数据分析应用场景7. 欺诈行为检测(Fraud Detection)第21页,共46页。1认识常用的数据可视化工具目录认识数据分析2认识Power BI3第22页,共46页。数据可视化工具的特性特性操作简单实时更新多种数据源多维度展现第23页,共46页。按照基于的语言大体可分为如下3类:数据可视化工具的分类无需编程语言的工具TableauFineReportPower BIRawInfogram等基于JavaScript实现的工具Chart.js、D3EChartsFusionCharts等基于其他语言实现的工具基于PHP的jpGraph基于Java的Processing基于Python
14、的NodeBox、R、Weka等。第24页,共46页。3Power BI2FineReport1Tableau常用的数据可视化工具第25页,共46页。Tableau是桌面系统中最简单的商业智能工具之一,它不强迫用户编写自定义代码,新的控制台可由用户自定义配置。Tableau的灵活易用让业务人员能够一同参与报表开发与数据分析进程,通过自助式可视化分析深入挖掘商业洞察与见解。常用的数据可视化工具Tableau第26页,共46页。Tableau的特点:常用的数据可视化工具Tableau1.极速高效2.简单易用,学习成本低3.可连接多种数据源,轻松实现数据融合4.高效接口集成,具有良好可扩展性,提升数
15、据分析能力第27页,共46页。FineReport报表软件是一款由纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,它具有“专业、简捷、灵活”的特点和无码理念,仅需简单的拖拽操作便可以设计复杂的报表,搭建数据决策分析系统。常用的数据可视化工具FineReport第28页,共46页。FineReport的特征:常用的数据可视化工具FineReport1.功能全面且专业2.设计报表简单高效,学习成本低3.行业积累丰富第29页,共46页。Power BI是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即时分析。生成美观的报表并进行
16、发布,供组织在Web和移动设备上使用。每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解。在企业内实现扩展,内置管理和安全性。常用的数据可视化工具Power BI第30页,共46页。Power BI的特征:常用的数据可视化工具Power BI1.在一个窗格中查看所有信息2.让细节更生动3.将数据转换为决策4.共享最新信息5.在网站上分享见解第31页,共46页。1认识常用的数据可视化工具目录认识数据分析2认识Power BI3第32页,共46页。Power BI的下载第一步:进入Power BI官方网站,单击“高级下载选项”后打开Power BI Desktop下载页面。第33页,共46
17、页。Power BI的下载第二步:单击“下载”按钮,弹出“选择您要下载的程序”对话框,根据自己的计算机系统选择合适的安装包。第34页,共46页。Power BI的下载第三步:单击“Next”按钮,选择文件的保存路径,这里选择“下载”文件夹。第35页,共46页。Power BI的安装第一步双击下载的“PBIDesktop_x64.mis”文件,弹出安装向导对话框,单击“下一步”按钮。第二步跳转至“软件许可对话框”,勾选“我接受许可协议中的条款”复选框第三步弹出“目标文件夹”对话框,单击“更改”按钮,指定安装位置,之后单击“下一步”按钮。第四步在弹出的“准备安装对话框”中,默认勾选“创建桌面快捷键
18、”复选框,单击“安装”按钮。第五步弹出“安装完成对话框”,单击“完成”按钮,Power BI Desktop的安装过程到此结束。第36页,共46页。Power BI Desktop界面第37页,共46页。Power BI Desktop界面顶部导航栏主要包括“文件”“开始”“视图”“建模”等选项卡,用于数据可视化操作。报表画布显示工作内容的区域,创建可视化效果时,在画布中会生成和显示这些可视化效果。报表编辑器由“可视化”“筛选器”“字段”3个窗格组成。第38页,共46页。Power BI Desktop中有报表视图、数据视图和关系视图3种。Power BI视图第39页,共46页。报表视图:可以创建任何数量的具有可视化内容的报表页、可视化内容可以移动,也可以进行复制、粘贴、合并等操作。Power BI视图第40页,共46页。数据视图:显示的数据是其加载到模型中的样子,便于浏览、检查和编辑Power BI Desktop模型中的数据。Power BI视图功能区公式栏数据视图图标数据网格搜索字段列表第41页,共46页。关系视图:显示模型中的所有表、列与关系,尤其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 温室大棚土壤改良施工方案
- 房屋征收中群体事件应急预案
- 邮政快递疫情防控应急演练方案
- 学校围墙施工安全方案
- 餐饮行业厨房油烟治理施工方案
- 医院心理健康服务规范制度
- 电子感应门技术升级方案
- 简易活动板房销售合同范本共
- 2024版废石买卖合同样本3篇
- 二零二四年度人力资源服务合同(招聘公司版)
- 园长课程领导力课件
- 部编版八年级语文上册全册习题精编课件含答案
- UN38.3 金属锂电池和锂离子电池组-中英文对照版
- 臀位分娩课件-
- 大学生节能减排科技竞赛作品申报书
- 单位工程竣工验收证明书(完整版)
- 小学数学北师大三年级上册数学好玩《校园中的测量》活动设计树德小学张三莉
- 大型机械租赁供应商考评表
- 初二数学秋季讲义 第8讲.分式恒等变形 教师版
- 线束检验标准(修订版)
- 三年级数学上册课件-5. 倍的认识 -人教版(共15张PPT)
评论
0/150
提交评论