大数据审计技术 课件 项目二 初探大数据审计工具-Power BI_第1页
大数据审计技术 课件 项目二 初探大数据审计工具-Power BI_第2页
大数据审计技术 课件 项目二 初探大数据审计工具-Power BI_第3页
大数据审计技术 课件 项目二 初探大数据审计工具-Power BI_第4页
大数据审计技术 课件 项目二 初探大数据审计工具-Power BI_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据审计技术项目二

初探大数据审计工具—PowerBI目

录/CONTENT任务一PowerBI安装

任务二PowerBI数据获取任务三PowerBI数据处理任务四PowerBI数据建模任务四PowerBI数据可视化学习目标素养目标1.具有严谨、条理清晰的数据处理能力;2.具有不断创新、不畏艰险的工匠精神;3.具有大数据分析思维和数据处理能力。知识目标1.了解PowerBI的主要组件;2.熟悉PowerBI的工作界面;3.掌握数据处理常用方法;4.掌握数据关系的类型。技能目标1.能够运用获取Web数据、文本文件的操作方法;2.能够运用导入Excel工作簿数据的方法;3.能够运用PowerQuery编辑器处理数据的方法;4.能够运用创建数据可视化报表的常用方法。思维导图项目背景在数字经济时代,数据是重要的资产。充分挖掘、科学分析、合理运用和直观展示数据是大数据时代财会类专业学生必须掌握的重要技能。随着大数据技术蓬勃发展,各种大数据分析和可视化工具层出不穷。基于其服务的目标人群不同,大数据分析工具可以粗略地分为三类:第一类主要面向具有计算机专业背景的用户,比如Python语言;第二类主要服务于统计专家,比如R语言;第三类分析工具的目标人群是没有计算机和统计专业背景,又需要进行大数据分析与可视化的专业人员,其中以微软公司推出的PowerBIDesktop为代表。PowerBIDesktop容易上手且功能强大,以视窗作为主要的交互方式,而且可以与Excel无缝协作。它能够把静态数据转换为精美的可视化报表,根据过滤条件动态筛选数据,从不同角度和维度分析数据,并使用实时仪表板和报表可视化数据,让抽象枯燥的数据变得形象生动。让我们一起来认识、探索、掌握PowerBIDesktop吧。01PowerBI安装任务描述知识准备任务实施任务小结任务描述下载并安装PowerBIDesktop,初步了解PowerBI工作界面,认识PowerBI的三大视图,“报表视图”“数据视图”和“模型视图”。子任务一下载PowerBI安装文件。PowerBI安装文件可以免费下载。子任务二安装PowerBI。成功安装PowerBI,是运用的基础。子任务三认识PowerBI界面。认识PowerBI界面才能更快熟悉其功能。知识准备一、PowerBI的简介(一)PowerBI的定义PowerBI是微软官方推出的一个让非技术人员也能做到有效地整合企业数据,并快速准确地提供商业智能分析的数据可视化神器和自助式BI分析工具。其既是员工的个人报表和数据可视化工具,还可用作项目组、部门或整个企业背后的分析和决策引擎。

(二)PowerBI的特点1.PowerBI可以支持各种数据源,包括文件、数据库以及各种云数据库和其他外部数据库2.PowerBI支持用户可以在任何地方编辑和修改报表,也可以在PC端、移动端等任何方式在得到授权的情况下进行查询、探索、分析相关数据分析,并作出决策。知识准备二、PowerBI的价值数据获取全面将ERP等信息系统的数据直接延伸到决策者的桌面,达成信息化的最后一公里,让决策者直接操控信息搜索引擎及时、准确呈现关键信息,让决策者远离信息洪水,有更多的机会思考;相关信息任意关联钻取,决策思维不再受到任何限制数字说话,科学决策不仅知道结果,还知道原因;不但可以事后分析,还能事前预警。提倡绿色BI绿色就是杜绝资源的浪费,技术资源也是如此,PowerBI让开发者能以最少的代价开发出来优秀的BI解决方案及应用。知识准备三、PowerBI的组件进行数据建模和分析,即把各维度数据(比如时间、地区、产品等)组合起来,建立模型,实现按自定义维度分析功能PowerPivot用于获取和整理数据,一般分为抽取—转换—加载三个过程,把数据源变成自己想要的格式。PowerQueryPowerView,进行数据可视化,生成各类交互式报表;而PowerPivot、PowerView和PowerMap已经整合到PowerBI中了PowerBI知识准备四、PowerBI的功能数据视图管理通过数据字典及数据视图管理,可将信息系统的数据库结构翻译成业务语言,自动生成SQL查询脚本,非IT专业的业务人员,也可轻松设计报表及分析模型。1数据转换管理实现从任意数据源,根据不同的分析主题,将海量数据通过全量与增量的数据更新策略,抽取、转换、装载到数据仓库中。2OLAP数据库管理通过数据转换将源数据抽取到数据仓库中后,就开始根据分析需求创建分析模型。3多维报表设计可实现多图表联动,展现方式更加灵活,可以设计任意分析路径。4知识准备四、PowerBI的功能多维报表浏览多维报表发布后,浏览用户可通过鼠标操作即可进行动态的分析,实现一个分析模型变成数十张报表的神奇效果5智能分析报告设计可读取不同的数据源数据,集成了趋势分析、结构分析、同比分析、因素分析、排行榜分析、任意表格等多种分析方式,且表格、图形、文字任意选择。6即席报表设计PowerBI提供简单的向导模式,加上可视化设计界面,可快速设计出各种形式的报表,且各报表之间,可轻松设计钻取与链接7安全管理体系可PowerBI具有功能强大而管理简单的安全管理体系。它包括了开发端与浏览端的功能权限,以及浏览用户的数据权限。8任务实施子任务一下载PowerBI安装文件检查下载步骤一:(1)检查电脑系统是否为Windows8.1或WindowsServer2012R2或更高版本;(2)检查电脑系统类型是否为64位操作系统。任务实施子任务一下载PowerBI安装文件检查下载步骤二:访问微软官方网址/zh-cn/desktop/点击【免费下载】。任务实施子任务二安装PowerBI下载完PowerBI安装文件后,鼠标双击安装文件,在弹出的对话框中点击“下一步”,勾选“我接受许可协议中的条款”复选框,继续点击下一步直至安装完成注意:安装完成后,我们只能免费使用本地版功能,如果需要和其他用户跨平台进行在线数据共享和协作或者发布报表,则需要注册PowerBI。任务实施子任务三认识PowerBI界面报表画布顶功能区报表编辑器任务实施子任务三认识PowerBI界面1.报表视图在报表视图中,用户可以创建任意数量的具有可视化图表的报表页。每张报表的初始页是一张空白画布,可以插入文本、图形、条形图、柱状图等。2.数据视图数据视图显示的是获取并整理后的数据,用户可以检查、浏览和了解模型中的数据。3.模型视图用于显示模型中的所有表、列和关系。在模型视图中可以建立表和表之间的关联,即数据建模。报表视图数据视图模型视图任务实施子任务三认识PowerBI界面1.“可视化”窗格提供了饼图、折线图、散点图、地图、切片器等可视化图表类型。2.“筛选器”窗格主要用于查看和设置视觉级、页面级和报告级筛选器,对可视化图表对象之间的编辑交互范围进行控制。3.“数据”窗格用于显示模型中的所有表、字段和度量值,并根据需要将相应字段和度量值拖放到“可视化”窗格的参数设置中或者“筛选器”窗格的筛选设置中,用以创建动态可视化效果。任务小结任务一主要介绍了下载及安装PowerBIDesktop的主要方法,初步认识并熟悉了PowerBIDesktop的主要工作界面及其三种主要视图。功能区、画布区、图表类型、图表属性和数据字段等内容将在后续进一步学习PowerBI安装完成后,我们只能免费使用本地版功能,如果需要和其他用户跨平台进行在线数据共享和协作或者发布报表,则需要注册PowerBI。我们可以用公司或者组织提供的电子邮箱免费注册。02PowerBI数据获取任务描述知识准备任务实施任务小结任务描述运用PowerBI进行数据分析与可视化,首先就要获取数据。在PowerBI中获取数据的方法和类型非常丰富,可直接在数据表中输入数据,也可以导入Excel工作簿和多种类型的数据源如文本数据源和Web数据源等。任务二主要讲解PowerBI获取数据的常用方法,为后续数据处理、建模和可视化做准备。子任务一手动输入数据。手动输入数据是一种最直接的数据录入方式,但并不是最常用的,只是需要特殊处理个别数据时会用到。子任务二非手动导入数据。PowerBI可以通过EXCEL文件、文件夹、数据库等端口获取数据。知识准备完成任务一中介绍的PowerBIDesktop软件的下载与安装,启动PowerBIDesktop并初步了解其工作界面,然后跟着下面【任务实施】部分一起操作,掌握常用的PowerBI获取数据的方法。任务实施子任务一手动输入数据步骤一:类似于Excel,PowerBI支持在数据表中手动输入或者以复制粘贴的方式直接将Excel工作簿或者网页中的粘贴到PowerBI数据表中。任务实施子任务一手动输入数据步骤二:创建表窗口打开时,默认状态下只有一个单元格。选中单元格,按“Enter”健,即可为数据表插入一行。单击数据表下方的“插入行”按钮,将在数据表最后插入一行。在目标行号上单击鼠标右键,在弹出的快捷菜单中单击“插入”选项,即可在目标行上方插入一行。任务实施子任务二非手动导入数据数据量比较大,手动输入就不太合适。PowerBI支持导入文件、数据库等不同源数据的导入。步骤一:在“主页”选项卡的“数据”组中单击“获取数据”按钮及其他相应按钮,可以打开数据获取窗口。任务实施子任务二非手动导入数据步骤二:选择需要导入的数据文件类型,选择“Excel”,或者在“主页”选项卡“数据”区域,单击“Excel工作簿”按钮,或者直接点击画布区“从Excel导入数据”按钮,然后会弹出“打开”对话框。选择需要加载的Excel文档,单击打开。任务实施子任务二非手动导入数据步骤三:打开“导航器”对话框,勾选需要添加的工作表前面的复选框,若Excel表格不需要编辑整理则直接单击“加载”按钮,Excel表格会直接加载进数据模型中。任务实施子任务二非手动导入数据数据导入完成后,在PowerBI的“数据”窗格中显示表和列。如果工作表需要编辑修改,则需要点击“主页”选项卡“数据”区中的“转换数据”按钮,或者在加载数据前的导航器窗口中点击“转换数据”按钮,进入数据编辑器页面,对数据进行清洗和整理。任务小结本任务主要介绍了PowerBI获取数据的常用方法手动输入和导入Excel工作簿数据,其中导入Excel数据在企业日常工作中普遍使用。在此基础上,我们可以进一步了解PowerBI获取其他类型的数据文件的方法。03PowerBI数据处理任务描述知识准备任务实施任务小结任务描述在PowerBI中获取数据后,经常会需要对不规则的数据进行处理,将源数据进行规范化与标准化处理,为后续的建模分析和可视化做准备。任务三将介绍利用PowerBI中简单易用的PowerQuery编辑器进行数据整理,如对数据进行类型转换、拆分、提取、归并等操作,清洗不规范数据,以满足可视化的需要。子任务一更改数据类型。在PowerBI中进行数据分析前需要将数据更改为方便读取和计算分析的数据类型。子任务二管理行列数据。管理行列数据主要是删除行或删除列或保留行等相关的数据处理,以保证数据分析的清晰度。子任务三填充相邻数据。用相邻单元格或区域的内容来填充活动单元格或选定区域以保证数据的完整性。知识准备在具体利用PowerQuery编辑器整理和清洗数据之前,我们需要初步了解什么是PowerQuery。PowerQuery是PowerBI中功能强大的核心组件之一,它的主要作用是数据连接、数据转换、数据组合和数据共享。任务实施子任务一更改数据类型首先打开PowerQuery编辑器,在需要更改数据类型的列标题上右键单击,在弹出的快捷菜单中点击“更改类型”,再选择需要将原来的列更改为目标类型,在弹出的“更改列类型”提示对话框中单击“替换当前转换按钮”即可。任务实施子任务二管理行列数据在数据处理的过程中,经常遇到多余行和列,或者重复项干扰的问题。PowerQuery编辑器中管理行列的功能可以帮助我们相对比较轻松地管理行列数据。在PowerQuery编辑器“主页”选项卡下,“管理列”“减少行”功能区,点击相应按钮即可。任务实施子任务三填充相邻数据1.填充null值将数据源导入PowerBI后,像Excel工作簿中合并单元格或空单元格中的数据会显示为null值即缺失值任务实施子任务三填充相邻数据2.快捷填充在PowerQuery编辑器中,鼠标右键单击需要填充数据的列标题,在弹出的快捷菜单中单击“填充”,接着选择“向上”或者“向下”填充即可。任务实施子任务三填充相邻数据3.转换填充也可以选中需要填充数据的列以后,点击“转换”选项卡下,“任意列”区域中的“填充”下拉按钮,在弹出的下拉列表中单击“向上”或者“向下”选项任务小结本任务简要介绍了PowerBI中简单易用且数据处理功能强大的PowerQuery编辑器处理数据的常用方法。需要强调的是,PowerQuery数据处理与数据清洗的功能非常多,并且在数据建模与可视化分析之前,大量的工作可能就在数据清洗部分,所以掌握PowerQuery的常用功能可达到事半功倍的效果。学习PowerQuery相应功能的最佳方法是实际操作并根据需要查看帮助文档。04PowerBI数据建模任务描述知识准备任务实施任务小结任务描述PowerBI可以根据不同的维度对多个表格、多种来源的数据进行聚合分析而不需要将所有数据合并到同一个数据表中。前提是为这些不同的数据表建立关系,使它们能够协同工作。这个建立多个表格之间关系的过程就是数据建模。在建模的过程中,如果模型中已有的表、列和数据值无法满足需求,可以通过DAX创建度量值、计算列等来解决。子任务一管理关系。管理关系包括创建关系、删除关系等关系管理行为,以建立表与表直接的关联。子任务二新建列和新建度量值。在PowerBI中进行数据建模时,新建列和新建度量值是两个很重要的操作。知识准备一、管理关系(一)认识表事实表中包含描述业务内特定事件的数据比如销售收入等。维度表是维度属性的集合,属性的集合构成一个维,可以将维度理解为分类的标准和依据。知识准备一、管理关系(一)认识关系及关系模型1.认识关系(1)一对多(1:*)关系。一对多关系是指一个表(通常是维度表)中的列具有一个值的一个而与其关联的另一个表(通常是事实表)的列具有一个值的多个实例。例如,门店表中的门店ID”具有唯一值,而销售表中对于相同的“门店ID”则具有多个值。门店表通过“门店ID”和销售表建立关系,即一对多(1:*)的关系。(2)多对一(*:1)关系。多对一关系与一对多关系正好相反,指的是一个表(通常为事实表)列具有一个值的多个实例,而与之相关的另一个表通常为维度表)仅具有一个值的一个实例。例如,销售表通过“门店D”和门店表建立关系,即多对一(*:1)的关系。(3)一对一(1:1)关系。一对一关系是指一个表(事实表)对应另一个表(维度表)的记录有一一对应的关系。例如,产品表中的“产品ID”对应产品分类表中的“产品D”,即一对一(1:1)的关系。知识准备一、管理关系(一)认识关系及关系模型2.关系模型的布局(1)星形布局模式。星形布局模式的特点是在事实表外侧只有一层维度表,所有维度表都直接与事实表关联,呈现的形状就像星星一样。知识准备一、管理关系(一)认识关系及关系模型2.关系模型的布局(2)雪花形布局模式。雪花形布局模式的特点是在事实表外侧有多层维度表,每个维度可能串起多个维度表,就像雪花一样由中心向外延伸。知识准备二、新建列和新建度量值(一)新建列新建列也叫创建计算列,创建过程中通常会用到DAX公式。在进行数据分析的时候,可以凭借现有的数据生成需要的数据字段。这种类型的表叫作列存储式表,即每一列都是按照个公式逻辑来计算。(二)新建度量值度量值是用DAX公式创建一个虚拟字段的数据值,通常可以理解为要分析的数据指标。它不改变源数据,也不改变数据模型。度量值可以随着不同维度的选择而变化,一般在报表交互时使用,以便进行快速和动态的数据浏览。创建的度量值将显示在带有“计算器”图标

的字段列中。知识准备三、认识DAX公式(一)DAX公式DAX是公式或表达式中可用于计算并返回一个或多个值的函数、运算符或常量的集合,其是一种函数语言,其中可以包含嵌套函数、条件语句和值引用等其他内容。(二)DAX语法DAX语法包括组成公式的各种元素,简单来说,就是公式的编写方式。DAX公式的特点如下:(1)类似Excel函数;(2)基于列或表的计算;(3)引用“表”“列”或度量值;(4)通过“”或““”启动智能感知。(三)DAX运算符与Excel一样,DAX公式也是使用+、-、*、这些符号进行运算的,并使用小括号()来调整运算的优先次序。知识准备三、认识DAX公式(四)DAX函数DAX拥有许多可用于组织或分析数据的函数。这些函数包括聚合函数、逻辑函数、信息函数、数学函数、文本函数、转换函数、日期函数、关系函数、高级聚合函数、时间智能函数、筛选器函数等。1.CALCULATE函数CALCULATE函数被称作DAX中最强大的计算器函数,其一般也愈发格式如下:CALCULATE(表达式,条件1,条件2,)知识准备三、认识DAX公式(三)DAX函数2.DIVIDE函数作数据分析时,很多指标都是相对值,如环比增长率、利润率、存货周转率、离职率、借款逾期率等,它们的数学表达式都使用了除法。我们可以使用运算符“/”进行除法运算,但当分母为0时,系统会报错。DIVIDE函数又叫安全除法函数,其格式为“DIVIDE(分子,分母)它的好处是当分母为0时,系统不报错,可以显示为空或其他特定信息。其基本语法格式如下:DIVIDE(分子,分母)任务实施子任务一管理关系1.创建关系方法一是加载数据完成后,将窗口切换到“数据视图”,单击“主页”选项卡下“管理关系”。或者单击“表工具”选项卡下“管理关系”按钮也可以打开“管理关系”对话框。任务实施子任务一管理关系1.创建关系以点击“管理关系”对话框中的“新建”按钮,在弹出的“创建关系”对话框中创建关系。任务实施子任务一管理关系2.编辑和删除关系如果需要编辑修改或者删除多余的关系,可使用“管理关系”对话框中的“编辑”和“删除”按钮。在“管理关系”对话框中,选中需要删除的关系,单击“删除”按钮,在弹出的“删除关系”提示对话框中单击“删除”按钮,返回“管理关系”对话框,单击“关闭”按钮即完成操作。任务实施子任务一管理关系2.编辑和删除关系另外一种方法是使用快捷菜单删除关系,在“模型视图”界面下,鼠标右键单击需要删除的关系连接线,在弹出的快捷菜单中点击“删除”选项即可。任务实施子任务二新建列和新建度量1.新建列PowerQuery编辑器有非常丰富且使用简便的新建列功能,如图2-32所示,PowerQuery编辑器“功能区”的“添加列”选项卡下有创建“自定义列”、“条件列”、“索引列”、“重复列”按钮。任务实施子任务二新建列和新建度量1.新建列步骤一:获取数据并打开PowerQuery编辑器,选中需要新建列的查询表,单击PowerQuery编辑器“添加列”选项卡下“常规”区域内“自定义列”按钮,会弹出“自定义列”对话框。任务实施子任务二新建列和新建度量1.新建列步骤二:输入自定义列公式。在“自定义列”对话框“新列名”文本框中可输入新建列的列标题,随后在“可用列”列表中双击“利润”或者选中“利润”后单击“插入”,会自动将用中括号括起来的公式参数“利润”添加到“自定义列公式”文本框中的等号后面。任务实施子任务二新建列和新建度量1.新建列当然,“自定义公式”文本框也支持引用函数,上文所输入的“自定义列公式”也可以通过引用函数来实现任务实施子任务二新建列和新建度量1.新建列步骤三:销售利润率一般用百分数表示,所以将新建列“销售利润率”的数据类型转换为百分比类型。任务实施子任务二新建列和新建度量1.新度量值步骤一:打开度量值表达式向导。在“数据视图”窗口模式下,单击“表工具”选项卡下“计算”区域的“新建度量值”按钮,即可进入度量值编辑状态。在编辑框中出现“度量值=”输入提示,在“=”后面输入计算所需要的函数即可任务实施子任务二新建列和新建度量1.新度量值步骤二:输入DAX函数。如计算产品的总成本,在编辑框“度量值=”后面键入SUM函数,然后选择需要计算的参数即可,默认新建度量值是以“度量值”命名,在“度量工具”选项卡下“名称”文本框中修改度量值名称,或者在“数据”窗口选中需要修改名称的度量值,右键单击,在弹出的快捷菜单中点击“重命名”直接输入新的名称即可。任务小结本任务初步介绍了PowerBI数据建模的概念和基本操作。PowerBI数据建模主要是创建数据表之间的关系,通过连接数据表使其能够协同工作,便于提取不同数据表中的数据进行分析。数据建模是PowerBI进行数据分析的核心工作,也是数据可视化的基础。05PowerBI数据可视化任务描述知识准备任务实施任务小结任务描述一图胜千言,大数据时代,数据可视化越发重要。PowerBI的可视化报表直观形象,而且其可视化功能相对简洁、灵活和智能。任务PowerBI的数据可视化。通过创建一个简单的PowerBI可视化报表来初步说明运用PowerBI进行数据可视化的流程。知识准备数据获取、数据处理与数据建模是可视化操作的基础。因此,完成任务五之前,需要对前文的任务一至任务四有初步掌握。虽然Excel也可以制作精美的图表,但是和PowerBl相比,其可视化展现效果还是略逊一筹。PowerBI的图表不仅可以交互,还可以钻取,在图表的样式上大大超越了Excel。PowerBI自带的可视化对象有条形图、柱形图、折线图、面积图、组合图、丝带图、瀑布图、散点图、饼图、环形图、树状图、地图、漏斗图、仪表图、卡片图、多行卡、KPI图、表、矩阵和切片器等。任务实施任务PowerBI的数据可视化步骤一:获取数据。启动PowerBI,获取Excel工作簿数据并加载数据。任务实施任务PowerBI的数据可视化步骤二:数据处理。运用PowerQuery编辑器清洗与整理数据。单击“主页”选项卡下“将第一行用作标题”按钮,即处理完毕。任务实施任务PowerBI的数据可视化在PowerQuery编辑器中,单击“主页”选项卡下“将第一行用作标题”按钮,即处理完毕。单击“主页”选项卡下“关闭并应用”按钮退出。任务实施任务PowerBI的数据可视化步骤三:创建数据表之间的关系。一般情况下,PowerBI会自动创建数据表之间的关系。此处演示的案例中各个表中都含有相同的字段名称。任务实施任务PowerBI的数据可视化步骤四:创建度量值,创建名称为“总成本”、“总利润”、“总收入”和“用户总数”的度量值,创建好的度量值名称左边显示一个计算器图标。任务实施任务PowerBI的数据可视化步骤五:创建可视化报表。1.在PowerBI“报表视图”窗口,单击“可视化”窗格中的“环

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论