《商业分析概论》联机分析处理(OLAP)_第1页
《商业分析概论》联机分析处理(OLAP)_第2页
《商业分析概论》联机分析处理(OLAP)_第3页
《商业分析概论》联机分析处理(OLAP)_第4页
《商业分析概论》联机分析处理(OLAP)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商业分析概论联机分析处理(OLAP)目录OLAP的提出OLAP的基本操作基于OLAP的多维分析OLAP的评价标准6.1OLAP的提出联机分析处理(OnLineAnalyticalProcess,OLAP)技术是为满足对数据仓库进行分析的需求而产生、发展起来的一门技术。OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“维”这个概念。“维”是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维(Dimension)OLAP的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。36.1OLAP的提出OLAP的发展历程60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展。联机事务处理(OLTP):利用关系数据库存储和管理业务数据,并建立相应的应用系统来支持日常业务运作。这种应用以支持业务处理为主要目的。所存储的数据被称为操作型数据或业务数据。对OLTP数据库中的数据进行再加工,形成一个综合的、面向分析的、更好的支持决策制定的决策支持系统(DSS)1993年,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。46.1OLAP的提出OLAP的发展历程5OLAP的三种功能建模展示存储独立性快速性交互性OLAP特征6.1OLAP基本概念OLAP的发展历程变量:从现实系统抽象出来的,用于描述数据的实际含义,即描述数据“是什么”维:是与某一事件相关的因素在关系模型的抽象,是人们观察数据的特定角度。如产品维、顾客维、时间维等。维的层次:是由观察数据细致程度不同造成的。如日、月、季、年是时间维的层次。维成员:维的取值。如“某年某月某日”是时间维的一个成员。维的分类:按照一定的划分标准对维的所有取值集合的一个分类划分,用于数据钻取和聚合。如上半年、下半年是对时间维的划分。数据单元:多维数组的取值多维数组:多维数据立方体66.1OLAP基本概念维、维的层次、维成员、多维数据集、数据单元、多维数据集的度量值和聚集维销售地区西南华中华东四川云南河南湖北江苏上海6.1OLAP基本概念维(Dimension)观察分析对象的角度。例如:可以从三个‘维’角度观察‘销售金额’这个对象:时间维:可按时间角度分析、统计其销售金额。商品维:可按不同商品分类角度分析、统计。地域维:可按连锁点不同地域角度分析、统计其销售金额。层(Layer)在分析型应用中,对对象可以从不同深度分析与观察并可得到不同结果,因此,“层”反映了对对象观察的深度。一般而言,层是与维相关联的,一个维中可允许存在若干个层,并且可以又不同的层次划分方法。例如:时间维:可以有日、周、月、季、年地域维:可以有市、省、国、洲商品维:商品的分类6.1OLAP基本概念维成员维的一个取值称为该维的一个维成员。如果一个维是多层次的,则该维的维成员是在不同维层次的取值的组合。例如:对时间维来说,‘某年某月某日’、‘某年某月’、‘某月某日’、‘某年’都是其维成员。对一个数据项来说,维成员是该数据项在某维中位置的描述。多维数组一个多维数组可以表示为(维1,维2,……,维n,变量),这样可以构成三维、四维及多维的数据表示结构。其中,变量表示我们所观察的数据对象,维1、维2、……、维n分别表示我们观察该数据对象的角度。如(时间,商品种类,商店,销售额),从而构成一个有关商品销售额的三维数组。(‘2000年’,‘家电’,‘南京市’,‘1亿’)(‘2000年7月’,‘女性服装’,‘江苏省’,‘10亿’)6.1OLAP基本概念数据单元(单元格)多维数组的取值称为数据单元。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个观察对象的值,即(维成员1,维成员2,……,维成员n,对象值)。10

如图所示的小格内存储的数据就可以假设为商品的销售量数据立方体

产品北京上海化妆品江苏玩具服装电器

1234时间(月)销售数量:10000服装切片6.1OLAP基本概念12在多维数据模型中,数据以数据立方体(datacube)的形式存在数据立方体允许以多维数据建模和观察。它由维和事实定义维是关于一个组织想要记录的视角或观点。每个维都有一个表与之相关联,称为维表。多维数据模型围绕中心主题组织,该主题用事实表表示事实表包括事实的名称或度量以及每个相关维表的关键字事实指的是一些数字度量数据立方体数据立方体——一个方体的格alltimeitemlocationsuppliertime,itemtime,locationtime,supplieritem,locationitem,supplierlocation,suppliertime,item,locationtime,item,suppliertime,location,supplieritem,location,suppliertime,item,location,supplier0-D(顶点)方体1-D方体2-D方体3-D方体4-D(基本)方体14在数据仓库中,数据立方体是n-D的(n维)(关系表和电子表格是几维的?)示例AllElectronics的销售数据按维time,item的2-D视图AllElectronics的销售数据按维time,item和location的3-D视图的3-D数据立方体表示销售数据的4-D立方体表示多维数据模型为不同角度上的数据建模和观察提供了一个良好的基础数据仓库存储的数据模型在数据仓库的研究文献中,一个n维的数据的立方体叫做基本方体。给定一个维的集合,我们可以构造一个方体的格,每个都在不同的汇总级或不同的数据子集显示数据,方体的格称为数据立方体。0维方体存放最高层的汇总,称作顶点方体;而存放最底层汇总的方体则称为基本方体。15OLTPVS.OLAP6.1OLAP的提出比较项目OLAPOLTP直接基础数据仓库DBMS用户决策/高级管理人员一般操作/管理人员目的为决策和管理提供支持为日常工作服务数据特征导出数据原始数据数据细节综合性数据,细节程度低细节程度高时间特征历史数据,跨越一个时段当前数据更新方法周期性刷新可实时更新数据量需求一次处理需大量数据一次处理需少量数据6.2OLAP的基本操作切片(slice):切片是多维数组的子集(通常是二维)切块(dice):对多维数据立方体进行三维及以上操作上卷(rollup):“上卷”是指沿某一个维的概念分层向上归约;下钻:用户可以获得到最详细的层级(下钻)的数据;“下钻”是上卷的逆向操作,它是沿某一个维的概念分层向下或引入新的维来实现旋转(pivot):改变报表或即席查询的维度相对位置163.旋转2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市6773599673696294数据立方体

北京市上海市天津市

2002年1季度12313467

2季度5610373

3季度459859

4季度6687962003年1季度13410273

2季度5613969

3季度239762

4季度5582946.3基于OLAP的多维分析MOLAP:多维数据库的OLAPROLAP:关系型数据库OLAPOLAP的结果展示19MOLAPMOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,采用类似于多维数组的结构。例如,二维MDDB(数组,即矩阵)的数据组织见下表北京上海广州衣服600700500鞋800900700帽子100200806.3基于OLAP的多维分析20MOLAP利用一种专有的多维数据库来存储OLAP分析所需要的数据数据采用n维数组的多维方式存储,形成“立方体”结构MOLAP存储模式将数据与计算结果都存储在立方体结构中,即将多维数据集区的聚合、维度、汇总数据以及其源数据的副本等信息均以多维结构存储在分析服务器上。6.3基于OLAP的多维分析21ROLAP数据模型ROLAP是基于关系数据库的OLAP。它是一个平面结构,用关系数据库表示多维数据时,采用星型模型。以关系型的结果进行多维数据的表示与存储数据的预处理程度不高,灵活性高一般采用星状模式或雪花模式来表达多维数据视图产品名地区销售量衣服北京600衣服上海700衣服广州500鞋北京800鞋上海900鞋广州700帽子北京100帽子上海200帽子广州806.3基于OLAP的多维分析22MOLAP与ROLAP的比较1.数据存取速度2.数据存储的容量3.多维计算的能力4.维度变化的适应性5.数据变化的适应性6.软硬件平台的适应性7.元数据管理6.3基于OLAP的多维分析23OLAP结果呈现多维数据报表图形方式6.3基于OLAP的多维分析营业部编号委托方式客户类别交易量(万元)01现场交易大户67,000中户83,020散户92,800非现场交易大户45,120中户69,000散户99,10002现场交易大户73,200中户50,030散户62,200非现场交易大户20,870中户33,110散户98,20003现场交易大户40,150……………………24Codd提出OLAP的12条准则来描述OLAP系统:准则1:多维概念视图准则。准则2:透明性准则。准则3:存取能力准则。准则4:报表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论