软件项目管理3课件_第1页
软件项目管理3课件_第2页
软件项目管理3课件_第3页
软件项目管理3课件_第4页
软件项目管理3课件_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章联机分析处理

3.1OLAP概念3.2OLAP的数据模型3.3多维数据的显示3.4多维数据分析3.5OLAP的结构与分析工具1第3章联机分析处理

3.1OLAP概念1

联机分析处理(OnLineAnalyticalProcessing,OLAP)在数据仓库系统中,联机分析处理是重要的数据分析工具。

OLAP的基本思想是从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。2联机分析处理(OnLineAnalytic3.1OLAP概念

OLAP是在OLTP的基础上发展起来的。

OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。

OLAP是以数据仓库为基础的数据分析处理。它有两个特点:一是在线性(OnLine),由客户机/服务器这种体系结构来完成的;二是多维分析,这也是OLAP的核心所在。33.1OLAP概念OLAP是在OLTP的基础上发3.1.1OLAP定义1.OLAP理事会给出的定义联机分析处理(OLAP)是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面。43.1.1OLAP定义1.OLAP理事会给出的定义42.OLAP的简单定义

联机分析处理是共享多维信息的快速分析。它体现了四个特征:(1)快速性:用户对OLAP的快速反应能力有很高的要求。(2)可分析性:OLAP系统应能处理任何逻辑分析和统计分析。(3)多维性:系统必须提供对数据分析的多维视图和分析。(4)信息性:OLAP系统应能及时获得信息,并且管理大容量的信息。

52.OLAP的简单定义联机分析处理是共

1993年,E.F.Codd提出OLAP的12条准则,用来评价分析处理工具,这也是他继关系数据库和分布式数据库提出的两个“12条准则”后提出的第三个“12条准则”。其主要的准则有:多维数据分析;客户/服务器结构;多用户支持;一致的报表性能等。

3.1.2OLAP准则

61993年,E.F.Codd提出OLAP的12条准则1.多维概念视图企业的数据空间本身就是多维的。因此OLAP的概念模型也应是多维的。用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的联合(概括和聚集)分析。71.多维概念视图企业的数据空间本身就是多维的。因此OLAP的4.一致稳定的报表性能

报表操作不应随维数增加而削弱,即当数据维数和数据的综合层次增加时,提供的报表能力和响应速度不应该有明显的降低。

84.一致稳定的报表性能报表操作不应随维数增加而削弱5.客户/服务器体系结构

OLAP是建立在客户/服务器体系结构上的。

多维数据库服务器能够被不同的应用和工具所访问。

客户端负责应用逻辑及用户界面。95.客户/服务器体系结构OLAP是建立在客户/服务

8.多用户支持能力

当多个用户要在同一分析模式上并行工作,OLAP工具应能够提供并发访问等功能。

11.灵活的报表生成

报表必须充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。108.多用户支持能力10

OLAP是针对特定问题的联机数据访问和分析。

(1)变量:变量是数据的实际意义,即描述数据“是什么”。

(2)维:维是人们观察数据的特定角度。如产品维、顾客维、时间维等。

(3)维的层次:数据的细节不同程度为维的层次。如日、月、季、年是时间维的层次。

(4)维成员:维的一个取值称为该维的一个维成员。如“某年某月某日”是时间维的一个成员。

3.1.3OLAP的基本概念

11OLAP是针对特定问题的联机数据访问和分析。3.1(5)多维数组:一个多维数组可以表示为:(维1,维2,……,维n,变量)一个4维的结构,即(产品,地区,时间,销售渠道,销售额)。(6)数据单元(单元格):多维数组的取值称为数据单元。如:4维数据单元(牙膏,上海,1998年12月,批发,销售额为100000)。

OLAP的基本概念(续)12(5)多维数组:一个多维数组可以表示为:OLAP的基本概念(3.2OLAP的数据模型

3.2.1MOLAP数据模型3.2.2ROLAP数据模型3.2.3MOLAP与ROLAP的比较3.2.4HOLAP数据模型133.2OLAP的数据模型3.2.1MOLAP数据模型133.2.1MOLAP的数据模型

MOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,采用类似于多维数组的结构。例如,二维MDDB(数组,即矩阵)的数据组织见表3.1所示。

北京上海广州衣服600700500鞋800900700帽子10020080表3.1MOLAP的数据模型143.2.1MOLAP的数据模型MOLAP是基于多维在查询中除查询一般的“衣服在广州的销售量”外,有时查询“衣服的总销售量”等问题,涉及到多个数据项求和,如果采取临时进行累加,会使查询效率大大降低,为此需增加汇总数据项。

北京上海广州总和衣服6007005001800鞋8009007002400帽子10020080380总和1500180012804580表多维数据库中晗综合数据的组织15在查询中除查询一般的“衣服在广州的销售量”外,有时3.2.2ROLAP数据模型ROLAP是基于关系数据库的OLAP。它是一个平面结构,用关系数据库表示多维数据时,采用星型模型。163.2.2ROLAP数据模型ROLAP是基于关系数据库的OL产品名地区销售量衣服北京600衣服上海700衣服广州500鞋北京800鞋上海900鞋广州700帽子北京100帽子上海200帽子广州80表3.3关系数据库RDBMS数据组织17产品名地区销售量衣服北京600衣服上海700衣服广州500鞋3.2.3MOLAP与ROLAP的比较1.数据存取速度2.数据存储的容量3.多维计算的能力4.维度变化的适应性5.数据变化的适应性6.软硬件平台的适应性7.元数据管理183.2.3MOLAP与ROLAP的比较1.数据存取速度181.数据存取速度ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。

MOLAP在数据存储速度上性能好,响应速度快。191.数据存取速度ROLAP服务器需要将SQL语句转化为多维存2.数据存储的容量ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。MOLAP通常采用多平面叠加成立体的方式存放数据。当数据量超过操作系统最大文件长度时,需要进行数据分割。多维数据库的数据量级难以达到太大的字节级。202.数据存储的容量ROLAP使用的传统关系数据库的存储方法,3.多维计算的能力MOLAP能够支持高性能的决策支持计算。ROLAP无法完成多行的计算和维之间的计算。213.多维计算的能力MOLAP能够支持高性能的决策支持计算。24.维度变化的适应性MOLAP增加新的维度,则多维数据库通常需要重新建立。ROLAP对于维表的变更有很好的适应性。224.维度变化的适应性MOLAP增加新的维度,则多维数据库通常5.数据变化的适应性当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。在ROLAP中灵活性较好,对于数据变化的适应性高。235.数据变化的适应性当数据频繁的变化时,MOLAP需要进行大6.软硬件平台的适应性ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。7.元数据管理目前在元数据的管理,MOLAP和ROLAP都没有成形的标准。246.软硬件平台的适应性24MOLAP和ROLAP的对比简表MOLAPROLAP固定维可变维维交叉计算多维视图行级计算超大型数据库读-写应用维数据变化速度快数据集市数据仓库25MOLAP和ROLAP的对比简表MOLAPROLAP固定维可3.2.4HOLAP数据模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之间。在HOLAP中,对最常用的维度和维层次,使用多维数据表来存储,对于用户不常用的维度和数据,采用ROLAP星型结构来存储。在HOLAP的多维数据表中的数据维度少于MOLAP中的维度表,数据存储容量也少于MOLAP方式。HOLAP在数据存取速度上又低于MOLAP。263.2.4HOLAP数据模型HOLAP(HybridOL3.3多维数据的显示3.3.1多维数据显示方法3.3.2多维类型结构(MTS)3.3.3多维数据的分析视图273.3多维数据的显示3.3.1多维数据显示方法273.3.1多维数据显示方法多维数据的显示只能在平面上展现出来。三维数据无法在平面上展现出来。三维数据显示见表3.6所示。283.3.1多维数据显示方法多维数据的显示只能在平面上展现出产品名地区 时间销售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服广州1月150衣服广州2月250衣服广州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋广州1月150鞋广州2月250鞋广州3月300…………29产品名地区 时间销售量衣服北京1月100衣服北京2月200衣3.3.2多维类型结构(MTS)表示方法是:每一个维度用一条线段来表示。维度中的每一个成员都用线段上的一个单位区间来表示。例如,用三个线段分别表示时间、产品和指标三个维的多维类型结构如图3.3所示。303.3.2多维类型结构(MTS)表示方法是:每一个维度用一在图3.3多维类型结构(MTS)中,指定时间维成员是3月,产品维成员是鞋,指标维成员是销售量,这样它代表了三维数据总得一个空间数据点,如图3.4所示。31在图3.3多维类型结构(MTS)中,指定时间维成员是3月,产3.3.3多维数据的分析视图在平面的屏幕上显示多维数据,是利用行、列和页面三个显示组来表示的。例如,对上例的四维MTS实例,在页面上选定商店维度中“商店3”,在行中选定时间维的“1月、2月、3月”共3个成员,在列中选定产品维中的“上衣、裤、帽子”三个成员,以及指标维中的“固定成本、直接销售”二个成员。该四维数据的显示如图3.6所示。商店3(页面)上衣裤帽子直接销售固定成本直接销售固定成本直接销售固定成本1月4503505504505004002月3802804603604003203月400310480410450400323.3.3多维数据的分析视图在平面的屏幕上显示多维数据,是利对于更多维度的数据显示,需要选择维度及其成员分布在行或者列中。在页面上可以选定多个维度,但每个维度只能显示一个成员。在行或者列中一般只选择二个维,每个维可以多个成员。例如,对6个维度数据,它的MTS如图3.7所示。33对于更多维度的数据显示,需要选择维度及其成员分布在行或者列中对以上6维数据中,设定页面维度为商店的成员是“商店3”,客户维度成员是“老年”。行维度含时间维和产品维共2个维度,其中时间维中成员为“1月、2月、3月”。产品维中成员为“桌子、台灯”。列维度含指标维和场景维共2个维度,其中指标维中成员为“直接销售、间接销售、总销售”。场景维中成员为“实际、计划”。具体的显示数据如图3.8所示。商店3,老年(页面)直接销售间接销售总销售实际计划实际计划实际计划1月桌子250300125150375450台灯2653201331604004802月桌子333400167200500600台灯2833401421704255103月桌子350420175210525630台灯25030012515037545034对以上6维数据中,设定页面维度为商店的成员是“商店3”,客户3.4OALP的多维数据分析3.4.1多维数据分析的基本操作3.4.2广义OLAP功能3.4.3多维数据分析实例353.4OALP的多维数据分析3.4.1多维数据分析的基本操作例如,以“产品、城市、时间”三维数据,如图36例如,以“产品、城市、时间”三维数据,如图363.4.1多维数据分析的基本操作

1.切片选定多维数组的一个二维子集的操作叫做切片。例如:对三维数据,通过“切片”,分别从城市和产品等不同的角度观察销售情况:

373.4.1多维数据分析的基本操作1.切片372.切块切块有两种情况:(1)在多维数组的某一个维上选定某一区间的维成员的操作切块可以看成是在切片的基础上,确定某一个维成员的区间得到的片段,也即由多个切片叠合起来。(2)选定多维数组的一个三维子集的操作在多维数组(维1,维2,……,维n,变量)中选定3个维,维i、维j、维k,在这3个维上分别取一个区间,或任意维成员,而其它维都取定一个维成员。382.切块切块有两种情况:383.钻取钻取有向下钻取(drilldown)和向上钻取(drillup)操作。向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据。向上钻取获取概括性的数据。393.钻取钻取有向下钻取(drilldown)和向上钻取(钻取:例如,2005年各部门销售收入表如下:40钻取:例如,2005年各部门销售收入表如下:40对时间维进行下钻操作,获得新表如下:2005年部门1季度2季度3季度4季度部门1200200350150部门225050150150部门320015018027041对时间维进行下钻操作,获得新表如下:2005年部门1季度2季4.旋转通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去。或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)424.旋转通过旋转可以得到不同视角的数据。旋转操作相当于平面数旋转时间维产品维产品维时间维(a)行列交换旋转以改变显示布局时间维地区维产品维时间维产品维地区维43旋转时间维产品维产品维时间维(a)行列交换旋转以改变时间维旋转前的数据实例旋转后的数据旋转后再切片44旋转前的数据实例旋转后的数据旋转后再切片443.4.2广义OLAP功能

1、基本代理操作

当系统处于某种特殊状态时“代理”提醒分析员。

(1)示警报告

定义一些条件,一但条件满足,系统会提醒分析员去做分析。如每日报告完成或月定货完成等通知分析员作分析。(2)时间报告按日历和时钟提醒分析员。

(3)异常报告

当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。453.4.2广义OLAP功能1、基本代理操作452.数据分析模型E.F.Codd将数据模型分为4类模型:(1)绝对模型通过比较历史数据值或行为来描述过去发生的事实。绝对模型只能对历史数据进行比较,并且利用回归分析等一些分析方法得出趋势信息。462.数据分析模型E.F.Codd将数据模型分为4类模型:(2)解释模型利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。

假设今年销售量下降,那么解释模型应当能找出原因,即下滑与时间、地区、商品及销售渠道四者中的何种因素有关。47(2)解释模型利用系统已有的多层次的综合路径层层细化,找出事(3)思考模型说明在一维或多维上引入一组具体变量或参数后将会发生什么。例如该公司决策者为了了解某商品的销售量是否与顾客的年龄有关,引入了行变量-年龄,即在当前的多维视图上增加了顾客的年龄维。48(3)思考模型说明在一维或多维上引入一组具体变量或参数后将会(4)公式模型该模型表示在多个维上,需要引入哪些变量或参数,以及引入后所产生的结果。公式模型自动完成上述变量引入工作,从而最终找出与销量有关的全部因素,并给出了引入后的结果。49(4)公式模型该模型表示在多个维上,需要引入哪些变量或参数,3.商业分析模型具体的商业分析模型有:(1)分销渠道的分析模型(2)客户利润贡献度模型(3)客户关系(信用)优化模型(4)风险评估模型503.商业分析模型具体的商业分析模型有:50(1)分销渠道的分析模型通过客户、渠道、产品或服务三者之间的关系,了解客户的购买行为、客户和渠道对业务收入的贡献、哪些客户比较喜好由什么渠道在何时和银行打交道。为此,银行需要建立客户购买倾向模型和渠道喜好模型等。51(1)分销渠道的分析模型通过客户、渠道、产品或服务三者之间的(2)客户利润贡献度模型通过该模型能了解每一位客户对银行的总利润贡献度。知道哪些利润高的客户需要留住,采用什么方法留住客户,交叉销售改善客户的利润贡献度,哪些客户应该争取,完成个性化服务。52(2)客户利润贡献度模型通过该模型能了解每一位客户对(3)客户关系(信用)优化模型银行对客户的每一笔交易中,知道客户需要什么产品或服务,例如,定期存款是希望退休养老使用,申请信用卡需要现金消费,询问放贷利息需要住房贷款等。通过模型计算,主动地对客户沟通并进行交叉销售,达到留住客户和增加利润的目标。53(3)客户关系(信用)优化模型银行对客户的每一笔交易中,知道(4)风险评估模型模拟风险和利润间的关系,建立风险评估的数学模型,在满足高利润、低风险客户需求的前提下,达到银行收益的极大化。54(4)风险评估模型模拟风险和利润间的关系,建立风险评估的数学

假设有一个5维数据模型,5个维分别为:商店,方案,部门,时间,销售。

1.多维数据存储

在指定“商店=ALL,方案=现有”情况的三维表(行为部门,列为时间和销售量)3.4.3多维数据分析实例

55假设有一个5维数据模型,5个维分别为:商店,方案

20042005%增长率销售量利润增长%销售量利润增长%销售量利润增长服装234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽车375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三维表

56

20042005%增长率销售量利润增长%销售量利润增长%销

20042005%增长率销售利润增长%销售利润增长%销售利润增长汽车375,09822.4325,40227.2(13.2)21.4维修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音乐63,7678.222,07114.2(63.4)7.3

2、向下钻取对汽车部门向下钻取出具体项目的销售情况和利润增长情况。

57

20042005%增长率销售利润增长%销售利润增长%销售利

2005销售量服装381,102家具66,005汽车325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不显示

58

2005销售量服装381,102家具66,005汽车325

2005销售量现有计划差量差量%服装381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽车325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋转表这次旋转操作得到2005年的交叉表方案为:现有、计划、差量、差量%。59

2005销售量现有计划差量差量%服装381,102350,3.5OLAP结构与分析工具3.5.1OLAP结构3.5.2OLAP的Web结构603.5OLAP结构与分析工具3.5.1OLAP结构603.5.1OLAP结构1.OLAP逻辑结构(1)OLAP视图:对于用户来说他是数据仓库或数据集市中数据的多维数据表示,不管数据怎样存储和存储在何处。(2)数据存储:要求选择数据实际存储的方式和实际存储的位置,两种常用的选择是多维数据存储和关系数据存储。613.5.1OLAP结构1.OLAP逻辑结构(1)OLAP视2.OLAP物理结构多维数据存储放在OLAP服务器中,抽取数据仓库中的数据,然后将其转换成多维数据结构,并把OLAP服务器传给客户端,这时客户端就变成”瘦“客户端,这是一种经典的三层结构。多维数据存储于客户端,数据分析也在客户端,这样就形成了“胖”客户端622.OLAP物理结构多维数据存储放在OLAP服务器中,抽取数3.5.2OLAP的Web结构数据仓库系统OLAP服务器Web服务器客户浏览器CGIAPIHTMLJavaappletsActiveXcontrolJavascipt当使用web结构组织OLAP应用时,其组织结构如图所示。Web服务器负责完成浏览器与OLAP服务器、数据仓库系统之间的通信连接。633.5.2OLAP的Web结构数据仓库系统OLAP服务器W3.5.3OLAP工具及评价目前许多公司已经推出了相应的OLAP支持工具,如ORACLE、IBM、BusinessObject、SAS、NCR等等。OLAP服务器和工具可以按以下五个方面来进行评价:特征和功能、访问性能、OLAP服务引擎、管理以及全局结构视图。用户可以从这五个方面分析市场上的OLAP产品,也可以把它们作为应用系统中OLAP需求分析指标。643.5.3OLAP工具及评价目前许多公司已经推出了相应的OOLAP服务器和工具应能完成以下功能:支持多维和维中的层次;聚集、概括、预计算和导出数据;提供计算逻辑、公式和分析过程;提供比较分析能力;进行跨维计算;沿单个或多个维的轴以及交叉表等来进行细剖和浏览。65OLAP服务器和工具应能完成以下功能:支持多维和维中的层次;习题1、2、3、5、9、12、14、15、1866习题1、2、3、5、9、12、14、15、1866第3章联机分析处理

3.1OLAP概念3.2OLAP的数据模型3.3多维数据的显示3.4多维数据分析3.5OLAP的结构与分析工具67第3章联机分析处理

3.1OLAP概念1

联机分析处理(OnLineAnalyticalProcessing,OLAP)在数据仓库系统中,联机分析处理是重要的数据分析工具。

OLAP的基本思想是从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。68联机分析处理(OnLineAnalytic3.1OLAP概念

OLAP是在OLTP的基础上发展起来的。

OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。

OLAP是以数据仓库为基础的数据分析处理。它有两个特点:一是在线性(OnLine),由客户机/服务器这种体系结构来完成的;二是多维分析,这也是OLAP的核心所在。693.1OLAP概念OLAP是在OLTP的基础上发3.1.1OLAP定义1.OLAP理事会给出的定义联机分析处理(OLAP)是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面。703.1.1OLAP定义1.OLAP理事会给出的定义42.OLAP的简单定义

联机分析处理是共享多维信息的快速分析。它体现了四个特征:(1)快速性:用户对OLAP的快速反应能力有很高的要求。(2)可分析性:OLAP系统应能处理任何逻辑分析和统计分析。(3)多维性:系统必须提供对数据分析的多维视图和分析。(4)信息性:OLAP系统应能及时获得信息,并且管理大容量的信息。

712.OLAP的简单定义联机分析处理是共

1993年,E.F.Codd提出OLAP的12条准则,用来评价分析处理工具,这也是他继关系数据库和分布式数据库提出的两个“12条准则”后提出的第三个“12条准则”。其主要的准则有:多维数据分析;客户/服务器结构;多用户支持;一致的报表性能等。

3.1.2OLAP准则

721993年,E.F.Codd提出OLAP的12条准则1.多维概念视图企业的数据空间本身就是多维的。因此OLAP的概念模型也应是多维的。用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的联合(概括和聚集)分析。731.多维概念视图企业的数据空间本身就是多维的。因此OLAP的4.一致稳定的报表性能

报表操作不应随维数增加而削弱,即当数据维数和数据的综合层次增加时,提供的报表能力和响应速度不应该有明显的降低。

744.一致稳定的报表性能报表操作不应随维数增加而削弱5.客户/服务器体系结构

OLAP是建立在客户/服务器体系结构上的。

多维数据库服务器能够被不同的应用和工具所访问。

客户端负责应用逻辑及用户界面。755.客户/服务器体系结构OLAP是建立在客户/服务

8.多用户支持能力

当多个用户要在同一分析模式上并行工作,OLAP工具应能够提供并发访问等功能。

11.灵活的报表生成

报表必须充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。768.多用户支持能力10

OLAP是针对特定问题的联机数据访问和分析。

(1)变量:变量是数据的实际意义,即描述数据“是什么”。

(2)维:维是人们观察数据的特定角度。如产品维、顾客维、时间维等。

(3)维的层次:数据的细节不同程度为维的层次。如日、月、季、年是时间维的层次。

(4)维成员:维的一个取值称为该维的一个维成员。如“某年某月某日”是时间维的一个成员。

3.1.3OLAP的基本概念

77OLAP是针对特定问题的联机数据访问和分析。3.1(5)多维数组:一个多维数组可以表示为:(维1,维2,……,维n,变量)一个4维的结构,即(产品,地区,时间,销售渠道,销售额)。(6)数据单元(单元格):多维数组的取值称为数据单元。如:4维数据单元(牙膏,上海,1998年12月,批发,销售额为100000)。

OLAP的基本概念(续)78(5)多维数组:一个多维数组可以表示为:OLAP的基本概念(3.2OLAP的数据模型

3.2.1MOLAP数据模型3.2.2ROLAP数据模型3.2.3MOLAP与ROLAP的比较3.2.4HOLAP数据模型793.2OLAP的数据模型3.2.1MOLAP数据模型133.2.1MOLAP的数据模型

MOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,采用类似于多维数组的结构。例如,二维MDDB(数组,即矩阵)的数据组织见表3.1所示。

北京上海广州衣服600700500鞋800900700帽子10020080表3.1MOLAP的数据模型803.2.1MOLAP的数据模型MOLAP是基于多维在查询中除查询一般的“衣服在广州的销售量”外,有时查询“衣服的总销售量”等问题,涉及到多个数据项求和,如果采取临时进行累加,会使查询效率大大降低,为此需增加汇总数据项。

北京上海广州总和衣服6007005001800鞋8009007002400帽子10020080380总和1500180012804580表多维数据库中晗综合数据的组织81在查询中除查询一般的“衣服在广州的销售量”外,有时3.2.2ROLAP数据模型ROLAP是基于关系数据库的OLAP。它是一个平面结构,用关系数据库表示多维数据时,采用星型模型。823.2.2ROLAP数据模型ROLAP是基于关系数据库的OL产品名地区销售量衣服北京600衣服上海700衣服广州500鞋北京800鞋上海900鞋广州700帽子北京100帽子上海200帽子广州80表3.3关系数据库RDBMS数据组织83产品名地区销售量衣服北京600衣服上海700衣服广州500鞋3.2.3MOLAP与ROLAP的比较1.数据存取速度2.数据存储的容量3.多维计算的能力4.维度变化的适应性5.数据变化的适应性6.软硬件平台的适应性7.元数据管理843.2.3MOLAP与ROLAP的比较1.数据存取速度181.数据存取速度ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。

MOLAP在数据存储速度上性能好,响应速度快。851.数据存取速度ROLAP服务器需要将SQL语句转化为多维存2.数据存储的容量ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。MOLAP通常采用多平面叠加成立体的方式存放数据。当数据量超过操作系统最大文件长度时,需要进行数据分割。多维数据库的数据量级难以达到太大的字节级。862.数据存储的容量ROLAP使用的传统关系数据库的存储方法,3.多维计算的能力MOLAP能够支持高性能的决策支持计算。ROLAP无法完成多行的计算和维之间的计算。873.多维计算的能力MOLAP能够支持高性能的决策支持计算。24.维度变化的适应性MOLAP增加新的维度,则多维数据库通常需要重新建立。ROLAP对于维表的变更有很好的适应性。884.维度变化的适应性MOLAP增加新的维度,则多维数据库通常5.数据变化的适应性当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。在ROLAP中灵活性较好,对于数据变化的适应性高。895.数据变化的适应性当数据频繁的变化时,MOLAP需要进行大6.软硬件平台的适应性ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。7.元数据管理目前在元数据的管理,MOLAP和ROLAP都没有成形的标准。906.软硬件平台的适应性24MOLAP和ROLAP的对比简表MOLAPROLAP固定维可变维维交叉计算多维视图行级计算超大型数据库读-写应用维数据变化速度快数据集市数据仓库91MOLAP和ROLAP的对比简表MOLAPROLAP固定维可3.2.4HOLAP数据模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之间。在HOLAP中,对最常用的维度和维层次,使用多维数据表来存储,对于用户不常用的维度和数据,采用ROLAP星型结构来存储。在HOLAP的多维数据表中的数据维度少于MOLAP中的维度表,数据存储容量也少于MOLAP方式。HOLAP在数据存取速度上又低于MOLAP。923.2.4HOLAP数据模型HOLAP(HybridOL3.3多维数据的显示3.3.1多维数据显示方法3.3.2多维类型结构(MTS)3.3.3多维数据的分析视图933.3多维数据的显示3.3.1多维数据显示方法273.3.1多维数据显示方法多维数据的显示只能在平面上展现出来。三维数据无法在平面上展现出来。三维数据显示见表3.6所示。943.3.1多维数据显示方法多维数据的显示只能在平面上展现出产品名地区 时间销售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服广州1月150衣服广州2月250衣服广州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋广州1月150鞋广州2月250鞋广州3月300…………95产品名地区 时间销售量衣服北京1月100衣服北京2月200衣3.3.2多维类型结构(MTS)表示方法是:每一个维度用一条线段来表示。维度中的每一个成员都用线段上的一个单位区间来表示。例如,用三个线段分别表示时间、产品和指标三个维的多维类型结构如图3.3所示。963.3.2多维类型结构(MTS)表示方法是:每一个维度用一在图3.3多维类型结构(MTS)中,指定时间维成员是3月,产品维成员是鞋,指标维成员是销售量,这样它代表了三维数据总得一个空间数据点,如图3.4所示。97在图3.3多维类型结构(MTS)中,指定时间维成员是3月,产3.3.3多维数据的分析视图在平面的屏幕上显示多维数据,是利用行、列和页面三个显示组来表示的。例如,对上例的四维MTS实例,在页面上选定商店维度中“商店3”,在行中选定时间维的“1月、2月、3月”共3个成员,在列中选定产品维中的“上衣、裤、帽子”三个成员,以及指标维中的“固定成本、直接销售”二个成员。该四维数据的显示如图3.6所示。商店3(页面)上衣裤帽子直接销售固定成本直接销售固定成本直接销售固定成本1月4503505504505004002月3802804603604003203月400310480410450400983.3.3多维数据的分析视图在平面的屏幕上显示多维数据,是利对于更多维度的数据显示,需要选择维度及其成员分布在行或者列中。在页面上可以选定多个维度,但每个维度只能显示一个成员。在行或者列中一般只选择二个维,每个维可以多个成员。例如,对6个维度数据,它的MTS如图3.7所示。99对于更多维度的数据显示,需要选择维度及其成员分布在行或者列中对以上6维数据中,设定页面维度为商店的成员是“商店3”,客户维度成员是“老年”。行维度含时间维和产品维共2个维度,其中时间维中成员为“1月、2月、3月”。产品维中成员为“桌子、台灯”。列维度含指标维和场景维共2个维度,其中指标维中成员为“直接销售、间接销售、总销售”。场景维中成员为“实际、计划”。具体的显示数据如图3.8所示。商店3,老年(页面)直接销售间接销售总销售实际计划实际计划实际计划1月桌子250300125150375450台灯2653201331604004802月桌子333400167200500600台灯2833401421704255103月桌子350420175210525630台灯250300125150375450100对以上6维数据中,设定页面维度为商店的成员是“商店3”,客户3.4OALP的多维数据分析3.4.1多维数据分析的基本操作3.4.2广义OLAP功能3.4.3多维数据分析实例1013.4OALP的多维数据分析3.4.1多维数据分析的基本操作例如,以“产品、城市、时间”三维数据,如图102例如,以“产品、城市、时间”三维数据,如图363.4.1多维数据分析的基本操作

1.切片选定多维数组的一个二维子集的操作叫做切片。例如:对三维数据,通过“切片”,分别从城市和产品等不同的角度观察销售情况:

1033.4.1多维数据分析的基本操作1.切片372.切块切块有两种情况:(1)在多维数组的某一个维上选定某一区间的维成员的操作切块可以看成是在切片的基础上,确定某一个维成员的区间得到的片段,也即由多个切片叠合起来。(2)选定多维数组的一个三维子集的操作在多维数组(维1,维2,……,维n,变量)中选定3个维,维i、维j、维k,在这3个维上分别取一个区间,或任意维成员,而其它维都取定一个维成员。1042.切块切块有两种情况:383.钻取钻取有向下钻取(drilldown)和向上钻取(drillup)操作。向下钻取是使用户在多层数据中能通过导航信息而获得更多的细节性数据。向上钻取获取概括性的数据。1053.钻取钻取有向下钻取(drilldown)和向上钻取(钻取:例如,2005年各部门销售收入表如下:106钻取:例如,2005年各部门销售收入表如下:40对时间维进行下钻操作,获得新表如下:2005年部门1季度2季度3季度4季度部门1200200350150部门225050150150部门3200150180270107对时间维进行下钻操作,获得新表如下:2005年部门1季度2季4.旋转通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去。或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)1084.旋转通过旋转可以得到不同视角的数据。旋转操作相当于平面数旋转时间维产品维产品维时间维(a)行列交换旋转以改变显示布局时间维地区维产品维时间维产品维地区维109旋转时间维产品维产品维时间维(a)行列交换旋转以改变时间维旋转前的数据实例旋转后的数据旋转后再切片110旋转前的数据实例旋转后的数据旋转后再切片443.4.2广义OLAP功能

1、基本代理操作

当系统处于某种特殊状态时“代理”提醒分析员。

(1)示警报告

定义一些条件,一但条件满足,系统会提醒分析员去做分析。如每日报告完成或月定货完成等通知分析员作分析。(2)时间报告按日历和时钟提醒分析员。

(3)异常报告

当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。1113.4.2广义OLAP功能1、基本代理操作452.数据分析模型E.F.Codd将数据模型分为4类模型:(1)绝对模型通过比较历史数据值或行为来描述过去发生的事实。绝对模型只能对历史数据进行比较,并且利用回归分析等一些分析方法得出趋势信息。1122.数据分析模型E.F.Codd将数据模型分为4类模型:(2)解释模型利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。

假设今年销售量下降,那么解释模型应当能找出原因,即下滑与时间、地区、商品及销售渠道四者中的何种因素有关。113(2)解释模型利用系统已有的多层次的综合路径层层细化,找出事(3)思考模型说明在一维或多维上引入一组具体变量或参数后将会发生什么。例如该公司决策者为了了解某商品的销售量是否与顾客的年龄有关,引入了行变量-年龄,即在当前的多维视图上增加了顾客的年龄维。114(3)思考模型说明在一维或多维上引入一组具体变量或参数后将会(4)公式模型该模型表示在多个维上,需要引入哪些变量或参数,以及引入后所产生的结果。公式模型自动完成上述变量引入工作,从而最终找出与销量有关的全部因素,并给出了引入后的结果。115(4)公式模型该模型表示在多个维上,需要引入哪些变量或参数,3.商业分析模型具体的商业分析模型有:(1)分销渠道的分析模型(2)客户利润贡献度模型(3)客户关系(信用)优化模型(4)风险评估模型1163.商业分析模型具体的商业分析模型有:50(1)分销渠道的分析模型通过客户、渠道、产品或服务三者之间的关系,了解客户的购买行为、客户和渠道对业务收入的贡献、哪些客户比较喜好由什么渠道在何时和银行打交道。为此,银行需要建立客户购买倾向模型和渠道喜好模型等。117(1)分销渠道的分析模型通过客户、渠道、产品或服务三者之间的(2)客户利润贡献度模型通过该模型能了解每一位客户对银行的总利润贡献度。知道哪些利润高的客户需要留住,采用什么方法留住客户,交叉销售改善客户的利润贡献度,哪些客户应该争取,完成个性化服务。118(2)客户利润贡献度模型通过该模型能了解每一位客户对(3)客户关系(信用)优化模型银行对客户的每一笔交易中,知道客户需要什么产品或服务,例如,定期存款是希望退休养老使用,申请信用卡需要现金消费,询问放贷利息需要住房贷款等。通过模型计算,主动地对客户沟通并进行交叉销售,达到留住客户和增加利润的目标。119(3)客户关系(信用)优化模型银行对客户的每一笔交易中,知道(4)风险评估模型模拟风险和利润间的关系,建立风险评估的数学模型,在满足高利润、低风险客户需求的前提下,达到银行收益的极大化。120(4)风险评估模型模拟风险和利润间的关系,建立风险评估的数学

假设有一个5维数据模型,5个维分别为:商店,方案,部门,时间,销售。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论