第5章:数据仓库的决策支持(2)_第1页
第5章:数据仓库的决策支持(2)_第2页
第5章:数据仓库的决策支持(2)_第3页
第5章:数据仓库的决策支持(2)_第4页
第5章:数据仓库的决策支持(2)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2第(第(2 2)部分)部分 5.2 5.2 * *联机分析处理联机分析处理 5.2.1 5.2.1 * *基本概念基本概念 1.1.定义定义 3. OLAP3. OLAP的基本概念的基本概念 5.2.3 5.2.3 * *OLAPOLAP的决策支持:多维数据分析的决策支持:多维数据分析 1.1.基本功能基本功能 3 联机分析处理联机分析处理(On Line Analytical On Line Analytical ProcessingProcessing,OLAPOLAP)的概念最早是由关系数据库之的概念最早是由关系数据库之父父E.F.CoddE.F.Codd于于19931993年提出的。

2、年提出的。 在数据仓库系统中,联机分析处理是重要的数在数据仓库系统中,联机分析处理是重要的数据分析工具。据分析工具。 OLAP OLAP的基本思想是从多方面和多角度以多维的的基本思想是从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。形式来观察企业的状态和了解企业的变化。45.3.1 基本概念基本概念 OLAP是在是在OLTP的基础上发展起来的。的基础上发展起来的。 OLTP是以数据库为基础的,面对的是操作人员是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等和低层管理人员,对基本数据的查询和增、删、改等进行处理。进行处理。 OLAP是以数据仓库为基

3、础的数据分析处理。它是以数据仓库为基础的数据分析处理。它有两个特点:有两个特点: 一是在线性(一是在线性(On Line),由客户机),由客户机/服务器这种服务器这种体系结构来完成的;体系结构来完成的; 二是多维分析,这也是二是多维分析,这也是OLAP的核心所在。的核心所在。 联机分析处理是共享多维信息的快速分析。联机分析处理是共享多维信息的快速分析。 它体现了四个特征:它体现了四个特征: (1)快速性)快速性:用户对用户对OLAP的快速反应能力有很高的要的快速反应能力有很高的要求。求。 (2)可分析性)可分析性:OLAP系统应能处理任何逻辑分析和统系统应能处理任何逻辑分析和统计分析。计分析。

4、 (3)多维性)多维性:系统必须提供对数据分析的多维视图和分系统必须提供对数据分析的多维视图和分析。析。 (4 4)信息性)信息性:OLAPOLAP系统应能及时获得信息,并且管理大系统应能及时获得信息,并且管理大容量的信息。容量的信息。 6 19931993年,年,E.F.CoddE.F.Codd提出提出OLAPOLAP的的1212条准则,其主条准则,其主要的准则有:多维数据分析;客户要的准则有:多维数据分析;客户/ /服务器结构;服务器结构;多用户支持;一致的报表性能等。多用户支持;一致的报表性能等。 71.1.多维概念视图多维概念视图n企业的数据空间本身就是多维的。因此企业的数据空间本身就

5、是多维的。因此OLAP的概念模型也应是多维的。的概念模型也应是多维的。n用户可以对多维数据模型进行切片、切用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的联合(概括块、旋转坐标或进行多维的联合(概括和聚集)分析。和聚集)分析。84.4.稳定的报表性能稳定的报表性能 报表操作不应随维数增加而削弱,报表操作不应随维数增加而削弱,即当数据维数和数据的综合层次增即当数据维数和数据的综合层次增加时,提供的报表能力和响应速度加时,提供的报表能力和响应速度不应该有明显的降低。不应该有明显的降低。 95客户/服务器体系结构 OLAP是建立在客户是建立在客户/ 服务器体系结构上服务器体系结构上的。的。

6、 要求多维数据库服务器能够被不同的应用要求多维数据库服务器能够被不同的应用和工具所访问。和工具所访问。10 8多用户支持多用户支持 当多个用户要在同一分析模式上并行工作,当多个用户要在同一分析模式上并行工作,需要这些功能的支持。需要这些功能的支持。 11灵活的报表生成灵活的报表生成 报表必须报表必须充分反映数据分析模型的多维充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。特征,并可按用户需要的方式来显示它。 OLAP OLAP是针对特定问题的联机数据访问和分析。是针对特定问题的联机数据访问和分析。 (1 1)变量)变量 :变量是数据的实际意义,即描述数据:变量是数据的实际意义,即

7、描述数据“是什么是什么”。 (2 2)维)维:维是人们观察数据的特定角度。如产品:维是人们观察数据的特定角度。如产品维、顾客维、时间维等。维、顾客维、时间维等。 (3 3)维的层次)维的层次:数据的细节不同程度为维的层次:数据的细节不同程度为维的层次。如日、月、季、年是时间维的层次。如日、月、季、年是时间维的层次。 (4 4)维成员)维成员:维的一个取值称为该维的一个维成:维的一个取值称为该维的一个维成员。如员。如“某年某月某日某年某月某日”是时间维的一个成员。是时间维的一个成员。 (5 5)多维数组)多维数组:一个多维数组可以表示为:一个多维数组可以表示为:(维(维1 1,维,维2 2,维,

8、维n n,变量),变量) 一个一个5 5维的结构,即(产品,地区,时间,销售维的结构,即(产品,地区,时间,销售渠道,销售额)。渠道,销售额)。(6 6)数据单元(单元格)数据单元(单元格): 多维数组的取值称为数据单元。多维数组的取值称为数据单元。 如:如:5 5维数据单元(牙膏,上海,维数据单元(牙膏,上海,19981998年年1212月,月,批发,销售额为批发,销售额为100000100000)。)。 (1 1)OLTPOLTPOLTPOLTP是低层人员利用计算机网络对数据库中的数据是低层人员利用计算机网络对数据库中的数据进行查询、增、删、改等操作,以完成事务处理工进行查询、增、删、改等

9、操作,以完成事务处理工作。作。OLTP利用数据库快速地处理具体业务。利用数据库快速地处理具体业务。OLTP应用应用要求多个查询并行。要求多个查询并行。 (2 2)OLAPOLAPOLAPOLAP是高层人员对数据仓库进行信息分析处理。是高层人员对数据仓库进行信息分析处理。 存取大量的数据存取大量的数据 包含聚集的数据包含聚集的数据 按层次对比不同时间周期的聚集数据按层次对比不同时间周期的聚集数据 以不同的方式来表现数据以不同的方式来表现数据 要包含数据元素之间的复杂的计算要包含数据元素之间的复杂的计算 能够快速的响应用户的查询能够快速的响应用户的查询 (3 3)OLAPOLAP与与OLTPOLT

10、P对比(对比表)对比(对比表)OLTPOLAP数据库数据数据仓库数据细节性数据综合性数据当前数据历史数据一次性处理的数据量小一次处理的数据量大对响应时间要求高响应时间合理用户数量大用户相对较少面向应用,事务驱动面向分析,分析驱动16 MOLAPMOLAP和和ROLAPROLAP是是OLAPOLAP的两种具体形式:的两种具体形式: ROLAPROLAP是基于关系数据库存储方式建立是基于关系数据库存储方式建立的的OLAPOLAP。 多维数据映射成平面型的关系表。采用多维数据映射成平面型的关系表。采用星型模型。星型模型。17 MOLAP MOLAP是基于多维数据库存储方式建是基于多维数据库存储方式建

11、立的立的OLAPOLAP;表现为;表现为“超立方超立方”结构,类结构,类似于多维数组的结构。似于多维数组的结构。 在分析中,需要在分析中,需要“旋转旋转”数据立方体数据立方体以及以及“切片切片” ” 、“切块切块”等操作。等操作。MOLAPMOLAP和和ROLAPROLAP的对比表的对比表MOLAPMOLAPROLAPROLAP固定维固定维可变维可变维维交叉计算维交叉计算多维视图多维视图行级计算行级计算超大型数据库超大型数据库读读- -写应用写应用维数据变化速度快维数据变化速度快数据集市数据集市数据仓库数据仓库19例如,以例如,以“产品、城市、时间产品、城市、时间”三维数据,如三维数据,如图图

12、时间城市产品电视机电冰箱广州上海9596 20 对三维数据,通过对三维数据,通过“切片切片” ” ,分别从城市和产,分别从城市和产品等不同的角度观察销售情况:品等不同的角度观察销售情况: 电视机电冰箱广州上海21钻取:例如,钻取:例如,19951995年各部门销售收入表如下:年各部门销售收入表如下:22对时间维进行下钻操作,获得新表如下:对时间维进行下钻操作,获得新表如下:231995年1996年部 门1季 度 2季 度 3季 度 4季 度 1季 度 2季 度 3季 度 4季 度部 门1200200350150120200250140部 门225050150150200180230120部 门

13、3200150180270180200170250旋转前的数据旋转前的数据241季度2季度3季度4季度部门95年96年95年96年95年96年95年96年部门1200120200200350250150140部门225020050180150230150120部门3200180150200180170270250旋转后的数据旋转后的数据251季度2季度3季度4季度年龄95年96年95年96年95年96年95年96年2010060805010050504050 x2030023011025027033020022050250210210280310270320250旋转后再切片旋转后再切片26

14、1 1、基本代理操作、基本代理操作 “代理代理”是一些智能性代理,当系统处于某种特殊状是一些智能性代理,当系统处于某种特殊状态时提醒分析员。态时提醒分析员。 (1 1)示警报告)示警报告 定义一些条件,一但条件满足,系统会提醒分析员去定义一些条件,一但条件满足,系统会提醒分析员去做分析。如每日报告完成或月定货完成等通知分析员作分做分析。如每日报告完成或月定货完成等通知分析员作分析。析。 (2 2)异常报告)异常报告 当超出边界条件时提醒分析员。如销售情况已超出预当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。定义阈值的上限或下限时提醒分析员。27 2 2、计算能

15、力、计算能力 计算引擎用于特定需求的计算或某种复杂计计算引擎用于特定需求的计算或某种复杂计算。算。 3 3、模型计算、模型计算 增加模型,如增加系统优化、统计分析、趋增加模型,如增加系统优化、统计分析、趋势分析等模型,以提高决策分析能力。势分析等模型,以提高决策分析能力。 28 假设有一个假设有一个5 5维数据模型,维数据模型,5 5个维分别为:商个维分别为:商店,方案,部门,时间,销售。店,方案,部门,时间,销售。 1 1三维表查询三维表查询 在指定在指定“商店商店=ALL=ALL,方案,方案= =现有现有”情况的三维情况的三维表(行为部门,列为时间和销售量)表(行为部门,列为时间和销售量)

16、 19941995%增长率销售量利润增长%销售量利润增长%销售量利润增长服装234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽车375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9 19941995%增长率增长率销售销售利润增利润增长长%销售销售利润增利润增长长%销售销售利润增利润增长长汽车汽车375,09822.4325,40227.2(13.2)21.4维修维修195,05114.2180,78615.0(7.3)5.6附件附件116,28043.9122,54547.55.38.2音乐音乐63,7678.222,07114.2(63.4)7.3 对汽车部门向下钻取出具体项目的销售情况和对汽车部门向下钻取出具体项目的销售情况和利润增长情况。利润增长情况。 1995Sales服装服装381,102家具家具66,005汽车汽车325,402所有其它所有其它306

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论