数据仓库第4章_第1页
数据仓库第4章_第2页
数据仓库第4章_第3页
数据仓库第4章_第4页
数据仓库第4章_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 4 章 OLAP 技术本章学习目标:(1)通过 OLAP 技术概念介绍了解 OLAP 的发展和特点。(2) 通过多维分析学习掌握多维的基本概念。(4)通过 OLAP 的实施掌握 OLAP 实施方法。(5)通过多维 OLAP 与关系 OLAP 的学习掌握多维 OLAP 与关系 OLAP 的概念。( 6 )通过 OLAP 技术评价学习掌握对 OLAP 技术的评价。第 4章章OLAP 技术术4.1OLAP技术概念念4.2OLAP与多维分分析4.3OLAP的的实施施4.4多维OLAP与关系OLAP4.5OLAP技术评价价练习4.1OLAP技术概念念在线分析析处理或或联机分分析处理理(线分析的的处理

2、上上的OLAP,)是一个应应用广泛泛的数据据仓库使使用技术术。两个特点点,在线线性(On_Line),多维分分析(Multi_Analysis),4.1.1OLAP的发展针对特定定问题的的联机数数据查询询和分析析对原始数数据按照照用户的的观点进进行转换换处理反映用户户眼中问问题某一一真实方方面(“维”)快速、稳稳定、一一致和交交互式的的存取允许用户户对这些些数据按按照需要要进行深深入的观观察4.1.2OLAP的的特性1.快速速性系统能在在数秒内内对用户户的多数数分析要要求做出出反应2.可分分析性用户无需需编程就就可以定定义新的的专门计计算,将将其作为为分析的的一部分分,并以以用户所所希望的的方

3、式给给出报告告3.多维维性提供对数数据分析析的多维维视图和和分析4.信息息性能及时获获得信息息,并且且管理大大容量信信息4.2OLAP与与多维维分析4.2.1多多维基本本概念维、维的的层次、维成员员、多维维数据集集、数据据单元、多维数数据集的的度量值值和聚集集1.维“上卷”“下钻”销售地区区西南华中华东四川云南河南湖北江苏上海4.2OLAP与与多维维分析2.多维维数据集集产品北京上海化化妆品品江苏玩玩具具服装电器1234时时间间(月)销售数量量:10000服装切片片3.维成成员维的一个个取值、不同维层层次取值值的组合合 、维维成员描描述所关关心的主主题在维维中的位位置数据单元元可以表表示为:(

4、维1维成员员,维2维成员员,维3维成员员,维4维成员员,观察察变量值值)4.多维维数据集集的度量量值多维数据据集的核核心值5.聚集集立方体中中包括很很多层次次,这些些层次可可以向用用户提供供某一层层次的概概括数据据通过聚集集,形成成基于维维的有决决策分析析意义的的一些数数据交集集4.2.2多多维分分析1.多维维的切片片(维1,维2,维i成员,维n,观察变变量)是是多维数数据集(维1,维2,维i,维n,观察变变量)在在维i上上的一个个切片2.多维维的切块块在(维1,维2,维i,维k,维n,观察察变量)多维数数据集上上,对维维i,维维k,选选定了维维成员,那(维维1,维维2,维维i成员员,维k成员

5、,维n,观察变变量)就就是多维维数据集集(维1,维2,维i,维k,维n,观察察变量)在维i,维k上的一一个切块块4.2.2多多维分分析3.旋转转2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市67735996736962944.2.2多多维分分析3.旋转转北京市上海市天津市2002年1季度123134672季度56103733季度4598594季度6687962003年1季度134102732季度56139693季度2397624季度5582944.2.2多多维分分析4.其它它OL

6、AP操作作“上卷”(roll_up)、“下下钻”(drill_down)、“钻过过”(drill_across)和“钻钻透”(drill_through)等等钻取操操作。“上卷”是指沿沿某一个个维的概概念分层层向上归归约;“下钻钻”是上上卷的逆逆向操作作,它是是沿某一一个维的的概念分分层向下下或引入入新的维维来实现现;“钻钻过”是是指对多多个事实实表进行行查询;“钻透透”是指指对立方方体操作作时,利利用数据据库关系系,钻透透立方体体的底层层,进入入后端的的关系表表。OLAP的其它它操作还还有统计计表中最最高值和和最低值值的项数数,计算算平均值值、增长长率、利利润、投投资回报报率等统统计计算算。

7、4.2.3维维的层层次关系系简单层次次复杂层次次全国江苏北京上海苏州市扬州市宝应县4.2.4维维的类类关系类的划分分,只能能依据同同一层次次的维成成员集合合来划分分维的层次次与类组组合图产品维产品大类产品用途类产品销地类产品产地类产品小类4.2.5OLAP与数数据仓库库关系从OLAP使用用的效率率角度考考虑,设设计数据据仓库时时考虑因因素。尽可能能使用星星型架构构,如果果采用雪雪花结构构,就要要最小化化事实表表底层维维度表以以后的维维度表数数量。为用户户设计包包含事实实表的维维度表。维度表表的设计计应该符符合通常常意义上上的范式式约束,维度表表中不要要出现无无关的数数据。事实表表中不要要包含汇

8、汇总数据据,事实实表中所所包含的的用户需需要访问问的数据据应该具具有必需需的粒度度。对事实实表和维维度表中中的关键键字必须须创建索索引;同同一种数数据尽可可能使用用一个事事实表。保证数数据的参参考完整整性,避避免事实实表中的的某些数数据行在在立方体体进行聚聚集运算算时没有有参加进进来。4.3OLAP的的实施业务处理系统 第三层 第二层 第一层 客户端数据抽取 数据清理 、转换 数据加载 多维化处理 可视化处理 图4.7数据仓库与OLAP关系图数据仓库OLAP服务器数据准备区4.4多多维维OLAP与关关系OLAP产品名称销售地区销售数量电器电器电器服装服装服装江苏上海北京江苏上海北京940450

9、3408303502704.4.1多维数据据库江苏上海北京电器服装9408304503503402704.4.1多多维数数据库产品名称销售地区销售数量电器电器电器电器服装服装服装服装汇总汇总汇总汇总江苏上海北京汇总江苏上海北京汇总江苏上海北京汇总9404503401730830350270145017708006103180江苏上海北京汇总电器服装汇总94083017704503508003402706101730145031804.4.2多多维数数据库的的数据存存储维数扩展展到三维维或更高高的维度度时,多多维数据据库MDDB就成了一一种“超超立方”体的结结构在MDDB中,其数数据的存存储是由

10、由许多类类似于数数组的对对象来完完成对象中包包含了经经过高度度压缩的的索引和和指针,利用这这些索引引和指针针将许多多存储数数据的单单元块联联结在一一起实际组合合中往往往由于各各种原因因会导致致某些组组合没有有具体的的值,或或值是空空的或者者为零。产生了多多维数据据库的稀稀疏矩阵阵问题4.4.3多多维数数据库与与数据仓仓库直接从业业务处理理系统中中抽取数数据问题:1.增加数据据抽取部部分的工工作量2.缺乏统一一的数据据源和结结论3.加大系统统的维护护工作量量4.缺乏对元元数据的的有效管管理5.加大OLAP系统的开开发投入入4.4.4MOLAP的的创建与与功能1.MOLAP的创建阶段:选择功能能确

11、定分析析数值构造分析析维定义逻辑辑模型2.MOLAP功能快速响应应能力与多维数数据库进进行交互互的能力力挖掘信息息间的内内在联系系各种模型型数据导航航能力4.4.5ROLAP实实现的三三个规则则1.支持OLAP原则2.数据存储储在某一一个关系系型数据据库中3.支持某种种形式的的聚集导导航4.4.6ROLAP的的多维表表示方法法1.星型模式式在关系系数据库库中的表表示 产品ID 时间ID 销售商ID 地址ID图4.8星型模式的关系数据库表示产品ID销售商ID地址ID时间ID销售数量销售成本总收入销售商维度表地理位置维表时间维表产品维表2.雪花花模式在在关系数数据库中中的表示示 产品维表 产品ID

12、 时间ID 销售商ID 地址ID图4.9雪花模式的关系数据库表示地理位置维表时间维表产品ID产品名称公司ID公司名称产品颜色ID产品颜色产品商标ID商标名称产品类型ID产品类型名销售商维度表产品ID销售商ID地址ID时间ID销售数量销售成本总收入产品ID公司ID产品颜色ID产品商标ID产品类型ID4.4.7ROLAP的的创建与与功能1.ROLAP的创建选择功能能、确定定分析数数值、构构造分析析维、定定义逻辑辑模型数据添加加、数据据管理、元数据据存储、应用工工具构造造2.ROLAP的功能提供基于于关系数数据的商商业视图图维层次支支持模型的自自定义细剖细节节层次数据的备备分恢复复和安全全功能元数据

13、导导航OLAP服务器性性能的协协调等功功能4.5OLAP技技术评价价4.5.1MOLAP与与ROLAP的的比较1.查询询性能2.数据据加载性性能3.分析析能力4.数据据集市的的大小5.维的的管理6.维护护能力4.5.2OLAP的衡衡量标准准1.多维维性2.直观观性3.可访访问性4.解释释性批处处理提取取5.OLAP分分析模型型6.客户户机/服服务器结结构性7.透明明性或开开放性8.多用用户性9.处理理非正规规数据性性4.5.2OLAP的衡衡量标准准10.存存储OLAP结结果11.提提取丢失失值12.处处理丢失失值13.弹弹性报告告14.一一致性能能报告15.对对物理层层的自动动调整16.通通用维17.无无限维与与聚合层层18.无无限制跨跨维操作作4.5.3OLAP服务务器和工工具的评评价标准准1.OLAP功功能2.访问问性能3.引擎擎功能4.管理理能力练习1.什么么是OLAP?OLAP是一一种技术术?还是是一种数数据库?2.OLAP的的系统结结构有哪哪几种?不同的的结构在在进行在在线分析析时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论