oracle与ibm的数据仓库比较_第1页
oracle与ibm的数据仓库比较_第2页
oracle与ibm的数据仓库比较_第3页
oracle与ibm的数据仓库比较_第4页
oracle与ibm的数据仓库比较_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京市*局项目(数据仓库)数据仓库比较项目编号:北控伟仕,2004Page PAGE 12 of NUMPAGES 12数据仓库比比较Oraclle vss DB22TOC o 1-3 h z HYPERLINK l _Toc90199345 1文档简简介 PAGEREF _Toc90199345 h 3 HYPERLINK l _Toc90199346 1.1文文档目的 PAGEREF _Toc90199346 h 3 HYPERLINK l _Toc90199347 1.2文文档范围 PAGEREF _Toc90199347 h 3 HYPERLINK l _Toc90199348 1.3

2、缩缩写约定 PAGEREF _Toc90199348 h 3 HYPERLINK l _Toc90199349 1.4参参考文档和和文献 PAGEREF _Toc90199349 h 3 HYPERLINK l _Toc90199350 1.5文文档概述 PAGEREF _Toc90199350 h 4 HYPERLINK l _Toc901993351 2相关的产产品比较 PAGEREF _Toc90199351 h 5 HYPERLINK l _Toc90199352 2.1数数据仓库 PAGEREF _Toc90199352 h 5 HYPERLINK l _Toc90199353 2.

3、2EETL工具具 PAGEREF _Toc90199353 h 5 HYPERLINK l _Toc90199354 2.3OOLAP PAGEREF _Toc90199354 h 6 HYPERLINK l _Toc90199355 2.4展展示工具 PAGEREF _Toc90199355 h 6 HYPERLINK l _Toc90199356 3开发过过程 PAGEREF _Toc90199356 h 7 HYPERLINK l _Toc90199357 3.1OOraclle的开发发过程 PAGEREF _Toc90199357 h 7 HYPERLINK l _Tocc901999

4、3588 3.2DB2的开开发过程 PAGEREF _Toc90199358 h 7 HYPERLINK l _Toc90199359 4应用性性 PAGEREF _Toc90199359 h 7文档简介文档目的此文档,用用来介绍OOraclle的数据据仓库产品品与IBMM公司数据据仓库产品品的比较文文档。通过本文文,使开发发团队及最最终使用者者对两个数数据仓库有有初步的认认识,为数数据仓库及及相关产品品的选择提提供依据。文档范围所以文中没没有具体实实施的细节节,适用读读者:开发人员项目经理开发经理最终用户缩写约定缩写描述IDSInterrnet Deveelopeer SuuiteOWBOr

5、aclle Waarehoouse Buillder参考文档和和文献编号文档名称版本日期1DB2 vvs Orraclee(BI)2Data Wareehousse Centter AAppliicatiion IInteggratiion GGuidee 8.23文档概述本文档主要要是从各各各角度对OORACLLE的数据据仓库和IIBM的数数据仓库的的分析,下下面就两方方面的产品品做一下简简单的概述述:IBM IBM公公司提供了了一套基于于可视数据据仓库的商商业智能(BBI)解决决方案,包包括: WWarehhousee mannagerr、Esssbasee/DB22 OLAAP Seer

6、verr 5.00、IBMM DB22 UDBB,以及来来自第三方方的前端数数据展现工工具(如BBO)和数数据挖掘工工具(如SSAS)。其中, Warehhousee mannagerr是一个功功能很强的的集成环境境,既可用用于数据仓仓库建模和和元数据管管理,又可可用于数据据抽取、转转换、装载载和调度。Essbbase/DB2 OLAPP Serrver支支持“维”的定义和和数据装载载。Esssbasee/DB22 OLAAP Seerverr不是ROOLAP(RRelattionaal OLLAP)服服务器,而而是一个(RROLAPP和MOLLAP)混混合的HOOLAP服服务器,在在Essb

7、base完完成数据装装载后,数数据存放在在系统指定定的DB22 UDBB数据库中中。 严格说来,IIBM自己己并没有提提供完整的的数据仓库库解决方案案,该公司司采取的是是合作伙伴伴战略。也也就是说IIBM公司司在展现和和多维分析析上留有接接口,所有有第3方的的公司可以以利用这个个接口来连连接到IBBM的系统统中提取想想要的数据据.例如,它它的前端数数据展现工工具可以是是Busiinesss Objjectss的BO、Lotuus的Appproaach、CCognoos的Immprommptu或或IBM的的Querry Maanageementt Faccilitty;多维维分析工具具支持Arr

8、bor Softtwaree的Esssbasee和IBMM(与Arrbor联联合开发)的的DB2 OLAPP服务器;统计分析析工具采用用SAS系系统。 Oraclle Oraacle数数据仓库解解决方案主主要包括OOWB和OOraclle Diiscovvererr两个部分分。然而Exppresss 是和OOraclle 8ii配合使用用的OLAAP Seerverr。从Orraclee 9i开开始(包括括10g),OOraclle把OLLAP SServeer整合进进了数据库库,作为了了数据库的的一个选件件,Oraccle EExpreess SServeer是一个个MOLAAP (多多维O

9、LAAP)服务务器,它利利用多维模模型,存储储和管理多多维数据库库或多维高高速缓存,同同时也能够够访问多种种关系数据据库;OWWB(Waarehoouse buillder) 可以完成成数据仓库库建模和元元数据管理理,又可用用于数据抽抽取、转换换、装载和和调度以及及多维模型型的建立; Oraacle Disccoverrer属于于查询工具具是专门为为最终用户户设计的,分分为最终用用户版和管管理员版。 Disscoveerer是是Oraccle的OOLAP展展示工具,无无需编程。数据仓库ORACLLE采用Cluusterr体系结构构,多个节节点共享硬硬盘,存在在磁盘I/O瓶颈,可可伸缩性较较差,

10、少见见超过4个个节点的实实例。ORRACLEE基本上没没有真正TTB级的数数据仓库,客客户往往被被要求将其其海量数据据分解到多多个数据库库中。IBM采用用MPP体系系结构,每每个节点独独享各自的的硬盘空间间,各个节节点间通过过高速网络络交换数据据。可伸缩缩性强,最最多可以扩扩充到10000个节节点。国内内有32节节点的实例例,国外有有512节节点的实例例。每个数数据库中单单个表的大大小可以达达到5122GB*11000=500TTB。在全全球范围有有许多TBB级的数据据仓库。ETL工具具ORACLLE的ETTL工具使使用的是OOraclle Waarehoouse Buillder(OWB),

11、此工具具中做维过过程就是构构建星形结结构的过程程,在作mmappiing,执执行的过程程则是数据据抽取的过过程,全都都用Oraacle wareehousse Buuildeer来实现现。OWBB全部开发发过程通过过图形界面面完成,对对于简单的的数据转换换实现简单单,开发速速度快。但但是对于复复杂的转换换过程,由由于整个转转换过程全全部都是由由工具完成成,用户不不能干涉,导导致在转换换中一些复复杂查询速速度缓慢,而而且没有可可能优化。IBM WWarehhousee Mannagerr 是 IIBM 数数据仓库解解决方案的的重要组成成部分,它它主要由以以下几部分分功能组成成:数据访访问,数据据

12、转换,数数据分布,数数据存储,靠靠描述性数数据查找和和理解数据据,显示、分析和发发掘数据,数数据转换过过程的自动动化及其管管理。它缩缩短了复杂杂的海量数数据与有洞洞察力的商商务决策之之间的差距距。IBMM 的 WWarehhousee Mannagerr 可获取取的数据源源可以是 DB2 家族中的的任一数据据库,也可可以是Orraclee、Sybbase、Infoormixx、SQLL Serrver 数据库和和 IMSS、VSAAM 文件件系统;存存放数据仓仓库的数据据库可以是是 DB22 UDBB forr Winndowss NT、OS/22、AIXX/6000、HP-UX、SSun S

13、Solarris、SSCO、SSINIXX 和 DDB2/4400、DDB2 ffor OOS/3990;Waarehoouse Manaager 的管理平平台为 WWindoows NNT 和 OS/22;而且以以上适用的的平台仍在在不断地扩扩展。OLAPDB2 OOLAP Servver在线分析处处理(OLLAP)在在 IBMM 的商务务智能中扮扮演着重要要角色,IIBM 为为此提供一一个分析工工具-DDB2 OOLAP Servver,深深入最终用用户的业务务,对桌面面上的数据据进行实时时操作。DDB2 OOLAP Servver 是是一套独特特的商务工工具,能够够快速地分分布传统监监视

14、和报告告范围之外外的应用程程序数据。IBM DDB2 OOLAP Servver 是是一种功能能强大的工工具,结合合了业界领领先的 AArborr Esssbasee OLAAP 功能能以及 DDB2 的的可靠性、可管理性性和访问能能力。Arrbor Essbbase是是OLAPP市场领先先的厂商。同其它 OLAPP 相比,有有更多的前前端工具和和应用程序序利用了 Essbbase API,使使其成为事事实上的业业界标准。同大多数数基于 SSQL 的的应用程序序结合时,DDB2 OOLAP Servver 和和 Warrehouuse MManagger 将将为端用户户提供更多多的前端工工具和

15、业务务智能应用用程序选择择余地。如如今,用户户可以享受受到多种 OLAPP 应用程程序的优势势,如通过过 Arbbor 的的 OLAAP 引擎擎集成预算算功能,充充分利用机机构在相关关技术上的的投资,管管理基本设设施和 DDB2 数数据。通过集成 IBM的的Wareehousse Maanageer 和 DB2 OLAPP Serrver,这这套解决方方案将具有有三方面的的重要价值值: 完全全、自动地地把 OLLAP 集集成到数据据仓库,数数据抽取和和生成自动动地由规则则和数据源源支持,直直接进入 DB2 OLAPP Serrver 的立方体体。利用 Waarehoouse Manaager

16、OLAPP 版本还还有一项附附加收益,就就是在可视视化数据仓仓库上创建建了一个中中间信息仓仓库。这个个中间数据据仓库包含含干净、抽抽取的数据据,用来在在 OLAAP 系统统上装载多多维数据。一旦 OOLAP 系统装载载并上线,或或者作为干干净数据源源来进行 OLAPP 以外的的分析比如如查询客户户地址等,这这些中间数数据就可以以废弃。DB2 OOLAP Anallyzerr使用 DDB2 OOLAP Anallyzerr,可以达达到企业的的商业智智能化,并并提高信息息技术组织织的效率。信息技术术人员可以以让用户利利用分析和和报表的功功能获得他他们所需的的信息,而而不会失去去对信息、数据完整整性

17、、系统统性能和系系统安全的的控制。展示工具Oraclle的展示示工具是使使用Oraacle公公司的diiscovver工具具,使用此此工具,有有某些局限限性,实现现方式不灵灵活,且需需使用专用用前端工具具,开发复复杂。IBM采用用业界领先先的多维分分析服务器器OLAPP Serrver和和智能挖掘掘工具Inntellligennt Miiner。开放的前端端界面和开开发接口。IBM的展展示没有特特定的工具具,而是提提供标准的的数据借口口,它可以采取第三方方的展现工工具,或者者独立开发发展现工具具,比较灵灵活的实现现前端的展展现过程。开发过程Oraclle的开发发过程ORACLLE 的开开发过程

18、主主要分为两两大部分: 11.OWBB开发 2.IDS 开发 一.OOWB开发发过程: 11在开发之之前必须先先建立Owwb中的两个资资料档案库库,一个叫叫repoositoory,另另一个叫rruntiime rrepossitorry(运行行时资料档档案库)。其中reeposiitoryy用来存放放owb设设计过程中中的对象。Runttime repoositoory用来来存放运行行所需的数数据,包括括元数据、映射定义义、转换规规则等等。2 每个资资料档案库库都有相应应的用户。一般来说说至少需要要创建四个用用户:reeposiitoryy所有者、runttime repoositoory所

19、有有者、ruuntimme reeposiitoryy访问者、目标数据据库所有者者。 3 用用所有者用用户登陆到到OWB以以后就可以以创建一个个新的prrojecct, 在在新的prrojecct 里需需要创建数数据源(ssorucce),目标库(targget),位置(llocattion)4 系统配配置完成后后,进入到到开发阶段段,首先需需要制作维维表(diimenssion),此操作作的作用是是定义出维维表的表结结构以及维维表的层次次.部署的的时候系统统会在目标标数据库内内创建一个个维表(ttablee)用来存存放纬度数数据.5 维表定定义完成后后,需要定定义维表对对应的映射射(mapp

20、pingg),此操操作的作用用是制定从从数据源(soruuce)抽抽取符合那那些条件的的数据放到到维表中.在部署的的时候系统统会在目标标数据库内内创建一个个包(paackagge),(维表和维维表的maappinng是一一一对应的) 66 所有维维表都定义义完成后,需要定义义事实表(cubee), 此操作的的作用是定定义出事实实表的表结结构以及事事实表和维维表的关系系(也就是是星型结构构).部署署的时候系系统会在目目标数据库库内创建一一个事实表表(tabble)用用来存放度度量值. 77.事实表表定义完成成后,需要要定义事实实表对应的的映射(mmappiing),此操作的的作用是制制定从数据据

21、源(soorucee)抽取符符合那些条条件的数据据放到事实实表中.在在部署的时时候系统会会在目标数数据库内创创建一个包包(pacckagee),(事实表和和事实表的的mappping是是一一对应应的) 88执行所有有部署成功功的维表的的mappping,向维表内内插入数据据,成功后后在执行所所有部署成成功的事实实表的maappinng,向事事实表内插插入数据.ORACLLE的owwb 的整整个开发过过程完成了了数据的抽抽取.转换.装装载(ETTL)和星型结结构的构建建,在owwb的所有有操作没有有脱离开OORACLLE的数据据库. 二.IIDS开发发过程: 11在owbb的开发告告一段落后后,

22、我们就就可以进入入到展现工工具的开发发过程中来来,首先我我们需要进进入IDSS的Disscoveerer admiinisttratoor里,在在这里制定定一个EUUL用户,这个EUUL用户是是用来是用用来管理ddeskttop 的的,还做一一些层次管管理,例如如可以制定定一些计算算方式和管管理那些数数据可以显显示给用户户那些数据据不可以显显示给用户户看.2 在Diiscovvererr admminisstrattor里完完成了制定定工作后,我们就可可以进入IIDS的另另一个工具具进行展现现方面的开开发了(ddeskttop),进入这个个工具后,我们开始始制作展现现需要的表表单.3.在dee

23、sktoop里你所所能看到的的所有数据据项都是EEUL用户户给你的权权限,你可可以根据客客户的要求求去制作表表单,增加加一些特殊殊的计算项项,在这里里你可以使使用ORAACLE公公司提供给给你的所有有聚集函数数.ORACLLE的idds 工具具主要是用用来满足展展现方面的的需要,而而deskktop是是开发表单单的主要工工具.DB2的开开发过程IBM 的的开发过程程主要分为为三大部分分: 1 wareehousse maanageer开发22 olaap seerverr 开发33 BI开开发一.Warrehouuse mmanagger开发发过程:1.在DBB2数据库库内通过III工具和和O

24、RACCLE数据据库做好映映射,将OORACLLE数据库库内的所有有表映射到到DB2数数据库内.2.进入到到数据仓库库中心,首首先我们现现配置,在仓库源源内加入你你需要的数数据源表(也就是映映射过来的的ORACCLE表).3.接下来来我们需要要在内内加入你需需要的目标标表(也就就是在DBB2数据库库内创建的的事实表).4.我们现现在就可以以进入,在这里里我们来建建立一个主主题,这个个主题是的的作用是制制定一系列列的数据抽抽取和转换换的规则,将ORAACLE数数据库内的的原始记录录,经过EETL的过过程存放到到DB2数数据库的事事实表内.5.我现在在测试主题题无误后,可以进入入到运行界界面,点击

25、击运行该主主题,这样样数据仓库库就开始抽抽取数据到到目标表内内了,至此此在warrehouuse mmanagger里的的工作我们们就结束了了,现在我我们得到的的只是一些些过滤好的的原始数据据,至于这这些数据之之间到底有有什么关系系和结构,还有根据据什么来汇汇总,我们们需要到IIBM的EEssbaase aadminnistrratioon seerverr 这个工工具里来实实现它.二.OLAAP SEERVERR开发过程程:1.在打开开Essbbase admiinisttratiion sserveer之前我我们需要现现启动OLLAP SSEREVVER这个个服务,启启动它后,我们需要要再

26、启动 admiinisttratiion sserveer 的服服务,这样样我们就可可以进入到到 dmiinisttratiion cconsoole里开开发了. 2.进入后,我们选择择Essbbase anallyticc serrverss ,需要要新建立一一个appplicaationn,在这个个appllicattion里里还需要建建立一个ddatebbase ,建立完完这个daatebaase后我我们就可以以正是进入入OLAPP的开发中中. 3.我们现在在dateebasee里进入到到它的ouutlinne,在这这里我们可可以定义一一个主题到到底有那些些维(diimenssion),

27、和事实实数据(ddate loadd),当定定义完成后后我们就可可以制作规规则文件了了. 4.我们在ddatebbase 里选着rruless filles在制制定维和事事实数据的的规则文件件,制定完完成后就验验证和保存存. 5.在这里我我们可以选选着loaad daate 项项,来想你你的规则文文件中填入入数据,系系统会根据据你定义的的规则文件件和维与事事实数据之之间的关系系从DB22数据库内内抽取需要要的数据,loadd到文件中中,到此,OLAPP的工作我我们也开发发完成了.三.BI开开发过程: (注注:这里使使用的是第第三方BII产品北京博易易智软产品品 BI-PILOOT) 1. 开发

28、前需需要先安装装BI的产产品,BII-PILLOT BBUILDDER AAND BBI-PIILOT SERVVER, BUILLDER的的作用主要要用来开发发报表,SSERVEER主要用用来发布部部署报表和和在服务器器上建立服服务. 2. 进入到BBUILDDER PPROFEESSIOONAL 里我们需需要先配置置它与OLLAP SSERVEER 的连连接,新建建立一个项项目在项目目上选择新新建ODSS文件,在在这里需要要填写OLLAP的驱驱动和地址址,用户名名和密码,验证成功功后,这样样连接就建建立起来了了. 3. 连接建立立起来后我我们可以选选择需要的的OLAPP里的daatebaa

29、se,这这样我们还还需要在项项目上新建建立一个OOLAP 文件,在在这里我们们可以选择择需要的ddatebbase. 4. 现在就可可以制作交交叉报表了了新建立一一个报表,选择插入入交叉表,在这里我我们可以看看到dattebasse里的所所有的维表表和事实表表里的数据据点,可以以选择横表表头显示什什么,每列列显示什么么,制作完完成后可以以预览报表表, 5.开开发完成后后,就可以以发布和部部署了,现现在就需要要启动BII-PILLOT SSERVEER了.部部署以后就就可以通过过B/S结结构来观看看报表.3应用性性3.1OOraclle的OWWB和IBBM的waarehoouse manaage

30、r . OLLAP sserveer的比较较1总体理解解上:Oraclle的产品品使用图形形化界面,可可以快速设设计、部署署数据仓库库,上手比较容容易,理解解上比较快快一些,比比较适合出出学者.而IBM的的产品比较较多,安装装和配置还还有使用上上比较复杂杂,所有比比较适合有有一定的数数据库基础础和一定的的数据仓据据知识的人人来操作.2操作使用用上:Oraclle产品控控制上太严严禁,没有有多少发挥挥的余地,不可以修修改已生成成的SQLL. 而IBM产产品就可以修改改你生成的的任何SQQL,比较较开放.编编程人员可可以自己发发挥.3.从结构构上:Oraclle的WAAREHOOUSE BUILL

31、DER工工具可以完完成数据的的抽取转换换(ETLL)和多维维结构的建建立.而IBM的的ETL部部分是由WWAREHHOUSEE MANNAGERR完成的,多维结构构的建立是是由OLAAP SEERVERR来实现的的,这样会会需要多花花时间来掌掌握更多的的工具.4 数据结结构上:Oraclle的整个个流程都是是在操作OORACLLE的数据据库,已OORACLLE数据库库为基础,即使到了了展现的时时候数据的的保存还是是在数据库库里,对数数据库操作作比较频繁繁. 而而IBM在在 WARREHOUUSE MMANAGGER的操操作还是已已数据库为为基础,但是到了OLAPP SERVVER的时时候就可以

32、以脱离对数据库的操操作了,已已文件的形形式保存下下来. 5 流程顺序序上: Orraclee的整个流流程是先建建立维表和和事实表,然后建立立他们之间间的层次和和关系,最最后根据抽抽取条件从从数据源抽抽取数据放放到目标表表内,它的的ETL和和OLAPP的多维结结构是一步步完成的. 而IIBM是先先根据抽取取条件从源源数据库内内整理好数数据放到DDB2数据据库内,在在建立多维维的规则文文件,根据据多维的规规则文件再再从DB22数据库内内抽取数据据存放到最最终的一个个文件中.3.2由于于数据仓库库开发过程程相对复杂杂,在两个个产品的使使用过程中中都出现了了一些问题题。3.2.11 用ORAACLE开

33、开发过程中中遇到的问问题:在展现方面面oraccle 的的IDS工工具,在报报表的表头中无法实现现多层嵌套套和自定义义表头。增量抽取数数据有问题题,oraacle的的OWB工工具不能实实现自动定定时间增量量抽取数据据,只能人人工抽取数数据,这样样会给以后后的维护产产生问题。如果设计的的维比较多多,对于报报表查询的的性能会有有一定影响响,两者是是成正比的的,纬度越越多,性能能越底。所有数据全全部动态计计算,没有有预算机制制,延长了了统计时间间。在OWB工工具里作数数据抽取时时,如果主辅表表关联,会会产生统计计金额的加加倍的问题题。有关上月数数与同期数数的问题在IIDS里无无法解决。Oraclle提供的的聚集函数数并不能满足足这样的要求求。Owb工具具,如果今今后需求有有变动,需需要修改开开发成果从从新抽取数数据,但是是 owbb工 具 不支持修修改,只能能删除原来来的关系线线从新作,比比较耗费时时间。最大弱点,在OWBB的开发中中,如果数数据库或网网络断线,那就

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论