下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于的商场数据仓库系统架构研究摘要在完成商场数据仓库数据模型的设计与构建后,数据的抽取、转换、加载成为建立数据仓库最重要的工作。针对商场数据仓库对ETL技术的要求,在 研究 CWM工作机制的基础上,提出了基于CWM的商场数据仓库ETL系统架构的设计。通过 分析 CWM对ETL提供的技术支持,论证了系统架构的可行性和 科学 性。 关键词商场数据仓库ETL元数据CWMETL系统架构 商场数据仓库数据模型建立后,一个最重要的 问题 ,是如何把已有的、各种异构的操作型的海量数据,从各种操作型数据库系统中抽取出来,排除数据中的数据缺陷,完成一系列转换,最后将数据加载到数据仓库中,成为面向主题的、集成的、
2、 历史 的、不易娈的、综合的数据。为管理者提供决策支持的有用信息。国内外有 影响 力的大型商场 企业 纷纷率先建立自己的数据仓库或数据集市。以满足决策的需要。 一、ETL概述 ETL是数据抽取(Extract)、转换(Transform)、加载(Load)的简写,它是指:将各种异构数据源中的数据抽取出来,并将不同数据源的数据进行转换和整合,得出一致性的数据,然后加载到数据仓库中。ETL工具,是数据仓库系统的重要组成部分;是影响数据仓库系统成败的关键。 获取ETL工具有两个途径:利用现有商品化ETL工具,虽然能缩短系统的开发周期,但存在投资成本大,软件的针对性、通用性、兼容性差的问题。自行设计开
3、发一个标准通用的ETL工具,提高ETL的实用价值,降低项目实施的成本和风险,具有重要的意义。 由于数据仓库和数据源系统在数据格式、数据模型等方面存在很大差异,客观上形成数据仓库ETL实现过程很大的难度。在ETL的工作过程中,每步都和数据仓库元数据密切相关。 按照传统的定义,元数据(Metadata)是关于数据的数据。元数据支撑了数据仓库开发 应用 的全过程,成为数据从数据源到数据仓库的桥梁。 数据抽取阶段,没有相应的映射规则,就无法知道需要抽取什么样的数据;在将源数据存储格式转换为目标数据存储格式时,需要知道源存储格式和目标存储格式的信息,以及相应的存储格式之间的转换规则;在数据加载阶段,需要
4、知道目标数据仓库的数据结构和相关信息。所有这些信息,都需要元数据提供。 由此可见,ETL过程自始至终都需要元数据的支持和控制。正因为如此,要解决ETL开发中的问题,应当从相关的元数据着手。 二、关于CWM及其提供的工作机制 CWM(CommonWarehouseMetamodel公共仓库元模型)是国际对象管理集团OMG推出的数据仓库元数据管理规范。CWM的主要目的是在分布异构环境下,使数据仓库工具、工作平台和元数据存储库之间易于进行数据仓库元数据的交换。 CWM基于以下三个 工业 标准制定: 1.UML(UnifiedModelingLanguage统一建模语言) 作为 目前 最为风行的建模语
5、言,UML用于描述一般数据仓库架构的元模型。 2.MOF(MetaObjectFacility元对象工具) MOF是OMG元模型和元数据的存储标准,用以定义存储库的结构、对外接口和交换格式的映射规则。 3.XMI(XMLMetadataInterchange,XML元数据交换) XMI是基于XML的元数据交换。定义如何用XML表示基于MOF的元数据,使元数据以XML文件流的方式进行交换。 基于上列三个标准,CWM为数据仓库工具之间共享元数据,制定了一整套关于模式、语法和语义的规范。主要包括: (1)CWM元模型(Metamodel):描述数据仓库系统共享的元模型。它由一系列子元模型构成。 (2
6、)CWMXML:CWM元模型的XML表示。 (3)CWMDTD:DW/BI共享元数据的交换格式。 (4)CWMIDL:DW/BI共享元数据的应用程序访问接口。 基于CWM的数据仓库元数据转换和管理模型可用图1表示。从图1不难理解,元数据库也是基于CWM标准,通过CWM元模型映射构建。CWM以UML的元模型为基础,针对数据仓库领域的应用,使用特定的元类、元关系,将来自各异构数据源和数据仓库各个组件中的元数据,通过CWMXML、CWMDTD、CWMIDL三个规范,转化为XML文档。为数据仓库元数据管理提供了满足元数据交换所需的语法和语义规范的、方便元数据交换和元数据存储的XML文件。 三、基于CW
7、M的数据仓库ETL系统架构 1.基于CWM的ETL系统架构 在 研究 ETL和CWM的基础上,设计出基于CWM的数据仓库ETL过程的系统架构,如图2所示。 2.系统架构的结构 分析 (1)ETL子系统结构 ETL子系统结构由五个模块组成。即:系统调度模块、元数据管理模块、数据抽取模块、数据转换模块和数据装载模块。其中,数据抽取模块负责将超市业务系统的原始数据进行抽取并保存到临时数据库中;数据转换模块负责对抽取出来的数据进行清洗、转换和 计算 汇总;数据装载模块负责将经过清洗、转换的、符合目标数据模型的数据装载到目标数据库中。以上三个模块的活动被系统调度模块统一调度,结合元数据管理模块对整个ET
8、L过程进行统一控制,用以实现ETL各步骤的定时触发、正常执行和异常控制等过程。 (2)CWM对系统元数据的规范 整个架构以CWM元模型库为基础,通过CWM工作机制,把各个层次的元数据规范化后,存储在元数据库中,再由元数据管理模块支撑并控制整个架构的运行。 (3)建立集中式元数据库 为了便于对数据仓库的元数据进行有效管理,按照通用的元数据管理标准建立一个集中式的元数据库。在所建元数据库中,通过建立“信息模型”的 方法 对元数据进行分类,并建立分类存储的、通用的信息目录。把技术元数据和商业元数据存储在不同的信息目录中。便于适应不同的服务目标、不同的元数据结构的存储和管理。元数据信息目录面向数据仓库
9、的 应用 程序。应用程序可以通过访问该目录,使用、存储、管理元数据;用户也可以通过该目录,对元数据进行浏览、查询和使用。整个架构,都集中在元数据的统一控制之下。 四、CWM对ETL提供的技术支持分析 1.CWM元模型结构 由于系统架构建立在CWM元模型基础之上,CWM通过对元数据的统一规范和管理,实现了对整个架构的支持。 为了便于分析CWM对ETL子系统中各个模块的支持,图3给出了CWM元模型结构示意图。在CWM的总体结构中,可分为5个层次,由若干互不相同但又紧密相关的子元模型包构成。图中灰色部分是CWM对ETL子系统有着直接联系和支撑CWM元模型包。 2.对数据抽取模块的支持 在CWM的资源
10、层中,五个元模型分别对五种不同的数据源进行了建模。五种数据源格式分别是:面向对象的数据格式、关系型数据格式、记录型数据格式、多维数据格式和XML数据格式。这五个元模型所描述的数据格式相当齐全,利用它们,可以把商场常用的、 历史 遗留的数据源都描述出来。从而得到各种不同格式的数据源的元数据,为ETL对数据源的抽取过程提供了支持。 3.对数据转换模块的支持 ETL的核心还是在于“T”这个过程,也就是转换过程。而抽取和装载一般可以作为转换的输入和输出,因此,我们重点研究了CWM对数据转换过程的支持。 在CWM分析层中,转换包对ETL过程进行了详细的描述。转换包的主要作用是:将一次转换活动的数据源和目标准数据关联起来,同时支持“黑盒”和“白盒”转换,可将一组转换组成一个逻辑单元。一次转换可以将一组源对象转换成一组目标对象。数据对象集合可以是任何模型元素,但通常是表、字段或者内存对象。 CWM管理层中的数据仓库操作包,记录了数据仓库的三个重要事件。其中的转换执行事件定义了记录转换活动结果的类。在转换完成之后,转换活动的结果可被活动执行类和步骤执行类记录。这个记录行为是对发生在数据仓库操作包中的一个内部事件、或者其他类似方式的回应,为每个转换执行记录开
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 格林童话读后感(15篇)
- 大学认识实习报告范文汇编10篇
- 六一儿童节主题活动总结10篇
- 个人试用期转正工作总结(汇编15篇)
- 幼儿园学前班新学期工作计划
- 教师的感恩演讲稿四篇
- 军训个人心得体会(集锦15篇)
- 山西财经大学计算机应用技术814数据结构考研题库
- 九年级下册数学教学计划锦集(17篇)
- 健康检查服务合同(2篇)
- 养老院品牌建设与推广策略
- 族概述与族操作-创建参数化三维族(Revit建模课件)
- 《机电一体化系统设计》
- 历史 小钱币大历史教学设计
- 文印服务投标方案(技术方案)
- 消防控制室值班服务投标方案
- 医养结合养老院(养老中心)项目可行性报告
- 初三语文总复习全程计划表
- 小儿横纹肌肉瘤
- 客户关系深度经营与开发
- 电子技术基础与技能-机工教案第九章教案555集成定时器介绍
评论
0/150
提交评论