![数据仓库的架构方式及其比较_第1页](http://file4.renrendoc.com/view/c546b5fa356369ac12c2ee8382f08f03/c546b5fa356369ac12c2ee8382f08f031.gif)
![数据仓库的架构方式及其比较_第2页](http://file4.renrendoc.com/view/c546b5fa356369ac12c2ee8382f08f03/c546b5fa356369ac12c2ee8382f08f032.gif)
![数据仓库的架构方式及其比较_第3页](http://file4.renrendoc.com/view/c546b5fa356369ac12c2ee8382f08f03/c546b5fa356369ac12c2ee8382f08f033.gif)
![数据仓库的架构方式及其比较_第4页](http://file4.renrendoc.com/view/c546b5fa356369ac12c2ee8382f08f03/c546b5fa356369ac12c2ee8382f08f034.gif)
![数据仓库的架构方式及其比较_第5页](http://file4.renrendoc.com/view/c546b5fa356369ac12c2ee8382f08f03/c546b5fa356369ac12c2ee8382f08f035.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库的架构方式及其比较数据仓库的架构方式及其比较传统的关系数据库一般采用二维数表的形式来表示数据,一个维是行,另一个维是列,行和列的交叉处就是数据元素。关系数据的基础是关系数据库模型,通过标准的SQL语言来加以实现。数据仓库是多维维数据库,它它扩展了关系系数据库模型型,以星形架架构为主要结结构方式的,并并在它的基础础上,扩展出出理论雪花形形架构和数据据星座等方式式,但不管是是哪一种架构构,维度表、事事实表和事实实表中的量度度都是必不可可少的组成要要素。下面解解析由这些要要素构成的数数据仓库的架架构方式。1星形架构星形模型是最常常用的数据仓仓库设计结构构的实现模式式,它使数据据仓库形成了了一
2、个集成系系统,为最终终用户提供报报表服务,为为用户提供分分析服务对象象。星形模式式通过 使用用一个包含主主题的事实表表和多个包含含事实的非正正规化描述的的维度表来支支持各种决策策查询。星形形模型可以采采用关系型数数据库结构,模模型的核心是是事实表,围围绕事实表 的是维度表表。通过事实实表将各种不不同的维度表表连接起来,各各个维度表都都连接到中央央事实表。维维度表中的对对象通过事实实表与另一维维度表中的对对象相关联这这样就能建立立各 个维度度表对象之间间的联系。每每一个维度表表通过一个主主键与事实表表进行连接,如如图3-100所示。图3-10 星形架构示示意图事实表主要包含含了描述特定定商业事件
3、的的数据,即某某些特定商业业事件的度量量值。一般情情况下,事实实表中的数据据不允许修改改,新的数据据只是简单地地添加进事实实表 中,维维度表主要包包含了存储在在事实表中数数据的特征数数据。每一个个维度表利用用维度关键字字通过事实表表中的外键约约束于事实表表中的某一行行,实现与事事实表的关联联,这就要 求事实表中中的外键不能能为空,这与与一般数据库库中外键允许许为空是不同同的。这种结结构使用户能能够很容易地地从维度表中中的数据分析析开始,获得得维度关键字字,以便连接接到中 心的的事实表,进进行查询,这这样就可以减减少在事实表表中扫描的数数据量,以提提高查询性能能。在AdventtureWoork
4、sDWW数据仓库中中,若以网络络销售数据为为事实表,把把与网络销售售相关的多个个商业角度(如如产品、时间间、顾客、销销售区域和促促销 手段等等)作为维度度来衡量销售售状况,则这这些表在数据据仓库中的构构成如图3-11所示,可可见这几个表表在数据仓库库中是以星形形模型来架构构的。星形模式虽然是是一个关系模模型,但是它它不是一个规规范化的模型型。在星形模模式中,维度度表被故意地地非规范化了了,这是星形形模式与OLLTP系统中中关系模式的的基本区别。 使用星形模式主主要有两方面面的原因:提提高查询的效效率。采用星星形模式设计计的数据仓库库的优点是由由于数据的组组织已经过预预处理,主要要数据都在庞庞大
5、的事实表表中, 所以以只要扫描事事实表就可以以进行查询,而而不必把多个个庞大的表联联接起来,查查询访问效率率较高,同时时由于维表一一般都很小,甚甚至可以放在在高速缓存中中,与事实表表进行连 接接时其速度较较快,便于用用户理解;对对于非计算机机专业的用户户而言,星形形模式比较直直观,通过分分析星形模式式,很容易组组合出各种查查询。图3-11 AdvenntureWWorksDDW数据仓库库中部分表构构成的星形架架构2雪花形架构构雪花模型是对星星形模型的扩扩展,每一个个维度都可以以向外连接多多个详细类别别表。在这种种模式中,维维度表除了具具有星形模型型中维度表的的功能外,还还连接对事实实表进 行详
6、详细描述的详详细类别表,详详细类别表通通过对事实表表在有关维上上的详细描述述达到了缩小小事实表和提提高查询效率率的目的,如如图3-122所示。雪花模型对星形形模型的维度度表进一步标标准化,对星星形模型中的的维度表进行行了规范化处处理。雪花模模型的维度表表中存储了正正规化的数据据,这种结构构通过把多个个较小 的标标准化表(而而不是星形模模型中的大的的非标准化表表)联合在一一起来改善查查询性能。由由于采取了标标准化及维的的低粒度,雪雪花模型提高高了数据仓库库应用的灵活活性。这些连接需要花花费相当多的的时间。一般般来说,一个个雪花形图表表要比一个星星形图表效率率低。在AdventtureWoorks
7、DWW数据仓库中中,以图3-11的架构构图为基础,可可以扩展出雪雪花模型的架架构,“DiimProdduct”表表有一个详细细类 别表“DimProductSubcategory”,而“DimCustomer”表也有一个表示客户地区的表“DimGeograph”表作为其详细 类别表,将它们加入数据仓库后,整个数据仓库就是雪花形架构,如图3-13所示。 错误!图3-12 雪花模型架架构示意图图3-13 AdvenntureWWorksDDW数据仓库库中部分表构构成的雪花形形架构3星形与雪花花形架构的比比较在3.1节的讨讨论中可以得得知,在数据据仓库中表与与表之间是不不必满足3个个范式的,也也不必
8、考虑数数据冗余,相相反,为了在在分析型查询询中获得较好好的性能,数数据仓 库中中的表还应该该尽量集中同同类型的数据据,同时把有有些常见的统统计数据进行行合并。按照照这种思想,图图3-13中中的“DimmProduuctSubbcateggory” 表和“DiimGeoggraph”表表可以并入“DimProduct”表和“DimGeograph”表中使整个数据仓库呈现星形架构,但是微软在设计 AdventureWorksDW数据仓库时并没有这样做,反而在“DimProductSubcategory”表和“DimProduct”表及 “DimGeograph”表和“DimGeograph”表之间
9、设计成满足一定范式要求的结构,下面将解释其原因。标准的关系数据据表不能满足足数据的分析析能力,所以以对表进行非非标准化处理理以形成数据据仓库中特有有的星形架构构方式,但这这样一来,如如果所有的分分析维度都作作为事 实表表的一个直接接维度,数据据的冗余是相相当大的,比比如将“DiimProdductSuubcateegory”表表合并到“DDimProoduct”表表中,的确能能形成一 个个关于产品所所有属性的维维度,但要在在一张表中表表达产品类别别属性和产品品的属性,需需要的存储空空间是相当大大的。由此可可以看出,在在星形架构的的基础上扩展展出雪花形架架 构,实质质上是在分析析查询的性能能和数
10、据仓库库的存储容量量2方面进行行权衡的结果果。表3-33具体比较了了2种类型的的架构差异。只只有明确了这这些差异,才才能在设计数数据仓 库时时选择最合适适的架构方式式。表3-3 雪雪花形与星形形层次结构的的差异星 形雪 花 形形行数多少可读性容易难表格数量少多搜索维的时间快慢4星座模式一个复杂的商业业智能应用往往往会在数据据仓库中存放放多个事实表表,这时就会会出现多个事事实表共享某某一个或多个个维表的情况况,这就是事事实星座,也也称为星系模模式(gallaxy sschemaa)。在 AdveentureeWorkssDW数据仓仓库中有多个个事实,为了了便于显示,取取最重要的22个事实表“Fa
11、ctInternetSales”和 “FactResellerSales”作为星座模式的例子。由于对网络销售和批发商销售的分析有很多观察视角都是相同的,因而这2个事实表共享的维度表 较多,比如促销手段、时间和产品等。在数据库关系图中把它们的关系表现出来后,如图3-14所示。图3-14 数据仓库的的事实星座模模式示例5数据集市数据集市是在构构建数据仓库库的时候经常常用到的一个个词汇。如果果说数据仓库库是企业范围围的,收集的的是关于整个个组织的主题题,如顾客、商商品、销售、资资产和人员等等 方面的信信息,那么数数据集市则是是包含企业范范围数据的一一个子集,例例如只包含销销售主题的信信息,这样数数据集市只对对特定的用户户是有用的,其其范围限于选选定的主题。数据集市面向企企业中的某个个部门(或某某个主题)是是从数据仓库库中划分出来来的,这种划划分可以是逻逻辑上的,也也可以是物理理上的。例如如在AdveentureeWorkssDW数据仓仓库中就是逻逻辑上划分的的数据集市。数据仓库中存放放了企业的整整体信息,而而数据集市只只存放了某个个主题需要的的信息,其目目的是减少数数据处理量,使使信息的利用用更加快捷和和灵活。数据仓库由于是是企业范围的的,能对多个个相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 1 Knowing me,knowing you Listening and speaking 说课稿-2023-2024学年高一英语外研版(2019)必修第三册
- Unit2 What is your hobby?Lesson 7(说课稿)-2024-2025学年人教精通版英语六年级上册001
- 2025合同模板股东协议 范本
- 25《忆读书》说课稿-2024-2025学年五年级上册语文统编版
- 8空气和我们的生活 说课稿-2024-2025学年科学三年级上册教科版
- 辽宁新风系统施工方案
- 8 网络新世界说课稿-2024-2025学年道德与法治四年级上册统编版
- 高空连廊除锈刷漆施工方案
- Unit 3 Asking the way(说课稿)-2023-2024学年译林版(三起)英语五年级下册
- 修理厂与公司车合同范例
- 《工程测试技术》全套教学课件
- 自卸车司机实操培训考核表
- 教师个人基本信息登记表
- 中考现代文阅读理解题精选及答案共20篇
- ESD测试作业指导书-防静电手环
- 高频变压器的制作流程
- 春季开学安全第一课PPT、中小学开学第一课教育培训主题班会PPT模板
- JJG30-2012通用卡尺检定规程
- 部编版人教版二年级上册语文教材分析
- 艾宾浩斯遗忘曲线复习方法表格模板100天
- APR版制作流程
评论
0/150
提交评论