第3章-设计数据仓库-2_第1页
第3章-设计数据仓库-2_第2页
第3章-设计数据仓库-2_第3页
第3章-设计数据仓库-2_第4页
第3章-设计数据仓库-2_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3 3章章 设计数据仓库设计数据仓库(2)(2)数据仓库设计n概念设计n实体关系图(ERD)n逻辑设计n数据项集(DIS)n维度事实模型DFMn物理设计数据仓库的数据仓库的概念设计n实体关系图(ERD)n以实体和关系为特征n实体用椭圆表示n关系用箭头表示n箭头方向和数量表示关系的基数实体关系的表示实体关系的表示实体和属性的建模惯例n唯一的名字n标题风格n完整、非缩写的单词n单数名词n企业ERD由企业内各个反映不同群体观点的高层数据模型组合而成。数据仓库的逻辑数据仓库的逻辑设计n对概念模型中标识的每个主要主题域或实体,都要建立一个中间层模型n中间层数据模型包括四个基本构造:n主要数据分组n每

2、个主要主题域只有一个主要数据分组,包含了只存在一次的属性n二级数据分组n包含每个主要主题域可以存在多次的数据属性n连接器n表示二个主要主题域间的关系n数据的“类型”n由指向数据分组右边的的线段表示,左边分组为超类型,右边分组为子类型中间层数据模型中间层数据模型中间层数据模型例子中间层数据模型例子nERD层标识了一个关系后,在DIS层需要用一对连接器关系来表现中间层数据模型例子中间层数据模型例子中间层数据模型例子中间层数据模型例子企业企业DISn企业DIS由企业内各个反映不同群体观点的DIS组合而成。维度事实模型DFMn事实是与决策相关的概念,通常是建模公司内发生的一组事件n维度是范围有限的事实

3、属性,提供了事实的分析坐标事实n通常对应公司中动态发生的事件n事实可能对应一个实体或实体间的N元关系n经常发生更新的实体是事实的上佳候选;而静态的实体则不是nSALE-事实nSRORE-不是事实星型模型星型模型n主要包含3种逻辑实体:n事实表n维度表n联系星型模型的特点n文本数据与数值数据分离n文本数据通常出现在维表中,而数值数据出现在事实表中n可以为决策支持系统的处理优化数据事实表n一个星型模型只有一个事实表n事实表包括独有的标识数据,同时包含其本身的独有数据n事实表往往是数字度量,不欢迎描述性信息n事实表可达数百万行或更多n最小粒度原则n事实表同时包含指向周围表(维表)的预先连接的外键n可

4、以有任意多个外键与维表相关事实表的内容n事实表的主键是所有维度表主键的组合键n主要是数字属性n表很长,但不宽n稀疏的数据n假期记录可能为空n退化的维度n既不是事实也不是维属性的数据元素n如发票号、订单号等事实表设计n毛利润=销售-成本;在已有销售和成本字段的情况下,是否应物理存储毛利润字段?n应存储n减少用户出错n便于生成报表维度表n维度表是事实表不可分割的伴侣n维度表倾向于将行数做得相当少(通常100万行),而将列数做得特别大n数据仓库的能力与维度的质量和深度成正比n一个用户要按星期与商标来查看销售额,星期与商标就必须是可的维度属性维度内容n维度属性是查询的约束条件、分组与报表标签生成的基本

5、来源n每个维度用单一的主关键字进行定义,主关键字是确保与之相连的事实表存在完整性的基础。n非直接相关属性n产品:包裹大小与品牌n非规范化n很多维度变化很缓慢n多级层次结构n维度表通常有多种多级层次结构维度中的文本与数字n维度应当是文本和离散的n尽量使用详细的文本信息取代编码n数字属性放入维度表还是事实表应当看它是一个含有许多取值并参与运算的度量(应放入事实表),还是变化不多并参与约束条件的离散取值(应放入维度表)n产品尺寸-维度表n产品生产成本-事实表n例:业务数据的E-R图销售销售日期商店号商品号销售数量销售单位商品商品号商品名商品类号存货星期商店号商品号数量1m1m商店商店号商店名地址城市

6、省邮编地区号1mm11商品类商品类号商品类名部门号m1m地区地区号地区名nE-R图向多维表的转换n该问题的多维表模型中,商品维包括部门、商品和商品大类,地点维包括地区和商店,忽略存货,而只注意销售事实。在E-R图中不出现的时间,在多维模型中增加时间维。n在多维模型中,实体与维之间建立映射关系,联系多个实体的实体就成为事实,此处销售实体作为事实,其他实体作为维。然后用维关键字将它转换为星型模型,如图所示。商品维地区维时间维部门地区年商品大类商店月商品周日销售事实E-R图向多维模型的转换图向多维模型的转换 时间 时间键 时间说明 日期 星期 月 年 级别号 销售事实 时间键 地理位置键 商品键 销

7、售数量 销售单位 地区 地理位置键 地理位置名 地区号 商店号 级别号 商品 商品键 商品名 部门号 商品类号 级别号 利用维关键字制定的星型模型利用维关键字制定的星型模型n在各维中,只有部门,商品类,地区,商店的编号没有具体的说明。n为了打印报表将增加这些编号的名称说明,即部门名、商店名等,在维表中增加这些说明,即修改该星型模型n 时间 时间键 时间说明 日期 星期 月 年 级别号 销售事实 时间键 地理位置键 商品键 销售数量 销售单位 地区 地理位置键 地理位置名 地区号 地区名 商店号 商店名 级别号 商品 商品键 商品名 部门号 部门名 商品类号 商品类名 级别号 修改后的星型模型修改后的星型模型产品维度表n产品关键字(PK)、产品描述、商标描述、分类描述、部门描述、包装类型、包装尺寸、重量、储藏类型、货架类型、货架高度、货架深度。n产品维度表每行都有与产品相关的商标与分类,有冗余但易于使用n日期维度:日期关键字、日期描述、星期、年历月、年历周、年历日、月编号、周编号、日编号、财政日、财政

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论