




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库维度建模数据仓库维度建模 学习目的学习目的 v在课程结束后应该知道: 数据仓库维度建模分哪几个步骤? 每个步骤都有哪些原则,和哪些误区? 掌握维度建模方法 ? 维度表属性在维度模型中起到什么样的作用? Kimball极力反对哪些建模方法? 一个比喻一个比喻 v比喻: 如果将数据仓库建设看作是一个高楼大厦建造过程的 话 数据仓库维度建模就是大厦的框架建设工作 数据仓库ETL过程,就是为大厦添砖加瓦的过程 优秀数据访问工具则是大厦整体装修的最佳工具 v框架的重要性 地基打多深决定大厦能做多高。 钢筋混凝土结构还是刚结构决定了大厦的稳定性 维度建模是数据仓库框架建设的重要技术 维度建模四步曲
2、维度建模四步曲 v四步维度建模步骤: 1.选取要建模的业务流程 2.定义业务流程中的数据粒度 3.选定用于每个事实表行的维度 4.确定用于形成每个事实表行的数字型事实 四步曲四步曲1.选取业务流程选取业务流程 v误区: 不针对业务流程而针对业务部门进行维度建模 将注意力放在业务部门身上,而不关注业务流程 为某个部门建立单独的维度模型 v原则: 针对业务流程进行维度建模 确保某个业务流程中的核心数据只被抽取一次 保证数据仓库中业务数据一致性 四步曲四步曲2.定义粒度定义粒度(1) v粒度的解释: 粒度传递了同事实表度量值相联系的细节所达到的程 度方面的信息。 简单的说,反映了事实表的明细程度 v
3、粒度举例: 超市小票上的购物清单 医生的处方药品清单 仓库每种产品库存值的月快照 v误区: 数据仓库团队经常绕过这个看似不必要的步骤 一个不合适的粒度定义将会使维度建模感觉无从下手 四步曲四步曲2.定义粒度定义粒度(2) v原则: 优先考虑具有原子粒度的业务信息,这些数据不能再 做进一步的细分 数据仓库中存储汇总的、概要性的数据主要是基于数 据库性能上的考虑 汇总数据不能成为最底层细节数据的替代品 四步曲四步曲3.选定维度选定维度 v误区: 没有定义粒度就开始选定维度 v原则: 在粒度确认后,选取能从各个角度,充分描述问题的 维度 为每个维度添加丰富的维度属性 v示例: 常见维度包括日期、产品
4、、顾客、事务类型和状态 四步曲四步曲4.确定事实确定事实 v误区: 没有第2步的粒度确认,就开始确定事实 将含有不同粒度的事实放在了同一个事实表中 v原则: 确定用于形成每个事实表行的数字可加型事实 在需求调研时我们可以通过提出“您需要对哪些指标 进行统计?”这样的问题来确定事实。 具有不同粒度的事实必须放在不同的事实表中 事实一般在各维度上都有良好的可加性 四步曲总结四步曲总结 v维度建模总原则: 数据驱动和需求驱动相结合 零售业案例背景零售业案例背景 v背景: 设想一下在一家大型杂货连锁店,其业务覆盖分布在 美国5个州范围内的100多家杂货店。 每个商店都有完整的配套部门,包括各类人员,并
5、有 大致60000多个品种的产品放在货架上。 各杂货店的POS系统记录了每位顾客交易详的细信息 定价与促销是管理层重要决策之一 如何使各种形式的促销活动所产生的效能清晰可见? 实例实例1.选取业务流程选取业务流程 v选取业务流程: 你能列出该连锁店急待解决的问题吗? 是否有系统能提供解决问题所需要的数据? 该系统对应的业务流程你清楚吗? v注意: 建立的第一个维度模型应该是一个最有影响的模型, 即它应该能对最紧迫的业务问题做出正面回答,并且 要保证有足够的操作型数据源的支持。 实例实例2.定义粒度定义粒度 v定义粒度: 你还记得刚才的粒度定义原则吗? 在这个连锁店我们应该使用什么样的粒度?即事
6、实表 要详细到什么程度? 实例实例3.选定维度选定维度 v选定维度: 如何得出基本维度? 什么是附加维度? 通过粒度的判断我们可以得出事实表的基本维度为: 日期、产品、商店与促销 日期维度 日期关键字日期关键字(PK)(PK) 待定日期属性待定日期属性 商场维度 商场关键字商场关键字(PK)(PK) 待定商场属性待定商场属性 产品维度 产品关键字产品关键字(PK)(PK) 待定产品属性待定产品属性 促销维度 促销关键字促销关键字(PK)(PK) 待定促销属性待定促销属性 POS零售营销事务事实 日期关键字日期关键字(FK)(FK) 产品关键字产品关键字(FK)(FK) 商场关键字商场关键字(F
7、K)(FK) 促销关键字促销关键字(FK)(FK) POSPOS事务编号事务编号 待定事实待定事实 实例实例4.确定事实确定事实 v 确定事实: 是否还记得确定事实的基本原则? 按照基本原则你认为事实表中应该包含哪些事实? 是否应该在事实表中存放计算列? 实例中事实应包括销售量、销售额与成本价,当然也可以包括毛 利润 日期维度 日期关键字日期关键字(PK)(PK) 待定日期属性待定日期属性 商场维度 商场关键字商场关键字(PK)(PK) 待定商场属性待定商场属性 产品维度 产品关键字产品关键字(PK)(PK) 待定产品属性待定产品属性 促销维度 促销关键字促销关键字(PK)(PK) 待定促销属
8、性待定促销属性 POS零售营销事务事实 日期关键字日期关键字(FK)(FK) 产品关键字产品关键字(FK)(FK) 商场关键字商场关键字(FK)(FK) 促销关键字促销关键字(FK)(FK) POSPOS事务编号事务编号 销售量销售量 销售额销售额 成本额成本额 毛利润金额毛利润金额 维度表属性维度表属性 v添加维度表属性 这是维度建模的最后修补工作 增加的维度属性会为用户带来更多的查询条件 丰富的维度属性将使查询变得更加灵活 维度表属性日期维度维度表属性日期维度 v日期维度属性 是否还可以列出其它属性 日期维度 日期关键字日期关键字(PK)(PK) 日期日期 星期星期 日历周结束日期日历周结
9、束日期 日历月日历月 日历年月日历年月 日历季度日历季度 日历年季度日历年季度 日历半年度日历半年度 节假日指示符节假日指示符 。及其它。及其它 维度表属性产品维度维度表属性产品维度 v产品维度属性 是否还可以列出其它属性 产品维度 产品关键字产品关键字(PK)(PK) 产品描述产品描述 SKUSKU编号编号 商标描述商标描述 子类描述子类描述 分类描述分类描述 部门描述部门描述 包装类型包装类型 包装尺寸包装尺寸 含脂量含脂量 。及其它。及其它 维度表属性商场维度维度表属性商场维度 v商场维度属性 是否还可以列出其它属性 商场维度 商场关键字商场关键字(PK)(PK) 商场名称商场名称 商场编号商场编号 商场所在行政区商场所在行政区 商场所在地区商场所在地区 首次开业日首次开业日 最后重修日最后重修日 。及其它。及其它 维度表属性促销维度维度表属性促销维度 v促销维度属性 是否还可以列出其它属性 促销维
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45326-2025超粗晶粒硬质合金工程齿
- 茶艺与传统工艺的结合试题及答案
- 战胜压力:健康管理师考试试题及答案
- 妇幼健康工作的可持续性试题及答案
- 土木科研成果应用试题及答案
- 二零二五年度品牌代理解约后的区域代理权转授权协议
- 2025年度智能化房屋租赁续租及配套设施升级合同
- 2025年度试用期劳动合同与岗位胜任能力评估协议
- 2025年度棋牌室品牌战略规划与实施合同
- 二零二五年度国际邮轮代购服务协议
- 2024年电厂讲解直流系统PPT通用课件
- 曹操献刀资料课件
- 2024年国信证券招聘笔试参考题库附带答案详解
- 仙家送钱表文-文字打印版
- 工程测量:四等水准测量
- 2022-2023学年河南省南阳市方城县科普版六年级下学期4月期中英语试卷(解析版)
- 学 生 处 分 登 记 表
- 国家辅助类药品一览表
- 砖厂烟气除尘脱硫项目设计方案
- 国家职业标准-农艺工
- 吉林省吉林市高职单招2022年数学测试题及答案
评论
0/150
提交评论