中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第1页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第2页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第3页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第4页
中文les07_数据仓库建模_ 数据仓库教学课件 中文oracle99版_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Copyright Oracle Corporation, 1999. All rights reserved. 7 7 数据仓库建模 7-7-2 2Copyright Oracle Corporation, 1999. All rights reserved. 总述 项目管理(方法论, 维持元数据) 定义数据仓库 的 概念及术语 规划成功的 数据仓库 分析用户 查询需求 选择处理体系 建模 数据仓库 计划仓库存储 ETT (构建仓库) 满足业务 需求 支持终端 用户访问 管理数据仓库 7-7-3 3Copyright Oracle Corporation, 1999. All rights reserved. 目标 在完成这次课后,你应该做到以下几点: 能够列出数据仓库建模的主要阶段 能够列出数据仓库模型的组成部分 确定可用于数据仓库建模的工具 7-7-4 4Copyright Oracle Corporation, 1999. All rights reserved. 数据仓库数据库设计阶段 1. 定义业务模型 (概念模型) 2. 创建多维模型 (逻辑模型) 3. 概要建模 4. 创建物理模型 物理模型 1 1 2, 32, 3 4 4 选择业务流 程 7-7-5 5Copyright Oracle Corporation, 1999. All rights reserved. 操作策略分析 操作策略分析 创建业务(概念)模型 阶段 1: 定义业务模型 选择业务流 程 7-7-6 6Copyright Oracle Corporation, 1999. All rights reserved. 建立业务模型 操作策略分析 建立业务(概念)模型 定义业务需求 确定业务尺度 确定维数 确定粒度 确定业务定义及规则 检验数据来源 阶段阶段 1: 1: 定义业务模型定义业务模型 7-7-7 7Copyright Oracle Corporation, 1999. All rights reserved. 业务需求驱动设计过程 现有的元数据现有的元数据产品产品 ERD ERD 模型模型 业务需求业务需求 研究研究 主要的输入 其它的输入 非关系型遗留系统非关系型遗留系统 7-7-8 8Copyright Oracle Corporation, 1999. All rights reserved. 确定数据量和维数 平衡 单元体 成本 销售 属性被视为连续的或离散的值属性被视为连续的或离散的值: : 属性不断变化属性不断变化: : 数据量数据量维数维数 描述 位置 颜色 大小 7-7-9 9Copyright Oracle Corporation, 1999. All rights reserved. 决定粒度 年? 季度? 月? 周? 天? 7-7-1010Copyright Oracle Corporation, 1999. All rights reserved. 确定业务规则 产品 类型 监视器 状态 PC15 inchNew Server17 inchRebuilt 19 inchCustom None 位置 物理距离 0 - 1 米 1 - 5 米 5 米 存储 存储 地区 区域 时间 月 季度 年 7-7-1111Copyright Oracle Corporation, 1999. All rights reserved. 创建多维模型 阶段 2: 创建多维(逻辑)模型 确定事实表 将业务操作转化成事实表 通过分析源系统信息确定额外操作 确定基本操作和衍生操作 辅助文档 确定维表 连接事实表和维表 创建用户视图 7-7-1212Copyright Oracle Corporation, 1999. All rights reserved. 维表 维表有以下特征: 包含代表业务属性的文本信息 包含相关的静态数据 通过外键关联事实表 产品渠道 事实(单位 价格) 消费者时间 7-7-1313Copyright Oracle Corporation, 1999. All rights reserved. 事实表 事实表有以下特性: 包含业务的数值变量 可能包含综合(汇总)的数据 可能包含打上时间戳的数据 有典型的叠加性(如果事实表相关的维度很高,则事实 表的字段数也会比较多) 除了数值变量,其他字段都是同维表中的关键字 通过外键连接维表 ,相关的主键在维表中 7-7-1414Copyright Oracle Corporation, 1999. All rights reserved. 多维模型 (星型结构) 产品渠道 事实 (单位, 价钱) 用户时间 维表维表 事实表事实表 7-7-1515Copyright Oracle Corporation, 1999. All rights reserved. 星型结构建模 中心事实表 周围的维表 非结构化的模型 Store Table Store_id District_id . Item Table Item_id Item_desc . Time Table Day_id Month_id Period_id Year_id Product Table Product_id Product_desc Sales Fact Table Product_id Store_id Item_id Day_id Sales_dollars Sales_units . 7-7-1616Copyright Oracle Corporation, 1999. All rights reserved. 星型结构建模 用户容易理解 快速响应查询 简单的元数据 由许多前端工具支持 可变性不强 构建较慢 不支持历史 7-7-1717Copyright Oracle Corporation, 1999. All rights reserved. 雪花结构建模 Time Table Week_id Period_id Year_id Dept Table Dept_id Dept_desc Mgr_id Mgr Table Dept_id Mgr_id Mgr_name Product Table Product_id Product_desc Item Table Item_id Item_desc Dept_id Sales Fact Table Item_id Store_id Sales_dollars Sales_units Store Table Store_id Store_desc District_id District Table District_id District_desc 7-7-1818Copyright Oracle Corporation, 1999. All rights reserved. 雪花结构建模 直接利用一些工具 更灵活的改变 提供更快捷的数据装载机制 可能变得更庞大从而不易于管理 降低了查询性能 更加复杂的元数据 国家州县城市 7-7-1919Copyright Oracle Corporation, 1999. All rights reserved. 采用概要数据 可更快速地访问已经计算好的数据 减少I/O, CPU和 存储器的使用 从原系统以及预先计算好的概要中提取 通常存在于汇总的事实表中 阶段 3:概要建模 7-7-2020Copyright Oracle Corporation, 1999. All rights reserved. 设计汇总表 UnitsSales($)Store Product A Total Product B Total Product C Total 平均 最大值 总计 百分比 7-7-2121Copyright Oracle Corporation, 1999. All rights reserved. 汇总表实例 SALES FACTS Sales$ Region Month 10,000 NorthJan 99 12,000 South Feb 99 11,000 North Jan 99 15,000 WestMar 99 18,000 South Feb 99 20,000 North Jan 99 10,000 EastJan 99 2,000WestMar 99 SALES BY MONTH/REGION Month Region Tot_Sales$ Jan 99 North41,000 Jan 99 East10,000 Feb 99 South 40,000 Mar 99 West17,000 SALES BY MONTH Month Tot_Sales Jan 99 51,000 Feb 99 40,000 Mar 99 17,000 7-7-2222Copyright Oracle Corporation, 1999. All rights reserved. Oracle8i中的概要管理 产品产品 区域区域 时间时间 销售概要销售概要 城市城市 销售销售 国家国家 概要使用概要使用 概要顾问 空间需求空间需求 概要建议概要建议 7-7-2323Copyright Oracle Corporation, 1999. All rights reserved. 数据仓库中的时间利用 7-7-2424Copyright Oracle Corporation, 1999. All rights reserved. 时间维 时间元素将被存储在哪里时间元素将被存储在哪里? ? 时间尺度销售事实 对于数据仓库,时间是关键因素。 时间的一致性表示对于扩展是必须的。 7-7-2525Copyright Oracle Corporation, 1999. All rights reserved. 创建物理模型 阶段 4: 创建物理模型 空间设计转换到实际执行的物理模型 定义表及索引的存储策略 规划数据库大小 定义初始索引策略 定义分割策略 通过物理信息更新元数据文件 7-7-2626Copyright Oracle Corporation, 1999. All rights reserved. 物理模型设计任务 定义命名和数据库标准 规划数据库大小 设计表空间 开发初始索引策略 开发数据划分策略 定义存储参数 设置初始化参数 使用并行处理技术 7-7-2727Copyright Oracle Corporation, 1999. All rights reserved. 通过GUI 定义,建模,报告 避免由以下原因导致混乱的建模: 开发压力 开发者缺少理论知识 无策略 决定策略 正规地撰写和发布文档 做可用的、电子化的文档资料 使用数据建模工具 工具事例 电子数据表 纸和笔 7-7-2828Copyright Oracle Corporation, 1999. All rights reserved. GUI 工具界面 7-7-2929Copyrigh

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论