数据仓库系统的设计与开发_第1页
数据仓库系统的设计与开发_第2页
数据仓库系统的设计与开发_第3页
数据仓库系统的设计与开发_第4页
数据仓库系统的设计与开发_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库系统的设计与开发第一页,共三十二页,编辑于2023年,星期六2023/5/3113.1数据仓库系统的设计与开发概述建立一个数据仓库系统的参考步骤数据仓库系统的生命周期创建数据仓库系统的两种思维模式数据仓库数据库的设计步骤第二页,共三十二页,编辑于2023年,星期六2023/5/312建立一个数据仓库系统的参考步骤数据仓库系统的建立是一个复杂而漫长的过程。涉及到:源数据库系统数据仓库对应的数据库系统数据分析与报表工具……第三页,共三十二页,编辑于2023年,星期六2023/5/313建立一个数据仓库系统的参考步骤收集和分析业务需求步骤建立数据模型和数据仓库的物理设计定义数据源选择数据仓库技术和平台从操作型数据库中抽取、清洗及转换数据到数据仓库选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件更新数据仓库第四页,共三十二页,编辑于2023年,星期六2023/5/314数据仓库系统的生命开发周期数据仓库系统的开发与设计是一个动态的反馈和循环过程。一个数据仓库系统包括:数据仓库数据库数据分析应用系统第五页,共三十二页,编辑于2023年,星期六2023/5/315数据仓库系统的生命开发周期第六页,共三十二页,编辑于2023年,星期六2023/5/316建立数据仓库系统的两种思维模式自顶向下(Top-down)将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式存入各个数据集市中。自底向上(Bottom-Up)

通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。第七页,共三十二页,编辑于2023年,星期六2023/5/317数据仓库数据库的设计步骤第八页,共三十二页,编辑于2023年,星期六2023/5/3183.2基于SQLServer的数据仓库数据库设计过程详解SQLServer2005介绍集成了三个服务。SQLServer2005的数据仓库架构第九页,共三十二页,编辑于2023年,星期六2023/5/319MSSQLServer2005的数据仓库架构

第十页,共三十二页,编辑于2023年,星期六2023/5/31103.2基于SQLServer的数据仓库数据库设计过程详解包括以下步骤:分析组织的业务状况及数据源结构组织需求调研,收集业务需求采用信息包图法进行数据仓库的概念模型设计利用星形图进行数据仓库的逻辑模型设计数据仓库的物理模型设计第十一页,共三十二页,编辑于2023年,星期六2023/5/3111分析组织的业务状况及数据源结构以SQLServer2005实例数据库AdventureWorksDW中所描述AdventureWorksCycles公司的用户需求为例。公司概况业务系统流程介绍对数据源结构的分析与理解第十二页,共三十二页,编辑于2023年,星期六2023/5/3112组织需求调研,收集业务需求坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用户的需求,进而对需求进行分析。关于用户需求的调研(确定主题域)对用户需求调研结果的分析(确定度量指标和维度)第十三页,共三十二页,编辑于2023年,星期六2023/5/3113物理模型

星型、雪花模型

物理数据模型概念模型逻辑模型面向用户的需求细化层次更详细的技术细节信息包图采用信息包图法进行概念模型设计第十四页,共三十二页,编辑于2023年,星期六2023/5/3114信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。信息包图法简介第十五页,共三十二页,编辑于2023年,星期六2023/5/3115工作:确定系统边界:决策类型、需要的信息、原始信息确定主题域及其内容:主题域的公共键码、联系、属性组确定维度:如时间维、销售位置维、产品维、组别维等确定类别:相应维的详细类别确定指标和事实:用于进行分析的数值化信息第十六页,共三十二页,编辑于2023年,星期六2023/5/3116信息包图的建立信息包:

维度类别

空白信息包图样式指标和事实第十七页,共三十二页,编辑于2023年,星期六2023/5/3117〖例〗试画出销售分析的信息包图。解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实:(1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。(2)类别:确定各维的详细类别,如:日期维包括年(5)、季度(20)、月(60)、日(1800),括号中的数字分别指出各类别的数量;区域维包括国家(10)、省州(100)、城市(500)、销售点(8000),括号中的数字同样分别指出各类别的数量;类似地,可以确定产品维、客户维、广告维等的详细类别。(3)指标和事实:确定用于进行分析的数值化信息,包括实际销售额、计划销售额和计划完成率。第十八页,共三十二页,编辑于2023年,星期六2023/5/3118销售分析的信息包图日期维区域维产品维客户维广告维(待用)年度(5)国家(10)产品类别(500)年龄分组(7)广告费分组(2)季度(20)省州(100)产品名称(9000)收入分组(8)月(60)城市(500)信用组(2)日(1800)销售点(8000)指标和事实:实际销售额、计划销售额、计划完成率信息包:销售分析 维度类别第十九页,共三十二页,编辑于2023年,星期六2023/5/3119设计基于主题域的概念模型供应商ID相关信息有关信息商品信息供应商供应商主题顾客顾客ID顾客主题商品商品ID商品主题第二十页,共三十二页,编辑于2023年,星期六2023/5/3120利用星形图进行数据仓库的逻辑模型设计

根据分析需求与信息包图制作星形图销售分析客户广告区域时间产品第二十一页,共三十二页,编辑于2023年,星期六2023/5/3121根据分析需求与信息包图制作雪花图

销售分析客户广告区域时间产品产品类别雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。

第二十二页,共三十二页,编辑于2023年,星期六2023/5/3122确定主题的属性组主题名公共键码属性组商品商品号基本信息:商品号、商品名、类型和颜色等采购信息:商品号、供应商号、供应价、供应日期和供应量等库存信息:商品号、库房号、库存量和日期等销售销售单号基本信息:销售单号、销售地址等销售信息:客户号、商品号、销售价、销售量和销售时间等客户客户号第二十三页,共三十二页,编辑于2023年,星期六2023/5/3123事实表及其特征度量是客户发生事件或动作的事实记录,如客户打电话,可能选择的度量有通话时长、通话次数和通话费用等。客户购买商品,可能选择的度量有购买的次数、购买商品的金额和购买商品的数量等。事实表则是在星型模型或雪花模型中用来记录业务事实,并作相应指标统计的表。事实表的特征有:记录数量情况维度表情况第二十四页,共三十二页,编辑于2023年,星期六2023/5/3124事实表的类型与设计事实是一种度量,所以事实表中的这种指标往往需要具有数值化和可加性的特征。即:要考虑决策分析的需要(必要的数据)要考虑系统运行的需要(派生的数据)第二十五页,共三十二页,编辑于2023年,星期六2023/5/3125粒度的选择与设计步骤根据需求和系统运行情况确定粒度:粒度的不同选择导致逻辑模型的差异粒度的不同选择导致数据存储容量的差异粒度的设计步骤:粗略估计数据量确定粒度的级别粒度设计实例:第二十六页,共三十二页,编辑于2023年,星期六2023/5/3126关于数据仓库的聚合模型数据的分割处理星形图中的维度表简介常用维度的设计模式第二十七页,共三十二页,编辑于2023年,星期六2023/5/3127事实表及其特征事实表的类型与设计粒度的选择与设计步骤关于数据仓库的聚合模型与数据的分割处理星形图中的维度表简介常用维度的设计模式第二十八页,共三十二页,编辑于2023年,星期六2023/5/3128数据仓库的物理模型设计物理模型设计的主要工作物理存储结构设计的原则数据仓库索引设计的特殊性存储优化与存储策略第二十九页,共三十二页,编辑于2023年,星期六2023/5/31293.3使用SQLServer2005建立多维数据模型

SQLServer2005示例数据仓库环境的配置与使用基于SQLServer2005示例数据库的多维数据模型的建立与应用。第三十页,共三十二页,编辑于2023年,星期六2023/5/3130

3.3使用SQLServer2005建立多维数据模型在SQLServer2005数据库环境中安装数据仓库组件、示例和工具利用示例数据仓库(Advent

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论