版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库基本概念2024/3/31数据仓库基本概念[1]数据仓库基本概念2024/3/31数据仓库基本概念[1]1数据仓库基本概念1.1从传统数据库到数据仓库1.2数据仓库定义及基本特性1.3数据仓库与决策支持系统1.4数据仓库体系结构1.5数据仓库相关概念数据仓库基本概念[1]数据仓库基本概念1.1从传统数据库到数据仓库数据仓库基本概念21.1从传统数据库到数据仓库随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息——能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系统响应问题、决策数据需求的问题和决策数据操作的问题。数据仓库基本概念[1]1.1从传统数据库到数据仓库随着市场竞争的加剧,信息系统的用31.1从传统数据库到数据仓库(续)传统的事务处理环境不适宜于决策支持应用事务处理和分析处理的性能特性不同数据集成问题数据动态集成问题历史数据问题数据的综合问题操作型环境和分析型环境的分离:数据抽取数据仓库基本概念[1]1.1从传统数据库到数据仓库(续)传统的事务处理环境不适宜于4现实生活中面临的问题人们在日常生活中经常会遇到这样的情况:超市的经营者希望将经常被同时购买的商品放在一起,以增加销售;保险公司想知道购买保险的客户一般具有哪些特征;医学研究人员希望从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助;……数据仓库基本概念[1]现实生活中面临的问题人们在日常生活中经常会遇到这样的情况:数5企业面临的问题经过多年的计算机应用和市场积累,许多企业保存了大量原始数据和各种业务数据,它是企业生产经营活动的真实记录由于缺乏集中存储和管理,这些数据不能为本企业加以利用,不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息数据仓库基本概念[1]企业面临的问题经过多年的计算机应用和市场积累,许多企业保存了6数据爆炸问题自动的数据收集工具和成熟的数据库技术导致巨大的数据存储在文件系统、数据库和其它的信息库中。我们会淹死在数据中,但却为信息、知识所饿!数据仓库基本概念[1]数据爆炸问题自动的数据收集工具和成熟的数据库技术导致巨大的数7面临的挑战如何在堆积如山的企业交易数据中发现具有商业价值的闪光点?如何使您的企业或组织在激烈的市场竞争中保持对客户的吸引力?如何预先发现和避免企业运作过程中不易察觉的商业风险?数据仓库基本概念[1]面临的挑战如何在堆积如山的企业交易数据中发现具有商业价值的闪8数据仓库应运而生数据仓库的出现和发展是数据库和OLTP技术发展、数据库应用深化的产物;目的是把数据库中的大量数据转化为有用信息,为企业更好地进行决策服务。数据仓库基本概念[1]数据仓库应运而生数据仓库的出现和发展是数据库和OLTP技术发9讨论话题一数据仓库产生的源动力是什么?数据仓库系统是数据驱动还是需求驱动的?数据仓库基本概念[1]讨论话题一数据仓库产生的源动力是什么?数据仓库系统是数据驱动10
“我们花了20多年的时间将数据放入数据库,如今是该将它们拿出来的时候了。”
----著名的数据仓库专家RalphKimball市场需求是技术发展的源动力数据仓库基本概念[1] “我们花了20多年的时间将数据放入数据库,如今是该将它们拿111.2数据仓库定义及基本特性1.2.1数据仓库定义1.2.2数据仓库基本特性数据仓库基本概念[1]1.2数据仓库定义及基本特性1.2.1数据仓库定义数据仓库基121.2.1数据仓库定义数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)集成的(Integrate)相对稳定的(Non-Volatile)反映历史变化(TimeVariant)的数据集合,用于支持管理决策。数据仓库基本概念[1]1.2.1数据仓库定义数据仓库(DataWarehouse131.2数据仓库定义数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。数据仓库之父--BillInmon数据仓库基本概念[1]1.2数据仓库定义数据仓库是在企业管理和决策中面向主题的、集141.2数据仓库基本特性面向主题性数据集成性数据的时变性数据的非易失性数据仓库基本概念[1]1.2数据仓库基本特性面向主题性数据仓库基本概念[1]15面向主题性面向主题性表示了数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一主题组织的。确定主题以后,需要确定主题应该包含的数据。不同的主题之间可能会出现相互重叠的信息。主题在数据仓库中可以用多维数据库方式进行存储。主题的划分中,必须保证每一个主题的独立性。数据仓库基本概念[1]面向主题性面向主题性表示了数据仓库中数据组织的基本原则,数据16数据集成性根据决策分析的要求,将分散于各处的源数据进行抽取、筛选、清理、综合等工作,最终集成到数据仓库中。业务数据库1业务数据库2……业务数据库n数据仓库抽取转换清洗加载数据仓库基本概念[1]数据集成性根据决策分析的要求,将分散于各处的源数据进行抽取、17数据的时变性数据应该随着时间的推移而发生变化,不断地生成主题的新快照。存量数据T1时点增量数据……Tn时点增量数据数据仓库抽取转换清洗加载初始主题数据T1时点主题数据……Tn时点主题数据数据仓库基本概念[1]数据的时变性数据应该随着时间的推移而发生变化,不断地生成主题18数据的非易失性数据的相对稳定性。数据仓库中的数据只进行刷新,从不进行更新处理。反映历史变化。存量数据T1时点增量数据……Tn时点增量数据数据仓库抽取转换清洗加载初始主题数据T1时点主题数据……Tn时点主题数据时间戳锁定数据数据仓库基本概念[1]数据的非易失性数据的相对稳定性。存量数据T1时点增量数据……19讨论话题二数据库和数据仓库有什么不同?数据仓库基本概念[1]讨论话题二数据库和数据仓库有什么不同?数据仓库基本概念[1]20数据库与数据仓库的对比对比内容数据库数据仓库数据内容当前值历史的、存档的、归纳的、计算的数据数据目标面向业务操作程序、重复处理面向主题域、管理决策分析应用数据特性动态变化、按字段更新静态、不能直接更新、只定时添加数据结构高度结构化、复杂、适合操作计算简单、适合分析使用频率高中到低数据访问量每个事务只访问少量记录有的事务可能要访问大量记录对响应时间的要求以秒为单位计量以秒、分钟、甚至小时为计量单位数据仓库基本概念[1]数据库与数据仓库的对比对比内容数据库数据仓库数据内容当前值历211.3数据仓库与决策支持系统决策支持系统的发展阶段初始阶段(DSS阶段)与专家系统结合阶段(IDSS阶段)基于数据仓库技术阶段(BI阶段)基于数据仓库的决策支持系统数据仓库基本概念[1]1.3数据仓库与决策支持系统决策支持系统的发展阶段数据仓库基22DSS的先天不足DSS的先天不足决策所需信息不足,难以满足决策支持系统的需要。模型库提供的分析能力有限人机接口部件占整个DSS开发工作量的一半,成为DSS实施中的一个瓶颈。数据仓库基本概念[1]DSS的先天不足DSS的先天不足数据仓库基本概念[1]23基于数据仓库的DSS基于数据仓库的DSS数据仓库为DSS的发展开辟了新途径目前DSS的开发模式(BI解决方案)以数据仓库技术为基础以联机分析、数据挖掘工具为手段数据仓库基本概念[1]基于数据仓库的DSS基于数据仓库的DSS数据仓库基本概念[1241.4数据仓库体系结构接口数据仓库管理环境细节级数据数据集市1数据集市2数据集市n…ETL逻辑数据仓库组织与管理数据利用元数据(MetaData)数据集市x主题数据∑主题数据∑主题数据∑业务数据系统市场调查信息数据源外部数据……OLAPDataMiningForecasting应用环境专家经验数据数据仓库基本概念[1]1.4数据仓库体系结构接数据仓库管理环境细节级数据数据集市1251.4.1数据仓库的概念结构从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具。数据集市/知识挖掘库业务系统外部数据源数据准备区数据仓库数据库应用工具管理工具应用工具数据集市/知识挖掘库数据仓库基本概念[1]1.4.1数据仓库的概念结构从数据仓库的概念结构看,应该包含261.4.2虚拟数据仓库结构虚拟数据仓库利用描述了业务系统中数据位置和抽取数据算法的元数据直接从业务系统中抽取查询的数据进行概括、聚合操作后,将最终结果提供给用户。
用户图1.2虚拟数据仓库结构数据仓库查询管理服务器业务系统数据库数据仓库基本概念[1]1.4.2虚拟数据仓库结构虚拟数据仓库利用描述了业务系统271.4.3数据集市结构数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形成的数据仓库,没有一个独立的数据仓库。系统的数据不存储在同一数据仓库中,每个主题有自己的物理存储区。
数据仓库查询管理服务器业务系统数据库主题1主题2数据仓库基本概念[1]1.4.3数据集市结构数据集市结构或称为主题结构的数据仓库是281.4.4单一数据仓库结构将所有的主题都集中到一个大型数据库中的体系结构。数据源中数据被按照同一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。
数据仓库查询管理服务器业务系统数据库数据仓库数据集市1数据集市2数据仓库基本概念[1]1.4.4单一数据仓库结构将所有的主题都集中到一个大型数据库291.4.5分布式数据仓库结构在企业各个分公司具有相当大的独立性时,企业总部设置一个全局数据仓库,各个分公司设置各自的局部数据仓库。局部数据仓库主要存储各自的未经转换的细节数据,全局数据仓库中主要存储经过转换的综合数据。
站点A站点B
总部站点C站点D
站点C站点D全局数据仓库局部数据仓库局部数据仓库局部数据仓库局部数据仓库数据仓库基本概念[1]1.4.5分布式数据仓库结构在企业各个分公司具有相当大的独立30讨论话题三数据仓库、数据集市、分析主题的关系是什么?在数据集市间如何保证数据的一致性?数据仓库基本概念[1]讨论话题三数据仓库、数据集市、分析主题的关系是什么?数据仓库311.5数据仓库相关概念BI(商务智能)ETL(抽取、转换、加载)METADATA(元数据)DATAMART(数据集市)SUBJECT(主题)DIMENSION(维度)数据仓库基本概念[1]1.5数据仓库相关概念数据仓库基本概念[1]32商务智能简单定义
综合企业所有沉淀下来的信息,用科学的分析方法,为企业领导提供科学决策信息的过程。完整定义
基于数据仓库技术的决策支持系统(DSS)。它
以数据仓库(DW)技术为基础,通过抽取、转换和清洗将分散在企业各处的数据整合在一起,转化为信息;进而以联机分析处理(OLAP)工具、数据挖掘(DM)工具、报表工具为手段将信息提升为知识;最后运用可视化技术以快捷直观的方式将探察分析结果呈现给最终用户,为管理决策层提供量化依据的过程。数据仓库基本概念[1]商务智能简单定义数据仓库基本概念[1]33ETL抽取、转换、加载(ETL)数据抽取(Extract)、转换Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 皮革化学品考核试卷
- 2024年度地暖工程节能技术服务与培训合同3篇
- 2024年汽车制造厂与供应商关于汽车零部件混合料运输合同
- 环保技术方案设计与优化考核试卷
- 2024年度智能云服务器集群托管服务合同3篇
- 生物多样性保护案例分析考核试卷
- 生物基纤维在触控屏中的应用考核试卷
- 礼品包装搭配课程设计
- 煤质化验培训课程设计
- 《复媒体视阈下青年群体在移动社交平台的迁徙行为研究》
- 建设项目全过程跟踪审计表格
- 企业员工上下班交通安全培训(简详共2份)
- 城市高密度建成区合流制溢流污染系统研究-黄孝河机场河水环境综合治理项目实践
- T∕ZSQX 008-2020 建设工程全过程质量行为导则
- 业务员手册内容
- pH值的测定方法
- 输出轴的机械加工工艺规程及夹具设计
- 元旦文艺汇演校长致辞
- 国家开放大学电大本科《管理案例分析》2023-2024期末试题及答案试卷编号:1304
- 离合器接合叉机械工艺说明书
- PWM脉宽直流调速系统设计及 matlab仿真验证
评论
0/150
提交评论