数据仓库术语一览_第1页
数据仓库术语一览_第2页
数据仓库术语一览_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库术语一览数据仓库:数据仓库是一个支持管理决策的数据集合。数据是面向主题的、集成 的、不易丢失的并且是时间变量。数据仓库是所有操作环境和外部数 据源的快照集合。它并不需要非常精确,因为它必须在特定的时间基 础上从操作环境中提取出来。数据集市:数据仓库只限于单个主题的区域,例如顾客、部门、地点等。数据集 市在从数据仓库获取数据时可以依赖于数据仓库,或者当它们从操作 系统中获取数据时就不依赖于数据仓库。事实:事实是数据仓库中的信息单元,也是多维空间中的一个单元,受分析 单元的限制。事实存储于一张表中(当使用关系数据库时)或者是多 维数据库中的一个单元。每个事实包括关于事实(销售额,销售量,

2、成本,毛利,毛利率等)的基本信息,并且和维度相关。在某些情况 下,当所有的必要信息都存储于维度中时,单纯的事实出现就是对于 数据仓库足够的信息。我们稍后讨论有关缺无事实的情况。维度:维度是用来反映业务的一类属性,这类属性的集合构成一个维度。例 如,某个地理维度可能包括国家、地区、省以及城市的级别。一个时 间维度可能包括年、季、月、周、日的级别。级别:维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别(如大分类 -中分类- 小分类-细分类)。级别仅存在于维度内。级别基于维度表中的列或维 度中的成员属性。数据清洗:对数据仓库系统无用的或者不符合

3、数据格式规范的数据称之为脏数据。清洗的过程就是清除脏数据的过程。数据采集:数据仓库系统中后端处理的一部分。数据采集过程是指从业务系统中 收集和数据仓库各指标有关的数据。数据转换:解释业务数据并修改其内容,使之符合数据仓库数据格式规范,并放 入数据仓库的数据存储介质中。数据转换包括数据存储格式的转换以 及数据表示符的转换(如产品代码到产品名称的转换)C联机分析处理(OLAP Online Analytical Processing )OLAP是一种多维分析技术,用来满足决策用户在大量的业务数据中, 从多角度探索业务活动的规律性、市场的运作趋势的分析需求,并辅 助他们进行战略发展决策的制定。按照数

4、据的存储方式分OLAP又分为ROLAP、MOLAP和HOLAP。在客户信息数据仓库 CCDW的数据环境 下,OLAP提供上钻、下钻、切片、旋转等在线分析机制。完成的功能 包括多角度实时查询、简单的数据分析,并辅之于各种图形展示分析数据挖掘:在数据仓库的数据中发现新信息的过程被称为数据挖掘,这些新信息 不会从操作系统中获得。切片:一种用来在数据仓库中将一个维度中的分析空间限制为数据子集的技术。切块:一种用来在数据仓库中将多个维度中的分析空间限制为数 据子集的技术星型模式:是数据仓库使用程序的最佳设计模式。它的命名是因其在物理上表现 为中心实体,典型内容包括指标数据、辐射数据,通常是有助于浏览 和

5、聚集指标数据的维度。星形图模型得到的结果常常是查询式数据结 构,能够为快速响使用户的查询要求提供最优的数据结构。星形图还常常产生一种包含维度数据和 指标数据的两层模型。雪花模式:指一种扩展的星形图。星形图通常生成一个两层结构,即只有维度和 指标,雪花图生成了附加层。实际数据仓库系统建设过程中,通常只 扩展三层:维度(维度实体)、指标(指标实体)和相关的描述数据(类目细节实体)超过三层的雪花图模型在数据仓库系统中应该避免。因为它们开始像更倾向于支持 OLTP使用程序的规格化结构,而不是为数据仓库和 OLAP使用程序而优化的 非格式化结构。粒度:粒度将直接决定所构建仓库系统能够提供决策支持的细节级别。粒度 越高表示仓库中的数据较粗,反之,较细。粒度是和具体指标相关的 ,具体表现在描述此指标的某些可分层次维的维值上。例如,时间维 度,时间可以分成年、季、月、周、日等。数据仓库模型中所存储的数据的粒度将对信息系统的多方面产生影响 。事实表中以各种维度的什么层次作为最细粒度,将决定存储的数据 能否满足信息分析的功能需求,而粒度的层次划分、以及聚合表中粒 度的选择将直接影响查询的响应时间。度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数 据表中的一 列,而且

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论