版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
企业数据模型转换到数据仓库数据模型的步骤企业数据模型 企业数据模型是指从整个企业业务的视角,对企业业务活动相关数据采用数据建模方法构造的模型。 企业数据模型是对企业业务的核心数据的抽象,它不是信息化系统实施所需的全部细节数据的数据模型。 企业数据模型不随企业职能域的改变而变化,它独立于企业的应用,是企业信息化应用建设的基础。数据仓库
数据仓库是一个面向主题的、集成的、非易失的,随时间变化的用来支持管理人员决策的数据集合。数据仓库的特点面向主题性 数据以所代表的业务内容划分,而不是以应用划分。集成 数据仓库中的数据从多个不同的数据源传送来。数据仓库的特点非易失性 数据仓库的数据通常以批量方式载入与访问,但在数据仓库环境中并不进行数据更新,只允许加载和查询操作。随时间变化 数据仓库中的每个数据单元只是在某一时间是准确的,有些情况下记录中加有时间戳,而在另外一些情况下记录则包含一个事务的时间。企业数据模型转换到数据仓库数据模型的步骤选择感兴趣的数据在键中增加时间增加派生数据确定粒度级别汇总数据合并实体建立数组分离数据选择有兴趣的数据
主要原因把数据仓库项目的目的和企业目标作为前景,在涉及数据仓库建模的所有决定中都考虑了企业目标和目的。把数据仓库模型的范围限定为刚好满足项目的需要。选择有兴趣的数据 在操作系统中,数据元素分三组肯定需要的元素肯定不需要的元素可能需要的元素选择有兴趣的数据 选择处理过程考虑三方面的因素使用数据元素生成派生字段划分事务型数据和参照型数据源数据结构使用数数据元元素生生成派派生字字段通常的的规则则用于计计算派派生字字段的的每个个元素素都应应该包包含在在数据据仓库库中。。原因用于计计算所所需要要的数数据元元素的的算法法可能能会改改变,,并且且通过过保留留这些些独立立的元元素,,派生生字段段可以以根据据当前前视图图和历历史视视图的的需要要重新新进行行计算算。当企业业用户户分析析结果果时,,尤其其是派派生元元素的的值是是一个个意想想不到到的值值的时时候,,他们们已经经钻研研用于于计算算某个个所需需字段段的数数据。。划分事事务型型数据据和参参照型型数据据通常的的规则则对于事事务型型数据据,如如果我我们无无法确确定,,就应应该引引入它它。对于参参照型型数据据,如如果对对是否否要包包括一一个数数据元元素有有异议议,通通常倾倾向于于排除除它。。源数据据结构构如果一一个源源数据据表中中的绝绝大部部分列列都需需要,,那么么应该该考虑虑包括括进所所有的的元素素。如果仅仅仅需需要一一个源源数据据表中中很少少的几几列,,那么么应该该倾向向于排排除其其他的的列。。企业数数据模模型转转换到到数据据仓库库数据据模型型的步步骤选择感感兴趣趣的数数据在键中中增加加时间间增加派派生数数据确定粒粒度级级别汇总数数据合并实实体建立数数组分离数数据在键中中增加加时间间企业数数据模模型是是一种种“时时间点点”模模型,,这种种模型型实时时地描描述业业务。。数据仓仓库数数据模模型是是一种种“时时间段段”模模型,,它用用历史史视图图来描描述一一个企企业。。在数据据模型型中为为每个个实体体增加加时间间成分分(日日期、、时间间)以以提供供历史史视角角。由由于对对每个个实体体的键键都要要求加加入时时间成成分,,因此此所包包括的的历史史数据据中的的一些些一对对多的的联系系也变变成了了多对对多的的联系系。在键中中增加加时间间实体的的时间间成分分只能能采用用两种种形式式中的的一种种对于快快照数数据,,加入入到键键中的的是一一个时时间点点,如如日期期。对于属属于一一段时时间的的数据据,加加入到到键中中的就就是时时间段段。尽管在在理论论上建建议时时间成成分应应该加加入到到每个个实体体键中中,但但是如如果数数据从从来不不改变变,就就不可可能有有任何何历史史数据据,因因而也也就有有了例例外。。收集历历史数数据的的方法法生成一一个双双外键键。收集历历史数数据的的方法法为每个个实例例在父父亲实实体中中生成成一个个顺序序键,,并在在父亲亲实体体内将将该实实例的的标识识符和和时间间成分分作为为非键键属性性存储储。收集历历史数数据的的方法法有计划划地实实施参参照完完整性性,而而不是是使用用DBMS来实实施它它,并并且针针对标标识符符实施施参照照完整整性。。收集历历史数数据的的方法法将数据据分离离为一一个包包含历历史数数据的的实体体和一一个只只包含含当前前数据据的实实体。。收集历历史数数据的的方法法维护基基本实实体,,基本本实体体内的的数据据元素素从不不改变变,并并且为为随时时间变变化的的属性性创建建一个个属性性的实实体。。收集历历史联联系联系也也会随随着时时间而而改变变。这这些改改变的的结果果是创创建多多对多多的联联系。。在第第三范范式模模型内内,可可预测测的层层次结结构是是通过过一系系列的的实体体来体体现的的,这这些实实体具具有连连续的的一对对多联联系。。收集历历史联联系这种情情况可可以用用两种种方法法来处处理插入一一个关关联型型实体体来解解决多多对多多的联联系从父亲亲实体体到子子实体体的日日期级级联得得到父父亲节节点数数据的的改变变和联联系的的改变变方法依依赖于于两个个主要要因素素层次结结构的的层次次数。。实体型型数据据与联联系型型数据据的相相对稳稳定性性。关于多多维模模型的的考虑虑在E--R模模型中中,可可以收收集到到每一一个有有意义义的历历史事事件,,并且且这些些事件件很容容易与与相关关的业业务项项联系系起来来。在在多维维模型型中,,对历历史数数据的的处理理依赖赖于其其是否否与事事务有有关或或者与与参照照型数数据有有关。。在一一个由由维表表覆盖盖的层层次结结构中中,对对数据据或联联系的的任何何有意意义的的变化化都要要求设设置另另外的的入口口项,,并创创建一一个缓缓变维维。。企业数数据模模型转转换到到数据据仓库库数据据模型型的步步骤选择感感兴趣趣的数数据在键中中增加加时间间增加派派生数数据确定粒粒度级级别汇总数数据合并实实体建立数数组分离数数据增加派派生数数据派生数数据是是对一一个或或多个个其他他的数数据元元素进进行数数学运运算而而产生生的数数据。。派生数数据并并入到到数据据仓库库模型型中有有两个个主要要原因因::保证一一致性性提高数数据交交付性性能企业数数据模模型转转换到到数据据仓库库数据据模型型的步步骤选择感感兴趣趣的数数据在键中中增加加时间间增加派派生数数据确定粒粒度级级别汇总数数据合并实实体建立数数组分离数数据确定粒粒度级级别从业务务观点点来看看,它它规定定了数数据仓仓库潜潜在的的能力力和灵灵活性性,而而不考考虑初初次部部署的的功能能。如如果没没有以以后粒粒度级级别的的变化化,数数据仓仓库将将永远远不能能回答答需要要低于于所采采用细细节级级的问问题。。从技术术观点点来看看,粒粒度级级别是是数据据仓库库建模模的主主要决决定因因素之之一,,因此此对操操作的的开销销及性性能都都有显显著影影响。。从项目目观点点来看看,粒粒度级级别影影响着着项目目组创创建数数据仓仓库的的工作作量,,因为为随着着粒度度级别别进入入越来来越高高的细细节级级,项项目组组需要要处理理更多多的数数据属属性和和它们们之间间的关关系。。另外外,如如果粒粒度级级别充充分增增加,,一个个相对对小型型的数数据仓仓库也也会变变得非非常巨巨大,,这要要求有有额外外的技技术上上的考考虑。。影响数据仓仓库的粒度度级别的因因素当前的业务务需求期望的业务务需求扩展的业务务需求数据挖掘需需求派生数据需需求操作型系统统粒度数据获取性性能存储开销管理企业数据模模型转换到到数据仓库库数据模型型的步骤选择感兴趣趣的数据在键中增加加时间增加派生数数据确定粒度级级别汇总数据合并实体建立数组分离数据汇总数据创建汇总数数据也许不不会节省磁磁盘空间,,因为用于于创建汇总总地细节可可能会被继继续保留。。然而,这这种能够改改善数据交交付处理的的性能。五种汇总类类型简单积累((simlpecumulation)卷动汇总((rollingsummary))简单直接文文件(simpledirectfile)连续文件((continuousfile))垂直汇总((verticalsummary)时间段数据据的汇总简单累积和和卷动汇总总应用于属属于一段时时间的数据据。简单累积表表示对数据据的一个属属性上的数数据求和,,比如时间间。卷动汇总提提供一致的的时间段内内的销售信信息。例如如,按周的的卷动汇总总提供上一一周每天结结束时的销销售信息。。快照数据的的汇总简单直接汇汇总和连续续汇总应用用于快照数数据、短暂暂数据或属属于一个时时间点的数数据。简单直接文文件提供了了固定时间间间隔内的的数据的值值。连续文件只只有当一个个值发生变变化时生成成一个新记记录。垂直汇总垂直汇总可可以同时应应用于时间间点和时间间段上的数数据。尽管管时间点上上和时间段段上的数据据不应该在在数据仓库库中被混合合到一个垂垂直汇总的的实体中,,但是在数数据集市中中允许把数数据归并到到一个事实实表中。企业数据模模型转换到到数据仓库库数据模型型的步骤选择感兴趣趣的数据在键中增加加时间增加派生数数据确定粒度级级别汇总数据合并实体建立数组分离数据合并实体合并实体是是将两个或或更多的实实体合并成成一个。原原始的实体体仍然可以以保留。合合并实体通通过减少连连接操作的的数量,提提高了数据据交付处理理的性能,,并且可以以增强一致致性。合并实体在决定合并并实体前应应有如下的的标准:实实体应共享享一个公共共键,来自自合并实体体的数据经经常被一起起使用,而而且插入模模式也相似似。三个条件如果数据不不能用相同同的键联系系起来,那那它不能合合并到一个个公共实体体中。若只使用在在同一个实实体中的数数据,则在在将数据交交付到数据据集市期间间,可以避避免连接操操作。装载性能和和存储。当当数据合并并到一个实实体中时,,任何时候候任何属性性发生变化化都将产生生新的一行行。企业数据模模型转换到到数据仓库库数据模型型的步
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度农业科技园区运营管理合同标准3篇
- 二零二五年度林权登记与不动产登记网络安全保障合同
- 2025年度智能控制喷锚工程劳务施工合同标准
- 二零二五年度美术教育研发中心美术教师聘用合同4篇
- 2025年度民间担保人文化创意产业贷款合同模板
- 二零二五年度数字经济派遣合同就业协议书范本
- 2025年新能源汽车零部件采购及供应合同范本2篇
- 2025年度山西旅游行业劳动合同书范本3篇
- 2025版智能门卫服务与社区治安巡逻合同3篇
- 2025装载机驾驶员聘用合同-装载机驾驶员职业技能鉴定协议3篇
- 《openEuler操作系统》考试复习题库(含答案)
- 《天润乳业营运能力及风险管理问题及完善对策(7900字论文)》
- 医院医学伦理委员会章程
- xx单位政务云商用密码应用方案V2.0
- 2024-2025学年人教版生物八年级上册期末综合测试卷
- 2025年九省联考新高考 语文试卷(含答案解析)
- 死亡病例讨论总结分析
- 第二章 会展的产生与发展
- 空域规划与管理V2.0
- JGT266-2011 泡沫混凝土标准规范
- 商户用电申请表
评论
0/150
提交评论