元数据管理模块方案_第1页
元数据管理模块方案_第2页
元数据管理模块方案_第3页
元数据管理模块方案_第4页
元数据管理模块方案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、谢谢观赏谢谢观赏元数据管理模块方案 1目录1. 现状分析 (2)1.1 目前的困境 (2)1.2 什么是元数据管理 (3)2. 目标分析 (3)(3)(4)(4)2.1 建立完善的指标解释体系2.2 建立规范的元数据管理体系2.3 建立有效的数据稽核体系3. 功能概述 (4)3.1 元数据管理 (4)3.1.1 业务元数据 (5)3.2.2 技术元数据 (6)3.3 元数据分析 (9)3.3.1 血统分析 (9)3.3.2 影响分析 (10)3.3.3 重要性分析 (11)3.3.4 无关性分析 (12)3.4 数据稽核 (12)3.4.1 稽核规则管理 (13)3.4.2 稽核任务调度 (1

2、3)3.4.3 稽核结果分析 (14)3.4.4 数据质量评估 (14)3.4.5 数据问题管理 (14)元数据管理系统概述1.项目背景随着经营分析系统规模不断扩大, 系统所积累数据量也越来 越大,收集到的海量数据背后隐藏着大量珍贵重要的信息, 但也 同时提高了系统的数据管理难度: 一方面难以对这些数据进行有 效解释, 缺乏对业务流程执行的实时监控和管理; 另一方面各部 门数据与数据整合的难度也不断加大, 影响到了经营分析系统中 的数据质量。如何对现有数据进行深层发掘, 并揭示出埋藏在元数据中的 趋势、因果关系、 关联模式等核心信息?这是下一步深化经营分 析系统应用的电信运营商需要解决的头等大

3、事。构建 BI ,首先 要保证的是数据质量。 元数据管理解决的问题就是如何把业务系 统中的数据分门别类地进行管理,并建立数据与数据之间的关 系,为数据仓库的数据质量监控提供基础素材。1.1 需求分析使用者 (决策层、业务分析人员 ):1) 经营分析系统中存在有很多报表,不同报表中存在一些 相同的指标,这些指标往往不一致,给业务分析和决策工作造成很多困惑, 必须花费很大的精力去检查核实。2) 对于很多指标,不清楚其具体含义,不清楚其反映的问 题,不清楚其具体算法和来龙去脉。数据仓库项目开发维护者:1) 不同报表中的同一指标不一致,必须花费很大的精力去 检查,目前基本上是通过手工检查表和存储过程的

4、方式,效率较低。2) 没有完善的开发、维护规范。比如,新增一张分析报表, 开发人员根据业务人员的需求制作完成之后, 往往没有整理完善相应的数 据指标解释和元数据管理,造成日后检查困难。3) 开发、维护规范的执行力较低,没有行之有效的管控手 段。不严格按照规范执行, 随着项目的发展和时间的推移, 导致数据仓库项目的健壮性和可维护性呈几何级数下降, 给数据仓库的建设带来 大量的重复工作。1.2 系统概述元数据最本质,最抽象的定义为: data about data (关于数据 的数据 )。而对于经营分析数据仓库而言, 形象的定义为: 元数据就是 数据仓库的规范。这些规范包括对各种指标的定义、 解释

5、; 包括对各表中数据 的来龙去脉、数据的大小和格式的定义。元数据管理, 就是要建立一套行之有效的规范以及该规范的 管控体系, 实现从管理到查询到综合分析的全面管控, 管理层次 从接口到 ETL 处理、业务逻辑处理、结果展现处理和指标分析 的方方面面, 构成数据仓库应用系统的核心和基础。 做到开发者 能严格遵守规范, 维护者和使用者有规范可查, 有力的保障数据 仓库项目的健壮性和可维护性。2. 目标分析要走出目前的困境,有下面三个方面的问题急待解决:2.1 建立完善的指标解释体系满足用户对业务和数据理解的需求, 建立标准的企业内部知 识传承的信息承载平台,建立业务分析知识库,实现知识共享。 能够

6、回答诸如以下问题:什么是出帐用户数?在网用户数和网上用户数有何区别?什么是套餐的生命周期?竞争对手新发展用户数是怎么得来的?这个数据还叫什么名字?2.2 建立规范的元数据管理体系让用户能够清晰的了解数据仓库中数据流的来龙去脉, 业务 处理规则、发展情况等, 提高系统的可维护性、 适应性和集成性, 支持数据仓库 /集市的成长需求,减少因员工换岗造成的影响。具体来讲, 主要是对数据仓库建设、 运行和维护的规范的管 理。能够回答诸如以下的问题:哪张表是从业务系统抽取过来的原始话单表?竞争对手新发展用户事实表中的数据, 是从哪些表汇总计算 出来的?DW 用户下的 P_XXX 这个存储过程是谁写的, 现

7、在还有用 吗?我是新手, 要生成套餐生命周期演化分析事实表, 我该怎么 做?表空间不够了,哪些表的数据可以删掉?2.3 建立有效的数据稽核体系促进数据仓库的数据质量建设, 为提高整个系统的数据质量 奠定坚实的基础。建立报警、监控机制,出现故障,能及时发现 问题。提供整体系统运营的情况分析。能够回答诸如以下问题:今天的出帐用户数过高,是怎么回事?数据集市层中的 DM_XXX 表中数据为空,什么原因?A 报表中的全省 ARPU 值和 B 报表中的 ARPU 值为什么不 同?3. 功能概述3.1 元数据管理对数据仓库的层次结构、主题域划分,各层的各种对象,如 表、存储过程、索引、数据链、函数和包等的管理。能够清晰的 展现各层次结构之间的数据流程,图形化展现各对象之间的关 系,展现表中数据的来龙去脉。3.1.1 业务元数据业务元数据包括以下信息: 使用者的业务术语所表达的数据 模型、对象名和属性名;访问数据的原则和数据来源;系统所提 供的分析方法及公式、报表信息。业务元数据管理除了管理上述信息外, 还提供对业务元数据 来源的管理和差异性对比功能, 使用户能够方便的查询、 比较和 追溯。包括两个子模块,指标管理和指标解释接口。指标管理: 主要实现对所有指标的维护功能,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论