下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、元数据解决方案随着报价系统每年收集和使用的数据飞速增长,数据体量日趋增长,数据形 态多样化且不统一,多种数据源之间的采集、传播和共享遇到困难。元数据管理 作为大数据治理的核心,是有效管理这些数据的基础和前提,在信息化建设中发 挥着重要的作用。如何理解、管理并发挥出元数据的价值,成为迫切的任务。一、什么是元数据元数据(Metadata)是关于数据的数据。元数据是描述数据仓库内数据的结 构和建立方法的数据。可将其按用途的不同分为两类:技术元数据( Technical Metadata )和业务元数据(Business Metadata )。1.技术元数据技术元数据是存储关于数据仓库系统技术细节的数
2、据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:1)数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据 的定义,以及数据集市的位置和内容。2)业务系统、数据仓库和数据集市的体系结构和模式。3)汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、 汇总、预定义的查询与报告。4)由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分 割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存 取控制)。2.业务元数据业务元数据从业务角度描述了数据仓库中的数据, 它提供了介于使用者和实 际系统之间的语义层,使业务人员也能够 或懂”数据仓库中的数据。业务元
3、数据 主要包括以下信息:1)使用者的业务术语所表达的数据模型、对象名和属性名2)访问数据的原则和数据的来源。3)系统所提供的分析方法以及公式和报表的信息。4)企业概念模型、多维数据模型,业务概念模型与物理数据的依赖,二、元数据的作用元数据可以实现业务模型与数据模型的映射, 帮助用户理解数据仓库中的数 据;元数据清晰的描述了数据的来龙去脉,描述了数据抽取转换规则,是保证数 据质量的关键;元数据管理系统可以把整个业务的工作流、数据流和信息流有效 的管理,可以支持需求变化,从而提高系统的可扩展性;打通数据孤岛,统一数 据定义,形成企业级知识传承平台,元数据管理使得数据变的更有价值。三、元数据管理在大
4、数据时代的背景下,数据即资产,元数据实现了信息的描述和分类的格 式化,从而为机器处理创造了可能,它能帮助企业更好地对数据资产进行管理, 理清数据之间的关系。元数据管理是企业提升数据质量的基础, 也是企业数据治 理中的关键环节。元数据管理不当,信息很容易被丢失,进而不能对业务进行有 效支撑,企业内部业务人员要识别相关信息就会变得十分困难,最终用户也将失去对数据的信任。1 .元数据采集技术元数据的采集,根据现有元数据设计出元模型,然后将数据仓库系统之 中的元数据按元模型集中汇总并关联到一起, 达到企业对数据统一管理与应用的 目的,ETL等产生的元数据,对于元数据管理工具支持的格式可直接进行导入,
5、对于一些自定义的规则,需要进行格式转换并导入。业务元数据相对复杂,来源较广泛且不统一,需要对业务系统进行深入理解, 按业务主题进行整理,梳理出业务范围、业务名称 、业务定义、业务描述、业 务关系等,并添加到元数据管理系统中。主要从以下几方面来进行梳理:1)业务平台中的各业务流程。2)交易、结算系统,提取出各种财务公式、过程逻辑、业务规则等。3)报表系统,比如表头,包含合计、平均数等聚合函数的列,一些计算公 式等。4)表格,在Excel中进行业务计算的公式,列的描述、代码描述等。5)文件数据中的标题、作者、时间、内容主题等。2 .存储管理对元数据存储需要使用专门的工具,拟定为( 还需要做充分调研
6、)Pentaho Metadata进行存储管理。通过工具与数据库系统的对接,将元数据导致进去, 对于不支持系统对接的元数据,可手动进行添加。通过管理工具提供的辅助功能 可对元数据进行标注、完善等。四、元数据应用通过元数据管理工具将元数据服务提供给所有业务人员, 使业务人员也能够 快速的从业务角度理解数据,从而帮助业务人员更好的利用数据。 以下用三个方 面来阐述元数据的实际应用价值:1 .元数据对比分析业务系统由开发环境到测试环境再到生产环境,在系统的设计、开发、测试、上线过程中,无论需求变更还是 Bug都会导致元数据的改动。大到库表结构重 新设计,小到字段类型的变更,都可能导致系统出现重大问题
7、。 为了避免这种问 题的发生,我们可以使用元数据系统的对比分析功能, 元数据系统可以自动采集 三个环境的库、表、字段、视图、存储过程等结构,自动化采集保证了各自环境中都是最新的、最准确的元数据结构,我们对上线的数据环境与测试库进行对比, 会轻松的发现问题所在,能大大降低这些问题发生的概率。2 .数据流向分析数据平台系统中,业务数据由操作型数据几分析型数据转换,通过大量的数 据抽取、转换、清洗等过程形成了分析统计数据。数据由业务系统 ,数据仓库, 数据集市,分析报表,数据加工链路比较长,期间处理方式多元化,很容易会出 现数据项不符合业务逻辑的情况,出现问题也很难迅速解决。通过使用元数据系统的数据
8、流向分析,即影响分析(上游 ,下游)与血缘分 析(下游,上游),提供了字段级的数据解析,上下游之间的数据加工链路可以 通过图形的方式快速定位,可以快速定位特定的表和某些字段,然后做详细的逻 辑分析,大大简化了分析环节,提升了解决问题的效率。3 .交易链路分析元数据可以辅助快速梳理系统服务之间的调用关系与服务间的接口。比如交易系统中入金、记账、结算等业务,会经过一系统复杂的系统接口服务调用,为 了更为清晰、准确的了解交易流程,需要对各个服务进行梳理、整合,由于涉及 不同的部门、系统,工作量和工作难度将相当大。为了解决这个问题,元数据的 链路分析能力可以自动化的完成梳理任务, 元数据可以通过服务接口的采集,自 动获取服务的信息,包括参与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度房地产项目担保合同标准范本3篇
- 2024年度企业专项人力资源派遣服务合同3篇
- 2024中介服务专业版二手房买卖合同范本3篇
- 2024年房产居中代理协议
- 2024年度消防设施安装调试合同范本492323篇
- 2024年度供应链金融担保履约保证协议3篇
- 2024年度企业担保合同变更及转让操作规范3篇
- 2024年度绿色建材认证地板砖批发合同范本3篇
- 2024年电子商务师专业实务及理论知识考试题库与答案
- 进口稻草出售合同范例
- 上海市住院医师规范化培训公共科目考试题库-重点传染病防治知识
- 专题10阅读理解、拓展探究-2022-2023学年八年级数学上册期末选填解答压轴题必刷专题训练(华师大版)(原卷版+解析)
- 西师大版五年级上册小数混合运算题100道及答案
- 2022年7月国家开放大学本科《中国法律史》期末纸质考试试题及答案
- 2024-2025学年七年级数学上册第一学期 期末模拟测试卷(湘教版)
- 2024年部门年终工作总结参考(四篇)
- 二年级数学上册口算天天练
- 肯耐珂萨题库
- 德询欧阳开贵 -组织的发展与挑战
- 冷凝集素综合征治疗与护理研究进展
- CJT313-2009 生活垃圾采样和分析方法
评论
0/150
提交评论