数据质量管理5要素数据质量报告_第1页
数据质量管理5要素数据质量报告_第2页
数据质量管理5要素数据质量报告_第3页
数据质量管理5要素数据质量报告_第4页
数据质量管理5要素数据质量报告_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据质量治理5要素数据质量报告数据质量治理5要素数据质量报告制订数据标准、标准流程同样重要。:销售人们可以把上述各种在不同时期由于不同目的而生成的数据进展5个方面着手。义。〔比方出于便利、习惯等〕订的。相对而言,前者更简洁执行一些。数据治理面临的两个主要挑战是企业本身的简单性和身份信息数据质量指标时,必需保证这些措施和指标能够不断重复。在数据转化流程中设立多共性能监控点。数据的质量凹凸着工程的最终成功。对流程不断进展改善和优化。我们常常听到有人说,他们觉察这些方法本钱昂扬的时候,就应当考虑换一种方式了。把责任落实到人。通常,我们认为那些与数据的产生、维会针对具体状况适时调整数据质量的目标。5点有助于帮助组织标准数据质量治理中与人有关的流程。提高数据质量的三个步骤此过程包括数据质量评估、规划以及策略的选择和实施。IT机构节约工程本钱。就遵循数据质量规章。生的影响。目前的策略类型有两种:在企业输入数据时提高数据质量的方法称为“上游”方法,而从运营系统提取数据的应用程序〔如数据仓库〕中改善数据质量的方法是“下游”方法。数据质量功能。〔而非数据源中的〔尤其是数据转换、名称和地址清洗以及查找验证〕数据质量治理5要素数据质量报告业在任何时候都可以信任满足全部需求的全部数据。一个战略性和系统性的方法能帮助企业正确争论企业的数IT部门的相关人员将各自具有明确角数据质量反映的是数据的“〔fitnessforuse〕”,即数据治理的前提。数据质量问题的影响因素1、数据质量方面缘由——数据不全都根底数据难以共享利用,数据的深层价值也难以表达。2、数据质量方面缘由——数据不完整性信息,数据完整性无法得到保障。3、数据质量方面缘由——数据不合规利用,且没有相应的数据治理流程。4、数据质量方面缘由——数据不行控标准、制度、流程得到长效执行。5、数据质量方面缘由——数据冗余成了企业顶层视角的数据消灭“一物多码”、“一码多物”等现象。5个因素.中琛魔方大数据平台治理。常见的数据质量问题包括数据不全都实效性不强精度不够数据质量治理的目标通过数据分析、数据评估、数据清洗、数据监控、错误预警数据需求方对数据质量的规章要求。数据质量评估包括但不止以下6个方面完整性Completeness:度量哪些数据丧失了或者哪些数据不行用。标准性Conformity:度量哪些数据未按统一格式存储。全都性Consistency:度量哪些数据的值在信息含义上是冲突的。准确性Accuracy据是超期的。s些属性是重复的。关联性Integration:度量哪些关联的数据缺失或者未建立索引。数据质量评估模型要素分别为:型、数据质量评价模型、数据质量关心模型。根底模型。主要是映射、定义数据采集标准,上载分单位的采集打算,同时纳入了约束规章定义标准、掌握规章定义标准、模板定义标准。数据标准:分两局部,一局部是直接映射应用中的标准,例如源数据库标准;另一局部是针对增应用库和工程库标准的定义标准,包括代码定义标准、数据项定义标准(例如是取英文还是汉语拼音,取几个字符、值域定义标准等等增表准的建立标准;采集打算:划;约束规章定义标准:主要描述质量定义模型中的语法构成;掌握规章定义标准:针对效劳器负载和采集表的准时性,要求建立的后台执行过程的掌握方式的使用说明;数据质量定义模型。以根底模型为前提对数据质量的统一标准的定义,是数据质4个关键特性。(1全都性的量化评价指标:间记录全都率。(2准确性的量化评价指标:准确率、过失率a、问题字段个数、问题记录掩盖率(3)准时性的量化评价指标:采集工程准时率;单位入库准时率(4)完整性的量化评价指标:字段缺失数、缺失记录掩盖率、打算完成率。数据质量掌握模型。据质量掌握模型的掌握内容表现在:对数据检查对象、数据检查频度、数据检查时间、数据检查方式等方面进展掌握。数据检查对象:是指依据采集打算设定需要检查的用户、专业数据表、数据库实体。数据检查频度;是指依据数据表的采集打算和实际发生的频度,设定存储过程的检查执行频率。数据检查时间:是指依据每日生产应用的密集时间以及数据发生到采集入库的密集时间,综合设定一个检查开头执行的时刻。数据检查方式:是指执行检查过程的方式可以由后台过程2小时自动检查一次;也可以由人工干预手动〔固然尽量选择数据库流量比较低的时候。数据质量评价模型。据质量的关键指标,实现对数据质量的量化诊断和评价。数据质量分析评价模型功能核心是,通过对根底模型中的采集打算和质量定义模型中的约束规章的处理,由掌握模型调用可以实现检查分析的后台存储过程在实体库中执行检查,形成查询,生成反映采集打算完成状况和数据质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论