版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于数据治理的企业数据质量管理与保障解决方案1数据质量问题背景及分类2数据质量体系建设原则3数据质量方案框架及关键技术4数据质量行业实践整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行1数据质量问题产生的背景2数据质量体系建设原则3数据质量方案框架及关键技术4数据质量行业实践整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行数据质量管理体系的构成为建立全方位的数据质量管理体系,应同时关注组织、技术和流程三大核心部分,三部分相辅相成才能形成完整的数据质量管理体系。数据质量体系建设五个原则目标提升数据质量问题解决效率,提升企业数据质量全程监控:从数据的定义、录入、存储、加工、交互、使用全过程进行数据质量监控,明确各部门在全过程中的责任,全方位保证数据质量主动管理:强化对企业发现的各IT系统数据质量问题的主动管理,协同相关部门推动问题的有效解决闭环管理:建立数据质量问题的发现、通报、整改和反馈等环节具体流程,形成数据质量问题的闭环管理自动管理:深入分析业务人员发现的数据质量问题的业务规则和成因,科技部门将其转化为技术规则落地到系统中,实现数据质量问题的自动筛选。全员参与:业务人员、技术人员和运维人员要共同参与数据质量提升工作。12345全程监控—事前、事中、事后三阶段管理事前预防事中监控事后改善数据质量主动保证,侧重面向未来的数据(指业务运营过程中新增的数据),通过业务流程优化、源系统改造和数据标准规范来提升数据质量。未来数据数据质量持续监控与优化,侧重面向当前的数据(当前数据质量检查周期内更新的数据),根据数据质量检核规则,对数据进行持续、周期性监测。当前数据历史数据数据质量清洗提升,侧重面向历史数据(指某个时间点前已经生成的数据)。按业务系统或主题分批对数据质量分析、清洗,提高既有数据的质量。从发现到改进闭环管理建立数据质量闭环管理机制、明确各部门关于数据质量提升工作的分工职责并强化执行;同时基于数据管理工具,固化流程,线上支撑企业级数据质量管理,确保企业级数据质量稳步提升。固化流程、全员参与借助工具、自动管理数据质量管理员技术人员业务人员问题定义问题发现/分析问题跟踪问题处理评估和统计数据质量问题需求提出,选择系统(检核对象业务实体、属性)需求转化检核规则,通过可配置化方式,自动生成检核脚本,批量检核问题数据。输入数据质量问题管理,疑似问题发布数据质量问题整改。采用问题认责方式,保证问题处理及时行。数据质量问题整改效果确认。未及时处理的问题,纳入考核计分数据质量问题评估与分析,图形化展示统计报表。1)检核维度报表2)机构问题统计报表。3)问题整改效果报表。4)问题分布报表。检核目标库输出企业级元数据管理流程自动化sql脚本引擎问题存储库数据质量问题分析。元数据模块提供影响分析,为下游问题预警提升意识、主动管理因子项关联定义数据标准明确数据责任人开展数据质量宣贯提升数据质量意识3数据质量方案框架及关键技术1数据质量问题背景及分类2数据质量体系建设原则4数据质量行业实践功能架构应用功能层接口服务数据质量报告数据质量分析质量监控获层取角色管理日志管理权限管理用户管理参数管理ODS/EDW/hadoop方式一:检核结果文件方式二:直连数据库任务手工调度任务自动调度调度参数管理并发跑批设置度量规则定义度量规则类别度量规则管理检核方法管理检核脚本生成检核方法导入检核方法导出检核结果管理问题显示配置问题发布管理问题处理跟踪问题查询管理问题考核管理问题导入/导出消息管理通知人管理消息模板管理发送任务管理知识库管理知识分类管理知识内容管理知识库查询多维度数据质量报告数据质量报告导出数据质量汇总分析影响/血统/趋势分析重点问题监控问题整改监控检核结果接口检核方法接口关键技术—检核脚本自动生成SQLEngine方式一:参数化配置空值检核01)基础类度量规则02)复杂业务度量规则非法值检核非法代码检核主键重复检核系统间一致性检核数据总数检核表间关系检核业务逻辑Sql存储过程定时调度方式二:模板导入按照度量规则类别,自动生成检核Sql语句。对业务逻辑复杂的检核方法,支持编写存储过程脚本对问题检核。问题跑批处理:1、支持与第三方调度工具的集成。2、产品自身提供跑批调度管理。业务人员通过系统界面进行规则定义或者通过模板导入方式进行,屏蔽技术细节。缩短度量规则转化为检核方法的时间。采用模板配置和页面参数配置方式输入检核规则,通过系统内置SQL引擎,实现检核脚本自动化生成。降低业务规则转化为技术实现的成本,提高业务规则的实现效率。关键技术—数据问题检核架构检核系统2数据库数据质量系统调度平台(或数据质量调度模块)检核规则、方法梳理模板检核脚本生产组件公共检核执行组件调度组件检核脚本存储表检核系统检核结果存储表线程1线程2线程nEDW/Hadoop检核系统1数据库格式化数据文件分发组件关键技术·数据质量问题报告4数据质量行业实践1数据质量问题背景及分类2数据质量体系建设原则3数据质量方案框架及关键技术考核
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 20957-1:2024 EN Stationary training equipment - Part 1: General safety requirements and test methods
- 快餐摊位租赁合同
- 2024【办公大楼的物业管理委托合同】对付物业最有效的办法
- 技术转让合同注意事项
- 2024日用品采购合同范本
- 2024年户外广告牌设置与发布合同
- 交通事故私了协议书模板
- 期刊广告投放区域协议
- 农村调解协议书样本
- 房产贷款合同汇编
- 微景观制作课件
- 业务招待费审批单
- 建筑工程项目管理咨询招标(范本)
- 三位数除两位数的除法练习题
- 慢性胃炎的中医治疗培训课件
- Python程序设计课件第7章面向对象程序设计
- 主题班会课防盗
- 幼儿园课件《挠挠小怪物》
- 教师教案检查八大评分标准教案的评分标准
- 政府会计基础知识讲义
- 幼儿园整合式主题活动设计案例《温馨家园》
评论
0/150
提交评论