DB52T 1540.3-2020 政务数据 第3部分:数据清洗加工规范_第1页
DB52T 1540.3-2020 政务数据 第3部分:数据清洗加工规范_第2页
DB52T 1540.3-2020 政务数据 第3部分:数据清洗加工规范_第3页
DB52T 1540.3-2020 政务数据 第3部分:数据清洗加工规范_第4页
DB52T 1540.3-2020 政务数据 第3部分:数据清洗加工规范_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DB52DB52/T1540.3—2020政务数据第3部分:数据清洗加工规范Governmentdata——Part3:Datacleaningandprocessingspecification2020-11-20发布2020-12-20实施贵州省市场监督管理局发布I 1 1 1 2 2 3 1数据清洗加工datacleaninga2半结构化数据semi-structu5.2应在与互联网隔绝的安全环境下处理政务数据,环境支持数据可存储、可转化,数据清5.3数据清洗加工人员应经过相应的技术和安全培训,具有数据清洗加工的能力,并能按照3重复数据46.1.2对于海量数据,宜使用数据清洗加工ELT流程见图2。6.2.3应支持结构、半结构和非结构等不同类型数据的抽取。6.2.4抽取目的地的存储容量应能支持抽取来源的数据总量,数据抽取目的地的表结构应与抽取来源6.2.5增量抽取(更新)应确定增量更新的方式,抽取的数据应有字段可区分,如更新时间等。56.3.2以需求为导向、应用为目标,考虑目标数据资源特点和工作复杂程度,结合6高高低7c)查询到确定的重复数据,根据权威性和应用场合,选择最恰当渠道来源的数据,或在不影响数据保真度和完整性的情况下进行合并处理。86.8.3应实现对数据的格式、信息代码、值的冲突进9转化规则规则描述统一时间日期数据格式将各类日期统一为八位的字符日期,如YYYYMMDD;将各类时间统一为六位的字符时间,如HHMMSS;将各类事件日期统一为十四位的字符时间日期,如YYYYMMDDHHMMSS;统一分类数据取值代码将人员的性别数据统一转换为国标性别信息代码;将人员的民族数据统一转换为标准信息代码;将人员的户籍地址数据统一转换为行政区划代码;将人员的婚姻登记情况统一转换为标准的婚姻状况代码;将公民身份证统一转换为18位的身

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论