济南市企业数据资产管理白皮书-2024.08-82正式版-WN8_第1页
济南市企业数据资产管理白皮书-2024.08-82正式版-WN8_第2页
济南市企业数据资产管理白皮书-2024.08-82正式版-WN8_第3页
济南市企业数据资产管理白皮书-2024.08-82正式版-WN8_第4页
济南市企业数据资产管理白皮书-2024.08-82正式版-WN8_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

济南市企业数据资产管理白皮书济南市企业数据资产管理白皮书指导单位:济南市大数据局济南市人民政府国有资产监督管理委员会中国(山东)自由贸易试验区济南片区管理委员会发布单位:济南市大数据协会编写单位:山东财经大学支持单位:北京交通大学山东省首席数据官联盟II济南市企业数据资产管理白皮书III济南市企业数据资产管理白皮书济南市企业数据资产管理白皮书一、调研背景与目的数据作为新时代的核心生产要素,已经成为推动产业转型升级、助推新一轮科技革命的基础资源。为此,我国推出了一系列政策。2022

12

月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)对外发布,从数据产权、流通交易、安全治理等方面构建数据基础制度,提出

20

条政策举措。2023

8

月,财政部制定印发的《企业数据资源相关会计处理暂行规定》为助力完善数字经济治理体系和加强宏观管理提供了会计信息支撑。2023

8

月,工信部、教育部等多部门联合印发的《元宇宙产业创新发展三年行动计划(2023—2025

年)》提出“要加速数字资产、数字人、数字内容等新兴领域产权归属研究,抢抓机遇引导元宇宙产业健康安全高质量发展,有力支撑制造强国、网络强国和文化强国建设”。2023

3

月,中共中央、国务院印发的《党和国家机构改革方案》明确提出组建国家数据局的关键作用,同年10

月,国家数据局正式挂牌成立。因此,推动数据要素发挥其乘数效应成为各地政府的首要工作议题。2023

11

10

日,济南市大数据局、济南市人民政府国有资产监督管理委员会和中国(山东)自由贸易试验区济南片区管理委员会牵头开展企业数据资源管理情况调研,并下发了正式调研函。济南市大数据协会联合山东省首席数据官联盟、山东财经大学以及北京交通大学受托开展此项工作。通过调查问卷、实地走访等方式,分析企业数据资源管理现状、数据资源和数据资产的应用实例,尝试探索提升企业数据管理能力操作流程,并基于当前企业数据管理中存在的问题,为企业提升数据管理能力提供政府助力。二、济南市典型企业数据管理现状本次调研共涉及

12

家企业(附录

1),调研样本基本实现行业全覆盖,具有一定代表性;其中制造业

5

家,信息传输、软件和信息技术服务业

3

家,建筑业

2

家,交通运输业、土地管理业各

1

家。被调研企业参与调研的人员包括企业高层领导、大数据部门、信息部门、财务部门和下属科技公司负责人,他们不仅了解企业数据管理情况,更关注数据资源入表和数据资产价值问题。第

1

页济南市企业数据资产管理白皮书从总体来看,目前企业的数据主要作为内部资源使用,以为企业自身生产与管理赋能。大部分企业已经开始了数字化转型,部分企业建立了相关专业部室或成立了专业数据公司,如济南城市建设集团成立了大数据中心,济南一建集团有限公司成立了负责运营维护集团数据的中科爱建(济南)智能工程有限公司。(一)数字化转型现状数字化是企业各个部门获取、整合与利用企业内部数据资源的重要途径。数字技术可以高效反映数据资源的利用状况、展现数字资源的利用程度。调研结果表明(见图

1),企业管理部门的数字化程度最高(75%),体现了运营管理是数据资源最广泛的应用场景;企业经营和销售部门的数字化程度分别为

58%和50%;企业设计部门的数字化开展程度最低(17%),表明设计部门的数字化转型工作可有待进一步分析推进。图

1

企业主要部门数字化转型现状被调研企业部门数字化转型主要表现在以下几个方面:1、建立数据中台。数据中台主要用于汇集企业各个部门的数据,便于数据管理和调度。其中,济南城市建设集团通过建设数据平台接入集团内部数据,将甲方和施工方项目管理系统中产生的有关图纸、模型、合同、清单、支付、招投标等方面的数据最终在该平台完成归集,统一了集团内部的工作平台,集团内部共用一套公用数据,只需被授予相应的权限,就能调用数据,实现数据共享,从而实现数据层面的统一;济南公共交通集团有限公司的下属科技公司,建立涵盖第

2

页济南市企业数据资产管理白皮书数据采集、整理和分析功能的数据中台,部门间实现数据开放共享;山东正中信息技术股份有限公司目前正在建设符合自身实际需要的数据中台系统,计划从软件平台入手借机搭建数据中台、做数据底座;中国电信股份有限公司山东分公司的业务部门可以在数据中台上架设

API

服务接口,进行调用共享,实现数据共享,对数据湖1内数据设定模型标准,统一在系统内建表维护。2、建立信息系统。山东正中信息技术股份有限公司共有四个核心系统,分别是财务系统、OA

系统、云平台、知识库。其中的云平台即正中信息技术咨询和管理科技服务云平台(包括监理服务系统、咨询服务系统、检测服务系统、供需对接服务系统等),与公司现有

OA

系统在合同分配、统计分析等方面实现协同,实现数据一次录入多次使用,同时可以为项目干系方提供信息资源共享和协同合作服务,用于支撑所有主营业务;知识库系统是企业各类资料的沉淀,包括政府的法律法规、标准规范、建设方案、建设资料等。济钢集团有限公司投资建设了内通外联的内部专业管理信息系统,主要分两大类,一类是执行层信息系统,如

MES

系统、一卡通系统、计量系统、智慧矿山系统、智慧园区系统、检化验系统、WMS

智能库房系统、标样环检相关电商系统等,执行系统的特点是与现场设备、生产工艺紧密相关,实现物联数据、传感数据、工艺数据的自动采集、自动传递;另一类是管控层信息系统,如运营管控平台、财务核算系统、资金管理系统、人力资源系统、全面预算系统、合并报表系统等,这些管控系统是集团层面同一平台建设、所有权属公司穿透使用、数据集中存储管理,执行系统纵向与管控系统打通,管控系统之间横向打通。山东宏济堂制药集团股份有限公司计划将全部信息系统打通,实现全业务链“端到端”的整体融合和数据集成共享。3、业财一体化。济南城市建设集团目前已建立起合同核算后自动发往财务系统的过程,但只是发出请求,在合同实际支付环节,出于财务安全的考虑,并没有实现完全智能化;济钢集团有限公司已经将业务系统和财务系统对接,业财是一张表、一套数据。4、建立标准体系。济南城市建设集团目前发布了济南城市建设集团技术标准《基础数据规范(第一部分)》《济南城市建设集团基础数据管理办法(试行)》,1

数据湖是一个以原始格式存储数据的存储库或系统。它按原样存储数据,无需事先对数据进行结构化处理。一个数据湖可以存储结构化数据、半结构化数据、非结构化数据和二进制数据。运行不同类型的分析——从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。第

3

页济南市企业数据资产管理白皮书对数据信息进行规范管理;济南公共交通集团有限公司发布了《公交数据平台技术规范——接口规范》《公交数据平台技术规范——数据管理》《基于多源数据的公交线网优化数据采集及交换服务——数据元》《基于多源数据的公交线网优化数据采集及交换服务——数据采集》,其中《公交数据平台技术规范——接口规范》被列为济南市地方性标准。(二)数据安全现状数据安全与否关系到企业生产经营管理中的数据是否会被泄露给竞争对手,从而导致市场竞争格局的改变;也关系到涉及客户的数据是否会被泄露给第三方,从而影响企业声誉甚至带来法律风险。因此,数据安全问题是企业的命脉,也成为企业开发、利用、交易数据资源时的隐忧。严格科学的数据安全管理能够体现企业对数据资源的重视,反映数据资源的良好发展情况。调研发现(见图

2),采用数据备份和数据使用权限控制这两种方式进行数据安全管理的企业最多(83%);采用数据加密、数据脱敏、建立数据安全分类分级标准和数据安全策略、对数据流通环节监控、分析潜在数据安全风险的企业分别占比为

50%、42%、42%、42%和

33%;开展数据安全审计活动的企业相对最少,不足

20%(17%)。这表明,企业更加倾向于采用简单直接的办法进行数据安全管理,而数据安全审计活动等系统性监控、处理数据安全风险的措施则仍然有待进一步普及。图

2

企业数据安全管理措施被调研企业保障数据安全的具体举措如下:第

4

页济南市企业数据资产管理白皮书1、对数据进行分类分级。数据分类分级是数据安全的重要保障。例如,济南大陆机电股份有限公司以工业互联网平台为载体,按照不同的分部对数据进行相应的管理,不同角色和部门有不同的数据访问权限,实现了数据的分类分级管理;中国电信股份有限公司山东分公司对原生产系统定期做分类分级,创建大数据湖,并在数据入湖前确认分类分级及权限管理;济南公共交通集团有限公司基于等保测评2对数据进行了分级分类管控。2、建立数据安全管理制度和体系。济南大陆机电股份有限公司建立了ISO27001

信息安全管理体系,通过了体系认证,并对数据的使用加工处理等做出明确的制度规定,对于涉及到客户隐私的数据,如客户应用中心的数据,平台一律不插手、不获取,不允许输出单个数据,只授予平台输出统计后的数据的权利。同时平台上所有的交互都是实名制,实时记录用户在何时何地读取数据,如发生篡改盗取行为,能够通过平台记录识别到个人或企业;中国电信股份有限公司山东分公司在

2023

年印发了相关数据安全管理办法,对外共享数据严格按照数据安全管理办法进行,绝不披露用户敏感数据;济南一建集团有限公司为保障数据安全,运用了较严格的防火手段,禁止无关人员进入机房,禁止外来存储设备接入服务器等,并根据使用对象的部门及职务,对其登录、查询权限进行限制,确保其只能看到与自己部门及职务相关的数据。3、强化数据安全管理措施。济南大陆机电股份有限公司在数据传输方面,对敏感数据和重要数据进行了加密传输处理;济钢集团有限公司将内部信息系统建立在企业内网环境,内网和外网之间建有

ESB3接口平台,便于衔接确保数据安全;中国电信股份有限公司山东分公司对数据进行脱敏加密管理,数据及时销毁不留存;济南一建集团有限公司实时开启防火墙、杀毒软件,每周定期对数据进行全量备份;济南公共交通集团有限公司在数据管理过程中对数据不同使用对象通过权限管理、数据脱敏等技术保证了数据的隐私性和安全性;山东泰山钢铁集团有限公司为保证数据安全采取了一系列措施,如数据备份、数据加密、分析潜在数据安全风险、对数据在组织内部流通的各个环节进行监控。2

等保测评的全称是信息安全等级保护测评,是经公安部认证的具有资质的测评机构,依据国家信息安全等级保护规范规定,受有关单位委托,按照有关管理规范和技术标准,对信息系统安全等级保护状况进行检测评估的活动。3

ESB(Enterprise

Service

Bus),企业服务总线。通过

ESB,可以实现集成业务处理,监控系统间消息流动,管理系统间交互的业务服务。第

5

页济南市企业数据资产管理白皮书4、成立安全专业委员会。济南公共交通集团有限公司成立网络安全委员会,每季度召开一次会议,并邀请网络安全专家授课,提升网络安全意识和防护水平,聘请专业网络安全团队开展网络安全防护,并提供建议。(三)数据治理现状企业如何通过行之有效的数据治理举措来实现对数据资源的有序利用和高效运营,反映了企业数据资源的管理能力,是数据资源价值实现链条中的重要一环。结果显示(见图

3),42%的被调研企业已经建立数据治理团队,17%的被调研企业进行过数据治理培训,通过投入人力资源的方式为其数据资源赋能;同时被调研企业中建立数据制度管理机制、建立数据制度体系并制定数据政策的企业均占

33%;25%的被调研企业尚未进行数据治理,占调研企业中的少数,可见数据治理观念已经深入企业实践,并得到广泛应用。图

3

企业数据治理措施被调研企业进行数据治理的具体措施如下:1、制定相关标准。山东电工电气集团有限公司现已制定了主数据和指标数据的标准;中国电信股份有限公司山东分公司在

2021

年发布了数据治理相关标准。2、进行数据标准化。由于数据多是由不同的业务系统产生,为了便于数据管理需要对数据进行标准化。济南城市建设集团正在进行清洗数据工作,对数据第

6

页济南市企业数据资产管理白皮书进行统一归口,目前已经开展数据资源会计入表的研究工作,准备进行业财一体化的数据应用建设。3、成立数据治理委员会。中国电信股份有限公司山东分公司成立了数据治理委员会,各部门领导牵头,技术业务相互配合。(四)数据质量现状数据质量直接影响企业数据资源的价值创造能力,采取科学有效的方式提升企业数据质量,对内有利于企业的经营管理参考使用,对外有利于企业数据资源的交易。调研结果表明(见图

4),75%的被调研企业选择定期分析组织数据质量;58%的被调研企业设立了明确数据质量管理目标;50%的被调研企业对组织数据质量进行全面监控;通过建立数据质量规则库、数据质量问题管理机制、数据质量持续改进策略的企业均占被调研企业总数的

33%。总体来看,企业仍然倾向于选择相对简单、成本相对较低的方式来提升其数据质量。图

4

企业数据质量保障措施被调研企业进行数据质量保障措施如下:1、根据业务流程进行数据稽核。山东宏济堂制药集团股份有限公司通过业务系统业务逻辑保证数据质量;中国电信股份有限公司山东分公司在湖仓4配置了多个稽核点,使用稽核告警工具,能够针对不同的报错类型进行精准告警;山4

有关中国电线股份有限公司山东分公司数据湖的内容详见第

5

页及注释

1。第

7

页济南市企业数据资产管理白皮书东泰山钢铁集团有限公司在后期财务分析时,针对偶尔出现的价格异常、成本异常情况,会通过勾稽关系验证、逻辑关系核查。2、建立数据质量相关制度。山东泰山钢铁集团有限公司形成了明确的数据质量管理目标,建立了数据质量规则库,全面监控组织数据质量情况,并建立了数据质量问题管理机制和数据质量持续改进策略,定期分析组织数据质量情况。3、成立数据质量管理团队。济南公共交通集团有限公司成立了数字总监团队,组织上百人的专业队伍对站点数据进行采集和整理,并且采用了自主研发的系统和算法来确保数据釆集的准确率。(五)数据资源入表意愿调研过程中,几乎全部的企业均表示愿意进行数据资源入表,但多数(75%)被调研企业目前只处于数据资源入表工作的初步阶段,并未真正实施。如图

5可知,25%的被调研企业已经开展了数据资源入表的准备工作,其中,已明确数据产权和归属科目的企业占被调研企业总数的

17%、已明确其成本项的计量方式和价值变动处理方式的企业占被调研企业总数的

8%;75%的被调研企业尚未开展有关数据资源入表的实质性工作,其中

58%的被调研企业表示虽尚未开展有关数据资源入表的实质性工作,但已有相关打算。总体而言,大部分企业尚未开展数据资源入表的实质性准备工作,但也有少部分企业先行;超过半数的企业已经有所计划但仍未实施,表明数据资源入表工作存在阻力,并非一蹴而就。图

5

企业数据资源入表准备情况重视数据资产管理工作是企业数据资产建设的前提,也是提升企业数据资产第

8

页济南市企业数据资产管理白皮书利用效率的前提和重要保障。统计结果显示(见图

6),67%的被调研企业对数据资产管理工作非常重视,17%的被调研企业对数据资产管理工作较为重视,17%的被调研企业对数据资产管理工作重视程度一般,没有企业认为数据资产不值得重视。可见数据资产对企业经营管理的重要性已经获得了广大企业的认可,重视数据资产的管理、利用与价值实现已经在资本市场中蔚然成风。图

6

企业对数据资产管理工作的重视程度三、被调研企业可能的数据资源(产品)及其应用场景示例(一)被调研企业可能的数据资源示例第

9

页济南市企业数据资产管理白皮书表

1

企业数据资源示例企业名称数据主题数据来源济南大陆机电股份有限公司济南公共交通集团有限公司

济南驰波名气通数据服务有限公司济南城市建设集团财务数据计量器具类数据计量管理平台能源管理类数据公交车运行数据视频监控数据机房模块机房内部相关数据动环监控系统公交车辆智能化运营调度系能源管控中心平台集团系统统、369

出行管理平台器具名称、器具状

园区内的所有水、

实时的公交线路的公司、线

实时记录机房内所有

机房内温湿度以及机

预算管理(年度预算编态、器具型号、测

电、光伏发电,包

路、车辆编号、数据采集时

监控视频,该视频保

房客户用电量统计数

制、月度资金计划编制)、量范围、准确度等

括数据采集时间、

、GPS

公里数、是否运营、

存期限为

90

天级、器具分类、器

计量点编号、测量

运营方向、进出场站信息、具制造商、生产日

点编号、采集数值

采集模式、GPS

时间、经度、据收入/融资汇报、费用支付申请(差旅、办公费报销、同户/异户名转款、还本付息、退投标保证金、税费等)、借款、实付款登记等数据内容期、出厂编号、

12

项数据ABC

码、用途等纬度、海拔、速度、方向角等

19

项数据关键数据字段第

10

页济南市企业数据资产管理白皮书通过

Web

系统与

集团与各出行服务商签订

确保客户物理设施安

确保客户服务器在最

在某种程度上减少了账手机APP的结合,

析、大屏展示、各

《对外数据资源共享合同》,

全,提前知晓设备报

佳运行环境下,有利

目信息混乱、业务不符合对厂区计量器具

类能耗统计、各类

各出行服务商每日按

10-20

警等进行有计划地巡

成本统计等,为能

秒的更新频率从济南公共交检、保养工作,做

通集团有限公司接收车辆实到了故障的实时

时、精确的能耗数

GPS

裸数据,形成各出行上报、派遣和解

据分析,降低能源

服务商的差异化

GPS

数据服决,极大提升了企

精细化管理工作难

务产品,结合其地图数据、业设备运维能力,

度,提高能源管理

实时算法,向最终乘客输出于客户的业务连续性

流程的情况,方便财务人员进行账目核对,有利于领导实时掌握资金支付情况数据用途减少资源浪费工作效率;提供扫

更加精准、全量车辆到站预码查询的能耗数据

报服务服务,进一步提高移动办公效率第

11

页济南市企业数据资产管理白皮书(二)被调研企业可能的数据产品示例表

2

中国电信数智科技有限公司数字能源平台产品示例中国电信数智科技有限公司数据产品名称

数字能源平台目前企业能源管理依旧存在人工计量、日常抄表、虽拥有智能计量设备但依旧采企业名称用人工、虽进行了相应的数据分析但分析结果无法在企业有效应用,以及存在能源浪数据产品背景

费和安全隐患等问题。为响应我国碳达峰、碳中和的战略目标,便于企业、单位都取得相应的碳达峰数字,满足企业节能减排的需求,实现双碳变现,中国电信数智科技有限公司致力提供数智综合信息服务,推出了数字能源平台。1、数据采集,通过智能网关、智能电表、智能水表、皮带秤、蒸汽表、天然气表,或者和企业的系统对接,采集企业的水、电、天然气、煤、水蒸汽;运作流程2、数据传输,将采集对象传输到公司部署的云服务器或本地化服务器;3、数据实际应用,采集数据将用于能源监测、能源改造、双碳服务;4、结果展示,具体数据和分析结果可展示在手机、电脑或大屏上。1、强化主动监控,实现能源集中管理。将企业的水、电、气、热等能源进行集中管控,构建统一集成的能源管理平台,达到主动、及时发现问题,提升企业能源管理水平的效果;能源管理步骤

2、实现能源分析。搭建集中的能源分析及展现平台,通过分析、对比、合理规划和利用能源,降低单位产品能源消耗,提高经济效益;3、针对性进行节能降碳。根据平台数据分析结果,为企业定制节能减排方案,帮助企业实现节能性价比最大化。1、费用方面:节约人工抄表成本;降低企业能源管理成本;可及时发现跑冒滴漏,快速处理止损;平台提供定制化节能服务。产品价值2、效率方面:智能表计监控设备安全;报警系统监控能源使用安全;大数据分析及时发现安全隐患。3、管理方面:挖掘企业节能管理潜力;实现精细化能源管控。(三)被调研企业数据资源(产品)的应用场景表

3

中国电信数智科技有限公司的数字能源平台的应用场景和案例中国电信数智科技有限公司企业名称第

12

页济南市企业数据资产管理白皮书被供电局罚款数据产品名称

数字能源平台应用场景变压器低载运行夏季企业电费过高由于设计冗余或用电设

由于功率因数低于

0.9

或高

企业夏季电费骤升,其原因备使用不充分,一些企

峰期超量用电,企业被供电

可能是巅峰期用电量过高、具体表现业的变压器负载长期低

局罚款空调浪费严重、空调设备自身不节能于

50%甚至更低当能源平台监测到负载

能源平台能够及时发现企业

能源平台可监测电量消耗,过低时,能够改变变压

用电问题,监测企业功率因

并进行能耗分析,为企业定器

线

数、巅峰期用电量,当出现

制具有针对性的解决方案,式,将使用的变压器数

超量等情况时,平台会报警,

如建议企业使用蓄冷空调解决措施量减少,提高节能力。

通过一些方式规避罚款。技术等。光大智慧产业园应用绿色能源管理系统,实现了能耗数据统一纳管,结合光伏,地源热泵实现公共部分能源负碳排放。同时对地源热泵、光伏发电等绿色电力进行统计展现,并结合工单管理对异常指标快速相应处理,使用较少人力保障设备及生产的平稳运行。应用案例数炬(山东)智能科技有限公司利用该平台基于

3D

建模,进一步实现能源能耗的可视化和综合管控,同时实现平台云端部署、能耗管控

AI

智能化、可视化。空调自控系统、照明自控系统以及空气监测系统,能够根据办公场景实际情况自动化管控,实现能耗利用最优化。表

4

北方健康医疗大数据科技有限公司的商保两核风控场景数据服务的应用场景和案例企业名称北方健康医疗大数据科技有限公司数据产品名称

商业保险两核风控场景数据服务应用场景商业保险两核风控购买商业保险的用户,在商业保险投保时,需要如实且完整填写被保险人的健康告知书,并作为保险合同的组成部分,在投保等保险过程中,保险公司在责任范围内可以进行核保核赔风控,对被保险人的健康情况、历史诊疗情况等进行调查。原始数据不出域、数据可用不可见,一使用一授权,知情同意,隐私保护。保险公司依据被保险人健康告知书,确保数据安全的情况下,通过调取其在北方中心的两核风具体表现场景特点第

13

页济南市企业数据资产管理白皮书控模型结果,为保险两核风控业务提供线索参考。数据使用方式

数据使用单位通过数据

API

调用两核风控模型结果。合作企业保险科技公司、保险公估公司、保险公司等。2023

5

23

日,北方中心商保两核风控场景数据服务正式上线运行,阳光人寿保险股份有限公司成为第一家开通该服务的保险公司,首日即服务群众

155

人次,覆盖22

家医院,保司调用的响应时间小于

1

秒。北方中心在山东省内率先打通商业保险与医疗服务之间的数据孤岛,有望极大提高山东在业经营的商业保险公司的服务效率,增强群众的获得感和幸福感。应用案例四、企业数据管理能力提升操作流程结合

DCMM(Data

Management

Capability

Maturity

Assessment

Model,简称DCMM)5,进行数据资源管理应遵循以下步骤(见图

7)。图

7

企业数据资源管理全流程图在这个过程中,数据安全管理是贯穿全流程的。值得注意的是,数据治理、知识产权登记、数据资源入表、质量管理等环节是相互影响的。数据治理为数据知识产权登记提供了基础和前提,可以为企业提供更好的数据管理和控制能力,为数据知识产权登记提供准确、可靠的数据支持;而数据知识产权登记可以为数据治理提供明确的权属关系和使用规则,为数据的合规性、安全性和隐私性提供保障。数据质量和数据治理之间也存在密切的关系。数据治理的目的是确保数据的准确性、完整性、一致性和可靠性,以满足组织的需求和目标。而数据质量则是实现这一目标的关键因素。如果数据质量不佳,存在缺失、错误或不一致等问题,那么数据治理的效果将大打折扣。并且,通过数据治理的工作流程,可以不5

《数据管理能力成熟度评估模型》(GB/T

36073-2018)第

14

页济南市企业数据资产管理白皮书断改善和优化数据质量,从而形成一个良性循环。(一)数据分类操作流程1、流程图6图

8

数据分类流程图2、具体步骤第一步:选择分类视角(1)明确分类业务场景;(2)根据业务场景选取分类视角7。第二步:制定工作计划(1)明确规划拟开展分类的数据范围;(2)明确拟采用的分类维度和方法;(3)明确预期分类结果;(4)明确分类工作实施方案及进度安排;(5)明确对分类结果的评估方法;(6)明确对分类结果体系的维护方案。第三步:调研数据现状过程(1)调研数据产生情况,包括但不限于数据产生的场景、主体、方式、频率、稀疏稠密、合法合规性等;(2)调研数据存储现状,包括但不限于数据内容的格式、存储方式、存储位置、存储量等;6

具体参考

GB∕T

38667-2020《信息技术

大数据

数据分类指南》。7

具体分类视角请参考《GB∕T

38667-2020

信息技术

大数据

数据分类指南》第

6

章。第

15

页济南市企业数据资产管理白皮书(3)调研数据质量情况,包括但不限于数据的规范性、完整性、准确性、一致性、时效性、可访问性等;(4)调研数据业务类型,如组织人事管理数据、经营数据、财务数据等;(5)调研数据敏感程度,包括但不限于数据的涉密程度、安全性、保护需求等;(6)调研数据应用情况,包括但不限于数据的使用目的、应用领城、使用方式等;(7)调研数据时效性情况,包括但不限于数据处理的时效性要求、数据价值时效性等;(8)调研数据权属情况,包括但不限于数据的所有权、管理权、使用权等。第四步:确定分类对象(1)确定数据分类的业务场景;(2)确定数据产生的起止时间;(3)确定数据量大小;(4)确定数据产生频率;(5)确定数据结构化特征;(6)确定数据存储方式;(7)确定数据处理时效性;(8)确定数据交换方式;(9)确定数据产生来源;(10)确定数据流通类型8;(11)确定数据质量;(12)确定数据敏感程度。第五步:选择分类维度(1)梳理分类视角的数据特征;(2)根据数据特征选取分类维度9。第六步:选择分类方法8

数据流通类型可理解为数据流通形式,按照数据与资金在主体间流向的不同,可分为开放、共享、交易三种流通形式。9

具体分类维度请参考《GB∕T

38667-2020

信息技术

大数据

数据分类指南》第

7

章。第

16

页济南市企业数据资产管理白皮书选择分类方法过程宜明确分类维度的排列顺序和组合方式10。第七步:拟定实施流程拟定实施流程宜结合数据的生命周期,拟定具体的分类实施流程,包括但不限于明确实施步骤、启动实施工作开展实施工作、总结实施过程等。第八步:开发工具脚本开发工具/脚本宜根据实施流程、分类维度和分类方法编写分类算法,遵循软件开发或者脚本编制的规范开发分类工具/脚本。第九步:记录实施过程记录实施过程宜记录分类实施过程的各个步骤及分类结果,输出文档。第十步:输出分类结果输出分类结果宜梳理各个步骤的分类结果,形成数据分类表。第十一步:核查实施过程(1)核查数据分类表,明确类别划分是否合理;(2)核查分类过程记录,明确分类结果与预期目标的偏离程度;(3)核查分类维度,确保分类维度符合业务需求、分类目标;(4)核查分类方法的合理性;(5)根据核查结果调整数据分类过程。第十二步:访谈相关人员(1)访谈数据分类执行者,询问分类视角、范围、维度、方法与业务场景的关联性等;(2)访谈数据所有者,询问数据分类结果中的数据权属类别划分、产生频率类别划分等是否符合实际情况;(3)访谈数据管理者,询问数据分类结果中的数据结构化类别划分、数据存储方式类别划分、稀疏程度划分、敏感程度划分等是否符合实际情况;(4)访谈数据使用者,询问数据分类结果中的数据处理实时性划分,交换方式类别划分、业务归属类别划分、流通类型类别划分等是否符合实际应用情况;(5)核查意见和问题,调整数据分类过程。第十三步:测试分类结果10

具体分类方法请参考《GB∕T

38667-2020

信息技术

大数据

数据分类指南》第

8

章。若选择混合分类法,还需考虑以哪种分类维度为主,哪种分类维度作为补充。第

17

页济南市企业数据资产管理白皮书(1)对分类后的数据执行分类脚本或程序,查看是否有不符合分类策略的分类结果;(2)核查意见和问题,调整数据分类过程。第十四步:变更控制(1)分析变更的必要性和合理性,确定是否实施变更;(2)制定变更计划,评估变更对数据分类工作的影响,包括分类维度、分类方法的改变等;(3)执行变更,对分类结果进行更改,记录变更过程;(4)对新的数据分类结果进行评估;(5)发布新的数据分类结果。第十五步:定期评估(1)定期评估数据分类维度和方法的合理性,检查其是否符合业务场景变化和分类视角变化;(2)定期评估数据分类结果的有效性和应用情况,检查其是否满足业务应用需求的更新;(3)核查意见和问题,调整数据分类过程。3、数据分类示例1111

以中国电信股份有限公司山东分公司数据为例,其他信息详见第二部分济南市典型企业数据管理现状第

18

页济南市企业数据资产管理白皮书图

9

中国电信数据线分类方法示例第

19

页济南市企业数据资产管理白皮书图

10

中国电信主数据面分类方法示例(二)数据标准化操作流程1、流程图图

11

数据标准化流程图2、具体步骤第一步:确定数据标准化的范围根据企业的实际情况,确定需要标准化的数据范围,例如部门、业务领域、数据类型等。企业可以选择将全部数据标准化,从而适应数字化转型时代的要求。第二步:制定数据标准数据标准就是对数据的命名、数据类型、长度、业务含义、计算口径、归属第

20

页济南市企业数据资产管理白皮书部门等,定义一套统一的规范,保证各业务系统对数据的统一理解、对数据定义和使用的一致性。企业应当抽象、确定数据主体对象,从企业众多业务元素中选取共用的数据形成原子数据集,创建规模有限的数据主体对象原子级数据模型体系12——建立跨越企业各业务类别以上的数据标准,即数据模型中业务单元的数据标准,而非根据业务场景建立不同的标准,从而避免随着业务场景和业务管理模式扩展,产生的巨额数据标准集运营和维护成本。同时,如此建立的数据标准更加稳固。第三步:数据清洗进行数据清洗以消除错误、重复、不完整的数据,提高数据的质量和可靠性。(1)缺失值处理。计算每个字段的缺失值比例,根据比例和字段的重要性设置不同的策略。如果数据不重要或者缺失率过高,可以直接删除字段。对于重要数据或缺失率较低的数据,可以根据业务知识或过往经验给出推测填充、利用同一指标或不同指标数据计算结果填充;对于某些缺失的重要数据,可以与相关人员探讨其他渠道重新获得数据的可能性,例如某些数据可以通过另一个数据库或

API

得到;(2)异常值处理。识别异常值,根据业务需求和数据分布情况,选择合适的处理方法,如删除异常值、替换异常值或对异常值进行修正;(3)去重处理。去除重复的数据行或记录,确保数据的唯一性和准确性;(4)对于复杂的数据清洗任务,可以考虑使用专业的数据清洗工具或库,以提高效率和准确性。第四步:数据转换根据制定的数据标准,将不同格式、不同来源的数据进行转换,以实现数据的统一和标准化。第五步:数据质量检查进行数据质量检查以确保数据的准确性和完整性。(1)确定需要做数据质量监控的数据指标项;(2)对于每个数据质量维度,定义表示标准质量和质量差数据的值和范围。12

原子级数据模型特点:①稳定性:模型与业务演化及应用场景变化无关;②同一性:一个主体一套原子模型,宜于跨条线的数据标准化转换及加工;③包容性:既可描述现有业务及服务,又天然支持新业务及服务创新;④小内核:规模有限,易于保持与业务演变的动态同步、提高复用率、限控标准集维护检索和复用成本。第

21

页济南市企业数据资产管理白皮书特别需要注意的是:同一个指标名称,可能会有不同的度量规则,因此需要执行许多不同的数据质量评估。第六步:数据整合将标准化的数据整合到企业数据平台中,以实现数据的集中共享。(1)建立数据共享平台。建立一个专门的数据共享平台,将整合后的数据集中存储和管理,并提供查询、下载和分析功能,以便其他部门和团队可以共享和使用这些数据,让数据成为每位普通员工都可以使用的原材料,发挥数据的真正价值;(2)制定数据共享规则和权限管理机制,确保不同部门和团队只能访问和使用与其职责相关的数据。3、数据标准化示例以济南公共交通集团有限公司

GPS

数据标准化处理为例13,济南公共交通集团有限公司在市区全域运营的车辆

5600

辆,其实时的公交线路的公司、线路、车辆编号、数据采集时间、GPS

公里数、是否运营、运营方向、进出场站信息、采集模式、GPS

时间、经度、纬度、海拔、速度、方向角等

19

项数据,截至评估基准日形成的数据资产,包含

1

张表,19

个字段,120

亿条数据元素,数据总量约为

1.27TB。本文以济南公共交通集团有限公司拥有的

GPS

数据为例进行数据标准化。第一、确定数据标准化的范围:需要进行标准化的数据是公交车运行

GPS数据,其中包括实时的公交线路的公司、线路、车辆编号、数据采集时间、GPS公里数、是否运营、运营方向、进出场站信息、采集模式、GPS

时间、经度、纬度、海拔、速度、方向角等

19

项数据。第二、制定数据标准:为方便各业务部门的调用,集团应组织下属科技公司、业务部门、财务部门等制定一套满足各部门使用需求的数据标准,进行数据类型、计算口径、测量单位等各方面、多维度的统一。第三、数据清洗:截至评估基准日,集团目前共有

120

亿条数据元素,数据总量约为

1.27TB,且数据每日每刻都在不断增加,科技公司应根据数据标准,设定算法或模型,用专业数据清洗工具对

GPS

数据进行清洗,以减少人工工作13

济南公共交通集团有限公司

GPS

数据相关信息详见报告第

21

页有关该公司数据资源(产品)的描述第

22

页济南市企业数据资产管理白皮书量。第四、数据转换:将清洗后的数据通过专业工具进行转换,保障其格式、类型统一。第五、数据质量检查:由集团成立的数据资源管理部门对标准化后的数据进行检查,对数据质量进行评估,满足数据质量管理要求。第六、数据整合:目前济南公共交通集团有限公司已成立数据平台,应当制定数据共享规则和权限管理机制,分别对不同部门、不同级别的人员授予不同的权限。然后将标准化后符合质量要求的

GPS

数据导入至企业数据平台中,实现数据的集中共享。(三)数据质量管理操作流程141、流程图图

12

数据质量管理流程图2、具体步骤数据质量管理框架主要由数据质量管理流程和数据质量管理工具构成,以数据质量管理流程为指导构建数据质量管理工具。数据质量管理流程主要从数据质量描述、数据质量识别、数据质量评估和数据质量控制四方面进行搭建;数据质量管理工具主要从数据标准管理、数据质量规则、质量检测任务、数据质量监控、数据质量报警、质量检测报告、检测报告分析、数据质量整改、数据质量跟踪方14

具体信息参考

DB14/T

2526-2022

《山西省地方标准——工业互联网综合平台

数据质量管理要求》。第

23

页济南市企业数据资产管理白皮书面进行规定。以下对数据质量管理流程中各个步骤的要求进行展开介绍,所列示的要求中包括但不限于此。第一步:数据质量描述(1)应根据平台企业管理的需求,参考外部监管的要求,确定平台企业数据质量管理目标;(2)应根据平台企业数据质量管理目标、数据标准规范和数据质量特性,确定平台企业数据质量评估维度。第二步:数据质量识别(1)应根据平台企业业务发展的需求及常见数据问题,确定平台数据质量管理范围、各类数据的优先级以及质量需求;(2)应根据平台企业数据质量管理目标及需求,定义各类数据的质量评价指标、校验规则与方法;(3)应根据业务发展需求及数据质量检查分析结果对数据质量规则进行持续维护与升级。第三步:数据质量评估(1)数据质量检查:应根据数据质量规则中的有关技术指标和业务指标、校验规则与方法,对平台企业的数据质量情况进行实时监控,若发现数据质量问题应及时向数据管理人员进行反馈;(2)数据质量分析:应对数据质量检查过程中发现的数据质量问题及相关信息进行分析,并找出影响数据质量的原因;应定义数据质量问题的优先级。第四步:数据质量控制(1)应根据数据质量分析的结果制定、实施数据质量改进方案,包括错误数据更正、业务流程优化、应用系统问题修复等;(2)应制定数据质量问题预防方案。有关数据管理工具,其中数据标准管理要求支持并跟随国家、行业和地方标准的制定与执行;数据质量管理规则要求支持数据质量特性自定义质量维度、关联数据标准规范、根据基础规则和平台应用场景自定义业务规则等;数据质量检测任务要求做好数据的检测运维等;数据质量监控要求对数据进行监控,明确数据的来源与去向;数据质量报警要求支持问题数据的报警;并做好相应的数据质第

24

页济南市企业数据资产管理白皮书量检测报告与报告分析;最后进行数据质量的整改与跟踪。3、数据质量管理示例以华阳集团企业为例15,主要关注数据记录、关键字段和业务规则三个方面的数据质量控制。系统核对记录数据主要在数据采集、数据清理、数据转化三个阶段,将取得的数据记录和数据总量与系统中反映的数据进行核对,确保电子数据完整性。对于非结构化的数据,系统将用文件数据量和大小与数据提供清单进行对比,核实数据的可用性和完整性。对于结构化的数据,系统将核对总数量和分类汇总项数量。系统验证关键字段采用字段长度核对、最大和最小值审核、孤立点检测、真实性核对、范围核对、空值替换等验证方法对表字段的完整性和乱码进行检验。系统业务规则验证是指利用业务专业标准和业务逻辑,设计一套有效的勾稽检查算法,对系统收集的业务数据进行逻辑校验的过程。(四)数据质量评价操作流程161、流程图图

13

数据质量评价流程图2、评价体系框架15

全称为惠州市华阳集团股份有限公司,成立于

1993

年,业务板块涵盖汽车电子、精密压铸、精密电子部件以及

LED

照明等,重点围绕汽车电动化、智能化、网联化、轻量化进行产品布局。该公司于上世纪

90年代初就开始了信息化建设的初步探索,涉及财务、业务等部门,经过近

30

年的数字化布局,先后经历了单机运行、信息系统独立建设、信息化集成平台建设和数智化平台建设

4

个阶段,为打造世界一流新材料产业集团注入强劲动能。案例来源于《华阳集团数据管理体系建设与应用实践》。16

具体信息参考

GB/T

36344-2018《中华人民共和国国家标准——信息技术

数据质量评价指标》。第

25

页济南市企业数据资产管理白皮书图

14

数据质量评价指标框架3、评价体系具体内容(1)数据质量评价内容——规范性要求数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度。表

5

数据质量评价体系的规范性具体内容指标名称

指标描述计算方法X=A/B数据标准

数据符合数据标准的度量

A=满足数据标准要求的数据集中元素的个数;B=被评价的数据集中元素的个数X=A/B数据模型

数据符合数据模型的度量

A=满足数据模型要求的数据集中元素的个数;B=被评价的数据集中元素的个数X=A/B数据符合元数据定义的度元数据A=满足元数据定义的数据集中元素的个数;B=被评价的数据集中元素的个数X=A/B量业务规则

数据符合业务规则的度量

A=满足业务规则的数据集中元素的个数;B=被评价的数据集中元素的个数权威参考

参考数据是系统、应用软

X=A/B数据(权

件、数据库、流程、报告

A=满足参考数据规则的数据集中元素的个数;威

及交易记录和主记录用来

B=被评价的数据集中元素的个数源)参考的数值集合或分类表安全规范是安全和隐私方

X=A/B安全规范

面的规则,包括数据权限

A=满足安全规范的数据集中元素的个数;管理,数据脱敏处理等

B=被评价的数据集中元素的个数(2)数据质量评价内容——完整性按照数据规则要求,数据元素被赋予数值的程度。表

6

据质量评价体系的完整性具体内容第

26

页济南市企业数据资产管理白皮书指标名称指标描述计算方法X=A/B数据元素完

按照业务规则要求,数据集中应被

A=被赋值的数据集中元素的个数;整性赋值的数据元素的赋值程度B=预期被赋值的数据集中元素的个数X=A/B数据记录完

按照业务规则要求,数据集中应被

A=被赋值的数据集中元素的个数;整性赋值的数据记录的赋值程度B=预期被赋值的数据集中元素的个数(3)数据质量评价内容——准确性数据准确表示其所描述的真实实体(实际对象)真实值的程度。表

7

数据质量评价体系的准确性具体内容指标名称

指标描述计算方法X=A/B数据内容A=满足数据正确性要求的数据集中元素的个数;数据内容是否是预期数据正确性B=被评价的数据集中元素的个数数据格式(包括数据类型、

X=A/B数据范围、数据长度、精度

A=满足格式要求的数据集中元素的个数;数据格式合规性等)是否满足预期要求B=被评价的数据集中元素的个数X=A/B数据重复

特定字段、记录、文件或数率

据集意外重复的度量A=重复的数据集中元素的个数;B=被评价的数据集中元素的个数X=A/B数据唯一

特定字段、记录、文件或数性

据集唯一性的度量A=满足唯一性要求的数据集中元素的个数;B=被评价的数据集中元素的个数X=A/B脏数据出

正确字段、记录、文件或数现率

据集以外无效数据的度量A=有脏数据出现的数据集中元素的个数;B=被评价的数据集中元素的个数第

27

页济南市企业数据资产管理白皮书(4)数据质量评价内容——一致性数据与其他特定上下文中使用的数据无矛盾的程度。表

8

数据质量评价体系的一致性具体内容指标名称指标描述同一数据在不同位置存储或被不

X=A/B相

同应用或用户使用时,数据的一致

A=满足一致性要求的集中元素的个数;计算方法一致性性;数据发生变化时,存储在不同

B=被评价的数据集中元素的个数位置的同一数据被同步修改X=A/B关

根据一致性约束规则检查关联数一致性

据的一致性A=满足一致性要求的集中元素的个数;B=被评价的数据集中元素的个数(5)数据质量评价内容——时效性数据在时间变化中的正确程度。表

9

数据质量评价体系的时效性具体内容指标名称指标描述计算方法X=A/B基于时间段

基于日期范围的记录数或频A=满足有效性要求的集中元素的个数;B=被评价的数据集中元素的个数的正确性率分布符合业务需求的程度基于时间戳的记录数频率分

X=A/B基于时间点的及时性布或延迟时间符合业务需求

A=满足及时性要求的集中元素的个数;的程度B=被评价的数据集中元素的个数X=A/B数据集中同一实体的数据元素之间的相对时序关系时序性A=满足时序性要求的集中元素的个数;B=被评价的数据集中元素的个数(6)数据质量评价内容——可访问性数据能被访问的程度。表

10

数据质量评价体系的可访问性具体内容指标名称

指标描述

计算方法可访问

数据在需要时

X=A/B第

28

页济南市企业数据资产管理白皮书的可获取性A=满足可访问性要求的集中元素的个数;B=被评价的数据集中元素的个数数据在设定有

X=A/B可用性效生存周期内

A=满足可用性要求的集中元素的个数;的可使用性B=被评价的数据集中元素的个数4、数据质量评价示例以我省首个科创金融领域数据资产融资案例为例17,浪潮卓数使用自主研发的数据质量评价系统对四季车服车主

APP

和店面运营管理

ERP

系统所归集的数据进行数据质量评价,评价过程遵循数据质量评价指标标准(GB/T

36344-2018ICS

35.24.01)和团体标准《信息技术

大数据

数据资产评估》。在确定本次数据质量评价范围后,该系统采用简单比率法、加权平均法、层次分析法等方法开展数据质量评价。首先对评价对象进行分析,对数据质量评价指标进行权重打分,随后建立数据质量评价规则库,利用数据质量评价系统进行全量规则跑分,最终得出评价结果。跑分过程中系统会对数据规范性(G)、完整性(W)、准确性(Z)、一致性(Y)、时效性(S)、可访问性(K)六个维度进行综合、全面、客观的评估,给出其对应的打分;总分计算公式为Score=a1*G+a2*W+a3*Z+a4*Y+a5*S+a6*K,其中

ai

为权重,采用层次分析法确定;约束条件为∑ai=1。数据质量评价的主要内容包括:第一、规范性分析。该系统会采集企业数据库的数据标准、数据模型、元数据、业务规则等数据存储和使用的规范标准,衡量数据规范标准是否完整,并基于此度量以及有哪些数据未按统一格式存储。第二、完整性分析。完整性体现在数据元素被赋值的程度,主要包括数据元素的完整性和数据记录的完整性。该平台对数据完整性的衡量是从数据采集到的程度出发的,是应采集和实际采集到数据之间的比例。如采集员工信息数据的时候,要求填写姓名、出生日期、性别、民族、籍贯、婚姻状况、最高学历等

20项信息,而某一员工仅仅填写了其中部分信息,如

10

项,则该员工所填写数据17

浪潮卓数大数据产业发展有限公司联合中联评估山东公司、天元征信等机构,为山东四季汽车服务有限公司提供数据资产评估服务,并协助四季车服成功获得齐鲁银行

300

万元贷款,为山东省数据资产化探索了新的路径。四季车服专注于汽车后市场的精细化服务,为广大车主提供维修保养、洗车、困境救援、车况检测、年审等服务,目前有连锁门店

280

余家,覆盖全省

139

个区县。第

29

页济南市企业数据资产管理白皮书的完整性只有一半。第三、准确性与一致性分析。数据的准确性体现在某一数据准确描述其所代表的事务或事件的程度,数据一致性通常是指用来描述同一信息主体在不同的数据集中信息属性是否相同。该系统会对数据的内容、格式进行自动化审核和分析,并且检验数据在不同存储位置、不同关联情况下,或者被不同应用、不同用户进行调用时,数据的表现是否是一致的,是否会出现关键信息冲突。比如说同一台车辆的记录在四季车服的店铺运营端系统和车主

APP

端里的记录是否一致。第四、独特性和重复数据分析,数据的唯一性是数据质量评价中的重要指标。该系统可以检测数据库表中是否有重复数据,或者数据的哪些属性存在重复。通常来说,如果企业同时在用多个不同厂商开发的应用程序来采集、管理、存储和使用数据,并且没有进行有效的企业级数据治理,就容易出现同一实体存储多个记录的情况,出现重复数据、影响数据质量。第五、时效性分析。数据能够及时有效更新是支持企业有效经营和分析挖掘数据的保障。该系统可以根据时间序列和数据生成的时间戳来判断数据在时间变化中的正确程度,判断数据是否及时有效的反应了事件的真实变化。根据该系统检测,四季车服的大多数数据记录都在预定时间内得到更新。第六、可访问和可用性分析。可访问性指数据能够被用户或应用正常访问或使用的程度,也即数据资产在其有效周期内可否被正常使用,在业务需要时可否被有效获取。在浪潮卓数为四季车服进行数据质量评价的过程中未出现数据无法访问的情况,用户可以轻松地访问所需数据,数据可访问性高。经过评估、打分和加权计算,可以得出质量评价的总分。出于保护商业秘密的需要,本报告隐去四季车服的原始打分,给出一个样例的得分表,该得分的数据质量总体评价为“良好”。根据质量评价的各项得分,可以制定企业未来的数据质量发展方向,如本样例打分中,数据准确性、完整性、时效性评价较高,规范性、一致性等方面仍有改善空间,是未来的提升方向。表

11

四季车服数据质量评价得分情况一级指标规范性二级指标数据标准数据模型加权得分0.65总分2.260.48第

30

页济南市企业数据资产管理白皮书元数据业务规则0.310.280.330.216.235.454.444.234.855.194.256.977.046.746.857.225.165.09权威参考数据安全规范数据元素的完整性数据记录的完整性数据内容的正确性数据格式的合规性数据的重复率数据的唯一性脏数据的出现率相同数据的一致性关联数据的一致性基于时间段的正确性基于时间点的及时性时序性完整性准确性11.6822.96一致性时效性14.0120.81可访问可访问性10.2581.96可用性总分(五)数据治理操作流程1、流程图第

31

页济南市企业数据资产管理白皮书图

15

数据治理流程图182、具体步骤数据作为一种全新生产要素,需要全体员工的数据素养认知提升,进行专业性数据人才的

DT

技术技能培训,培养企业自有数据人才。企业需要进一步进行统一数据治理、充分激发企业内数据价值。在进行数据治理前,企业应当对现有的数据库和数据表中的数据进行技术元数据收集和全量登记,并对数据统一管理,便于业务人员查找、调用数据。用友“六横三纵”数据治理体系,即数据架构管理、数据标准管理、数据质量管理、数据安全管理、数据生命周期管理和数据应用管理等“六横”,以及管理组织、制度流程和技术平等“三纵”为企业进行以业务价值为导向的全局数据治理提供保障,最终建立的数据治理体系应能支持企业组织结构、营运资源的动态演变。(1)“六横”第一步:数据架构管理1)提供标准的、通用的业务术语/辞典;2)表达战略性的数据需求;3)为满足如上需求,概述高层次的整合设计;4)使企业战略和相关业务架构相一致。第二步:数据标准管理1)制度数据标准管理计划;2)数据标准管理执行;3)数据标准管理检查;4)数据标准管理改进。第三步:数据质量管理主要针对数据的开发、应用和管理进行规范和指导,解决数据的不完整、数据格式不一致、空值和乱码,提高数据准确性和标准度。数据质量管理定义数据质量评价维度和数据质量评价体系,提供质量指标定义、质量稽核、质量问题分析和统计等功能。高质量的主数据依赖于围绕主数据构建的流程、系统和管理要求,其对应的载体为主数据管理系统。18

具体可参考在数据交易网发表的《用友正式发布数据资产入表解决方案》(附方案)。第

32

页济南市企业数据资产管理白皮书第四步:数据安全管理主要在传统的安全防御基础上,强化数据信息安全和数据使用安全,加强数据脱敏和加密处理,防止数据丢失、泄露和窃取,确保企业数据安全。以中孚安全技术有限公司为例19,该公司基于零信任的数据安全防护,能从以下层面实现数据应用过程中的安全防护:表

12

中孚安全技术有限公司基于零信任的数据安全防护层面基于零信任理念设计开发,摒弃传统硬件依赖弊端,通过使用符合国家密码要求的商用密码算法构建数据安全传输通道。数据传输过程中能够认证每一数据传输

个经过网关的

IP

数据包,过滤来源于非授权设备的不明数据包。同时,在安全防护

数据加密传输过程中采用秘钥注入和网络包认证数据流分离的方式,保障控制链路和数据链路的分离,提高攻击难度,能够有效免疫针对传统数据加密方式的网络攻击行为,从而保护数据传输安全。以商用密码为基础,通过成熟技术框架和技术理念的创新,对存储和传输中数据存储

的敏感数据实施加密,实现敏感数据密文存储,避免敏感数据明文存储,防安全防护

止数据被拖库、窃取,为数据的安全提供完整性、机密性和不可否认性等数据加密支撑。数据处理过程中以数据脱敏方式实现数据处理的安全防护。数据脱敏能够通过采用去标识化技术实现数据的静态和动态脱敏,能够将数据经过脱敏后使数据处理用,解决使用数据时存在的敏感数据风险问题,实现数据漂白,提供敏感数安全防护据从发现、梳理、脱敏到分发等全流程的管控能力,有效防止对敏感数据泄漏。通过流量或接入报文日志、检测目标

API

资产访问情况,自动发现目标系统中存在的

API

资产数据,并纳入系统内部进行管理。针对数据接口可能数据交换

面临的安全风险和数据泄露、滥用等问题,实现对

API

鉴权有效性风险、安全防护

敏感数据暴露风险、资产信息暴露风险、接口访问行为风险、API

备案风险等安全风险场景进行监测,结合相关模型,分析访问源、目标

API

资产存在的疑似安全问题,并具备对发现的安全风险进行取证和溯源的能力。数据安全

采取“外防内控”的防护思路,采用深度内容分析、数据分类分级和文件指纹19

中孚安全技术有限公司于

2013

11

12

日成立,位于山东省济南市高新区,公司经营范围包括:安全技术开发;计算机软硬件、电子元件的开发、生产、销售及技术服务;信息系统集成服务等。第

33

页济南市企业数据资产管理白皮书监管匹配等检测识别技术,通过执行数据泄露防护策略,对网络流量中的敏感数据传输行为进行发现、审计、告警和阻断。第五步:数据生命周期管理建立保证以上主要数据要素管理环节循环、有序运行的管理平台,持续提升企业数据要素管理和数据要素应用价值。从数据使用规划开始,包括采集、开发、产生、建模、业务应用系统调用、更改、存储和消亡整个生命流程管理,其中对数据质量和数据安全的控制是连续的。通过对数据的跟踪,加强数据管理措施,降低数据管理成本,提高数据质量,升级数据安全,提高数据的兼容性和复用性,最终达到数据价值最大化。第六步:数据应用管理1)区分数据以供内部应用,还是出售给其他企业应用;2)制定对内对外的数据应用管理制度体系;3)做好制度执行工作,确保管理制度得到落实;4)做好监督工作,并不断进行修正。(2)“三纵”第一步:管理组织根据管理的要求,将企业的生产行政指挥系统,按分工协作的原则划分,并且对各个管理层次或环节明确规定其职责、权限、义务和信息沟通方式,同时相应地配置一定数量和能力的管理人员。第二步:制度与流程根据《山东省数据知识产权登记管理规则(试行)》、《企业数据资源相关会计处理暂行规定》、“数据二十条”等各项法律法规建立起与企业规模形式相适应,以供企业内部使用的规章制度。参考本文提供的各项流程,做好流程的实施与管理工作。第三步:技术与平等技术与企业数字化过程密切相关,一方面需要提高企业的技术水平,为数字化保驾护航,另一方面做好技术的安全隐私管理。数据资源的各主体之间虽有权利不同之说,但不可以有权利不平等之说,即使企业用于数据资源的控制权也不可以违背平等的原则。第

34

页济南市企业数据资产管理白皮书3、数据治理示例以济南公共交通集团有限公司

GPS

数据治理为例20。第一、需要确定企业对

GPS

数据的战略需求,站在制高点对

GPS

数据进行规划,应该主要为内部赋能,或是出售给出行服务商,亦或是继续两种业务模式并行。第二、对

GPS

数据做好标准化管理,各部门对

GPS

数据的命名、数据类型、长度、业务含义、计算口径、归属部门等,定义一套统一的规范,保证各业务系统对数据的统一理解、对数据定义和使用的一致性。实现“书同文”——使用同一种数据语言、“车同轨”——各类规格的统一、“度同制”——货币单位、重量单位的统一。第三、做好对

GPS

数据的安全管理,强化数据信息安全和数据使用安全,加强数据脱敏和加密处理,防止数据丢失、泄露和窃取,确保企业数据安全。同时确保

GPS

数据质量问题。第四、从

GPS

数据的采集、开发、产生、建模、业务应用系统调用、更改、存储和消亡整个生命流程做好追踪管理。第五、对

GPS

数据应用的行为进行完整记录,确保可追溯、可审计;建立GPS

数据资产服务保障、效益评估、效果评价等机制,确保

GPS

数据资产应用过程安全可控、合法合规。第六、做好济南公共交通集团有限公司各部门各组织的管理工作,依照《企业数据资源相关会计处理暂行规定》、“数据二十条”等制度起相应的制度体系,提高技术优质性和安全性,在与客户交易

GPS

数据时遵循平等原则。(六)数据资源目录编制流程1、流程图2120

济南公共交通集团有限公司

GPS

数据相关信息详见报告第

21

页有关该公司数据资源(产品)的描述。21

该流程参考《雄安新区数据资源目录编制指南》。第

35

页济南市企业数据资产管理白皮书图

16

数据资源目录编制流程图2、具体步骤第一步:成立编目组织第二步:明确编目原则目录编制的实质是用规范化的方法梳理系统全量数据,形成数据资源的透明全景展现。编制原则应是:数据为主、全量透明、严格标准、规范易用。第三步:进行组织培训指导加强各工作人员对数据资源目录编制的认识,确保目录编制有效进行。培训内容应包括:数据资源目录编制的重要性、目录编制基础知识、目录编制方法及编制时间计划等。第四步:确定编目范围企业内的全量数据都应进行数据资源目录编制,包括系统库表、服务接口和非结构化数据。第五步:开通数据资源平台数据资源目录依托数据资源平台,需要对不同的员工申请、开通账号,并设置不同的权限,确保账号不被滥用。第六步:生成数据资源目录数据资源目录由业务目录、数据目录和管理目录三部分组成。部门目录是在已有系统数据库表的基础上,通过工具提取技术元数据形成数据目录;将数据目第

36

页济南市企业数据资产管理白皮书录注册到数据目录系统,补充业务元数据完成业务目录编制;目录使用过程中产生管理元数据,管理目录由系统自动生成。主题目录和基础目录编制需在规划并建设相应的主题数据库或基础数据库之上,通过工具提取技术元数据形成数据目录;将数据目录注册到数据目录系统,补充业务元数据完成业务目录编制;目录使用过程中产生管理元数据,管理目录由系统自动生成。目录编制方式共有两种,分别是工具生成方式和人工生成方式。(1)工具生成目录生成数据目录:通过元数据采集工具自动提取系统数据库的数据字典信息,包括库、表、字段三级的技术元数据信息,平台自动同步库表技术元数据信息到数据目录系统形成数据目录。业务目录编制:基于已生成的数据目录,通过人工补充业务元数据信息的形式完成业务目录编制、注册、挂接和维护。目录注册与挂接:通过工具方式生成目录,数据资源目录编制完成即自动完成目录注册与数据挂接。管理目录生成:数据资源目录中的业务目录和数据目录进入数据目录管理系统后对其进行相关管理操作产生的管理元数据即构成管理目录。(2)人工生成目录目录编制:相关人员从系统库表出发,对实际存在的全量数据资源(库表、接口、文件)进行盘点,借助数据库设计文档,补充细化资源的重要指标项,填写数据资源目录模板,以标准模板形式编制部门数据资源目录。目录注册与挂接通过块数据平台―批量导入工具,完成目录注册与自动挂接。第七步:维护目录遵循数据资源目录“谁生产、谁提供、谁负责”的原则,对本数据资源目录的业务目录、数据目录进行定期更新和维护,保障数据的完整性、准确性、时效性和可用性。完整性维护:查漏补缺,不断补充完善数据资源目录。准确性维护:对已注册的数据资源目录进行核验修正维护。分类分级维护:对已注册的数据资源目录的资源分类,共享类型和开放类型进行修正维护。第

37

页济南市企业数据资产管理白皮书时效性和可用性维护:在系统业务、系统数据库表结构、数据数据项发生变化后一定期限内更新部门目录,并提交更新后的目录和目录变更申请到数据平台管理员,在审核后及时发布。同时,管理部门应定期进行全面普查,如有更新的需及时予以更新。第八步:评估目录需要制定一套科学、全面、易用的数据资源目录评估指标体系。数据资源目录评估指标体系应包括多级评估指标、考核要点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论