下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据要素标准体系建设研究数据要素与数字技术共同构成国民经济顺畅循环的基础[1],在国民经济信息化、数字化和智能化方面发挥着日益重要的作用[2]。数据要素相关标准是数据的生产、流通等各环节的基础,也是推动数据市场培育的“奠基石”[3],随着数据市场规模的日益扩大,政府对数据要素标准化工作提出了迫切要求。2O2O年,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》[4]首次明确提出“数据要素”的概念,要求推动“数据采集的标准化”,建立完善分类分级等制度。同年,《中共中央国务院关于新时代加快完善社会主义市场经济体制的意见》[5]建议完善数据权属界定、交易流通等标准。2O21年,国务院办公厅印发《建设高标准市场体系行动方案》[6],强调要建立数据资源产权、交易流通、跨境传输和安全等基础制度和标准规范。2O22年,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》[7](也即《数据二十条》),明确对“数据产权”“数据要素流通和交易”等制度的建立提出要求。上述文件为数据相关标准的制定提供了方向,更凸显了标准化工作对数据要素高效流通利用的关键作
用。本文旨在对比分析国内外数据要素标准的差异,探讨国内现有标准的空白与后续标准化工作的重点研究方向,初步构建数据要素标准体系,为我国数据要素标准的制定提供参考。国内外数据标准差异分析本文选取全国标准信息公共服务平台(https://std./)为数据源,采集时间为2O24年5月6日。统计和梳理数据相关现行或即将实施的国际标准与国家标准。首先,基于词频分析,绘制国内外标准的词云图,找出高频标准。其次,通过文献调研方法,结合工作实践,分析不同方向数据的标准建设现状,对比国内外标准各自的研究重点,作为数据要素标准体系建设的理论基础。国际标准词频分析国际标准较为突出的关键词,在数据流通交易的层面包括:“交换(exchange)”(interchange)”“交流(communication)”“产品(product)”;在数据技术方法层面包括:“格式(format)”“识别(identification)”“采集(capture)”“整合(integration)”“处理”(processing);在数据治理保障层面包括:“管理(management)”“安全(security)”“质量(quality)”;在数据行业应用层面包括:“工业(industrial)”“生物(biometric)”“空间(space)”等(见图1)。其中,最为突出的是数据流通方面的标准,其次为行业应用中的工业数据相关标准。图1国际标准词云图国内标准词频分析国内的标准中,国家标准与国际标准有许多相似之处,但二者也各有侧重。在数据流通交易层面最突出的关键词仍然是“数据交换”“通信”“传输”“接口”“产品”;在数据技术方法层面则有数据的“自动化”“元数据”“格式”“集成”和“数据处理”等;在数据治理保障层面数量较少,其中相对突出的关键词有数据安全保护相关的“分类”“信息安全”等;在数据行业应用层面中,“工业”仍然是应用最多的行业场景,其次是“空间数据”与“地理数据”。其中,“数据交换”等数据流通相关标准最为突出,在数据治理层面的“元数据”标准、“分类”标准、数据技术层面的“集成”相较而言更为突出(见图2)。图2国家标准词云图总体而言,目前数据标准集中在数据流通方面,在数据治理保障方面略显欠缺。其中,国际标准在数据交换、交易方面的标准更加完善,在数据采集等
技术方面略有欠缺;国内标准在行业应用方面更为突出,在数据安全标准的数据分类分级保护方面相对完善,但数据质量标准的制定存在一定欠缺。标准重点研究方向目前,数据要素相关标准的研制主要是以交易流通等应用层面的标准为主,缺乏成体系的概念性标准。对于数据要素的基础定义类标准,以及抽象化的数据处理方法,如采集、质量等,相关标准都有所欠缺。尤其是国内,数据市场起步较晚,但又发展迅速,难免造成理论基础层面不够扎实、更注重实用性的特点。对此,应重点研究的数据要素相关标准既要考虑实际需要,也要兼顾理论框架的完整性。一方面应重点完善数据要素相关概念、定义等基础性标准,为具体实践提供规范化的引导;另一方面也要关注新兴行业,建立大模型语料质量评价、数字电池护照等标准,完善现有的质量评价、采集处理、流通交易等方法性标准,使其适应时代的发展。数据要素标准体系建设根据上文对现有国内外数据相关标准的总结和分析,参考新一代人工智能标准体系建设[8]相关架构(见图3),本文初步构建了数据要素标准体系,为标准化工作提供框架性参考。图3数据要素标准体系架构图基础层即“A基础标准”,位于数据要素标准体系结构最左侧,支撑体系的其他部分,包括术语与定义、登记与格式、基础设施三大类标准。术语与定义标准。用于统一数据要素相关概念、术语等方面的标准,为其他各部分标准的制定提供支撑。目前国内该类标准尚不完善。登记与格式标准。规范数据要素的识别登记、基础设施标准。保证数据要素采集、计算、存储等基础设施建设和运营标准,包括数据中心、数据库、网络基础设施相关标准等。保障层包括“B数据质量管理”与“C数据安全合规”。两类标准共同为数据采集与处理、数据流通与跨境传输、数据要素各行业应用等提供基础支撑与保障。数据质量管理数据质量管理标准针对数据要素全过程的质量管理方法进行规范,包括元数据质量、数据架构质量、数据语料质量、质量控制与评价标准等。元数据质量标准。涉及元数据自身准确性、完整性等方面的规范要求。数据架构质量标准。对数据整体结构的合理性、有效性等的准则规定。数据语料质量标准。用于模型训练的数据集与语料数据的规范。质量控制与评价标准。用于规范数据质量的控制流程、方法以及对数据质量进行评估的指标和方式的标准。数据安全合规数据安全与合规标准主要针对数据要素全过程的安全与合规方法进行规范,包括数据安全、分类分级、数据合规、隐私保护和数据确权等部分。数据安全标准。确保数据不受未授权访问、使用、篡改或破坏的标准。分类分级标准。根据数据的重要性、敏感性等
因素,划分为不同类别和级别进行保护的标准。数据合规标准。确保数据收集、处理、存储和使用符合法律法规、行业规定和伦理准则,防止出现违法违规行为。隐私保护标准。制定并遵循保护个人隐私数据的原则、技术和政策,确保个人数据不被滥用、泄露或非法获取。数据确权标准。用于数据登记、流通等全过程对数据权属确认的方法。技术层主要包括“D数据采集与处理”与“E数据流通与交易”。为数据采集处理标准提供技术与内容支撑,为数据流通交易标准则提供规范和参考。数据采集与处理数据采集与处理标准主要用于规范数据提供方的数据资源化过程,包括数据采集、数据预处理等部分。数据采集标准。明确数据来源、采集方法和频率等要求的标准。数据预处理标准。对原始数据进行清洗、集成、规范化等过程的标准。数据处理标准。数据转化为更易理解使用的形式,形成数据产品的标准。数据标注标准。针对用于模型训练数据的处理方法,规范标注的要求。数据存储标准。规定数据存储格式,确保其安全性等的相关标准。数据流通与交易数据流通与交易标准,用于规范数据要素平台方的数据流通与交易过程,其中数据资产与数据产品属于对概念的规范,数据交换等标准则偏向方法。数据交换标准。数据在信息系统间的传输、共享的规范与格式等。数据交易标准。数据作为商品进行交易时,关于定价、流通、买卖行为的标准。跨境传输标准。数据在不同国家或地区间传输的准则,确保合规和安全性。应用层即“F数据要素行业应用”,面向行业具体需求,对其他部分标准进行细化,支撑各行业发展。这里仅列出部分行业进行展示。数字农业标准。包含农业信息化、智能化技术的应用标准。数字制造标准。涵盖数字化技术和制造技术融合的生产标准。数字交通标准。包括信息技术和互联网在交通领域应用的规范。数字医疗标准。涉及数字技术在医疗健康产业的应用标准。大模型标准。关注具有复杂计算结构的机器学习模型的标准。电子商务标准。涵盖利用电子设备和网络技术进行商务活动的规范。另外,还有更多其他行业的应用标准,需在未来实践中逐步扩展。监督层即“G评估与监督”,位于数据要素标准体系结构的最右侧,规范数据要素流通交易全过程,防止数据滥用。数据能力评估标准。包含对个人或组织在数据处理、分析、解读和应用等方面的能力进行评估的规范,旨在衡量其数据分析和评估的成熟度和技能水平。数据监督与审计标准。涉及对企业数据系统进行实时监测和控制,以及对数据传输、存储等环节进行监督检查的规范。数据伦理与社会责任。关注数据收集、使用、存储和共享过程中应遵循的道德和伦理原则,强调各方从数据要素采集到交易全过程应承担的社会责任等。结语国内外数据市场发展情况的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论