版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
CCSL78团体标准IITA构要求Requirementforstructureofdatacomponents2022-07-28发布2022-08-28实施前言 III引言 IV1范围 12规范性引用文件 13术语和定义 14缩略语 45数据元件的结构内容 46数据元件的类型 46.1总体要求 46.2组态 46.3模态 56.4组合态 56.5异构态 57数据元件的命名规则 57.1命名要素 57.2命名方式 68数据元件的标识符编制规则 68.1标识符组成 68.2标识符的组成形式 79数据元件的核心元数据 89.1内容 89.2属性 89.3描述 8附录A(资料性)数据资源到数据元件的转换 17参考文献 18ITCIITA022Ⅱ前言请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。中国信息产业商会团体标准专业委员会提出并归口。本文件起草单位:中国电子信息产业集团有限公司、中国电子系统技术有限公司、清华大学、北京大数据研究院、中电云数智科技有限公司、北京捷报金峰数据技术有限公本文件主要起草人:陆志鹏、国丽、乔亲旺、周崇毅、刘国栋、胡成盛、杨二龙、王梓、胡俊、谢冬水。TCIITA022引言为贯彻落实《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》《“十四五”数据经济发展规划》(国发〔2021〕29号)、《关于加强数字政府建设的指导意见》(国发〔2022〕14号)、《中华人民共和国认证认可条例》、《关于开展数据安全管理认证工作的公告》(国家市场监督管理总局、国家互联网信息办公室联合印发,2022年第18号)和GB/T41479-2022《信息安全技术网络数据处理安全要求》的相关要求,激活数据要素潜在价值,探索破解数据要素市场化配置中的重点、难点、堵点问题,推动与实体经济深度融合,我们启动了数据安全、数据要素、数据产业三大领域的探索,以“数据安全与数据要素化工程”的名义进行攻关。工程的内容,设计和定义了数据要素加工中心和数据要素金库。其中,数据元件开发平台作为数据要素加工中心的五大业务平台之一,在数据元件开发、生产、入库的全流程中,对数据资源、开发流程和审批流程进行管理,实现了数据元件从设计、开发调试、生产管理到入库编目的全流程管控,进而实现“数据可用不可见,数据不动程序动”。围绕数据元件的结构,所进行的流程管理和过程控制,称为数据元件的结构化。结构化,就是数据安全与数据要素化工程的显著特征。与数据元件开发平台直接关联的本文件《数据元件的结构要求》,确立了数据元件的结构,规定了数据元件的类型、命名规则、标识符编制规则和核心元数据的要TCIITA022数据元件的结构要求本文件确立了数据元件的结构,规定了数据元件的类型、命名规则、标识符编制规则的要求。适用于数据要素生产过程中数据元件的设计与开发。范性引用文件文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本 (包括所有的修改单)适用于本文件。GBT260—2007中华人民共和国行政区划代码GBT2659—2000世界各国和地区名称代码GBT26816—2011信息资源核心元数据TCIITA506-2022数据元件安全审核要求定义atasetdatadesensitization1TCIITA022通过一系列数据处理方法对原始数据进行处理以屏蔽敏感数据的一种数据保护方法。datacomponent题,通过对数据资源脱敏处理后,根据需要由若干相关字段形成的数据集的关联字段通过建模形成的数据特征。构structureofdatacomponent数据元件的结构主要包含四部分内容,分别是数据元件的类型、命名规则、标识符编制规则和核心元数据。数据元件的类型主要从四种数据元件形态的特征和要求来进行描述。数据元件的命名规则主要从命名原则、命名要素、命名方式等来描述。数据元件的标识符编制规则主要从标识符组成和标识符形式来描述。数据元件的核心元数据主要包括业据、技术元数据、管理元数据。构化structuralizationofdatacomponent为推动数据安全与数据要素化工程落地,围绕数据元件的结构,所进行的流程管理和structureddata一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的型予以有效描述。unstructureddatadataresource字化形式留存的信息资源。datacomponentmodel2TCIITA022使用数据资源开发数据元件过程中所采用的某些规则、算法等构造的数据模型。数据元件composeddatacomponent据集。据元件modaldatacomponent据元件combinatorialdatacomponentheterogeneousdatacomponent由结构化数据、非结构化数据等多种结构类型的数据资源经脱敏或初级加工形成的数据特征。ta[来源:GB/T26816—2011,3.2.18]adataelement[来源:GB/T19710—2005,4.6]adataentity特征的元数据元素。[来源:GB/T19710—2005,4.6,有修改]coremetadata源基本属性的元数据元素和元数据实体。[来源:GB/T18391.3—2009,3.5]3TCIITA0224缩略语。API:应用编程接口(ApplicationProgrammingInterface)5数据元件的结构内容结构内容包含以下四部分:c编制规则:主要从标识符组成和标识符形式来描述;元件的类型总体要求基于数据元件的开发方式和数据资源类型的差异将数据元件的结构之一,分为组态、a)形成数据元件所使用的数据资源数量应满足最小必要原则:数据元件构建所使用的数据资源不宜包含过多信息,应对数据资源表的字段数、记录数和数据存储量;b)数据元件去标识化或主体授权同意:对于涉及政府、组织、企业或个人等重要数敏感信息,应去除主体标识或者主体授权同意。c)数据元件不可逆:数据元件模型应保证数据元件结果不可逆回到数据资源,确保数据的使用者无法根据数据元件提供的信息还原出数据原貌,以免造成原始数据2组态4TCIITA022组态数据元件主要加工方式主要包括表合并、连接、特征选择等。基于数据元件构建企业基本信息包含企业名称、企业人员规模、企业营业收入等,通过对企业名称进行脱敏处理后,可模态模态数据元件的主要加工方式包括指标变换、特征提取、特征优化、逻辑规则判断ab)单个模态数据元件是单个对象输出的特征记录;c企业财务信息包括资产负债率、净资产、主营业务占比等字段信息,通过数学建模可形成财务特征元组合态2021年北京市中小企业经营特征元件包含2021年北京市中小企业基本信息和2021年北京市中小企业财.5异构态异构态数据元件是将数据表、图片、音频、视频等多种结构类型的数据进行统一标准化加工形成的数据集或数据特征。基于数据元件构建的基本原则,异构态数据元件应符合a始数据资源包含非结构化数据;GB人脸表情图像集包含若干不同人脸的表情图片,通过对图片的分辨率和大小等进行标准化,形成图像件的命名规则命名要素数据元件名称是对数据元件所包含数据内容进行清晰、简明的描述,便于开发人员、5TCIITA022a及的数据范围加以限定说明的要素。b据元件所涉及的数据主体内容进行描述的要素。命名方式数据元件其中,数据元件的主体要素是必不可少的,限定要素可在保证数据元件内容表达明a据元件不包含限定要素时,可省略限定要素描述内容。件,其中不含时间和行业领域限定要素。b)限定要素选择与否不会造成歧义时,可省略限定要素描述内容。定要素。c)特殊情况下,命名要素不满足实际描述需求时,可根据需要增加限定要素描述内据元件的标识符编制规则1标识符组成标识符由该数据元件的世界各国和地区名称代码、区域码、类别码、类型码、顺序码a国和地区名称代码指数据资源所在国家或地区代码,采用三位大写字母编码,按照GB/T2659—Xb)区域码指数据资源归属地(省、市、县)的行政区划代码,采用6位数字代码,应符合BT如果数据资源包括两个或两个以上行政区,采用上一级别行政区代码表示。当上6TCIITA022数据元件的类别包括标准数据元件和定制数据元件。类别码由1位阿拉伯数字表示例:标准数据元件1态数据元件;示例:组态数据元件1后6位表示在世界各国和地区名称代码、区域码、形态码、类别码确定的情况下,在子码代表同类数据元件自定义对象个体代码,根据应用的需求自定义数据元件子数量和编码的位数,由不定长数字与字母组合。示例:第一个对象个体代码1标识符的组成形式XXXXXXXXXXXXXXXXXXXXX-Y图2数据元件的标识符的组成形式据元件的由境外(美国)的数据资源作为原材料加工,在2021年生产的第123号定制组态数据元件:USA0000212021000123。7TCIITA022数据元件的核心元数据9.1内容依据GB/T26816—2011中对信息资源核心元数据的描述方式,数据元件的核心元数据是对数据元件的基本信息项进行描述和元数据信息的表示,包含业务元数据、技术元数9.2属性核心元数据,应按照以下方式进行描述。a称名称,以字符串的形式表示。b)定义容描述,以字符串的形式表示。数据元件的核心元数据实体或元素的英文名称。核心元数据英文名称是数据元件数据元件的核心元数据实体或元素的英文缩写名称,按照GB/T21063.3—2007给描述该项数据元件的核心元数据的取值类型、数据格式、数据长度等。不同类型下五种:;2)数值型:描述整数、浮点数等类型的属性;;5)布尔型:描述是/否、真/假等类型的属性。表示该项数据元件属性是必备的还是可选的,以字符的形式表示。约束类型应包:2)C:条件必选,表示该数据元件属性在一定条件下为必选项,即当满足约束义的条件时必须选择;对于数据元件的核心元数据元素,列举一个填写内容示例。例如数据元件开发单9.3描述述。9.3.1业务元数据8TCIITA022的业务元数据包括标识符、名称、英文名、类型、摘要、关键词。a符b)名称mponentTitlec名据元件的英文名称。onentd)类型f)关键词9TCIITA0229.3.2技术元数据数据元件的技术元数据包括字段数、记录数、存储量、标签、区域范围、时间范围、存周期、生产机制。a数b)记录数berOfRecordsc量eeriodf)更新频率TCIITA022g)生存周期h)生产机制9.3.3管理元数据数据元件的管理元数据包括信息领域、质量等级、价值评级、安全分级、数据项信息、最新修改日期、是否出境、数据跨主体流动、数据安全风险评估、评估机构、评估时间、评估结论、整改措施、数据来源单位名称、数据归集单位名称、元件开发单位、发布方式、用途、备注。ab)质量等级cTCIITA022d)安全分级e息1)数据项中文名。2)数据项英文名3)数据项类型O4)数据项长度TCIITA022f)最新修改日期g)是否出境h)数据跨主体流动i)数据安全风险评估j)评估机构k)评估时间l)评估结论TCIITA022m)整改措施n)数据来源单位名称o)数据归集单位名称p)元件开发单位1)开发单位名称2)开发单位代码TCIITA0223)开发单位电话q)发布时间r)元件管理单位1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《供配电技术》第1章 教案
- 综合实践的心得体会范文
- 文员的实习报告
- 青春的三分钟演讲稿范文(33篇)
- 房屋转让合同
- 少先队缅怀先烈活动方案
- DB12-T 1090-2021 1:500 1:2000基础地理信息要素数据库技术规范
- 2024年心电图机项目资金筹措计划书代可行性研究报告
- 财务报表分析 教案 项目六 财务报表综合分析
- 2023-2024学年广东省深圳市华附集团八年级(下)期中英语试卷
- 英语口语与演讲知到章节答案智慧树2023年青岛农业大学
- 自然灾害之寒潮灾害演示文稿
- 学校食品安全总监职责,学校食品安全员守则,学校食品安全风险日管控、周排查、月调度工作制度
- 激光焊接机工艺培训讲解
- 坚持以人民为中心发展思想
- 新人教版高中英语必修一至必修五完整课文译文
- (部编版)二年级语文上册必背课文默写填空
- 夏商周考古课件 第4章 殷墟文化(4-6节)
- GB/T 708-2019冷轧钢板和钢带的尺寸、外形、重量及允许偏差
- GB/T 6072.4-2012往复式内燃机性能第4部分:调速
- 胆囊癌和胆管癌2021NCCN患者指南中文版
评论
0/150
提交评论