DB3203T 1056-2024数据元件 第1部分:结构要求_第1页
DB3203T 1056-2024数据元件 第1部分:结构要求_第2页
DB3203T 1056-2024数据元件 第1部分:结构要求_第3页
DB3203T 1056-2024数据元件 第1部分:结构要求_第4页
DB3203T 1056-2024数据元件 第1部分:结构要求_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3203Datacomponents-PartI III 5.3模态数据元件 6.1要素 6.2方式 8.1属性 8.1.1取值 8.1.2中文名称 8.1.3定义 8.1.4英文名称 8.1.5短名 8.1.6数据类型 8.1.7约束类型 8.1.8取值示例 8.2描述 8.2.1业务元数据 8.2.2技术元数据 II8.2.3管理元数据 III请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。件的设计、开发、交易和管理。拟由五个部分据元件的质量检测流程提供指导,并给出相关件开发商和数据运营商对数据元件进行价值评估,并给出相关信1数据元件第1部分:结构要求本文件规定了数据元件的结构、类型、命名、标识和核心元数据具有一定主题,可以标识并可以被计算机处在生产、生活和管理等社会活动中以数字化形式留存的数据对数据资源进行处理,屏蔽敏感数据的一种数据保护组态数据元件composeddatacom2数据资源脱敏处理后,由若干个相关字段形成的数据集。数据资源的关联字段通过建模形成的数据特征。组态数据元件和模态数据元件的组合。定义和描述其他数据的数据。类型命名标识核心元数据a)最小必要原则:数据元件构建所使用的数据资源不宜包含过多信息,对数据资源表的字段数、记录数和数据存储量等进行约束控制;3b)去标识化或主体授权同意原则:对于涉及政府、组织、企业或个人等重要数据和敏感信息,c)不可逆原则:数据元件模型保证数据元件结果不可逆回到数据资源,确保数据的使用者无法5.2组态数据元件5.2.1组态数据元件应对原始数据资源中敏感信息进行脱敏处理,除敏感字段外,输出字段内容与选5.3模态数据元件5.3.1模态数据元件输出的特征字段应是新的字段。5.3.3单个模态数据元件应是单个对象输出的特征记录。5.4组合态数据元件1)时间:可选要素,表示数据元件涉及的时间范围,如年、月等;2)地域:可选要素,表示数据元件涉及的地域,包括国家、地区等;3)行业领域:可选要素,表示数据所属的行业领域。b)主体要素:1)数据对象:必选要素,表示数据元件所涉及的数据对象主体;2)信息主题:必选要素,表示数据元件所包含内容的概要描述及数据粒度相关信息。46.2.1数据元件命名应符合“限定要素”+“主体要素”+“数据元件”表达方式的要求。6.2.2限定要素的取舍应符合以下要求:a)数据元件的命名中不包含限定要素时,无其描述;b)不造成歧义时,可省略其描述;c)命名要素不满足实际描述需求时,应根据数据元件内容增加时间、地域或行业领域的限定要素描述。7.1组成形式标识应由数据元件的世界各国和地区名称代码、区域码、类别码、类型码、顺序码和子码依次连接组成,见图2。10位顺序码1位类型码1位类别码6位区域码3位世界各国和地区名称代码图2数据元件的标识组成形式7.2世界各国和地区名称代码7.2.1世界各国和地区名称代码为数据资源所在国家或地区代码,应采用三位大写字母编码,应符合GB/T2659.2中关于“三字符拉丁字母代码结构”的规定。7.2.2数据源不属于单个国家或地区时,则应用大写字母AAA表示,数据来源不明确,则应用大写字7.3区域码7.3.1数据资源归属地(省、市、县)的行政区划代码,应采用6位数字代码,应符合GB/T2260的规定。7.3.2数据资源包括两个或两个以上行政区,应采用上一级别行政区代码表示;当上一级别为国家时,应用111111表示。7.3.3数据来源不明确时,则应用000000表示,数据资源为境外资源时,则应用999999表示。7.4类别码类别码应由1位阿拉伯数字表示:——1:标准数据元件;5由境外(美国)的数据资源作为原材料加工,20226e)布尔型:描述是/否、真/假等类型的属性。8.2描述8.2.1.3名称78.2.1.4英文名英文名称:englishTitle。短名:enTitle。英文名称:abstract。短名:abstract。88.2.2.3记录数8.2.2.4存储量9英文名称:lifeCycle。短名:lifeCycle。英文名称:qualityLevel。短名:qualityLvl。英文名称:valueLevel。短名:valueLvl。英文名称:securityLevel。短名:securityLvl。英文名称:FieldInformation。短名:FieldInfo。取值示例:ElectricityUsageFeature。英文名称:fieldType。英文名称:fieldLength。短名:fieldLen。英文名称:isCrossEntity。短名:isCEntity。英文名称:collectionOrganisation。注:多个电话号码,用分号(“;”)分隔。注:多个电话号码,用分号(“;”)分隔。8.2.3.21用途8.2.3.22备注(资料性)数据资源到数据元件的转换过程及应用场景示例A.1数据资源到数据元件的转换过程数据资源到数据元件的转换,见图A.1。D₂Dmf₂Xm图A.1数据资源到数据元件的转换示意图A.2数据元件的应用场景示例以徐州市市民健康信息为例,原始数据字段包括姓名、身份证号、门诊及住院信息、出院诊疗结果等。这些数据涉及到个人敏感信息,直接流通将造成不好的社会影响。通过构建徐州市市民健康状况数据元件,显示有无慢性病、有无大病、有无传染病(显示有无,结合具体疾病类型显示评分,疾病严重程度越高,种类越多分数越低)。在满足求职、相亲等应用场景的同时,更好地保护了市民的隐私。其中徐州市市民健康状况数据元件核心元数据示例,见表A.1。表A.1徐州市市

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论