畜牧兽医大数据应用与管理 第2部分:元数据DB50-T 1096.2-2021_第1页
畜牧兽医大数据应用与管理 第2部分:元数据DB50-T 1096.2-2021_第2页
畜牧兽医大数据应用与管理 第2部分:元数据DB50-T 1096.2-2021_第3页
畜牧兽医大数据应用与管理 第2部分:元数据DB50-T 1096.2-2021_第4页
畜牧兽医大数据应用与管理 第2部分:元数据DB50-T 1096.2-2021_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS65.020.30CCSB40

DB50重 庆 市 地 方 标 准DB50/T1096.2—202122021-03-30发布 2021-07-01实施重庆市市场监督管理局发布DB50/T1096.2DB50/T1096.2—2021II前  言本文件按照GB/T1.1—20201本文件是DB50/T1096的第2部分。DB50/T1096已发布了以下部分:第1部分:总则第2部分:元数据第3部分:信息分类与编码第4部分:数据接口第5部分:共享交换技术要求第6部分:信息资源目录第7部分:管理要求请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由重庆市农业农村委员会提出并归口。本文件起草单位:重庆市畜牧技术推广总站、重庆大学、广州中科易德科技有限公司、西南大学、广州中国科学院软件应用技术研究所。DB50/T1096.2DB50/T1096.2—2021PAGEPAGE3畜牧兽医大数据应用与管理第2部分:元数据范围本文件规定了畜牧兽医行业大数据应用与管理的元数据。本文件适用于畜牧兽医行业有关数据集属性的统一规范化描述。规范性引用文件(包括所有的修改单适用于本文件。GB/T7408数据元和交换格式信息交换日期和时间表示方法GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分框架GB/T19710—2005地理信息元数据术语和定义下列术语和定义适用于本文件。3.1元数据metadata定义和描述其他数据的数据。[来源:GB/T18391.1—2009,3.2.16]3.2数据集dataset可以识别的数据集合。[来源:GB/T19710—2005,4.2]畜牧兽医数据集的元数据元数据组成1,其中数据集按照GB/T19710的要求进行。图1参考元数据与核心元数据的包含关系元数据框架畜牧兽医行业数据集的元数据规定了7个元数据子集,详见4.5、4.6:a)元数据标识信息:包含元数据本身的基本信息。b)数据集标识信息:包含元数据所描述的数据集的基本信息。c)内容信息:包含数据内容特征的描述信息。d)分发信息:包含数据分发的信息以及用户获得数据的途径。e)数据质量信息:包含数据集数据质量信息的说明。f)限制信息:包含对元数据或数据集进行访问和使用的限制信息。g)维护信息:包含元数据或数据集的更新频率及更新范围的信息。畜牧兽医行业数据集参考元数据的聚集关系与依赖关系见图2。图2畜牧兽医行业数据集参考元数据的聚集关系与依赖关系元数据的结构层次按照GB/T18391.1的要求,元数据的结构包含元数据元素、元数据实体和元数据子集三个层次:a)位名称”、“联系人”、“联系电话”等若干个元数据元素来说明。c)元数据摘要描述元数据摘要描述定义畜牧兽医行业数据集的元数据内容。表1给出了元数据的元素、实体与子集的定义。表2给出了元数据元素表达式符号的含义。表1元数据摘要描述符描述符约束性说明中文名称必选元数据子集、元数据实体或元数据元素的中文名称。英文名称必选元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。定义必选描述元数据子集、元数据实体或元数据元素的基本内容,是畜牧兽医大数据信息数据集某个属性和特征的概念与说明。数据类型必选责方”的数据类型,供“数据集提交和发布方”和“元数据维护方”进行引用。短名必选(有短名范围内)唯一性的情况下取每个词汇的前3位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加1位,如果仍然不能满余词汇的首字母采用大写。注解必选对元数据子集、元数据实体或元数据元素的含义的进一步解释,包括该元数据的约束/条件(必选、可选)和最大出现次数。当该元数据为可选时,应注明其约束条件。取值规则可选元数据元素、元数据实体或元数据子集取值方式的说明。描述元数据元素时必选,描述元数据实体、子集时不选。子元素可选子元素是通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数据元素。表示规则为:“标识符=表达式”。描述元数据实体、子集时必选,描述元数据元素时不选。具体定义方式见表2。表2元数据元素表达式符号含义符号含义=“=”左侧由“=”右侧内容替换、生成、组成,补充举例+与,“+”左侧与右侧的两项都要选择|或(选择),在由“|”分开的两项之中选择其一a表示元数据元素a为必选项,且最大出现次数为1DB50/T1096.2—DB50/T1096.2—20212(续)PAGEPAGE4符号含义0{a}1表示{}中的元数据元素a为可选项,且最大出现次数为1或参见其注解0{a}n表示{}中的元数据元素a为可选项,且最大出现次数为N或参见其注解1{a}n表示{}中的元数据元素a为必选项,且最大出现次数为N畜牧兽医行业数据集核心元数据畜牧兽医行业数据集的核心元数据包括8个必选元数据元素或实体,10个可选元数据元素或实体。畜牧兽医行业数据集的核心元数据内容见表3。表3畜牧兽医行业数据集核心元数据内容核心元数据内容元素或实体约束性在参考元数据中的位置数据集名称元素必选数据集标识信息数据集标识符元素必选数据集标识信息数据集摘要元素必选内容信息数据集提交或发布方元素必选数据集标识信息关键词实体必选数据集标识信息数据集语种元素必选数据集标识信息元数据创建日期元素必选元数据标识信息元数据标识符元素必选元数据标识信息数据集特征数据元元素可选内容信息数据集发布日期元素可选发布信息数据集发布格式实体可选发布信息在线访问地址元素可选发布信息数据集分类实体可选数据集标识信息相关环境说明元素可选数据集标识信息元数据负责方元素可选元数据标识信息元数据标准名称元素可选元数据标识信息元数据标准版本元素可选元数据标识信息元数据更新日期元素可选元数据标识信息具体核心元数据内容说明见表4。表4畜牧兽医行业数据集核心元数据具体说明核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性数据集名称简要描述数据集主题与内容的标题datasetTitle字符串自由文本dataTitle必选项,最大出现次数为1DB50/T1096.2—DB50/T1096.2—20214(续)PAGEPAGE6核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性数据集标识符数据集的唯一标识符datasetIdentifier字符串按照“提交机构-编号-标准名称,版本号用1位整数加2位小数的表示方版本)dataID必选项,最大出现次数为1数据集摘要数据集内容的简单说明abstract字符串自由文本abstract必选项,最大出现次数为1数据集提交或发布方提交或发布数据可靠性负责的单位或部门datasetContact复合型自由文本dataContact必选项,最大出现次数为1关键词用于描述数据集主题的通用词、形式化词或短语keywords字符串自由文本keyword必选项,最大出现次数为N数据集语种数据集采用的语言datasetLanguage字符串语种代码dataLang必选项,最大出现次数为N元数据创建日期创建、采集元数据的日期metadataDateStart日期型按照GB/T7408规定,格式应当为YYYY-MM-DDmdDateStart必选项,最大出现次数为1元数据标识符元数据的唯一标识metadataIdentifier字符串自由文本mdID必选项,最大出现次数为1数据集特征数据元数据集中能够表达数据集核心内容与特征资源的数据元列举characteristicDataElement字符串自由文本charaDataEle可选项,最大出现次数为1数据集发布日期数据集进行提交或发布的日期datasetPublicationDate日期型按照GB/T7408规定,格式应当为YYYY-MM-DDdataPubDate可选项,最大出现次数为1数据集发布格式分发数据的格式说明distributionFormat复合型分发格式=分发格式名称+0{版本}1distFormat可选项,最大出现次数为N在线访问地址可以对数据集进行在线访问或获取的信息online字符串在线访问地址,按照RFC2396规定填写online可选项,最大出现次数为N核心元数据内容定义英文名称数据类型取值规则/子元素短名约束性数据集分类数据集的分类信息datasetCategory复合型数据集分类=类目名称+类目编码+分类标准dataCat可选项,最大出现次数为N相关环境说明说明数据集产生的处和数据量等environmentDescription字符串自由文本envDesc可选项,最大出现次数为1元数据负责方提交元数据并对元数据负责的部门和单位metadataContact复合型自由文本mdContact可选项,最大出现次数为N元数据标准名称执行的元数据标准名称metadataStandardName字符串自由文本mdStdName可选项,最大出现次数为1元数据标准版本执行的元数据标准版本metadataStandardVersion字符串自由文本mdStdVer可选项,最大出现次数为1元数据更新日期更新元数据的日期metadataDateUpdata日期型按照GB/T7408规定,格式应当为YYYY-MM-DDmdDateUpd可选项,最大出现次数为1畜牧兽医行业数据集参考元数据畜牧兽医行业数据集的参考元数据由7个元数据子集构成:a)中文名称:根实体元数据b)定 义:畜牧兽医行业数据集参考元数据的根实体c)英文名称:metaDatad)数据类型:复合型e)短 名:metaDataf)子元素:元数据=元数据标识信息+数据集标识信息+内容信息+0{分发信息}1+0{数据质量信息}n+0{限制信息}n+0{维护信息}1每个参考元数据子集的说明见表5。DB50/T1096.2DB50/T1096.2—2021PAGEPAGE9表5畜牧兽医行业数据集的参考元数据子集说明参考元数据子集定义英文名称数据类型子元素短名约束性元数据标识信息关于元数据本身的基本信息metaDataIdentificationInfo复合型元数据标识信息=元数据创建日期+数据集标识符+0{元数据负责方}n+1+1+1+mDIdInfo必选项,最大出现次数为1数据集标识信息元数据所描述的数据集的基本信息datasetIdentificationInfo复合型数据集标识信息=数据集名称+0{目的}1+0{可信度}n+1方}n+n+n+n+0{相关环境说明}1dataIdInfo必选项,最大出现次数为1内容信息数据集内容特征的描述信息content复合型内容信息=数据集摘要+0{数据集特征数据元}1+1+n+cont必选项,最大出现次数为1分发信息提供数据集的分发格式和分发方式的信息distributionInfo复合型分发信息子集=n+n+0{在线访问地址}n+0{离线发布介质}ndistInfo可选项,最大出现次数为1数据质量信息提供数据集质量的总体评价信息dataQualityInfo复合型数据质量信息=数据志说明dataQuaInfo可选项,最大出现次数为N限制信息对数据集和元数据进行访问和使用的限制信息dataConstraints复合型限制信息=n+n+dataConst可选项,最大出现次数为N维护信息对数据集或元数据进行更新与维护的有关信息maintenanceInfo复合型维护信息=n+n+maintInfot可选项,最大出现次数为1元数据著录用户针对畜牧兽医行业数据集进行元数据著录的实例,可参考附录A。元数据扩展扩展原则新扩展的元数据需要遵循如下两条基本原则:a)新建的元数据不应与参考元数据中的现有的元数据元素、实体、子集的名称、定义相冲突。b)如果共享元数据标准中规定了不允许的情况,则不得扩展这些不允许的内容。扩展步骤元数据扩展的步骤包含以下环节,如图3所示:分析参考元数据:对参考元数据进行全面的分析,不仅要针对元数据元素/实体的名称,还应使用已有的元数据元素、实体、子集等:如果参考元数据中存在能够满足要求的元数据元素、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论