TCPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第1页
TCPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第2页
TCPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第3页
TCPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第4页
TCPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.01CCSL70团 体 标 准T/CPRA2101.2—20242TechnicalrequirementsofgenedatabaseofChineseculturePart2: Genedataqualityrequirements2024-12-13发布 2024-12-13实施中国公共关系协会文化大数据产业委员会 发布T/CPRA2101.2-2024T/CPRA2101.2-2024PAGE\*ROMANPAGE\*ROMANII目 次前 言 II范围 1规范性引用文件 1术语和定义 1中华民族文化基因库 1总体要求 1原则 1数据范围 1数据格式 2数据文件命名原则 2逻辑一致性要求 2实时性要求 2数据质量要求 2核心元数据要求 2数据文件质量要求 6数据质量保真要求 7前 言GB/T1请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国公共关系协会文化大数据产业委员会提出并归口。本文件起草单位:北京邮电大学、北京玖扬科技有限公司、伏羲云(北京)文化科技有限公司。本文件主要起草人:徐坤、高凯、赵海英、薛晓鹏、尹晖、侯小刚、周月、徐鹏举、李伟、崔义娜、陈磊、刘志军、李媛媛。T/CPRA2101.2-2024T/CPRA2101.2-2024PAGEPAGE1中华民族文化基因库技术要求第2部分:数据质量要求范围本文件规定了国家文化大数据体系中中华民族文化基因库数据的质量要求,包括总体要求和数据质量要求等。本文件适用于国家文化大数据体系中中华民族文化基因库设计、研发等。规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则T/CPRA1-2021国家文化大数据标准体系T/CPRA300-2023文化数字内容分类与代码T/CPRA301-2023文化资源数据分类与代码术语和定义下列术语和定义适用于本文件。genedatabaseofChineseculture中华民族文化基因库的数据主要来自革命文物大数据库和博物馆大数据体系,通常经过高精度数据采集,导入国家文化大数据体系底层关联集成系统,完成数据标注、关联,并提取中华民族文化元素、符号和标识,最终形成中华民族文化基因库。相关数据通过国家文化专网实现共享。[来源:T/CPRA301-20233.1.3]总体要求原则数据质量原则要求应满足:准确性,数据记录来源可靠,数据记录准确;守正性,数据应以事实为依据,符合社会主义核心价值观;完整性,数据记录完整,不遗留;及时性,数据出现变化应及时修正更新。数据范围中华民族文化基因库数据对象是:公共文化服务机构高清数字化采集形成的数据;从文化遗产中提取的中华民族文化元素、符号和标识数据。数据格式中华民族文化基因库数据格式主要包括图片、视频、文字、音频、三维模型,具体格式要求如下:图片格式:BITMAP、JPEG、TIFF、PDF、PNG、PSD、、SVG。视频格式:MPEG、、MOV、F4V。c)文字格式:TXT。、AIFF、MP3、MIDI、WMA、APE、FLAC。三维模型格式:OSGB、OBJ、FBX、STL、3DS。数据文件命名原则数据集(目录)命名原则数据集命名原则要求如下:数据集命名应按照存储格式进行分类,如图片、视频、音频、文字等;数据集命名宜采取多级目录结构;数据集命名不宜使用特殊字符,如@,#,$,%,^,&,*,¥,~,/等字符。单一数据命名原则单一数据命名原则要求如下:-{序号}.{文件格式}进行命名;单一数据命名中的文件数据名部分宜采用英文字母进行命名;单一数据命名中不宜出现@,#,$,%,^,&,*,¥,~,/等特殊字符。逻辑一致性要求逻辑一致性应满足以下要求:值域一致性:数据项的取值应在值域的界定范围内;格式一致性:数据存储应与数据集物理结构及规定格式保持一致。实时性要求可按需求定期或及时对数据进行更新,保持数据的实时性。元数据属性中应包含时间标识。数据质量要求核心元数据要求

表1图片元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串100其他标识符otherIdentifiers否字符串100服务类型serviceType自动获取字符串100贡献者contributors是字符串300著作权人copyrightOwner是字符串100载体carrier是受控词100登记者registrant自动获取字符串100登记日期registerDate自动获取日期100描述description是字符串400标签label否字符串100分辨率imageClarity自动获取字符串100大小metadataFileSize自动获取字符串100格式metadataFileFormat自动获取字符串100高度imageHeight自动获取字符串100长度imageWidth自动获取字符串100存储地址addressUrl自动获取字符串100预览文件存储地址previewAddressUrl自动获取字符串100文件MD5md5Val自动获取字符串100版权登记号copyrightRegNo否字符串100版权归属copyrightOwnerShip否字符串100版权开始时间copyrightDurationStart否日期100版权结束时间copyrightDurationEnd否日期1002三维模型元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串100其他标识符otherIdentifiers否字符串100描述description否字符串400服务类型serviceType自动获取字符串100贡献者contributors是字符串300著作权人copyrightOwner是字符串100载体carrier是受控词100登记者registrant自动获取字符串100登记日期registerDate自动获取日期100标签label否字符串100大小metadataFileSize自动获取字符串100格式metadataFileFormat自动获取字符串100存储地址addressUrl自动获取字符串10)预览文件存储地址previewAddressUrl自动获取字符串100三维类别typed是受控词100文件MD5md5Val自动获取字符串100版权登记号copyrightRegNo否字符串100版权归属copyrightOwnerShip否字符串100版权开始时间copyrightDurationStart否日期100版权结束时间copyrightDurationEnd否日期100表3视频元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串100其他标识符otherIdentifiers否字符串100服务类型serviceType自动获取字符串100贡献者contributors是字符串300著作权人copyrightOwner是字符串100载体carrier是受控词100登记者registrant自动获取字符串100登记日期registerDate白动获取日期100描述edition是字符串400标签escription否字符串100大小label自动获取字符串100格式metadataFileSize白动获取字符串100分辨率metadataFileFormat自动获取字符串100时长playTime自动获取字符串100存储地址addressUrl自动获取字符串100预览文件存储地址previewAddressUrl自动获取字符串100MD5md5Val白动获取字符串100版权登记号copyrightRegNo否字符串100版权归属copyrightOwnerShip否字符串100版权开始时间copyrightDurationStart否日期100版权结束时问copyrightDurationEnd否日期1004音频元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数标识符identifiers是字符串100其他标识符otherIdentifiers否字符串100服务类型serviceType自动获取字符串100贡献者contributors应字符串300著作权人copyrightOwner是字符串100载体carrier是字符串100登记者registrant自动获取字符串100登记日期registerDate自动获取日期100版本edition是受控词100描述escription是字符串400标签label否字符串100大小metadataFileSize自动获取字符串100采样频率metadataKHz否字符串50格式metadataFileFormat自动获取字符串100时长playTime自动获取字符串100存储地址addressUrl自动获取字符串100预览文件存储地址previewAddressUrl自动获取字符串100文件MD5md5Val自动获取字符串100版本登记号copyrightRegNo否字符串100版权归属copyrightOwnerShip否字符串100版权开始时间copyrightDurationStart否日期100版权结束时问copyrightDurationEnd否日期1005文本元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串100其他标识符otherIdentifiers否字符串100服务类型serviceType自动获取字符串100贡献者contributors是字符串300著作权人copyrightOwner是字符串100载体carrier是受控词100登记者registrant自动获取字符串100登记日期registerDate自动获取日期100描述description是字符串400标签label否字符串100大小metadataFileSize自动获取字符串100格式metadataFileFormat自动获取字符串100语种language是受控词100存储地址addressUrl自动获取字符串100预览文件存储地址previewAddressUrl自动获取字符串100文件MD5md5Val自动获取字符串100版权登记号copyrightRegNo否字符串100版权归属copyrightOwnerShip否字符串100版权开始时间copyrightDurationStart否日期100版权结束时间copyrightDurationEnd否日期100数据文件质量要求平面图像数据表6平面图像数据质量标准格式文件扩展名分辨率要求BITMAP(位图).bmp位深为24位或32位JPEG(联合图片专家组).jpgJPEG压缩编码>2.0位/像素TIFF(标记图像格式).tif,.tiff分辨率≥300dpiPDF(可移植文档格式).pdf分辨率≥300dpiPNG.png位深≥24位,分辨率≥300dpiPSD.psd分辨率≥300dpiRAW.raw分辨率≥300dpiSVG.svg分辨率≥72ppi三维模型数据表7三维模型数据质量标准文件格式文件扩展名精度要求OpenSceneGraghBinary.osgb厘米级精度OBJ.obj面片数量>100000个;包含贴图与材质FBX.fbx面片数量>100000个STL.stl面片数量>100000个3DS.3ds厘米级精度视频数据8视频数据质量标准文件格式文件扩展名分辨率要求MPEG格式.mp4,.mpg分辨率≥1080p,帧率≥60HzAVI格式.avi分辨率≥1080p,帧率≥60HzMOV格式.mov分辨率≥1080p,帧率≥60HzFLV/F4V格式.flv分辨率≥1080p,帧率≥60Hz音频数据9音频数据质量标准文件格式文件扩展名码率WAVE格式.wav采样率≥44.1khz,采样精度≥16bitAIFF格式.aiff采样率≥44.1khz,采样精度≥16bitMP3格式.mp3采样率≥44.1khz,采样精度≥16bitMIDI格式.mid采样率≥44.1k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论