T-CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第1页
T-CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第2页
T-CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第3页
T-CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第4页
T-CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.01CCSL70T/CPRA2101.2—2024中华民族文化基因库技术要求第2部分:基因数据质量要求TechnicalrequirementsofgenedatabaseofChineseculturePart2:Genedataqualityrequirements中国公共关系协会文化大数据产业委员会发布I 2规范性引用文件 3术语和定义 3.1中华民族文化基因库 4总体要求 4.1原则 14.2数据范围 14.3数据格式 24.4数据文件命名原则 24.5逻辑一致性要求 24.6实时性要求 25数据质量要求 5.1核心元数据要求 25.2数据文件质量要求 65.3数据质量保真要求 7本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国公共关系协会文化大数据产业委员会提出并归口。本文件起草单位:北京邮电大学、北京玖扬科技有限公司、伏羲云(北京)文化科技有限公本文件主要起草人:徐坤、高凯、赵海英、薛晓鹏、尹晖、侯小刚、周月、徐鹏举、李伟、崔义娜、陈磊、刘志军、李媛媛。1中华民族文化基因库技术要求第2部分:数据质量要求本文件规定了国家文化大数据体系中中华民族文化基因库数据的质量要求,包括总体要求和数据质量要求等。本文件适用于国家文化大数据体系中中华民族文化基因库设计、研发等。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则T/CPRA1-2021国家文化大数据标准体系T/CPRA300-2023文化数字内容分类与代码T/CPRA301-2023文化资源数据分类与代码3术语和定义下列术语和定义适用于本文件。3.1中华民族文化基因库genedatabaseofChineseculture中华民族文化基因库的数据主要来自革命文物大数据库和博物馆大数据体系,通常经过高精度数据采集,导入国家文化大数据体系底层关联集成系统,完成数据标注、关联,并提取中华民族文化元素、符号和标识,最终形成中华民族文化基因库。相关数据通过国家文化专网实现共享。[来源:T/CPRA301-2023定义3.1.3]4总体要求4.1原则数据质量原则要求应满足:a)准确性,数据记录来源可靠,数据记录准确;b)守正性,数据应以事实为依据,符合社会主义核心价值观;c)完整性,数据记录完整,不遗留;d)及时性,数据出现变化应及时修正更新。4.2数据范围中华民族文化基因库数据对象是:2a)公共文化服务机构高清数字化采集形成的数据;b)从文化遗产中提取的中华民族文化元素、符号和标识数据。4.3数据格式中华民族文化基因库数据格式主要包括图片、视频、文字、音频、三维模型,具体格式要求如下:a)图片格式:BITMAP、JPEG、TIFF、PDF、PNG、PSD、RAW、SVG。b)视频格式:MPEG、AVI、MOV、FLV/F4V。c)文字格式:TXT。d)音频格式:WAVE、AIFF、MP3、MIDI、WMA、APE、FLAC。e)三维模型格式:OSGB、OBJ、FBX、STL、3DS。4.4数据文件命名原则4.4.1数据集(目录)命名原则数据集命名原则要求如下:a)数据集命名应按照存储格式进行分类,如图片、视频、音频、文字等;b)数据集命名宜采取多级目录结构;c)数据集命名不宜使用特殊字符,如@,#,$,%,^,&,*,¥,~,/等字符。4.4.2单一数据命名原则单一数据命名原则要求如下:a)单一数据文件命名规则宜按照文件数据名-{序号}.{文件格式}进行命名;b)单一数据命名中的文件数据名部分宜采用英文字母进行命名;c)单一数据命名中不宜出现@,#,$,%,^,&,*,¥,~,/等特殊字符。4.5逻辑一致性要求逻辑一致性应满足以下要求:a)概念一致性:文化基因分类与代码、数据结构、属性、文化基因间关系在同一尺度上应保持一致,在不同尺度上应符合统一的体系规则;b)值域一致性:数据项的取值应在值域的界定范围内;c)格式一致性:数据存储应与数据集物理结构及规定格式保持一致。4.6实时性要求可按需求定期或及时对数据进行更新,保持数据的实时性。元数据属性中应包含时间标识。5数据质量要求5.1核心元数据要求表1图片元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串3其他标识符otherIdentifiers否字符串服务类型serviceType字符串贡献者contributors是字符串300著作权人copyrightOwner是字符串载体carrier是受控词登记者registrant字符串登记日期registerDate描述description是字符串400标签label否字符串分辨率imageClarity字符串大小metadataFileSize字符串格式metadataFileFormat字符串高度imageHeight字符串长度imageWidth字符串存储地址addressUrl字符串预览文件存储地址previewAddressUrl字符串文件MD5md5Val字符串版权登记号copyrightRegNo否字符串版权归属copyrightOwnerShip否字符串版权开始时间copyrightDurationStart否版权结束时间copyrightDurationEnd否表2三维模型元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串其他标识符otherIdentifiers否字符串描述description否字符串400服务类型serviceType字符串贡献者contributors是字符串300著作权人copyrightOwner是字符串载体carrier是受控词登记者registrant字符串登记日期registerDate标签label否字符串大小metadataFileSize字符串4格式metadataFileFormat字符串存储地址addressUrl字符串预览文件存储地址previewAddressUrl字符串三维类别typed是受控词文件MD5md5Val字符串版权登记号copyrightRegNo否字符串版权归属copyrightOwnerShip否字符串版权开始时间copyrightDurationStart否版权结束时间copyrightDurationEnd否表3视频元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串其他标识符otherIdentifiers否字符串服务类型serviceType字符串贡献者contributors是字符串300著作权人copyrightOwner是字符串载体carrier是受控词登记者registrant字符串登记日期registerDate描述edition是字符串400标签escription否字符串大小label字符串格式metadataFileSize字符串分辨率metadataFileFormat字符串playTime字符串存储地址addressUrl字符串预览文件存储地址previewAddressUrl字符串MD5md5Val字符串版权登记号copyrightRegNo否字符串版权归属copyrightOwnerShip否字符串版权开始时间copyrightDurationStart否版权结束时问copyrightDurationEnd否5表4音频元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数标识符identifiers是字符串其他标识符otherIdentifiers否字符串服务类型serviceType字符串贡献者contributors应字符串300著作权人copyrightOwner是字符串载体carrier是字符串登记者registrant字符串登记日期registerDate版本edition是受控词描述escription是字符串400标签label否字符串大小metadataFileSize字符串采样频率metadataKHz否字符串50格式metadataFileFormat字符串playTime字符串存储地址addressUrl字符串预览文件存储地址previewAddressUrl字符串文件MD5md5Val字符串版本登记号copyrightRegNo否字符串版权归属copyrightOwnerShip否字符串版权开始时间copyrightDurationStart否版权结束时问copyrightDurationEnd否表5文本元数据元数据字段CODE必填类型长度名称titleName是字符串300文化数据标识符identifiers是字符串其他标识符otherIdentifiers否字符串服务类型serviceType字符串贡献者contributors是字符串300著作权人copyrightOwner是字符串载体carrier是受控词登记者registrant字符串登记日期registerDate6描述description是字符串400标签label否字符串大小metadataFileSize字符串格式metadataFileFormat字符串语种language是受控词存储地址addressUrl字符串预览文件存储地址previewAddressUrl字符串文件MD5md5Val字符串版权登记号copyrightRegNo否字符串版权归属copyrightOwnerShip否字符串版权开始时间copyrightDurationStart否版权结束时间copyrightDurationEnd否5.2数据文件质量要求5.2.1平面图像数据表6平面图像数据质量标准格式文件扩展名分辨率要求BITMAP(位图).bmp位深为24位或32位JPEG(联合图片专家组).jpgJPEG压缩编码>2.0位/像素TIFF(标记图像格式).tif,.tiff分辨率≥300dpiPDF(可移植文档格式).pdf分辨率≥300dpiPNG.png位深≥24位,分辨率≥300dpiPSD.psd分辨率≥300dpiRAW.raw分辨率≥300dpiSVG分辨率≥72ppi5.2.2三维模型数据表7三维模型数据质量标准文件格式文件扩展名精度要求OpenSceneGraghBinary.osgb厘米级精度OBJ.obj面片数量>100000个;包含贴图与材质FBX.fbx面片数量>100000个STL面片数量>100000个3DS.3ds厘米级精度75.2.3视频数据表8视频数据质量标准文件格式文件扩展名分辨率要求MPEG格式.mp4,.mpg分辨率≥1080p,帧率≥60Hz分辨率≥1080p,帧率≥60HzMOV格式.mov分辨率≥1080p,帧率≥60HzFLV/F4V格式分辨率≥1080p,帧率≥60Hz5.2.4音频数据表9音频数据质量标准文件格式文件扩展名码率.wav采样率≥44.1khz,采样精度≥16bitAIFF格式.aiff采样率≥44.1khz,采样精度≥16bitMP3格式.mp3采样率≥44.1khz,采样精度≥16bitMIDI格式.mid采样率≥44.1khz,采样精度≥16bitWMA格式.wma采样率≥44.1khz,采样精度≥16bitAPE格式.ape采样率≥44.1khz,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论