版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.040CCSA14DB32/T4818.2—2024党史资料数据规范第2部分数据采集DataspecificationforCommunistPartyofChinahistorymaterials—Part2Dataacquisition2024-07-08发布 2024-08-08实施江苏省市场监督管理局 发 布中国标准出版社 出 版DB32/T4818.2—2024目 次前言 Ⅲ引言 Ⅳ范围 1规范性引用文件 1术语和定义 1缩略语 2总体要求 2组织与管理 3党史资料出库 4数字化前处理 5目录数据库建立 6资料扫描与采集 6资料处理 10数据挂接 14数字化成果验收与移交 14党史资料归还入库 16附录资料)党史资料数字化安全管理制度 18附录资料)党史资料数字化加工保密管理制度 19附录资料)党史资料出库申请单 20附录资料)党史资料数字化加工登记单 21附录资料)报刊数据标引生成文件XML样例 22附录资料) 党史资料数字化备份管理登记表 26ⅠDB32/T4818.2—2024前 言本文件按照GB/T1.1—202标准化工作导则 第1部分标准化文件的结构和起草规的规起草。本文件是DB32/T481《党史资料数据规范》的第2部分。DB32/T4818已经发布了以下部分:——第1部分:数据编目;——第2部分:数据采集;——第3部分:数据标引。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国共产党江苏省委员会党史工作办公室提出并归口。本文件起草单位:中国共产党江苏省委员会党史工作办公室、中电鸿信信息科技有限公司、江苏省质量和标准化研究院。ⅢDB32/T4818.2—2024引 言为贯彻落实党史学习教育领导小组办公室、国家档案局印发的《关于做好党史学习教育文件材料收为数字化文献,并通过网络信息实现资源共享,推动江苏省党史资料数字化建设高质量发展,特制定本文件。在党史资料数据建设工作中但由于标准文件篇幅限制且数据编目DB32/T4818分为以下三个部分。——第1部分:数据编目。旨在明确党史资料数据编目过程中的相关要求,包括编目项目的确定、编目主体分类、编目流程等,提高数据编目的科学性和准确性。——第2部分:数据采集。旨在明确党史资料数据采集过程中的相关要求,包含了从党史资料出库到党史资料归还入库的一系列采集流程和内容,提高数据采集的规范性和可操作性。——第3部分:数据标引。旨在明确党史资料数据标引过程中的相关要求,包括不同类型、不同主题党史资料数据的标引要求,提高数据标引的规范性和准确性。ⅣDB32/T4818.2—2024党史资料数据规范第2部分数据采集范围本文件确定了江苏省党史部门党史资料数据采集的总体要求库的相关内容。本文件适用于江苏省党史部门对各类党史资料的采集与管理。规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文包括所有的修改单适用于本文件。GB/T20530 文献档案资料数字化工作导则GB/T23286.1—2009 文献管理 长期保存的电子文档文件格式 第1部分PDF1.PDF/A⁃)的使用DA/T31—2017 纸质档案数字化规范DB32/T4818.1—2024 党史资料数据规范 第1部分数据编目ISO/TR130282010 信息和文献 记录数字化实施指Informationanddocumentation—Imple⁃mentationguidelinesfordigitizationofrecords)术语和定义GB/T20530DA/T31—2017GB/T23286.1—2009界定的以及下列术语和定义适用于本文件。党史资料数字化 digitizationofCommunistPartyofChinahistorymaterials对党史资料进行数字化加工,使其转化为存储在光盘、硬盘等载体上的数字资源,并按照党史资料的内在联系,建立起目录数据与数字资源关联关系的处理过程。失真度 distortiondegree对资料进行数字化转换后,数字图像与原件在色彩、几何等方面的偏离程度。国际标准书号 internationalstandardbooknumber国际上通用的出版物标识编码的标识符。注:采用ISBN编码系统的出版物有:图书、小册子、缩微出版物、盲文印刷品等。便携式文档格式 portabledocumentformat一种用独立于应用程序、硬件、操作系统的方式呈现文档的文件格式。1DB32/T4818.2—2024联合图像专家组 jointphotographicexpertsgroup一种常用的图像有损压缩格式,可设置压缩率,压缩率越高,文件越小,图像品质越低。Matroska多媒体容器 Matroskamultimediacontainer能够在一个文件中容纳无限数量的视频、音频、图片或字幕轨道的一种开放标准的自由的容器和文件格式,一种多媒体合并转化格式。注Matroska.mkv,对于单一的纯音频文件是.mka。缩略语下列缩略语适用于本文件。AVIAudioVideoInterleave)BOMByteOrderMar)COMCommercia)DPIDotsPerInc)HTTPSHypertextTransferProtocolSecur)ISBNInternationalStandardBookNumbe)JPEG/JPGJointPhotographicExpertsGrou)MXFMaterialeXchangeForma)NTSCNationalTelevisionStandardsCommitte)OFDOpenFixed⁃layoutDocumen)PALPhaseAlterationLin)PCMPulse⁃CodeModulatio)PDFPortableDocumentForma)SECAMSequentielCouleurAMemoir)SRTSubRipTex)TIFFTagImageFileForma)XMLEXtensibleMarkupLanguag)总体要求基本要求各相关单位应根据党史资料的珍贵程度素统筹规划、科学开展党史资料数字化。党史资料数字化的开展应符合GB/T20530的相关要求。应采取有效的管理和技术手段,确保党史资料数字化成果质量。党史资料数字化应遵循党史资料文件以PDF/A形式保存,文件的内容应以标记形式嵌入党史资料,保留文字的逻辑结构,以便搜索引擎进行全文检索。2DB32/T4818.2—2024基本环节党史资料数字化的基本环节主要包括:数字化前处理;目录数据库建立;资料扫描与信息采集;资料处理;数据挂接;数字化成果验收与移交等。党史资料数字化过程中据,元数据元素的确定应符合ISO/TR130282010的相关要求。安全管理加强党史资料数字化各环节的安全管理,建立党史资料数字化安全管理制度见附录实体和党史资料信息的安全应符合安全管理制度要求。保密要求加工涉密党史资料时,应按照党史资料数字化加工保密管理制度见附录开展工作。组织与管理机构及人员应建立党史资料数字化组织应配备具有相应能力的工作人员熟悉党史业务并具有较高的调查研究水平和良好的组织领导能力的管理人员;熟悉相关标准规范并能为党史资料数字化各环节提供技术支持的技术人员;掌握一定数字化基础知识并熟悉本职工作的操作人员等。应通过科学规范的管理制度,对工作人员进行规范化管理。应加强对外聘工作人员的审核,强化数字化的安全性。基础设施应配备专用加工场地加工场地的选择及温湿度等环境的控制应利于党史资料实体的保护。场地内应配备可覆盖全部加工涉密音视频党史和文献资料时,应由党史部门提供场地和电脑、存储设备等具备记忆功能的存储与处理设备,音视频读取和转换设备由制作单位自备。工作方案应在充分调研的基础上3DB32/T4818.2—2024党史资料数字化方案应包括数字化对象虑党史资料的珍贵程度宜对党史资料数字化方案进行专家论证党史资料数字化方案应经审批后严格执行。工作方案审批结果应与数字化过程中形成的其他文件一并保存。管理制度化成果质量。党史资料数字化管理制度应包含岗位管理体管理等方面的制度:岗位管理制度对各数字化岗位的工作目标和职责进行规范,形成明确的岗位业务流程规范、考核标准、奖惩办法等;人员管理制度对人员的安全责任进行规范;场地管理制度对人员出入和工作场地内基础设施理工作进行规范;设备管理制度对数字化各环节涉及的全部设备的管理工作进行规范;数据管理制度对数字化各环节所产生的数据的管理工作进行规范;党史资料实体管理制度对党史资料实体在数字化过程中的交接工作流程控制应制定党史资料数字化流程和各环节操作规范,对党史资料数字化全过程进行有效的控制,确保数字化成果质量。应加强对党史资料数字化的全流程安全管理。应建立完善的问题反馈机制,对党史资料数字化过程中后端环节发现前端环节中产生的问题进行及时反馈和修正。工作资料管理应根据情况制定符合实际要求的党史资料数字化工作资料,加强对数字化的管理。工作资料主要包括:党史资料数字化方案;党史资料数字化审批书;党史资料数字化流程单;数据验收单;项目验收报告;党史资料数字化成果移交清单等。应加强对党史资料数字化工作资料的管理等管理要求。党史资料出库党史资料保管部门应按照党史资料数字化方案确定的数字化对象开展党史资料调取4DB32/T4818.2—2024见附录,经相关责任人批准后,按照各地党史资料库房管理要求为数字化对象办理出库手续党史资料数字化过程中,应设置距离数字化加工场所较近的保管库以临时存放党史资料,对党史资料的领取与归还进行严格管理党史资料按介质可分为以下几类。的拥有ISBN的图书、各公开发表的报纸杂志等;开盘带等。数字化前处理确定扫描页宜将确定为数字化对象的党史资料全部扫描。如有不需要扫描的页面应加以标注。编制页号应对没有页号或页号不正确的党史资料重新编制页号。书写页号所使用的笔、墨等不应破坏党史资料原件或对党史资料长期保存造成影响。应将破损页面、缺页等特殊情况进行登记。目录数据准备按照目录数据库建立时制定的数据规则应对需要在目录数据库中进行标记的情况进行标记。拆除装订应以对党史资料的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护党史资料不受损害,并对排列顺序不准确的党史资料进行重排。特殊装订且拆除装订后需恢复的党史资料,在拆除装订物时应采用拍照等方式记录党史资料原技术修复纸质资料件进行相应处理5DB32/T4818.2—2024图像资料对残缺、褪色、偏色的进行补充和校色。如需提供原片,应补充相关资料。音视频资料对音视频党史和文献资料载体进行外观检查,如出现以下情况,应对音视频党史和文献资料载体进行适度清洁或修复等技术处理:资料载体物理形态出现卷曲资料载体出现可见性微斑影响音视频资料数字化的其他情况。检查资料载体是否存在已经损毁无法数字化的情况,对于认定为不能数字化的资料载体,送到省级党史部门做进一步检查认定。如遇恢复率较低的情况,应与提供单位协商解决。实物资料对实物资料进行拍照,标注实物的尺寸大小质地,体现实物资料的形状和内容。资料登记按照DB32/T4818.1—2024第67章的要求,制作并填写《党史资料数字化加工登记单见附录,详细记录资料相关信息。恢复装订扫描工作完成后,拆除装订物的资料应重新进行装订。恢复装订时,应注意保持资料的排列顺序不变,案卷左边和底边整齐,做到完整、准确、无遗漏。目录数据库建立应制定包括数据字段长度、字段类型、字段内容要求等的目录数据库数据规则,其制定应符合DB32/T4818.1—2024对党史资料编目的要求。应选择可转换为通用数据格式的数据库,数据库结构设计时应注意保持党史资料的内在联系。将党史资料数字化前工作中对党史资料目录进行修改目录数据。可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查,检查内容包括编目项目的完整性、编目内容的规范性和准确性等。发现不合格的数据应及时进行修改。资料扫描与采集基本要求党史资料扫描应根据党史资料原件实际情况等选择相应的扫描设备,进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、6DB32/T4818.2—2024个以上文件时,应分别扫描。若后期采用软件自动拼接的方式,重叠尺寸应不小于单幅图像对应原件尺寸的1/3。利用专业的读取设备采集音视频信息术处理。扫描设备宜选择对党史资料实体破坏性小的扫描设备进行数字化,保护党史资料实体。应采用平板扫描仪、专业不拆卷非接触光源扫描仪及高分辨率的拍摄机进行扫描,不应采用滚筒式扫描仪。超出所使用扫描仪扫描尺寸的党史资料可采用更大幅面扫描仪进行扫描,也可采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。应遵循相关设备的使用规律扫描色彩模式宜全部采用彩色模式进行扫描,最大限度保留党史资料原件信息。页面中有红头、印章或插有照片、彩色插图、多色彩文字等的党史资料,应采用彩色模式进行扫描。页面为黑白两色,但字迹清晰度差或带有插图的党史资料,可采用灰度模式进行扫描。扫描分辨率应综合考虑扫描后图像的清晰度、完整度和数字图像后期利用方式等因素进行扫描分辨率的选择。扫描分辨率不应小于300dpi600dpi。如有COM进行COM输出的党史资料,扫描分辨率不应小于300dpi;进行高精度仿真复制的党史资料600dpi;进行印刷出版的党史资料辨率。存储格式党史资料数字图像长期保存格式为JPG格式保存任一方向上的尺寸误差不应超过3 水平斜角度不应超过1°。图像压缩率的选择可根据实际应用的需求而定。党史资料数字图像利用时将图像转换为OFDPDF等其他格式。若转化则所有JPG图片应合并转化成PDF文件。同一批党史资料应采用相同的存储格式。扫描图像命名应在资料编号为主文件名的基础上对数字图像命名。应将数字图像存储为单页文件,并按主文件名与图像流水号的组合对图像命名。例如:命名为×××××××××××.jpg。数字图像确需存储为多页文件时,可采用该党史资料的资料编号+4位序号对图像命名。示例197875118960870001.jpg97875118960870002.jpg97875118960870003.jpg示例2320000_01_02_01_03_00000010001.jpg320000_01_02_01_03_00000010002.jpg7DB32/T4818.2—2024纸质资料扫描常规纸质资料扫描按照10.2.2要求的扫描设备和扫描方式进行扫描,彩色模式下扫描精度不应低于300dpi照10.5要求进行存储,主文件名采取8位格式,文件名按约定的命名方法,命名为×××××××××.jpg。所有JPG图片合并转化成PDF文件。应在未改变原扫描图像的色彩应保证图像信息与原资料图像内容完全一致写注释和印鉴等。应清除干净扫描留下的所有黑线、指印或阴影,图像剪裁应保留到该页文献的外边缘不包括书本叠页部分。扫描图像整体倾斜不应超过1°;不应出现图像一部分倾斜或扭曲而影响阅读的情况。图片页面存在部分倾斜的,以页面中的文字纠正为准。方向不正确的图像应进行旋转还原,以符合阅读习惯。纸张质量造成的页面上零星的污点,若在页面视图下看不清楚,或该污点嵌在文本行中无法清特殊纸质资料扫描高进行拍照扫描,后将扫描文件组织成PDF文件。图像资料扫描传统冲洗的图像资料扫描精度不应低于600dpi2寸以下的照片用600~1200dpi以上精度扫描,扫描后应对图片进行题PDF文件。图像格式可采用JPEG,应保证扫描精度。幻灯片可通过幻灯机等设备进行数字化,在原有图像精度下转换为JPEG格式的文件,而后以专题形式集结成册,附上标题和说明,转换为PDF文件。数字化的图像数码设备拍摄的,应在原有图像精度下转换为JPEG格式的文件;数字化矢量图像文件,应在600dpi下进行栅格化,保存为JPEG文件,而后以专题形式集结成册,附上标题和说明,转换为PDF文件,不应改变内嵌图像的格式与精度,图像容量不受限制。图像存储所有资料形成的图像文件均应采用JPG格式存储。转存一套双层PDF格式。图像文件以文件夹命名,文件夹命名应与文件级目录中的ISBN命名相一致,文件夹内单页图像以8位流水号命名。8DB32/T4818.2—2024到100 。应科学建立党史资料数字图像的存储路径,确保数据挂接的准确性。图像检查数字化单位应在扫描完成后立即进行质检,检查各级别图像数据的质量。数据检查的内容和要求如下。图像文件各种格式放大到1马赛克等或图像内容不完整等现象。若不符合图像质量要求应进行图像校正或重新扫描。发现文件漏扫时,应及时补扫并正确插入图像。拼接图像接缝处无错位是否符合扫描规格要求和技术参数。所有文件保存位置正确,可有效打开和显示。资料一致。等文档是否齐全。报纸资料扫描扫描版面图像,按400dpi精度对报纸整版扫描,确保版面文件的完整性。保留400dpi精度的原始扫描版面图像文件,修图后版面图不低于400dpiPDF版面数据不低于400dpi。图片数据库资料格式采用JPG压缩格式。黑白版面及图片采用灰度技术片采用彩色技术。纠正扫描图像的倾斜度,纠正后倾斜度不超过2°。全部图片均应裁切,标引后以原扫描大小原色彩交付。音视频资料采集模拟信号的音视频资料载体信息采集后字幕文件,实现文字搜索定位。应按照11.3音视频资料处理中的技术参数要求进行数字化转换形成数字副本,并建立目录数据库。数字信号的音视频资料拷贝采集后,按原格式保留一份资料后进行降噪、建立字幕文件等数字化处理。有多件录音录像电子文件反映相同场景或主题内容的原始的录音录像文件素材和后期编辑制作的录音录像文件都应收集保存,并对档案实体进行系实物资料扫描对实物资料进行数码拍照。一个角度无法反映实物形状的,应多个角度进行拍照。印章等实物,应将印章内容体现出来。拍照后的实物资料数字化制作过程同图片资料类处理方法。9DB32/T4818.2—2024珍贵且尺寸不规则的党史资料大小。扫描后图像处理图像拼接对分幅扫描形成的多幅数字图像,应进行拼接处理,合并为一个完整的图像,保证党史资料数字图像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅图像无明显拼接痕迹。旋转及纠偏对不符合阅读方向的数字图像应进行旋转还原。对出现偏斜的图像应进行纠偏处理基本不感觉偏斜为准。裁边如需对数字图像进行裁边处理,应在距页边最外延至少2mm~3mm处裁剪图像。去污去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现党史资料原貌的原则,处理过程中不应去除党史资料页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。图像质量检查应进行图像质量检查,发现质量问题及时进行整改:数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描;数字图像的排列顺序与党史资料原件不一致时,应及时进行调整;重新进行图像处理。资料处理除报纸外的文字及图像资料处理OCR识别依据数字化加工登记单OCR的资料进行OCR逐页识别校对,差错率应保持在千分之一以内。PDF文件应根据图像尺寸间至最小。手写文档等不适宜OCR识别的资料,应将每份资料的标题、目录等通过人工干预方式进行识别标注。PDF合并转化成册装订的资料,一册资料合并转化为一个多页的PDF文件;按卷归档的资料由多个成册资料按照顺序进行编号组成。PDF文件的命名即该资料的加工编号。目录导航编辑成册装订的资料,应将输出后的双层PDF进行目录标签提取,提取级别上限为三级。提取过程中应10DB32/T4818.2—2024按照原书页面顺序进行提取,不应出现章节丢失或级别划分错误等情况,若书本目录缺失,则由人工编制两级目录进行编目。报纸资料处理文字处理应按照以下要求进行文字处理。全文数字化部分的文字处理差错率应在万分之一以下。标引文字差错率应在万分之一以下。转版文章应连成一篇文章特定文章的差错标准如下:政治人物——历届党和国家领导人名单,历届省/市委和省/市政府领导人名单,全国人大、政协领导人名单,省/国家及本省领导人的讲话含公告版面文件制作将纸质报纸制作生成双层PDF格式文件版面数据完整性应达到100 。文件夹命名及存放文件夹命名应遵循以下要求。以报纸为单位组织成文件的第一层目录jsrb。)在报名简称的目录下,以年月日为组织单位形成第二层目录,目录名为YYYY⁃MM⁃DDMM和DD表示22022年12月122022⁃12⁃12。单位数的日期表示为0+2022年9月92022⁃09⁃09。在年月日形成的目录下,以各版版名形成第三层目录:0101;若为字母加数字命名的版面A02A02;010203版;A2A3A02;01;A01B01。文件夹存放应遵循以下要求:除分类规则文件外均存放在年月日表示的第四层目录下XMLPDF版JPG版面文件,新闻图文件;表格、公式可作图片处理;去掉版面上笔记、公章等痕迹。有排版生成的报刊电子数据,宜使用对应的标引工具进行反解。没有排版报刊数据或不使用推荐标引系统的E生成XML文件。11DB32/T4818.2—2024交付成果标引好的XMLPDFJPGJPG插图文件,彩色版面的色彩模式为RGB色彩模式为Grayscale。11.3 音视频资料处理基本要求采集完成后的原始音视频文件在提供利用前,可针对原始音视频文件的拷贝文件进行文件转用于长期保存的音视频文件应是原始音视频文件,而非处理后的文件。信息处理音频资料数字化的技术参数应满足以下要求。a)采样率:不低于44.1kHz。对于珍贵或有特别用途的音频资料,采样率不低于96kHz。b)量化位数:24位。声道:以原始声道数记录。文件格式:模拟信号原始档案资料采用WAVE格式,数字资料按原格式数据采集与保存。数字化处理:所有采集到的资料采用MPEG⁃4AAC编码处理,应采用可变码率压缩,平均码率为160kbps。数字化成果资料用Matroska多媒体容器合并转化音频文件和字幕文件,音频文件是MKA格式,字幕文件是SRT格式,背景可配上相关人物相片或相关图片。对于配套的字幕数据,字符编码采用UTF⁃8BOM。视频资料数字化的技术参数应满足以下要求。H.264标准编码。特别珍贵和特殊用途的录像资料,可采用无压缩的方式。帧率:与原录像资料相同。画面宽高比:与原录像资料相同。分辨率:采集为标清视频时为720×57原资料为PAL制式和SECAM制式或720×48原资料为NTSC;采集为高清视频时分辨率不低于1920×1080。色彩采样率:采集为标清视频时不低于0,采集为高清视频时不低于2。视频量化位数:不低于8bit。对于特别珍贵的资料应不低于10bit。视频比特率:采集为标清视频时不低于8Mbit/s,采集为高清视频时不低于16Mbit/s。)音频编码格式:PCM。48kHz。音频量化位数:不低于16bit。对于特别珍贵的资料应不低于24bit。声道:以原始声道数记录。AVI或MXF格式。数字化成果:以Matroska格式合并转化,视频文件的扩展名为.mkv;字幕文件采用SRT格式,字符编码采用UTF⁃8BOM。11.4 资料存储存储要求文字及图像资料所有经过识别和标注的资料内容,文字差错率应控制在千分之一以内。元数据编目差错率在12DB32/T4818.2—2024千分之一以内。双层PDFPDF文件的图像层和文字层的文字对位准确。整本PDF应制作书签。书签是电子书的目录,内容和纸质书的目录一致。书签的功能是用户点击书签的某一章节,电子书会自动显示为相应页。打开PDF文件时,自动显示书签,书签只展开到第一级目录。成册资料的PDF目录导航文字内容差错率千分之一以内,链接要求100准确。打开一本电子文献阅览并对文字放大时,应保证在放大到200的时候,字迹清晰,笔画连音视频资料音视频数据最终都应以Matroska格式合并转化为文件形式3D内容使用左右格式编码在其中合并转化相关的章节信息与图片文件,图片文件精度应不低于300dpiJPEG格式编码。Matroska容器的标签中循Matroska可扩展的开放标准音视频容器中的定义。存储格式所有文字及图像数字化资料以PDF/A⁃1a格式存储;视频数字化资料以MKV格式存储;音频数字化资料以MKA格式存储;配套字幕数据以SRT格式存储。文件命名规则数字化资料命名数字化资料按照命名规则进行命名6位当地行政区划代码+2位资料大类区分码+2位出版内外区分码+2位资料时期区分码+2位资料细类区分码+7位顺序区分码。具体见图1。图1 数字化资料命名规则行政区划代码、大类区分码等编制说明见表1。表1 数字化资料命名说明序号名称长度说明1行政区划代码6位参考国家行政区划代码2大类区分码2位0102030405069913DB32/T4818.2—2024表1 数字化资料命名说明(续)序号名称长度说明3出版内外区分码2位0102994资料时期区分码2位01:新民主主义革命时期02:社会主义革命和建设时期03:改革开放和社会主义现代化建设新时期04:中国特色社会主义新时代05995资料细类区分码2位0102030405060708996顺序区分码7位按顺序编码“320000_01_02_01_03_0000001时间为新民主主义革命时期0000001实物资料标签命名实物资料应加贴标签。标签的命名和数字化资料命名一致。数据挂接数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为合格后,应借助相关软逐条对挂接结果进行检查,发现错误及时进行纠正,编目条目与对应图像文件挂接正确率应达到100 。检查内容包括:a)目录数据与党史资料数字图像对应的准确性;b)已挂接数字图像与实际扫描数量的一致性;c)数字图像是否能正常打开等。数字化成果验收与移交验收方式党史部门应成立专门的验收组,采用系统自动检验与人工检验相结合的方式对党史资料数字化成果14DB32/T4818.2—2024进行验收检验。验收内容党史资料数字化成果包括党史资料目录数据载体等。应对目录数据进行验收,主要包括数据库中各条目的内容、格式等的准确程度,必填项是否填写等。应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。应对数字图像进行验收序的准确性、图像质量等。应对音视频文件进行验收应对数据挂接进行验收,主要包括目录数据与其对应的数字图像的挂接的准确性等。应对工作文件进行验收应对存储载体进行验收,主要包括载体的可用性、有无病毒等。验收指标总体要求能采用计算机自动检验的项目应采用计算机自动检验的方式进行100检验,检验合格率应为100。不能用计算机自动检验的项目,可根据情况以件或卷为单位采用抽检的方式进行人工检验,抽检比率不应低于5,对于数据库条目与数字图像内容对应的准确性,抽检合格率应为100,其他内容的抽检合格率应不低于95。图像扫描和目录建库数据验收经数字化单位自检符合要求后,在数字化单位无偿提供的客户质检管理终端上,每批以抽检50的方式进行图像扫描和目录建库数据的验收,其中:党史资料号、文件夹命名、扫描无漏页、扫描图像完整性的准确率应达到100。如发现一条错误应退回重检,且检查验收方不提供错误数据。其他数据项允许差错率控制在1以内。文件完整性检查对PDF文件的清晰度、倾斜度、失真度等进行检查。如发现不符合质量要求的文件,应重新进行扫描处理。由于操作不当导致扫描文件不完整或无法清晰识别时,应重新扫描。检查验收方不提供错误信息。资料数据挂接验收数字化单位自检符合规定要求后,每批以抽检50的方式进行数据验收。数据挂接准确率应达到100 资料实体验收资料实体验收应逐卷清点98以上予以验收通过。15DB32/T4818.2—2024验收结论党史资料数字化成果质量检验达到13.213.3“通过。验收未通过应视情况进行返工或修改,后重新进行验收。验收完成后应经验收组成员签字。验“通过的结论,应经相关项目负责人和质检人员审查签字,并提交党史部门审核确认后方有效。移交数字化成果资料验收合格后,制作单位应按照应标党史资料数字化方案完善各种文件资料,连同省级党史部门将统一对各市采集处理完成的原始资料和数字化资料进行专业存储和开放应用。党史资料归还入库原始资料归还入库资料装订党史资料数字化完成后,拆除过装订物的党史资料如需装订,应保持党史资料原貌,做到安全、准确、无遗漏。资料归还入库对党史资料进行处理和清点,并履行党史资料入库手续。数字化资料备份备份范围经验收合格的完整数据。备份方式每完成一个类别的数据验收后,保存未经压缩的单页TIFF格式硬盘两套,另转存两套双层PDF格式硬盘。存储数据的硬盘由数字化单位无偿提供。为保证数据安全性,备份可选择多样化的载体,可采用在线、离线等多种方式相结合进行多套备份,并注意异地保存。备份数据检验检验内容主要包括备份数据能否打开对移交的硬盘进行质量检查,检查硬盘外观及硬盘质量,目录完整性、图像是否可以打开等情数据重新进行备份。备份标签离线备份,如移动硬盘、光盘、磁带存储等,应做好介质上的标签,以便查找和管理。16DB32/T4818.2—2024备份登记应进行备份登记,填写《党史资料数字化备份管理登记表见附录17DB32/T4818.2—2024附 录 A资料性)党史资料数字化安全管理制度工作区域应安装无死角监控探头全天监控。工作人员应佩戴工牌,非工作人员不应进入作业区。工作人员应签订保密协议。在作业区不应携带及使用电子设备U盘等。工作电脑只提供内网,不应开通因特网权限。不应携带任何火源、食品、饮料等进入加工场所。在省市县之间通过网络传输数据时HTTPS协议。传输前应根据省级党史部门规定的统一加解密方法和密钥,对内容进行加密。通过物理介质传递电子资料时,也应对内容进行加密。数字化竣工移交后应格式化本地存储。18DB32/T4818.2—2024附 录 B资料性)党史资料数字化加工保密管理制度党史资料管理人员和数字化加工单位均应树立保密观念,共同保守党史资料机密。对各类党史资料均应按合同规定的范围进行出入库、扫描,并严格履行手续。不应对不在扫描范围应严格管理扫描的党史资料或复制。凡涉及党史机密的人员一律不准许在家庭、子女及无关人员面前谈论有关党史机密内容,不应在普通电话、明码电报和私人通信中暴露党史机密。数字化加工单位对所扫描党史资料应妥善保管访友、出入公共场所等。对目录有错误、失去保存价值的党史资料文件应及时沟通处理,不应以废纸出售。发生失密、泄密和资料被盗事件时,应立即报告主管领导。当事者应写出书面报告。对违反保密规对电子化扫描的党史资料在扫描后宜按原顺序入库;对需要作出调整的党史资料,应及时向领导报告,协商出对问题资料的处理办法。不应私自处理解决。在党史资料加工场所不应携带手机U盘、相机等可存储设备。在加工期间所需要的电子设备、存储装置不应携带出加工场所。出入库的党史资料应做好出入库登记,并且做好每日扫描进度的登记。党史资料加工场所工作人员上下班及中午休息时间应严格签到。在党史资料数字化加工工作结束后交党史部门接收,不准许带出。在加工期间产生的废弃的资料应统一交由党史部门处理。19DB32/T4818.2—2024党史资料出库申请单见表C.1。
附 录 C资料性)党史资料出库申请单表C.1 党史资料出库申请单交接事由注意事项序号资料名称资料内容数量备注1234审批人日期移交人日期接收人日期20附 录 D资料性)党史资料数字化加工登记单表附 录 D资料性)党史资料数字化加工登记单表D.1 党史资料数字化加工登记单下载权限*禁止“*字段为必填字段。是否上架*是所属地区多个编号用空格)32103212保密等级*项目数据内容简介*XXXXXX出版单位*新华日报出版时间*2022⁃08⁃02作者*张三相关事件*(多个用空格隔开)七七事变卢沟桥事变相关人物多个用空格隔开邓小平周恩来文献标签*多个用空格隔开)南京无锡上海文件分类*(多个用空格隔开)10010002000200021001000200020003isbn编号*XXXXXX文件名称样例数据党史资料数字化加工登记单见表D.1。*21党史资料数字化加工登记单见表D.1。*DB32/T4818.2—2024附 录 E资料性)报刊数据标引生成文件XML样例以下为报刊数据标引生成文件XML样例。<?xmlversion="1.0"encoding="utf⁃8"?><版面><大样><日期>2022⁃04⁃25</日期><版次>01</版次><版名>要闻</版名><组版人/><报名>人民日报</报名><版面真名/><文件名>rb01RBXW1C425.fit</文件名><签发部门/><签发人/><版面编辑>鞠鹏</版面编辑><版面高>14605</版面高><版面宽>9384</版面宽><文本篇数>8</文本篇数><图片篇数>3</图片篇数><PDF><文件名>rb01RBXW1C425.pdf</文件名></PDF><版面图><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><宽>350</宽><真图><文件名>rb01RBXW1C425.jpg</文件名><高>5905</高><宽>3795</宽></真图><简图><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><宽>350</宽></简图>22<图标><文件名>rb01RBXW1C425i.jpg</文件名><高>100</高><宽>64</宽></图标></版面图></大样><小样><发布类型>发布类型</发布类型><发布>1</发布><信息ID>人民日报012021⁃04⁃2500033</信息ID><来源/><引题><![CDATA[]]></引题><标题><![CDATA[国家主席发表二〇二一年新年贺词]]></标题><副题><![CDATA[]]></副题><摘要><![CDATA[]]></摘要><作者>鞠鹏</作者><通讯员/><栏目/><图片说明/><下转/><上接/><序号>1</序号><分类/><体裁/><转载/><文件名>zll7465.txt</文件名><字数>1244</字数><版面图映射><顶点个数>10</顶点个数><顶点>0.01 11.81 </顶点><顶点>70.59 11.81 </顶点><顶点>70.59 38.58 </顶点><顶点>0.01 38.58 </顶点><顶点>0.01 11.81 </顶点><顶点>-0.01 11.81 </顶点><顶点>0.01 11.81 </顶点><顶点>0.01 24.41 </顶点><顶点>-0.01 24.41 </顶点><顶点>-0.01 11.81 </顶点></版面图映射>
DB32/T4818.2—202423DB32/T4818.2—2024<内容><![CDATA[ ■记
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 道路照明检修工程施工方案
- 养殖场汽车消毒施工方案
- 物料起重机施工方案
- 苏州无空气喷涂施工方案
- 2025年塑料铜芯线项目投资可行性研究分析报告
- 2023-2029年中国K12在线英语教育行业发展监测及投资前景展望报告
- 2025年电子金属制品项目可行性研究报告
- 家居用品运输简易合同模板
- 城市垃圾清运服务合同
- 湖北艺术职业学院《Matab及其在地学中的应用》2023-2024学年第一学期期末试卷
- 春节文化常识单选题100道及答案
- 24年追觅在线测评28题及答案
- TGDNAS 043-2024 成人静脉中等长度导管置管技术
- 《陆上风电场工程概算定额》NBT 31010-2019
- FZ∕T 63006-2019 松紧带
- 罐区自动化系统总体方案(31页)ppt课件
- BIQS评分表模板
- 工程建设项目内外关系协调措施
- 招投标法考试试题及答案
- 皮带输送机工程施工电气安装措施要点
- 药房(冰柜)温湿度表
评论
0/150
提交评论