




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节总体实施原则与流程 2一、实施原则 2二、总体工作流程 4第二节数字化加工流程及主要技术方案 6一、入库提卷、拆卷 6二、标引著录 7三、档案扫描 7四、图像处理 10五、全文识别(OCR)及生成双层FDF、版式还原及格式转换 11六、总质检 12七、批量挂接 13八、还卷及数据备份提交 14第三节历史档案扫描的工作流程方案 15一、分组实施方案 15二、总体流程 16三、实施流程 18(一)档案交接 18(二)档案整理 21(三)扫描加工 24(四)图像处理 29(五)异常处理 32(六)质量抽检 36(七)装订还原 37四、主要环节实施标准 38第四节图像处理方案 40一、图像标准化处理 40二、特殊图像的处理 42第五节特殊纸张处理方案 43第六节图像数据挂接方案 45第七节档案编码方案 45第八节文件存储方案 46第九节数据备份方案 46第一节总体实施原则与流程XX单位本次扫描加工是馆藏约XX千卷档案,为了加快档案信息化发展,促进馆藏档案信息的广泛利用,我司将从技术工艺、过程监管、质量控制、进度保障、安全生产和信息保密等多方面进行规划和资源配置,全方位保障各项实施工作的良性发展以及整体项目的顺利完成。一、实施原则我方的总体实施原则如下:1.详细规划、细致安排,将每项工作任务、每个工作环节都想到、做好,无遗漏、无差错;2.设立完善的项目管理体系和保障体系,为应对多方面已知、未知的情况做好准备工作;3.加强人员审查和员工管理工作,制订并执行高效的安全管理制度和保密制度,杜绝各类问题事故的发生,确保项目的安全实施;4.对纸质档案数字化的各个环节建立起完整、规范的记录。并使用加工流水表单详细记录加工过程及相关问题。5.增加管理人员的投入,增强现场的监管力度,明确监管措施落实到位;6.集中优势资源,从资金、技术、人员、工艺、和管理等多方面保障项目的顺利实施;7.全力保障品质检查,以多层次、多级别的检查管理,确保提交给用户的产品全部符合质量要求;8.全力保障信息安全和保护档案实体安全。我公司拥有管理精细化、加工流程化、质量标准化的专业档案数字化团队,可提供对各类文书、图纸、资料、业务档案等纸质、影像档案进行整理分类和档案数字化加工服务,通过建立图文数据库,对数据进行规范性校验,实现纸质档案与电子档案一一对应关系,最终将成果档案数据与业务系统挂接,形成一个有序结构的档案数据库,及时提供利用,实现信息共享,为未来人工智能及大数据应用打下坚实基础。(根据项目实际情况修改)二、总体工作流程(一)档案分类整理:按照档案情况,年度、类别、长短期等进行分类整理,将部门编制不统一的进行统一分类,以便数字化后方便查找与管理。(二)档案交接:分类整理后的档案按年度、类别提出,提卷时数字化加工方的提卷人员按照要求,编写档案的页号和需要扫描录入的文件页号后及抽取不需扫描的页面,并按实际页数填写详细的档案交接清单,并由双方主管人员签字。(三)标引著录:标引著录是为了方便查阅与管理,对文字录入的准确性要求较高,实际项目中将会按照统一的标准制作相应的《文字录入工作说明书》,供录入员和校对人员参考。(四)档案拆分:档案拆分前要对档案进行统一的编号,编制总页号后,要从中选中需要扫描的页面。再一次编制所需扫描的页号,两个页号需要用铅笔的颜色或位置区分,以确保档案还原时能够清楚区别和核实页数,档案拆分时要严格按照要求对不需扫描的页面进行标注。(五)档案的扫描:原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。扫描使用金档科技自主研发的图像扫描处理软件,扫描人员可根据原稿质量,对系统进行定义,如自动倾斜校正、自动去污、自动分文件等批处理功能。在由系统自动处理功能的同时,扫描人员根据原件的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像的分辨率、阀值、明亮度以及扫描方式和扫描速度,确保在扫描图像质量清晰的情况下,使原件完好无损。(六)图像处理:采用自动化处理和人工处理相结合的方式,确保图像质量的完美。通过校对系统对图像进行校对,确保图像顺序正确、去斑点、污渍、黑边、偏斜处理、校验。在校对时发现不合格图像及时返回前一工序进行改正。(七)质量检验:对扫描处理完成后的图像页面进行检验,对档案拆分、扫描、修正、去污、图像的处理以及文本和图像页的匹配等质量进行全面检验。对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前的图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记并退回上一流程重新处理。(八)图像与索引挂接:文本域录入和扫描处理检验后的图像成品,按年度进行文字图像与系统的挂接,不需手工挂接即可实现文本与图像页与系统的挂接。挂接到档案管理系统中后,进行再次的成品验收,对各种使用习惯逐页进行检验,验收合格后移交验收小组验收。(九)案卷整理还原:档案整理工作严格按照国家档案局规定的相关标准进行有序的整理,公司安排专人负责案卷整理与还原。第二节数字化加工流程及主要技术方案档案数字化加工主要流程包括:提卷—拆卷—档案著录—扫描—图像处理—OCR—校对—版式还原—转双层PDF—终验—挂接。一、入库提卷、拆卷1.从档案室移交档案,严格执行原始档案的交接手续,使用双方项目负责人确认的档案交接清单(完成清点登记)。2.档案整理:编写页码、核对纸质档案页码、对可拆钉的文件做拆钉处理以适应扫描的要求、对需要修复的档案进行归并整理(如果发现破损严重,无法直接进行扫描的档案,应先进行技术修复、折皱不平影响扫描质量的原件应先进行相应处理后再进行扫描,发现破损严重的档案须立即报知项目相关负责人)制作卷内目录,扫描文件抽取3.按照扫描处理量明确交接周期和档案交接量(双方项目负责人签字,以保在施工过程中档案不损失、不丢失。)4.装订案卷应保证装订牢固,案卷整齐,卷内材料不松动,脱落,保持与原案卷一致。二、标引著录按要求将文件所需信息录入到软件数据库里,标引著录按照国家档案局有关标准结合用户档案著录的具体要求进行。1.录入方式采用手工录入的方式2.校对方式校对以软件校对和打印输出、对比校对相结合,错误率在万分之二以下。案卷目录和卷内目录按照档案的原始数据录入。卷案目录和卷内目录的样式经用户同意可做相应调整。对档案目录数据修改和补充的数据,须填写更改资料、更改资料放入原案卷内,卷内目录及其他不全的需补充完整。三、档案扫描1.扫描方式:根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用加长式扫描或者图像拼接处理方式处理,同一页面有两个以上文件,需分别扫描。2.扫描色彩模式:以黑白二值扫描为主,附有灰度(彩色)照片及原件分明度很低的档案,可视情况采取灰度和24位真彩色扫描。然后以黑白二值保存。例:蓝底招生名册,此种档案长见为A3幅面、纸张很薄,底色与文字的分明度很低。实物档案查看时都显吃力,此种档案如果用黑白二值扫描,则会出现大幅暗面,文字显现不清;如果使用彩色扫描,文字部分明度很低。只有使用灰度扫描,效果相对好一些。扫描后的图像再辅以黑白二值保存,则最大限度的提高了图像质量。3.分辨率:无全文检索需求的文档分辨率调整为200DPI最为合适。需要全文检索而做ocr识别的文档,黑白二值扫描分辨率最佳为400dpi,此分辨率下识别成功率最高。24位真彩色扫描分辨率标准为200dpi。4.图像文件的大小:黑白二值扫描A3页面:20K—40K;灰度或彩色扫描A3页面:100—150K。5.如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览的速度。6.清晰度:扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原档案存在锈斑变质、颜色过浅或深浅不一致,也保证扫描图像可读,扫描留下的墨迹宽度不得超过0.5厘米,并且指印和黑线不能覆盖或影响正文内容。7.根据档案实体情况,在档案电子文件中相对应目录设置“复制件”、“原件不清”标志。目录以原有档案目录为准,在实际处理过程中著有未归类的新目录。可根据情况修改目录,增加或调整标准目录,对档案原目录数据修改或补充的数据,需填写更改资料,更改资料放入原案卷内,能实现一条目录对应多个图像和一个图像对应多条目录的编目。8.图像内容:(1)实时在屏幕上监控扫描全过程,遇有漏扫、重张,图像黑边、偏斜、折角、不清晰等情况,则进行重扫或补扫。(2)检查扫描件是否合乎要求,扫描图像必须与原图页面一一对应,不得出现颠倒、缺页、重页或错页情况,不能有遗漏、重复,扫错的现象(3)扫描的页面内容居中显示,不可出现明显偏左或偏右的现象,正文内容、页眉、页脚、反面印章、附件、手写注释等信息完整;图像内容与书本面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。(对图像黑边、偏斜、折角、不清晰等情况进行处理,以达到用户需求)(4)纸张较差档案扫描方案:由于进行数字化的档案会有部分为历史档案,纸张质量比较差,对于这部分纸张质量较差的历史档案扫描,我们本着以下原则:9.扫描登记:认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。四、图像处理1.逐张检查图像质量(包括黑边、折角、图像偏斜度、清晰度、失真度等进行检查,发现不符合图像质量要求时,应重新进行图像处理),档案顺序(页号)是否正确,有无漏扫、重张等情况(发现文件漏扫时,应及时补扫并正确插入图像。发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。)2.纠偏:图像整体倾斜不得超过1度,不得出现图像的一部分倾斜或扭曲而影响阅读的现象。如果档案页面存在部分倾斜的,以页面中标题纠正为准。3.去污:所有扫描留下的黑线、指印、阴影或污点都必须清除干净(在放大50%的情况下)由于印刷质量或纸张质量等造成的页面上有零星的污点和反面倒映文字污点比较多,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但应尽量保证图像可读。4.全文页面及局部文字的加深和变浅的处理:原始档案的清晰度较低时,可提高图像的清晰度,修正原资料中存在的字间距和行间距过密,文字较深或较浅,字迹不清楚的缺陷,确保文字及图像信息清晰可辨。5.图像拼接:对大幅面档案进行分区扫描形式的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性和数字化档案的准确可读。6.照片页处理:必要时采用专业的图像处理软件进行处理,确保照片的清晰度。7.图像存储:存储格式以G-4压缩TIFF格式保存。A4幅面档案保存文件不得大于100K;其他幅面档案扫描形成文件在保证影像质量的前提下,尽量缩小文件占用空间。扫描文件存储命名必须与条目档案号一一对应。五、全文识别(OCR)及生成双层FDF、版式还原及格式转换将扫描处理完成后的文档利用专业的识别软件进行全文OCR,如甲方对识别成功率有严格要求的,还需另外进行人工校对,校对结束后将版式还原及转换成双层PDF文件格式。根据用户对识别率的要求,可选择性进行人工校对。进行人工校对和不进行校对的优缺点对比:1.不进行人工校对:其原理是在单层PDF的基础上利用计算机软件进行全文OCR识别后生成双层PDF文件。从而激活了图片中所反映的文字,而达到提取文字和利用原文所包含的文字进行检索的目的。但是不进行人工校对和版式还原,识别的准确率取决于原始资源的情况及保存现状。(1)优点:效率高、成本低、能利用原文检索、浏览速度快。(2)缺点:识别准确率取决于原件的质量,所以准确率不稳定。(3)适应范围:1)原件版面干净及保存完好的资源。(准确率可达95%以上)2)原文中只含部份核心检索内容的资源。(如学籍档案,检索的重点只是围绕学生的身份信息)2.进行人工校对:其原理是在OCR的基础上,为了确保识别的准确率而增加了人工校对和版式还原的工序。可实现无障碍的全文检索。(1)优点:全文检索无差错,准确率可达99%,且文本层和图像层一一对应。(2)缺点:效率极低、成本极高、因为进行了版式还原,所以原真率不到98%,而且存储空间很大而致浏览速度降低。(3)适应范围:1)所载信息珍贵且使用频率很高的资源。2)数字化项目资金预算充裕且项目实施时间宽松的资源。3)有很好的硬件环境支持的数字化项目。六、总质检1.对扫描处理完成后的图像页进行检验,对档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量进行全面检验,对于质量达不到要求的进行重扫、补扫等操作。2.对文本域录入与文本录入域的标引、文件的页号和页数进行对比,对扫描前图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单重新处理。3.对图像质量的检查,确保图像版面清晰,干净,大小一致,方向一致。4.主要质检标准:(1)加工后的电子影像在总数量、完整性、清晰度上与源文件保持一致。(2)案卷著录、按文件的属性著录数据库字段,检查“文件路径”字段与文件实际存储位置一致,差错率控制在千分之五以内。(3)电子影像档案件信息定义数据差错率控制在百分之二以内。(4)电子影像档案卷内页码差错率控制在千分之一以内。(5)每页电子影像左右端正度控制在三度以内。(6)电子影像漏扫,压边率控制在千分之一以内。(7)电子档案与条目数据的挂接一致,差错率小于千分之一以内。七、批量挂接1.扫描处理后的图像成品,按年度、机构上传至档案专用服务器,利用档案管理软件中的对应挂接功能将扫描图像信息与录入到档案管理软件系统中的目录进行对应挂接,确保目录与原文的一一对应。2.挂接到档案管理系统中区,进行再次的成品验收。八、还卷及数据备份提交1.原始档案还原工作严格按照国家档案局规定的相关标准和实际情况进行有序的还原,将还原的档案资料逐卷精心检查,确实没有落页、掉页、折页等问题后再归还档案管理人员,经双方仔细核实无误后,在还卷交接单上签字确认。2.在数据化加工过程中的各项工作记录,在数据转移完成后、提交给用户方。3.为了有效地保护数据,因此建立数据备份制度,在数字化加工项目工作结束,并经用户在终验报告上签字确认后,将通过验收后的数据利用用户软件的光盘制作功能刻录成光盘,刻录到DVD光盘中,刻录完成后再制作一个光盘备份,或用移动硬盘等存储介质,将所有成品数据备份,提交给用户。4.刻录光盘要求:(1)光盘制作两份,制作成档案数据格式为多页TIFF的光盘单盘调阅。(2)同一份文件不跨越二片DVD片号(同一份文件页数需在同一DVD内)(3)电子档案存在于符合标准的单片包装光盘(4)光盘标示光盘编号,单片包装盒上注明光盘内主要信息(5)在光盘刻录完成后,与硬盘系统中电子档案进行一次比对,确保档案资料无遗漏及正确性。(6)制作光盘人员对于所有光盘序号进行标记,并提交相应表格。第三节历史档案扫描的工作流程方案一、分组实施方案本项目加工使用小循环操作,共分XX个小组,其中:XX个整理、XX个扫描、XX个修图、XX个质检与挂接,其他如交接及还原工序将统一完成。我公司现场安排XX个项目主管(负责整体管理、控制与沟通),XX个质量主管(负责交接、培训与总检);和XX个安全主管(负责人员管理与安全控制)。采购单位现场安排XX名管理人员,负责交接与现场安全管理和质检、处理异常情况、实时验收等;验收时,采购单位将另外安排人员组织验收。每小组实施流程如下图所示:二、总体流程我司数字化加工的标准流程可以分为档案交接、整理、目录数据检查纠错、扫描加工、图像处理、图像质检、数据挂接、数据校验、分盘刻录和数据交付等工序。其中,本项目条目著录已完成,我司负责对目录进行校验。整个加工流程由我司库房保管员将待加工档案分配给XX个加工小组,完成后统一进行装订还原,并进行数据校验,实施流程如下图所示:主要工序简要说明如下:1.领用交接:从档案库房提取需要进行数字化加工的档案原件到加工现场(可以按工作日、班次或批次提取),根据需要清点到盒(卷),记录每盒(卷)档案件数及页数,不出现遗漏登记或重复登记。2.档案整理:整理人员对领出的档案原件进行数量清点和纸张检查,发现问题及时登记并提交用户审核处理,对没有问题的档案才进行拆卷处理。然后进行拆卷、纠正、平整、裱糊、鉴定、分页等处理工作。其中,整理人员需要进行目录质检,即要与实体核对,如核对有问题,须当场提出,由采购单位的人员进行目录的修改后,重新导出目录给加工小组(一般是第二天提供正确的目录),当天的这一卷案卷须封存,第二天才能继续进行。3.扫描加工:扫描操作员将整理好的档案原件,根据纸张状况和工作任务进行扫描。4.图像处理:利用计算机对扫描后形成的影像文件进行精细处理,包括纠偏、去污、裁剪、色彩调整等修饰工作。5.分盘刻录:对数字化加工成果按目录刻盘,光盘出现问题时能够使用硬盘还原重新刻录。6.数据交付:将质量合格的扫描数据更新到服务器,并定期备份。7.著录挂接:通过软件著录档案条目,并与档案扫描图像进行正确挂接。根据项目的特殊需要,在数字化加工过程中可能会另外对扫描件进行文字识别、图纸影像进行矢量化、最终数据制作成电子书籍或图册。这些操作根据项目要求而定,在加工流程安排时在适当的位置进行嵌套。三、实施流程(一)档案交接档案交接流程图如下所示。说明如下:1.档案交接员确定待领取档案的全宗、年份、保管期限、目录号,填写《档案交接记录表》。档案领取需及时,以保证项目组正常运作,项目组内应留存待加工档案数量为一天所加工量。2.用户从档案库房领取档案,档案交接员仔细确定领取档案案卷数量,保证所领取的档案是正确的,填写《档案交接记录表》和《档案数量确认单》。3.如果档案交接员发现档案在页码数和纸张数方面有偏差,则填写《档案交接异常情况登记表》,提交用户进行处理。如果没有偏差,则双方签字确认。4.档案交接员将领取的档案交给内部周转库房保管。5.周转库房管理员确认和接收领取的档案。6.领取的档案数字化加工流转完毕后,周转库房管理员准备待归还档案,交给档案交接员。7.档案交接员对待归还档案进行检查确认,填写《档案交接记录表》,提交用户。8.用户对档案清点检查,发现问题有档案交接员登记《档案交接异常情况登记表》,交给周转库房管理员进行处理。9.确认无误后,用户将归还的档案入库,双方签字确认。(二)档案整理档案整理由整理人员对档案进行纸张数量确定、鉴定(区分扫描件与非扫描件)、分页、编制页码(档案本身编有页码,但因底稿不扫,造成影像文件页码不连续,且原有页码编制不规范,文件背面未编,所以不可用,为保证质量与效率,页码需重新编制)等工作,工作流程图如下所示。说明如下:1.整理人员向周转库房管理员领取本组待处理案卷,填写《档案数量确认领卷单》。2.周转库房管理员将档案交给整理人员,整理人员根据案卷信息填写《档案数量确认单》中相应项:档号、卷皮标明的张、页数。3.整理人员逐页清点案卷张、页数。如数量不符、纸张破损严重等异常情况,则填写《异常情况登记表——档案数量确认》,同时立即报告由值班主管处理,值班主管报知用户,双方协调解决。4.整理人员清点完成,填写《档案数量确认单》中相应项:实际张、页数、偏离数、偏离情况等。5.完成一批(10卷)双方签字确认,填写《工作流程单》。6.整理人员按档号顺序从周转库房领取一批档案,10本为一批。7.整理人员确认该批档案档号(全宗号、目录号、年度、案卷号、保管期限),在《工作流程单》》上登记该批档案情况,登记内容为档号。8.整理人员拿出一本案卷,在案卷左边案卷脊背上确认档号,并把该档号准确无误的填写到案卷封皮正面左下方相应栏目内,使用铅笔填写。9.整理人员拆卷,拆卷顺序按照档案原有编排顺序依次进行。10.整理人员检查文件完整性,文件纸张若有折叠(包括边角),需展开抚平;若有破损,小心用修补;若有多页粘连,不需撕开。特殊纸张(如:已破碎的文件)将根据实际情况进行必要的处理,如复印、加薄膜等,以防止在扫描工序中对纸张造成二次伤害。如有异常情况(缺页,内容与目录不符和等),则在《工作流程单》“备注”栏内注明情况备查,并填写《异常情况登记表——档案前处理》。11.我方整理人员拆卷对必须分页才能扫描的纸张,经用户同意后,用裁纸刀沿文件原边缘折痕裁切;并将所有卷内文件平放整齐。12.整理人员编制页码,页码从1开始按顺序编制,对A3纸张页码编制:开放内容(表格)则视为单页,只打一个页码;单独封闭内容(表格)视为两页,按内容顺序打两个页码。编制要求为:(1)所有扫描稿按顺序重编页码,所有有内容页面均要敲页码,保证每张影象编制一个页码(2)扫描页码编制位置在文件左下角,装订线内(3)扫描页码位数不定,无前置零,以跟原页码区分。13.页码编制完成,在《工作流程单》相应栏目内填写本卷需扫描张数,即最后页码,并签字确认。(三)扫描加工档案扫描加工的流程如下所示。说明如下:1.扫描员填写《档案扫描领卷单》,从周转库房领取本组待扫描案卷。2.扫描员检查案卷脊背档号与封皮左下脚档号是否一致,若一致则将档号、需扫描页数填写到《工作流程单》相应栏目中;若不一致,则以与整理人员核对,确认改卷正确档号。3.扫描员打开XX数字化加工信息系统,录入正确的档号。4.扫描员上纸,操作步骤如下:(1)将档案原件从档案案卷中取出,分别从两个方向将档案展开,观察是否有档案粘连、其他夹页、钉书钉或大头针等杂物。发现档案粘连,若对档案内容不影响,则进行分离处理,但决不可造成档案破损;若对档案内容有影响,则立即报告用户方档案管理人员处理并做好处理记录。发现夹页应立即报告用户方档案管理人员处理,并对处理结果进行记录。发现其他杂物要进行清除,但决不可造成档案破损。(2)将档案向进纸方向展开,观察侧面标记是否有档案反相及档案及四角曲折。若有进行处理。(3)将档案展开抚平后放入扫描仪扫描板,将扫描仪盖板盖紧,防止纸张起皱。5.扫描员按照案卷标明的页码顺序扫描,案卷内没个扫描页码张均要扫描成单独影像页。对于附着在主页上的小纸片作为另页扫描,另页扫描的命名时放在主页之前扫描。(1)对于同一份档案中有铅笔、钢笔、圆珠笔同时存在的,以文件主要部分的清晰为准,需进行灰度补偿处理。(2)为了保证档案资料的载体安全,扫描时应根据纸张情况选用合适的扫描生产线,对于纸张较薄或较脆容易破损的要使用平板扫描。对特殊纸张或档案原件清晰度不高的,我们可通过增加分辨率,调整亮度、对比度等技术参数,直至扫描图像清晰为止。对于同一份档案,清晰度不同,特别是铅笔、钢笔、圆珠笔同时存在的,以文件主要部分的清晰为准,一般要求如下:1)色彩选择:红头全文字黑白原稿档案采用(300dpi)TIFF格式黑白扫描,含彩色内容的档案、图纸采用(300dpi)JPG彩色扫描,照片以原色彩为准用(300dpi)TIFF彩色扫描。2)存储格式:300dpi以上,彩色JPEG;黑白TIFF。3)扫描完毕图像文件进行纠偏,页面端正,无明显倾斜,倾斜度不大于1°;4)扫描时按照纸质档案的原始大小扫描成像,打印时按标准A4等标准尺寸输出;5)对一些大图形的材料,要采用专业零边距扫描仪扫描后拼接。6.扫描过程中认真观察扫描图像质量,确保扫描影像的清晰完整,方向正确,没有歪斜、黑边。发现图像质量问题立即暂停扫描进行处理。问题及处理方法如下:(1)图像有杂点。档案有污染。找出档案,观察污染情况,可清除的污染物,进行清除;对档案涂改造成的字迹不清,决不可进行处理,按原档案扫描并做好记录。(2)条码部分图像不清。条码印制质量不好。找出档案,调整亮度参数后重扫。对亮度过高造成的扫描后图像杂点进行处理,但决不可改变任何原有笔迹。对难以修正的档案,应立即报告用户方档案管理人员处理并做好记录。(3)图像有横向黑线。感光阵列有脏物。打开扫描仪,用酒精棉擦净,然后用风球吹干。将有黑线的图像删除,按最后一个图像的编号,找到后一张档案继续扫描。每扫一千张左右对扫描仪进行一次清洁。(4)图像标题反向。档案放置反向。将反向档案找出,重扫并将原图像替换。(5)图像部份内容反向。答题者写反。将档案找出,报告用户方档案管理人员处理并做好记录。(6)图像角部、黑边、档案折角(边)。若影响档案内容,找出档案整理折角后重扫;若不影响档案内容,则用擦涂工具进行清除。档案缺角(边)。若影响档案内容,找出档案报告用户方档案管理人员处理并做好记录;若不影响档案内容,则用擦涂工具进行清除。(7)图像太淡、不清。档案用淡蓝色墨水填写或用修正液涂改。找出档案,调整亮度参数后重扫并将原图像替换。由于亮度过高造成图像杂点,要对影响影像档案内容的杂点进行清除。7.一个批次(目录)的档案扫描完成后,扫描员核对图像数与本案卷待扫描页数是否一致,若不一致则查明情况并做相应处理(例如检查档案袋中是否有遗留档案),一般情况为漏扫、多扫等,并登记《异常情况登记表——档案扫描》。8.一个批次的档案扫描完毕后,扫描员将扫描仪出纸口的档案取出,按原始顺序放回档案袋,在档案袋上加盖“已扫”印章。9.每扫完一批档案,扫描员将图像数据发送到服务器,注意彩色图像与黑白图像分开保存。10.扫描员完成已分发的档案扫描后,填写《工作流程单》,打开扫描仪进行清洁并散热。(四)图像处理图像处理人员和图像质检人员使用“XX数字化加工信息系统”进行图像处理(区别在于质检人员仅检查和登记问题,处理人员解决问题),流程如下所示。说明如下:1.图像处理人员打开XX数字化加工信息系统,在任务步骤栏选择“影像处理”步骤。点击“任务获取”,在任务列表中按年份先后选取一条待处理任务,关闭任务列表。点击“刷新”按钮,双击任务记录,打开图片窗口。2.图像处理人员确认任务列表中档号与封皮影像中档号一致,如不一致则登记《异常情况登记表——图像处理》,并报告值班主管,立即查明情况并处理。如果需要与档案原件核对,则填写《图像处理异常情况处理临时领卷单》,向周转库房管理员领取领取档案。3.图像处理人员确认档号无误后,然后核对影像数量是否正确(需要一次性查明整卷情况,1张封皮+N张目录+最后页页码=本卷影像数)。通过软件翻到最后页确认页码。如影像数量有误,则登记《异常情况登记表——图像处理》,并报告值班主管协助处理。确认后在《异常情况登记表——图像处理》中登记和使用新编制扫描页码。4.图像处理人员对图像进行检查并处理发现的问题,处理手段包括旋转、纠偏、去污、居中、色彩调整等。处理过程中注意是否有非扫描件影像(标准见档案整理)、色彩模式是否正确(标准见档案扫描)、影像内容是否清晰(主要是黑白影像)。处理要求如下:(1)对于图像模糊不清情况,填写《异常情况登记表——图像处理》交由扫描主管签字,找出档案由扫描人员调节扫描参数进行图像的再扫描,确实因填写用笔不当导致扫描图像模糊的,需请用户签字确认。(2)对扫描图像进行纠偏,页面端正,无明显倾斜,倾斜度不大于1°。对于图像严重倾斜而致使图像无法处理,填写《异常情况登记表——图像处理》交由扫描主管签字,找出档案由扫描人员进行重新扫描,并向用户作出说明。(3)对于扫描后图像文件中的污点、黑边等进行去除,保证图像文件的干净、整洁和美观。对于黑边影响识别的需填写《异常情况登记表——图像处理》,交由扫描主管签字,找出档案由扫描人员进行重新扫描,并向用户作出说明。(4)保持扫描图像内容居中,上下左右四边尺寸合理,边距过宽的进行裁边,边距过窄的进行加宽。(5)对扫描后的图像进行逐页纠偏、去污、图像拼接、裁边处理和排列顺序调整,保证图像符合正常的阅读习惯。图像偏度不得大于3度,图像拼接处信息要完整,不能缺少任何信息。图像深浅不一时,采用平衡功能,调整图像深浅一致.5.图像处理人员完成一批图像后保存图像,填写《工作流程单》。(五)异常处理1.档案原件异常情况(A类)1)档号类:①档号模糊不明确:是指同批案卷中存在个别案卷的全宗号、目录号、年度、保管期限不统一;②案卷号缺失:是指一批案卷中相邻两卷案卷标识案卷号不连续;③重名:是指不同案卷内容案卷号相同。2)页码类:①跳号:是指案卷中相邻两张独立纸张都存在标识页码但页码标识不连续,排列如:3、5或3、9等;②漏敲:是指案卷中存在独立纸张无标识页码;③页码重复:是指案卷本身只有一套页码标识系统,其中存在单张独立纸张页面存在2两个或以上页码标识;④开放页码系统:是指案卷独立纸张起始页码不为1,或结束页码与案卷封皮总页码(或目录结束页码)不符合;⑤附页:是指案卷中存在附页且附页且未按该卷页码系统标识页码号;⑥目录错乱:是指案卷原件卷内目录所标识页码号与实际卷内文件标识页码、内容三者不相符。3)纸质类:①纸张破损:是指档案纸张破损程度远超改卷其他纸张,无法进行正常处理;②纸张粘连:是指相邻纸张粘连程度远超处理标准的、影响扫描影像成像内容。4)其他类:本流程未定义、但无法按正常流程标准加工的纸张类型。2.影像文件异常情况(B类)(1)影像文件损坏:是指加工系统软件无法正常读取、显示、编辑、保存等操作的影像文件;(2)影像文件内容缺失:是指非正常内容缺失的无法确定的内容不完整影像;(3)本流程未定义、但无法按正常流程标准加工的影像文件类型。3.加工系统软件异常情况(C类)软件报错:是指按正常操作规范操作而产生的软件报错、无征兆关闭等一切非正常情况。4.硬件设备异常情况(D类)所有硬件设备(扫描仪、PC等)因故障无法工作或非正常情况,如过大噪音、反应迟缓等。异常处理相关人员对照表:类型相关人员A类B类C类D类公司方现场主管★★★★项目经理★★★★商务部★软件部★客户方现场值班员★★客户主管★★流程规范:1.发现情况;并再三确认情况属实2.呼叫现场有关管理人员确认情况属实;3.填写《异常情况登记表》、《工作流程单》“备注栏”项,如涉及纸张、案卷数量问题则须同时填写《档案交接登记表》“备注栏”项;4.由项目经理负责与相关方面沟通,协商解决办法并形成书面处理意见;5.处理方法意见报送相关主管审核;6.审核通过,交由项目组执行解决;不通过则另行协商直至审核通过;7.项目经理负责监督处理执行过程及处理结果确认,并最终报备相关方面主管;8.流程结束,相关文档归档保存。(六)质量抽检质量抽检的流程如下图所示。说明如下:1.质检人员打开XX数字化加工信息系统,在任务步骤栏选择“档案质检”步骤。点击“任务获取”,在任务列表中按年份先后选取一条待处理任务,关闭任务列表。点击“刷新”按钮,双击任务记录,打开图片窗口。2.质检人员确认任务列表中档号与封皮影像中档号一致,如不一致则登记《异常情况登记表——总检》,并报告值班主管,立即查明情况并处理。如果需要与档案原件核对,则填写《总检异常情况处理临时领卷单》,向周转库房管理员领取领取档案。3.质检人员确认档号无误后,然后核对影像数量是否正确(需要一次性查明整卷情况,1张封皮+N张目录+最后页页码=本卷影像数)。4.质检人员逐页翻看检查影像,右键点击卷内目录检查影像与条目对应情况,如果发现问题,则登记在《异常情况登记表——总检》中。5.抽检完成后,如果质量合格填写《质量抽检验收单》,并填写《工作流程单》。(七)装订还原装订还原将经过拆分扫描及完成影像处理的档案原件重新装订,流程图如下。说明如下:1.档案还原人员从周转库房领取已加工完毕的档案。2.将案卷内文件整理整齐,标准是优先左边、底边对齐,然后是右边对齐。按以下要求装订案卷:(1)严禁将纸张放反、放倒、页码顺序错乱。(2)大纸张按原折痕折叠好。(3)档案纸张过窄的,用白纸在装订边(一般为左边)补齐。3.夹子夹紧后打孔,打孔位置尽可能在原孔位置上打,但以保证不脱页优先。页数少的案卷用衬条加厚,档案线尽可能拉紧些,防止松动。4.在还原过程中,如果发生问题,登记《异常情况登记表——档案还原》。5.装订好后档案按顺序分年度排放。6.还原人员填写《工作流程单》。四、主要环节实施标准(一)目录补录扫描文件的目录,由采购单位提供,对于个别文件需要补录目录的,则由我公司进行补录。目录补录要求,按×××采购单位所提供的文件目录数据库结构与著录要求进行。(二)档案整理扫描之前,在保护档案不受损害的前提下,拆除装订物(资料及档案内的成册材料不拆),按采购单位的要求区分扫描件和非扫描件,并对折皱不平影响扫描质量的原件先进行相应处理(压平或熨平等),确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸张质地状况较差的档案扫描图像清晰;扫描完成后,拆除过装订物的档案按原档案保管单位重新装订,并保持每页档案原有的排列顺序不变,案卷不掉页、右边和底边整齐。卷皮破损严重的,调换卷皮。旧卷皮需全部交还采购单位。(三)档案扫描加工扫描档案文件正稿、附件、草稿、修改稿及轮阅单等。档案扫描采用彩色和黑白二种方式。全文字黑白原稿档案采用(300dpi)TIFF格式黑白扫描,含彩色内容的档案、图纸采用(300dpi)JPG彩色扫描,照片以原色彩为准用(300dpi)TIFF彩色扫描,均保持原档方向。最终再转成PDF格式文件。扫描时,根据纸张质地、底色、薄厚程度等因素,设置最佳的扫描明暗度、对比度设置,保证原始扫描图像效果与原件吻合。根据档案幅面的大小和纸张状况,选择相应扫描仪。其中大幅面档案采用小幅面扫描后进行图像拼接处理;同页有两个以上文件,分别扫描后再进行合页。为保护档案原件,我公司尽量使用平板扫描仪扫描,对于现代档案纸张质量较好适合高速扫描的,事先征得采购单位同意,并做好记录;对资料等成册材料不宜拆卷的,必须使用不拆卷扫描仪扫描。扫描时应在《纸质档案扫描工作流程表》上认真登记扫描的页码和页数,并核对每份文件的扫描页码、页数与实际的文件页码、页数是否一致,不一致时注明具体原因和处理方法。第四节图像处理方案我司拥有自主档案数字化加工应用管理软件,扫描图象处理具有能批量自动纠偏、去污、去除多余白边等功能,扫描图象处理能一次完成。对扫描后的图像进行逐页纠偏、去污、图像拼接、裁边处理和排列顺序调整,保证图像符合正常的阅读习惯。图像偏度不大于3度,图像拼接处信息完整,不缺少任何信息。图像深浅不一时,采用平衡功能,调整图像深浅一致。一、图像标准化处理(一)影像纠偏影像纠偏功能包括:自动纠偏和手动纠偏两种,自动纠偏根据预设角度对图像进行自动纠正,但部分图像因为角度纠正后可能会出现内容变形的情况,因此还需要手动进行角度的偏转,偏转最小值为1度。(二)页面去污页面去污功能也包括自动去污和手动去污两种,自动去污功能是根据预设的污点像素大小对小于设定值的点进行自动去除,但超出设定值的污点需手动去除。自动去污一般预设值都较小,以防止将标点符号或虚线当成污点清除。去污功能类似于绘图软件中的橡皮擦功能。(三)消除折痕折痕是由于纸张对折出现的印迹经扫描后在图像上产生的黑线,由于折痕多覆盖在内容信息的上面,因此必须用手工去痕的方法进行处理。去折痕功能类似于绘图软件中的自动清除选定区域功能。(四)去除黑边系统可以根据每一批档案的边距情况调整黑边的出现范围,由系统自动根据设定范围进行清除黑边处理。对于黑边超过预设范围的系统也提供了手动的擦除黑边的工具。此功能也类似于绘图软件中的自动清除选定区域功能。(五)去装订孔由于装订孔位置较为靠近图像内容,因此我们采用手动修图的办法来擦除装订孔图案。(六)尺寸调整对于图像尺寸不一致的情况,我们将对边缘空白过宽的进行裁切,对于过窄的进行补边,使同幅面档案大小美观、一致。(七)色彩调节针对图像中色彩较近,内容与底色反差不大,明暗度太浅的情况,我们的系统可以对图像进行色彩及亮度、对比度等的任意调节。(八)图片合页对于同一页上粘贴的多页纸张在扫描后生成了众多的单个影像,再通过此合页功能可以将它们合成到同一页中来,但其效果并不同拼接。(九)影像拼接对于超过扫描仪宽度的大幅面档案和图纸我们将采用零边距扫描仪进行局部扫描后再无缝拼接,为了保障拼接的效果因此必需使用零边距扫描仪。二、特殊图像的处理(一)内容较浅对于影像中内容较浅的情况,将采用减小色彩中间值的处理方法进行字迹加深处理。同时还可以采取调节明暗对比度或光亮度等手段进行测试,直至内容更为清晰,适于阅读为止。(二)带有红眼采用图像处理软件中的去红眼技术直接进行过滤。(三)局部变色对于纸张局部变色后扫描出来的影像底色不一致的情况,如果用户允许页面美化处理,则采用图像处理软件进行手工填色处理。(四)麻点过多对于扫描影像麻点过多的情况将采用调节阀值的技术最大程度的淡化麻点。局部麻点采用图像处理软件手工去污处理。(五)文字背透对于较浅的文字背透情况将采用加衬纸的方式进行重扫处理,减少反光度从而降低文字背透印迹。如果是墨迹已透纸而出,则进行登记后将尽量用图像处理软件进行放大后处理。第五节特殊纸张处理方案一、较薄的纸张1.采用纯平板扫描仪进行扫描,确保无损坏;2.在纸张下方垫用相似条件的纸张作为参照物确保扫描后的影像质量无透光现象;3.公司拥有相应的效果处理软件加以控制,确保影像质量;4.本公司与扫描仪厂商建立了长期战略合作伙伴关系,提供各类纸张的标准色表,确保影像质量。二、发脆的纸张拆卷后采用平板扫描仪加工,纸质太差的使用专用档案衬纸衬底裱糊处理。三、破损的纸张1.对于已经破损的文件,用专用档案修补纸和胶水、胶带等进行修补,破损情况严重,无法修补的,用专用纸在背面托衬进行文件的修复;2.扫描过程中,按规定的操作方法进行操作,避免因操作不当造成文件的破损;3.对于所有破损文件进行记录备案,处理前与客户方进行沟通确认。四、变色的纸张1.在扫描仪硬件方面,调用各类厂商提供的插件、控件进行第一次处理;2.根据纸张具体情况调节扫描仪的各项参数,主要包括:伽码值、对比度、亮度、色表等;3.利用本公司专用扫描软件进行最后的影像优化处理;包括:边缘锐化、色彩温和度调整、折皱处理等;4.采用厂家的去底色技术处理。五、色
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年对溴苯酚项目可行性研究报告
- 2025年室外全彩多媒体信息屏项目可行性研究报告
- 2025-2030中国婴儿睡袋行业深度调研及投资前景预测研究报告
- 2025-2030中国在线亲子旅游行业发展前景预测与投资机会研究报告
- 2025-2030中国可可碱行业供需状况与发展趋势研究报告
- 2025-2030中国反无人机行业市场发展趋势与前景展望战略分析研究报告
- 成长教育课程销售合同
- 手房房产居间合同范本
- 农业科技合作开发保密协议
- 农村合作社联合开发利用资源协议
- 2025年临床医师定期考核必考复习题库及答案(1060题)
- 建筑设计各专业产值分配比例表
- 《黛玉葬花》葬花情节的文化解读
- 2025年国家铁路局市场监测评价中心招聘应届毕业生2人历年高频重点提升(共500题)附带答案详解
- 介绍家乡山西太原
- 2025届湖北省孝感市八校教学联盟高三第二次模拟考试数学试卷含解析
- 土木工程CAD-终结性考核-国开(SC)-参考资料
- 放射性皮肤损伤的护理-中华护理学会团体标准
- 糖尿病-运动课件
- 【课件】往复式压缩机课件
- 2024-2030年中国铌行业市场发展趋势与前景展望战略分析报告
评论
0/150
提交评论