档案数字化加工方案_第1页
档案数字化加工方案_第2页
档案数字化加工方案_第3页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-0- 档案室、档案馆馆藏档案扫描、数字化加工整体解决方案目录- - 1 - 第一节 质数字化加工作业前期预备1一、数字化工作人员预备1二、数字化工作软件、硬件预备4三、确定数字化内容、数量及用户需求5其次节 数字化加工流程及主要技术方案6一、入库提卷、拆卷6二、标引著录7三、档案扫描8四、图像处理11OCR、生成双层pdf、板式复原及格式12六、总质检14七、批量挂接15八、还卷及数据备份提交15第三节 质量把握方案和保证措施17一、加工质量保障措施17二、多环节,多层次的质量检查体系17三、阶段性验收与终验相结合的严格验收程序是质量把握的终级保障19第四节 安全保密把握21保密协议22第五

2、节 售后效劳24工程背景随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、各类数据库、网络资源、电子档案、电子图书等型数字化信息资源的建设。 在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化, 使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于 数据库存储,或通过CD-ROM、Internet使用。以传统纸张为载体的保存方式,占据了大量的空间,需要特别的环境,而且不便利查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文件信息进展电子化处理,保存到光盘上,具有存储、治

3、理、共享等功能,还可以削减文件库房占地,节约保管设备和人员方面开支,又便利统计和进展远程查询。因此,将档案、期刊、文件等资料通过扫描仪,扫描成图像文件,再通过处理转换成电子文档,建立名目和索引,制作成电子文件,已是当务之急。第一节 数字化加工作业前期预备一数字化工作人员预备1 .甲方人员职务:现场交接治理人员人数要求:一名专业要求:为学校档案馆负责档案治理工作的技术或治理人员。职责范围:.负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。.负责监视乙方标准化加工。随时把握乙方加工进度并进展协调。.准时关注并抽查乙方加工质量代表甲方与乙方进展准时的沟通及问题协调,确保工程

4、顺当完工。2 乙方人员治理人员主要为:生疏现场加工治理,生疏数字化整体作业流程,具有较强组织力量和现场治理及沟通力量的乙方负责人。工程技术人员主要为:生疏计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案治理等相关专业学问的乙方技术部技术支持工程师。2.3 数据采集作业员主要为:了解档案数据库数据标准和计算机软件应用等相关学问的乙方数字化制作部工作人员。职务职责人职务职责人员备注工程负责人负责人员,资源的调配工作。负责施工组织设计、治理。人3负责施工条件的保障及与甲乙双方作。1人管理人员不肯定要常驻一切通讯手段和定期到现场到对该工程加工进度和加工质量的掌控1.负责与乙方的档案提卷和还卷

5、等交接工作现场主管负责现场的人员治理和加工治理负责数据的终验和挂接协调工作。1人著录人员负责将档案卷内名目及其它索引信息进展手工录入为电子数据信息并校对1人数据采集人员扫描人员人员描污;去黑边及去杂点等;纠偏:将偏斜的图像进展订正处理;或变浅;拼接:将页面较大的图像进展拼接处1人1人在进展图像处 以要留意每一 觉察扫描质量 问题马上发还理;上一工序重扫并作好记录。化人员负责将处理好的图像进展全文识别、校对、板式复原和格式转换移交给现场主管终验并挂接。1-3人度。二.数字化工作软、硬件预备配备硬件数量及档次要视数据采集工作状况及数据量大小。甲方供给PC4-6决。场地:甲方供给。办公用具:甲方供给

6、打印机以实际用量为标准办公桌椅档案资料的装订及打印机所用的全部耗材。其他条件:供给电力和饮水。3-2软、硬件名称数量具体配置响应时间供给方软、硬件名称数量具体配置响应时间供给方检索使用功综合档案治理系统一套能。2支持TIFF和PDF格式数据的批量挂接功能。到位甲方软件、OCR 软件全套能满足本加工工程全部的技术要求到位乙方效劳器一台到位甲方扫描仪A3幅面一台A3 幅面到位乙方到位乙方到位甲方FI-4750C(ADF)A4幅面扫描仪A4幅面一台虹光-FB6030(平板)计算机4-6套PC 机三. 确定数字化内容、数量及用户需求在数据采集之前,首先要客观真实统计数字化内容和数量,确定用户使用需求,

7、然后制定对应方案和技术把握以便准确地进展施工安排。表3-3三峡大学档案馆档案数字化用户需求调研表档案类型档案类型档案数量数字化预备状况纸张及保存状况用户需求备注招生名册约约件面档案装订档案著录档案整理排序很好一般影像化较差很差矢量化很好一般影像化学籍档案约约件面档案装订档案著录档案整理排序较差很差矢量化档案装订档案著录档案整理排序很好一般影像化学生成绩约约件面较差很差矢量化档案装订档案著录档案整理排序很好一般影像化党群档案约约件面较差很差矢量化档案装订档案著录档案整理排序很好一般影像化基建档案约约件面较差很差矢量化档案装订档案著录档案整理排序很好一般影像化科研档案约约件面较差很差矢量化其它:约

8、约件面档案装订档案著录档案整理排序很好一般影像化较差很差矢量化填表人职务其次节 数字化加工流程及主要技术方案-OCR-校对-版式复原-转双层PDF-终验-挂接。图一档案数字化加工流程图一、 入库提卷、拆卷从档案室移交档案,严格执行原始档案的交接手续,使用双方工程负责人确认的档案交接清单完成清点登记。档案整理:编写页码、核对纸质档案页码、对可拆钉的文件做拆钉处理以适应扫描的要求、对需要修复的档案进展归并整理假设觉察破损严峻,无法 直接进展扫描的档案,应先进展技术修复、折皱不平影响扫描质量的原件应先 进展相应处理后再进展扫描,觉察破损严峻的档案须马上报知工程相关负责人-7- 制作卷内名目,扫描文件

9、抽取在施工过程中档案不损失、不丧失装订案卷应保证装订结实,案卷整齐,卷内材料不松动,脱落,保持与原案卷全都。图二二、 标引著录按要求将文件所需信息录入到软件数据库里,标引著录依据国家档案局有关标准结合用户档案著录的具体要求进展。录入方式承受手工录入的方式校对方式校对以软件校对和打印输出、比照校对相结合,错误率在万分之二以下。案卷名目和卷内名目依据档案的原始数据录入。卷案名目和卷内名目的样式经用户同意可做相应调整。对档案名目数据修改和补充的数据,须填写更改-8- 资料、更改资料放入原案卷内,卷内名目及其他不全的需补充完整。三、 档案扫描扫描方式:依据档案幅面的大小选择相应规格的扫描仪或专业扫描仪

10、进展扫描。大幅面档案可承受加长式扫描或者图像拼接处理方式处理,同一页面有两个以上文件,需分别扫描。扫描颜色模式:以黑白二值扫描为主,附有灰度彩色照片及原件清楚24 位真彩色扫描。然后以黑白二值保存。例:蓝底招生名册,此种档案长见为A3物档案查看时都显吃力,此种档案假设用黑白二值扫描,则会消灭大幅暗面,文字显现不清;描后的图像再辅以黑白二值保存,则最大限度的提高了图像质量,如图四。图三 灰度扫描效果图四 保存为黑白值后的效果200DPI 最为适宜。需要全文检索而做ocr400dpi,此区分率下识别成功率最高。24200dpi。图像文件的大小:黑白二值扫描A3页面:20K40K;灰度或彩色扫描A3

11、页面:100150K。如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的状况,可适当增加扫描的区分率,但要保证图像清楚的同时,又不影响远程查询和扫瞄的速度。- 9 - - 10-清楚度:扫描图像字迹清楚、颜色恰当,不宜过浅或过深,并且不得消灭字迹笔画残缺或字迹笔画叠合而影响阅读的状况,即使原档案存在锈斑变质、颜色过浅或深浅不全都,也保证扫描图像可读,扫描留下的墨迹宽度不得超过厘米,并且指印和黑线不能掩盖或影响正文内容。件不清”标志。名目以原有档案名目为准,在实际处理过程中著有未归类的名目。可依据状况修改名目,增加或调整标准名目,对档案原名目数据修改或补充的数据,需填写更改资料,更改资料放入

12、原案卷内,能实现一条名目对应多个图像和一个图像对应多条名目的编目。图像内容:折角、不清楚等状况,则进展重扫或补扫。检查扫描件是否符合要求,扫描图像必需与原图页面一一对应,不得消灭颠倒、缺页、重页或错页状况,不能有遗漏、重复,扫错的现象扫描的页面内容居中显示,不行消灭明显偏左或偏右的现象,正文内容、页眉、页脚、反面印章、附件、手写注释等信息完整;图像内容与书本面完全对应,不得消灭书页内容残缺或将旁边页面信息扫入本页的现象对图像黑边、偏斜、折角、不清楚等状况进展处理,以到达用户需求纸张较差档案扫描方案:由于进展数字化的档案会有局部为历史档案,纸张质量比较差,对于这局部纸张质量较差的历史档案扫描,我

13、们本着以下原则:保证档案安全。纸张较差的档案多为破损档案,对于破水防滑等有破坏档案可能性的操作方法。保证扫描质量。历史档案之所以进展档案数字化,其中最主要的目的之一就是抢救这局部历史档案,今后在应用这局部档案 系统,使用扫描件。这样档案扫描的质量要尽可能的清楚、干净,尽可能的恢复历史原貌,这对扫描质量的要求很高。高效高质的完成任务。扫描登记:认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否全都,不全都时应注明具体缘由和处理方法。四、 图像处理逐张检查图像质量包括黑边、折角、图像偏斜度、清楚度、失真度等进展检查,觉察不符合图像质

14、量要求时,应重进展图像处理,档案挨次页号是否正确,有无漏扫、重张等状况觉察文件漏扫时,应准时补扫并正确插入图像。觉察扫描图像的排列挨次与档案原件不全都时,应准时进展调整1 度,不得消灭图像的一局部倾斜或扭曲而影响阅读的现象。假设档案页面存在局部倾斜的,以页面中标题订正为准。去污:全部扫描留下的黑线、指印、阴影或污点都必需去除干净在放大50%的状况下由于印刷质量或纸张质量等造成的页面上有零星的污点和反面倒映文字污点比较多,假设在页面视图下看不清楚,或该污点嵌在文本行中无法去除,可以不去除,但应尽量保证图像可读。提高图像的清楚度,修正原资料中存在的字间距和行间距过密,文字较深或较浅,字迹不清楚的缺

15、陷,确保文字及图像信息清楚可辨。合并为一个完整的图像,以保证档案数字化图像的整体性和数字化档案的准确可读。度。G-4 压缩TIFF A4 幅面档案保存文件不100K;其他幅面档案扫描形成文件在保证影像质量的前提下,尽量缩小文件占用空间。扫描文件存储命名必需与条目档案号一一对应。五、 全文识别OCR及生成双层pdf、版式复原及格式转换将扫描处理完成后的文档利用专业的识别软件进展全文 OCR,如甲方对识别成功率有严格要求的,还需另外进展人工校对,校对完毕后将版式复原及转换PDF依据用户对识别率的要求,可选择性进展人工校对。进展人工校对和不进展校对的优缺点比照:PDF 的根底上利用计算机软件进展全O

16、CR 识别后生成双层PDF 取文字和利用原文所包含的文字进展检索的目的。但是不进展人工校对和版式复原,识别的准确率取决于原始资源的状况及保存现状。优点:效率高、本钱低、能利用原文检索 扫瞄速度快。缺点:识别准确率取决于原件的质量,所以准确率不稳定。适应范围:、原件版面干净及保存完好的资源95%以上、原文中只含部份核心检索内容的资源如学籍档案,检索的重点只是围绕学生的身份信息OCR 的根底上,为了确保识别的准确率而增加了人工校对和版式复原的工序。可实现无障碍的全文检索。优点:全文检索无过失,准确率可达 99%,且文本层和图像层一一对应。缺点:效率极低、本钱极高、由于进展了版式复原,所以原真率不到

17、98%,而且存储空间很大而致扫瞄速度降低。适应范围:、所载信息贵重且使用频率很高的资源。、数字化工程资金预算充裕且工程实施时间宽松的资源。、有很好的硬件环境支持的数字化工程。- 13 - 14-六、 总质检对扫描处理完成后的图像页进展检验,对档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量进展全面检验,对于质量达 不到要求的进展重扫、补扫等操作。对文本域录入与文本录入域的标引、文件的页号和页数进展比照,对扫描前图像页的标引与扫描后的图像页的编号与页数进展比照,觉察不合格的登记清单重处理。对图像质量的检查,确保图像版面清楚,干净,大小全都,方向全都。主要质检标准:加工后的

18、电子影像在总数量、完整性、清楚度上与源文件保持全都。案卷著录、按文件的属性著录数据库字段,检查“文件路径”字段与文件实际存储位置全都,过失率把握在千分之五以内。电子影像档案件信息定义数据过失率把握在百分之二以内。电子影像档案卷内页码过失率把握在千分之一以内。每页电子影像左右端正度把握在三度以内。电子影像漏扫,压边率把握在千分之一以内。电子档案与条目数据的挂接全都,过失率小于千分之一以内。七、 批量挂接扫描处理后的图像成品,按年度、机构上传至档案专用效劳器,利用档案治理软件中的对应挂接功能将扫描图像信息与录入到档案治理软件系统中的名目进展对应挂接,确保名目与原文的一一对应。挂接到档案治理系统中区

19、,进展再次的成品验收。八、 还卷及数据备份提交1原始档案复原工作严格依据国家档案局规定的相关标准和实际状况进展有序的复原,将复原的档案资料逐卷细心检查,确实没有落页、掉页、折页等问题后再归还档案治理人员,经双方认真核实无误后,在还卷交接单上签字确认。在数据化加工过程中的各项工作记录,在数据转移完成后、提交给用户方。为了有效地保护数据,因此建立数据备份制度,在数字化加工工程工作完毕,并经用户在终验报告上签字确认后,将通过验收后的数据利用用户软件DVD 光盘中,刻录完成后再制作一个光盘备份,或用移动硬盘等存储介质,将全部成品数据备份,提交给用户。刻录光盘要求:、光盘制作两份,制作成档案数据格式为多

20、页TIFF、同一份文件不跨越二片DVD同一份文件页数需在同一DVD、电子档案存在于符合标准的单片包装光盘、光盘标示光盘编号,单片包装盒上注明光盘内主要信息、在光盘刻录完成后,与硬盘系统中电子档案进展一次比对,确保档案资料无遗漏及正确性。、制作光盘人员对于全部光盘序号进展标记,并提交相应表格。第三节 质量把握方案和保证措施工程加工总体质量目标:保证合格、争创优良!一、 加工质量保障措施严格遵照执行我方签定的不分包、转包三峡大学档案数字化工程承严格依据我方制定的人员和设备投入打算进场加工,确保人员设备供给,为工程进度和质量供给保障。在该工程加工过程中,我方全部现场加工人员均受我公司数字化作业人员质

21、量考核制度的约束,并担当相应奖罚结果。二、 多环节,多层次的质量检查体系。完整性和即时性;数据内容齐全,属性数据输入准确;与数据校对的档案交接。纸质档案实体完整,还案准时无误。对数据迁移的质量检查,主要内容:迁移后的数据的完整性准确性;对数据进展组合查询并且结果正确;对数据进展汇总统计并输出标准表 格,试运行无死机现象。在完成以上每个环节后,检查人员将其数据再次进展一遍全面的复查,尤其对检查记录单上更正后的错误进展认真的检查,确保扫描得来的数据与源文件内容完全全都。实施工程负责人对成品数据进展百分之十的抽查,在抽查时将该查数据的年度、保管期限、全宗号、卷号、卷内挨次号等名目信息是否准确无误,再

22、对猎取图像数据的亮度、歪斜、是否错页等方面进展抽查,如有不合格的数据准时进展统计和修正,确保最终数据的准确无误。三、 阶段性验收与终验相结合的严格验收程序是质量把握的终极保障。工程名称工程编工程名称工程编号报告人时间工程负责人所处阶段工程状态参数监控状况工程状态打算状况实际状况偏差扫描订正措施工程进度工程工作量工程工作量人 时 工程规模工程外工作量状况描述 非工程工作其他工作中遇到问题及困难:需要用户支持与协作:用户意见:用户签字:签字日期:终验报告工程名称工程名称工程编号报告人时间工程负责人第 阶段本阶段工程完成状况验收工程完成状况备注档案整理卷档案扫描A4页, A3页,其他页图像处理卷页索

23、引名名目入条OCR全部报表输出卷资料装订内部验收卷,页件名目与图像文件的连接数据是否上传到效劳器名目与图像文件的连接数据是否上传到效劳器数据备份年月阶段的成品验收,乙方所供给的数据根本满足甲方的要求,甲方同意通过验收,进入下一个工作阶段。用户签字:日期:工程经理签字:日期:一、 为了确保采集数据不外泄,在开头进展数字化加工后,我公司将不允许加工人员携带任何存储介质进出加工现场。二、 为避开采集数据在硬盘上的物理磁道上被复原外泄,我公司将使用乙方供给的电脑用于数据采集作业。三、 电脑上全部的可以读写存储介质的接口,自进场之日起即贴上封条,直到工程完工。四、 为避开数据采集过程中数据通过网络外泄,我公司在加工期间将关闭外网,只使用局域网完成数字化作业。五、 为了建立并严格落实安全保密制度,保证档案资料的安全保密性,做到确定不外泄任何信息。保密协议将同加工合同同时签定并成为合同不行分割的一局部。见附件。附件:保密协议保密协议甲方:乙方:数字科技地址:鉴于甲方托付乙方担当其档案资料的数字化加工效劳,乙方可能接触到甲方某些非公开的,涉密的文件、档案和资料,为了维护甲方资料的安全,保守国家隐秘,乙方同意在整理档案中涉及大量的重要的档案材料担当保密义务,并遵守如下保密规定:1, 乙方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论