版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、招标标段编号:HBDL-KJ-0907-01河北省电力公司2009年科技项目第一批设备材料招标河北省电力公司培训档案管理信息系统研发投 标 文 件(技术部分)河北新远方科技公司二00九年九月一、 前言1.1总体简绍自九十年代初以来,各行业单位便开展了档案管理信息化的推进工作,十几年来,档案管理信息化的工作也取得了较大的进步,档案信息化管理的发展历程及趋势可以分为如下几个阶段:l 条目级管理阶段(单机阶段):在这个阶段,所有软件所使用的开发平台及操作系统本身都还需要比较落后,只能实现对档案数据的索引管理,无法实现对档案数据原文的管理。更无法实现档案数据的网络化管理。l 原文管理阶段(单机阶段):
2、在这个阶段,大家已经开始将档案索引信息所对应的原文进行扫描,并挂接入系统,已实现对档案数据的全文管理。并且已经开始尝试进行档案数据的网络化管理尝试。但仍以单机管理为主。l 网络化管理阶段:在本阶段,建立单位内部的档案管理网络化系统已成为共识,有条件的单位开始在本单位内部进行档案的网络化管理,并取得了初步的成功。l 集成化管理阶段:在本阶段,用户对档案网络系统的要求更加严格,希望档案系统不要成为单位内部的系统孤岛,要求将档案系统与各种信息化系统进行对接,已实现集成化的管理,将需要归档的数据通过集成处理直接归入档案管理系统中来,以减少档案人员的工作量,提高工作效率。目前档案行业正处于本阶段。l 数
3、字档案管理系统阶段:到了这个阶段,用户对档案网络化的要求更高,除了满足前述集成化管理的要求,还要求将其行业或下属单位的所有数据进行全面的整合,利用现代的网络技术、安全技术、搜索引擎等技术,实现分布式的、虚拟的、统一管理、统一利用的档案管理信息平台。目前国内外均已对此进行了大量的研究,国家档案局十一五规划中也明确提出要进行数字档案管理系统系统的建设与推进工作。l 知识管理阶段:在实现了数字档案管理系统系统功能后,人们对档案管理的要求将会从“重管理、轻利用”向“重管理、更重利用”发展,真正体现“管理档案不是目的,利用才是目的”这一指导思想,档案的概念将更加模糊,档案管理的范畴将更加宽泛,只要是对单
4、位有用的信息,都将成为单位的知识而进行管理与利用,而做为单位内部最大的一部分知识:档案,必然会成为知识管理系统中的重中之重。目前,国外如宝马、西门子等国际知名企业均已开始知识管理系统的研制与推进工作。1.2建立数字档案管理系统的必要性1.2.1 什么是数字档案管理系统我国的档案信息化建设从20世纪80年代末,国内使用小型计算机管理档案机读目录开始起步,之后发展到使用微型计算机利用关系型数据库开展中大规模的信息检索,再到利用多媒体、网络技术开展现代意义的信息服务利用,档案信息化建设经历了摸索实践、建立理论、逐步深入的复杂过程,为今后的发展奠定了信息资源基础和技术基础。随着我国信息化建设和国家数字
5、图书馆工程建设的开展,档案工作者们发现,档案与图书及其他文献之间在信息属性上的差别将随着信息技术的发展而逐步淡化,并由数字图书馆引发了对档案信息化建设的思考,从而提出了数字档案管理系统的建设目标。对于数字档案管理系统,国际和国内都有着许多不同的看法和理解,即使在国家档案局2000年立项的各地数字档案管理系统的建设过程中,对于建设目标也经过了多次转变。经过摸索和实践,国内对数字档案管理系统的认识基本统一为:数字档案管理系统是采用现代高新技术所建立的数字档案信息系统,是档案信息的组织模式,代表的是一种信息环境和基础设施构建,是超大规模的、便于使用的、没有时空限制的知识信息中心。我们认为,既然数字档
6、案管理系统是档案信息化建设的发展方向,那么就必须站在信息技术和档案工作发展的高度进行深入分析和思考。数字档案管理系统是国家机关、企事业单位按照行政隶属关系或业务指导关系,通过本部门政务网或其他基础网络,将档案馆及立档单位档案室结合起来,以统一的数据库标准、软硬件平台和安全控制手段为基础,为各级各类工作人员提供综合信息服务的虚拟的档案馆(室)集群。这种意义上的数字档案管理系统建设是国家数字档案管理系统的信息基础,具有时效性和现实性,与本部门的信息化建设联系紧密,便于实施。我们提出的数字档案管理系统建设即以此为出发点进行规划。数字档案管理系统表现出如下一些特点:l 首先,它一定是利用现有计算机技术
7、建立起来的一套信息化系统,它与当今众多利用信息技术建立起来的其它应用系统一样,需要考虑大量的存储、利用、安全、传输加密、身份认证等诸多问题;所以,只有在充分考虑并利用了这些技术的基础上,才可能建成我们理想中的数字档案管理系统;l 其次,数字档案管理系统系统即为数字档案信息集成系统,它完全不同于传统意义上的档案馆,它所管理的不再是传统的纸质文件,而是数字信息;所以,这就要求如果要建立数字档案管理系统则必须将现有的纸质文件进行数字化,并需将数字化后的档案信息完全纳入数字档案管理系统信息系统中,没有信息数据,就不可能称其为数字档案管理系统,所建立的数字档案管理系统也是没有任何意义的;l 第三,数字档
8、案管理系统一定是利用信息技术建立起来的虚拟的档案馆,完全不同于传统意义上的档案馆,它是没有地理概念与时空概念的档案馆,是一种全新意义上的档案馆;所以,为了建成数字档案管理系统,保障其正常运行,必须得投入人力物力进行各种标准及规范的制定与建立,如“数字档案信息管理与存储规范”、“数字档案管理系统计算机信息系统安全防护策略”、“数字档案管理系统信息交换标准”等;l 第四,数字档案管理系统一定是一种分布式的档案馆,即数字档案管理系统一定是多个数字化档案馆的集群,简单的将某一个档案馆的档案资料进行数字化并进行发布利用,我们只能称其为数字化档案馆,而不能称其为数字档案管理系统,这也是与目前数字图书馆有较
9、大区别的地方;所以,在数字档案管理系统的建立过程中,一定不应该只考虑主管部门本身,而应该将所有的下属单位的档案管理与利用一并纳入到数字档案管理系统的总体方案中,可以在主管机关建立超级服务终端,同时应在下属单位设立多处分终端;l 第五,数字档案管理系统的利用一定是以基于现代网络技术、没有时间限制的、利用起来非常方便的应用系统,能够让利用人员真正做到随时随地调用其想查找的档案资料;所以,要想建成数字档案管理系统,必须有完备的网络硬件基础,能够将所有下属单位完全连接起来,这样,就能够保证可以将数字档案信息在专网中进行发布,当然,也可以有选择地将部分档案信息进行基于WEB的发布而向公众公开,以提高有价
10、值档案的利用率;l 第六,数字档案管理系统所管理的对象不仅仅是历史档案,现行档案也应纳入整个数字档案管理系统的建设体系中来,有时,甚至要超越档案的范畴,凡是对现行工作有参考意义的资料、信息,均可以采集到数字档案管理系统系统中来,以提供利用; l 第七,数字档案管理系统不仅仅是一套档案馆管理系统,各级、各单位所使用的单位档案管理系统也应是数字档案管理系统的有机组成部分,其管理的信息也应可以适时的通过各服务终端进行网络发布而提供利用,同时,各单位所使用的档案管理系统应与服务终端保持定期的数据交换,从而实现数字档案信息的远程传输与接收,即档案资料的网上移交;l 第八,数字档案管理系统不是一个完全独立
11、的系统,它会与其它的应用系统发生大量的联系,如OA系统、ERP系统等,这些应用系统中会产生大量的需要归档的信息,而这些信息应该通过接口系统直接归入各级、各单位所使用的档案管理系统中去,再通过网络发布机制及电子文件的网上传输与接收机制进行网络发布利用及向主管部门进行定期的数据移交;所以,从这个意义说,数字档案管理系统同时也应是单位信息化系统建设的不可忽缺的组成部分。l 第九,数字档案管理系统系统应该具有工作流、邮件及消息管理功能,能够实现数据接收、管理、利用的审批。1.2.2 为什么要建立数字档案管理系统(一)建设数字档案管理系统是实现信息共享,提高信息综合服务效率和质量的根本途径。随着各企、事
12、业单位的信息化建设的不断深入,将在各级机构和部门建立包含公文、档案、资料在内的多种数据库,但正是由于机构行政分工或技术分工的不同,将会导致信息之间的联系可能被人为地割断,而无法快速利用信息的全部内容,这也就是我们常说的“信息孤岛”问题。而数字档案管理系统建设区别于传统的档案自动化最根本的一点,就是利用网络和数据库的开放接口,实现跨部门、跨系统的信息资源共享。因此,我们通过建设数字档案,依托单位的办公系统平台,通过统一信息利用标准,在安全保密的条件下,实现各系统中数据库的互联互通,为本单位人员提供有效、快捷的信息获取渠道,实现本单位信息资源的高度共享,从根本上提高信息综合服务效率和质量,充分发挥
13、文档信息在领导决策和科研工作中的服务作用。(二)建设数字档案管理系统可以统一全行业档案管理标准,统一管理。目前本单位及各下属单位均已实现了档案管理的自动化,但是由于相互之间所使用系统的独立性,使得各下属单位均按各自的想法与要求去定制各自使用的系统,而主管部门也无法及时了解各单位的档案软件定制情况,无法执行统一的档案管理标准,通过建设数字档案管理系统系统,所有的标准、规范均可以统一定制到一套系统中,全行业统一使用一套系统,有利于档案管理标准化的推进。通过这种方式,有利于全行业档案的统一管理,极大的提高档案管理水平。(三)建设数字档案管理系统可以实现全行业档案信息资源的互联互通。目前各下属单位的档
14、案信息资料均单独保管,各自利用,这样不利于充分发挥档案信息在领导决策和科研工作中的服务作用,不利于档案信息资源的利用最大化,不能实现档案信息资源在本行业的互联互通,通过建设数字档案管理系统即可以很好地解决这一问题。1.2.3 目前数字档案管理系统在国内外的发展 据了解,美、英等发达国家在90年代中期已经开展了数字档案管理系统的研究和实践。通过NARA(美国档案文件署)网站,可以检索到包括10个总统图书馆在内的200多个档案馆的数字化档案。国家档案局从1996年对数字档案管理系统进行了一系列的研究。1999年,国家档案局和深圳市档案馆提出了建立数字档案管理系统的构想。2000年又把“数字档案管理
15、系统工程研究与开发”作为全国重点档案科技攻关计划下达给深圳市档案局与国家档案局科研所共同承担,并将其列入国家档案局的“十五”规划,同时在深圳开展试点工作。目前在国内还没有一家建成真正意义上的数字档案管理系统。1.2.4数字档案管理系统建设的主要内容 数字档案管理系统建设的主要内容包括:标准规范体系的建设、数字信息资源建设、基础平台建设、基础设施建设、信息安全体系建设和人才队伍建设六个方面。(一)标准规范体系建设。标准规范体系建设是数字档案管理系统工程的重要支撑。在数字档案管理系统建设过程中,如何将多元化的档案信息资源协调组织起来,通过网络互联互通,实现信息共建和共享,以及数字信息的长期保存和迁
16、移,其关键就在于标准化。因此,我们必须按照先进性、完整性和可调整性的原则,借鉴和采用国内外成熟、相关的标准和规范,研究制定切实可行的标准规范体系。主要包括管理性标准规范、业务性标准规范和技术性标准规范,尤其是元数据标准。(二)数字信息资源建设。数字信息资源是数字档案管理系统得以生存发展的基础和核心。信息资源不仅涵盖原有的传统意义的档案信息,并且其信息采集的范围将进一步扩大到现行文件、各信息系统的专业数据库和专题数据库以及从互联网、政务网等各方面收集的与本单位相关的各类信息。正是考虑到数字信息资源的多样性和非结构性等特点,我们将在建设过程中引入OAIS(开放档案信息系统)参考模型,解决数字信息资
17、源长期保护问题和维护数字信息的可存取性。在这个模型中,我们将采用对象分类法来标识和区分用来支持数字信息保存的不同种类的元数据,并把每种信息和它的元数据作为一个“信息包”捆绑在一起。一个信息包由“内容信息”和“保存描述信息”两部分组成。内容信息包含了各种数字资源或数据对象,保存描述信息则包含了各种描述元数据。这样,无论信息技术发展到何种程度,当用户提出信息利用请求时,系统会同时提供可以读取该信息的工具和便于用户理解的各种描述信息,确保信息的有效利用。数字信息资源建设包括传统的馆藏档案的数字化信息、直接接收的数字信息、通过其它信息系统及其它分支业务网络收集的各种类型电子文件及其元数据、通过互联网或
18、其它本部门之外的专用网络搜集的信息以及直接采购的与本单位有关的行业数据库和专题数据库。(三)基础平台建设。数字档案管理系统基础平台是一个动态的、可扩展的信息网络系统,在整个数字档案管理系统体系中起着承上启下的联接作用。一方面可以按照相关技术标准与现有各应用系统完整结合,获取各方面信息,丰富数字信息资源;另一方面,通过良好的人机交互,为用户提供跨地域、跨部门的信息服务。数字档案管理系统基础平台主要包括文档一体化系统数据接口、信息采集系统、档案信息管理系统、档案信息利用服务系统和运行维护跟踪管理系统。(四)基础设施建设。基础设施建设包括网络建设、硬件设施建设和软件建设。1、网络建设是数字档案管理系
19、统的通信保障,包括单位总部的网络建设和下属单位档案室的网络建设,并通过统一的网络软硬件环境,依托现有的政务网构成虚拟数字档案管理系统基础网络。2、硬件设施建设包括档案馆(室)开展信息化建设所必需的网络设备、数字加工设备、海量存储设备以及计算机和输出设备。3、软件建设除运行必需的各类操作系统软件外,还应包含自行研制开发的通信软件、邮件服务器、系统管理软件、安全管理软件等系统。(五)信息安全体系建设。在数字档案管理系统的建设和运行过程中,如何确保信息的安全保密是提供信息服务的前提和保证,必须通过信息安全体系的建设,确保信息的可用性、保密性、完整性和抗抵赖性,同时还必须满足系统的可靠性、可控性和稳定
20、性。信息安全体系建设包括:建立完善的信息安全保密制度、采用切实有效的安全保密措施和进行安全监控与审计。(六)人才队伍建设。数字档案管理系统的建设不仅为我们带来了技术上的巨大进步和工作效率的极大提高,并且从客观上对各级档案部门工作人员的科技素质的提出了较高的要求。我们在进行数字档案管理系统建设的同时,必须坚持以人为本的原则,把培养人才、建设队伍、提高素质放在第一位,培养和造就一支具有良好的职业道德、较高水平的信息工作能力和较全面的知识结构的复合型人才队伍,并通过院校教育、在职培训、引进人才等方式保持人才队伍的先进性,使信息技术不断与实际工作相结合,为数字档案管理系统建设创造发展基础。二、 档案管
21、理系统建设方案2.1建设目标本项目将开发一套河北省电力公司培训档案管理系统,实现系统内所有职工培训档案管理的信息化,实现各种培训数据的自动计算、汇总、查询和报表等功能,提供了“一体化”的多部门应用模式和职能型综合管理方案,实现公司领导、人力资源部、送培单位、培训中心从决策层、管理层、业务层的信息共享,从而实现教学培训档案管理一体化,信息流统一化的良好管理模式。在企业的多种信息化应用系统中,电子文件的数量在不断的增大,电子文件的格式在不断的增多,不同格式电子文件的存储方式及打开方式不同。随着系统硬件、操作系统、运行环境、应用软件的不断变化、更新,电子文件的长期保存、及利用的问题必将成为档案信息化
22、管理迫切需要解决的首要问题。随着现代企业的分支机构不断增加,档案应用系统的负载和数据量也日趋庞大,如果将所有的档案数据都集中到一个文件服务器或数据库服务器,这必然导致档案数据管理、保存、利用的性能及效率的降低。培训档案馆管理系统建设目标:l 建立基于J2EE平台的标准化、可扩展、多部门协同的分布式数字档案管理系统系统;l 具有档案信息获取、管理、存储、利用、交换和服务等一系列功能;l 向档案利用者提供一站式、无缝集成的、个性化的档案查询服务以及其他相关服务;l 向所有的档案用户提供基于WEB的界面,包括:用户提交界面、搜索界面、系统管理界面等各种界面。利用Java虚拟机和Java服务器技术,系
23、统允许用户通过浏览器访问系统;l 采用强大的工作流引擎建立档案管理工作相关业务的审批流程。2.2设计原则培训档案管理系统基于J2EE平台的分布式数字化档案馆系统,系统的所有代码均使用JAVA语言开发。系统的后台数据库系统采用关系型数据库系统,支持ORACLE、SQLSERVER、DB2、SYBASE、MYSQL等多种数据库系统。系统中的所有配置采用XML技术。系统的通讯协议采用HTTP,TCP/IP,SSL。根据档案管理的特点,档案的应用程序、处理的数据及实际的计算多广泛的分布于网络中,为了平衡这种分布,采用RMI技术实现系统的分布式计算,RMI是远程方法调用(Remote Method In
24、vocation)。RMI技术可以实现档案业务所涉及的数据移交,即档案组织的下级机构的数据可以主动或被动的通过网络传输迁移至组织的上级机构。技术架构如下图所示: 整个系统被划分成五个相对分开的逻辑层面:1)展现层:采用Struts框架实现MVC模式的展现层。是展现给系统所有用户的图形界面,它包括HTML、JSP、Servlet、Java Applet。采用MVC模式的优势在于:代码重用性,MVC可以使用多种用户图形界面而系统核心处理功能无需改变;提高开发工作的协同性,并且图形界面的变更不会导致核心处理功能的变化;因为显示功能与处理功能的分开,所以在不需要重新编译核心处理功能的情况下可以修改系统
25、的图形界面。2)应用层:实现所有的档案管理业务逻辑。包括所有的档案管理功能,如档案的摄取、管理、保存、利用、访问等。工作流引擎贯穿整个系统的功能及业务流程,使各个相对独立或有先后次序的功能可以有机的结合起来,功能之间有相互调用的接口。3)服务层:作为整个系统的服务总线,为整体系统提供面向服务架构的开发工具包。其原理是将基础功能合并到开发工具包中,统一提供API接口供"应用层"调用,例如JavaMail为所有的模块提供邮件服务。这些开发工具包有:邮件服务类、消息服务类、文件处理类、FTP处理类、XML处理类、字符集转换类、唯一主键生成器、分页处理类、数据类型转换类、树型结构处
26、理类、报表处理类、采用RSA算法的文件加/解密类、Enterprise Service(企业注册服务)等。其中,Enterprise Service(企业注册服务)允许开发人员扩展现有的服务基础,例如注册不同的服务将信息包引擎产生的"信息包"转换为特定的数据结构提供给不同模块。4)信息包引擎:信息包引擎层是进行逻辑包与物理存贮包之间的转换层。它完成从信息包数据到数据库、文件系统、外部各种数据源之间的交互与存取功能,并提供统一的访问接口。本层向上提供访问接口,包括定义、查询和更新三方面的功能接口,向上层提供以DOM形式的信息数据包,将经过服务接口从各类数据源中获取到的数据转换
27、为信息包、将数据修改命令转换为标准格式提交给服务接口执行。实现服务接口的跟各种数据源的链接的可独立发布的java bean程序包,如与数据库的接口程序、与文件系统的接口程序等。数据库接口使用hibernate 数据对象持久层技术实现。Xml文件访问使用w3c标准格式定义的xml文件系统作为数据源访问。也提供到CORBA、EJB、soap、web service等的数据访问接口。5)数据层:存放系统的应用数据,是上层的数据源。数据源可以是关系型的数据库系统,如Oracle、MS Sqlserver、Mysql等;也可以是XML文档集(按照XML规范存放的数据);还可以是如轻量级目录访问协议(LD
28、AP)服务器的目录服务。 其系统构架如下图所示:2.2.1 建立基于OAIS参考模型的数字档案管理系统系统 什么是OAIS1995年,在国际标准化组织(ISO)的请求下,空间数字系统咨询委员会(Consultative Committee for Space Data Systems,CCSDS)开始开发一个存档标准以支持数字形式存在的数据的长期保存。CCSDS的这一工作导致1999年5月开放档案信息系统(Open Archival Information System ,OAIS)参考模型的发布。这一参考模型针对数字信息的长期保存和维护的档案系统提供一个概念性的框架,描述了一个
29、档案系统存在的环境、档案系统的功能组织以及支持档案处理的信息基础结构。这一参考模型作为ISO的推荐草案得到了广泛的评阅,经过扩充,适用于图书馆、档案馆及其它文化传承机构、政府部门和私有机构。新的OAIS于2001年7月发布。 建立数字档案管理系统系统为什么要采用OAIS参考模型自OAIS发布以来,很多数字档案的研究和开发的项目都以OAIS作为一个优先遵守的标准规范。OAIS参考模型同时支持数字化的和物理存在的存档信息。它特别对数字化信息给予了较多关注,这些数字信息或者是作为档案的主体,或者是作为对数字化资源以及物理存档资源的支持信息存在。在OAIS参考模型中,提供了一个完整的档案
30、信息保存功能,它包括摄入、档案存储、数据管理、存取和分发。它同时论述了数字信息从一种媒体或格式到另一媒体或格式的移植、信息表示的数据模型、信息保存中软件的作用、档案系统之间数字信息的交换等。它还确立了各个档案功能内部和外部的接口,以及一系列在这些接口之上的高层服务。在CCSDS和ISO的推动下,OAIS参考模型成为了数字档案系统普遍遵从的标准规范,来自图书馆、档案馆、科学数据、文化传承等领域的相关项目和系统都纷纷以其为准,进行系统的规划和设计。飞扬数字档案管理系统系统建设,也将遵循OAIS参考模型。 OAIS参考模型在国内外的应用(1)CEDARS(CURL Exemplars
31、in Digital ARchives)Cedars是英国的三个CURL机构在1998年4月到2002年3月间进行的一个研究项目。Cedars项目关注5个方面的研究内容:保存元数据、知识产权、数字馆藏管理、技术策略和分布式数字档案原型系统。其中分布式数字档案原型系统是Cedars项目为了验证Cedars项目中提出的长期保存方法的有效性而创建的一个系统,并且通过它证明了数字保存是一个可以解决的问题。Cedars的分布式数字档案原型系统的目标并不是解决所有的“数字保存问题”,而是从一个更加实用的角度,来考虑数字资源的保存。对于一个特定的数字资源,这一原型系统希望能够达到的目标是:使数字资源能够在长
32、期保存的存储体系中能够持续存在;确保被保存的数字对象能够被找到;使这些被保存资源在一段时间之后仍然能够被理解。Cedars的原型系统以OAIS为基础,OAIS参考模型中所描述的功能和特点都不同程度地在Cedars分布式数字档案原型系统中得到了实现。Cedars提出的分布式数字档案原型系统是一个“联邦的”数字档案解决方案。它实现了一个包括协作、互联和分布式档案存储的体系架构。在实际中,Cedars原型系统是由地理上相互隔离的3个站点组成的、包括三个数字档案的分布式框架。(2)NEDLIB及DSEP(Deposit System for Electronic Publications )NEDLI
33、B开始于1998年,到2000年结束,该项目由欧洲国家图书馆联合会常设委员会发起,由欧洲委员会电信应用项目支助,欧洲8个国家的图书馆、一个档案馆、两个ICT组织和三个主要的出版商参与了这个项目。NEDLIB项目的一项重要工作是做数字资源保存的功能说明和DSEP的全面设计。主要目的是确定所有保存机构的共有的功能需求,从而使DSEP的设计可以达到一个高层次,可以作为单个机构保存资源时的基础架构而存在。项目的目的还包括长期保存问题的研究。该项目对长期保存不同方面进行了研究,包括性价比、法律限制、与出版商的协议、用户访问需求、保存策略的选择等。NEDLIB主要致力于保存的技术问题的研究。除了制定抽象模
34、型和实验性保存战略外,NEDLIB还非常重视程序设计和结果的重用。该项目保存所有的推荐标准、技术解决方法、实践经验、技术框架和组织方法,从而为使用DSEP时提供实践指导。NEDLIB提出了基于仿真的长期保存方法,其中主要的组成部件是仿真器说明(emulator specifications)、仿真说明解释程序(emulator specification interpreter program)和仿真虚拟机(emulation virtual machine)。NEDLIB在保存机构需求与OAIS间建立映射,然后将OAIS模型细化为DSEP,这样DSEP可以执行OAIS标准。NEDLIB将从数
35、字资源的选择到最终用户访问的工作流分为13个步骤,并将这13个步骤映射为OAIS功能实体集合。(3)e-Depot的DIAS系统e-Depot系统是一个完全自动化的、专注于长期存储和大规模存档的自动化系统,是荷兰国家图书馆针对长期保存和持久存取荷兰电子出版物的需要而提出。2002年12月12日, 由IBM开发的e-Depot的核心数字信息存档系统(Digital Information and Archiving System,DIAS)完成开发。e-Depot提出需要将长期保存功能从出版物的生产者中分离出来,构建大型受控存档环境的设想,并且这一受控存档环境还必须符合OAIS参考模型。在e-d
36、epot中,这一存取和维护数字对象的大型受控存档环境就是IBM所开发的DIAS系统。E-depot采用了将仿真和迁移相结合来实现对特定数字对象的保存,提出了统一虚拟计算机(UVC)的方法和在保存系统中管理媒体移植的方法。(4)目前国内尚没有一整套的完全基于OAIS参考模型而开发的数字档案管理系统系统。三、 省电力培训档案管理系统功能设计方案整个系统将由三大中心及一个门户构成,即:“接收中心”、“管理中心”、“利用中心”及“门户”;以完成从信息的采集、管理、保存、利用的全过程管理。如下图所示:3.1 系统功能模型图3.2管理中心管理中心主要是完成对已收集进行的数据进行各种管理操作,如生成存储信息
37、包(AIP),进行信息的整理归类、进行档案数据的长期保存规划、包括与接收中心、利用中心通过工作流管理进行信息的审批交互等工作。3.2.1 工作流管理工作流的管理是有别于传统档案软件的核心标志之一,它将流程的审批工作贯穿于整个数字档案档案馆系统中,在接收下属单位数据、进行档案数据的鉴定、存储、档案查询的临时赋权、预约档案查询及排位管理时均需要使用此功能。它的实现,将有助于将档案管理从静态管理向动态的管理发展。3.2.2 长期保存规划 通过分析国外相关的项目和实践,并参考专家学者的研究成果,将数字资源长期保存的方法归纳如下:(1)多重备份与适时迁移功能多重备份的基本思想类似于数据库管理中的数据备份
38、,尽量避免因不可避免的因素而造成的数据损失。目前,各类数字资源保存系统多采用Cache技术,采用分布式架构,在位于异地的多台机器上分别缓存资源,一旦一方数据发生损失,可以迅速从其他缓存点恢复数据。适时迁移是根据软件、硬件的发展将数字资源迁移到不同的软件或硬件环境下,从而保证数字资源可以在发展的环境中被识别、使用和检索。根据迁移条件的不同,迁移可以分为硬件迁移、软件迁移、载体迁移、格式迁移、版本迁移和访问点迁移。硬件迁移主要是由于硬件更新而引起的,是将数字资源存储到新的硬件环境下。硬件迁移往往适用于数字保存单位硬件条件升级或提高的情况。软件迁移主要是由于使用的软件发生变化而引起的,是将数字资源转
39、移到新的软件环境下,以保证数字资源在新的软件环境下的可用性。载体迁移主要是由于数字资源存储载体的变化而引起的,是将数字资源转移到新的载体环境下。如将以光盘为载体的数字资源保存到硬盘中。版本迁移主要是由于软件更新或升级而引起的,是将数字资源转移到新的软件版本环境下,以保证数字资源在新的版本环境下的可用性。如将Word6环境下的文档转移到Word2000环境下。格式迁移是将数字资源从一种格式转换成另外一种格式,以适应新的环境下对数字格式的要求。如将HTML格式转换成XML格式。访问点迁移是指访问入口点的改变。如从客户端方式改为从WEB浏览器方式。(2)开放描述功能、建立元数据标准开放描述是目前流行
40、的一种数字资源长期保存中数据可读性与互操作性的解决方案。所谓开放描述指信息系统通过计算机可识别的开放语言和规范方式来描述自己系统各个层次内容。尤其是自己的数据格式、组织体系和管理机制。所形成的描述文件及其定义语言置于本系统公知位置、或递交公共登记系统,第二方系统可以对这些描述文件进行搜寻,按照开放语言规则进行解析,从而使第三方系统能识别、理解本系统的格式和规则,并在此基础上实现系统间的互操作。数字资源的开放描述可以将数字资源的存储、描述、组织、传递方式以第三方可以获取的形式描述,从而实现第三方或未来对该类资源的使用。开放描述与登记机制包括文件格式登记、描述登记和服务登记。文件格式登记一般实现文
41、件格式登记、格式识别、格式有效性检查、格式转换等功能。描述登记是对数字资源描述的一种开放性描述与注册方式,通过该种方式第三方可以了解数字资源的具体描述方式、方法、解析方法等内容,从而方便地使用该资源。目前流行的描述登记有元数据登记、持久标识符登记等。服务登记的目的是以一种开放的描述方法描述服务,第三方可以通过服务注册中心发现需要的服务,并通过服务请求调用等方式完成服务调用,从而实现需要的服务。目前流行的Web服务就是采用的这种方式,其中UDDI是该技术方法的统一描述、发现和集成中心,它可以完成服务的注册、服务发现与服务绑定。(3)模拟环境与环境封装功能模拟环境是在新的环境下模拟原有的数字资源保
42、存、运行环境,实现在新的环境下的资源的利用,如在Windows环境下模拟DOS环境运行DOS程序。环境封装是在对数字资源进行包装过程中,将该数字资源所需的运行环境,如动态链接库、运行环境等一起打包,从而实现在其它环境下运行该程序包,如在JAVA程序中加入J2SDK,从而保证在新的环境下的JAVA环境要求。可以创建在原始硬件环境下运行原始数据所需软件的软件模拟器来完成在未来的环境中运行原始数据的工作。这种模拟原始环境的方法可以有效地解决在数字档案管理系统中原始资源的长期保存问题。 环境封装包括在XML中包含原始文件、在描述文件中包含指向软件的链接、包含软件本身三种情况。包含软件本身往往是保存与数
43、字资源有关的所有内容,如文件本身、文件的上下文信息、文件运行的软件、硬件环境等。(4)数据恢复与数据考古数据恢复与数据考古是从原始的字节流中恢复数字资源的原貌,并保证数字资源的可读性和可用性。数据恢复包括数据灾难恢复、数据格式恢复等。数据恢复是具有技术挑战性的技术方法,值得注意的是,如果已经无法获取数字资源的原貌,就无法评估数据恢复的成果。因此在正常的图书馆数字资源保存过程中,不赞成使用这种方法作为长期保存的技术方法,而应该采用更为实际的运作方法。该方法仅在其他长期保存方法无法发挥作用时使用。(5)技术框架与整体解决方案技术解决是数字资源长期保存的根本性方法,但单纯地采用技术方法并不能解决数字
44、资源长期保存的全部问题,因此,许多研究项目试图从数据资源保存、管理、检索等宏观角度考虑数字资源的保存问题,长期保存技术方法的选择已不局限于某一种技术方法的使用,而是从国家宏观战略角度考虑资源的长期保存问题,技术方法的选择更加趋向综合,并根据资源类型的不同采用不同的整体解决方案。技术与框架研究成为目前数字资源保存方法研究中的重要组成部分。3.2.3 档案存储管理对各种途径采集到的数字档案信息必须进行安全有序的存储,保证用户随时对数字档案信息的有效利用,这是数字档案管理系统建设的一个关键环节。数字档案管理系统的核心是建立以档案资料目录数据库为基础,包含其所对应的各种类型的档案原文数据、电子文件元数
45、据的数据库集合以及与之关联的索引集合等。各类数据库的建立与维护管理:(1) 建立目录数据库。一方面要按照国家相关标准、规范和本单位制定的规定、规范建立文书档案、科技档案、声像和照片档案、实物档案、资料等信息的目录数据库并进行主题词和分类标引(可自动进行);另一方面,要建立与本单位工作和日常档案利用工作相关的专题数据库,如著名人物、重点工程项目档案数据库。(2) 建立原文数据库。以目录数据库为基础和出发点,通过扫描、声像数字化、网络接收、网络自动采集等多种手段建立与目录对应的包括静态图像、动态图像、文本以及其他格式文件的多种类型的原文数据库。(3) 建立元数据库。依照国家相关标准和本单位自身工作
46、特点,建立与原文数据库中数字化信息相对应的元数据信息数据库。包括数字化加工的技术背景信息、电子文件产生的背景信息、授权及数字签名信息和相关软件(分为编辑软件和查看软件两类)等。(4) 建立索引。数字档案管理系统所需要的信息索引分为两类。一类是用于档案馆自身数据库管理和查询的正序索引,一般由计算机系统自动完成;另一类是根据网络用户利用信息的需要,如全文检索、主题关联检索、分类关联检索等,而建立的倒序索引或复合索引,一般可通过人为干预随时建立。在本模块中,主要实现以下几大功能:数据接收功能、存储层次管理功能、媒体替换功能、错误检测功能、灾难恢复功能、提供数据功能。如下图所示:基于OAIS参考模型,
47、档案信息的存储管理流程及其辅助功能模型如下图所示;具体功能及其实现过程描述如下:(1) Receive data(数据接收功能):数据接收功能从获取功能接收一个存储请求及一个AIP信息包并且将AIP信息包移至档案中长久保存。为存储AIP选择适当的存储设备或媒体介质,传输请求可能需要指出由AIP组成的数据对象的预期利用频率。这个功能将选择媒体类型,准备设备或卷,并且执行物理移动至档案存储卷。在完成传输后,这个功能向INGEST发送存储确认信息。(2) Manage Storage hierarchy(存储层次管理):存储层次管理的位置,通过命令(指令)、基于存储管理策略的适当的媒体介质上的AIP
48、s的内容、操作统计、或者是从Ingest向数据接收发送存储请求的方向。它将遵循任何特殊级别的AIP必需的服务,或者遵循任何特殊的安全测量,并且确保AIP的适当保护级别。这些包括在线的、离线的或接近在线的存储,必需的吞吐率、最大限度允许的BIT错误率、或者是特殊处理,或者是备份程序。它监控错误日志以确保AIP在传输过程中不被破坏。这个功能采用统计学原理,为管理功能统计媒体的总容量、统计在不同存储层次上的有效存储容量。(3) Replace Media(媒体替换):媒体替换功能提供对过时AIPS信息包的再生能力。在媒体替换功能内部,内容信息与保存描述信息不能被修改。然而,组成信息包的数据可能发生改
49、变,但只要它继续执行相同的功能并且一直向前的执行,那么就不会导致信息的丢失。移动策略必须选择一种存储介质,必须重视各种媒体介质的错误发生率,它们的性能及价格。如果由媒体决定的属性(例如:录音带的块大小、CD ROM的容量信息)被包含在内容信息中,成为内容信息的一部份,那么当数据移植到具有更高容量的存储体系时必须找到保存此信息的解决办法。这个功能也许只是简单的完成“复制”,“重新包装(封装)”。举个例子,如“重新包装”,是移植到新的操作系统和文件系统下的媒体,内容信息与档案保存描述信息不会受到新的文件系统的约束。无论如何,在管理模块通过档案信息更新功能的监管下,“重新包装”与所有的转换合并在一起
50、执行,以确保信息的保存。(4) Error Checking(错误检测):错误检测功能提供统计上的可接受的保证,它保证AIP的组成部分在内部任何的档案存储数据转换期间不会被破坏。这个功能要求档案中的所有硬件和软件提供潜在的错误通知,并且这些错误可以发送到被档案存储模块检测出来的标准的错误日志。PDI(关于保存的描述信息)中的固定信息为AIP被移动或存取时不会被修改提供保障。类似的信息需要保护PDI本身。一种用于跟踪和校验档案中的所有数据对象合法性的标准机制也可能会被使用。举个例子,CRCs循环冗余码校验可以维护每一个单独的数据文件。一种高级别的服务,比如Reed-Solomon 译码支持组合错
51、误检测及修正,可能会提供。存储工序应该提供采用CRCs或其他错误检测工具进行任意验证数据对象完整性的机制。(5) Disaster Recovery(灾难恢复):灾难恢复为复制档案数字内容及存储在物理隔离设备上的副本提供一种机制。这个功能通常通过复制档案内容信息到一些可移动存储设备上(如直列磁带机、密集光盘机)完成。也可能通过硬件传输或网络数据传输来执行。(6) Provide Data (提供数据):提供数据功能提供已经存储的AIPs副本以便访问。这个功能接收一个AIP请求,识别被请求的AIPs且在被请求的媒体类型上提供这些AIP或者将它们传输到分段区域。3.2.4 档案管理档案管理主要负责
52、档案保存描述信息(PDI)的著录、维护、电子文件的挂接、数据的打印输出。包括维护管理数据库数据的完整性。这些数据不仅包含描述信息还包含系统信息。描述信息标识并描述档案的馆藏情况,系统信息用于支持档案业务的运作。负责创建所有表定义必须的所有数据管理功能;提供创建、维护、访问档案存储内容的用户自定义视图的能力。 执行数据的更新,包括数据的增加、删除、修改。并且接收来自访问模块的查询请求,执行查询,然后将查询结果集返回给查询者。 元数据管理元数据管理系统。它是整个系统的重要组成部分,其基本功能是为系统的运行建立基础。元数据管理系统的结构包括6个组成部分:(1)基准元数据系统。是指某个标
53、准的元数据系统。它的作用是:作为基准元数据,组织标识数字化信息资源;以标准形式描述用户的查询提问;为各种网络信息发掘工具提供数字化信息。(2)元数据字典。是一种用于各种元数据体系到系统基准元数据系统相互转换的对照表,它描述了各种元数据的基本特征,构建了各种元数据与基准元数据系统的对应关系。其基本作用是为系统的转换模块提供转换依据。(3)数据属性集。是指存储数据的属性总和。元数据管理系统可通过数据属性集将数据结构和基准元数据相对照,保障它们之间的可互换性。(4)数字化信息资源集。它描述的对象是信息源。系统可以通过信息源特征集来确定个信息源所采用的元数据体系,将用基准元数据表达的查询式转换成各个信
54、息源所采用的元数据表达式,从而决定各个信息源的检索方法并解释检索结构。(5)转换模块。提供了实现各种元数据之间相互转换、翻译的方法。(6)维护模块。可以对各种对照表进行添加、删除、修改等动态管理,保证元数据管理系统的可扩展性和可维护性。预归档管理预归档管理主要管理立档单位本身的公文(收发文)及在立卷归档前的文件数据。用户根据本单位文件(公文)管理的实际情况即根据需要管理的所有的预归档类型定义其库结构,及相关的报表、排序规则等。负责预归档库数据的完整性;执行数据的更新,包括数据的增加、删除、修改;并且接收来自访问模块的查询请求,执行查询,然后将查询结果集返回给查询者。还包括文件的分
55、发功能,这个功能主要用于立档单位的文件保管部门对已经形成的正式文件进行分发处理(文件的内发、传阅、外发)。采用JMS及JAVA MAIL技术对文件进行实时的网络传输。预归档管理的业务流程图如下所示:立卷管理立卷是将若干文件按形成规律和有机联系组成案卷的过程。立卷过程中,系统可以自动生成档案保存描述信息(PDI)中的固定信息,如档号、案卷号等元数据;系统可以根据组织提供的规范的归档范围标准,自动的生成分类号、保管期限等元数据。档案本身的多元性特点导致了不同行业的组织的立卷方式不一样,系统可以允许组织选择符合自己要求的立卷方式。系统还可以根据用户预先定义的档案实体的存放结构,自动生成
56、档案实体的物理存放位置(库位号),这样,真正做到了从文件鉴定,立卷,归档,到实体存放的自动一体化管理。统计管理统计管理包括档案通用统计、馆藏统计、操作日志统计、年报处理,四个主要功能。l 通用统计:数据来源是档案的保存描述信息(PDI),对一种类型的档案信息收集(AIC)的PDI统计。1、档案管理员对选择的档案类型进行统计;2、档案管理员对选择的某个档案类型下的档案库进行统计;3、统计列可以由档案管理员自定义;4、统计方案可以自定义,包括求和、最大值、最小值、平均值等;l 馆藏统计:数据来源也是档案的保存描述信息(PDI),统计档案的馆藏情况,可以同时对一个或更多的档案信息收集(
57、AIC)进行统计。1、统计列可以自定义;2、统计条件可以自定义,即可以由用户确定需要统计的数据范围;3、参与统计的档案门类可以自定义;4、可以自定义统计任务(作业),即可以保存每次与统计相关的所有设置;5、可以打印统计报表;6、统计报表的格式可以自定义。l 操作日志统计:数据来源是系统的所有用户,包括管理员、一般档案查询人员登陆系统后的操作信息,如登陆的时间、登出时间、进入的模块、使用的功能等。统计的方式一般是固定的方,即对操作的描述信息进行统计,而操作的描述信息是由本系统确定的。l 年报处理:档案管理员对本全宗的档案情况作总体描述、统计后以表格的方式向上级档案机构提交报表,包括本全宗人员情况
58、、人员结构、利用情况、档案库房情况、档案实体情况、档案移交接受情况等数据项。 1、系统可以利用本身现有的数据自动统计年报中的部分数据项:如室存档案数量(卷、件数)、 年度档案利用人次、年度档案利用情况等;2、系统可以根据年报各数据项之间的逻辑关系对用户录入的数据进行自动校验;3、系统可以接收下级单位的年报数据;4、系统可以向上级单位报送年报数据;编研管理1、档案编研工作定义:是以馆(室)藏档案文献为主要物质对象,以主动提供或报道档案信息内容,满足社会利用位主要目的,在深入研究档案内容的基础上,按专题对档案文件进行收集、筛选、加工,使之转化为不同形式的编研成果的一种专业工作。2、档案编研工作在本系统中的体现:档案管理员通过跨类检索工具检索到档案条目,可以将检索结果集转入到档案编研库中,形成档案专题目录3、编研工作人员可以通过全文检索查找档案信息,并可以将全文检索的结果集转入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 港口集装箱装卸区施工合同
- 铁路桥梁外墙保温施工合同范本
- 2024年度农田水利工程进度与质量监控合同3篇
- 矿井安全监测系统拉管施工合同
- 2024年度汽车贷款贷后信用评级及动态调整合同3篇
- 建筑隔音劳务分包合同模板
- 烟草制品行业伤害处理规范
- 校园防恐安全协议
- 2025汽车购销合同协议
- 广西壮族自治区河池市十校协作体2024-2025学年高一上学期第二次联考数学试题(解析版)
- 五年级上册英语人教PEP版课件书面表达
- 中国常用汉字大全
- PPT:增进民生福祉提高人民生活品质
- 开具红字发票情况说明
- 2022 年奥赛希望杯二年级培训 100题含答案
- 水利工程建设汇报材料(通用3篇)
- 10篇罪犯矫治个案
- 中央企业商业秘密安全保护技术指引2015版
- 艾草种植基地建设项目可行性研究报告
- 留守儿童一生一档、联系卡
- GB/T 2007.2-1987散装矿产品取样、制样通则手工制样方法
评论
0/150
提交评论