数字图书馆的体系结构及设计与开发_第1页
数字图书馆的体系结构及设计与开发_第2页
数字图书馆的体系结构及设计与开发_第3页
数字图书馆的体系结构及设计与开发_第4页
数字图书馆的体系结构及设计与开发_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主要内容设计开发数字图书馆的设计与开发体系结构数字图书馆的体系结构数字图书馆的基本体系结构1数字图书馆的信息体系结构2数字图书馆的技术体系结构3数字图书馆的系统体系结构4数字图书馆体系结构比较研究5数字图书馆的体系结构数字图书馆的基本体系结构数字图书馆的基本体系结构数字图书馆的基本体系结构资源库用户界面命名系统索引/搜索系统数字图书馆的基本体系结构资源库资源库的功能包括存储和管理各种数字对象,通常是由关系型数据库来管理。应用程序通过资源库提供的库访问协议(RAP)来访问资源库。可实现存储、访问、复制、移动和删除数字对象等操作。命名系统命名系统是针对长期标识符的分配、管理及解析的一个综合系统,CNRI为数字图书馆提出了完整的命名系统“调度系统(HandleSystem)”,它是一个独立的系统,其职能是负责数字资源的全球唯一的、长期的、独立于地址的命名的分配、管理和解析。索引与搜索系统索引的创建可能是由机器的自动扫描、手工录入和干预,或者是这两者的结合。客户机把查询式提交给索引服务器,将返回相匹配的数字对象的URN(统一资源命名,如调度码)。索引服务还提供被索引信息的元数据和查询机制。用户界面用户界面是用户与数字图书馆的接口,数字图书馆向用户提供的最终服务都是通过用户界面来实现的。什么是数字信息

数字图书馆的信息是由经过数字技术处理的数据元素组成,这些元素包括数字对象(digitalobject)、元数据(metadata)、句柄(也称调度码)(handle)实现服务集的子系统数字对象子系统仓储子系统名录服务系统索引服务系统用户接口网关数字图书馆的技术体系结构网络基础设施资源加工系统异构资源整合系统资源调度系统联合编目和馆际互借系统用户查询和服务系统安全认证系统版权保护与电子商务系统数字图书馆的系统体系结构用户界面查询系统调度系统图书馆服务器对象库系统制作系统基于三层客户机/服务器模式的数字图书馆的体系结构三层结构即浏览器/Web服务器/数据库服务器(B/S/D)的引入解决了两层的不足,相比两层结构具有以下优势:客户端零维护;可扩展性好安全性好资源重用性好三层结构典型的应用是基于Z39.50协议的数字图书馆结构,该结构如图所示。基于三层客户机/服务器模式的数字图书馆的体系结构IBM提出了三角形客户机/服务器模型的数字图书馆体系架构,该体系结构主要包括图书馆服务器、对象服务器以及客户机,核心是图书馆服务器,如图.

IBM数字图书馆三角形结构分布式数字图书馆的体系结构中间件结构:

中间件平台产品很多,基于目的和实现机制的不同,可以将平台分为:远程过程调用(RemoteProcedureCall)、面向消息的中间件(Message-OrientedMiddleware)、对象请求代理(ObjectRequestBrokers)。分布式数字图书馆的体系结构远程过程调用(RPC):远程过程调用是一种广泛使用的分布式应用程序处理方法;一个应用程序使用RPC来“远程”执行一个位于不同地址空间里的过程,并且从效果上看和执行本地调用相同。一个RPC应用分为两个部分:server和clientserver提供一个或多个远程过程;client向server发出远程调用;server和client可以位于同一台计算机,也可以位于不同的计算机,甚至运行在不同的操作系统之上它们通过网络进行通讯相应的stub和运行支持提供数据转换和通讯服务,从而屏蔽不同的操作系统和网络协议。分布式数字图书馆的体系结构面向消息的中间件(MOM):面向消息的中间件指的是利用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行分布式系统的集成;通过提供消息传递和消息排队模型,它可在分布环境下扩展进程间的通信,并支持多通讯协议、语言、应用程序、硬件和软件平台;目前流行的MOM中间件产品有IBM的MQSeries、BEA的MessageQ等。分布式数字图书馆的体系结构对象请求代理(ORB):随着对象技术与分布式计算技术的发展,两者相互结合形成了分布对象计算,并发展为当今软件技术的主流方向;1990年底,对象管理集团OMG首次推出对象管理结构OMA(ObjectManagementArchitecture),对象请求代理(ObjectRequestBroker)是这个模型的核心组件。它的作用在于提供一个通信框架,透明地在异构的分布计算环境中传递对象请求;CORBA规范包括了ORB的所有标准接口;1991年推出的CORBA1.1定义了接口描述语言OMGIDL和支持Client/Server对象在具体的ORB上进行互操作的API;CORBA2.0规范描述的是不同厂商提供的ORB之间的互操作。分布式数字图书馆的体系结构目前中间件的技术规范有DCE体系、DTP模型、J2EE、CORBA、互联网规范等.DCE体系:DCE(DistrbutedComputingEnvironment)由OpenSoftwareFondation制定,现在这个组织被称为OpenGroup。DCE由多个共同在一起工作的组件组成:远程过程调用(RPC)本地和全局目录服务(CDS和GDS)安全服务DCE线程分布式时钟服务(DTS)和分布式文件服务(DFC)线程、RPC、CDS、安全服务和DTS组件通常被成为安全核心,并且是组成任何DCE环境所必须的组件,DTS是可选件。DCE环境中,还包括用于管理这些组件的管理工具DCE被称做中间件或使其具有能力的技术,它不是独立存在的,而是被捆绑在供应商操作系统中,或者由第三方供应商进行集成。分布式数字图书馆的体系结构DTP模型:DTP模型是X/OPEN组织提出的一种软件结构,这种结构允许多个应用程序去共享多个资源管理器提供的资源,并且具有协调全局事物的能力。X/OPEN是一个独立的、具有全球影响力的开放系统组织,它得到了世界大多数的最大的信息系统供应商的支持,其根本任务是通过规范开放系统的具体实现,从计算的观点考虑如何让用户获得更大的利益。X/OPEN的DTP模型的组成:由应用程序资源管理器(RM)事物管理器(TP)通信资源管理器(CRM)等基本模块组成,各个模块之间X/OPEN模型定义了这样一些模块与模块之间的接口规范。分布式数字图书馆的体系结构CORBA:CORBA是CommonObjectRequestBrokerArchitecture的缩写,简称公共对象请求代理结构,它由国际对象管理组织OMG制定,这个组织是一个国际性组织,始建于1989年,现已拥有包括生产厂商与软件开发商800多个会员;其目的是在分布和已构计算机环境下为应用软件的开发提供一个公共框架,使开发出来的软件即面向对象又具有可重用性、可移植性以及可操作性等特点。分布式数字图书馆的体系结构J2EE:J2EE是Java2PlatformEnterpriseEdition的缩写,是一种多层应用模式的结构体系整个规范由SUN公司提出,它将业务逻辑从系统服务功能和用户界面中分离出去,放置在客户层和应用基础设施这两层之间的中间层,是目前应用的最为广泛的面向Web的应用系统结构规范。Web:Web是一种网络化的信息资源,它依赖于3个基础机制,使这些信息资源可以面对广大的使用者:一种唯一的命名机制,为网上的资源进行定位,如URI;一种通信规程,以便在网上可以存取这些被命名的资源,如HTTP;混合文本,以便更好地驾御这些信息资源,如HTML。分布式结构OAI:全称为OAI-PMH(OpenArchivesInitiativeProtocolforMetadataHarvesting)由美国数字图书馆联盟(DLF)、网络信息联盟(CNF)等组织于1999年提出的一个应用框架;最初目的是为了解决电子期刊的预印本的互操作和元数据收割(metadataharvesting)问题;2000年OAI协议的应用扩展到数字图书馆领域,目的是实现分散的、不同系统平台之间的元数据交换和共享,提高系统的互操作能力;OAI分为OAI服务提供者与数据提供者两部分;以OAI协议为基础的联合目录架构中,主要由OAI的服务提供者定期的向数据提供者主动抓取其中的元数据,建立集中的元数据联合目录;由于OAI是建立在HTTP协议上的应用层协议,所以其命令集是通过HTTP发送OAI给相应的服务器端程序的,服务器根据指令准备数据返回相应的记录集合,记录集合是遵循OAI协议的XMLSchema的XML的格式数据.服务提供者集中维护从各个系统中抓取来的元数据,并在获得的元数据上建立增值服务;数据提供者主要维护特定范围的数字资源,并且支持OAI协议来获取其中资源的内容分布式数字图书馆的体系结构OAI的结构图

OAI协议结构分布式数字图书馆的体系结构EU-NSF联合数字图书馆研讨会专门讨论了分布系统互操作性问题,提出了一个分布式数字图书馆参考框架,它由三个功能层构成:第一层为数字图书馆客户系统(DigitalLibraryClients),包括用户界面、自然语言处理、检索式分析处理、专门数据内容处理和浏览、多重数据结果处理等客户模块,经过用户界面客户通过一定机制调用;第二层为协调调解层(Coordinator/Mediator),在外部功能模块和元数据登记系统支持下对分布和异构的资源进行虚拟化整合,支持对分布式资源的透明利用;第三层是数据资源层(DataSources),各个数据资源作为自主系统,支持本地客户及本地功能,同时通过封装件和代理模块与协调调解层连接,从而被集成到整个分布式数字图书馆体系中。分布式数字图书馆的体系结构EU-NSF分布式数字图书馆参考框架:EU-NSF分布式数字图书馆参考框架分布式数字图书馆的体系结构分布式异构结构在数字图书馆建设领域著名的应用案例是NCSTRL和NSDL。NCSTRL:NCSTRL(NetworkedComputerScienceTechnicalReferenceLibrary)是有代表性的数字图书馆建设项目,它是由DARPA资助的,来自北美、欧洲和亚洲的160多家学术研究机构参与了该项目;体系结构以Dienst体系结构为基础,该体系结构的一个重要特征就是分布式搜索;NSDLNSDL(NationalSTEMDigitalLibrary,STEM—Science,Technology,EngineeringandMathematics)是NSF资助的、由多家单位来实施数字图书馆项目,它包括64个子项目;其目的是支持科学、技术、工程和数学教育,提供广泛接入和方便使用的分布式资源网络和学习机制;NSDL一期工程已于2002年底为公众提供服务,它是目前规模最大的数字图书馆项目;由于NSDL的内容和用户的多样性,为让各种用户共享不同的信息,最初的体系结构设计就是通过共享元数据,并利用元数据开发核心服务。分布式数字图书馆的体系结构NCSTRL体系结构分布式数字图书馆的体系结构斯坦福大学基于CORBA技术开发出了InfoBus中间件,InfoBus方案并专注于实现异构系统的互操作,提出了多达5层的独立服务:互操作层、元数据结构层、搜索协议层、通用支付接口和可互操作的权限管理框架,为在现有技术环境下实现数字图书馆进行了全面的探索,提供了一整套复杂的分布式结构模型,该结构模型如图3.10示。

图中IC表示客户接口,PM表示协议机,LS表示图书馆服务,IS表示信息资源,IPS表示信息处理服务。InfoBus模型是一个虚拟的总线结构,各异构的仓储、服务与界面如同插件一样插入总线集成一起。个对象系统间的交互协议为DLIOP,实现夸仓储的信息访问与查找,由一个元数据结构来实现对新增用户界面及查询翻译的支持。异构的仓储封装在图书馆服务代理中,并向客户程序屏蔽其异构件。组建到总线中的图书馆服务提供所需的功能,如查询翻译、元数据工具、权限管理等。新一代体系结构2004年6月在意大利召开的“数字图书馆的体系结构:对等网、网格和面向服务”会议中,学者围绕网格(grid)、对等网(peertopeernetwork,p2p)与面向服务(service-orientedarchitecture,SOA)等技术讨论构建数字图书馆新体系结构问题。德国的IngoFrommholz在”supportinginformationaccessinnextgenerationdigitallibraryarchitecture”一文中也指出网格、对等网与面向服务等技术构建下一代数字图书馆体系结构成为可能:设计高效低成本的下一代数字图书馆体系结构,使数字图书馆技术向更广泛的用户群体开放;快速适应DL服务及相关IT领域的发展;促使更广泛的内容与服务提供者的动态联邦模式。新一代体系结构SOA:SOA是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口联系起来;接口是独立于实现服务的硬件平台、操作系统和编程语言的;这种具有中立的接口定义(没有强制绑定到特定的实现上)的特征称为服务之间的松耦合;面向服务的体系结构是面向对象的模型的替代模型,面向对象的模型是紧耦合的;基于SOA的系统并不排除使用面向对象的设计来构建单个服务,但其整体设计却是面向服务的;SOA系统原型的一个典型例子是通用对象请求代理体系结构(CommonObjectRequestBrokerArchitecture,CORBA);在SOA构架中,Webservices是其一种实现方式,它定义了服务提供者、服务请求者、服务注册者三种角色;Webservices的主要技术包括XML、HTTP、SOAP、UDDI、WSDL等。新一代体系结构P2P:P2P是一种分布式网络,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源需要由网络提供服务和内容,能被其它对等节点(Peer)直接访问而无需经过中间实体;此网络中的参与者既是资源(服务和内容)提供者(Server),又是资源(服务和内容)获取者(Client);P2P打破了传统的Client/Server(C/S)模式,在网络中的每个结点的地位都是对等的;每个结点既充当服务器,为其他结点提供服务,同时也享用其他结点提供的服务;对等网中每个peer都是自治的,每个peer同是客户机也是服务器,整个结构中不需要中心管理,也不需要全局视图。新一代体系结构Grid:Grid是借鉴电力网的概念而提出;是将整个网络整合成一台虚拟的超大计算机;实现计算资源、存储资源、数据资源、信息资源、文献资源、知识资源、专家资源等的全面共享;实现分布式的硬件、软件资源和各种信息知识资源的全面连通,达到资源的最大共享。数字图书馆建设跟网格、对等计算、面向服务等技术结合是一种发展趋势,可以有效解决数字图书馆建设中遇到的问题,提高数字图书馆的可扩展性、可伸缩性、高柔韧性,提高数字图书馆的服务水平;IngoFrommholz在”supportinginformationaccessinnextgenerationdigitallibraryarchitecture”一文中列举了三种类型的下一代数字图书馆体系结构。新一代体系结构基于网格的虚拟数字图书馆体系结构:该体系结构典型代表是DILIGENT项目,其目标是构建一个有成本效益的为大量动态虚拟e-Science组织存取知识共享和合作研究的安全、可协调、动态的试验平台;建立在基于网格技术基础上的DILIGENT体系框架可动态构建和管理虚拟数字图书馆;DILIGENT系统规定数字图书馆服务、资源收集实体和元数据收集实体都以网格资源的形式存在,并基于DILIGENT系统的基础架构对其进行注册和调用;EGEE项目作为ILIGENT系统开发的合作伙伴,正在进行网格基础架构的革新研究,并且提供了DILIGENT系统所需的基础功能,包括资源的动态定位、跨组织的资源共享和基本的安全配置服务;同时为了高效支持虚拟数字图书馆的形成还需要一些增值服务,如支持大数据量的存储,动态数据分发,元数据代理,元数据和内容管理,高级资源代理,分布环境下资源内容的安全以及工作流的管理服务等;基于网格的DILIGENT系统试验平台可通过文化遗产领域和环境e-Science研究领域两个具体现实应用来验证网格数字图书馆的性能。新一代体系结构面向服务的分布式的数字图书馆体系结构:该体系结构典型代表是BRICKS(BuildingResourcesforIntegratedCulturalKnowledgeServices)系统,是欧盟第六框架计划资助的一个文化资源共享项目,项目于2004年1月1日启动,于2007年6月结束,项目预算经费为1.22亿欧元,目标是设计、开发和维持一个文化遗产领域面向用户和服务的知识资源共享空间;基于面向服务与P2P技术的BRICKS系统具有可扩展性、可伸缩性、可用性与可操作性等特征,它允许资源实体和服务实体随时随地加入和离开,但不影响整个数字图书馆系统的运行;它依托Internet,构建一个松散的、面向服务的数字图书馆基础架构。对于信息访问,BRICKS基于作业索引注释和协同工作方式,用户通过动态注释服务查询文档相关说明信息,注释服务将根据用户给出的搜索主题和作业目标进行查询。同时,BRICKS还保证动态产生的链接信息与对应文件的实时联系。新一代体系结构基于P2P的数字图书馆系统结构原型

图3.11基于P2P的数字图书馆系统结构原型新一代体系结构基于Web的集中式文档协作体系结构:该结构典型代表是COLLATE系统,它是为分布式用户群而设计的基于内容和注释工作的知识工作环境;它既支持单个用户工作模式也支持某一领域专家之间的资源共享和合作研究模式;COLLATE系统基于模型的模块化设计原则,使得其基础框架也适合于其他领域资源的服务和项目开发;该系统支持协作行为,如建立联合出版或集会,提供虚拟的展览材料,发布未刊出的注释和评注等;COLLATE系统能为文档中的文本与图表分别建立索引,作为深度分析的一种手段,注释可以单独创建一可以合作创建;通过注释,用户可以了解文档的路径等相关信息;COLLATE协作是集中了很多功能的多功能软件包,它被看做是分布式的、面向服务的数字图书馆体系结构原型,它的文档注释机制为信息访问提供了一种新的方法。云计算体系结构云计算背景:云计算(CloudComputing)是2007年产生的一个新概念,但不久其热度就超过了网格计算(GridComputing);由于规模巨大,扩展性极好,边界模糊,类似天空漂浮的云,故被称为“云计算”;它具有超大规模、虚拟化、高可靠性、通用性、高可扩展性、按需服务和极其廉价的特点;由于云计算采用多种技术进行混合演进,技术成熟度高又受大公司推动,发展极为迅速;在美国主导云计算发展的企业包括互联网公司、基础设施供应商、电信运营商等;Amazon、Google、微软、IBM和Yahoo等大公司皆是云计算的先行者;基础设施供应商有EMC、惠普、思科、AT&T等。另外还包括提供技术支持的厂商例如VMware;国外使用云技术提高企业竞争力的公司有Salesforce、Facebook、YouTube、MySpace等;几乎所有的互联网公司和大型企业的IT部门都在利用云技术降低成本提高效率。云计算体系结构云计算基本原理:云计算是对分布式处理(DistributedComputing)、并行处理(ParallelComputing)和网格计算(GridComputing)及分布式数据库的改进处理,其前身是利用并行计算解决大型问题的网格计算和将计算资源作为可计量的服务提供的公用计算,在互联网宽带技术和虚拟化技术高速发展后萌生出云计算;许多云计算公司和研究人员对云计算采用各种方式进行描述和定义,基于云计算的发展和我们对云计算的理解,概括性给出云计算的基本原理为:利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务),这使得用户可以将资源切换到需要的应用上,根据需求访问计算机和存储系统;云计算可以把普通的服务器或者PC连接起来以获得超级计算机计算机的计算和存储等功能,但是成本更低;云计算真正实现了按需计算,从而有效地提高了对软硬件资源的利用效率;云计算的出现使高性并行计算不再是科学家和专业人士的专利,普通的用户也能通过云计算享受高性能并行计算所带来的便利,使人人都有机会使用并行机,从而大大提高了工作效率和计算资源的利用率;云计算模式中用户不需要了解服务器在哪里,不用关心内部如何运作,通过高速互联网就可以透明地使用各种资源。云计算体系结构云计算体系结构:云计算平台是一个强大的“云”网络,连接了大量并发的网络计算和服务,可利用虚拟化技术扩展每一个服务器的能力,将各自的资源通过云计算平台结合起来,提供超级计算和存储能力。通用的云计算体系结构如图3.12所示:云计算体系结构云计算体系结构云用户端:提供云用户请求服务的交互界面,也是用户使用云的入口,用户通过Web浏览器可以注册、登录及定制服务、配置和管理用户,打开应用实例与本地操作桌面系统一样;服务目录:云用户在取得相应权限(付费或其他限制)后可以选择或定制的服务列表,也可以对已有服务进行退订的操作,在云用户端界面生成相应的图标或列表的形式展示相关的服务;管理系统和部署工具:提供管理和服务,能管理云用户,能对用户授权、认证、登录进行管理,并可以管理可用计算资源和服务,接收用户发送的请求,根据用户请求并转发到相应的相应程序,调度资源智能地部署资源和应用,动态地部署、配置和回收资源;监控:监控和计量云系统资源的使用情况,以便做出迅速反应,完成节点同步配置、负载均衡配置和资源监控,确保资源能顺利分配给合适的用户;服务器集群:虚拟的或物理的服务器,由管理系统管理,负责高并发量的用户请求处理、大运算量计算处理、用户Web应用服务,云数据存储时采用相应数据切割算法采用并行方式上传和下载大容量数据。云计算体系结构云计算服务层次:

在云计算中,根据其服务集合所提供的服务类型,整个云计算服务集合被划分成4个层次:应用层、平台层、基础设施层和虚拟化层。这4个层次每一层都对应着一个子服务集合,为云计算服务层次如图3.13所示:

云计算的服务层次是根据服务类型即服务集合来划分,与大家熟悉的计算机网络体系结构中层次的划分不同。在计算机网络中每个层次都实现一定的功能,层与层之间有一定关联。而云计算体系结构中的层次是可以分割的,即某一层次可以单独完成一项用户的请求而不需要其他层次为其提供必要的服务和支持;在云计算服务体系结构中各层次与相关云产品对应。具体为应用层对应SaaS软件即服务如:GoogleAPPS、SoftWare+Services;平台层对应PaaS平台即服务如:IBMITFactory、GoogleAPPEngine、F;基础设施层对应IaaS基础设施即服务如:AmazoEc2、IBMBlueCloud、SunGrid;虚拟化层对应硬件即服务结合Paas提供硬件服务,包括服务器集群及硬件检测等服务。体系结构评价标准开放性:数字图书馆系统必须是一个开放的系统,开放的含义包括如下几方面内容:能够与第三方系统或功能模块实现良好的对接和集成;能够方便地在本系统内部增加删除或修改某些功能模块;尽可能广地支持各种资源格式和标准。系统设计时需要遵循一下原则:基本体系结构简单化,在设计基本体系结构时主要考虑信息的流通和管理机制,强调系统的通用性和稳固性;功能模块化,数字图书馆的服务功能是不断发展的,因此数字图书馆的每一项服务应该是相对独立的,便于安装、撤销和维护;选取成熟的通用的标准和协议。如用户界面采用通行的Web浏览器,文档表现采用XML定义,元数据采用DublinCore、中文元数据标准等。体系结构评价标准互操作性:通过信息资源本身实现互操作是最应该受到鼓励的方法,因为数字图书馆建设的基础是资源,用户最终利用的也是资源,而且与信息系统比较起来,资源从类型上(如图书、期刊、科学数据、地图、档案)要容易预见,发展变化也相对缓慢,从资源的格式上讲(如标准的文件格式.txt、.html、.mpeg等),大家对通用标准的认同更加一致。通过一定的标准规范让不同的藏品遵循相应的元数据标准,并通过元数据的共享或互换,可以实现资源间的共享,比如NCSTRL项目,采用OAI元数据采集协议来实现来自不同单位的藏品的互操作;当前,许多数字图书馆项目一般都主动遵循一定的元数据标准去创建元数据,并出现了一些工具和方案能够实现不同元数据标准的元数据元素的映射;同时,信息系统之间的互操作随着中间件和代理技术的发展也取得了很大的进步,同时近年来,Web服务技术为网络软件的共享和互操作方面提供了新的机制,将来随着这些技术的进一步发展,实现信息系统间的互操作将越来越简单。体系结构评价标准扩展性:NCSTRL项目为在扩展性方面提供了很好的经验;由于NCSTRL的成员单位比较分散,并且不断有新的成员单位及新的用户加入,最终选择了把数字图书馆划分成不同的区域,这样不但适应了数字图书馆不断延伸的特点,而且还能为本地用户提供及时的、具有本地特色的服务;在中国数字图书馆工程建设一期规划(2000-2005)就采用了区域服务的思想。伸缩性:由于各数字图书馆建设单位在经济、技术、管藏资源、用户需求等方面都不平衡,因此不同数字图书馆的建设规模也将是不同的;一个好的体系结构设计必须能够适应不同规模的系统,使不同规模的系统都能够获取最佳的效率。8.2.3安全方案检索代理通过检索代理服务器对数据进行访问,检索用户只能访问到检索代理服务器,无法进入数据库服务器,在数据库服务其(内部网)前设置了一个“堡垒型”防火墙,拒绝黑客进入数据库服务器和局域网,增加数据库安全性。用户操作统计与分析用户检索的记录保存在数据库中,并提供检索记录的查询、浏览、打印、统计与分析等功能。通过统计分析记录查询数据库中的内容被用户操作(包括浏览)的情况,如用户每次查询登录日期、时间、登录IP地址、检索用时、检索次数、下载信息的情况分析、统计等。独立于操作系统的用户管理、身份验证机制提供系统、数据库、记录及字段级的安全控制手段;用户使用信息资源的授权机制、用户文献存取数量控制;用户IP地址限制;数据操作审计和日志功能,控制台运行日志和故障分析工具。数字图书馆系统的设计与开发系统开发的基本知识1数字图书馆系统的构成2数字资源整合管理系统3Z39.50协议在数字图书馆中的技术实现4数字图书馆开发平台5系统开发的基本方法

1.结构化系统分析与设计方法。过程:系统规划阶段→系统分析阶→系统设计阶段→系统实施阶段→系统运行与维护阶段。优点:①前一个阶段的完成是后一个阶段工作的前提和依据,而后一阶段的完成往往又验证了前一阶段的成果;②这个开发过程是从抽象到具体,逐步求精的过程。③分析和设计过程完善。④及时对本阶段工作成果进行评定,使错误止于该阶段缺点:①它是一种需要预先定义需求的方法。②不能很好地从系统分析到系统设计过渡。③该方法文档的编写工作量极大。系统开发的基本方法

2.原型法过程:(1)分析研究系统开发的可行性。(2)确定系统的目的。(3)建造系统原型。(4)评审系统原型。(5)修改系统原型。(6)再次评审系统。(7)开发完成。优点:突破了以往的系统,能更好地满足用户的要求;改进了用户和系统开发人员的交流方式;提高了用户的满意程度,更加贴近实际;降低了系统开发风险,一定程度上减少了开发费用。缺点:开发工具要求高;对处理复杂系统和大型系统相对困难;对用户的管理水平要求高。系统开发的基本方法

3.面向对象的开发方法过程:(1)调查系统和分析需求。(2)分析问题和求解问题。(3)整理问题和。(4)实现程序和开发。特点:(1)直接反映了人们对客观世界的认知模式。(2)在设计中容易与用户沟通。(3)具有抽象性。(4)具有封装性。(5)具有继承性。系统开发的基本方法

4.计算机辅助系统工程法特点:(1)使客观对象到软件系统的映射问题得以解决,可支持系统开发的全过程。(2)使软件质量和软件重用性得到提高。(3)加快了软件开发速度。(4)使系统开发过程的管理和维护更加简单。(5)能够自动生成开发过程中的各种文档资料。系统开发阶段1.可行性分析经济可行性技术可行性管理可行性系统开发阶段2.系统分析系统需求分析采用一系列行之有效的技术、方法和工具来分析用户需求,通过特定的形式系统地描述拟开发的信息系统的功能、性能,以及行为特征和相关约束,定义所有内外部特征,最后形成既能指导系统设计又能同用户沟通的系统需求规格说明。步骤:问题定义→问题分解制定→需求规格说明→需求评审系统开发阶段3.系统设计总体设计阶段系统平台设计划分子系统功能结构图设计处理流程图设计数据文件和数据库设计详细设计阶段代码设计数据库设计用户界面设计编写程序模块设计说明书编写系统说明书应记载上述各项设计的全部成果,全面描述出新系统的基本结构,从总体上回答新系统该怎样做的问题。系统开发阶段4.系统实施指将系统设计阶段的结果在计算机上实现,将原来纸面上的、类似于设计图式的新系统方案转换成可执行的实际软件系统。主要任务:①按总体设计方案购置和安装物理系统;②建立数据库系统;③程序设计;④系统测试;⑤整理基础数据;⑥人员培训;⑦系统切换。系统结构构成元数据与对象库调度系统查询系统网络协议标准规范数字图书馆系统的功能构成管理子系统内部管理、用户管理、评估分析资源建设子系统资源建设、资源组织服务子系统个人服务、共享服务数字资源整合管理系统体系结构表示层应用层协议层内容层数字资源整合管理系统功能模块集成检索资源开放链接身份验证数据统计个性化服务数字资源整合管理系统功能模块 Z39.50(信息检索应用服务定义和协议规范,InformationRetrievalApplicationServiceDefinitionandProtocolSpecification),是由美国图书馆界创立的计算机数据库网络互联通讯协议。Z39.50经历了3个版本,它们是:Z39.50-1988;Z39.50-1992;Z39.50-1995。Z39.50目前的版本3已于1996年被ISO正式确定为信息检索的国际标准(ISO23950)。

Z39.50是开放系统互连参考模型(OSI-RM)的应用层协议,论及面向连接的、程序间的通讯问题,他使得用户在一台计算机(client)上检索存储在另一台计算机(server)中的信息,而不必关心这些信息是如何存储和组织的。目前它已经被广泛的被图书馆界作为一种访问分布式数据库的方法。

协议规范分为两个部分--由客户机(Z-client)实现的协议过程及由服务器(Z-server)实现的协议过程。源端(Origin)和目的端(Target)通过应用联动(A-association)中的Z39.50联动(Z-association)进行通讯,实现信息交换,信息分别称为请求和响应。Z39.50主要包含11种机制: 1.初始(Initialization);

2.查找(Search);

3.检索(Retrieval);

4.删除结果集(Result-set-delete);

5.存取控制(AccessControl);

6.结算/资源控制(Accounting/ResourceControl);

7.分类排序(Sort);

8.浏览(Browse);

9.其他扩展服务(Extendedservices);

10.其他扩展服务(Extendedservices);

11.终止(Termination)数字图书馆开发平台的选择原则平台提供的功能是否能够满足需求自身目前的条件平台的扩展性与兼容性平台的标准化程度性价比平台服务的好坏数字图书馆开发平台介绍IBM数字图书馆开发平台清华同方TPI数字图书馆开发平台iBASE数字图书图书馆解决方案IBM数字图书馆开发平台IBM数字图书馆是由美国IBM公司开发研制的,它集成了软件和硬件的开发平台。它的系统软件是在DB2大型关系数据库基础上运行,并提供了多种API接口和开发工具的底层开发平台。软件开发商们可以根据图书馆用户的实际需求进行上位开发,以满足图书馆用户的需要。清华同方TPI数字图书馆开发平台由清华同方推出,具有更为强大的信息开发与管理功能,其中的“数字资源采集系统”可从网上信息中筛选出对本单位有用的资源,把分布在各处的虚拟资源收藏为本地资源,把不同格式的资源转换成规范格式的资源。“数字资源加工系统”可把各种印刷型文献和文档资源加工成数字资源,并对数字资源进行标引、分类与组织。“数据库发布与检索系统”实现了跨服务器、跨平台的分布式检索。此外,还开发了“数字资源管理系统”、“数字参考咨询系统”、“网上用户教育与培训系统”和“个人数字图书馆系统”。这些功能结合起来,将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论