数字图书馆技术_第1页
数字图书馆技术_第2页
数字图书馆技术_第3页
数字图书馆技术_第4页
数字图书馆技术_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、门户门户结算结算认证认证统一检索平台统一检索平台电子电子文献文献全文全文文摘文摘索引索引库库馆藏馆藏书目书目上下文上下文购买的购买的各个数据库各个数据库资源调度资源调度联邦检索联邦检索 跨库检索跨库检索 文献传递文献传递CCCPQDD论文论文联合目录联合目录特色特色统一检索平台统一检索平台电子电子文献文献全文全文文摘文摘索引索引库库馆藏馆藏书目书目网络网络资源资源资源调度系统资源调度系统本馆本馆元数据元数据联合仓库联合仓库某图书馆门户某图书馆门户本馆本馆可访问的可访问的异构系统(群)异构系统(群)元数据元数据联合仓库联合仓库本馆资源调度系统本馆资源调度系统文献传递文献传递代理的代理的异构系统异

2、构系统适配器(群)适配器(群)数据源适配器数据源适配器电子电子文献文献全文全文文摘文摘索引索引库库馆藏馆藏书目书目网络网络资源资源某图书馆门户某图书馆门户跨库检索跨库检索联邦检索联邦检索 1、数字图书馆的定义、特征、数字图书馆的定义、特征2、数字图书馆的理论模型、数字图书馆的理论模型 形象模型、抽象模型形象模型、抽象模型3、数字图书馆的理论结构、数字图书馆的理论结构 数字资源、网络服务、支持技术数字资源、网络服务、支持技术4、数字图书馆与图书馆自动化的关系、数字图书馆与图书馆自动化的关系 一、数字图书馆的定义一、数字图书馆的定义 数字图书馆数字图书馆(Digital Library)的概念,最

3、早的概念,最早可以上溯到可以上溯到1975年年R. W. Christian 在在电子图电子图书馆:书目数据库:书馆:书目数据库:1975-76一书中提出的电一书中提出的电子图书馆子图书馆(Electronic Library),现在一般认为电,现在一般认为电子图书馆是数字图书馆的早期提法,子图书馆是数字图书馆的早期提法,1992年前大年前大多使用多使用“电子图书馆电子图书馆”,1992-1994年间这两个年间这两个概念并行使用,概念并行使用,1994年后多用年后多用“数字图书馆数字图书馆”。 研究图书馆协会1995年10月数字图书馆不是一个单一的数字图书馆不是一个单一的实体实体;数字图书馆需

4、要链接许多信息资源的数字图书馆需要链接许多信息资源的技术技术;多个数字图书馆及信息机构之间的链接对最终用户多个数字图书馆及信息机构之间的链接对最终用户透明透明;全球范围存取数字图书馆与信息服务是一个全球范围存取数字图书馆与信息服务是一个目标目标;数字图书馆的收藏不仅限于文献的数字替代品,它数字图书馆的收藏不仅限于文献的数字替代品,它们还扩展到不能以印刷形式代替和传播的数字化们还扩展到不能以印刷形式代替和传播的数字化人造物人造物。 数字图书馆是一个拥有专业人员等相关资源的数字图书馆是一个拥有专业人员等相关资源的,该组织对数字资源进行挑选、组织、提供智能化,该组织对数字资源进行挑选、组织、提供智能

5、化存取、解译、传播、保持其完整性和永存性等存取、解译、传播、保持其完整性和永存性等,从而使得这些数字资源能够快速且经济地被特定的用从而使得这些数字资源能够快速且经济地被特定的用户或群体所户或群体所。 美国数字图书馆联盟美国数字图书馆联盟1998年年美国著名数字图书馆专家美国著名数字图书馆专家William Arms 数字图书馆与传统图书馆有着不可分割的联系。数字图书馆与传统图书馆有着不可分割的联系。传统图书馆是数千年传统图书馆是数千年“前数字化时代前数字化时代”人类社会知人类社会知识文化的结晶,数字图书馆虽然可以把传统图书馆中各识文化的结晶,数字图书馆虽然可以把传统图书馆中各种载体的文献信息内

6、容数字化,但却不能种载体的文献信息内容数字化,但却不能文献载体文献载体本身,也不能本身,也不能传统图书馆特有的阅览环境等;传统图书馆特有的阅览环境等;数字图书馆不仅要数字图书馆不仅要地对已有的文献资源进行地对已有的文献资源进行数字化,而且要处理数字化,而且要处理的数字信息资源并开辟利用图的数字信息资源并开辟利用图书馆的新渠道、新方式和新技术。书馆的新渠道、新方式和新技术。没有必要没有必要传统图书馆去另建新的数字图书馆,传统图书馆去另建新的数字图书馆,传统图书馆是数字图书馆的传统图书馆是数字图书馆的,数字图书馆是传统图,数字图书馆是传统图书馆的书馆的,二者相互结合,构成,二者相互结合,构成复合图

7、书馆复合图书馆(Hybrid Library)。 二、数字图书馆特征二、数字图书馆特征数字资源数字资源数字资源类型包括期刊、图书、工具书、视频资料、声频资料等;文件格式包括从位图形式的页面到经SGML编码的特殊文本文件,甚至CD-ROM中的信息或本地局域网中的资源等等。能同时处理多媒体化的数字资源是数字图书馆在技术上的一个典型特征。 网络服务网络服务特色技术特色技术分布式资源与运行管理技术;分布式资源与运行管理技术;海量信息存储与组织技术;海量信息存储与组织技术;多媒体信息标引与检索技术等多媒体信息标引与检索技术等 资源资源技术技术服务服务正确的认识应是资源-技术-服务的综合集成和一体化没有资

8、源,数字图书馆就失去存在基础;没有服务,数字图书馆就失去存在价值;没有技术,数字图书馆难以运行。资源、技术与服务相辅相存,构成数字图书馆的“三位一体”。 对资源对资源-技术技术-服务一体化数字图书馆系统的简单精练抽服务一体化数字图书馆系统的简单精练抽象处理:数字图书馆的硬件边界由技术象处理:数字图书馆的硬件边界由技术“范围范围”而成,数字而成,数字图书馆的结构抽象化为技术,资源则抽象化为数字图书馆系图书馆的结构抽象化为技术,资源则抽象化为数字图书馆系统的输入,而服务抽象化为数字图书馆的输出。统的输入,而服务抽象化为数字图书馆的输出。 技术系统技术系统S (信道信道)资资 源源(信源信源)服服

9、务务(信宿信宿)IJBJ可看作是初始信息量可看作是初始信息量I经过经过S变换后产生出的有效信息量,整变换后产生出的有效信息量,整个模型类似于一个数学变换体系,需要寻求的数学关系相当于个模型类似于一个数学变换体系,需要寻求的数学关系相当于 F(J, B) = fG(I, S)函数函数F表征服务表征服务(信宿信宿)特性,函数特性,函数G表征资源和技术系统表征资源和技术系统(信源信源和信道和信道)特性,二者之间的函数关系就是数字图书馆的一种数特性,二者之间的函数关系就是数字图书馆的一种数学模型。其中学模型。其中S是决定系统性能的核心参量,而是决定系统性能的核心参量,而B则代表了用则代表了用户主动和交

10、互参数。户主动和交互参数。数字资源、网络服务和特色技术是数数字资源、网络服务和特色技术是数字图书馆的主要特征和理论核心,则数字字图书馆的主要特征和理论核心,则数字图书馆的理论框架可由数字资源、网络服图书馆的理论框架可由数字资源、网络服务和支持技术构成。务和支持技术构成。 : 改善被动服务的改善被动服务的技术方法改善被动服务的技术方法是通过纯粹Email或Web表单方式提供用户附加信息资源或解答用户提问,这是最简单的被动服务改良模式,但可以为用户提供了便捷、经济的通讯渠道。主动服务:主动服务:是数字图书馆网络服务的高级方式,是数字图书馆网络服务的高级方式,特点是考虑用户的个别要求,具体实现形式一

11、般是特点是考虑用户的个别要求,具体实现形式一般是通过交互式通过交互式Web网站形式。网站形式。 交互式交互式Web网站形式具体可分为双向交互问网站形式具体可分为双向交互问答模式和个性化信息推送模式,其中答模式和个性化信息推送模式,其中MyLibrary技术正在成为主流。技术正在成为主流。数字图书馆根据用户的请求组数字图书馆根据用户的请求组织资源,服务形式根据用户需求变化,系统和用户处于同织资源,服务形式根据用户需求变化,系统和用户处于同等地位,信息在系统和用户之间双向交流。该模式在技术等地位,信息在系统和用户之间双向交流。该模式在技术上可以通过上可以通过Chat形式实现。形式实现。用户根据自己

12、的需求和爱好用户根据自己的需求和爱好自行设计数字图书馆界面并定制数字图书馆资源,用户处自行设计数字图书馆界面并定制数字图书馆资源,用户处于主动地位,数字图书馆系统居于从属地位,数字图书馆于主动地位,数字图书馆系统居于从属地位,数字图书馆只是在技术上按照用户的个性化需求定制并主动推送信息。只是在技术上按照用户的个性化需求定制并主动推送信息。从单向信息传递模式到个性化信息推送模式从单向信息传递模式到个性化信息推送模式一方面体现了技术的进步;一方面体现了技术的进步;另一方面也越来越多地将控制权和主动权交给用户;另一方面也越来越多地将控制权和主动权交给用户;用户技术水平和应用水平越高,使用效果就越好;

13、用户技术水平和应用水平越高,使用效果就越好;同时,资源管理方也应重视对数字资源的整合和对操同时,资源管理方也应重视对数字资源的整合和对操作方法的优化,使数字图书馆的网络服务具有保障。作方法的优化,使数字图书馆的网络服务具有保障。 数字图书馆涉及的技术包括通用信息技术和专用创新技术即特色技术。通用信息技术通用信息技术建设数字图书馆所需的通用信息技术主要是计算机技术、网络技术和信息安全技术。特色技术特色技术涉及数字信息处理与加工技术、海量信息存储与组织技术、分布式资源与运行管理技术、多媒体信息标引与检索技术、信息挖掘技术、个性化信息定制与发布技术、信息可视化与读者界面技术、信息安全技术、数字权益管

14、理技术等。 图书馆自动化系统发展的三阶段说;图书馆自动化系统发展的三阶段说;图书馆自动化是数字图书馆的基础之一,图书馆图书馆自动化是数字图书馆的基础之一,图书馆自动化是建设数字图书馆的必经阶段。自动化是建设数字图书馆的必经阶段。图书馆自动化是在传统图书馆理论框架下应用计图书馆自动化是在传统图书馆理论框架下应用计算机技术来改善图书馆服务与管理,而数字图书馆却算机技术来改善图书馆服务与管理,而数字图书馆却是在理论与技术上超越传统图书馆的新发展,意义和是在理论与技术上超越传统图书馆的新发展,意义和影响将更加深远。影响将更加深远。一、数字图书馆的出现和演变一、数字图书馆的出现和演变1、数字图书馆的产生

15、背景2、数字图书馆的产生和演变过程二、二、 数字图书馆的发展趋势与方向数字图书馆的发展趋势与方向3、数字图书馆的发展趋势4、数字图书馆建设的方向5、网格技术的发展对数字图书馆的影响 图书馆的发展和演变的内部环境的驱动力和社会环境的推动力。内部环境内部环境:是指社会对图书馆的需求产生的驱动力,促使其改变传统图书馆的服务环境,实现图书馆的数字化和自动化;社会环境社会环境:包括社会经济结构、信息技术结构、文化结构的变动,进而推动图书馆的发展和演化。数字图书馆产生与发展主要源于两种力量的推动一是图书馆自身资源共享的内在要求;二是计算机互联网络的发展对数字信息进行有序化、结构化组织的要求。A、数字图书馆

16、产生的内在因素B、数字图书馆产生的外在因素C、数字图书馆发展的社会背景数字图书馆产生的内在因素一是印刷型文献的保存问题;二是文献信息的利用问题。数字图书馆产生的外在因素数字图书馆产生的外在因素 一是文献信息资源的巨增种类、数量、内容种类、数量、内容二是信息高速公路的建设和因特网的发展20世纪世纪 70年代年代,图书馆逐步利用计算机进行日常管理。图书馆逐步利用计算机进行日常管理。80年年代末图书馆自动化系统逐步得到了应用,分布式管理意味着通过代末图书馆自动化系统逐步得到了应用,分布式管理意味着通过因特网可以把全球的数字化资源联为一体因特网可以把全球的数字化资源联为一体三是数字化技术的发展信息存储

17、技术信息存储技术 数据库技术数据库技术 信息传输与通讯技术信息传输与通讯技术数字图书馆发展的社会背景数字图书馆发展的社会背景 1数字图书馆是社会信息化发展的必然产物2数字图书馆是评价一个国家信息基础水平的重要标志3数字图书馆是21世纪全球文化竞争的焦点之一4数字图书馆建设有利于带动相关行业的发展体现了数字化社会对信息共享和信息开放的根本要求;数字图书馆建设使人类社会信息资源的共享达到一定的高度,为文化传播打开新的大门。数字图书馆的形成过程主要包括以下几方面数字图书馆的形成过程主要包括以下几方面: 第一、文献资源数字化第一、文献资源数字化 第二、数字资源的集成第二、数字资源的集成 第三、数字资源

18、的共享第三、数字资源的共享1945年的数字图书馆的构想,构思并描述了所设想的一种 Memex装备机械化的个人文档与图书馆;1965年到1973年麻工学院建立Intrex数据库,将文章储存在缩微胶片上利用联机储存目录和索引进行检索;1969年Sandia实验室开发出有关科技文献的全文储存和检索系统;1969年正式发行机读目录,这是图书馆进入自动化的标志;1975年, R.W.Christian出版了“Electronic Library Bibliographic Databases:19751976”一书,首次提到了“Electronic Library”这个名词;1978年美国著名图书馆学家

19、兰卡斯特论述了电子图书馆的前景, 1984年 K.E. Dowlin首次对电子图书馆这一概念给出明确定义;1988年美国国家科学基金会的伍尔夫(W. Wulf)撰写的国际合作白皮书提出数字化图书馆的概念。80年代末 90年代初对数字图书馆的设想更加具体化,“电子图书馆”、“虚拟图书馆”、“无墙图书馆”等概念纷纷提出来。电子图书馆是数字图书馆的早期提法,它反映了所应用技术的特点;虚拟图书馆则强调了网上数字化资源,而未突出图书馆的数字化特点;无墙图书馆突出了利用范围和效果;数字图书馆较准确地反映了问题的本质,揭示了信息存取形式的基本特征及有关内涵 80年代末,美国一些大学和知名公司开始研制开发大型

20、的图书馆自动化管理系统。IBM电脑公司合作开发出图书馆管理系统;1988年底,美国国家科学基金会就发起了“水星计划”;1989年,卡内基.梅隆大学开始进行电子图书馆研究,作为图书馆自动化的一部分,其项目目标是建立一个电子传输全文系统;康泰尔大学、化学文摘社、OCLC等机构也在着手建立“化学联机检索实验(CORE)”。1994年, 美国国家科学基金会联合其它单位正式实施“数字图书馆创始”计划,这个计划的主要目标是“使收集、存储和组织数字化信息的技术手段得到较大提高,并使数字化信息通过网络被查询、检索和处理,且有一个统一的用户友好界面”。 20世纪末以来,世界各国的数字图书馆建设有了较大的发展,许

21、多已经投入实际的应用。在这一时期研究的重点也不再单纯地局限于技术,而是把研究范围扩展到更宽广的领域,制定信息共享格式与国际标准,数字图书馆网站的可靠性和稳定性,经济因素和商品化等,进行综合性研究。 B、数字信息存储的全息化、数字信息存储的全息化C、多种资源的高度集成,易用性更强、多种资源的高度集成,易用性更强E、标准化建设取得较大进展、标准化建设取得较大进展F、社会化和国际化趋势、社会化和国际化趋势第一代数字图书馆主要在特定文献资源数字化的基础上建立数字信息资源系统;第二代数字图书馆致力于支持分布的数字信息系统间的互操作,支持这些系统间无缝交换和共享信息资源与服务,由此构造集成信息服务机制,形

22、成基于集成信息服务的数字图书馆;第三代数字图书馆将围绕用户信息活动和用户信息系统来组织、集成、嵌入数字信息资源和信息服务,从而更直接、深入、有效地支持用户检索、处理、利用信息来解决问题的全过程。数字图书馆需要的技术:数字图书馆需要的技术:网络通信、多媒体信息处理、信息的压缩与解压网络通信、多媒体信息处理、信息的压缩与解压缩、分布式信息处理、信息安全、数据仓库、基于内缩、分布式信息处理、信息安全、数据仓库、基于内容的智能检索、超大规模数据计算、用户界面等多种容的智能检索、超大规模数据计算、用户界面等多种技术。技术。目前亟待解决的关键技术包括目前亟待解决的关键技术包括:软件重用技术、多语言处理技术

23、、自动识别技术、软件重用技术、多语言处理技术、自动识别技术、因特网人工智能技术。因特网人工智能技术。数字图书馆的一个基本特征是传输网络化。数字图书馆的一个基本特征是传输网络化。A、加强数字图书馆建设的战略管理、加强数字图书馆建设的战略管理B、加强特色化数字资源建设、加强特色化数字资源建设C、加强数字图书馆建设的合作与协调、加强数字图书馆建设的合作与协调D、加强数字图书馆的可用性评价、加强数字图书馆的可用性评价E、加强数字图书馆的知识管理、加强数字图书馆的知识管理F、加强数字图书馆的标准化管理、加强数字图书馆的标准化管理G、加强数字图书馆用户的研究与关系管理、加强数字图书馆用户的研究与关系管理政

24、府出面政府出面,统一规划、组织和协调,统一规划、组织和协调,从战略管理的高度处理好数字图书从战略管理的高度处理好数字图书馆建设中的一些宏观关系问题馆建设中的一些宏观关系问题,加强整体规划和可行性分析。加强整体规划和可行性分析。从全局出发从全局出发, ,合理建设和使用文合理建设和使用文献信息资源献信息资源, ,不要盲目求新、求全、不要盲目求新、求全、求高水平求高水平, ,应该加强资源共享应该加强资源共享, ,不要不要重复建库和重复引进造成浪费,要重复建库和重复引进造成浪费,要立足本馆、面向全球、形成特色。立足本馆、面向全球、形成特色。C、加强数字图书馆建设的合作与协调、加强数字图书馆建设的合作与

25、协调通力合作和沟通,立足于一盘棋,打破各自为政、条块分割、重复建设的局面,以网络为依托进行整体化建设。D、加强数字图书馆的可用性评价、加强数字图书馆的可用性评价可用性指的是系统必须具备一定的功能特征从使用上来说,可用性是指用户在一定的环境里完成一定的任务时,系统的性能或作用能否得到有效的体现。数字图书馆的可用性可以分为和两种,概括为:易学、易记、能有效地满足用户的信息需求、容错、愉悦、服务差异化是通过对数字图书馆所拥有的包括信息及知识各种要素在内的所有智力资本进行组织、开发和运营,实现知识创新、知识扩散和知识增值的过程。其主要内容包括:(1)知识创新,(2)知识组织(3)知识开发(4)知识扩散

26、和知识应用 建设数字图书馆主要涉及两方面标准:建设数字图书馆主要涉及两方面标准:首先是直接涉及文献信息工作本身的技术首先是直接涉及文献信息工作本身的技术标准标准,包括通用标准、出版专业通用标准和相包括通用标准、出版专业通用标准和相关标准、图书情报专业通用标准和相关标准、关标准、图书情报专业通用标准和相关标准、档案专业通用标准和相关标准等;档案专业通用标准和相关标准等;其次是有关计算机、通信和数据库建设的其次是有关计算机、通信和数据库建设的标准。标准。 是通过有关的管理技术和方法对用户进行系统化研究,识别有价值的用户,对用户进行沟通和教育培训等工作, 从而改进服务,提高用户的满意度。是类型比较多

27、、范围广、需求变化大,目前又以团体用户为主,集体统一购买某方面资源的使用权。 数字图书馆用户关系管理的数字图书馆用户关系管理的核心思想核心思想是将用是将用户关系作为一种重要的资源户关系作为一种重要的资源,深入对用户的需求进深入对用户的需求进行分析,通过完善服务来满足用户的需求;行分析,通过完善服务来满足用户的需求; 它将注意力集中于用户发展,以便使潜在用它将注意力集中于用户发展,以便使潜在用户变成现实客户、现实用户变成忠诚用户;户变成现实客户、现实用户变成忠诚用户; 通过满足用户的需求,与用户建立长期稳定通过满足用户的需求,与用户建立长期稳定的关系,从而不断拓展产品或服务的范围。的关系,从而不

28、断拓展产品或服务的范围。 在于发现、了解、预测和管理现有或潜在于发现、了解、预测和管理现有或潜在的用户。在的用户。 (1)数字图书馆用户的需求分析;(2)数字图书馆用户的数据管理和挖掘;(3)数字图书馆用户的分类研究;(4)数字图书馆用户的心理行为研究;(5)数字图书馆的用户教育;(6)数字图书馆用户的服务效果评价;(7)数字图书馆服务方式的改进;(8)数字图书馆用户的人文关怀。数字图书馆用户研究和关系管理的主要内容A、网格技术的特点及其意义、网格技术的特点及其意义B、网格技术在数字图书馆建设中的应用、网格技术在数字图书馆建设中的应用C、网格对数字图书馆的挑战、网格对数字图书馆的挑战 网格网格

29、(Grid)是近年来兴起的一种前沿信息技术,是近年来兴起的一种前沿信息技术,是互联网信息技术发展的新趋势。是互联网信息技术发展的新趋势。思想思想来源于电力网格;来源于电力网格;目的目的是将计算能力和信息资源象电力网一样通过是将计算能力和信息资源象电力网一样通过网络形式方便地传送到用户中;网络形式方便地传送到用户中;是高性能计算机、数据资源、因特网三种技术的是高性能计算机、数据资源、因特网三种技术的有机组合和发展,它把分布在各地的各种计算机连接有机组合和发展,它把分布在各地的各种计算机连接起来起来,进行资源共享。进行资源共享。 网格是一个一致、开放、标准网格是一个一致、开放、标准的计算环境的信息

30、基础设施,支持的计算环境的信息基础设施,支持聚合地理上广泛分布的高性能计算聚合地理上广泛分布的高性能计算资源、大容量数据和信息存储资源、资源、大容量数据和信息存储资源、软件和应用系统、高速测试和获取软件和应用系统、高速测试和获取系统、以及人力等各种资源的合作系统、以及人力等各种资源的合作问题求解系统的构造。问题求解系统的构造。 数字图书馆是综合运用多方面高新技术支持的数数字图书馆是综合运用多方面高新技术支持的数字信息资源系统,将分散于不同字信息资源系统,将分散于不同载体载体、不同、不同地域地域的数的数字化信息资源以网络化方式互相联结起来,实现资源字化信息资源以网络化方式互相联结起来,实现资源共

31、享共享。数字图书馆通过数字技术进行信息资源的组织和数字图书馆通过数字技术进行信息资源的组织和管理,能够储存管理,能够储存海量海量信息,用户可以通过互联网络高信息,用户可以通过互联网络高效方便地进行效方便地进行查询检索查询检索。数字图书馆具有信息资源数字图书馆具有信息资源数字化数字化、信息组织、信息组织非线非线性化性化、结构、结构复杂化复杂化、信息传递、信息传递网络化网络化、服务方式、服务方式多样多样化化等特点。等特点。 网格是高性能计算机、数据源、因特网网格是高性能计算机、数据源、因特网三种技术的有机组合,它具有高性能、一体三种技术的有机组合,它具有高性能、一体化、知识生产、资源共享、异地协同

32、工作、化、知识生产、资源共享、异地协同工作、支持开放标准、功能动态变化等优点,为数支持开放标准、功能动态变化等优点,为数字图书馆建设提供了有利的条件。字图书馆建设提供了有利的条件。 (1)网格为数字图书馆构造统一的平台)网格为数字图书馆构造统一的平台(2)网格有利于数字图书馆的信息集成)网格有利于数字图书馆的信息集成(3)网格有利于实现数字图书馆的资源共享)网格有利于实现数字图书馆的资源共享(4)网格有利于数字图书馆的海量数据处理)网格有利于数字图书馆的海量数据处理(5)网格有利于数字图书馆进行知识管理)网格有利于数字图书馆进行知识管理应用移植是网格技术走向应用的最大障碍。应用移植是网格技术走

33、向应用的最大障碍。网格技术要求用户将原有的系统应用标准网格技术要求用户将原有的系统应用标准化,并平移到新的系统之中。化,并平移到新的系统之中。实际上很多现有的数字图书馆应用系统如实际上很多现有的数字图书馆应用系统如果被推向网格环境,将面临重新编写应用代码的果被推向网格环境,将面临重新编写应用代码的问题。问题。 首先,在资源建设方面要特色化;首先,在资源建设方面要特色化;其次,要增强数字图书馆系统的相互可操作性,其次,要增强数字图书馆系统的相互可操作性,以便更好通过网格系统共享资源;以便更好通过网格系统共享资源;再次,进一步完善数字图书馆协同服务,系统模再次,进一步完善数字图书馆协同服务,系统模

34、式要走向集成的、多层次的分布模式,实现各类服务式要走向集成的、多层次的分布模式,实现各类服务组件集成化;组件集成化;第四、不断丰富服务中的交互模型,通过提供各第四、不断丰富服务中的交互模型,通过提供各种交互模型使数字图书馆服务能够不断地适应发展变种交互模型使数字图书馆服务能够不断地适应发展变化的要求,更加具有针对性和个性化。化的要求,更加具有针对性和个性化。 1、数字图书馆的信息体系结构数字图书馆的信息体系结构 2、数字图书馆的技术体系结构数字图书馆的技术体系结构3、数字图书馆体系结构比较研究数字图书馆体系结构比较研究4、数字图书馆系统的结构模型数字图书馆系统的结构模型数字图书馆数字图书馆核心

35、技术核心技术:研究研究数字化信息的有效组织结构,数字化信息的有效组织结构,解决解决各个各个信息仓储的互操作性,信息仓储的互操作性,形成形成数字图书馆基础体系结构以有数字图书馆基础体系结构以有效地效地操作操作大规模的、分布的数字化信息。大规模的、分布的数字化信息。研究内容研究内容:实现实现在网络环境下跨仓储的、统一高效的访在网络环境下跨仓储的、统一高效的访问和检索工具,以及问和检索工具,以及提供提供一套高效的信息生成、组织和提一套高效的信息生成、组织和提取技术。取技术。最终目标最终目标:优化优化因特网的信息存储结构,因特网的信息存储结构,提供提供一致的检一致的检索接口,使整个网络成为一个虚拟的、

36、单一的、有组织的、索接口,使整个网络成为一个虚拟的、单一的、有组织的、有结构的信息集合,有结构的信息集合,实现实现跨资源库的无缝信息检索。跨资源库的无缝信息检索。 体系结构主要解决的问题:体系结构主要解决的问题:数字对象的信息组织结构数字对象的信息组织结构和分布式信息仓储的组织结构。和分布式信息仓储的组织结构。 数字对象:数字对象:决定着信息组织、处理和利用方式。决定着信息组织、处理和利用方式。 资源库组织结构的核心:资源库组织结构的核心:在于建立一个统一的、互操在于建立一个统一的、互操作的、可伸缩的组织框架,将分布互联的信息仓储集成为作的、可伸缩的组织框架,将分布互联的信息仓储集成为一个整体

37、,在此基础上提供高质量的信息服务,如屏蔽各一个整体,在此基础上提供高质量的信息服务,如屏蔽各仓储的差异、提供统一的服务接口、语义化检索、智能代仓储的差异、提供统一的服务接口、语义化检索、智能代理等。理等。 对于用户而言对于用户而言,体系结构隐蔽在用户界面以下,体系结构隐蔽在用户界面以下,良好的体系结构应提供一个透明层,用户甚至感觉不良好的体系结构应提供一个透明层,用户甚至感觉不到体系结构的存在。到体系结构的存在。对于数字图书馆实施者而言对于数字图书馆实施者而言,体系结构决定数,体系结构决定数字图书馆中信息的组织方式、系统的软硬件构成、数字图书馆中信息的组织方式、系统的软硬件构成、数据操作方法等

38、问题。据操作方法等问题。 1、信息体系结构基础、信息体系结构基础 (1)数字信息的概念、特征;)数字信息的概念、特征; (2)信息体系结构的设计要求、基础。)信息体系结构的设计要求、基础。2、数字图书馆的信息体系结构、数字图书馆的信息体系结构 (1)数字图书馆核心服务的主要特征;()数字图书馆核心服务的主要特征;(2)数字)数字对象系统;(对象系统;(3)仓储服务系统;()仓储服务系统;(4)名录服务系统;)名录服务系统;(5)索引服务系统;()索引服务系统;(6)用户接口网关。)用户接口网关。数字图书馆的信息体系结构数字图书馆的信息体系结构是指在数字图书馆中组织信息的结构;是指在数字图书馆中

39、组织信息的结构;研究如何有效、灵活地在数字图书馆中表现研究如何有效、灵活地在数字图书馆中表现丰富多样的数字化收藏信息;丰富多样的数字化收藏信息;使计算机软件理解数字信息的结构、执行用使计算机软件理解数字信息的结构、执行用户所期望的交互式的通用解决方案。户所期望的交互式的通用解决方案。:各种二进制序列文献信息;数字图书馆的信息是由经过数字技术处理的数据元素组成的,这些元素包括数字对象(digital objects)、元数据(metadata)和句柄(handle,也称调度码)。(set of digital objects):在数字图书馆中,为了表现数字信息的复杂性,同类的数字对象可组合在一起

40、。所有数字对象符合基本形式,而同类数字对象在基本基本形式形式之外还具有其他一些共同结构共同结构,这是因为每个数字对象集的结构取决于它所表示的信息内容,而不是数据元素的存储形式。 数字图书馆的体系结构中,信息都是以数字信息为基本单位进行存储的,数字信息是按数字对象的形式存储的。:是指与其它数字化资料之间存在的部分/整体、系列等的关联关系。:目前数字格式大多使用的是可扩展置标语言XML格式。:数字对象是容易改变的,当现有资料被转换成数字形式时,同一记录可能被转换了好几次。:数字对象的每一个元素都有与之相关的不同版权和许可权。:能够合理、规范地组织其丰富的信息资源(一般应按类型组织资源库中的信息),

41、提高信息资源的网络化共享程度,以最大限度地满足用户的信息需求。 给用户及其应用程序以相当的灵活性;藏品结构应易于直接管理、跨库连接及快速查询;能反映经济、社会和法律等构件在信息基础中的发展,特别是应能识别信息是否有价值,可否类化和条件化,可否传递到无国界的非安全网络上等。 数字图书馆信息体系结构基于数据类型、结构元数据和元对象三个概念;数据的每一个项目都有一个相关的数据类型,用来描述数据的技术性质,如数据的存储格式或处理方法;是描述数字信息的类型、标题、著者、版本、相关关系及其它特性的元数据,结构性元数据不可再分。一部诗歌集中的诗歌可以一首一首地用不同的数字对象数字对象来描述,一个数字对象对应

42、一首诗;用于描述诗歌集的元对象:是一个将所有诗歌列表的数字对象集;元对象元对象:是为数字对象集提供基准或参照的一种对象。最简单的形式便是数字对象的一个句柄列表或调度码清单。 所有数据均需给定一个显式明确的数据类型所有数据均需给定一个显式明确的数据类型所有元数据均应显式明确编码所有元数据均应显式明确编码每个具有知识产权的单独项均应赋予句柄标每个具有知识产权的单独项均应赋予句柄标识或调度码识或调度码元对象用于聚集数字对象,特别是项目的所元对象用于聚集数字对象,特别是项目的所有版本和相关的所有结构元数据有版本和相关的所有结构元数据句柄或调度码用于识别元对象中的列表项句柄或调度码用于识别元对象中的列表

43、项将将在在的数字化信息统一起的数字化信息统一起来,构成一个来,构成一个的而且具有优化结构的而且具有优化结构的相关的相关(见图),为数字图书(见图),为数字图书馆的应用提供馆的应用提供的资源访问,并且能的资源访问,并且能方便地对资源进行方便地对资源进行。 其主要构件:数字对象、句柄(或调度码)和仓储。其主要构件:数字对象、句柄(或调度码)和仓储。数字对象存储在仓储中,用句柄来标识,数字对象具数字对象存储在仓储中,用句柄来标识,数字对象具有分布式的体系结构。有分布式的体系结构。数字图书馆的信息体系结构具有开放性,它将数字图数字图书馆的信息体系结构具有开放性,它将数字图书馆的整个功能划分为一组定义明

44、确的服务,每一种服务书馆的整个功能划分为一组定义明确的服务,每一种服务都通过一种定义明确的协议来访问。都通过一种定义明确的协议来访问。这种结构为数字图书馆提供了其必须具备的基本功能,这种结构为数字图书馆提供了其必须具备的基本功能,即一组核心服务,是有效管理的数字对象集(内容)和服即一组核心服务,是有效管理的数字对象集(内容)和服务集(功能)的统一。务集(功能)的统一。服务集是与存储、发现、检索和保存数字对象相关的服务集是与存储、发现、检索和保存数字对象相关的服务功能,实现服务集的子系统有:仓储服务系统、名录服务功能,实现服务集的子系统有:仓储服务系统、名录服务系统、索引服务系统和用户接口网关。

45、服务系统、索引服务系统和用户接口网关。 数字图书馆体系结构中的内容是以数字对象形式存数字图书馆体系结构中的内容是以数字对象形式存储的;储的;数字对象是用全局唯一的持久名字数字对象是用全局唯一的持久名字句柄标识的;句柄标识的;句柄用命名服务器注册,用名录服务器解析出句柄句柄用命名服务器注册,用名录服务器解析出句柄标识的数字对象的位置。标识的数字对象的位置。数字对象的存储和访问是由仓储服务系统来实现。数字对象的存储和访问是由仓储服务系统来实现。索引服务提供发现数字对象的机制,使用户易于从索引服务提供发现数字对象的机制,使用户易于从馆藏中寻找和发现所需的对象。馆藏中寻找和发现所需的对象。用户接口网关

46、提供以人为中心的数字图书馆的功能用户接口网关提供以人为中心的数字图书馆的功能入口。入口。A、数字对象、数字对象B、数字对象集、数字对象集数字对象概念数字对象概念:是数字图书馆体系结构:是数字图书馆体系结构中存储信息的基本逻辑单位和实体,是以一中存储信息的基本逻辑单位和实体,是以一定结构的数字形式来表达信息内容的一种方定结构的数字形式来表达信息内容的一种方法,是网络环境下的数字资料。法,是网络环境下的数字资料。数字对象的组成数字对象的组成:元数据、数字资料、:元数据、数字资料、句柄或调度码。句柄或调度码。元数据元数据:或称属性、关键元数据,关于数字资料:或称属性、关键元数据,关于数字资料的数据,

47、是存储在数字对象中的信息,包含一些识别的数据,是存储在数字对象中的信息,包含一些识别对象的条件、条款和调度码;对象的条件、条款和调度码;功能功能:管理网络环境下的数字对象,如数字对象:管理网络环境下的数字对象,如数字对象的存储、复制和传输等权限的管理。的存储、复制和传输等权限的管理。元数据类型:元数据类型:描述性元数据描述性元数据,用于发现和标识一个对象;,用于发现和标识一个对象;结构性元数据结构性元数据,为用户显示和导航一个对象,包,为用户显示和导航一个对象,包括该对象的内部组织信息;括该对象的内部组织信息;管理性元数据管理性元数据,描述该对象的管理信息,如创建,描述该对象的管理信息,如创建

48、日期、文件的格式、访问权限、知识产权问题等。日期、文件的格式、访问权限、知识产权问题等。 数字资料:是数字图书馆的原型资料,数字资料:是数字图书馆的原型资料,最终用户需要获取的信息内容,即二进制字最终用户需要获取的信息内容,即二进制字符串集合。符串集合。一个数字对象所存储的数字资料可能一个数字对象所存储的数字资料可能是经是经XML置标后的文本,或者是一本电子置标后的文本,或者是一本电子图书,也可能包括传统图书馆的资料,诸如图书,也可能包括传统图书馆的资料,诸如一些计算机程序或动态的图象。一些计算机程序或动态的图象。 句柄或调度码句柄或调度码:是数字对象和其它因特网资源在全局:是数字对象和其它因

49、特网资源在全局范围内的永久的唯一标志符,是范围内的永久的唯一标志符,是URN的一种形式。的一种形式。URN (Uniform Resource Names)统一资源统一资源名称也叫永久名称,其名称应该全球唯一和持久的,且独名称也叫永久名称,其名称应该全球唯一和持久的,且独立于具体的存储位置。立于具体的存储位置。句柄可按名称识别对象库中的数字对象或因特网上的句柄可按名称识别对象库中的数字对象或因特网上的资源。资源。句柄的作用句柄的作用:引用由:引用由URL列表所定义对象的一个或多列表所定义对象的一个或多个拷贝;提供个拷贝;提供EMAIL地址。地址。句柄实际上是使用具有唯一性的字符串给数字对象提句

50、柄实际上是使用具有唯一性的字符串给数字对象提供一个具有唯一性的名称。供一个具有唯一性的名称。句柄组成句柄组成:类型、命名权威代码(或前缀、项目标识:类型、命名权威代码(或前缀、项目标识符或后缀。符或后缀。数字对象集数字对象集:是同类数字对象的组合,可:是同类数字对象的组合,可用来表示一组有关联的对象。用来表示一组有关联的对象。如不同版本的程序、不同格式的文本或不如不同版本的程序、不同格式的文本或不同演奏的音乐作品。同演奏的音乐作品。数字对象集包括组合对象和元对象两种;数字对象集包括组合对象和元对象两种;组合对象组合对象的内容包含一组对象;的内容包含一组对象;元对象元对象的内容包含一组对象的句柄

51、。的内容包含一组对象的句柄。仓储也叫数据仓库或资源库,适于保存含有价值仓储也叫数据仓库或资源库,适于保存含有价值信息的材料专门类别的仓库,主要是分布式信息仓储,信息的材料专门类别的仓库,主要是分布式信息仓储,基本存储单元是数字对象,整个系统就是为了存储、访基本存储单元是数字对象,整个系统就是为了存储、访问、管理数字对象而设计的。问、管理数字对象而设计的。仓储服务系统通常是由关系型数据库来管理;仓储服务系统通常是由关系型数据库来管理;应用程序通过资源库提供的库访问协议应用程序通过资源库提供的库访问协议RAP(repository access protocol)来访问资源库,)来访问资源库,实现

52、存储、访问、复制、移动和删除数字对象等操作。实现存储、访问、复制、移动和删除数字对象等操作。RAP定义了外界访问仓储的最基本的接口。定义了外界访问仓储的最基本的接口。仓储服务系统采用层次结构,整个体系仓储服务系统采用层次结构,整个体系分为三层:分为三层:接口层:提供用户接口网关和仓储服务接口层:提供用户接口网关和仓储服务系统的接口,并且提供仓储服务系统与名录系统的接口,并且提供仓储服务系统与名录服务系统的接口。服务系统的接口。对象抽象层:是中间管理层,它提供数对象抽象层:是中间管理层,它提供数字对象中与内容无关的服务,为数字对象与字对象中与内容无关的服务,为数字对象与其相对应的存储位置之间提供

53、映射及提供常其相对应的存储位置之间提供映射及提供常规运行所需的系统服务。规运行所需的系统服务。对象存储层:仓储中的信息永久保存在对象存储层:仓储中的信息永久保存在对象存储层。对象存储层。也叫命名系统,是针对长期标识符即数字对象名字的分配、管理及解析的综合系统。包括开放的句柄协议、名字空间和句柄协议的具体实现。名录服务系统具有唯一性、持久性、可扩展性、多实例、国际字符支持、分布式的服务和管理以及安全有效的解析等特点。提供通过查询使用户能够很容易地从馆藏中提供通过查询使用户能够很容易地从馆藏中寻找和发现所需数字对象的机制。寻找和发现所需数字对象的机制。系统的资源发现功能由索引服务器和索引管系统的资

54、源发现功能由索引服务器和索引管理器两部分合作完成;理器两部分合作完成;索引管理器:选择执行查询的索引服务器;索引管理器:选择执行查询的索引服务器;索引服务器:收集关于数字对象的信息、执索引服务器:收集关于数字对象的信息、执行查询;行查询;索引管理器:合并来自索引服务器的结果。索引管理器:合并来自索引服务器的结果。提供以用户为中心的数字图书馆功能接入点。提供以用户为中心的数字图书馆功能接入点。负责向用户提供查询界面,接受用户的检索请求;负责向用户提供查询界面,接受用户的检索请求;将用户的检索请求进行语义规范和语法转换;将用户的检索请求进行语义规范和语法转换;选择合适的馆藏服务进行搜索和访问;选择

55、合适的馆藏服务进行搜索和访问;对返回的命中结果根据相关性、资源类型、数据格对返回的命中结果根据相关性、资源类型、数据格式等进行过滤、排序或做其他显示处理;式等进行过滤、排序或做其他显示处理;一般可支持一般可支持IE等浏览器。等浏览器。 2、基础应用平台、基础应用平台5、数字资源的管理与存储系统、数字资源的管理与存储系统6、资源调度系统、资源调度系统10、电子商务系统、电子商务系统网络应用模式网络应用模式网络操作系统平台和网络组建方案网络操作系统平台和网络组建方案网络管理系统网络管理系统网络技术的选择网络技术的选择网络安全网络安全 经过文献数字化加工或者资源整合处理过的资源;经过文献数字化加工或

56、者资源整合处理过的资源;完成对已经数字化的图书、期刊、古籍、静止图象、完成对已经数字化的图书、期刊、古籍、静止图象、音频、视频、网上资源以及其他的数字化资源等数字化信息及知识音频、视频、网上资源以及其他的数字化资源等数字化信息及知识的组织、加工与处理,实现对数字化信息资源的深层加工,支持以的组织、加工与处理,实现对数字化信息资源的深层加工,支持以标准化和规模化的生产方式进行资源加工,同时对加工的数字化资标准化和规模化的生产方式进行资源加工,同时对加工的数字化资源要能够多次使用,适应今后的扩展需要。数字资源的加工格式必源要能够多次使用,适应今后的扩展需要。数字资源的加工格式必须标准化;须标准化;

57、系统要求基于系统要求基于XML的资源,同时支持中文元数据规范,具备的资源,同时支持中文元数据规范,具备与数字版权保护、电子商务、调度等系统的接口,包括全文抽词建与数字版权保护、电子商务、调度等系统的接口,包括全文抽词建立索引、网上抓取、压缩、自动文摘生成、自动处理大量的图片、立索引、网上抓取、压缩、自动文摘生成、自动处理大量的图片、自动分类和摘要、对于多媒体信息特征的抽取等功能。自动分类和摘要、对于多媒体信息特征的抽取等功能。整合各文献单位拥有的数字资源和历史资源到数整合各文献单位拥有的数字资源和历史资源到数字图书馆中;字图书馆中;实现与其他系统互操作或交换,形成一个全面的实现与其他系统互操作

58、或交换,形成一个全面的数字资源库是数字图书馆资源建设的基础;数字资源库是数字图书馆资源建设的基础;不仅全面整合某一部门原有的分布在不同异构平不仅全面整合某一部门原有的分布在不同异构平台的高质量数字资源,还整合分布在若干不同部门多个台的高质量数字资源,还整合分布在若干不同部门多个系统中的各种类型的数字资源库;系统中的各种类型的数字资源库;可以同时从数字资源的封装及异构系统间的协议可以同时从数字资源的封装及异构系统间的协议两个途径实现;两个途径实现;在完成核心公共模块的前提下,先整合核心元数据,然后扩展到元数据集、数字对象;先整合系统的内部资源,然后整合其他系统的资源;先整合具有一定规则的数据库资

59、源,然后整合不规则的其他数字资源。将加工成形的数字资源发送到资源管理存储将加工成形的数字资源发送到资源管理存储系统的元数据库和数字对象库中;系统的元数据库和数字对象库中;通过用户界面与检索系统向用户提供数字资通过用户界面与检索系统向用户提供数字资源的查询服务;源的查询服务;系统涉及网络协议、媒体特性、易用性、信系统涉及网络协议、媒体特性、易用性、信息导航和语言转换等多方面技术;息导航和语言转换等多方面技术;用户检索和服务系统由应用界面系统、元数用户检索和服务系统由应用界面系统、元数据搜索系统和数字资源存取系统三部分组成。据搜索系统和数字资源存取系统三部分组成。数字图书馆环境下的馆际互借系数字图

60、书馆环境下的馆际互借系统,要从以传统介质为主的传递方式过统,要从以传统介质为主的传递方式过渡到兼顾印刷性文献和数字资源两方面渡到兼顾印刷性文献和数字资源两方面的方式。的方式。通过加密技术和数字水印技术来进行有效的通过加密技术和数字水印技术来进行有效的版版权保护权保护,同时通过安全认证技术来确保数字图书馆,同时通过安全认证技术来确保数字图书馆系统中数字对象的安全。系统中数字对象的安全。认证是用来识别个人、网络上的机器或机构;认证是用来识别个人、网络上的机器或机构;数字图书馆系统需要三类认证:用户认证、计数字图书馆系统需要三类认证:用户认证、计算机认证、图书馆资料的认证;算机认证、图书馆资料的认证

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论