数字图书馆前沿问题与图书馆信息技术部建设_第1页
数字图书馆前沿问题与图书馆信息技术部建设_第2页
数字图书馆前沿问题与图书馆信息技术部建设_第3页
数字图书馆前沿问题与图书馆信息技术部建设_第4页
数字图书馆前沿问题与图书馆信息技术部建设_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图书馆前沿问题与图书馆信息技术部建设(讲义) 1 数字图书馆前沿问题 11 北京 DL 高级研讨班概况 2006 年 8 月 14 日-16 日,“2006北京 数字图书馆前沿问题(发展战略与 实践)高级研讨班”在清华大学举行。该研讨班由清华大学图书馆、美国斯坦 福大学图书馆和中国图书馆学会数字图书馆建设与研究专业委员会联合主办, 中国学术期刊( 光盘版) 电子杂志社协办。来自全国 78 所高校图书馆和相关机构 的 200 多位代表参加了本次研讨会。这是继“2004深圳”、“2005厦门” 两届研讨会之后,海内外从事数字图书馆研究和建设的同仁们第三次相聚在一 起,共同分享信息、交流经验,尤其就某些数字图书馆前沿问题进行广泛而深 入地探讨。 1.2 三届数图高研班主题 (表) 1.3 北京 DL 研讨班专家报告综述 131 国内数字图书馆的发展概况 国家图书馆.数字图书馆管理处孙卫总工程师.国家图书馆二期工程暨国家 数字图书馆工程; 中国科学院文献情报中心副主任、国际图联采访与藏书发展专业委员会孙 坦研究员E-science 条件下的数字图书馆建设 ,重点介绍了 CSDL 开放体系 的基本设计原则、基本架构以及 CSDL 开放建设的进一步设想。 CALIS 管理中心副主任、北京大学图书馆副馆长、教育部高等学校图书情 报工作指导委员会副主任兼秘书长朱强教授介绍了 CALIS 的现状与进展以及 CALIS 通过验收的情况。 132 数字图书馆战略策划 阐述数字图书馆发展的战略趋势。 霍普金斯大学图书馆系统部主任王雪茅先生,全球图书馆环境中的领导 培养,首先介绍了全球化、全球图书馆以及领导培养的理念,然后从多个方 面剖析了所在高校数字化图书馆的五年战略规划,从理论与实践结合的角度阐 述了领导培养应该考虑哪些方面的问题。 爵硕大学林夏博士数字图书馆新技术展望,指出新一代数字图书馆必 须建立在新的观念上,要掌握数字信息的本质以及研究信息实体之间新生的链 接和关系,提出一门建立在网络科学、图书馆和信息科学,认知科学基础之上 的新学科 数字信息组织(DIO),并且介绍了几种知识组织新技术。 肯特州立大学图书情报学院的曾蕾教授数字保存,阐述长期保存的重 要性,解释了长期保存(Preservation)和获取使用(Access)的关系,并指出天生 的数字资源应该有长期保存的优先权并推荐了做长期保存项目应该参考和遵循 的十个文件,最后介绍了长期保存的一些实用技术。 斯坦福大学图书馆的张甲先生做了题为数字时代的信息服务报告,他 从项目背景、项目进展、合作原则等方面介绍了斯坦福大学图书馆和 Google 合 作的图书全文检索项目,另外还介绍了斯坦福大学扫描图书的流程以及全文检 索的各种检索功能,具体的检索层面分为字段检索、知识分类检索、联想检索、 引文检索、信息工具、定题追踪、建议/推荐、导航工具。他指出图书馆的作用 正在发生转变:从编制书目到知识导航,从提供馆藏到提供满足读者信息需求 的工具,从收集书刊到保存知识和发展数字文献内容,变单馆运作为知识源提 供机构的成员。 133 知识组织与内容管理 上海图书馆刘炜博士数字图书馆 2.0,展示了目前流行的 Web2.0 的理念、 原则、结构、语言和技术特征,进而结合 web2.0 在图书馆界的影响和应用论述 了图书馆 2.0 的服务理念、类型和原则。另外三位专家从不同角度阐述了知识 组织和管理的发展历程和技术方法。在浏览和检索界面设计中利用知识组织 系统(曾蕾),介绍了第一代到第四代网络界面的特征和变迁,如何在实际 工作中利用 KOS 的原理和方法提高用户的检索效率。 信息构建的可用性测试 (周晓英),主要从人机界面的可用性、信息构建与可用性、数字图书馆系统 的可用性及其测试方法等方面阐述这一主题。 134 数图技术科研与应用 信息可视化与可视分析(林夏),指出信息可视化应用的新浪潮即将到 来,新的应用将体现在信息搜索、知识发现、信息分析和集成方案等领域中。 信息抽取及其在数字图书馆中的应用研究(张智雄),从信息抽取的概念、 层次、类型、应用等方面对信息抽取做了详细介绍,对信息抽取技术在数字图 书馆的应用中作了展望。OpenURL 及其在链接解析系统中的应用(刘伟玲) ,机构库 背景、现状及思考(李春旺)。 135 资源整合与知识检索 资源整合与门户建设 清华大学图书馆的实践(姜爱蓉),主要从资源 整合的层面、方法、效果和门户建设的思路、内容、应用等方面汇报了清华大 学图书馆资源整合与门户建设的基本情况、实践经验和引发的思考。 从无的放矢到个性化的知识检索,提出了完全以用户需求为中心组织资源 的理念,倡导将图书馆的资源作为其他大型研究和学习组织的一部分来提供服 务,旨在方便读者使用。 数字资源管理的实例介绍:利用图书馆自动化系统以及开发数字资源管理系 统(刘伟玲)。 14 重点讲两个前沿问题 一个是因为与数字图书馆课程密切相关;一个是因为与信息管理与信息 系统专业密切相关。 141 数字图书馆 2.0 DL2.0=DL+WEB2.0 数字图书馆 1.0(图) 数字图书馆 2.0(图) 2.0 只是表示一种版本升级,呈现出与以往的一些不同 DL2.0:具有许多 Web2.0 特征的数字图书馆(以 Web2.0 作为技术和理念背景 的 DL) 具有不同的问题域和不同的侧重点,例如 以用户为中心 更复杂(细粒度) 的数字对象结构 更普遍的链接性 更多的多媒体而不是文本 更普遍的手持设备与 p2p 应用等 Web 2.0 技术特征 分布式架构 物理位置不同而共享资源与服务 松散耦合 高互操作性组建按需联络,统一的消息传递机制 平台独立性 不同应用平台(指操作系统、数据库平台)具有通用的机器界 面和人机界面 开放 APIs 服务的使用和通信等开放接口(或符合通用协议标准),技术 文档齐全 支持 Web 服务 访问(共享 /重用)Web2.0 组件的 的趋势(例如采用 SOA 架构,但并非都这样) 2.0 为什么会成功(Web2.0 的核心竞争力) 服务,而非软件。 通过使更多用户使用独特的、难以复制的数据而获得价值; 把用户作为开发者; 获得集体智能; 通过用户的“自服务”而服务于“长尾”; 轻型用户界面、开发模型以及商务模型(普及、普及、普及) Web2.0 与图书馆 2.0 比较 Web 2.0 互联网成为平台(参与体系)而不是利用互联网来统治和控制; 充分重视并利用集体力量和智慧; 将数据变成“Intel Inside ”; 分享和参与的架构驱动的网络效应; 通过带动分散的、独立的开发者把各个系统和网站组合形成大汇集的改革; 通过内容和服务的联合使轻量的业务模型可行,分享经济的模式; 注重用户体验的持续的服务(“永久的 Beta 版”); 服务和应用无处不在(非单机版和单一平台版本); 图书馆 2.0 以用户为中心; 富技术(technology-savy)环境; 提供长尾化服务; 内容为多种设备而准备; 软件的组件化,而不是单一的 ILS 解决方案; 持续不断的变化; 采用 Web2.0 的应用和服务; 开放标准 142 信息可视化 可视化向人们提供一种方法和手段,利用这种方法和手段人们可以观察人 们所不能观察到事务或概念。 可视化基本上可以划分为两个大类:科学的可视化(医学信息的可视化、气 象信息的可视化)和信息的可视化(软件工程的可视化、信息检索的可视化、 因特网的可视化)。这两者的根本区别在于科学的可视化在显示和展示事务和 概念时,继承事务和概念在它本体中的固有结构。 传统信息检索系统(Internet 搜索引擎,以及传统图书馆文献目录检索系统) 1 没有考虑人的检索查询行为。 2 对用户来讲是一个不透明的黑箱。 3 用户对传统信息检索系统的检索过程是不连续的。 4 检索结果是一种简单的线性表达。 5 缺乏一种有效的检索反馈机制。 6 检索结果不能够有效地展示大量文献体。 信息检索可视化优势: 1 一个可视化的信息检索环境利于用户进行信息浏览,信息开发,信息挖掘。 2 可以使一个信息检索过程透明。 3 可以向用户提供更为丰富的信息。 4 有可能开发出新的信息检索和信息浏览方法和机制。 5 可以将人的认知能力融入信息检索和信息浏览过程之中。 6 是一个良好的人机对话和交流的环境。 7 可以大大改善信息检索的检全率以及检准率。 8 为传统的信息检索打开了一扇全新的窗口,开拓了崭新的应用以及研究领域, 提升了信息检索的档次, 它代表着信息检索系统发展的未来。 建立信息检索可视化系统的一般步骤: 1 选择应用领域以及信息检索系统类型。 2 鉴别和定义要进行可视化的目标以及特征。 3 对可视化空间的定义。 4 目标体从原始数据库影射到可视化空间的算法和方法。 5 定义可视化空间中信息检索和信息浏览方法。 6 可视化系统设计语言的选择。 可视化信息检索系统的常见功能: 1 允许用户在可视化空间中观察文献与文献之间,可能的话文献与提问之间的 语义关系,浏览可视化空间中任意特定领域。 2 根据用户的需求,在可视化空间中动态地调整文献分布。 3 根据用户的需求,在可视化空间中扩大/缩小一个特定的局部空间领域。 4 根据用户的需求,在可视化空间中任意地选择一个文献并且阅读它的有关详 细信息。 5 提供信息查询手段。 6 展示并且解释标准的情报检索模型以及其他信息检索机制。 信息检索可视化面临的问题: 1 怎样在有限的显示空间内展示海量信息? 2 怎样有效地定义和建立信息可视化空间? 3 怎样有效地评价信息检索可视化系统? 4 信息检索可视化系统空间维数的争论。 互联网信息的可视化主要反映在以下方面: 1 对搜索引擎结果的可视化。 2 对互联网之中网页之间节点联系的可视化。 3 对互联网之中用户使用网络的情况进行可视化处理。 信息检索的可视化系统:TileBars;VISUAL NET;GRIDL;DARE。(很遗憾,似 乎为小范围实验系统,笔者未能体验。) (注:以下资料源自林夏先生的 PPT。) 信息可视化是一门边缘学科(计算机科学,信息科学,心理学;教育学及其他 应用领域) 1995 年前后,随着网络信息技术的发展,一批可视技术有了新的突破。信息可 视化领域的一个里程碑是 1995 年开始的 InfoVis 年会。另一个里程碑是 1999 年 出版的“Readings in Information Visualization”。 信息可视化的三大支柱:感知的功能;图形的功力;联想的潜力。 信息可视化是对人类智能一种新的开发:理性的智慧;感性的智慧;知性的智 慧(理解感知的能力:认知的功能、图形的功能、联想的功能;通过计算机的 功能来提高,放大认知的功能) 信息可视化寻求人机合作(计算机将大量抽象的信息映射到图像上;人们通过 图像的结构,特征等来理解认识从而获得知识。) 计算机与人各显神通(电脑的高速信息处理能力远远超过人脑;人脑的识辨, 理解能力是电脑所不可及的) 今天的信息世界(信息爆炸:怎样组织它们?信息超载:怎样理解它们?所有信 息是相互关联的:怎样介入它们?知识淹没在信息中:怎么发现知识?信息以 各种形式展现:怎样显示他们?) 信息可视化在数字图书馆中的应用(用可视化揭示信息的分布;用可视化显示 检索的结果;用可视化为大量的信息分类;用可视化帮助用户浏览;用可视化 为信息个体化服务) 信息可视化的应用实例: TheBrain: / Touchgraph: / Grokker: /service/grok/g_products.html Topic maps Highwire: 信息可视化开发工具: / InfoVis Cyberinfrastructure Indiana University: / Piccolo Toolkit University of Maryland: /hcil/piccolo/ the prefuse visualization toolkit: / The visualization toolkit: /VTK/ OpenDX: / 2 图书馆信息技术部建设 21 中美图书馆信息技术及相关机构设置调查 根据 2006 中国高校排名、2006 美国大学排名,逐一访问各自前 10 名高校 图书馆网站,结合笔者占有的资料,从中分别选取关于机构设置信息最新最多 的 5 所高校作为研究对象。中国选取清华大学(1)、浙江大学(3)、复旦大 学(5)、武汉大学(8)、中山大学(10)。美国选取 Princeton University(2)、 Yale University(3)、University of Pennsylvania ( 4)、Duke University (5)、 Stanford University(6)。(注:学校后边括号内的数据为其名次。)表 1 为信 息来源网址,访问时间均为 2006 年 6 月 26 日。 中美图书馆信息技术及相关机构设置调查表 图书馆 机构设置 清华大学 系统部、数字图书馆研究室、文献技术服务部 浙江大学 系统中心、数字资源中心、 复旦大学 数字化部 武汉大学 办公室、采编部、系统部、声像部、信息服务中心、典藏 部、文理分馆、工学分馆、信息科学分馆、医学分馆 中山大学 数字资源部 Princeton Technical Services Department; University Yale University Digital Library Research and Planning Team; Integrated Library Technology Services; University of Pennsylvania Information Processing Center;Information Technologies Digital Library Systems and Services 调查结论: (1)机构名称混乱,岗位职责不够明晰。机构名称五花八门。如系统部、系统 中心、数字资源中心、数字化部、数字资源部均貌似“信息技术部”,具体岗 位职责不得而知。这给读者服务与馆际交流带来若干不便。 (2)美国设有数字图书馆研究部(或组), 具体从事有关数字图书馆的技术和服 务方面的研究, 中国称数字化部等, 其职能远不及美国, 只是从事简单的资源数字 化工作, 职能与美国相近的也只有清华大学图书馆的数字图书馆研究室。美国数 字图书馆的发展过程,经历了由静态表达到动态检索,最后实现信息同步这样 一个由初级向高级阶段递进的发展过程,数字图书馆的实现方式也由自己开发 软件向购买商业软件转向,并始终保持与 IT 业界发展同步和享用 IT 行业的技 术与成果,因此,图书馆界非常关注 IT 技术的发展和 IT 技术在图书馆方面的 应用问题,关注数字化文献保存技术。国内高校图书馆数字化技术的重视程度 还远不及美国,对数字图书馆的研究乃至对信息技术的应用均落后于美国。 22 图书馆 2.0 与图书馆信息技术部的建设 现代技术与图书馆的发展密切相关这是一个共识。但我国目前图书馆信息 技术部的建设很不理想。(其实,技术部门的叫法,依旧是五花八门,我坚持 用图书馆信息技术部来称谓它。)“图书馆 2.0:观念与技术”,观念是前提, 技术是手段,图书馆需要自己的技术人才。 广义的现代图书情报技术:数字图书馆相关技术问题的理论探讨与实践交 流,如数字图书馆体系结构;个性化服务的技术、算法及管理机制;分布式数 据库技术;基于内容的多媒体信息检索;海量信息存储、组织和管理;元数据 标准和规范的研究和制定;馆藏数字化技术;基于 Web 的搜索引擎技术;自 然语言处理技术以及语义网研究等。计算机信息管理技术的应用、研究与发展。 计算机技术在图书馆学、情报学中的应用。 现代图书情报技术具体到图书馆领域,主要是指应用于现代图书馆管理与 服务中的现代信息技术。主要包括以下内容: 硬件层面。包括网络综合布线工程、网络设备、UPS、计算机设备及其他 信息技术设备。前期的设备规划,中期的管理与维护,后期的报废处理都需要 技术。图书馆员(技术人员)在里边起的作用主要是一种协调作用,包括馆内 的协调,馆外的协调(比如与硬件供应商,维修商等等的协调。)对于各种信 息技术设备,我们的图书馆员(技术人员)要尽可能熟悉其原理,拥有相应的 一些维修设备,能够进行一些日常维护。 软件层面。核心是图书馆自动化系统,系统管理员在图书馆是一个非常重 要的角色。其他还有电子阅览室管理系统、网站发布系统、办公自动化系统, 电子书电子期刊服务系统等等。图书馆员(技术人员)需要有较强的学习能力, 熟悉 SQL 语言,了解相关技术,最好是精通一门编程语言,此外要有较强的沟 通能力,现代信息技术运用能力。 服务层面。比如网站的设计与制作,网站日志分析,自动化系统数据挖掘, 学科导航设计,数字参考咨询,开展网络调查等等方面。这个层面需要有敏锐 的洞察力及较强的归纳分析能力,需要有较深的理论基础及较强的信息技术应 用能力。 在上海召开的“图书馆 2.0:观念与技术”研讨会闲聊中,进一步感受了 图书馆信息技术部的生存状况。有专门技术部门的馆对信息技术部馆员的评价, 简单说就是:没本事,脾气大。两年前,也是外出开会,跟一位老师聊起他们 的技术部主任,感觉恨得咬牙切齿:利用图书馆设备干私活,人在心不在。如 此等等。这几年我亲身走访

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论