云计算环境下的中文图书信息共享平台初探-基于图书馆信息流整合与利用的思考(上)_第1页
云计算环境下的中文图书信息共享平台初探-基于图书馆信息流整合与利用的思考(上)_第2页
云计算环境下的中文图书信息共享平台初探-基于图书馆信息流整合与利用的思考(上)_第3页
云计算环境下的中文图书信息共享平台初探-基于图书馆信息流整合与利用的思考(上)_第4页
云计算环境下的中文图书信息共享平台初探-基于图书馆信息流整合与利用的思考(上)_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    云计算环境下的中文图书信息共享平台初探基于图书馆信息流整合与利用的思考(上)    摘要:图书馆信息流的整合与利用关系到文献资源建设的质量,本文以中文图书信息流为例,提出图书馆内部信息流和外部信息流双向流动的关系,并针对目前在采访实践工作中图书信息全面获取、信息整合汇总、信息采编加工环节遇到的难题加以阐述,提出利用信息流整合技术手段,开发基于云计算的图书信息共享平台,由大型图书馆牵头,借鉴国内外先进案例,实现由多功能模块组成的云端共享服务和信息多方共建共享,同时完善图书馆基础业务操作,建立云图书馆员机制。以期更加有效地整合中文图书信息流,促进采访

2、工作信息的有效利用。关键词:中文图书,信息流,云计算,整合,共享随着数字图书馆时代的到来,图书馆信息流的重要性越来越引起图书馆界的重视,信息流的传播速度和利用程度直接关系到文献资源建设的质量。为了有效进行图书馆外部与内部信息流的相互转换,笔者基于图书馆中文图书信息流在整合与利用过程中面临的一系列困境及难题,针对信息流的有效整合利用进行深入研究,以期探索出适应数字时代图书馆发展且满足图书采访需求的可行性对策。1 信息流的概念信息流是传播学中的一个重要概念,它最早由美国传播学者罗杰斯提出,后引伸到各个领域中。广义的信息流是指人们采用各种方式来实现信息交流,从面对面的直接交谈直到采用各种现代化的传递

3、媒介,包括信息的收集、传递、处理、储存、检索、分析等渠道和过程。狭义的信息流是从现代信息技术研究、发展、应用的角度看,指的是信息处理过程中信息在计算机系统和通信网络中的流动。虽然到目前为止,图书馆学中并没有一个明确的关于信息流的定义,但是从上述概念中不难看出,信息流是一个过程,一种活动,它是有向的,并不是静止的,所呈现出来的状态是不同的。简言之,信息流就是信息的传递过程。同时,它也是实现图书物流的基础,是先于物流的重要保障。根据信息流的概念可以判断,图书的信息流主要包括产生、获取、解析、加工以及服务等。2 图书馆中文图书信息流的传递渠道及过程从上述信息流的概念来看,信息流所描述的是信息流动过程

4、中所呈现出来的各种状态。仅就中文图书信息流而言,可以将其分为两个阶段,即图书馆外部信息流和内部信息流(如图1所示)。图1 中文图书信息流模式图图书馆外部信息流主要体现在信息生产者以及信息传递的媒介上。其中,图书信息的产生主要来自于出版社发行部门的馆配书目、各级书商的馆配书目、其他图书馆的馆藏目录、读者推荐书目、新书发布会信息、总编室的缴送样书清单以及原书作者赠书清单,等等。这些数据分别通过各种虚拟媒介(如网站、qq群、博客、微博、微信二维码等)和实体媒介(如报纸、杂志、广播、电视等)从不同的维度渗入到图书馆的采访工作中,成为图书馆内部信息流开发利用最重要的前提要素。图书馆内部信息流主要是指各种

5、图书信息在流入图书馆之后,被获取、解析、细化、分类、加工,最终服务于读者的一系列操作过程。可以将其大致分为4个模块:信息获取、信息解析、采编加工、信息服务(如图1所示)。采访人员通过各种方法从不同渠道获取图书信息后,经过统一格式、保留有效字段、删除冗余信息、汇总信息等工序,得到较为全面准确的采访书目信息,通过对书目信息的查重甄选后,有针对性的进行采购和访寻工作。随后,编目和加工人员则开始对到馆图书信息进行细化、分类、加工,所生成的馆藏目录信息最终被读者浏览利用。简言之,图书馆外部信息流是实现图书馆内部信息流的内容保障,而图书馆内部信息流则是图书馆外部信息流的一种具体表现。需要指出的是,在内部信

6、息流的开发较为成熟时,它会变为其他图书馆的外部信息流的一部分,在整个信息流的产业链上,两者充分实现了双向流动的过程。所以,笔者认为两者不仅是递进关系,更多的是相互促进的关系。3 图书馆中文图书信息流整合利用所面临的困境以中文图书信息流为例,从图书信息的获取到整合汇总再到编目加工都在如今的数字化图书馆时代面临着一系列的困境,中文图书信息流的整合利用需要更加有效的研究实践。3.1 及时获取优质图书信息的困境图书采访环节的第一步首先是图书信息的获取,也就是使图书馆外部信息流变为内部信息流的关键环节。在这个过程中,采访人员需要从书商、出版社、读者、作者、其它图书馆等各种途径获取图书信息,由于目前出版发

7、行市场的复杂化,使得图书信息的获取仍然不能满足图书馆及时准确获取目录的目标。3.1.1 书商书目存在漏洞目前大多数公共图书馆都采取政府采购的模式采购图书,因此书商提供的全品种书目成为中文图书获取图书信息的重要手段,而新华书店系统的国营书商与民营书商在经营理念和管理运作上各有利弊,没有一家书商可以将全部的书目信息提供给图书馆,如部分包销、合作出版、折扣较高且学术性强等的书目常常无法获取。3.1.2 出版社书目无法囊括全部出版信息由于书商提供的书目信息存在漏洞,采访人员就更需要从外部信息流的源头出版社获取书目。但是出版社由原来的事业型单位改为营利性企业单位,这样的改制使得越来越多的出版社更青睐自费

8、图书的出版与发行,将很多图书的发行权交予其它公司或个人,出版社的发行部门仅掌握部分书目信息。尤其是目前大量民营出版公司具有独家出版发行权,大多数出版社总编室与发行部门相脱节,出版社不但不能发行此部分图书,连书目信息也无法获取。因此采访人员从出版社获取的书目也无法囊括全部的出版信息。3.1.3 图书馆之间信息共建共享尚需开发图书馆之间合作较少,书目信息得不到有效流动传播,目前图书馆依靠全国图书馆联合编目系统可获取到大部分图书馆馆藏信息书目,但一些非成员馆的书目信息仍然处于空白状态,尤其是西北、西南地区或具有地方特色的图书馆所藏图书,这正是某些图书馆中文图书信息获取的瓶颈。3.1.4 媒介信息和自

9、动化系统利用率低所有外部信息都是通过各种媒介进行传播和利用,而面对信息高速发展的数字化时代,书目报和杂志等一些实体媒介一般对于量化的采访部门而言利用率较低,仅仅对于一些畅销书或重点书引起关注。同时,在各类网站、qq群、博客、微博、微信、二维码等虚拟媒介充斥人们生活的时代,图书信息作为必不可少的元素也加入其中,而大多数图书馆的采访环节对上述虚拟媒介的利用却是少之又少,无法实现虚拟媒介的主动利用。比如读者推荐书目可以采用网络量化推荐模式。同时对于各种渠道都无法获取的作者包销书,大多数图书馆处于被动接受的状态,还没有实现主动出击的索赠模式。因此对于外部信息流的读者和作者环节应当引起图书馆的重视。3.

10、2 信息整合汇总的困境当外部信息流经过媒介的传播成为图书馆内部信息流时,要想使书目信息顺利流通到下一环节,并顺利完成批查重,快速有序的整合汇总就成为重要步骤。以图书馆获取的中文图书信息为例,人工化的书目信息整合面临着很大困境。3.2.1 信息整合汇总技术手段原始单一,人工成本较大目前,多数图书馆信息整合汇总工作的技术手段仍然以利用excel信息处理为主,大部分书目信息需要人工手动逐一完成,耗时耗力。虽然也有批量合并整理的小型应用程序,但多处于分散状态,并未进行功能集成,要求使用者具备较为初级的编程知识,并且对于批量处理的文件要求格式、字段名和字段数量统一,操作起来具有一定的局限性。这些小程序在

11、一定程度上减轻了信息整理人员的工作负担,但其仍处于辅助工具的地位。有时候需要多个程序交替使用,才能完成部分信息整合工作,很多书目信息整理软件存在着操作性不强,界面不友好等问题。3.2.2 信息格式多样复杂,存在大量冗余内容由于技术的发展,信息存储方式的不同,信息格式也越来越复杂多样。根据笔者的采访经验,图书馆收集到书目信息主要有.xls、.xlsx、.pdf、.iso、.doc、.docx. exe、.txt、.mxl等格式。格式种类繁多,除了excel和marc格式的信息,其他格式的信息都需要较长时间进行整理才能加以利用。这种情况在出版社提供的书目中更为普遍,尤其是使用pdf格式的图书信息更

12、加难以整合,这种格式的图书信息一般情况下都是通过重新手工录入到excel来完成整理的,造成了人力成本和时间成本的增加。除了格式多样,由于图书馆是从不同途径获取的图书书目信息,因而存在着大量冗余信息,这就涉及到另一个难题冗余数据的排除。以一个书目信息的文件为例,要想删除全部的冗余数据,则至少需要两次的删除操作,即文件自身的比对删除、与历史数据比对删除。此外,由于从各种渠道获取的书目信息著录标准不统一,因此书目信息的字段千差万别,而完成批量整理和批查重的前提条件就是字段统一,这就造成了只能手动整理信息的局面。甚至有些出版社的书目只有isbn和题名,给图书整理工作带来了一定程度的影响。3.2.3 网络信息抓取技术较为落后,处于单件写入阶段随着网络技术的发展,人们购书方式的改变,网上书店的规模越来越大,其中存在着大量的书目信息,这些信息往往与我们从其他渠道获取的书目会有一些差异,如何整合这些信息也是图书馆采访部门近几年一直在探讨的问题。虽然有些图书馆已经设计开发出抓取网络书目信息的程序,但仍然是单件操作,无法实现自动批量处理,整合信息也只能部分批量处理,操作流程繁琐,人工操作比重较大,信息不能快速准确地被整合利用,距离智能自动化网络信息整合还有一定差距。3.3 信息采编加工过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论