基于xml技术的图书馆定题服务研究_第1页
基于xml技术的图书馆定题服务研究_第2页
基于xml技术的图书馆定题服务研究_第3页
基于xml技术的图书馆定题服务研究_第4页
基于xml技术的图书馆定题服务研究_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于xml技术的图书馆定题服务研究

图书馆的具体服务是图书馆根据读者的信息需求开展的一项积极服务之一。长久以来,图书馆的定题服务针对读者个别兴趣,选择最新信息,以主动积极的方式提供信息服务,取得了卓越成效。目前,定题服务已经成为国内外图书馆服务化被动转为主动的典型范例和主要选择。《图书情报工作》2007年第11期曾经刊发了中科院唐勇、袁大发研究员的论文《科研院所情报工作的定题跟踪服务》,论文探讨了定题跟踪服务的工作要求与方法,提出了信息内容的集成、服务手段的集成和个性化服务的网络SDI服务的发展趋势。本文基于此研究理论和国外相关学者的研究分析,在对目前定题服务的一般模式的研究基础上,提出基于RSS技术的图书馆SDI服务系统的构建思路。1组织内各项资料的使用率Luhn在1958年曾提出,SDI是一项在机器(计算机)辅助下,传播新信息的服务,目的是要使组织内的每位成员能获取新的资料,而组织内各项资料的使用率能达到最高点。Housman和Kaskela在1974年说明,SDI系统的目的并不是研究人员在紧急时,去找出有用的资料,而是持续通知和帮助研究人员在其专业领域上的资料搜集和更新服务,让研究人员借助最便捷的SDI服务获取最全面的专业领域的发展进程。定题服务在具体执行过程中,无论是人工手动或电子自动化系统,筛选资料和提供服务的一般模式如图1所示。2sdi系统使用新特点定题服务的发展受社会和技术条件的限制和影响,每个历史时期SDI系统都有它各自的特点。目前在网络技术日趋成熟和普及的环境下,图书馆定题服务和SDI系统的服务内容和方式也提出了新的要求。网络环境下SDI系统具体服务要求包括:a.明确的挑选。SDI系统中,信息挑选的条件是以能描述读者搜寻信息的要求为基础。若系统中信息资源的建立能反映读者以往的搜寻习惯,系统接受度和满意度将会较高。b.简便的通知。使用SDI系统的最后结果,就是要获得和对象信息需求相符的新书摘要和期刊全文内容。以往是用纸本打印传递,现今多以电子邮件通知。c.全面的反馈。为了评估系统效能,读者常被询问对于通知内容的反应,而多以文献的查全率(Recall)及精确率(Precision)来衡量。d.兴趣档的更新。若读者长期持续相同的研究,其文献搜寻型态一般会稳定不变。如果因为兴趣改变,或其他因素,造成搜寻重点突然转变,就必须根据转变调整兴趣档。总之,SDI系统管理者应该全面策略性地考虑以上4项要求,其中任何一项特色的改进,都会增加系统的使用敏感度。然而,在许多文献报告中,对于SDI系统的重点都放在系统如何设计、硬设备的设定、软件的包装,而较少注意到这些要求与使用者间的互动。管理者、研究人员、和计算机工程师们会注意到SDI系统的存在,但却很少进一步了解可以如何利用,真正解决信息处理的问题。所以,为提升SDI使用率,必须调整思考方向,对于潜在使用者应先告知这4项要求及优缺点。而且,系统功能应和计算机硬设备分开,因为使用者只在意所提供的功能,所以这些功能必须符合使用者喜好及定位。3信息的定题整理RSS(ReallySimpleSyndication)最早是1997年由DaveWiner在UserLand公司时设计出的一种规格,由于应用了XML,使得撰写网页不用像以往一样编辑HTML档,只要编好item内容,便可转换成HTML的网页。RSS发展至今有多种版本,2003年7月,UserLand软件公司将RSS2.0的所有权移转给哈佛的伯克曼网络与社会中心(BeckmanCenterforInternet&SocietyatHarvardLawSchool),成立独立的咨询委员会,推广RSS使用,及给予RSS开发人员建议。在该委员会的指导下,RSS技术在网络信息定题服务中得以长足的发展和广泛的应用。RSS可视为一个小型资料库,内含网站标题及内容和网站本身的描述,起先主要用来发布和聚集网页内容(例如新闻标题)。对网页内容供应方而言,可以利用RSS半主动地将该网站的某些信息、状态等进行整理后,通过标题列的显示方式提供给读者阅读,免去读者在众多文字、图片的网页中寻找标题位置,也不必再一一通知订阅用户内容有所更新;对网页订阅方而言,只要订阅RSSfeed,不必开浏览器,就可通过RSSReader自动获取网页更新的内容;如此可省却许多信息传递的时间和成本,达到内容联合(ContentSyndication)的自动化。在RSS技术支撑下,同样一份文件,可以经由许多入口(各处的RSSReader)连结取阅,而不必有许多相同的复本散落网络各角落。所以,在网络信息资源飞速增长和网络个性化服务需求日趋明显的环境下,RSS技术的产生解决了信息搜索和提供服务的诸多问题,为网络资源的定题服务提供了技术支撑。以下将本文研究应用RSS时会遇到的相关名词简单整理,分述如下:a.RSSFeed。放置资料内容的档案,资料内容可能是一则新闻或网志,档案则是一份Well-Formed的XML档案,依循不同版本规格而有不同的写法。相对的,现在很多RSSReader软件也同时支持不同的RSSfeed版本。b.RSSReader。剖析、接收RSSFeed档案的软件,有各种形式,包括单机安装、浏览器内挂、和电子邮件方式;支持各作业平台,如Windows、MacOS、及PDA。使用者只要找到RSSFeed档案的URL网址并订阅,就可定期收到更新内容。c.RSSAggregator。RSSAggregator为RSSFeed提供多一层的使用方法,其将RSSfeed收集在同一接口,分类、更新并过滤标题,成为订阅、搜寻RSSfeed的来源。有些网站甚至提供公开的ServiceAPI呼叫,供订阅用户运用,以分析RSSFeed的点选率及连结数。OPML(OutlineProcessorMarkupLanguage)。是一个XML档案,起源由RadioUserLand公司发展而成,用在Outliner的文字编辑程序中。Outliner是将文字资料以阶层式结构集合整理的编辑程序。因为具有结构性,OPML文件可以让许多RSSFeed清单有次序地汇集成单一档案,以供RSSAggregator、RSSReader软件汇入、汇出互相交换使用,这是应用最普遍的地方。4期刊管理服务目前一些图书馆的期刊数据库厂商,开始提供以RSS方式传递SDI服务信息,这些信息包括新期刊的目次和文章摘要。基于RSS技术的SDI系统模型如图2所示:在图3中,与传统SDI服务模式比较,主要改进内容包括:RSSFeed是符合XML规格的档案,元素内容可视制作者需求而定。目前RSSFeed的制作者以资料库厂商为主。每则RSSFeed所传递的信息多是期刊目次,信息安排较规律;而邮件通知只是告知新到期刊,详细目次还要进一步连结。a.以RSS订阅电子期刊不需建立兴趣档,使用者进入系统后,就按需求直接订阅;数据库系统也不储存订阅纪录。b.在使用电子邮件的SDI服务模式中,数据库系统根据读者兴趣档和新资料做比对,把符合的新资料以电子邮件传送给读者;在使用RSS的SDI中,只要判别有无新资料,不需比对,且判别及传送更新内容的动作可由分散世界各地的RSSReader分摊处理,如此可减轻期刊数据库集中处理的负担,并分散传送资料的网络频宽资源。c.若要取消或修改订阅内容,在使用电子邮件的SDI服务模式中,必须修改兴趣档,或依步骤取消订阅;以RSS的方式则是直接删除RSSFeed订阅。5系统总体架构针对SDI服务,以RSS技术为基础,设计出SDI服务的新方式。在此提出一个符合个性化需求,电子期刊中间过滤机制的系统MJFB(MyJournalFilterBroker),以期实现SDI个性化数字图书馆服务。系统设计目的是以网页浏览器为读者与网络期刊资源的中介者接口。为让使用者能明确定义需求,借助个性化服务的概念,设计出挑选、过滤订阅期刊的功能。而关键词对衡量网站的价值和重要性,占有较高的作用;因此系统设计以关键词去寻找新发表的相关期刊文章;在最后以RSS作为传递新信息的工具,为了减少不明确、非必要的RSSFeeditem数量,系统提供进一步检索RSSFeed的功能;并且为了顾及浏览RSSFeed的便利,系统提供浏览排序的选项。早期阅览订阅的RSSFeed,大多需要安装额外的RSSReader软件;现在则有Web接口和电子邮件的方式可以选择。为了增加阅览RSSFeed便利,将所有处理过程结束后的RSSFeed同时显示在系统页面上,每位使用者在登入系统之后,不需额外软件,就可随时看到属于自己的所有订阅内容。就软件设计而言,系统以三层次的概念来实现,如图3所示。依据图3系统软件设计的基本流程,以下就系统架构的三层次概念分别说明:a.外部界面(ExternalInterface)。系统初始,通过浏览器做个人账号的登入,以实现个性化服务的第一步身份验证,进入系统。另外,使用者通过外部一般RSSReader软件,订阅经系统处理过后的RSSFeed及OPML档案。b.系统处理(MJFBSystem)。系统处理是系统运作的主要部分。在使用者登入之后,依据个人Profile资料,系统做4个部分的处理:进一步增加或删除订阅、订阅后的处理、产生RSSFeed、并且让所订阅的RSS能同时在系统中显示,而无须再通过额外的RSSReader软件和界面,增加系统的整体便利性。c.资料搜寻与储存。数据库储存每位使用者的资料订阅纪录,关键字数据库储存每位使用者所建立的关键字组以及搜寻回来的新期刊文章相关信息。依据使用者及所建关键字的Profile资料,储存订阅纪录在系统数据库,同时借助Ingenta数据库提供相关信息给系统做进一步处理。对全部资源按照学院分类储存,并储存期刊的ISSN及RSSFeed的URL网址,详细期刊资料则通过URL连结。6期刊信息搜寻在期刊订阅中,使用者登入之后,则需先做身份的判断,得知使用者所属学院。接着,从订阅资料库查询已订阅清单,系统分别与该学院及历史查询清单比对,若订阅清单中并无纪录,则从历史查询及学院期刊资料库中列出全部期刊;若已有订阅纪录,则列出尚未勾选订阅过的期刊。订阅资料库仅纪录期刊ISSN(InternationalStandardSerialNumber)编号,详细的期刊资料,包括RSSFeed网址,则以ISSN值在期刊资料库(jurs)中查询。在列出尚未订阅的期刊时,使用者便可依此网址单笔在RSSReader中订阅。其中以关键字搜寻最新期刊文章的处理程序如图4所示,各步骤分述如下:a.关键字建立。在系统界面中,输入关键字内容、追踪频率选取关键字和检索条件。b.关键字查询。系统每天自动判断有哪些关键字已到达追踪时间,将已到达追踪时间的关键字搜寻Ingenta数据库期刊内容,同时更新该关键字之最新时间;并纪录此更新时间存进数据库,以此更新时间为计算下次是否已达追踪时间的依据。c.解析查询结果页面。搜寻完Ingenta数据库之后,接着做网页解析(Parsing)的动作,也就是分析查询结果页面上的内容该如何放入数据库栏位中。由于本研究采用Ingenta数据库的搜寻界面,而Ingenta搜寻结果页面上的export(plaintext)功能中,则以每页50笔纪录的规则详列了搜寻结果的文字,成为网页解析的依据。在以上处理流程中,在每个搜寻结果的页面中,很有规律的一笔笔纪录了搜寻到的期刊文章,利用程序解析期刊文章的metadata资料,并将其存入数据库。SDI服务提供中,期刊文章的metadata资料规则的列出来,详细内容提供链接的URL地址,可以点击直接浏览。7使用方便,减少数字垃圾信息的误接针对现代图书馆个性化需求与RSS技术本身的特性,根据MJFB系统流程和订阅后置处理程序,设计出如图6所示的系统功能,使用者在远程通过浏览器登入、身份验证过后,进入MJFB系统。在提供订阅与删除订阅功能之外,系统同时集成RSSReader软件,使用者无须再额外安装RSSReader软件就可以实现订阅和浏览所有过程,增加了使用的便利;在系统输出的部分,除了个别期刊、关键词的订阅外,利用RSS本身的OPML格式,产生每位使用者自己的OPML档,达到个性化的服务效能。在电子化系统发展中,便利性和信息过量二者间,存在难以平衡的矛盾。一方面要自动通报新信息,一方面要花时间去处理这些新信息。普遍而言,现今各个专业人员在通过电子邮件订阅网络专业资料的同时,却收到50%以上的垃圾信息、群发广告邮件或不完整的信息资料,局限了专业人员对新信息新

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论