图书采购查重系统的研制思路与应用_第1页
图书采购查重系统的研制思路与应用_第2页
图书采购查重系统的研制思路与应用_第3页
图书采购查重系统的研制思路与应用_第4页
图书采购查重系统的研制思路与应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图书采购查重系统的研制思路与应用

1查重系统视角通过阅读和写作研究,文件采购的质量直接受文件建设的质量控制。为使查重尽可能全面精确,图书采购时应采取多个检索点同时对比查重。目前高校和公共图书馆的图书采购查重大多以ISBN为标准。从理论而言,ISBN作为国际标准书号,能使不同出版者的每一种图书在世界范围内具有唯一性,因此,它在图书馆的采购查重中被作为重要的查重标准而被广泛采用。CNMARC专门设置了010字段,用于在文献著录中记录ISBN的有关信息。用ISBN查重,可操作性强,简单易行。但是ISBN存在以下情况,对查重质量影响较大:①图书出版存在异书同号(一号多用,特别是丛书,盗版书)的现象。②图书出版可以同书异号(一书多号)。如:不同出版社出版的同一种文学名著,或同一出版社出版的不同装帧形式的同种书。③早期出版的图书没有ISBN号,从而导致漏查(我国于20世纪80年代中后期开始陆续采用ISBN)。④馆藏MARC记录ISBN信息著录有错误。单纯利用ISBN查重不能实现根据复本量追加采购数量。有的图书经ISBN查重判定为重复记录,但是馆藏的复本量少,需要追加采购量,所以需要查重系统具有根据馆藏记录来追加采购复本的功能。目前书商提供的书目Excel表格式书目,只能手工逐个查重,不利于采用计算机进行采购查重工作。2重要的图书采购系统2.1复本补购认定图书采购查重就是对决定要购买的文献核查重复记录,即利用有关软件工具对馆藏总书目、已购买但还未入库的订购书目录和不打算购买的图书书目进行检查,核对以前是否入藏或预订过这种文献,以避免造成重订或误订,并能在该文献缺少或需要补充复本时,确定需要订购的文献名称及数量。复本补购认定也是采购查重中较重要的工作。若图书与某一馆藏记录的题名、责任者、出版项、ISBN等著录信息(字段)完全相同,则为复本。这些需要被查重的字段都包含在图书的MARC记录中,它是机读目录格式,是一种以代码形式和特定结构记录在计算机载体上,可由计算机自动控制、处理和编辑输出的记录。研发一个可以利用图书MARC数据,实现以ISBN和馆藏册次为字段进行采购查重的系统,且同时能使用题名、责任者、ISBN、出版社等字段对订购图书精确查重并具有输出各种表单的功能。这样的图书采购查重系统是图书馆和书商十分需要的查重工具,有较大的应用价值和实际意义。2.2结合书商map与馆藏table的转换该软件应该可以实现MARC数据与文本文件,MARC数据与Excel文件的相互转换与输出;可以实现书商MARC与馆藏MARC数据自设定子字段批查重;现场采购时能根据ISBN和册次来查重,并根据馆藏数量自动设置追加购买复本数。3重要的图书采购和质量研究3.1合理添加文献资源图书采购是图书馆工作的第一环节。随着各高校图书馆年购书量的急剧增加,特别是现场采购的日益增多,如何控制所订文献数量,保证文献质量,合理使用有限经费,全面准确地查重就显得日益重要。3.2主要内容3.2.1复本的确定利用书目数据的MARC字段对比查重。确认题名(200a)、ISBN(010a)、出版社(210c)、作者(200f)等指定字段中的项目(项数可根据本馆情报自定)同时满足重复,即可以确定此书为复本。从馆藏书目的MARC获取册次数据,确定已有复本数。3.2.2应用程序组件设计在编制采购查重软件的过程中,我们采用了微软的VC作为开发语言,并且使用了微软的数据库引擎ADO。VisualC++是面向对象的可靠语言,通过高级模板功能、低级别平台访问和优化编译器,可以生成功能强大且高性能的应用程序,实现组件的出众功能。ADO(ActiveXDataObjects)是一个便于使用的应用程序层接口,是由微软为最新和最强大的数据访问范例OLEDB而设计的,它编写的应用程序能够通过OLEDB提供者访问和操作数据库服务器中数据,并且在前端和数据源之间使用最少的层数,提供高性能接口。3.2.3图1显示了系统流程的原理4主要系统功能模块4.1采购模块4.1.1图书的复本数挑战系统外出采购人员带条码阅读器加笔记本即可利用该模块进行采购工作。设置好需要采购图书的复本数,系统会根据已导入图书馆书目数据MARC文件自动进行复本查重。通过所采购的书的ISBN加册次这条记录就会自动追加并即时保存到系统的数据库中。采购结束后,可以“导出”一个含此次采购书的ISBN号和册次的文本文档。4.1.2现场购买主设备利用查重系统导出图书馆的ISBN号加复本数,再导入到数据采集器里,进行现场采购查重。4.1.3el文件互转将图书馆的MARC数据导出来,利用查重系统的MARC与Excel文件互转,将MARC数据转换为Excel的形式,交书商查重。同时可以对采购的图书进行分类统计,采访人员可以根据这个统计来了解本馆本次图书采购的类别数量分布及其购书经费分布情况。4.1.4查重系统总库的结合●导入图书馆书目MARC数据,将从图书馆导出的总库数据作为已有藏书数据导入到本系统的数据库中,然后利用该模块即可输出ISBN加册次。工作人员携带此数据和本查重系统即可外出现场采购,但须及时将采购书目记录追加到查重系统的总库中,以备下次现采查重用。还应将需要查重的数据,如外部库、编目库的MARC书目记录追加到查重系统的总库。●用ISBN输出书商MARC数据,通过采购所得到的ISBN数据,可以利用此模块对照书商完整的书目MARC记录,输出所采集到的图书的完整的MARC记录,这就是我们通常所说的套录。(根据采购ISBN号套取书商的详细MARC记录)。套录时可以根据自身的需要删除一些不需要的字段。查重定购后再以MARC格式或Excel格式将购书单交给书商,书商就可以根据采购员提供的价格、ISBN和册次等数据形成订单,根据订单进行配书。MARC记录可以带回图书馆作为书目数据加以利用。4.2确认重量模块4.2.1查重条件选择当书商提供完整的MARC数据时,可利用该数据进行多个检索点的查重。由于仅利用ISBN号查重具有局限性,我们可以采用ISBN号、题名、作者、价格等多个条件进行重复,即一种书只有在ISBN号、题名、作者、价格都一样的情况下,这种书才最有可能是复本。为提高查重的精确性可以根据本馆的需要来添加查重点。有的图书馆馆藏书目数据本身就不完整,比如缺少ISBN,或者ISBN、题名、作者输入错误,这势必对查重结果产生很大的影响,所以我们一般先限定ISBN、题名、作者、价格等几个字段,根据情况只写几个字段重复(比如3,2,1),即选择4个字段,如200a,010a,010d,215d,那么选择输入3后,意味着只要有3个字段重复,该种书就被认为记录重复,详见图2条件的限定。查重条件选择后,可以保存重复和非重记录为*.iso格式文档,直接用写字板打开。对于那些不需要如此精确查重的图书馆,可以选“只要ISBN重复认为重复”作为查重条件。4.2.2mac数据的分类和输出我们如果只想采购图书的几个大类,可以利用该模块来操作,这里和上面不同的是可以选择不同的分类,比如只购买计算机和经济类图书,就可以用T和F来限定。在输出时,也可以有选择性地选择字段输出MARC数据。如果书商提供的是Excel订单,可以通过本查重系统格式转换工具先将订单转换为MARC数据,再利用此模块进行批量查重,此功能可以输出重复记录和非重复记录。4.3不同格式知识的转换4.3.1从MARC数据中输出ISBN一般图书馆数据多数以MARC数据为主,利用该模块可以完整输出书目记录中的ISBN和馆藏量。4.3.2Excel格式数据与MARC格式数据的转换书商提交的书目数据一般都是定长格式,而且多数为Excel格式。在这个模块里,可以方便地将Excel表格转换成MARC数据,从而方便地进行查重和套录。同样,根据需要可以利用本系统将MARC数据转换成Excel表格提供给书商。4.3.3不同格式MARC数据的转换现在的图书馆普遍采用两种编目标准,一个来自中国国家图书馆,一个来自CALIS数据编目中心,两个标准有些地方不同,为了方便使用,系统提供实现两种格式数据的相互转换功能。4.3.4MARC数据分类统计可以对书商或者图书馆采购的MARC数据进行分类统计,便于图书馆根据本馆实际情况进行采购。4.4rper数据库的处理为了满足不同用户的需求,可以设置当前使用的数据库类型,当设置SQLSERVER数据库时,程序处理本机SQLSERVER数据库;或者将本地的ACCESS数据库直接利用SQLSERVER的导入功能生成数据库。在清空数据库时务必小心,清空数据库时应确认一次。为避免误操作,应及时将数据备份。5确认系统流程5.1获取隐藏的中断数据从图书馆管理系统中输出完整的含馆藏复本信息的MARC数据,并设置好输出馆藏册次的输出字段,然后输出馆藏MARC数据记录保存。5.2系统调度分析图书馆购书时是先选书,后对照馆藏数据进行查重。定购后,再把订购数据导入到查重系统总书目库中。因此本程序在编制时主要实现两大功能,第一是查重,第二是把购买的新书的MARC数据直接加入到查重系统书目库中。该程序功能主要通过VC++来实现。在编制过程中,以采购模块为例,它的基本逻辑思路如图3所示:订购后,书商提供的新书的数据需经本馆专业编目人员校对,如果数据质量达标,可以直接导入到ILASII系统的采编书目库中,新书验收时再进行检验后审校到中央书目库。很多书商提供的MARC数据由于编目人员不够专业,其数据质量不高。图书馆一般是将书商提供的Excel表单通过查重软件转换为MARC数据,将一些基本字段如ISBN、题名、作者等导入采访书目库,同时将价格、册数、发行者等源字段进行格式转换导入采访馆藏库,具体转换如图4所示,在进行MARC数据著录时,通过查看采访数据,可了解到此书的来源、册数以及信息提供商,同时还可根据ISBN、题名、作者等检索点,对一些还需要查重的图书在ILASII系统内再

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论