论图书的查重_第1页
论图书的查重_第2页
论图书的查重_第3页
论图书的查重_第4页
论图书的查重_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论图书的查重

1高质量的查重工作确认是指使用官方书名目录或计算机检索系统,确定存储文件的关系,并处理不同的情况。如果这是已出版的文件的副本,即其书名、作者和版本完全相同。是否有不同版本的文件,包括不同版本的翻译和版次。如果有不同版本的文件,包括不同版本的翻译和版次,则是否有不同版本的文件。对于任何一个图书馆的编目工作来说,查重都是一个非常重要的环节。在编目之前,首先必须查重,而且必须认真仔细,因为查重的质量直接影响到分类标引的质量,进而影响整个数据库的质量。高质量的查重工作一方面保证同一主题文献归入相同的类目、某文献的不同版本、不同卷册能够集中,避免同书异号现象,使同种图书的分类标引前后一致,还可以对有关联的文献进行辅助区分,并能及时发现并纠正数据库中的问题记录;另一方面可以避免重复劳动,利用已有标引成果提高标引速度。查重方式有三种:①查复本,即查找本馆数据库中是否有和在编文献完全相同的记录。②查已有标引成果。如果待查文献是本单位未入藏的,可查是否有相应的统一标引成果可以利用,如果有,还要考虑直接采用其标识,还是作为参考,再据本单位的具体需要予以调整或修正。以联机方式在特定网络中查找本单位没有标引而外单位已标引的文献标识供本单位利用的情形越来越普遍。③查在版编目。其中包含的分类号、主题词等有的可以直接采用,有的只能作为参考。2采用组配方式查重与手工查重相比,计算机查重简单得多,每条记录有多个检索点,还可以用组配方式查重,速度和效率都会显著提高。在查重中检索点的选取是灵活的,具体运用何种查重方式并不是绝对的,应对图书的前言、序等说明性文字和版权页等文献信息源先作浏览再予以综合考虑。2.1图书出版的数量和准确性不高。据数字输我国自1987年开始采用ISBN号后,文献查重首选IS-BN。ISBN在理论上具有惟一性,可操作性强,简单易行,且准确率高。但是也存在一些问题,由于编目员或计算机系统本身的原因,特别是目前图书出版的情况较为复杂,一书多号或一号多书的情况经常出现,容易造成漏检和误检。所以,对于各出版项较为齐全,与其他文献无相互关联关系的出版物可选择ISBN查重,否则应辅以题名或责任者途径进行组配查重。2.2设置重复名义如果在编图书无ISBN号或ISBN不详或存在相互关联的文献应选择题名作为首要查重途径。题名查重查全率、查准率都较高,但题名需要逐字进行比较,操作不方便。如高等数学、大学物理等,还存在大量重复题名,可用责任者组配的方法查重,并在查重时选择截断或包含关系检索。另外,多卷书在分散著录时,卷册次作为题名的一部分加以著录,若输入不完整,则无法检出。如《基础物理学》的上册,若完全匹配,则检索到一条记录;若采用左截断方式,则检中多卷书分散著录的所有记录。在正题名的选择上,存在副题名及题名说明文字时需要补充查重。有时对不规范的题名文字,模棱两可容易引起歧义的题名,不同的编目员理解不一。所以,在查重时应考虑各种可能性,采用多途径检索,以保证整套丛书的集中与分散的统一。2.3对具体著作的查重责任者查重准确率较高,但用责任者查重有一定的局限性,对于以下一些情况需要加以分析。2.3.1如果责任者重名情况较多,如“约翰”,重名率高,系统会出现大量命中记录,应使用组配或限定方式检索。2.3.2同一著作的不同译本或不同版本,责任者不同,若仅用责任者进行查重,容易造成漏检,需用题名组配查重。2.3.3名称不规范时,应用规范和不规范名称两种方式查重。因为记录是由不同编目员处理的,他们掌握的著录标准不同,会造成同种情况下不同的处理方式,存在疏漏或误差,易造成漏检。如“卡内基”与“卡耐基”,“卡耐基”为规范名称。但有的出版物著为“卡内基”,如果编目员疏忽可能没加以规范会造成漏检。再如“马克·吐温”为规范名称,但系统生成7字段检索点时,可能为“吐温”,也会造成漏检。所以应采用多种查重途径、查重方式,才能保证查重的准确性。2.4数据库内容特征有时为了保证分类标引的前后一致性及著录的统一,需要利用丛书名查找本馆数据库及源数据库中是否有类似的记录。其特点是输入丛书名,可以检索到包含这一丛书项的所有记录,以作为参照进行标引和著录,并发现存在问题的记录。2.5查重内容查重时可以通过人名主题、地名主题、学科主题及自由词等途径查找馆藏及源数据库中是否有可以利用的现成的标引成果。其特点是操作简单,仅需输入较少的字词就可以检索到包含这一主题的所有记录;缺点是需要完全匹配的词,如果输入的主题词不规范则不能检出。以上是查重时经常利用的途径,其中ISBN号、题名和责任者是最主要的途径。在查重工作中,如果一次查重没有命中不能轻易放弃,要根据文献的特点从多个检索点、多种途径查重。3重要问题和处理3.1分类标识和主题标识的错误在用ISBN号查重时极易造成漏检,故需要用题名及责任者辅助查重。若属于复本,则使用原先文献的分类标识和主题标识,但如果原来的标引有明显的错误则应予以纠正;若不作为复本处理,但是文献在内容上是相同的,只是在形式上发生一些改变,通常可作为同种书处理,即取同一个分类号,同一个种次号,并在种次号后加辅助区分号,这样能够将同一种书集中,在检索和排架时便于查找。3.1.1关于文献的复本处理不同装帧形式的图书常有不同的ISBN号,若仅用ISBN号查重必然无法找到另一条记录,应用题名或责任者再进行一次查重。例如:上海音乐出版社的《走进新时代中华百年歌典》有精装和平装两种形式,分别有不同的ISBN号和价格,通过题名途径查到馆藏有平装的入藏,在编文献为精装,若作为复本处理,仅需将精装的IS-BN号加入到平装的记录中,用两个010字段加以反映即可。有的图书重印后内容不变只是形式发生改变,如价格、开本等,是否作为复本,各馆有不同的规定。例如:《理论力学学习方法及解题指导》,2002年版与2003年重印本在价格、尺寸及页码上发生改变,若作为新书处理,实际上是一书两入,不能将相同内容的文献加以集中,可视作复本处理。如果ISBN号不同,可以增加相应的010字段并在附注项说明。这样,可以避免馆藏的繁杂和混乱,既可以从不同的ISBN号检索到该条记录,又可以将同种书集中排架,便于读者查找和利用。3.2对版本的辅助区分版本不同主要包括同一著作的再版及修订,不同出版社的同一著作和同一著作的不同注译本。不同版本通常ISBN号不同,用ISBN号查重必然造成漏检,应以题名作为主要检索点,并辅以责任者查重。对再版图书要考虑查其他版次,在查到记录的同时对文献进行版本的辅助区分,如属于某文献的不同版本,可以作同种书集中处理,增加相应的版本标识,或进行相应的辅助区分,分类号及主题标识一般不变(按分卷标引者除外);如属新入藏的文献,则按标引程序操作。3.3用可以检索的内容作为分散著录的检查点丛书分散著录时由于一套丛书的各分册到馆先后不同或由不同的编目员处理,可能有的集中著录,有的分散著录,有的集中标引,有的分散标引,所以除了要用丛书名查重外,还要查分册书名,否则会造成对同一套书标引著录的混乱状况。通过查丛书名,可以及时发现问题,保证丛书分类著录的前后一致性。丛书查重有时会出现一号多书的情况,需以题名或责任者进行辅助查重。如丛书《易学思维精华》ISBN号为7-80145-715-3,对应《中华自然哲学之数学原理》、《易经与大智慧》、《走进伏羲》和《易经图典精华》四种书,用ISBN号检索不能查到准确的惟一记录,需要用题名或责任者进行二次查重,或者将题名或责任者作为限定条件,就可以得到惟一的检索结果。多卷书在分散著录时,各分卷ISBN号可能不完整,如上、下卷,用ISBN号查重无法查到集中的记录,这时需要用题名作为检索点;对于有单独分卷题名且分卷题名有独立检索意义但未一次到齐的多卷书,可能出现有的集中著录,按总题名分类,有的进行分散著录,按分卷题名分类。集中著录和分散著录所选择的正题名是不同的,这时,既要用总题名查重,又要按分卷题名查重,发现不一致时要及时改正,或者作分散著录,或者作集中著录。同时要注意补充相关的卷册标识。对于年度连续的著作,因ISBN号不同,故用ISBN号不能查到集中的记录。年度出版物的年代一般著录在题名与责任者项的分辑号子字段,应选取题名包含关系检索,或用丛书名检索,在查到记录的同时补充相关的卷册信息。如《2002年中国短篇小说年选》,2002年在著录时不作为正题名的一部分,可以用题名包含关系查找《中国短篇小说年选》或用丛书名《花城年选系列》查到集中的记录,并作同种书的辅助区分。3.4种书的查重对于题名发生变更的文献,如改名、续篇等,仅用书名查重有一定的局限性,许多情况下要用责任者补充查重,并依据书中的其他信息做出判断,对于是同种书的要加以集中。3.4.2《大众哲学》集中处理再版时改变书名,应注意版本配套。改名后的著作应与原书集中,如《大众哲学》艾思齐著,通过阅读前言等了解到本书原名《哲学讲话》,再通过题名或责任者途径查到馆藏有《哲学讲话》,这时可以将《大众哲学》作集中处理。3.4.3《未来会如何》的加害者续写的著作应与原书集中。如《未完成的革命》迈克尔·德图佐斯著,是《未来会如何》的续篇,应作为同种书集中,通过题名或责任者途径查到馆藏有《未来会如何》,这时可使用原来的分类标识并加辅助区分号。再如:《历代书法论文选续编》中的前言等表明它是《历代书法论文选》的延续,应将两者集中。综上所述,在分编查重工作中,要根据具体情况进行多检索点查重和多途径查重,是复本的要避免重复记录,是同种书的要加以集中,这样才能减少重复数据,保证标引和著录的一致性,从而提高书目数据库的质量,为图书馆其他工作打好基础。3.1.2增加检查,增加增固查重对于1987年以前出版的图书没有ISBN号,在后来重印时又增加了ISBN号的图书,此时通过ISBN号查重必然无法找到以前的记录,这时要从其他检索点补充查重,并对原来的记录加以补充,增加010字段著录重印的ISBN号及价格,并在附注项说明。作复本处理时使用原来的标识。3.4.1《c/c++》等所代表的配套教材是同一种次号,一个加对于某种书的题解或学习辅导之类的配套出版物,一般与原来的书ISBN号不同,题名也不同,在查重时应以题名作为主要检索点,并采取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论