社科信息检索工具编排方法.ppt_第1页
社科信息检索工具编排方法.ppt_第2页
社科信息检索工具编排方法.ppt_第3页
社科信息检索工具编排方法.ppt_第4页
社科信息检索工具编排方法.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲、信息检索工具的编排方法,1、字顺法 2、类序法(分类法、主题法等) 3、自然顺序法(时序、地序等),一、字顺法,1、形序法 (一)部首法 东汉许慎说文解字首创(540部,始一终亥) 明梅膺祚字汇首创214部,始一终龠 康熙字典、中华大字典皆214部 新华字典、现代汉语词典皆189部 汉语大字典、汉语大词典皆200部 优点:符合汉字构字特点;不知字音也可查字 缺点:各字典部首体系不统一;有的字不好确定部首;需要数笔画数,速度较慢,(二)笔画笔顺法 优点:简便易学;不知字音、部首也可查字 缺点:有的字笔画、笔顺不易确定;笔画数多的字,查字速度慢。,2、音序法 汉语拼音字母排列法:现代汉语词典、新华字典 韵部排列法:广韵(206韵)佩文韵府、经籍纂诂(平水韵106韵) 古声部排列:宋人三十六字母 经传释词、古书虚字集释 注音字母排列法:解放前、台湾、香港 优点:查字较快 缺点:需要熟悉音韵体系;不知字的读音不能用;重音字多,影响查字速度,3、号码法 四角号码检字法 (1)笔形和代号(10种笔形对应10个号码) (2)查字方法 取角顺序:左上、右上、左下、右下 取角方法: 取角方法新旧不同 优点:查字迅速 缺点:方法本身不容易掌握;有些字的号码不易定,新四角号码编码规则,四角号码的笔形和代号 口诀: 横一垂二三点捺 叉四插五方块六 七角八八九是小 点下有横变零头,四角号码取角顺序,每字按左上角、右上角、左下角、右下角的次序取四个角的号码。,、一笔可以分角取号 、一笔的上下两段和别笔构成两种笔形的,这一笔画可分开使用,分两角取号。 、下角笔形偏在一角的,而另一角无笔形的,按笔形的实际位置取号,缺角作 但“弓亏”等字用作偏旁时,取7作整个字的左下角号码,取角方法,、凡外围是口门門的三类字,左右两下角改取里面的笔形。 但上下左右有附加笔形的,都不在此例。 、一个笔形,前角已经用过,后角作为。,关于附号,四角号码有新旧之分 右图是旧四角号码编码规则,但差别不大,二、类序法 1、分类法 广泛用于图书资料的是图书分类法。图书分类法的作用是指示用户根据学科内容检索图书资料,指导用户从开架书库(open shelf)中按类号顺序找到指定的图书及其内容相关的资料。许多出版物上都有“图书在版编目“CIP(Cataloging In Print)。在我国出版的图书、专著上“图书在版编“数据中有“中图法分类号“一项。,中国图书馆分类法,中图法是我国当代具有代表性的图书分类法,是一部大型的综合性的图书分类法。它是根据文献各级类目之间的逻辑关系(如从属关系、并列关系、相关关系、交叉关系等)编排而成的一个逐级展开的排列表。 中图法由五大基本部类和22个基本大类、简表、详表、通用复分表组成。 中图法的标记符号,采用拉丁字母与阿拉伯数字相结合的混合号码制,拉丁字母用来表示大类,其他各级类目则用阿拉伯数字表示。,中图法的结构体系为: 5个基本部类,22个基本大类,马克思主义列宁主义毛泽东思是指导我们的理论基础,作为一个基本部类,列于首位。 哲学是关于自然科学和社会科学的概括和总结,因此把它作为第二部类,排在社科、自科之前。 此外考虑到图书本身的特点,对一些内容庞杂,类无专属,无法按某一学科内容性质分类的图书,作为一个基本部类置于最后。 由于社会科学和自然科学内容多,发展快,如不再细分,不仅不能满足图书分类上的需要,而且也不便于读者查找图书资料,因此在“社科”部类下再分九大类,在“自科”之下再分十大类,中国图书馆图书分类法,基本部类,基本大类,基本大类,基本大类,二级类目,三级类目,四级类目,五级类目,中图法的标记符号,中图法的标记符号,采用拉丁字母与阿拉伯数字相结合的混合号码制。 其中,拉丁字母用来表示大类,其他各级类目则用阿拉伯数字表示。 “T 工业技术” 类的二级类目太多,也采用字母表示。例:“TP3”, T 代表一级类目工业技术, P 代表二级类目自动化、计算机技术, 3 代表三级类目一计算技术、计算机技术。,美国国会图书馆分类法 美国国会图书馆分类法可以在以下网络址上查到它的类目设置等内容: /catdir/cpso/lcco/lcco.html 它的主类目表如下:,杜威十进分类法 杜威十进分类法可以在以下网络址上查到它的类目设置等内容: /oclc/fp/ 它的主类目表如下:,杜威十进分类法 杜威十进分类法可以在以下网络址上查到它的类目设置等内容: /oclc/fp/,2、主题法,主题检索语言是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。 主题法最常用的有标题法、叙词法、关键词法、自然语言法,1)、标题法,也称标题词法,是主题法系统中最早出现的-种, 它是以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识。 标题表通常由一个主表和若干个辅助表组成。美国国会图书馆标题表(LCSH)是当今最著名的标题表。标题法比较直观、容易掌握;查找速度快,但查全一门学科或具某一属性事物的文献却较为困难。,2)、叙词法,叙词法,又称为主题词法。是将自然语言的语词概念,经过规范化和优选处理,通过组配来标识文献主题的方法。词与词之间建立参照系统。 叙词法适用于计算机和手工检索系统,是目前应用较广的一种主题检索语言。 我国目前使用最广的中国分类主题词表(前身是汉语主题词表)就是属于叙词法,有电子版和印刷版两种形式。,汉语主题词表片段:,3)、关键词法,关键词是指出现在文献标题、文摘、正文中,对表达文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。 网上各种各样的搜索引擎和数据库大多采用了关键词法组织信息资源,如网易、搜狐等,中国科技期刊数据库(纵普数据库)等也使用了关键词法来组织信息。 由于关键词法的词语不规范,影响了文献信息的查全率和查准率。,4)自然语言法,自然语言法是不进行标引,直接利用计算机的功能,通过自然语言中的词汇或词组组配对文本形式的信息资源进行匹配检索的方法。 这种方法又称文本检索或全文检索。 随着电子文本的普及,全文检索逐渐成为检索的重要方法。,主题 法的优点,在表达主题内容方面具有较大的灵活性,抛弃了人为的号码系统,代之以通用的规范语言,并在各主题之间建立有机的参照系统,代替了等级制的直线排列。它使用组配和索引等方式,较好地满足多元检索的要求。用户查找文献时,可以不考虑所需文献内容在体系分类等级中的位置,只要按字顺查找表达概念的主题词或相近的主题词即可。,三、自然顺序法 1、时序法 2、地序法,工具书中自然顺序排检法,时序排检法:是按事物发生发展的时间顺序或人物生卒年月日、生平经历的先后次序编排查检文献的方法。 一般查找年代和历日的年表、历表、记载个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论