科技文献检索第二章检索基础知识_第1页
科技文献检索第二章检索基础知识_第2页
科技文献检索第二章检索基础知识_第3页
科技文献检索第二章检索基础知识_第4页
科技文献检索第二章检索基础知识_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章检索基础知识第1页,共46页。2.1

检索定义2.2检索语言2.3

检索系统2.4检索方法2.5检索步骤2.6检索效率第2页,共46页。2.1.1文献检索概念文献检索——广义上讲包括文献信息的存储和检索两个过程。狭义是指有目的地开展对于经过有序化后的文献信息的集合体所开展的查找活动及过程。文献检索存储检索存储:是对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。检索:是指面向信息需求而进行高度选择性的查找过程。第3页,共46页。信息存储与检索过程图文献信息分析检索课题文献信息特征检索提问信息分析著录标引选用检索语言和名称规范文献信息标识(检索项)检索提问标识(检索词)形成形成检索系统输入检索检索结果输出存储过程检索过程第4页,共46页。2.1.2信息检索的原理文献检索的过程就是检索提问标识与存储在检索工具中的著录标引标识相匹配的过程.第5页,共46页。2.1.3检索的类型

1、按检索对象划分3类文献检索(DocumentRetrieval)数据检索(DataRetrieval)事实检索(FactRetrieval)第6页,共46页。2、按信息检索手段划分2类

手工信息检索计算机信息检索第7页,共46页。3、按检索系统的工作方式划分4类脱机检索(Off-lineRetrieval)联机检索(On-lineRetrieval)光盘检索(CD-ROMRetrieval)因特网检索(InternetRetrieval)第8页,共46页。4、按检索工具类型划分6类目录检索(CatalogSearching)题录检索(TitleSearching)文摘检索(AbstractSearching)索引检索(IndexSearching)全文检索(FullTextSearching)参考工具检索(FactandDataSearching)第9页,共46页。2.2检索语言信息检索语言(Retrievallanguage)是用来描述文献的内容特征、外表特征和表达用户信息提问的一种专门语言。当存储信息时,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的词语,并赋予一定的标识,如题名、著者、主题词等,作为存储与检索的依据,然后被纳入到数据库中。

当检索信息时,检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的词语,然后通过检索系统在数据库中匹配具有同样词语和标识的文献,找到自己所需要的信息。第10页,共46页。信息检索语言第11页,共46页。第12页,共46页。2.2.1分类语言分类语言——又称分类法,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检索语言,包括体系分类法和组配分类法。第13页,共46页。中国图书馆图书分类法中国科学院图书馆图书分类法中国人民大学图书馆图书分类法美国国会图书馆分类法杜威十进位分类法第14页,共46页。《中国图书馆分类法》第15页,共46页。T工业技术TP自动化技术、计算机技术TP1自动化基础理论TP2自动化技术及设备TP3计算技术、计算机技术TP30一般性问题TP31计算机软件TP311程序设计、软件工程TP311.1程序设计TP311.11程序设计方法TP311.12数据结构TP311.13数据库理论与系统TP311.131数据库理论TP311.132数据库系统:按类型分层次数据库网络数据库关系数据库面向对象的数据库…..TP6射流技术TP7遥感技术TP8远动技术第16页,共46页。《杜威十进分类法》(DDC)

1873年美国图书馆学家杜威所创,目前该分类法已经被翻译成30多种语言,在全球超过135个国家的20多万个图书馆使用,在美国,95%的公共图书馆,25%的学院图书馆大学图书馆以及20%的专门图书馆使用该分类法。第17页,共46页。《杜威十进分类法》(DDC)310普通统计学000总类320政治学371学校管理、100哲学类330经济学特殊教育200宗教类340法律372初等教育300社会科学类350公共行政管理373中等教育400语言类360社会机构社会团体374成人教育500纯科学类370教育375课程600应用科学类380商务、通讯、运输376妇女教育700艺术类390习俗、礼仪、民俗377学校与宗教800文学类378高等教育900地理历史类379政府法规管理与资助第18页,共46页。分类语言的特点(1)分类法符合人们认识事物的规律和处理事物的习惯。(2)由于分类法是按学科、专业集中文献,能系统地揭示文献内容特征,因此能够实现族性检索,获得较高的查全率。(3)便于组织图书资料的排架。(4)分类检索语言是一种先组式语言,不能随时修改补充。第19页,共46页。2.2.2主题语言主题语言——主题语言,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、关键词语言和叙词语言。主题词就是指以规定概念为基准,经过规范化和优先处理后,具有组配功能、能够显示词间语义关系动态性的词或词组。主题检索适合特性检索,系统性不强。第20页,共46页。关键词语言

关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。第21页,共46页。叙词语言

叙词语言是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。叙词语言示例:《汉语主题词表》、英国《科学文摘》使用的《INSPECThesaurus》、美国《工程索引》93年后使用的《EiThesaurus》等。第22页,共46页。2.3.1文献检索系统定义是指按某种方式、方法建立起来的供文献信息用户查检文献信息及原始文献的一种有层次的体系,是表征有序的信息特征的集合体。(包括各种手工检索工具和各类计算机检索系统)2.3检索系统第23页,共46页。2.3.2检索系统的类型

1.目录(catalog)——它主要用于反映文献的出版情况或收藏情况。

目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。目录类型:

馆藏目录:反映一个图书馆文献收藏情况的目录。联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。

第24页,共46页。按出版类型划分:图书目录、期刊目录、会议论文目录。按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录(OPAC,OnlinePublicAccessCatalog)等。

OPAC:是指以计算机编码形式存贮在计算机系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。第25页,共46页。2.题录(bibliography)——题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。

题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。示例1:第26页,共46页。3.文摘(abstract)——更有利于用户判断检索结果的准确性。

文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。第27页,共46页。

4.索引(index)

索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点。索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。最常用的索引是主题索引、分类索引和著者索引等。第28页,共46页。目录:单位出版物题录:单位出版物中的单篇文献文摘:单位出版物中的单篇文献索引:单位出版物或单篇文献中的知识单元检索工具的著录对象第29页,共46页。手工信息检索工具的著录项目目录:出版物名称--编著者--出版项—附注项题录:题目/著者//出处文摘:题目/著者//出处、文摘索引:知识单元---顺序号(或页码)期刊论文的文献出处:刊名、年、卷、期、页码第30页,共46页。(三)文献检索系统的功能

报道文献信息

存储文献信息

检索文献信息第31页,共46页。2.4检索的方法信息检索方法工具法引文法循环法第32页,共46页。2.4.1工具法概念:利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),进行系统而全面的文献检索的方法。类型:顺查法、倒查法、抽查法第33页,共46页。2.4.2引文法概念:利用文献后面的参考文献查找信息的方法特点:所检文献专指度较高、信息越来越旧、容易误导;在检索工具短缺时采用此法.第34页,共46页。2.4.3循环法概念:工具法和引文法交替使用的检索方法特点:优势互补了解课题发展动态

第35页,共46页。选择信息检索方法的原则:1、有检索工具时用工具法或循环法2、无检索工具时用引文法3、新兴学科或知识更新快的学科课题用倒查法4、查全率要求高用顺查法5、已经掌握课题发展的规律特点用抽查法第36页,共46页。2.5检索步骤分析检索课题,明确检索要求选择检索工具,确定检索途径确定检索标识,确定检索运算构筑检索提问,获取初步结果调整检索策略,获取所需信息第37页,共46页。2.6检索效果的评价及其优化检索效果评价的意义——(1)提高检索效率(2)改善系统性能第38页,共46页。检索效果评价的指标

评价检索效果的常用指标有:查全率(Recallratio)——---用R表示查准率(Precisionratio)——用P表示漏检率(Omissionratio)——-用O表示误检率(Fall-outratio)——-用F表示高查全率和查准率是人们在检索活动中通常所追求的目标。第39页,共46页。查全率

查全率是指被检出的相关文献量与系统文档中实有的相关文献量之间的比率。它是衡量信息检索系统收录内容及其用户检索结果的完整程度的指标。可用下式表示:被检出相关文献量查全率(R)=——————————×100%系统中相关文献总量

第40页,共46页。查准率

查准率是指检出的相关文献量与检出文献总量之间的比率。它是衡量信息检索系统收录内容及用户检索结果精确度的尺度。可用下式表示:

检出相关文献量检准率(P)=—————————×100%检出文献总量第41页,共46页。影响用户查全率与查准率的不良因素——

(1)对检索目标把握不准确(2)对检索系统选择不洽当(3)检索词和逻辑组配不当(4)检索途径和方法选择不当(5)系统功能不熟悉、检索技能不熟练第42页,共46页。检索效果的优化手段——

提高检索系统的功能提高数据库的质量提高检索人员的素质优化检索策略第43页,共46页。

提高查全率的主要方法——(1)准确把握检索对象及目的,选择合适的数据库。(2)降低检索词或分类号的专指度。(3)更多地采用学科分类途径来扩大检索范围。(4)减少逻辑“与”及逻辑“非”的使用。(5)增加逻辑“或”及截词检索技术的使用。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论