信息检索原理_第1页
信息检索原理_第2页
信息检索原理_第3页
信息检索原理_第4页
信息检索原理_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章科技信息检索原理与技术

ThePrinciplesandTechniquesofInformationRetrieval深圳大学图书馆2011年9月第一节信息检索原理第二节信息检索语言第三节信息检索技术本章主要内容:

第三章主要讲述信息资源的检索原理、检索语言及检索技术。要求学生了解检索语言和步骤,掌握布尔逻辑检索、截词检索、限制检索等基本检索技术,能正确的制定检索策略。本章的重点:检索功能、检索算符、检索策略本章的难点:检索式的制定和调整第一节信息检索的原理

ThemethodsofInformationretrieval

1.检索原理2.检索类型3.检索功能

第一节信息检索的原理

1.1文献信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。1.检索原理1.2标引:对文献内容特征和外部特征进行分析形成概念标识,再依据一定的标准或规则(检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。1.3文献信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。简言之,信息检索原理就是用户将信息需求转变为检索系统所能识别的检索标识,与信息检索系统中存储的信息特征进行逐一比对,两者完全一致或基本一致时,即为检索命中信息,可按用户要求从检索系统中输出。其检索结果既可能是用户需要的最终信息(一次信息),也可能是用户需要的信息线索(二次信息),用户可据此线索进一步进行判断、筛选,以获取所需要的最终信息。

信息检索原理图2.检索类型

网络数据库在网络学术资源中占据重要位置,它的形式多样,但我们仍然可以将其归纳为以下三种类型:2.1书目数据库主要为馆藏书目数据库和文摘、索引数据库;它们提供的是获取文献的信息和线索。其特点如下:(1)覆盖的学科范围广,来源出版物量大。如SCI、EI数据库等。(2)配有强大的检索系统,检索途径多,支持复杂的检索式。(3)内容更新及时。如EI数据库是每周更新(4)提供全文链接或收藏馆信息2.2全文数据库包括全文电子期刊、电子图书、学位论文、会议文献、政府出版物、专利、标准等可直接获取原文的数据库,是近年来发展最快的数据库资源。2.3参考工具类百科全书、科技手册、电子词典、统计年鉴等,是用来检索数据、事实类问题的最佳参考信息源。

检索功能是指检索系统在检索界面上提供给用户的基本功能。它与系统的检索技术是紧密结合的。比较通用的检索功能有:浏览、索引、词表、简单检索、高级检索、专家检索、二次检索等。上述检索功能都是技术上较为成熟,在检索系统中得到广泛应用的。

3.检索功能3.1浏览检索(Browse)

利用检索系统提供的树型结构,从“树根”开始,逐层逐级打开,直到找到所需文献。浏览功能最重要的作用就是为用户提供一个知识体系,让用户可以俯瞰全貌,了解某一个方面信息总体情况。如主题浏览、分类浏览、文献类型浏览等。

例如:

springerLink数据库的浏览功能

浏览检索可选择期刊、图书、丛书、电子参考书及图片等进行浏览检索例如:按期刊名称浏览(按字顺)点击后打开本期内容3.2索引检索(Index)

一些数据库常将其文献记录的一个或几个字段中具有实际检索意义的词,按字顺排成一个表单式的索引,供用户选择检索。索引的种类很多;如人名索引、出版物索引、地名索引、主题索引、机构索引等。

如图所示的作者索引(取自EI数据库)

用途:在不清楚作者名称是全称还是缩写的情况下使用作者索引可节省检索时间和保障查全率或查准率。索引检索作者名索引检索实例:用户要检索作者“刘剑洪”发表的文献;按传统拼写方法为:liujianhong;但经EI作者索引检索发现,该名字在EI数据库中的另外一种拼法为liujian-hong用逻辑“或”来检索该作者发表的文章得到检索结果177条;其中liujianhong的结果为106条,Liujian-hong的结果为71条。

浏览索引中所有包含有该词的姓名,从而确定自己查找的人名,进而点击作者姓名,即可看到作者列表。

索引与浏览最大的不同,就在于浏览提供给用户的是一个树状结构的概念体系,而索引是一个简单的线性列表。但在检索界面上,索引和浏览有时合二为一,统称为浏览,用户在界面上看不到严格区分的索引和浏览功能,只在使用时有所不同。

3.3词表检索词表检索是主题检索途径。一些检索系统把自己的词表编入检索系统。用户在确定检索用主题词的同时,可以直接进行检索。检索实例:用户要进行有关“激光”的主题检索;进入EBSCO数据库后,选择主题检索途径,然后输入检索词“Laser”主题词检索输入检索词,点击“检索”选择主题词系统出现的检索结果如下;用户可根据系统列出的有关主题词按自己的需求进行选择3.4简单检索(EasySearch)

简单检索又称基本检索。即为用户提供一个简单的检索界面,帮助非专业或初入门的用户方便的提交检索式。页面上通常只有一个检索框,不提供或提供很少的检索入口(通常是在全文中进行检索),类似于搜索引擎。

简单检索由于不能构造比较复杂、精细的检索式,因此检索结果不是很准确。

检索实例EasySearch

例如:要检索有关“纳米管”(nanotubes)的文献;用户可直接将检索输入检索框内,点击Search健检索结果3.5高级检索

(Advancedsearch)

高级检索可利用组配检索和字段检索来构造比较细致的检索式,帮助用户进行精确检索。使检索更为灵活,检索结果更加准确。

高级检索主要包含:

组配检索:

★布尔逻辑组配:libraryandinformation;

★位置算符组配:library(3w)information;

字段检索---字段检索是一种限制检索词在某一字段范围出现的检索方法。数据库可供检索字段有二种:①一种是反映内容的主题字段,如:题名、叙词、标识词和文摘等。②另一种是反映形式特征的检索字段,如:作者、文献类型、语种、出版时间等。检索实例:要求在EBSCO数据库中检索文章题目中出现“Chinaeconomic”和文摘中出现“WTO”的文献,并限定文献出版的时间:2000.1—2010.1EBSCO数据库的高级检索界面Advancedsearch输入检索式((Chinaeconomic)/TIANDwto/AB);PY=2000.1—2010.1)检索结果打开全文中文名英文名缩写摘要AbstractAB题目TitleTI机构名称Authoraffiliation;CorporateSource;

Organization;CompanyAFCSCN关键词KeywordKW出版年PublicationYearPY全文Fulltext;AllfieldALL期刊名

Sourcetitle;journalname;publicationtitleSTJNPT高级检索常用检索字段中文名英文名缩写语言LanguageLA国际标准刊号

ISSN

SN国际标准书号ISBNBN文献类型DocumenttypeDT出版商PublisherPN3.5专家检索(Expertsearch)

专家检索可为专业用户、资深用户提供比较复杂的检索界面。

专家检索多为命令式检索方式,适合熟悉检索指令、检索经验丰富的用户使用。用户可将编制好的检索式填到检索框中,即可进行检索。使用专家检索可构造较复杂的检索式,达到较高的查全率和查准率,一般查新人员大多采用这种方式。

39专家检索检索式输入框字段说明

检索年代检索实例:

要求检索以下词组同时出现在文摘中的文献

lightweightsteelautobody

检索式:lightweightsteelautobodyWNAB

(WNAB---在EI数据库中,表示将检索词限定在文摘内)

输入检索式检索结果43

专家检索类似于一种命令式检索,在专家检索的界面上有一独立的检索框,用户采用“within”命令(wn)和字段码,可在特定的字段内进行检索。例如:①在文摘中查找“Laserbeamcutting”;可以表示为“Laserbeamcutting”wnAB;②在题名中查找(seatbeltsORseatbelts);可表示为:(seatbeltsORseatbelts)wnTI

专家检索采用布尔运算符(AND,OR,NOT)连接检索词。例如:输入Gilbert,BarriewnAUANDAnalogDeviceswnAF;则检索出由AnalogDevices(作者单位)的BarrieGilbert(作者)编写的文献。

3.6二次检索(Refindsearch)

二次检索是指在当前这次检索结果范围内,再次输入不同的检索词,运用布尔逻辑检索、截词检索等方式进行检索。经过多次的二次检索,逐渐缩小文献范围,使检索结果更符合您的查询目标。

例如:检索纳米材料的有关文献时,用“所有字段Allfield”途径,第一次输入关键词“纳米材料Nanomaterials”,检索出来的结果较多,共有89

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论