计算机信息检索_第1页
计算机信息检索_第2页
计算机信息检索_第3页
计算机信息检索_第4页
计算机信息检索_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲计算机信息检索ComputerizedInformationRetrieval

(工程硕士)

20112信息检索词汇(terms)Informationretrieval(IR)Informationaccess(obtain)Informationsearch(lookfor)Informationsearching(lookfor)Informationseeking(focusonusers,active)locatehit3信息检索基本原理信息集合匹配与选择需求集合特征化表示特征化表示41.信息检索发展阶段●手工操作(manual)●计算机化(computerized)●网络化(networked)●智能化(intelligentized)●认知化(cognized)What’ssearchinglike?“Findinganeedleinahaystack”52.主要检索系统类型联机检索(onlinesearch)

脱机检索(offlinesearch)光盘检索(CDsearch)网络检索(Interne/Websearch)全球数字图书馆系统(digitallibraryglobalsystem)6

通信网络

联机检索中心

检索终端数据库2.1联机检索(onlinesearch)

Theprocessoflocatingspecificpiecesofinfofromoneormoredatabasesthatresideonthecomputers(hosts).Thesearchisatrueinteractionbetweenyouandsearchsystem.

主机

Feature:interaction,realtimeremote,directInternetWAN微机7OnlinedatabasesFeatures

¨Atest-bedforearlyIRexperiments&development

¨The

showcaseofIRtechnology(e.g,relevanceretrieval)untiltheInternet,theWebbecamepopular

¨AlaboratoryforacquiringinformationretrievalskillsIRcapability

¨Coversvirtuallyeverytypeofdatabasestructures

¨Implementalldifferentretrievalmodelsandtechniques-----Hahn8OPAC

Features

¨AnextensionofMARCrecords

¨Aproductoflibraryautomation

¨Abibliographic

databaseoflibraryresourcesforaninstitutionatvariouslevels,e.g,local,regional,national

IRcapability

¨

Easytobrowse(resembleshelfstructure)

¨Basedonwell-establishedhierarchicaldatabasestructure¨Mayprovidesophisticatedsearchingcapabilitiesbutusersmaynotbenefitfromthem9光驱

微机

2.2光盘检索(CDsearch)光盘单机检索

检索终端10局域网

服务器

光驱

LAN微机光盘联机检索(CD

online)

检索终端11CD-ROMs

Features

¨OnlinedatabasesinCD-ROMmedium

¨Portability¨Cheaper&moreconvenientaccessuntiltheWebbecomesthegatewayforCD-ROMaccess

¨Noticeableprobleminupdatingthedatabase¨

HypertextorhypermediaisheavilyusedinCD-ROM

¨Becominganobsoletetechnology?IRcapabilities

¨Introducethe

browsingfeature

¨OtherIRtechniquessimilartothoseofonlinedatabases

¨

Slowerinspeed122.3网络(Internet)信息检索

Features

¨InitialintentionwasmoreonresourcessharingthanIR

¨Rapiddevelopmentandconstantimprovement

¨Wideusage

¨

Goodfor

presentinginformation,lesssofororganizingformation

IRcapability

¨Retrievalcapabilityisanaddition,notincludedintheoriginaldesignforthesystemexceptinthecaseofWAIS¨

Quality(unevenretrievalperformance)and

quantity

varyfromonetooltoanother¨

Replacingonlinesystemsandbecomingthelab&showcasefornew,advancedandsophisticatedIRtechniques13

3.数据库的基本概念

3.1数据库的定义

至少由一种文档组成,能满足特定目的的或特定数据处理系统需要的数据集合。14

3.2数据库的类型

1、参考数据库书目数据(bibliographicdatabase)目录数据库(catalogdatabase)文摘索引数据库(abstract/indexdatabase)指南数据库(directorydatabase)15

2、源数据库(sourcedatabase,databank)数值数据库(numericdatabase)文本-数值数据库(text-numericdatabase)属性数据库(propertydatabase)术语数据库(terminologybank)全文数据库(full-textdatabase)图象数据库(graphicdatabase)多媒体数据库(multimediadatabase)

…163.3书目数据库的结构

文档(file)

数据库组织的基本形式记录(record)

文档的构成单位

(对应一个书目条目)17字段(field)

记录的构成单位

(条目中的一个信息项)子字段(subfield)

字段的构成单位184.计算机检索基本方法

4.1.检索策略

检索步骤的科学安排

4.2.检索步骤

19确定检索点/词

检索课题用户

主题分析选择信息资源

选择数据库制定检索式

计算机处理

结果检验

索引词表NY20

内容Content

范围Coverage

时效Currency

费用Cost选库的4C原则:21

检索点(accesspoints):

主题subject

分类classification

著者author

名称title

号码code,coden...

22

检索词/语言:非规范词(非受控词,自由词) uncontrolled,free-term规范词(受控词)controlled

如:汉语主题词表(中文)LCSH词表(英文)

23

禁用词:Stopwords:在记录中出现的频度太高,不能用以检索。如:AAREFOROFTHEWITHANASFORMONTHISWOULDANDBYINTHATTO,…

24

4.3检索方法

1、命令检索(commandsearch)

算符(operator)

检索式(query,profile,statement,formula)2、菜单检索(menusearch)

提示选项填空

253、浏览检索(browse,WIMP)hypertext,超文本链接(hyperlink)4、Web方式检索(综合应用)

检索方式:基本检索(basic,easy,simple,quick)

高级检索(advanced,expended,guided)

专家检索(advanced,expert)

264.4检索式的表达1、常用算符逻辑算符(booleanoperator)位置算符*截词符字段符27

逻辑与

andsolar

and

energysolarenergy28

逻辑或

or

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论