第2章 计算机信息检索技术_第1页
第2章 计算机信息检索技术_第2页
第2章 计算机信息检索技术_第3页
第2章 计算机信息检索技术_第4页
第2章 计算机信息检索技术_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计算机信息检索技术

郑州大学信息检索教研室

2011-4-4

第1节计算机检索概述

第2节计算机信息检索系统组成

第3节计算机信息检索的分类

第4节计算机信息检索技术

第5节信息检索的方法*

第6节信息检索的策略*

2011-4-42

1.1国内外计算机信息检索发展阶段

>1975年,从国外引进数据库开展机检服务;

>1980年,建立国际联机终端开展检索服务;

A20世纪80年代中后期,自建数据库;

A90年代初,发展光盘检索;

A90年代中期,Internet网络化检索阶段。

2011-4-43

国外计算机信息检索发展阶段(P5)

>脱机检索阶段(20世纪50-60年代)

>联机检索阶段(20世纪60-80年代)

>光盘检索阶段(20世纪80年代中-90年代)

>网络信息检索阶段(1995-)

2011-4-44

1.2计算机信息检索的原理

■计算机信息检索的实质就是由计算机将输入的检索策略与

系统中存储的文献特征标识及其逻辑组配关系进行类比、

匹配的过程,需要人——机协同作用来完成。

■信息存储是将文献、数值、事实等信息按一定的格式输入

到计算机中,构成可供检索的数据库。主要包括信息的采

集、著录、标引、整序等过程。

■信息检索是将检索提问式按一定的要求输入计算机中,经

计算机系统与已存贮在计算机中的数据库进行匹配运算,

然后将符合检索提问的数据按要求的格式输出。

2011-4-45

计算机信息检索的原理(P8-11)

6

信息存储过程

I信息存储就是按照一定标准,将收集

到的原始文献进行主题概念分析,用

系统规定的语言(主题词、分类号)

进行标引,形成信息的特征标识,进

行整理与排序,构成可供检索的数据

库,主要包括:信息的采集、著录、

标引和整序等过程。

2011-4-47

信息的著录

■对所收集的原始信息的外表特征(如题名、

著者、文献出处等)和内容特征(如分类

号、主题词、摘要等)进行描述,形成一

条条款目或记录的过程。

■在数据库中,其外表特征和内容特征通常

称之为字段,一条记录由若干个不同字段

构成。

2011-4-48

信息的标引

■标引:根据一定的规则和程序(主题词典或词

表),对文献的主题内容进行分析,给予每篇文

献主题词、关键词作为存储和检索标识;或者根

据文献的学科归属,采用某种文献资料分类法,

给予分类号作为检索标识。

2011-4-49

信息检索过程

I用户对检索课题加以分析,明确检索范围,弄清主题

概念,然后用系统检索语言来表示主题概念,形成检

索标识及检索策略,输入到计算机进行检索。计算机

按照用户的要求将检索策略转换成一系列提问,在专

用程序的控制下进行逻辑运算,选出符合要求的信息

输出。

I计算机检索的过程实际上是一个比较、匹配的过程,

检索提问只要与数据库中的信息的特征标识及其逻辑

组配关系相一致,则属“命中”,即找到了符合要求

的信息。

2011-4-410

1.3计算机信息检索特点

■检索速度快,效益高;

■检索功能强,数量大;

■检索途径多,手段灵活;

■检索范围广;

■服务方式多。

2计算机信息检索系统组成

2.1系统设备

A硬件:运算器、控制器、存储器、输入输出装置等

»软件:系统操作程序、数据库管理程序、联机控制程序、

应用程序等。

A通讯线路:电话通讯网、数据通讯网、卫星通讯网等。

»检索终端:信息用户与检索系统主机进行人机对话,实

现联机检索的设备。包括上网设备、调制解调器等。

A数据库:是计算机检索的对象。是由一个或数个文档构

成,并能够满足某一特定目的或某一特定数据处理系统

需要的一种数据集合。

2.2数据库的构成

一定专业范围内的信息记录及其索引的集合体,是计算机

信息检索系统的重要组成部分,是信息资源,是检索对象。

文档__记录——字段

检索时,计算机按输入检索词的字顺先从指定的倒排文档

中找到相匹配的索引词,然后根据索引词后的记录顺序号

到顺排档中调出相应的记录。

2011-4-413

文档(File)

口数据库中一部分记录的集合,文档由若干记录构成。

口数据库是由一个顺排文档和若干个倒排文档所构成

顺排文档是数据库的主体,又称主文档,按每条记

录的顺序号大小排列,检索结果都来自于顺排文档。

倒排文档是从顺排档中抽取有检索意义的检索标识,

如主题词、著者姓名、化学物质名、刊名等,并

按索引词的字顺排列,同时在检索标识后注明入

藏顺序号,这就是常见的数据库中的主题词索引、

著者索引、刊名索引。

2011-4-414

「文献检索'期刊导毓I中国学术期刊网络出版总库三1

选库

0快速检索标准检索专业检索作者发文检索科研基金检索句子检索来源期刊检索

1.幢入检索控制条件:公

期刊年期:从怀醺

三I年到I不限三I年指定期:「青输'更新时间:pw

.履糊勺

0采源期刊:愉入期刊名称,ISSNCW均可来源类gu:|全部期刊3

支持基金:|输入基金名称I模糊▼]

田日|作者三]|输入作者姓名|精确二|作者单位:|输入作者单位,主称、简称、冒用名均可卜模糊二]

I.2.脸入内容桧素条件:

田E|主题二|输入检索同|词频二J2JQ|并且包含二]|愉入榜索同-悯频二]四广|精确二]

0检索文献P中英文扩展检索

0关键词

《中国学术!4库》专辑文献统计分析报表.

□今日出版量

参考文献文献收全获奖文高引用文高下载文新概念源

±专辑/专;文献篇数基金文献

率献献献文献

0中图分类号来源文献

0基础科学74099%170471499%203790495571333679752182

0工程科技I97899%351626699%25108504710446905816494206

工程科技II111399%295882599%32103602946516006812175204

0农业科技58499%225402699%218020282323508631498863

基于近缸外光谱的人工神经网^研究STR基因座

sr3袁商林分析测试学报

分型方法2009/11

银纳米粒子-离子液体修饰碳糊电极的制备及其

0r4李卫娟分析测试学报

0对多巴胺的测定2009/11

寓子液体中卤素离子杂质的离子色谱-直接电导

0r"ir'A周爽分析测试学报2009/11

记录(Record)

■由若干字段组成的文献单元,是数据库中的基本

文献单元,每条记录描述了原始信息的外部和内

部特征。数据库中的一条记录通常代表一篇文献。

■例如:在书目型数据库中,一条记录相当于一条

题录或文摘;在全文型数据库中,一条记录相当

于一篇完整的文献;在其它类型数据库中,一条

记录则代表一个信息单元。记录越多,数据库的

容量就越大。

2011-4-416

1题名班纳米管阵列的选择性刻蚀法制备及减性.

作者王涛涛;

关键词纳米管;有序阵列;选择性刻蚀;减性质,E文献内部特征

单位青岛大学物理科学学院.

摘要采用基于氧化铝模板的电化学共沉积方法合成了NMC道内米电缆有序阵列,通过电化学选择刻蚀纳米电斑的铜核,制备了多晶Ni

纳米管有序阵列.蚯纳米管有序阵列表现出明显的单轴磁各向异性,易磁化轴沿着纳米管方向.这种具有磁各向异性的有序阵

列在高密度垂直磁记录材料中具有潜在的应用前景.

刊名功能材料--

文献外部特征

年2010__________________

01//

Ti0_2纳米管薄膜的制备及其光电性能研究/X/

2题名

王立新;郑言贞:陶直,陈建峰,//

作者

Ti02;形貌;染料敏化太阳能电池;转化效率/

关键词

北京化工大学纳米材料先进制备技术与应用科学教育部省点实验室;

单位

摘要将水热法制备的T102纳米管荏600P下焙烧,用焙烧产物制备染料敏化太阳能电池中的薄膜电极,同时与未焙烧的Ti02纳米管制

备的薄膜电极进行光电性能比较.结果表明,600P焙烧纳米管产物制备的薄膜电极短路电流和开路电压分别达到17.45mA/cm2

和0.60V,光电转化效率提高到5.65*高于未焙烧的Ti02纳米管制备的薄膜电极相应值,且机械性能良好,不易剥落。

刊名北京化工大学学报(自然科学版)

年2010

期01

3题名浅谈模板法制备纳米材料

作者李宁,刘晓嘘,孔庆平,张文彦,

关键词纳米材料:模板法:制备工艺;化合聚合:溶胶-凝胶沉积;化学气相沉积

单位中国兵器工业集团第521研究所;西北有色金属研究院纳米材料研究中心;

字段(Field)

■字段是构成记录的基本单元,是对文献某一方

面的特征(包括外表特征和内容特征)进行描

述的结果。

■例如:题名、主题词、分类号、文摘、作者、

作者地址、出版年、来源(出处)等字段是书

目数据库中必备字段。为识别每一个字段所表

达的文献特征,通常每个字段都有固定的名称

和缩写(或称字段标识符),如,题名字段的

标识符为TL作者字段的标识符为AU等。

2011-4-418

2.3数据库的类型*(P3-4)

■参考(文献书目型)数据库

■全文数据库

■事实数据库

■数值数据库

2011-4-419

参考(文献书目型)数据库

是指包含各种数据、信息或知识的原始来源和属性的数据

库;是机读的目录、索引和文摘检索工具,检索结果是文

献的线索而非原文。

□存储的是二次文献,包括文献的外部特征、题录、文摘

和主题词等。

□这类数据库占用很大的比例,其代表性的数据库有

《ElCompendexPlus》(工程索引)、《INSPEC》(科学

文摘)和《全国报刊索引》等。

□图书馆提供的基于网络的联机公共检索目录(0PAC)系统

2011-4-420

事实数据库

存储的是用来描述人物、机构、事物等信息

的情况、过程、现象的事实数据。

□如名人录、机构指南、大事记、百科全书、手

册、地图集、企事业名录、计算机程序、音乐

等,均可归入事实数据库。

□例如:中国咨询行、国研网、万方数据(中国

企业、公司及产品、中国科技名人、中国科研

机构等等)

2011-4-421

数值数据库

主要包含的是数字数据,如各种统计数据、

科学实验数据、科学测量数据等。

>气像数据、地质资料、化学或物理化合物

特性的文献数据、人口统计资料、市场调

研数据等。

2011-4-422

全文数据库

■存储的是原始文献的全文,如杂志论文、报纸

新闻、法院案例等。

■全文检索可直接获取原始资料,而不是书目检

索时的线索,提高了用户的检索效率。

如:中国知网(CNKI)、万方、维普、

E1sevier等全文数据库。

2011-4-423

3计算机信息检索的分类

1按信息资源的存储形式分

2按信息访问模式分

3.1按信息资源的存储形式分*(P7.8)

(1)全文检索。

■以全文数据库存储为基础的检索方式,所谓全文数据库是将

一个完整的信息源的全部内容转化为计算机可以识别、处理

的信息单元而形成的数据集合。

■全文检索系统对全文数据库进行词(字)、句、段落等深层

次的编辑、加工,同时允许用户采用自然语言表达,借助逻

辑组配、截词、邻词匹配等检索手段直接查阅文献原文信息。

■全文检索的应用范围包括:各种科技期刊、专利文献、新闻

才艮纸、年鉴、百科、手册、图书等全文数据库,例如:我国

引进的OCLC的firstsearch、IEL、SpringerLink、EBSCO等

全文数据库以及我国CNKI的中国期刊全文数据库、重庆维普

的中文科技期刊数据库、超星数字图书馆、万方资源系统的

数字化期刊、学位论文、会议论文等。

2011-4-425

(2)二次文献检索*

■是针对全文检索而言,也就是分别将文献的内部特征

(题名、分类等)和外部特征(作者、出处、年代、

ISSN、语言等)作为存储和检索的匹配标识而形成

的数据集合,利用检索系统的检索结果是文献信息的

题录及文摘。

■学科领域覆盖面广,信息量大,可以利用文献线索获

取到一次文献。

■例如:COMPENDEX、INSPEC、SCI等国外数据库;

万方数据的学位论文、会议论文数据库、全国报刊索

弓I、Calis西文期刊目次数据库等

2011-4-426

(3)多媒体检索

■就是把文字、声音、图像(形)等多种信息的传播载体

通过计算机进行数字化加工、处理而形成的一种综合存

储技术。

■利用多媒体检索系统可分别进行视频检索、声音检索、

图像检索。多媒体信息检索系统有着广阔的应用前景,

它将广泛用于电子会议、远程教学、远程医疗、电子图

书馆、艺术收藏和地球资源管理、天气预报、时装设计、

智能群体决策、计算机支持协同工作、金融市场、军事

指挥系统、防汛指挥系统等方面。

■各大网站均可进行多媒体信息的检索,如:GOOGLE,百

度等搜索引擎、新华社多媒体数据库是国内最大规模的

多媒体、多文种新闻信息综合性数据库。

2011-4-427

(4)超文本检索

■超文本(Hypertext)是利用计算机将多介质信息按照一定的逻辑

联接关系加工、贮存起来,构成可任意连接的、有层次的网状结

构数据库,是一种联想式的综合信息管理系统。

■其中的某些字、符号或短语、图形和图像起着“热链路”

(Hotlink)的作用,在显示出来时其字体或颜色变化或者标有下

横线、以区别于一般的正文。当鼠标器的光标移到某个热链路上,

并且按了一下鼠标键之后,鼠标器光标便沿着这条链路跳到该文

件的另一处或另一个文件。

■计算机信息检索在经历了传统信息检索、全文文本检索之后,随

着多媒体技术的发展和应用,出现目前这种超文本检索方式。可

用于检索人物、新闻、文档、文艺小说、旅游景点、绘画、古文

物、生物等内容广泛的各种信息。

2011-4-428

3.2按信息访问模式分g

根据检索方式分:

⑴脱机检索

⑵联机检索

(3)国际联机检索

⑷光盘检索

⑸镜像检索

(6)网络检索

2011-4-429

(1)脱机信息检索

是六十年代发展起来的批次检索,用户不与检索系

统发生直接联系,只需把检索要求送往检索中心,

由检索人员在计算机主机进行文献检索的一种方式。

优点:价格便宜,无网络通讯费,检索费

用由用户平摊,随机存储。

缺点:一次机会检索,检索结果延误,委

托性检索。

(2)联机信息检索

联机检索是用户利用终端设备,通过通信

网络或通信线路与检索系统联机,进行

“人机对话”,从检索中心的数据库查找

所需要的文献信息过程。

特点:检索的速度快,检索结果可以得到

及时修改。

缺点:检索费用高。

(3)国际联机检索*

该系统是70年代出现的一门现代化情报检

索手段,目前已发展到相当高的水平,计

算机联机网络和检索终端已遍及世界所有

主要国家和地区。

优点:

(1)可以实现资源共享;

(2)检索速度快;

(3)信息资源专业化;

(4)查全率和查准率较高。

国际联机检索的缺点

>检索费用高;

A对检索系统及其文档(数据库)的收录、

标引、特点等问题较难了解、熟悉;

A检索技术和技巧不易掌握

2011-4-433

世界上最著名的国际联机检索系统

1、DIALOG系统*

■是世界最大的国际联机检索系统

■1963年,原属美国洛克希德公司,系统设在加洲Palo

人11:0市,1988年转让给美国1(1118111;一口(1(13丫公司02000年

又转入DIALOG公司经营。目前,该系统的联机服务网遍

布世界70多个国家和地区的200多个城市,共设有联机检

索终端25000余台。

■系统中各类型数据库数量的发展速度相当快,

拥有数据库约900多个,占全世界机存总量的60%,内容

涉及自然科学、社会科学、经济、商业等各个领域。

DIALOG系统主页(/)

?Dialog,&ThossonBusiness-VlcrosoftInternetExplorer

:文件口端福明查看'91忖做凶工具(X)Wiiji

。后退

J回曲揄下搜索「收藏夹@I合,心画

:止(£)http:〃www.dialog..com/海报»

Thomson,com

THOMSON

Home

AboutII,

What*sNev/

ProductsDIALOG

SourcesINFORMATIONTOCHANGETHEWORLD

Communities

Support

ContactUs

ThisisDialog.RecentNews

Search

13FEB2008

Providingmorethan15terabytesofcontentfromthe

EnterSearchTerms:

world'smostauthoritativepublishers,andthetooktoThomson:ScientificIrrjitesFuture

searcheverybitofitwithspeedandprecision.WeareaInformationProfession~to

companyfoundedontheideathatinformationmatters—ApplyforAnnualScholmrshi

thatitreallycanmakeadifferenceintheworld-oryour

05FEB2008

cornerofit.Learnmore

QuickLinksThomsonScientificSoonsorf

►CareerOpportunitiesFourthannualSLAawardfor

Nev/Look,EasierNavigation

>C*ataStarDatasheetsAu5trahanandNewZealand

InformationProfessionals

^DialogBluesheetsWelcometothenewDialogwebsite.Weareconfident

>Events&Tradeshowsyouwillfindthenew,simplerdesigneasiertouse.Rest29JAN2008

►HelpDeskassuredthatthesitestillcontainsalltheinformationand

ThomsonSdentificMakesFile

materialsyouneedtogetthemostfromDialogand

►CustomerLogonHigtoriesAcailablwThrounhOialoq

►ProductSupportDataStar.Navigationhasbeenstreamlined,withlinksto

^Quantum2mainsecbonsmovedtothesidebarandanew"Top10DEC2007

Links*'headingyoucanusetojumpdirectlytothemost

►SearchAidsThomsonScientificAwardsROQ奁r

►Trainingpopularpagesonthesite.Also,newlinkstoourSummitScholarshipto

ThomsonScientificparentsitehavebeenadded.As

►Web-basedTrainingUniversityCoHwQe,London's

always,thankyouforyourinterestinDialog,partoftheMehrnouEhMOM&仟mrian

ThomsonScientificfamilyofproductsandservices.

□RSSFeeds

MoreNews

DIALOGWEB系统检索平台

3Dialog.Web-licroisoftInternetExplorer[二叵区

:寸件四编指切查着心收威因lAcri梏勖电1―

!。制,◎-国图心j户《*食收藏夹eI合•易回,

地址!旦)http://wwwdialogwebcom/cgi/logoff?mode=guided&url=/cgi/dwframe?href=search.html-H转到后嵯》

/DialogWeb_____。于s>?

CommandSearchnewsearchdatabasesalertsorderco»rt(logoffhelp

ScienceandTechnology

Tosearchthedatabaseindex,enteryoursearchtermsandclickSearch.

Search

®SearchScienceandTechnology

Databases

《/SearchallDialogDatabases

.CompanyDirectories.ResearchandDevelopment

AllCompanyDirectoriesTechnologyAerospaceandDefenseAutomotiveBiosciencesand

Company/OrganiNationDirectoriesChemicalBiotechnologyChemistryComputers,ElectronicSj

Manufacturers/SuppliersandTelecommunicationsEnergyEngineering

■IndustriesandMarketsEnvironmentGeosciencesManufacturing

IndustryNewsMarketInformationRegulatoryNewsMaterialsM&teorologyMiningPatentsPhysics,

-U.S.Astronomy,andMathematicsTransportationWater

ProductsandAquaticSciences

BrandNamesBuyers*GuidesChemicalProduct.OtherSources

DirectoriesSoftwareDirectoriesCitedReferencesConferenceP独ecs

DissertationsEnergyRegulationEiwironmerrtal

RegulationFoodRegulationPharmaceutical

R-gulationResearchinProgress-U・S.Standards

andSpecificationsTablesofCorvterrtsUpcoming

।二onferencesandEventsPatentsChemical

Regulation

BacktoAll

ۥ2007TLeDialorCorxK>ration

世界上最著名的国际联机检索系统

2、ORBIT系统:

是世界是第二大联机检索系统,他建于1965

年,总部设在美国费吉尼亚洲的马库林。提供

专利、化学、能源、市场、工程和电子等方面

的信息,约有100个数据库,占全世界机存文

献量的25%。

主要提供补充DIALOG系统而不是与其竞争的

数据,特别是在专利、商标和科技信息等领域

具有独特优势。

2011-4-437

世界上最著名的国际联机检索系统

3、BRS系统:内容涉及医学、生物科学、教育、健康、物

理和社会科学及其它综合性学科。有154个公用数据库

和40多个私人数据库。

4、ESATRS系统:是欧洲最大的、也是世界第三大联机情

报检索系统,1964年成立于法国,1973年迁移至意大利,

目前有100多个数据库。提供有原材料价格、宇航及高

技术软件、美国化学数据、综合性数据库等。

5、STN系统:由美国化学文摘社、德国KarIsruhl专业信

息中心、日本科技信息中心联合开发的国际间网络系统,

约有200多个数据库:其中包括各具特色的美、德、日

三国专利数据库、化学全文数据库、化学物质结构图形

数据库及部分医药数据库等。

2011-4-438

(4)光盘数据库检索

A光盘:80年代发展起来的激光存储载体,继

纸张感光材料、磁性载体之后问世的又一种新

型的信息存储介质。能存储数据、文字、图形、

图像、声音、动画等各种信息。一张普通的光

盘、信息存储量约为650兆。

A光盘的分类:按存储方式分为

(1)只读型光盘:CD-ROM

(2)写读光盘:WORM

(3)可擦写型光盘:ERM

光盘检索的定义和特点

A定义:是一种用激光技术在特制圆盘上

记录信息的检索方式。

A特点:(1)投资成本低;

(2)价格低;

(3)运行速度快;

(4)检索效果好;

(5)下载方便;

(6)安全性能高。

光盘检索的系统组成

A单机光盘检索系统组成:

(1)数据库:光盘

(2)软件:系统软件和检索软件

(3)硬件:计算机、光盘驱动器、显示屏、打印

机等

A网络光盘检索系统组成:

(1)光盘塔

(2)光盘组网软件

(3)光盘塔服务器

(5)镜像数据库检索*

■镜像:最原始的含义是在镜子里看到的你自己的像,在

IT界中,将“镜像”这个词的含义进行了扩展,指的是

完全一样的两个东西。

■镜像数据库:就是将光盘版、网络版数据库或主网站资

源的数据复制到不同的地理位置(某地或本地)的镜像

服务器上,成为该服务器的镜像数据库,并为网络用户

提供检索服务。

■目的是分担访问流量;如,CNKk维普、万方数据、

超星等

2011-4-442

(6)网络数据库检索*

■通过计算机网络系统可以连接世界上各种公用数据库

和商用数据库,可以帮助用户获取希望得到的信息。

■网络化信息检索系统的特点是:一般基于客户机/服

务器,客户与服务器是同等关系,只要遵循共同协议

(TCP/IP协议是目前最成功的网络体系结构和协议规

范),一个服务器可被多个客户访问,一个客户可访

问多个服务器。网络的用户数量不受到限制,它是一

个开放系统而不是封闭式系统

■网络化信息检索将在全球范围内实现信息资源共享,

全球网络是信息存贮与检索进一步发展的方向。

■常见检索有:GOOGLE、百度、多媒体、咨询行及

所有的外文数据库

2011-4-443

4计算机信息检索技术*(因1)

1.布尔逻辑检索

2.截词检索

3.位置运算检索

4.字段限定检索

4.1布尔逻辑检索*(PII)

>布尔逻辑检索(Booleanlogical):是用布尔逻

辑算符将检索词、短语或代码进行逻辑组配,

指定文献的命中条件和组配次序,凡符合逻辑

组配所规定条件的为命中文献,否则为非命中。

A布尔逻辑运算符:在检索过程中用于表达词与

词之间的逻辑关系的算符。分为三种逻辑关系:

逻辑与(AND)(*)、逻辑或(0R)(+)、逻辑非

(NOT)(一)表示。

逻辑与

■AANDB:检索词A和检索词B同时出现

在一条记录中,例如:汽车和飞机发动机。

■其作用是缩小检索范围,提高查准率。

汽车与飞机发动机

2011-4-446

逻辑或(OR)

■AORB:记录中出现检索词A或检索词

B或两词同时出现在一条记录中。

■其作用是扩大检索范围,提高查全率

汽车发动机或飞机发动机

AORB

逻辑“或”

运算

2011-4-447

逻辑非(NOT)

■ANOTB:记录必须包含检索词A但不

能包含检索词B。即在含有A检索词的文

献中去除含有B检索词的文献。

■其作用是缩小检索范围,提高查准率。

AnB

逻ot

W”

2011-4-448

布尔逻辑算符的运算次序

■用布尔逻辑算符组配检索词构成的检索提问式,逻辑算符

AND、OR、NOT的运算次序,在不同的检索系统中有不同的

规定。

■在有括号的情况下,括号内的逻辑运算先执行。

■在无括号的情况下,有下列几种处理顺序:

NOT最先执行,AND其次执行,OR最后执行。

AND最先执行,NOT其次执行,OR最后执行。

OR最先执行,AND其次执行,NOT最后执行。

按自然顺序,AND、OR、NOT谁在先就先执行谁。

■检索时,要事先了解检索系统的规定,避免逻辑运算次序

处理不当而造成错误的检索结果。因为,对同一个布尔逻

辑提问式,不同的运算次序会有不同的检索结果。

2011-4-449

4.2截词检索

截词检索就是把检索词截断,取其中的

一部分,在加上截词符号一起进行检索。

主要用于检索词的单复数、词性的词尾

变化、词根相同的一类词,以及同一词

的拼法变异等。

常用的截词符有:“?”“*”、

截词的作用:采用截词检索表达式,既能

防止漏检,又能节省时间,能有效提高检

索效率。

截词符的使用:利用截词检索时,注意截

词的部位,一定不能截的太深,否则误检

率会很大。

2011-4-451

截词方法

□无限截断:即该词根后可跟任何字符,且字符数不限;

出口:child*,可查至|chiId,children,childish,

chiIdhood等所有以chiId开头的单词。

如:coumput?,可检出Compute,Computer,Computing,

computable

□有限截断:即该词根后至多可跟n个字符,如需要n个有限

词符截词,请输入n个?即可;

如,输入stud???表示截3个字母,可检出带有study、

studies、studing等的文献。

□中间截断:又称前后方一致,允许检索词中间有若干变化。

如,wom?n可以检索出:woman,women

2011-4-452

4.3位置运算检索

位置算符:表示其连接的两个检索词之间的位置关

系,不同的系统有不同的位置算符,以DIALOG系统

为例:

■(W)与(nW)算符一with的缩写。表示其连接的两个检

索词必须按序出现,中间不允许插词,只能有一空

格或标点、符号。

如:high(W)class

■(N)与(nN)、算符一near的缩写。表示其连接的两个检

素词的顺序可以互易,桓两词间不允许插词。(nN)

中居n表示允许插词量少于或等于n个。

如:internet(N)accessing

命中记录中匹配词可能有:internetaccessing,

accessinginterneto

■(S)算符一Subfield的缩写。表示其连接的两个

检索词必须出现在同一子字段中。子字段是指

字段中的'一部分,如'一句句子,一个词组、短

语。字段不限,词序不限。

如:silicon(S)sensor

命中记录出现的匹配情况如:

Avacuummagneticsensor(VMS)usinga

siliconfieldemittertipwasfabricatedand

demonstrated.

■(F)算符一Field的缩写。表示其连接的两个检

索词必须出现在同一字段中,字段不限,词序

不限。

2011-4-454

5信息检索的方法

■检索方法是指查寻文献信息的具体方法。

选择科学有效的检索方法,对广、快、精、

准地获取文献信息,提高检索效率,是非

常重要的。文献的检索方法主要有以下几

种类型。

2011-4-456

5.1.

>是指直接从有关的一次文献中获取所需信息的检

索方法。

A利用直查法虽然可以较快地获取最新文献,能切

实地掌握文献内容和实质,但面对大量的、无序

的文献,存在着很大的盲目性、分散性、偶然性,

很难查全,费工费时。

A许多文献用户都有利用直查法的经历,在长期实

践中也摸索出一定的经验。

2011-4-457

5.2.追溯法

»是指利用引文关系获取所需文献信息的检索方法。

»被引用的参考文献多出自知名作者的论文、专著,所以通

过追溯法检索到的文献大都具有较高的学术价值。但是被

引用的文献在全部发表的文献中只占少数,有些引文与作

者所写著作的主题关系也不大,所以追溯法会漏检和误检。

»追溯法有两种情况

(1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论