计算机检索原理_第1页
计算机检索原理_第2页
计算机检索原理_第3页
计算机检索原理_第4页
计算机检索原理_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、n计算机检索概述1.计算机检索的发展2.计算机检索的原理3.数据库简介4.计算机检索中常用的运算符5.计算机检索策略的制定及调整1.计算机检索的发展n分4个阶段n(1)20世纪50年代,以批量处理、脱机检索为特点的第一阶段n(2)20世纪60年代末,以联机检索为特点的第二阶段n(3) 20世纪70年代,以联机检索为特点、伴随光盘检索异军突起的第三阶段n(4)20世纪90年代,基于互连网的数据库检索和Internet网上信息检索并重的第四阶段 2.计算机检索的原理 计算机检索的原理就是利用计算机将用户所提出的检索标识与检索系统中的标引标识进行比较,并将匹配的文献提出作为命中。标引标识是在信息加工

2、过程中产生的。标引就是将信息中的具有检索特征的词语或标志抽出并按照一定的规范制成索引的过程。检索标识是检索者根据对课题的分析,制定出的既能反映课题的要求,又符合计算机检索要求的检索语言,其中包括适当的检索词,以及合适的逻辑算符和位置算符。3.文献数据库简介n数据库的定义和类型n一.定义:至少由一种文档组成,并能满足某一特定的目的或某一特定数据处理系统所需要的一种数据集合。n二.数据库类型:1.文献目录型数据库(bibliographic database). 也称为书目数据库或者目录数据库,是二次文献数据库,包含文摘数据库、题录数据库、索引数据库、各国的MARC格式的图书目录。2.指南数据库(

3、reference databases).也称指示性数据库,其内容是关于某些机构、人物、出版物、项目、程序、活动对象的简要描述,是指引用户从其他有关的信息原获取更详细的信息的一类数据库。3.数值数据库(numeric database).又称数据型数据库,此类数据库存储的均为数据信息。4.全文型数据库(full-text database)。是指储存文献全文或者其中主要部分的一种数据库。n数据库的构成(1)文挡(file),若干个逻辑记录构成的信息集合成为文挡。(2)记录(record),记录是若干个字段组成的文献单元。(3)字段(field),是文献著录的基本单元,用来描述文献主题内容相关的

4、某种属性。4.计算机检索中常用的运算符n一. 逻辑算符n1.逻辑“与”。用“and”或者“ * ”表示,是用以组配不同的概念逻辑符 号,表示“and”连接的两个词在一个记录中必须同时出现。 如:Library and ComputerLibraryComputern2.逻辑“或”。用“or”或“+”表示。是用来组配相同或相近概念的逻辑算符,表示在记录中出现其一即可作为命中。如:fiber or fibrefiberfibre3.逻辑“非”。在系统中用“not”或者“”表示,排除某个概念的逻辑算符, 如:Patent not Japan, 表示检中的记录中包含Patent ,不包含Japan。

5、PatentJapan二.优先算符 优先算符用()表示,在含有多个运算的检索式中,可以用()将需要优先运算的部分括上,系统会优先运算()中的部分,然后在按照not, and, or的顺序进行运算。如:S (fiber or fibre) and optical三.截词符和屏蔽符(以以EI数据库为例数据库为例,其他数据库大同小异其他数据库大同小异) 1.截词符:用“*”作为截词符,有二种用法。 Use truncation (*) to search for words that begin with the same letters. ( (无限截词无限截词) )comput* returns

6、 computer, computers, computerize, computerizationTruncation can also be used to replace any number of characters internally.(.(中间截词中间截词) ) sul*ate returns sulphate or sulfate 2.屏蔽符:“?”作为屏蔽符,加在单词中间,可以代表1个字符的变化。如:wom?n, 表示women和woman。 Use wildcard (?) to replace a single character.wom?n retrieves wom

7、an or women 四.位置算符(以EI为例,不同的数据库各不相同)1. 严格词组 To search for an exact phrase or phrases containing stop To search for an exact phrase or phrases containing stop words (and, or, not, near), enclose terms in braces or words (and, or, not, near), enclose terms in braces or quotation marks. quotation marks

8、. Journal of Microwave Power and Electromagnetic Energy Journal of Microwave Power and Electromagnetic Energy near field scanningnear field scanning 2.位置相邻Use Use NEARNEAR or or ONEARONEAR to search for terms in proximity. ONEAR to search for terms in proximity. ONEAR specifies the exact order of te

9、rms. NEAR and ONEAR cannot specifies the exact order of terms. NEAR and ONEAR cannot be used with truncation, wildcards, parenthesis, braces or be used with truncation, wildcards, parenthesis, braces or quotation marks. NEAR and ONEAR can be used with stemming. quotation marks. NEAR and ONEAR can be

10、 used with stemming. Avalanche ONEAR/0 diodes (Avalanche ONEAR/0 diodes (位置相邻位置相邻, ,单词的前后顺序不可颠倒单词的前后顺序不可颠倒) )Solar NEAR energy (Solar NEAR energy (位置相邻即可位置相邻即可, ,顺序不限顺序不限) ) 5.计算机检索策略的制定及调整n概念的选取 (1)核心概念的选取:如:“高温超导故障限流器”可提出两个核心概念,高温超导(High Temperature Superconduct,简写HTS)、故障限流器(fault current limiter)

11、 (2)发掘隐含概念:隐含概念是指课题中没有明确提出,但又与课题密切相关的概念。如“石质文物的保护”,文物、保护是一级概念,石质是二级概念,是对文物的限制。但是这个课题仅以“文物and 石质and 保护”作为检索式,是一个意义比较宽泛的检索式。可以将课题分析的深入一些,实质文物受自然界的影响,会发生风化、表面剥蚀的现象,一般采用在文物表面途层的办法,常用的有两类涂层:有机涂层、聚酯涂层,所以在选取概念的时候应当将涂层、薄膜这样的隐含概念选出。如果对保护材料有特殊的要求,还可以将硅、有机硅或聚酯作为概念提出。石质文物也有不少的下位概念:石楼、石碑、纪念碑、金字塔等。因此检索式可根据具体要求灵活调

12、整。 概念的选取(3)考虑同义词:一个词在英语中往往有多个词与之对应:如“保护”的英文有:conservation, preservation, protection等词。 (4)使用规范的用语:应当使用行业术语、通用的概念作为检索词,尽量不用俗语等非规范词。 (5)排除不必要的概念:如:“利用矿业废渣中的绿泥石、千枚岩烧结制砖的工艺”,其中的“烧结”就是制砖的工艺,是工艺的附加概念,可以不必提出,矿业废渣是一个相对大的概念,在已知原料为绿泥石、千枚岩这样具体成分后,矿业废渣可以不作为概念提出。 (6)使用准确的代码:化学物质登记号、产品代码、德温特专利号等均可作为检索词进行检索。(7)没有实在意义的词不可以做主题词2. 数据库的选择(1)合适的主题范围(2)合适的数据库类型、年度范围3. 检索策略的制定及调整 (1)初步制定检索式 (2)如果检索结果太少,适当调整策略,以扩大检索范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论