版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
孝计算机文献检索是随着计算机的出现而发展起来
的。计算机检索经历了脱机检索、联机检索、光盘检
索及网络信息检索等阶段。计算机检索以其检索效率
高、检索效果好而在文献信息检索中得到了广泛的使
用。
♦:♦重点掌握:计算机检索的基本原理、数据库的定义、
类型和结构;计算机检索的基本步骤与方法。
本章主要内容
£第一节计算机检索概述
第二节计算机检索原理
第三节计算机检索技术
第四节计算机检索步骤
第一节计算机检索概述
♦:♦计算机信息检索的特点
♦:♦计算机信息检索的定义
♦:♦计算机信息检索系统的类型
♦:♦计算机信息检索系统的构成
♦:♦数据库
♦:♦计算机检索的特点
>信息量大
>信息及时
>检索功能强
>检索效率高
计算机信息检索的定义
简称机检
A狭义上是指人们根据特定的情报需求,利用计
算机从相关的机读数据库中识别并获取所需情报
信息的过程。
A广义上包括信息存储和信息检索两个方面,即
数据库的建立与利用两个方面。
手检与机检的比较
项目手检机检
总体特征手翻、眼看、大脑判断策略、查寻、机器匹配
标引及索引特点检索点较少检索点较多
检索时间较慢较快
检索要求专业知识、外语知识、专业知识、外语知识、机检
检索工具知识系统知识
查全查准率查准率较高查全率较高
综合效率较低较高
计算机信息检索系统的类型
A文献信息检索经历了手工检索、机械检索、计算机检索
三个阶段。
»计算机用于信息检索的研究始于20世纪50年代初。
A从50年代开始,美国最先使用计算机进行信息检索并解
决了信息存贮和检索速度等问题。
A60年代中期,计算机检索逐步实用化,利用单台计算机
回溯检索和新文献的定题检索,提供脱机检索服务。
A70年代初,计算机检索进入联机检索阶段。
A80年代以后,计算机检索进入国际联机信息检索阶段。
A80年代末、90年代初,计算机检索发展成计算机网络信
息检索。同时,光盘诞生了进入光盘检索阶段。
A90年后,进入网络检索阶段
计算机信息检索系统的构成
»计算机硬件部分:
•主机:由控制器、运算器、存贮器等组成。
•外围设备:终端机、打印机、键盘、磁盘、光盘、
驱动器、通信设备等。
»计算机软件:包括系统软件和应用(检索)软件。
»数据库
数据库类型(按内容分型)
・书目数据库(如图书馆书目数据库)
・数值数据库(如人口统计数据库)
・事实数据库(科研机构数据库)
•全文数据库中国学术期刊全文数据库、中文科技期刊全文数
据库等
•软件数据库
数据库
>数据库的定义美国著名信息检索专家Martha,E.Williams给数
据库的定义是“包含书目及与文献有关的数据的机读记录的有组织
的集合。”按内容性质分:
A书目型数据库(BibliographicDatabase)
如:国外三大农业数据库、馆藏书目数据库
A全文型数据库(FullTextDatabase)
如:中国学术期刊全文数据库、中文科技期刊全文数据库等。
»数值型数据库(NumericDatabase)
存贮有科学数据,统计资料等数据。
»事实型数据库(FactDatabase)
存贮有企业名录、百科全书、人名录等有利用价值的信息。
»超文本型数据库(HypertextDatabase)
>数据库的结构
字段(Field)、记录(Record)和文档(File)
字段代码字段名表示方法
TITitleapple?inti
ABAbstractmachineinab
DEDescriptorsbuildinginde
AUAuthorau=liu
BNISBNbn=0-5635-0144-4
CCCALClassification(分类号)cc=921
CDConferenceDatecd=19960501
CLConferenceLocation(会址)cl=hangzhou
CTConferenceTitlect=roboticsandautomation
CYConferenceYearcy=1996
DTDocumentTypedt=book
LALanguagela=english
PYPublicationYearpy>=1990
SNISSNsn=1060=9857
SOSourcePublicationso=power
第二节计算机检索的基本原理
计算机信息检索是利用计算机对信息进行存储与检索
的过程,即数据库的建立与利用。示意图
。数据库的建立:按照既定的建库方针、目的、标准等
从信息源中选择所需文献,对需录入的文献进行加工,也
就是对文献的外表特征和内容特征进行分析和标引,形成
文献特征的标识,把这些标识输入计算机,计算机再按事
先设计好的规则自动把这些标识排序形成多种索引,建成
数据库,为信息检索提供有规可循的检索途径。
。数据库的利用:计算机信息存储的逆过程。将课题的
主题概念按系统词表进行规范化处理,转换成系统语言,
形成检索提问特征标识,根据需要使用布尔逻辑运算符制
定检索策略,将检索提问式输入计算机,在数据库中查找
所需信息。
计
算
机
文
献
信
息
数
据
库
的
检
索
原
理
示
意
图
第三节计算机检索技术
0
1、布尔逻辑检索功能
2、词间位置检索功能
3、截词检索功能
4、字段限定检索功能
♦:♦布尔逻辑检索功能:用布尔逻辑算符来组配
检索词以确定文献的命中与否。其算符的相互匹
配方式一共有8种。
厂逻辑与(逻辑乘)
逻辑或
异或关系
<“逻辑非”的“逻辑或”关系
“逻辑或”的“逻辑非”
逻辑非
J被标引在该词下的
种
ABANOTB
简例:逻辑运算AND
计算机在图书馆中的应用
计算机图书馆
简例:逻辑运算OR
•微量元素与克山病的关系
AorBorC
简例:逻辑运算NOT
查玉米方面的文献,但除甜玉米方面的文
献
A:玉米
B:甜玉米
♦:♦词间位置检索功能
文献记录中词语的相对次序不同,所表达的意
思就可能不同。同样在检索式中,检索词的相
对次序不同,表达的检索意图也不一样,布尔
逻辑运算符有时难以表达某些检索课题的确切
提问要求,用词间位置算符来限定和组配检索
词,可弥补布尔逻辑算符只是定性规定检索词
的范围,而没有限定检索词位置关系,易造成
误检的不足。
词间位置检索技术就是利用一些特定的位
置算符来表达检索词之间的位置关系,并
且可以不用叙词表而直接使用自由词进
行检索的方法。有的书上还把这种检索称
为原文检索。这种检索在利用TI和AB途径
检索时,对检索质量影响很大。
例:检索“小麦中氨基酸的测定”
(determinationofaminoacidsinwheat)
检索式:determinationwithaminoacidswithwheat
词间位置算符在不同系统中的使用方法不同:
@)在》1知08系统中主要位置算符及其使用方法
③在SPIRS系统中,位置算符只使用两个:
with、near
那么,位置算符的应用,能缩小检索范围
提高查准率。
l.W-With
•w算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后
顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得
夹有任何其他单词或字母。
例:intelligent(W)robot?(EiCompendexPlus)
•Wn(或nW)表示在此算符两侧的检索词必须按输入时的前后顺序排列,
不能颠倒。但允许在连接的两个词之间最多插入n个单元词。
伤I:intelligentwlrobot*(OCLCFirstSearch)
2.N-Near
•N算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的
词之间不允许插入任何其他单词或字母。但词序可以颠倒。
例:intelligentNEARrobot*(EiCPXWeb)
•Nn(或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。
例:intelligentN1robot*(OCLCFirstSearch)
3.Adj-adjacency
邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两
词之间不允许有其他的词或字母。相当于短语检索。
例:intelligentadjrobot*(ElsevierScienceSDOS)
算符功能表达式检索结果
W、W/N、WITH、两词相邻,按输入时顺Education(W)school或Educationschool
WITfflN序排列EducationWITHschoolEducationschools
Educationschool
同上,两词中间允许插
nWEducation(1W)schoolEducationschools
入n个词
Educationandmusicschool
Educationschool
两词相邻,顺序可以颠Education(N)school或
N、NEAR、ADJEducationschools
倒EducationNEARschool
Schoolofeducation
Educationschool
Schoolofeducation
同上,两词中间可以插Educationandmusicschool
nNEducation(IN)school
入n个词Schoolofmusicand
education
两个词同在一个标引例如同时出现在题名或文
FEducation(F)school
字段中摘字段中
❖截词检索功能
截词运算符号有两个:“?、*”
③其在不同系统中表示的含义不同。见书111
③在SPIRS系统中?为有限截断、*为无限截断;
©在中刊库中只有?表示无限截断。
例:1、teen*teen,teens,teenage,
teenager等。
2、teen???>Teen,teens,teenage
在词尾加?号,以?号的个数表示词后最多可
跟字母的个数
③截词方式有很多,按截词位置可以分为:
®前截断(后方一直检索)
?Chemistry,chemistry>biochemistry>electrochemistry
physicochemistry(物理化学)等。
注:在SPIRS系统和中刊库中无
(8)后截断(前方一直检索)chem-£_chemical(化学制品)
chemism(化学机理)、chemomorphosis(化学诱变)、
chemosynthesis(化学合成)等。
®中间截断:wom?n分别检出了woman,women两词
fib?board分别检出了fiberboard,,fibreboard两词。
®截词检索在中文数据库中截的是词意.
例:西北?分别检出了:西北农林科技大学学报、西北园艺、
西北纺织学院学报等。
③在外文数据库中截的是词的后缀,截断派生出的词汇和原来的词
义基本一致.
例"金属"metal*,metal>metals>metaled>metalist等。
③利用截词检索时,注意截词的部位,一定不能截的太深,否则误
检率会很大.“西北农林?”就比“西北?”效果好
❖字段限定检索功能
将检索词限定在某一字段中,检索时,计算机只对限定字
段进行运算,以提高检索效果。常用的检索符号有:
in、=、v、>、二、>
例:Englishinla;py>1992
总结:在一个复杂的检索式中,不仅可以有多个运算符,
也可以使用括号来指定运算的优先顺序、以及体
现概念的完整性。
:查“玉米方面的英文”文献
(maizeorzea-maysorcorn)inde^nd)(Englishinla)
西文数据库常用字段
中文数据库常用字段
字段名称字段
AbstractsAB文摘
AuthorAU作者
CoiporateSource、Organization.CompanyCS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中班10以内课件
- 不爬桌子安全
- 重大事故隐患判定标准考试题库
- 学前儿童手工活动的内容
- 小学四年级数学三位数乘两位数质量考核口算题带答案
- 关于考研的职业规划
- 现代办公事务处理信息的收集与处理
- 意外情况的沟通刘洋单位长沙民政
- 《安恩和奶牛》课件
- MDS相关贫血的治疗
- 化学品的安全使用和存储
- 挡土墙基础混凝土检验批质量检验记录表标准范本
- 八年级地理教案-中图版八年级地理上册《居民与聚落》教案
- 中国气象站点分布信息
- 2022年军队文职人员招聘考试公共科目真题
- 汽车技术人员奖惩制度范本
- 统计造假弄虚作假自查范文(通用5篇)
- 互联网背景下小学生心理健康教育策略 论文
- 传统节日文化在幼儿园课程中的应用研究 论文
- 《机械设计基础A》机械电子 教学大纲
- 2022宁夏共享集团公司校园招聘48人上岸笔试历年难、易错点考题附带参考答案与详解
评论
0/150
提交评论