上海大学图书馆情报部课件_第1页
上海大学图书馆情报部课件_第2页
上海大学图书馆情报部课件_第3页
上海大学图书馆情报部课件_第4页
上海大学图书馆情报部课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲信息检索原理

(教材p.19-45)2023/7/22上海大学图书馆情报部本章要点1

?信息检索的基本原理?检索语言的类型

?信息检索的类型

?信息检索系统的类型?数据库的构成?信息检索的基本概念2023/7/22上海大学图书馆情报部

1信息检索的基本概念信息检索的定义:从任何信息集合中查找所需信息的活动、过程与方法。

What’ssearchinglike?“Findinganeedleinahaystack

p.192023/7/22上海大学图书馆情报部1.1信息检索的原理著录广义上,信息检索包括信息存储与检索两个过程检索人员情报人员2023/7/22上海大学图书馆情报部1.1信息检索的原理编辑/存储检索收集汉字并注音、释义和用法记录下每个汉字的上述信息编辑正文:按汉语拼音排序汉字部首的检字表汉字汉语拼音字顺部首的检字表著录新华字典汉字并注音、释义和用法标引标识

存储检索标引标识=检索标识汉语拼音,汉字部首检索标识整理以新华字段为例2023/7/22上海大学图书馆情报部1.2检索语言文献标识的依据:检索语言检索语言:用来描述文献文献的内容特征、外表特征和表达情报提问的一种人工语言。是信息处理人员和检索人员共同遵循的“纲领”,保证检索系统的质量。检索语言的种类:分类、主题

p.31-342023/7/22上海大学图书馆情报部1.2检索语言

-中国图书馆分类法(中图法)22个大类:用1个汉语拼音表示一级2023/7/22上海大学图书馆情报部1.2检索语言

-中国图书馆分类法(中图法)分类号类目名称一级二级2023/7/22上海大学图书馆情报部1.2检索语言

-中国图书馆分类法(中图法)二级四级三级2023/7/22上海大学图书馆情报部1.2检索语言

-中国图书馆分类法(中图法)五级五级五级2023/7/22上海大学图书馆情报部1.2检索语言

-中国图书馆分类法(中图法)五级六级七级2023/7/22上海大学图书馆情报部课堂同步练习11.TN919.2是几级分类号?类目名称是?2.TN919.22类目名称是?2023/7/22上海大学图书馆情报部课堂同步练习1答案1.TN919.2是六级分类号,类目名称是数据通信网2.TN919.22类目名称是帧中继

数据通信网2023/7/22上海大学图书馆情报部1.2检索语言-主题语言主题检索语言:关键词和叙词关键词:一种自然语言性质的主题语言,它是从文献的题目、正文或摘要中抽出的能表达文献主题内容的具有实质意义的语词。对词语不加控制(没有预先编制的词表)叙词:从自然语言中优选出来并经过规范化处理的名词术语。(有预先编制的词表)例:原始文献信息关键词叙词(汉语主题词表)铌基超导合金铌基超导合金铌基合金超导合金适合于数据库适合于数据库和检索工具p.33-342023/7/22上海大学图书馆情报部1.2检索语言汉语主题词表中国图书馆分类法2023/7/22上海大学图书馆情报部1.3信息检索的类型计算机检索手工检索以获取手段区分2023/7/22上海大学图书馆情报部1.3信息检索的类型信息集合文字数值图表事实文献检索数据检索事实检索以检索内容区分2023/7/22上海大学图书馆情报部1.3信息检索的类型文字:文献检索2023/7/22上海大学图书馆情报部1.3信息检索的类型数值、图表:数据检索图表数值(huangye)2023/7/22上海大学图书馆情报部1.3信息检索的类型事实:事实检索何时何地发生事件概念定义2023/7/22上海大学图书馆情报部1.3信息检索的类型文献检索的结果—相关性检索对同一个课题,同一个检索系统,不同的检索者查到的结果可能是不同的。甲课题A输出10篇查全率高乙课题A输出

5篇查准率高信息检索系统2023/7/22上海大学图书馆情报部1.3信息检索的类型文献检索—相关性检索为什么结果有差别

甲检索词ABC10篇

乙检索词ACD5篇信息检索系统2023/7/22上海大学图书馆情报部1.3信息检索的类型数值检索、事实检索的结果—确定性检索检索结果是有和无的差别

有?上海大学总机?上海大学图书馆办公室电话新校区:66131999无2023/7/22上海大学图书馆情报部1.4信息检索系统类型以报道文献的内容区分:

目录题录文摘全文

p.21-222023/7/22上海大学图书馆情报部1.4信息检索系统类型购买商业数据库自建数据库2023/7/22上海大学图书馆情报部1.4信息检索系统类型上海大学图书馆中外文数据库

数据库名称性质数据库类型书目查询系统自建目录万方数据库—学位论文、学术会议等数据库购买摘要中国知网—中国期刊网购买全文超星数字图书馆购买全文Ei数据库购买文摘EBSCO数据库购买全文+摘要2023/7/22上海大学图书馆情报部1.4信息检索系统类型目录:一批相关文献信息的著录集合,它以报道文献出版或收藏信息为主要功能的系统。

p.212023/7/22上海大学图书馆情报部1.4信息检索系统类型目录:

“本”为报道的基本单元2023/7/22上海大学图书馆情报部1.4信息检索系统类型教材第1章2023/7/22上海大学图书馆情报部1.4信息检索系统类型期刊2023/7/22上海大学图书馆情报部1.4信息检索系统类型2023/7/22上海大学图书馆情报部1.4信息检索系统类型题录:将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的工具。p.212023/7/22上海大学图书馆情报部1.4信息检索系统类型题录:文献的篇为报道的基本单元2023/7/22上海大学图书馆情报部1.4信息检索系统类型文摘:以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。p.212023/7/22上海大学图书馆情报部1.4信息检索系统类型中文篇名题录+摘要2023/7/22上海大学图书馆情报部1.4信息检索系统类型全文:通常先提供题录和文摘信息,同时给出全文链接,供检索者选择。p.212023/7/22上海大学图书馆情报部1.4信息检索系统类型全文链接2023/7/22上海大学图书馆情报部1.4信息检索系统类型全文2023/7/22上海大学图书馆情报部1.4信息检索系统类型信息检索系统类型目录题录文摘全文报道基本单元本篇篇篇揭示文献内容的深度出版物名称为止至篇名为止至摘要为止至全文为止2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成一条记录:书目2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成一条记录:题录2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成一条记录:文摘2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成一条记录:全文2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成记录号字段名记录3:题录顺排文档2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成顺排文档:记录12,3…的集合作者倒排文档:作者姓名记录号陈春秀1陈东方3程文娟3黄茂5秦大河6秦翔6吴元康2肖中新4原始信息其他倒排文档存储排序.

.

.数据库记录号形成检索检索输出2023/7/22上海大学图书馆情报部

1.5数据库(计算机检索系统)的构成共16个倒排文档2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成数据库构成:文档:文献或数据记录的集合。顺排文档:记录(记录号大小排列)的集合。也称为主文档。内容无序性,无法直接检索。倒排文档:依据文献记录的特征标识进行排序后得到的集合。提供检索入口,提高检索效率。

p.222023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成一条记录构成基本字段2023/7/22上海大学图书馆情报部1.5数据库(计算机检索系统)的构成记录:有关文献或数据的整体描述,是构成数据库或文档的基本单元。全文:一条记录相当于一篇文章

书目:一条记录相当于一条文摘或题录字段:记录的基本单元。对实体具体属性进行描述的结果。根据与文献内容相关与否,分为基本字段和辅助字段。

p.22-232023/7/22上海大学图书馆情报部本章要点2

?概念的拆分提取及扩展?检索算符与检索策略的构成?文献检索的一般步骤2023/7/22上海大学图书馆情报部a分析研究课题,明确检索要求b选择信息检索系统c确定检索词构成检索策略d实施查找并记录和阅读文献e索取原文2文献检索的一般步骤2023/7/22上海大学图书馆情报部2文献检索的一般步骤a分析研究课题,明确检索要求研究的学科、专业领域,文献类型,语种,年代等2023/7/22上海大学图书馆情报部2文献检索的一般步骤取得原文印刷型馆藏书目数据库电子全文数据库论文相关文献检索检索目的b.选择信息检索系统2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词c确定检索词

概念拆分

概念提取概念扩展英文:informatinretrievalviainternet

空格空格中文:因特网信息检索词间没空格数字艺术在影视作品中的展现词间没空格被检索系统处理成术语或词组,因而检索结果可能很少,甚至为零。

p.292023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词概念不拆分的检索结果2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词c确定检索词:概念拆分的方法:按照概念单元分成不能再拆分的词语。如:数字艺术在影视作品中的展现泛指的词:展现虚词:在,中,的主要概念:数字,艺术,影视,作品

2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词概念拆分后的检索结果2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词c确定检索词:

概念拆分概念提取概念扩展

提取主要概念:课题研究的对象、方法有关的特指性事物名词。辅助概念:泛指性名词如:研究,探讨等禁用词:介词、连词、冠词等虚词

提取主要概念,视实际情况选取辅助概念,去掉禁用词。如:主要检索词:数字,艺术,影视,作品2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词c确定检索词

概念拆分

概念提取概念扩展为了取得较好的检索效果,必须在概念分析的基础上列出与主要概念有关的同族词。2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词主要概念扩展的三种方法:基于同一概念的扩展法基于内容分析的扩展法基于检索结果的扩展法2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词方法一:同一概念的检索词的扩展法

(1)同一事物的学名、俗名、商品名学名俗名商品名

NaCl

盐计算机电脑硅油聚二甲基硅氧烷乙醇酒精

p.39

2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词方法一:基于同一概念的扩展法(2)同一事物的简称、全称、音译和意译简称全称音译意译

wwwworldwideweb

CADcomputeraideddesign

internet因特网互联网

motor马达电动机

laser镭射激光器p.392023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词方法一:基于同一概念的扩展法(3)同一事物名称的反义词污水处理与水净化光洁度与粗糙度(4)同一事物名词的单复数、不同词性、英美语的不同形式单数复数名词动词computer

computerscompositioncomposite英拼美拼

colour

color

fibre

fiber

p.392023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词方法二:基于内容分析的扩展法

1)上位概念扩展法:分析检索对象的学科归属

p.39词语上位概念白炽灯电灯赖氨酸氨基酸卡车汽车2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词2)下位概念扩展法:概念分析的树形展开法词语下位概念西部贵州,云南,青海,新疆,西藏,陕西,宁夏环境水,空气,土地等氨基酸赖氨酸、苏氨酸、亮氨酸、异亮氨酸、缬氨酸、蛋氨酸等

一次文献图书,期刊,专利等2023/7/22上海大学图书馆情报部2文献检索的一般步骤—确定检索词方法三:基于检索结果的概念扩展法

对初步检索结果进行分析,能够得到与课题相关的新的检索概念如:检索“可降解塑料的开发”经检索阅读文献,发现“塑料”的下位概念有:聚氨酯泡沫、聚乙烯、聚氯乙烯等,故可考虑这些概念进行扩展检索。2023/7/22上海大学图书馆情报部课堂练习2

分析课题“论网络环境下信息资源的利用”的相关文献

a.拆分概念并区分出主要概念、辅助概念和禁用词。b.扩展主要概念

2023/7/22上海大学图书馆情报部课堂练习2答案

a.拆分概念:论网络环境下信息资源的利用主要概念:网络、信息资源辅助概念:环境

、利用禁用词:论、下、的主要检索词:网络、信息资源

2023/7/22上海大学图书馆情报部课堂练习2答案b.扩展主要概念

主要概念1:网络,因特网主要概念2:信息资源,图书,期刊,数据库等2023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略

检索策略的定义:对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略:运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符等方法,表达课题检索要求的过程。(可以接受的含义:不同的系统算符表示方法、允许应用的种类不同)p.412023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略算符1:

布尔逻辑算符

定义:规定检索词之间的逻辑关系的算符。种类:逻辑“与”、“或”、“非”

大多数的数据库中,用ANDORNOT表示p.41-422023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略逻辑“与”

表示方法—AANDB阴影部份为检中文献

p.42

检索策略:网络

AND信息资源

AND利用含义:输出的记录中同时

含有“网络”、“信息资源”和“利用”

网络信息资源利用169001

11613

103128

4292023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略2023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略

逻辑“或”

表示方法—AORB

阴影部份为检中文献

p.41数据库信息资源检索策略:信息资源OR

数据库11613+21810=33423>33303去重含义:输出的记录中至少含有其中的一个概念21810

信息资源OR

数据库1161333303

2023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略2023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略

逻辑“非”表示方法—ANOTB阴影部份为检中文献

p.42专利德国检索策略:专利NOT

德国12089含义:输出的记录中只含有NOT前面的检索词,而不含有NOT后的检索词120891355012097

82023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略算符2:优先算符“()”

布尔逻辑算符运算次序:NOTANDOR

当逻辑“或”算符与其他算符混合运算时,要使用优先算符“()”来改变运算顺序。p.432023/7/22上海大学图书馆情报部

例:查找“论网络环境下信息资源的利用”的相关文献。c.构建检索策略

课堂练习32023/7/22上海大学图书馆情报部课堂练习3答案

主要概念1:网络、因特网主要概念2:信息资源、数据库、期刊逻辑“或”关系:网络与因特网;信息资源与数据库与期刊。逻辑“与”关系:主要概念1与主要概念22023/7/22上海大学图书馆情报部课堂练习3答案检索策略:分步:S1网络OR因特网S2信息资源OR

数据库OR

期刊S3利用S4S1ANDS2ANDS3综合:(网络OR因特网)

AND

(信息资源OR

数据库OR

期刊)

AND

利用2023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略3244

4153

网络信息资源利用45网络

or因特网信息资源or图书or期刊or数据库利用662023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略算符3:截词算符

在Ei数据库中,后截断截词符用*表示。在某些英语检索词中,词干相同,词义相近,但词尾有变化时,可采用后截断截词符。表示方法:词干*如:要检索出computer、computers、computing、computerize、computerise等以同一词干开头的词,除了用OR连接外,用computer*—检索结果中可能含computer、computers、computerize、computerise的记录。

用comput*—检索结果中可能含computer、

computers、computing、

computerize、computerise的记录p.452023/7/22上海大学图书馆情报部2文献检索的一般步骤

—检索算符与检索策略使用后截断算符需注意的四个问题:1.截词符要紧接在词干后面,截词符和词干间不能有空格;如:×computer*

2.避免将检索词的词干截得过短,一般应在三个字母以上;如:×com*

3.截词应该使用得合理;如:×

development*

4.从希望出现的单词中取尽可能多的公

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论