计算机信息检索讲座课件_第1页
计算机信息检索讲座课件_第2页
计算机信息检索讲座课件_第3页
计算机信息检索讲座课件_第4页
计算机信息检索讲座课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机信息检索与利用叶青医学信息检索与利用教研室2013.11.8主要内容一. 计算机信息检索基础 二. 广西医科大学图书馆的数字资源介绍二. Pubmed简介四. 国际联机检索系统Dialog简介一. 计算机信息检索基础 计算机信息检索计算机信息检索指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。 随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。 计算机检索的一般程序 (1)分析检索课题,明确检索要求 (2)选择适当检索系统(数据库) (3)确定检索途径及检索词 (4)构建检索提问式 (5)上机检

2、索并调整检索策略 (6)输出检索结果2.1 分析检索课题,明确检索要求主题分析主题概念分析是课题检索的重点和难点)明确检索需求及检索目标(1)检索信息的学科范围(2)检索信息的类型(3)检索的目的2.2 选择检索系统(数据库等)(1)根据检索目的确定所需数据库的类型(2)根据信息需求的内容、专业范围选择数据库(3)根据记录来源选择数据库(4)根据熟悉程度选择数据库2.3 确定检索途径、制订检索式确定检索途径制订检索式(确定检索词、编制检索式 ) 应首先从相应的主题词表中选择所需的检索词,以便获得最佳检索效果 没有确切表达课题内容的主题词时,可采用自由词检索。 以课题核心概念为主,排除无关概念,

3、把重复概念进行归并,简化检索式,提高检索效果。 3计算机检索基本技术 31 布尔逻辑检索技术 布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义: AND (*)表示由该符号连接的检索式的运算结果为逻辑”与”。 OR (+)表示由该符号连接的检索式的运算结果为逻辑”或”。 NOT (-)表示由该符号连接的检索式的运算结果为逻辑”非”。布尔逻辑检索技术AND (*) 连接不相容的主题概念(或不同字段) 检索结果同时出现连接的词 限定 缩小范围 提高准确率OR (+) 连接同义词 同族词 相关词 检索结果至少含有其中一词或同时有 扩大

4、检索范围 提高查全NOT (-) 缩小检索范围,起到减少文献输出量布尔逻辑检索技术 优先处理算符“( )”逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有 A、B、C、D四个检索词(其中A和B,C和D分别为同义概念),检索提问式为: (A OR B)AND (C OR D) 即,同一组检索提问既含有OR算符,又含有AND算符,此时须使用优先处理算符 “( )”,将OR算符前后的词放入括号中,计算机将优先运算括号内的算符。逻辑运算符的应用例:为检索课题”固氮和固炭的生化机理或基因机制”编制检索策略.固氮* 固炭* ( 生化+ 生物化学 + 基因)33位置检索 位置检索可要求检索词以用户

5、所规定的相对位置出现。比如:以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。 位置算符与AND 常用的位置算符及含义: (W)算符(WITH) 表示两个检索词紧密相连,词序不能颠倒, 中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。 例:COMMUNICATION(W)SATELLITE 位置检索COMMUNICATION AND SATELLITE 结果:communication satellite ,satellite communication ,communication d

6、evices for satellite ;communication links without satellite (n W)算符(n WORD) 表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。位置检索技术 (N)算符(NEAR) 表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。 (n N)算符(n NEAR) 表示两个检索词中间可以插入n个词,且词序可以颠倒。 位置检索技术如:internet(N)accessing命中记录中出现的匹配词可能有:internet accessing, accessing internet。如:internet(1N)accessing

7、命中记录中除上例的外,还会可能有:accessing internet, accessing the internet, internet /intranet accessing等。位置检索 (S)算符(SUBFIELD) 表示两个检索词必须出现在同一个子句子中,但两词的词序和插入的词数不限。句子位置算符 (F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。字段位置算符 例:air(w)pollution (F)control位置检索 (C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。 (L)算符(L

8、INK)表示两个检索词之间存在从属关系或限制关系,如果其中一个为一级主题词,另一个就为二级主题词。 3加权检索 加权检索是在检索提问式中,根据每个提问词在检索要求中的重要程度,分别给予一定的加权数值加以区别,我们称这个数值为权数。同时再给出检索命中的阈值。当检索结果达到所设定的阈值时,系统将显示为命中记录。 采用加权检索的目的在于提高检索结果的准确程度。 34限制检索技术 所谓限制检索是通过限制检索范围,达到优化检索结果的方法。 具体形式主要有: (1)字段限制检索 (2)使用符号限制 (3)进行范围限制 (4)采用限制指令 限制检索技术 辅助字段限制辅助字段运算符的用法是在需要指定字段的检索

9、词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert, S.”的含义是在作者字段中查找含有“Robert, S.”的所有记录。 下面是其他常用的辅助字段限制及其实例: 指定著者单位字段 CS=SHANGHAI UNIVERSITY 指定刊物名称字段 JN=APPLIED MATHEMATICS 指定语言字段 LA=ENGLISH 指定文献类型字段 DT=JOURNAL4.检索式的调整 检索表达式输入检索系统后,输出的检索结果有时不一定能满足课题的要求,或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检

10、索策略。4.1 检索结果过多 调整检索策略之前,首先要分析造成结果不理想的原因。对于输出篇数过多的情况,应分析是否可能是如下原因造成: a .选用了多义性的检索词; b .截词截得过短; c. 输入的检索词太少; d. 应该使用“与(AND)”的使用了“或(OR)”; e.优先运算符“()”使用错误。4.2 检索结果过少 对于输出篇数过少的情况,应分析是否方式如下原因造成: a. 检索词拼写错误; b. 遗漏重要的同义词或隐含概念; c. 检索词过于冷僻具体; d. 没有使用截词算符; e. 位置算符和字段算符使用的过多; f. 使用过多的“AND”算符。扩大检索范围的方法针对上述原因,如果是

11、属于需要扩大检索范围,提高检索结果查全率的,调整策略的方法有: a. 减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来; b. 在词干相同的单词后使用截词符(?或*); c. 去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。4.3 检索策略的选择推荐的检索策略 检索前研究你的主题. 变化你所知道的检索策略. 除非找到目标或学到新东西,否则不要局限在一种检索方法中。不推荐的检索策略浏览主题目录 在大型数据库中使用简单关键字跟随链接去那些大众口味或商业利益所推崇的网站4.4检索式的构造方法聚类组合法在课题分析,构造检索提问式时,可以采用“聚类组合法

12、”。实施如下七项操作:切分:对课题语句进行切分,以词为单位划分句子或词组; 删除:对不宜做检索词的词进行删除;替换:用更具体、明确的词替换掉某些表达欠佳词; 聚类:将彼此“非常相关的词”归于一组补充:对缩略词组进行还原作为补充; 增加:通过逻辑“与”或“非”增加限义词来避免由于检索词一词多义造成的误检问题;组合:最后组合成合乎需要的检索式.删除 排除检索意义不大而且比较泛指的概念 如: 展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果删除过分具体的限定词:干洗剂的近况 、生产工艺 配方极其应用 删除存在蕴含关系的可合并词例:内弹道高温高压高密度气体状态方程 排除重

13、复无关的概念项目“河豚毒素的液相色谱分析”从项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念主要概念: 河豚毒素、液相色谱检索式:河豚毒素 and 液相色谱检索词之间存在部分与整体关系例:检索“欧洲能源”方面的文献 按照“欧洲”;同时包括许多国家。英国 法 德意 5.提高查全率的主要方法(1) 准确把握检索对象及目的,选择合适的数据库。(2) 降低检索词或分类号的专指度。(3) 更多地采用学科分类途径来扩大检索范围。(4) 减少逻辑“与”及逻辑“非”的使用。(5) 增加逻辑“或”及截词检索技术的使用。(6) 采用“全文

14、检索”。(7) 不限定检索对象的文献类型、时间段、文种等。 6.提高查准率的主要方法(1) 准确把握检索对象及目的,选择合适的数据库。(2) 提高检索词或分类号的专指度。(3) 更多地采用专用名词及特性检索的途径。(4) 选择逻辑“与”及逻辑“非”的使用。(5) 减少或不采用逻辑“或”及截词检索技术的使用。(6) 限定检索词出现的字段及在段落、文句中的位置。(7) 不选“全文检索”.(8) 限定检索对象的文献类型、时间段、文种及其它特征。二.广西医科大学图书馆信息资源纸质图书120多万册(图书32万余种)电子图书近120万册 中、外文期刊4000多种(现刊1729种)数据库29个图书馆中文数据

15、库1.中国生物医学文献数据库(CBM)2.维普中文科技期刊数据库 (VIP)3. CNKI数据库4.万方数据库图书馆外文数据库Web of Science MICROMEDEX数据库(综述型事实数据库) 循证医学评价数据库(EBMR) PML数据库 Springer Link Ovid EBSCO MD Consult 数据库 Biosos Preview数据库 康健临床决策循证数据库 图书馆电子图书库1.书生之家 2.中国数字图书馆3.汇雅电子图书 多媒体资源1.起点考试网 2.外研社外语资源库 3.金图高校英语资源数据库 4.爱迪科森网上报告厅 5.职业全能培训库 6.计算机技能自助式网络视频库7.新东方英语四六级网考平台三.Pubmed简介网址:/pubmed美国国立医学图书馆向因特网用户提供免费MEDLINE检索收录70余个国家5000多种生物医

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论