文献检索-文献检索策略构建_第1页
文献检索-文献检索策略构建_第2页
文献检索-文献检索策略构建_第3页
文献检索-文献检索策略构建_第4页
文献检索-文献检索策略构建_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文献检索-文献检索策略构建一、检索策略的构建 检索策略是根据检索课题的具体要求而制定的一套具体、合理的检索方案。 正确制定检索策略,优化检索过程,有助于取得最正确的检索效果。 检索策略的制定是否合理,以及在检索过程中能否根据实际情况随时修改原有的策略,使之 更加完善,都会直接影响检索结果。 分析检索课题,明确检索目的 选择检索方式和数据库 确定检索途径与检索标识 编制检索提问式 执行检索式 浏览检出文献,评价检索结果 调整检索策略 输出检索结果 转录、复印等 YesNo 一分析研究课题,明确检索目的 分析研究课题的目的在于明确检索内容和 具体要求。为此,应对课题的背景、以知条件、 以及要解决的

2、问题及要求等进行认真分析,明 确所需文献的范围、类型、文种、时间、空间、 输出方式等。 二选择检索方式与数据库1、检索方式机检的选择 1脱机检索 2) 联机检索 3) 光盘检索 4) 网络检索 2 、数据库的选择 数据库是指在计算机存储设备上按一定 方式存储的相互关联的数据集合。 选择数据库时要充分考虑到: 学科专业范围是否适用; 收录的文献资料是否齐全; 揭示的文献特征是否准确和深入; 报道时间是否迅速; 使用的语种是否熟悉。等等。 1数据库的类型 文献型数据库 书目型数据库题录、文摘) 全文型数据库 事实型数据库 (PDQ等 数值型数据库 (GenBANK,PTECS等) 图像型数据库 混

3、合型数据库 2数据库的结构 数据库的根本结构主要由文档、记录、字段三个层次构成。 文档File 数据库可以由一至多个文档构成。 文档按其编排结构和功能的不同,可分为顺排文档Sequential file和倒排文档Inverted file。 顺排文档是假设干个记录构成的信息集 合。在书目型数据库中,它以文献记录作 为信息存储单元,按记录入藏的顺序号从 小到大排列。 它相当于印刷型检索工具的正文局部。 倒排文档是从顺排文档记录中抽取出 的、以每一个文献特征标识作为信息存储 单元,按一定顺序排列,并在每一个标识 后注明相应的文献记录顺序号。不同的文 献特征标识的组合就构成了不同类型的倒 排文档。如

4、著者倒排文档等。 它相当于印刷型检索工具的辅助索引 局部。 记录Record 记录是构成数据库的一个完整的信息单元,由假设干个字段构成。 每条记录都描述了与原始信息有关的各种特征,这些特征字段为判定检索结果是否符合检索需要提供了依据。 书目型数据库中的一条记录相当于一篇完整的文献;其他类型数据库中的记录那么是某种信息单元,如一组理化指数、一种治疗方案等。 下面是MEDLARS系统中的MEDLINE数据库的 一条文献记录: AUGINGRASS DJ; MESSER RJ TI- A SIMPLIFIED THCHNIQUE OF INFEIOR BORDER ABTHE INFERIOR BO

5、RDER WIRE, AS ORIGINALLY LA-ENG MH-*BONE WIRES; HUMAN; MANDIBLE/*SURGERY ADDEPARTMENT OF ORAL MAXILLOFACIAL SURGERY, MEDICAL COLLEGE OF WISCONSIN, MILWAUKEE. SO- ORAL SURG ORAL MED ORAL PATHOL 2002;81(4):264 字段Field 字段是构成记录的根本信息单元数据项,是对原 始信息的具体属性进行描述的结果。书目型数据库中的字 段是描述文献内外特征的各项标识内容,如标题字段、著 者字段、文摘字段等。

6、 每个字段都有各自的字段标识符field tag,以供 识别其所表达的文献特征,例如:标题字段的标识符为 TI、著者字段的标识符为AU等等。字段标识符也参与构建检索策略。 检索系统数据库文档记录字段 三确定检索标识与检索途径 确定检索途径取决于两方面的条件:一是待查课题的条件和检索内容的要求;二是使用的检索工具数据库所揭示的文献各种特征是否准确和深入。 不同学科、不同类型的检索工具采用不同的文献特征来标引文献,形成不同的检索标识而提供不同的检索途径。1、文献检索语言检索标识 文献检索语言Document language是来描述 文献特征和表达检索提问的专门语言,即根据检 索需要而创立的统一文

7、献标引用语和检索用语的 一种人工语言。 检索语言既是聚集、组织、存储文献标准, 也是检索提问时所利用的手段及工具。 1文献检索语言主要类型: 描述文献外表特征语言 书刊题名 著者姓名 文献序号 描述文献内容特征语言 分类语言 主题语言主题词、关键词等 代码语言 2检索词典Retrieval thesaurus 检索词典是文献标引用语和检索用语的语源 和依据性文本。 它是对各学科中的名词术语、概念、代码、 分类号等进行标准化的记录,起着对检索语言规 范控制作用。 常见的检索词典是各种分类表和主题词表。 例如:?中国图书馆分类法?和?医学主题词?表 MeSH/?Thesaurus?。 2、检索途径

8、 1著者途径 这是利用著者姓名团体机构名称作 为检索标识进行查检文献的一种途径。 它适用于了解国内外某著者或团体机构所发 表的文献内容及其所研究课题的最新进展情况。 使用著者途径检索文献的关键在于熟悉著者 姓名在索引中的编排规那么。如姓名顺序、音译、排序 2分类途径 这是利用检索工具所采用的特定分类体系中 的分类号或分类类目作为检索标识进行查检文献 的一种途径。 它能较好地满足按类检索文献的要求,适用 于按学科概念检索文献。 使用分类途径检索文献的关键在于熟悉检索 工具所采用的特定分类法。 3主题途径 这是根据能反映文献主要内容的主题包括 主题词和关键词等作为检索标识进行查检文献 的一种途径。

9、 它具有较强的专指性和直接性的特点,适用 于查找内容比较具体、专一的文献。 使用主题途径检索文献的关键在于能够选准 代表所需文献主题内容的检索词。 *选用主题词时应注意的问题: 1. 选用主题词,应从事物的“专有名词来考虑,不要从“过 程词来考虑。如“肾结石的诊断 “肾结石/诊断 2. 选用主题词的概念要恰如其分,不能太广或太狭。 3. 利用MeSH表或Thesaurus将非主题词转换成可供检索使 用的正式主题词。包括同义词、近义词、简称与繁称和 俗名与学名等。例如:cancer neoplasms 怀孕 妊娠、子宫纤维瘤 子宫平滑肌瘤 4、要注意主题词的倒置形式。 过敏性休克 休克,过敏性

10、5. 主题概念的分析与转换 隐性主题分析 “为乳腺癌效劳的工作组织 “癌监护组织 “办公室吸烟对他人有害 “吸烟污染 主题概念分解转换 “胃十二指肠溃疡 应转换成“胃溃疡和“十二指肠溃疡两个主题词 注意英文同义词解剖名词的主题词 胃 gastric ,stomach 、 心 heart, cardio- 眼 eye ,ocul-,ophathalm-、 肝 liver,hepat- 6. 没有相应主题词时,可采用靠词或上位词检索 靠词检索: “上消化道出血 “胃肠出血; “红细胞存活 “红细胞衰老 上位词检索:“污水处理 “废弃物处理,液体 7. 可使用副主题词与主题词进行组配 “肝疾病的早期

11、治疗 “肝疾病/治疗 8. 要注意主题词与副主题词组配范围的限定 肺/诊断 肺炎/诊断 9. 已有先组的主题词,不用组配 “维生素A缺乏症 “维生素A缺乏症,“维生素A/缺乏症 10. 不能越级组配 “胆囊炎的B超诊断 “胆囊炎/超声检查 “胆囊炎/诊断 举例:“加压素治疗休克引起冠心病 显性主题: 休克/药物治疗、 加压素/临床应用、 冠心病/化学诱导 隐性主题: 加压素/副作用 四编辑检索提问式 * 检索提问式是用户向检索系统表达文献需求的句式。检索提问式有简单提问式和复合提问式。后者含有两个或两个以上的检索词,表达多维概念的检索,要用检索运算符号相连接。 检索系统中常用的检索运算符号有以

12、下几种: 1布尔逻辑运算符 用来表达检索词之间或检索词与检索式之间 的逻辑运算关系。这种概念组配是检索系统使用 最为广泛的检索技术。 常见的布尔逻辑运算符有“逻辑与、“逻辑或和“逻 辑非3种,其符号分别为“and、“or和“not有的数据 库那么分别用“*、“+和“-或“and not来表示。它们的逻 辑运算关系如以下图所示: AAABBABA and B逻辑与A or B逻辑或A not B逻辑非 1“逻辑与运算 这是具有概念交叉关系或限定关系的一种组 配。它要求检索出的文献记录必须同时含有检索 词A和检索词B。 例如:“吸烟与肺癌的关系 检索式为: 吸烟 and 肺癌 smoking an

13、d lung-neoplasms “逻辑与的作用是缩小了检索范围,提高查准 率。 2“逻辑或“运算 这是具有概念并列关系的一种组配。它要求 检索出的文献记录中含有检索词A,或者含有检索 词B,或者同时含有二者均为命中文献。 例如:“食欲亢进与过度饮食 检索式为:食欲亢进 or 过度饮食 hyperphagia or overeating “逻辑或“的作用是扩大了检索范围,提高查全率。 3“逻辑非“运算 这是具有概念排除关系的一种组配。它要求检索出的 文献记录是在检索词A的记录中去掉含有检索词B的记录, 即排除了不希望出现的文献记录。 例如:“非儿童性白血病,检索式为:白血病not儿童 “逻辑非

14、“的作用是缩小了检索范围,提高查准率。 使用逻辑非运算符号须慎重,容易造成漏检。因为它 会把那些同时出现在检索词A和检索词B的记录排除在外。 在一个复合检索提问式中,各种布尔逻辑运算符是 按照notandor的次序运算。也可用来改变运算 次序,以符合检索课题的逻辑关系。 例如: “用青霉素或红霉素治疗非儿童性肺炎 检索提问式,应为: #1 青霉素 or 红霉素 #2 肺炎 not 儿童 #3 #1 and #2 或者:#1青霉素 or 红霉素and肺炎 not 儿童 2位置算符 位置算符是要求原始记录中检索词之间要满足某些 条件而使用的符号。 例如:检索式为A with B,那么表示检索词A和

15、检索词B 必须同时出现在同一记录中的同一字段内; 检索式为A near B,那么表示检索词A和检索词B必须同 时出现在同一记录中的同一句子内。等等。 位置算符提高检索结果的准确性。它比“逻辑与更专 指,是调整检索策略的一种重要手段。 3字段限制符 字段限定符是限制检索词在数据库记录中的特定字段范围内检索的一种符号。常见的字段 限定符有“in或“。 字段限定检索的表达形式是:“检索词in字段 标记符或者是“字段标识符检索词。例如:hepatitis in ti 、张志 in au、la=English等 字段限定检索也是缩小检索范围、提高查准率的一种方式。 4.截词符 截词Truncation检

16、索是利用截词符附加 在所截取检索词的局部进行检索的一种技术。它 具有将同一词干的词全部查出的功能,扩大检索 范围,提高查全率。 按截词的位置,截词检索有前截断、中截断、 后截断、前后截断四种方式,最常用的是后截断 检索。 不同的检索系统有不同的截词符,常用的截 词符有“? 和 “。 “ ?是有限截词符即“?的数量就是替代被屏蔽字 符的数量,如输入“leukemi?,可检索出含leukemia、leukemic、leukemid等词的记录。 “ 是无限截词符即表示所截去的字符数量不受限 制,如输入“leukocyt*,可一次性查出以leukocyt开头 的所有检索词的记录。如输入“*sight,

17、可查到以sight结 尾的所有检索词的记录,如“farsight和nearsight等。 使用截词检索技术,要确定好适宜的截词位置,切忌 截词过短,以免造成误检。 检索课题:“胃镜检查胃炎仅限20212021年的英文综述文献。 胃炎 gastritis 胃镜 gastroscope gastroscopic gastroscopy 内窥镜 endoscope endoscopic endoscopy 检索提问式为: #1 gastritis and (gastroscop * or endoscop * ) #2 la = English 或 English in la #3 pt = rev

18、iew #4 py = 20212021 #5 #1 and #2 and #3 and #4 五浏览检出文献,评价检索结果 对检出的文献进行综合分析与评价。如果符 合检索要求,可直接输出检索结果转录、复印 等 ;如果检索结果与检索期望存在差距时,就 要分析出现误检或漏检的原因,并通过适当的方 法,调整检索提问式,直至其符合检索要求。 六检索策略的调整* 检索策略调整的原那么通常是以查全或查准为主。 当检出的文献量过少时,应以查全扩检为 主,可用以下方法加以调整: 增加同、近义词和相关词,并用or连接; 采用截词检索技术; 用检索词的上位词或分类类目进行扩展检索; 减少and的组配面; 取消某些限制过严的字段限制符和位置算符的使用。 当检出的文献量过多时,应以查准缩检为主,可 用以下方法加以调整: 利用专指性较强的主题词检索,并用相应的副主题 词进行组配,必要时可进行“二次检索; 增加and的组配面; 用not限制与提问不相关文献的输出; 限定检索词所在的可检字段或词间的顺序和位置; 限制检出文献的类型、语种和年份等特征词。 如有必要,可对检索提问式进行屡次的反响修改和调 整,直到检索结果满意为止。计算机检索中使用的特征词:新生儿 inf newborn 030天 动物 animal 婴

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论