中南大学湘雅医学院 文献检索_第1页
中南大学湘雅医学院 文献检索_第2页
中南大学湘雅医学院 文献检索_第3页
中南大学湘雅医学院 文献检索_第4页
中南大学湘雅医学院 文献检索_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学文献信息检索

第二章信息检索基本知识胡德华副教授第二章信息检索基本知识

第一节信息检索概述1

第二节信息检索原理2第三节检索途径与技术3

第四节检索策略4二、信息检索概述1.概念广义的信息检索包括信息的存储和检索两个过程(StorageandRetrieval)。信息存储是指将大量无序的文献信息集中起来,根据信息源的形式特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统.信息检索是指运用编制好的检索工具或检索系统,查找出满足用户需求的特定信息。狭义的信息检索是指根据用户的需求,利用检索工具或检索系统,查找出符合用户特定需要信息的过程。42.类型(P5)手工检索检索手段计算机检索联机检索光盘检索网络检索5文本信息检索数据格式和检索技术多媒体信息检索超媒体和超文本检索第二节信息检索原理定义:又称信息检索系统,是指累积文献信息并提供检索途径的工具。类型:(一)印刷型检索工具(二)计算机检索工具一、信息检索工具(一)印刷型检索工具类型:参考工具书目录检索工具题录检索工具文摘检索工具常用的国内印刷型检索工具常用的国外印刷型检索工具(二)计算机检索工具系统构成逻辑构成:信息选择与采集子系统、标引子系统、建库子系统、词表管理子系统、用户接口子系统、提问处理子系统。物理构成:硬件、软件、数据库、通讯网络。文献数据库:文献的有序集合2.数据库的结构DatabaseFlies(数据库)FileRecords(文档)RecordFields(记录)FieldSearchingEntry(字段)(检索入口)1.定义:文献数据库是指包含书目及与文献有关数据的机读记录(Record)的有序集合。(美国著名信息检索专家ME‧威廉姆斯(M.E.Williams))收集原始信息。提取、标注原始信息的特征,并进行规范化处理。把每个特征录入到对应的字段(field)中。3.文献数据库的建立信息源(原始信息)特征1特征2特征3特征4特征5特征n提取特征数据库中文献的记录方式标注特征规范化处理中国图书馆分类法医学主题词表(MeSH)格式规范字段名15

书目型数据库全文型数据库事实型数据库数值型数据库多媒体数据库类型4.文献信息数据库书目型数据库(bibliographicdatabase):是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。举例:中国生物医学文献数据库、PubMed、EMBASE等。(1)书目型数据库全文型数据库(Full-textDatabase):收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。优点:能直接获取文献原文,集文献检索和全文提供于一体;提供全文字段检索。举例:中国学术期刊网络出版总库(CNKI)、万方数据资源的数字化期刊、OVID全文数据库、ElsevierScience的SDOS等。(2)全文型数据库(3)事实型数据库事实型数据库(FactDatabase):提供有关事物、人物、机构等方面的事实性信息。举例:ClinicalTrials(临床试验数据库)是通过对自愿接受试验患者的临床研究,观测药物、诊断方法、疫苗和其他治疗方法对某一种疾病或症状是否安全和有效。数据型数据库(NumericDatabase):提供数值性信息,包括各种统计数据、科学实验数据、各种测量数据等。举例:WHOSIS:可以获取以下统计数据和资料:疾病负担统计、死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据、精神病死亡率统计、免疫接种统计等统计数据,以及疾病负担计划、国际疾病分类法及WHO术语信息系统、卫生系统成就、全球酒精数据库(GlobalAlcoholDatabase)等与卫生和卫生统计有关的资料。美国疾病控制与预防中心(CDC)的DataandStatistics等。(4)数据型数据库(5)多媒体数据库多媒体数据库(MultimediaDatabase):是数据库技术与多媒体技术相结合的产物,是文本、图像、声频、视频等多媒体信息的集合。举例:NLM的可视人计划(TheVisibleHumanProject),哈佛大学医学院的全脑图谱(TheWholeBrainAtlas),Utah大学的病理学图谱(WebPath)等。二、信息检索效率信息检索效率是评价一个信息检索系统性能优劣的质量标准,它始终贯穿信息存储和检索的全过程。衡量信息检索效率的指标:查全率、查准率、漏检率、误检率。理想的检索效果是查全率和查准率同时达到100%。但事实上很难达到全部检出和全部检准的要求,而只能达到某个百分比。第三节检索途径与技术一、检索途径二、检索技术一、检索途径自由词检索主题词检索题名检索著者检索机构检索刊名检索默认检索分类检索引文检索……二、检索技术1.布尔逻辑检索

逻辑与(AANDB)逻辑或(AORB)A

逻辑非(ANOTB)布尔逻辑检索示意图ABABAB1)布尔算符AND的含义及应用(1)含义:AND又称为逻辑“与”,表示“相交”关系,用于缩小检索范围(查准率)例如:用CBM查找干扰素治疗白血病的文献检索式为:干扰素AND白血病

(2)应用:表示形式:AANDBAB例1在CBM中干扰素治疗白血病的结果

白血病44538篇

干扰素21229篇

干扰素AND白血病729篇2)布尔算符OR的含义及应用(1)含义:“OR”又称为逻辑“或”,表示“并列”关系,扩大检索范围(查全率)例如:用CBM查找1978年以来有关艾滋病的文献检索式为:艾滋病OR爱滋病ORAIDSOR获得性免疫缺陷综合征(2)应用表示形式:AORBABAIDS5574篇

爱滋病469篇艾滋病19869篇艾滋病OR爱滋病ORAIDSOR获得性免疫缺陷综合征22834篇例1:用CBM查找1978年以来有关艾滋病的文献要点:提高查全率如何确定检索词归纳成

以下几个方面

全称、简称及缩写同时使用;规范词兼顾自由词(其中勿忘了同义词、近义词);查上位词时勿忘下位词;注意外来词译写变化。例2:用CBM查找2006年乳腺肿瘤的检索结果例3:用MEDLINE检索近3年乳腺肿瘤的检索结果例4:用CBM查找脑血管疾病的有关文献例5:用CBM查找拉米夫定的有关文献

(1)含义:NOT又称为逻辑“非”,用于

排除不需要的检索结果(2)应用表示形式:ANOTB

3)布尔算符NOT的含义及表示形式

例如:白血病治疗NOT放疗AB用CBM查找除放疗外的有关白血病治疗的文献4、运用“布尔算符”的注意事项

布尔逻辑运算符运算顺序为:

NOT→AND→OR

1)运算符遵循数学运算法则;2)在检索式中只有AND、OR前后的检索标识可以交换;

3)检索式中有NOT时前后检索词不能交换。

备注:()必须在半角和英文状态下输入

2.截词检索

作用:表示不确定字符的检索运算符,用于扩大检索范围。包括:

“*”

无限截词符

“?”有限截词符(通配符)应用举例(一)“*”的应用如:1、急性*胰腺炎:可检出急性胰腺炎、急性重症胰腺、急性出血坏死型胰腺炎、急性

胆源性胰腺炎、急性出血性胰腺炎等急性胰腺炎的所有文献。

2、immun*:可检出immune、immunity、

immunology、immunohistochemical等所有含immun前缀的检索词的文献。检索结果急性胰腺炎、急性重症胰腺、急性胆源性胰腺炎、急性出血坏死型胰腺炎等急性胰腺炎使用MEDLINE(06/7-06/10)查找免疫相关的文献结果应用举例(二)“?”的应用例如:拉米?定:可检出含拉米夫定和拉米呋定定的文章;

Protein?:可检出含

Proteins

Protein的所有文章

注:“?”必须在半角或英文状态下输入

3.限定检索作用:对特定字段的限定检索,包括:in、=、[]、.等表现形式:检索标识限定符字段名

实例:PY=2003;石京山in著者(作者=石京山);shijs[au]

shijs.au

实际演练(CNKI)实际演练(PubMed)总结:提高查准率从以下几个方面着手检索结果多时采用“AND”缩小检索范围检索下位词时不使用上位词使用“NOT”将不需要的检索标识排除将“AND”改为更精确的狭隘的位置符使用限定符限定检索标识所在字段4.相关反馈检索相关信息反馈检索,是将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系统自动进行检索。如PubMed的“RelatedArticles”CNKI的“相似文献”Google()的“类似网页”举例(PubMed)举例(CNKI)5.跨库检索跨库检索(crossdatabasesearching、One-stopsearching)是一次对多个数据库同时进行检索的技术。跨库检索能为用户提供统一的检索接口,将用户检索需求转化为不同数据库的检索表达式,并发地检索本地和广域网上的多个分布式异构数据库,并对检索结果加以整合,以统一的格式将结果呈现给用户。举例(万方数据)举例(Entrez)第四节检索策略一、检索策略的涵义广义的检索策略是指用户根据检索需求选择相应的数据库、确定检索方式、检索途径及相应检索表达式进行检索的一系列操作或方案,是用户检索目标的体现。狭义的检索策略仅指用户确定检索表达式进行检索的系列操作。

检索策略的重要性二、检索策略的构建分析课题,明确实质需求选择合适的检索工具或数据库概念分析并转换成系统检索词拟定检索提问式和检索途径检索修正调整检索策略获取原文,完成检索结果是否满意NOYES流程图指在着手查找文献信息前对课题内容进行分析,明确文献检索的目的需求。◆分析课题:要求明确课题对查新、查全和查准的要求,主要包括信息的内容需求和形式需求。●内容需求指检索课题涉及的学科范围、主题内容和有关的主题词、分类号等,以及它们之间的逻辑关系。

在此基础上,确定检索主题,根据其结构、类型、专业范围、性质等,提取主题概念、尤其注意挖掘隐含的主题概念,形成若干能代表信息而且有检索意义的主题概念。●形式需求包括所需文献的类型、数量、语种、年代等。1.分析课题,明确实质需求2.选择合适的检索工具或数据库选择检索工具时要考虑是否与文献需求紧密结合、学科专业对口、覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的工具以及检索系统的检索功能是否完善等。根据检索需求,选择数据库:(1)强调“准确”:这类检索需求的针对性强,多是解决某个具体问题,此时应选择提供的数据比较准确、权威的数据库。(2)强调“全面”:这类检索需求要求全面了解某一特定领域的基本知识、现状及发展趋势,因而应选择覆盖文献年限长、收录某一特定领域文献较多的数据库,必要情况下还需要选择多个相关数据库。(3)强调“全文”:可选择全文数据库或提供全文传递服务的数据库。(4)强调“新颖”:即需获取最新的信息,检索年限不要太长,应选择数据更新快、包含最新信息的数据库。(5)强调“深入”地获取某数据库信息,应选择单库检索,强调“广泛”地获取某方面的信息,应选择跨库检索,对多个数据库同时进行检索,节省检索时间。(6)强调“类型”:即用户想获取某一特定类型的文献,如期刊论文、学位论文、专利文献、循证医学证据,应根据需求灵活地选择包含相应资源的数据库。3.概念分析并转换成系统检索词☆检索词是表达信息需求和检索课题内容的基本单元,选择恰当与否,会直接影响检索效果。检索词可分为四类:表示主题的检索词,包括经过人工规范化处理的标题词、单元词、叙词(将有稍后叙述)和未经规范化处理的自然语言关键词。表示作者的检索词,包括作者姓名及机构名称。表示分类的检索词,如分类号等。表示特殊意义的检索词,如专利号、标准号、分子式等。☆检索词的选择与确定要注意两个原则:根据检索课题所涉及的学科专业和技术内容选词;对检索词进行处理,一个概念可以用不同的词来描述,不同的角度反映了同一概念的不同内涵,具有不同的切题深度和广度,因此要注意比照,选用规范词汇,尽量使用通用术语。4.拟定检索提问式和检索途径检索式是检索策略的具体体现,是检索策略构造中的关键环节,其优化与否决定了检索的质量,对检索结果产生决定性作用。检索式由检索词和和各种布尔逻辑算符、位置算符、截词算符及其它链接组配符号组成。类型简单提问式:如SARS,舒喘灵;夏家辉in

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论