检索策略与主题标引ppt课件_第1页
检索策略与主题标引ppt课件_第2页
检索策略与主题标引ppt课件_第3页
检索策略与主题标引ppt课件_第4页
检索策略与主题标引ppt课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

检索策略检索策略 与与 主题标引主题标引 主要内容: 一、检索语言 二、检索途径 三、检索程序(步骤) 四、检索功能 五、主题词表与主题标引 六、检索策略调整 一、检索语言 检索语言是文献中用来描述文献外表特征 和内容特征和表达检索提问内容的一种专门 人工语言,又称情报语言、标引语言、索引 语言等。 文献外表特征:书/刊/篇名、著者、出版事 项等。 分类检索语言 文献内容特征: 主题检索语言 分类检索语言 以学科分类为基础,结合信息内容特 征的一种直接体现知识分类概念的检 索语言。 以树状结构的形式,采用概念逻辑分 类的原理,层层划分,构成具有上下 类(隶属关系)、同位类(并列关系 )的概念等级体系。 用分类号、类目名称来表达各种概念 。 中国图书馆分类法(中图法 )简表 A马列、毛泽东思想 B哲学、宗教 C社会科学总论 D政治、法律 E军事 F经济 G文教、科学、体育 H语言、文字 I文学 J艺术 K历史、地理 N自然科学总论 O数学、物理、化学 P天文学、地球科学 Q生物科学 R医药、卫生 S农业科学 T工业科学 U交通运输 V航空、航天 X环境科学 Z综合性图书 R医药、卫生 R1 预防医学、卫生学 R2中国医学 R3基础医学 R4临床医学 R5内科学- R6外科学 R71妇产科学 R72儿科学 R73肿瘤学 R8特种医学 R9药学 R51传染病 R52结核病 R53寄生虫病 R54心脏、血管疾病 R55血液及淋巴系疾病 R56呼吸系及胸部疾病 R57消化系及腹部疾病 R58内分泌腺疾病及代谢病 R59全身性疾病 体系分类法的优缺点 优点:系统性强,族性检索,便于按学科 、专业直接检索比较广泛的课题。查全率 较高。 缺点:缺乏专指性,查准率不高,不能满 足专深课题以及新兴学科、交叉学科和边 缘学科知识的检索。对于分类体系不熟悉 容易误检和漏检。 主题检索语言 以文献的主题内容为依据,用词语作为概 念标识,并按一定的顺序排列而成的一种 检索语言。 优点:直接性、专指性强,比较适合专深 课题的检索。 主题检索语言:主题词、关键词 主题词(subject heading) 又称叙词(Discriptor),是 经过规范化 处理的具有实质性意义的词或词组。 “ 规范”:是对一个概念的同义词、近义 词和拼法变异词适当归并,采用参照系统 ,并有主题词的范畴表和树状结构。形成 专门的主题词表。 主题词表 语词规范化所使用的工具。 国内医学检索工具: 中国中医药学主题词表、医学主题词注释 字顺表。 国外医学检索工具: Medical Subject Headings ( MeSH,医学主题词表) 主题词的特点 规范错综复杂的名词概念,对同义 词、近义词、多义词 进行规范和控制 ,使标引人员与检索人员在检索时有共 同语言。 主题词具有主题集中、学科分散的特 点,故能提高文献检索的查全率和查准 率。 关键词(keyword) 未经严格规范化处理的检索词或词组(自 然语言)。 通常是从文献的题目、摘要、正文中选取 出来。标引出的关键词在文献中起关键性 作用,通常是由名词、形容词等实质性词 构成。 关键词的特点 优点:可不用主题词表,自由选词 ,不受限制。 缺点:同一主题的文献可能分散在不同 的词下,可能造成漏检。要提高查全 率,就必须分别检索同一主题的同义 词和近义词等。 一体化医学语言系统 (Unified Medical Language System, UMLS) 由美国NLM自1986年起研究和开发的生 物医学信息检索语言的集成系统和机读信 息资源指南系统。 UMLS通过将大量的检索词(包括规范词 和自由词)累积输入系统中,进行检索词 自动转换处理,使用户能够不必考虑检索 词的规范性或知识分类属性,不受人工语 言和自然语言的限制。 具有智能检索功能的系统:PUBMED/CBM 二、检索途径 是检索工具提供的检索入口。通常检索工 具都按照文献的特征进行标引,形成不同 的索引,如分类索引、主题索引、作者索 引、代码索引、引文索引等,一种索引就 是相应的检索途径。 计算机检索提供的途径几乎包括文献所有 的外部特征和内容特征,如标题、作者、 作者单位、出处、文摘、关键词、主题词 、分类号、ISSN等。 分类途径 分类途径:按照文献的主题内容所属的学科分 类体系,利用分类目录进行文献检索。 举例:查小儿白血病,应选: AR55血液及淋巴系疾病 BR725.5小儿血液及淋巴系疾病 CR733.7白血病 DR54心脏、血管疾病 答案:C 注意:分类途径检索关键在于对分类法的熟悉和 理解。 CBM分类检索 维普分类检索-查看分类表 主题途径 主题词途径:利用主题索引或主题词 字段检索。关键在于主题词的选取和 确定。 关键词途径:利用关键词索引和关键 词字段检索。选词比较自由,但注意 漏检率较高。 主题词途径-查看主题词表 在主题词表中选正确的主题 词 关键词途径-直接输入关键词 关键词与主题词字段的显 示 【分类号】:R449;*R725.5;R733.7;R977;R978.7;R979.12 【标题】:小儿急性非淋巴细胞白血病的诊治现状与展望 【作者】:吴梓梁 【作者单位】:广州医学院第一附属医院儿科,广州 510120 【摘要】:目前非淋巴细胞白血病(ANLL)(除M3型外)的疗效尚未令 人满意,无论是化疗,还是造血干细胞移植,其最好的5a无病生存率 (EFS)为55%一65%。理想的治疗方案仍在探索中,根据作者有限的 经验,以超大剂量阿糖胞苷(SHD-Ara-C)为主的诱导后化疗方案有 可能是治疗小儿ANLL最有效的化疗方案之一。. 【出处】:实用儿科临床杂志 2012;27(3) 153-155 【关键词】:急性非淋巴细胞白血病;治疗;超大剂量化疗;阿糖胞 苷 【主题词】:阿糖胞苷/*投药和剂量;*白血病, 淋巴样;存活率;急 性病;*无病生存;造血干细胞移植 【特征词】:儿童;儿童, 学龄前;人类 著者途径 按照著者姓名、学术团体及机构名称作 为检索标识,通过著者索引或著者字段检索 。 注意姓名的缩写形式,数据库中著者著录 规则一般是:姓前名后,姓是全称,名为缩写 的首字母。如:Smith J, Li XH 区别同名同姓的著者,利用单位名称、地址 或研究课题的不同加以区分。 作者检索途径 三、检索程序(步骤) 分析检索需求 选择检索工具或数据库 确定检索途径 编制检索提问式 获得文献线索(题录、文摘) 索取原文 常用中外文数据库 中国生物医学文献数据库(CBM) 维普中文科技期刊数据库(VIP) 中国知网数据库(CNKI) 万方数据库 超星数字图书馆 读秀 MEDLINE/PubMed(美国生物医学数据库) EBSCO OVID 检索词 输入框 检索词 输入框 数据库提供多种途径检索 要点:检索提问式 v在计算机检索过程中,用户的检索需求是通 过检索提问式表达的。即通过计算机检索系 统提供的组配、限定、加权、扩展、截词等 多种检索功能,运用一定的算符,将表达检 索要求的检索词构造成提问式,提交系统进 行检索。 四、检索功能 布尔逻辑检索(组配检索) 限定检索 截词检索 位置算符检索 加权检索 布尔逻辑检索(组配检索) 逻辑与(AND ,*): A AND B ,A*B 表示被检索的文献记录中必须同时含有A和B 两个概念。 例:小儿 AND 白血病 小儿 白血病 布尔逻辑检索(组配检索) 逻辑或(OR ,+) A OR B ,A+B 表示文献中含有其中任何一个概念就会被检出 。 例:小儿 or 儿童 小儿 儿童 布尔逻辑检索(组配检索) 逻辑非(NOT, ) A NOT B,AB 表示排除检索范围中不需要的概念。 例:微量元素 NOT 锌 微量元素 锌 限定检索 常见的可限定检索字段有: 题目、作者、语种、文摘、出版物类型、 期刊、年代、出版国等字段。 限定检索可缩小检索范围。 字段限定 截词检索 截词符号有“?、* ”等,用于提高查全率。 例: CBM检索词可使用单字通配符“?”、任 意通配符“%”。如:胃?癌、肝%疫苗。 Pubmed使用“*”作为截词符号 ,如physi*, 可检索出physics, physical, physiology等,如 果physi*超过600个词,会提示延长词根查找 。 截词检索示例:查胃?癌 位置算符检索 A NEAR B :表示A 、B两个词语必须同时出现在同一 句子中。 例: high near2 chromatography 可检出:high pressure liquid chromatography, 和high performance liquid chromatography等文献 A WITH B :表示A、B必须同时出现在同一字段。( 词间位置 的要求比NEAR宽松些) 加权检索 加权检索是对每个检索词赋予一个数值, 即“权”,权值越大,检索出的文献命中程 度越高。 不同的检索系统对加权有不同的定义,也 并非所有计算机检索系统都具备加权检索 功能。 MEDLINE和CBM 中对主要主题词打“*”号 。 PUBMED主题词字段的 显示 五、主题词表与主题标引 通过文献(相关课题)的分析,提炼 出主题概念转换成主题词、关键词等 检索语言,并以此作为文献检索标识 。这一过程就称为主题标引。 主题标引也即检索词的表达、选 择、确定的过程。 依据主题词表选择最相匹配的主题词进行标引 上位类与下位类主题词的使用 主题词/副主题词组配原则 主题词靠词标引 1.主题词标引 医学主题词表 (Medical Subject Headings, MeSH) 是美国国立医学图书馆(NLM)编制的权威性 主题词表。它是一部规范化的可扩充的动态 性叙词表。 NLM以它作为生物医学标引的依据,编制 医学索引及MEDLINE数据库。 MeSH汇集约18,000多个医学主题词。 MeSH Browser(医学主题词浏 览器) MeSH Browser不直接和medline或其他数据库链接,不 能替代PUBMED系统。 主题词表-字顺表 (1)规范检索词:使标引和检索之间用语一致。 参照系统:用代参照、相关参照 (2)确定主题词/副主题词。 (3)确定相关主题词,扩大检索范围 例: Exercise X(替代) Exercise, Physical 同义词 见/用 主题词 相关的逆参照: 例: 运动,体育 参见 运动 Exercise, Physical see Exercise 第一组 用代参照 揭示等同关系,规范词意作用。 用于一组同义词中选一个科学通用的名称作为主题词。 第二组 相关参照 揭示相关关系,起到扩大检索范围的作用。用于 主题词见主题词。 例1:运动 相关参见 用力、身体素质 Exercise see related Exertion、 Physical Fitness 反参: Exertion XR Exercise、Fatigue(疲劳)、 Sports(体育运动)、Work(工作) 参照系统 CBM:参照系统示例 副主题词又称限定词(Qualifiers), 与主题词进行组配,对某一主题词的概念 进行限定或复分,使主题词具有更高的专 指性。 副主题词目前是92个。 在进行检索时,用户输入一个主题 词后,系统会自动显示该主题词所能组配 的副主题词。 副主题词 (Subheadings) 副主题词 CBM副主题词使用举例 主题词/副主题词组配的原则- 1 检索有专指的副主题词,勿用泛指的副主题词;( 参照预扩展检索副主题词表) v例:诊断 治疗 病理学 膳食疗法 放射摄影术 药物疗法 放射性核素显像 护理 超声检查 预防和控制 放射疗法 康复 外科学 移植 注意:副主题扩展检索是指包括该副主题词所有下位词都一 并检索。用于查全。 组配的原则-2 能用主题词/副主题词组配的,不用与副主 题词等义的主题词。 v 例:乙型肝炎的免疫学研究 标引为:肝炎,乙型/免疫学 不用:肝炎,乙型 AND 免疫学 组配的原则-3 NLM对同一主题词进行复分所用的副主题词不超过3个 ,如需3个以上,一般不与副主题词组配。 利用主题词途径检索,注意选用 ALL(全部副主题词) NONE(不带副主题词) 分析(具体的副主题词) 血液 范畴表又称树状结构表是主题词的分类体系 。 MESH将主题词按学科属性归入16大类, 每 个大类按等级缩格排列,最多可达11级。如: Nervous System A8 Central Nervous System A8.186 Brain A8.186.211 Prosencephalon A8.186.211.730 主题词表-范畴表(Tree structure) A 解剖学 B 生物体 C 疾病 D化学品和药物 树状结构/范 畴表 CBM:范畴表示例 树状结构号 上下位的选择 首先选用专指的下位类主题词 主题词较泛指时,应用扩展检索(机检时 通过主题途径能自动扩检,手检则不能) 根据课题要求和检索结果调整检索策略, 用于扩大或缩小检索范围。 树状结构表的功能 (1)便于按学科体系选词 (2)通过范畴号确定所选词的学科范围 (3)对广义概念(上位概念)检索时要使用 该表,以便扩展下位检索 (4)有专指的下位概念要用专指概念 靠词标引 某些主题概念在词表中没有相应的主题 词进行标引时,可以采用靠词标引: 靠最直接的上位类主题词 v例:病毒性心肌炎 病毒性疾病 AND 心肌炎 2.关键词标引及检索式编写 1.关键词标引查准率高,但查全率低,应尽可 能多的标引出同义词、近义词,并使用逻辑或 构建检索式。包括其不同的拼写形式、单复数 、全称与简称、学名与俗名等。例如: l黄苓苷or 黄芩甙 or 黄苓苷元 or 黄苓素 l白细胞介素1(白介素1 、IL1 、IL-1) l斑点追踪(超声二维斑点追踪技术、斑点追踪 成像技术、二维斑点追踪显像技术) 2.对一些词语不应做关键词标引,如影响、患 者、研究、观察等。 检索式: 心血管疾病 AND 微量元素 AND 代谢 不同表达:心血管病、心脑血管病、 某一类疾病(范畴词),包含很多下位概念:心 脏病、高血压 解决:同义词用OR;用分类途径R54;主题词扩展 检索 关键词标引示例1: 标引出:心血管疾病、 微量元素、 代谢 查找:心血管疾病微量元素的代谢的相关文献 关键词标引示例2: 查找:丹参与维拉帕米对大鼠肝纤维化、肝硬化 防治作用的实验研究 检索式:(丹参 OR 维拉帕米)AND 大鼠 AND (肝纤维化 OR 肝硬化) 丹参 AND 维拉帕米? 药物对照研究多用OR连接 ,以便查出更多相关文献,强调药物联用、配伍 的可以用AND。 实验研究的表达:大鼠(小鼠、兔)OR 实验 OR动物 OR 模型; 最好利用系统的限定功能。 利用系统的限定功能举例 关键词标引示例3: 查找:养心正脉颗粒对“血瘀症”的实验研究 检索式: (养心正脉颗粒 OR 中药)AND 血瘀症 AND 实验 不能单用制剂或自制药物名称,类似中药可以用中药 、复方、中成药等,或者提出其组方中的主要单味 药名、或者提取物;另外西药还要注意商品名、化 学名等的不同。尽量查全。 实验:药理学、药效学 主题词检索与关键词检索说明 中文数据库仅CBM有主题词检索,最好两种途径

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论