版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第4讲检索工具、检索技术、检索步骤、效果评价内容:教材第2章2-4节,4章目的与要求:通过熟悉常用检索工具及信息检索基本技术,让学生能够根据实际信息需求,使用适当的检索工具,选择合适的检索途径及策略找到需要的信息。要求掌握信息检索各步骤内容,会熟练选择检索工具并运用计算机检索技术查找文献信息;能够对检索结果进行评价,并能够利用检索结果调整策略根据检索需求适当调整检准率与检全率。教学重、难点:1.索引的特点与作用;题录、全文数据库的特点;2.三层结构(字段、记录、文档)与文献特征的对应关系;搜索引擎。3.计算机信息检索基本技术;加权检索、扩展检索、二次检索等。4.查全率、查准率的计算方法与基本调整措施;5.影响检索的主要因素及应对措施。24.1信息检索工具(系统)P254.1.1信息检索工具的定义检索工具是人们为了快速、全面、准确地查询已有的文献信息资源,按照一定的著录规则编制而成的用以报道、存储和查找信息的工具。
二次文献即是一种检索工具。现在主流的检索工具形式是数据库。34.1.2信息检索工具的作用:存储作用将大量分散的、不同种类、不同学科的信息资料,进行组织排列使信息由分散到集中,由无序到系统化。报道作用把不同学科信息的类型、数量、质量展示给信息利用者,促进信息传递和使用检索作用以特征序化而形成检索途径可使人们根据特征来寻求与之相对应的信息或文献。44.1.3检索工具的类型可按收录范围、载体形式、加工手段等划分一、按检索工具提供文献信息的特点划分为:一)线索型(目录、题录、文摘、索引)二)事实型三)全文型四)引文型5目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。
主要揭示、报道出版物的外表特征。作用主要是提示藏书,指导阅读。一)线索型检索工具6题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。【论文题名】网络环境下信息检索与报道服务浅析
【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment
【作者】丁彩云DINGCai-yun
【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004
【刊名】株洲师范高等专科学校学报
【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE
【年卷期】2005Vol.10No.2
【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道
一)线索型检索工具7文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。【论文题名】网络环境下信息检索与报道服务浅析
【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment
【作者】丁彩云DINGCai-yun
【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004
【刊名】株洲师范高等专科学校学报
【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE
【年卷期】2005Vol.10No.2
【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道
【摘要】网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.
一)线索型检索工具8索引:是把特定范围内文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等外表或内容特征)按照描述语言形成标识,按其固有顺序排列起来,并指明出处,为用户提供文献线索的一种检索工具。
一)线索型检索工具二)事实型检索工具检索结果是回答问题的知识本身,而不是查找知识的线索。包括事实、数据、知识内容等。三)全文型检索工具特点:提供完整的文献单元内容;不保证内容是否绝对真实、正确。四)引文型检索工具主要功能是用来查找文献间引证关系(继承、评价)如SCI、CSCD等。9二、按信息加工处理的手段分一)手工检索工具历史悠久;形式多样;词义检索;人脑判断与筛选(詹德优《中文工具书导论》中分为8类):书目、索引、文摘;字典、辞典;类书、政书;百科全书;年鉴、手册、名录;表谱;图录;丛集汇要。二)机械检索工具(过渡形式)三)计算机检索工具(数据库)当前主流。更能满足用户对检索的主要要求:准:要求检出的文献有针对性,能解决研究中的具体问题。全:全面了解某一特定领域(问题)的发生、发展和现状。新:掌握最新动态或进展。快:最短时间内获得结果。定义、历史发展、系统构成、类型划分(自学,教材P50-54)1011常用的外文生物医学数据库:PubMed数据库荷兰《医学文摘》数据库(EM)《生物学文摘》数据库(BA)化学文摘数据库(CA)《科学引文索引》数据库(SCI)常见的中文生物医学数据库:中国生物医学文献数据库(CBMdisc)中国知网维普资讯网(维普智立方)万方数字化期刊中医药文献数据库121、数据库的结构13数据库是检索系统的信息源和核心。利用一个数据库,首先要了解其结构。不同的数据库,虽然利用原理相同,但由于数据内容和利用目的的不同,使得其数据结构和文献记录标引方式也有一定的差异,因而其利用也各有特点。数据库对文献特征的组织和揭示影响着数据库的利用及效果。各种数据库的共同点(P54)数据库结构均为字段、记录、文档3个层次的构成。14
(从大到小)文档记录字段
若干个记录构成的信息集合称为文档。大型的数据库分割成若干文档。记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。组成记录的数据项目15文章号篇名作者文摘全文001asdZhouXxx……..002bysDangYyy……..……vcaWenzzz……..篇名文章号Asd001Bys002vca……作者文章号Dang002Wen……Zhou001索引文档1:篇名索引索引文档2:作者索引主文档(顺排文档)检索篇名检索作者当你要在篇名中查找时,搜索指令将在篇名索引中进行搜索,然后将主文档中对应的记录调出来各项数据以构成一张横竖对齐的二维表格形式存放于数据库文件(库文件)中。文章号唯一,且索引文档与主文档的文章号一一对应索引文档(倒排文档)文档(File)由众多记录按一定方式组织在一起形成。162、搜索引擎(Searchengine)P58概念:是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后显示给用户,为用户提供检索服务的系统。原理:同样分为信息存储与信息检索两个过程。将存储信息与检索需求进行相似度计算,并按一定的排序原则显示在屏幕上。17搜索引擎分类按工作方式:全文搜索引擎代表:百度,谷歌目录索引类搜索引擎代表:早期的Yahoo其他搜索引擎名称:元搜索引擎集合式搜索引擎门户搜索引擎免费链接列表本部分内容安排有实习,此处不展开讲解。184.2计算机信息检索基本技术P55计算机信息检索技术:是指从计算机信息系统中提取符合用户信息需求相关信息的技术。常用计算机算符:布尔逻辑算符字段限定符截词符位置算符其他……194.2.1布尔逻辑检索与布尔算符:来源:(布尔代数)逻辑与、逻辑或、逻辑非。作用:布尔逻辑运算符用来表示两个检索词之间的逻辑关系,用以形成一个逻辑表达式。计算机根据逻辑表达式查找符合限定条件的文献信息。
布尔算符形式(3种):逻辑与(AND)逻辑或(OR)逻辑非(NOT)20布尔逻辑算符一、逻辑“与”(AND)表达概念间交叉限定关系的一种组配;作用:描述更为准确,缩小检索范围,提高查准率。例:查找“胰岛素治疗糖尿病”的文献,基本检索式为:
insulinANDdiabetes胰岛素AND糖尿病检索式“AandB”表示文献中同时包含检索词A和检索词B的文献才是命中文献。(如右图)
21布尔逻辑算符
二、逻辑“或”(算符:OR)表达概念间并列关系的一种组配;作用:扩大检索范围,提高查全率。
如:查找“肿瘤”的检索式为cancer(癌)
ortumor(瘤)orcarcinoma(癌)orSarcomas(肉瘤)
or
neoplasm(新生物)orlymphoma(淋巴瘤)……。检索式“AorB”表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。
使用注意:处理好整体与部分的关系,避免漏检。22布尔逻辑算符三、逻辑“非”(算符:NOT)表达概念间不包含关系的一种组配。作用:缩小检索范围,提高查准率。例:查“动物(非人类的)感染乙肝病毒”的相关文献。检索式:hepatitisBvirus(乙肝病毒)NOThuman(人类)?“AnotB”表示包含检索词A但不包含检索词B的文献为命中文献。使用需注意:处理好交叉关系,避免漏检。23运算次序与注意事项运算次序在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。一般情况下,运算优先级别如下所示(可以使用括号改变运算次序)。()>NOT>AND>OR例:检索厚朴或槟榔对兔离体肠平滑肌运动功能的影响.(厚朴OR槟榔)AND平滑肌实际使用中,不同数据库对运算次序解释不同。24检索实例:例:查找有关肿瘤引起的贫血的非英文文献
neoplasms(肿瘤)/complications(并发症)
anemia(贫血)/etiology(病因学)
English
#11687NEOPLASMS/complications#2179ANEMIA/etiology#323867EnglishinLA(或LA=English)#420(#1and#2)not#325截词检索:利用计算机特有的指定位对比判断功能,使不完整词能与标引词进行比较、匹配的一种检索。实质是用逻辑OR对具有相同的词头或词尾的词汇进行检索。截词符号也称通配符,通常用“*”代表无限多字符组合,而用“?”代表任意一个字符。4.2.2截词检索与截词符26一、后截断:将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符组合方式均符合该字符串的检索要求。后截断检索技术最常用,其主要用途有:词的单复数,如book?同根词,例如biolog*,physic*年代,例如199?,19??作者,例如:Lancaster*例如:
hypertensi??可查到hypertension、hypertensive。
hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。
27
二、前截断:将截词符号放在一个字符串的左方,以表示其左方有有限或无限个字符。前截断因为实现技术上较困难,在检索系统中比较少见。其主要用途在于:进行一个主题在不同领域应用情况的检索;在化学化工文献中多有类似情况。例1:*magnetic,可检索出magnetic(有磁性的)、electro-magnetic(电磁的)、patamagnetic(顺磁的)、thermo-magnetic(热磁的)thermomagnetic等词的文献。例2:*sighted,可查到farsighted与nearsighted。
28
三、中截断:将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如:
wom?n,可查到Woman,Women。
defen?e,可查到defense,defence。29截词检索在大多数检索系统可基本实现。截词检索的优势:是防止漏检的有力手段。能扩大检索范围,提高查全率;可以减少检索词的输入工作量;简化检索步骤(不需要用OR进行同义词的组配)。注意截断部位是否合适:不是所有用截词符产生的单词与你的检索意图相一致。304.2.3限定检索与字段限定符(1)“in”表示将“in”左侧检索词限定在某个字段名内查找。如:HypertensioninTI_(2)“=”、“<”、“>”、“>=”、“<=”符号主要用于限定查找年代。如:PY=2014,表示要求检出2014年出版的文献。314.2.4位置检索与位置算符(了解即可)又称邻近检索,是对检索词之间的相对位置进行限制。包括在记录中出现的顺序和相对位置。运算符都用“()”括起,前后不留空格。(1)with算符:(W)与(nW)表示此算符两侧的检索词在命中记录中必须出现在同一字段中(如篇名或文摘等),位置相邻且顺序不可颠倒。(2)near算符:(N)与(nN)
A(N)B表示命中记录中左右两个检索词出现在同一句子中。无论语序。
324.2.5其他检索技术一、加权检索(WeightingSearching
)
是一种定量检索的技术。从权重方面对检索词之间的组配关系加以限制和表示。在每个提问词后面给定一个数值表示其重要程度,这个数值称为权(Weight),在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和超过阈值,该记录为命中文献。缩小检索范围,提高检准率的有效方法。33二、聚类检索:计算文献的相似度,并把相似度较高的文献集中在一起,形成一个个的文献类。主题相近、内容相关的文献聚在一起,相异的被区分开来。根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系。34三、扩展检索:主题词或副主题词都可能存在含义的等级关系。检索领域常见的“扩展”选项是指如果选择该方式,系统将自动在指定的等级关系体系中把该词的下位词同时选中,词间关系为“逻辑或/OR”的关系。354.3信息检索步骤P28一、分析研究课题、明确检索要求明确检索目的和要求。了解检索者的具体要求,以及需检索出文献要解决的实质问题(一个课题可有多个问题,一次检索最好解决一个问题)。寻找探索性、开创性课题——需要查出一些启发性文献;课题申报——尽可能全面掌握相关资料;科研过程中问题解决——针对性、可行性方案筛选;鉴定评奖——与科研成果最相关的信息;确定检索范围。确定解决某一特定问题需涉及的学科范围、文献类型、时间区段、文献语种,以及文献数量等。学科范围:(如药物:基础研究or临床应用?)厘清检索词及词间关系。有检索意义的术语(拼写,同义词、近义词及相关词)及其他特征(如文献类型、有无专利申请可能)。通过检索词及其组成的逻辑关系式来进行检索检索词的选择直接关系到检索结果的质量。36二、选择检索工具或数据库注意——根据检索课题的主题及学科范围来选择相对应的检索系统或工具。1)与课题关系密切的信息源或检索系统有哪些?熟悉检索课题所涉及的学科范围、有无分支问题?了解课题专业涉及的数据库学科覆盖范围。2)检索者的目的?一般了解?系统了解?对科研项目内容的全部研究的把握?能解决问题的可行方法?一种?多种?1.选择检索工具(系统)时注意:①收录文献要全(量大);②文献的著录要标准(结果准确);③检索途径要多(索引功能完备);④时差要短(更新快)。4.3信息检索步骤374.3信息检索步骤三、确定检索方法(教材P28)检索方法应根据检索工具的收藏条件、检索要求、检索范围以及对学科背景等因素的了解程度而确定。①浏览法:科技人员通过浏览阅读核心期刊来获取本学科信息的方法。平时获取信息的重要方法。优点:最快获取信息;直接阅读全文;基本上能掌握本学科发展动态和水平。缺点:必须事先了解本学科核心期刊种类;检索范围小,易漏检。②追溯法:利用已获得的有较大参考价值的文献后面的参考文献,以之为线索由近及远,进行逐一追踪的查找方法。优点:不需利用检索系统,查找方法简单;缺点:检索效率不高;漏检率高;对最新进展掌握不够。38①浏览法:②追溯法:③常用法:利用检索工具查找文献的方法。顺查法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 郑州卫生健康职业学院《数据挖掘与人工智能》2023-2024学年第一学期期末试卷
- 郑州财经学院《宏观经济分析》2023-2024学年第一学期期末试卷
- 昭通职业学院《有机化学实验Ⅲ(二)》2023-2024学年第一学期期末试卷
- 武汉商学院《有机化学A(1)》2023-2024学年第一学期期末试卷
- 2024销售公司产品销售权承包合同3篇
- 上海交通职业技术学院《医学细胞生物学和遗传学》2023-2024学年第一学期期末试卷
- 2025年度车辆租赁行业信用评价合同3篇
- 宿舍楼应急照明与疏散指示系统应用效果评估
- 2024汽车租赁的合同
- 中医药在寒冷气候下的应用
- 2023年基础会计学课后习题及参考答案
- 2024年时事新闻及点评【六篇】
- (部编版)统编版小学语文教材目录(一至六年级上册下册齐全)
- 2024年中国防伪行业发展概况、市场全景分析及投资策略研究报告
- 高中英语-名词性从句教学设计学情分析教材分析课后反思
- 2024-2030年中国Micro LED行业发展现状调研及市场前景趋势报告
- 2024年全国职业院校技能大赛“新型电力系统与维护”赛项考试题库-中(多选题)
- 除湿机湿度调节能力考核试卷
- 朗诵社团活动教案
- 宜宾市翠屏区2022-2023学年七年级上学期期末地理试题
- 汽车智能座舱交互体验测试评价规程
评论
0/150
提交评论