计算机检索2月新版课件_第1页
计算机检索2月新版课件_第2页
计算机检索2月新版课件_第3页
计算机检索2月新版课件_第4页
计算机检索2月新版课件_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机文献信息检索 概论陈路平老师主讲(授课新版3)2016.2.05 计算机检索1计算机文献信息检索发展简介 计算机文献信息检索始于50年代,1954年美国海军武器实验所(NOTS)使用IBM701型电子管计算机建成了世界上第一个信息检索系统, 利用IBM701型电子管计算机把文献号码和少量索引词存贮在计算机中,(1).检索结果是文献号码,后在1958年经过改进,(2).检索结果可以是文摘、题录和作者等项目。2从20世纪50年代初计算机文献信息检索经历了 以下四个阶段。1.实验研究阶段 (1950-1954年)2.脱机检索阶段 (1954-1964年)3.联机检索阶段 (1965-1972年

2、4.国际网络检索阶段(1973年-至今) (一)实验研究阶段(1950-1954年) 这段时期图书情报界利用计算机进行编制索引、自动分类等研究,其目的是使图书馆工作自动化。3(二)脱机检索阶段(1954-1964年) 这一阶段通过计算机贮存二次文献和收录文献的范围越来越广,如书目索引和累计索引等数据库,用户可以对已存入计算机中文献信息进行定题检索和回溯检索 当时这种定题检索和回溯检索为脱机检索也称为批处理检索。 特点:只能由专业人员 操作 缺点:(1)检索人员为了节约费用,每隔二至三周才做一次检索,用户不能及时拿到检索结果。 (2)批处理检索是一种封闭式检索,用户与检索人员之间无任何反馈信息,

3、并无法和计算机对话。专业人员4 (三)联机检索阶段(1965-1972年) 这一阶段,由于第三代集成电路计算机 的产生与发展和高密度大容量贮存器-硬磁盘及磁盘机的出现,再加上数字通讯技术的发展和分组交换公用数据通信网的普及,使得情报检索从脱机、批处理阶段进入联机检索阶段。 与脱机检索阶段相比较,联机检索阶段具有以下特征: (1)采用大、中型计算机,文献检索 实行分时 处理,人机可直接对话,能及时得到检索结果; (2)终端用户可以检索到多个文献数据库; (3)虽然在该阶段出现了计算机网络,但规模不够大,大多是集中式的,联机检索受到地区的限制。 5 信息高速公路 20世纪50年代,美国建成了遍布全

4、国的高速公路网,对加速美国商品、劳务人员流通发挥了极其巨大的作用,推动了美国和周边国家的经济发展,至今高速公路网仍是美国现代经济的基础。1993年克林顿就任美国总统后,提出建立“国家信息基础设施(National Information Infrasture)计划”, 简称NII。其计划归纳为三点: (1)铺设覆盖美国的光纤网络。 (2)用光纤网络连接所有的通信系统、计算机资料库和电信消费设施。 (3)让光纤网络能传输视频、音频、数字、图象等多媒体信息。 信息高速公路主要由:通信网络、通信设备和通信资源三部分组成。 通信网络和通信设备构成宽广平坦的路面,信息资源就是公路上行驶的车辆,三者构成一

5、个有机的整体。7信息高速公路主要由(三部分组成)1.通信网络、2.通信设备、3.通信资源、 通信网络 和 通信设备 -构成宽广平坦的路面, 信息资源就是公路上行驶的车辆, 三者构成一个有机的整体。 信息高速公路将对社会经济,人们的工作和社会模式以及教育、科研等产生深远的影响。8(1)信息的存贮过程: 就是将大量分散的文献资料进行收集、整理、评价、选择、标引、编写文摘、著录等,直到输入计算机,建立起计算机可以阅读和分析处理的数据库的过程。 (2)信息的检索过程: 就是将用户提出的查询要求,赋予一定的检索标识,按照一定的要求输入 到计算机中,由计算机系统对其进行处理,并与已存贮在计算机中的信息进行

6、运算、匹配,最后将检索结果按用户要求输出。10文献收集文献加工文献输入数据库计算机文献信息检索系统检索结果提问文献提问输入提问表述用户查询示意图存 贮 检索11二、计算机文献信息检索系统的构成 计算机文献信息检索系统主要由:计算机硬件,软件,数据库构成。 (一)硬件 计算机硬件是指进行信息输入、输出、存贮、运算和传递的实体(包括以计算机为中心的一系列机器设备),它可以是大、中、小型计算机,也可以是微机、打印机及电源设备和通信设备及网络系统等,其中影响检索系统功能的是CPU的运算速度,内外存容量。 (二)软件 计算机软件又叫计算机程序,是指控制计算机进行各种作业的一系列指令和进行“人机对话”及各

7、种数据的存贮和传输的“翻译”规则。计算机软件包括系统软件和应用系统软件等。 12文献数据库结构:存取号标题著者刊名卷期页码出版年类型文种主题词文摘010001010002010003Han qdMa dlHan jsEngEngChina肿瘤基因心血管neoplasm cancer tumor carcinoma14计算机检索原理顺排文档:数据库中全部记录按一定顺序排列而成的文献记录集合。顺排文档(Sequential File)是大量记录(Records)的集合,按文献纪录入编的存取号从小到大依次排列的目录式文档。它相当于印刷型手工检索工具的正文题录或文摘部分。15倒排文档:著者倒排文档著者

8、文种主题词010001010002Ma dlHan jsEngEngChina肿瘤心血管基因Han qd存取号010003010001010002存取号010003010001010002存取号010003主题词倒排文档文种倒排文档17 数据库是计算机信息检索系统中的重要组成部分,是信息源,是检索的对象。 (2)数据库的结构:(文档.、字段、) 数据库由1至数个文档构成,文档(File)是由存贮在磁带、磁盘或光盘等载体上的一条条记录组成。 就书目数据库而言,一条文献记录(Record)就是一篇文章,一本书或一种杂志 的 描述体。 构成记录的基本单位为字段。 记录由一系列字段组成,如主题词、文摘

9、、著者等。 纪录( Records )是数据库中一个完整的信息单元,由一系列字段(Fields)构成。-相当于手检工具的题录或文摘。 构成记录的基本单位为字段。18字段(Field)是数据库的基本元件, 也叫数据元(Data Element)。 字段的实体就是文献著录中的“项”,它反映一条记录中各著录项的属性,如:著者项、篇名项、出处项等。有些字段还被分为-几个子字段(Subfield), 如来源(Source)字段,被划分为刊名,出版年、页码等子字段。子字段: 刊名,出版年、页码等为子字段。19字段(Fields) 是著录文献各项的名称及其内容,是描述文献内容外特征的各項标识内容。字段 相当

10、于题录或文摘中的各項目名称, 如: 题名(TI)、著者(AU )、地址(AD)、出处(SO)、主题词(MESH主要主题词(MMH,MJMH)、 关键词(KW)、特征词(TG)、 出版年(PY)、语种(LA)、摘要(AB)等等。20CBMDISC光盘检索(CBMLARS的使用)标识符字段名称 注释 属性AA 著者文摘AB 文摘 AD 地址 (第一著者地址)AD1 国省市名 (第一著者省市名)AF 原文出处 (译文原文出处)AU 著者CA 索取号 (医情所会议、汇编内部编码)CN 国内代码 (国内期刊代码) 21标识符字段名称 注释 属性CL 分类号CT 特征词 FS 资助类别ID 资助编号IS

11、ISSN (国际期刊代码)JC 内部代码 (医情所期刊内部代码)LA 语种 (缺省值为中文)MA 会议地点MH 主题词22标识符字段名称 注释 属性RF 参文数 (参考文献数)(SO) 出处 (复合字段:TA,PY,VI,IP,PG)SU 增刊TA 期刊名称 TI 中文题目 TT 英文题目TW 关键词 VI 卷UI 流水号24 标识符 字段名称 属性 TI Title(篇名) AU Author(著者) AD Address of Author(著者通讯地址) SO Source(文献来源) PY Publication Year(出版年) * LA Language(文献语种) * CP C

12、ountry of Publication(出版国家) * AB Abstract(摘要) 25 标识符 字段名称 属性 NM Name of Substance(物质名称) IS International Standard Serial Number (国际标准刊号) * TG Checktags(特征词) * AN Accession Number(存取号) * UD Update code(更新代码) * SI Secondary Source Identifier(第二文献来源标识) SB Subset(MEDLINE子集) * CM Comments(评论) GS Gene Sym

13、bol(基因符号) PT Publication Type(出版类型) *带*号为限制性字段,其它为“基本字段或默认字段”27= (等于) PY=1992 (小于) PY ( 大于) PY1992 出版年1992= (小于等于) PY=1984 出版年= (大于等于) PY=1992 出版年=1992 (指定范围) PY=1990-1992 出版年=1990-199228限制检索: 全部字段: 肿瘤 in all 限定符 in 和 = 的使用: in 可用于全部字段 = 只能用于某些字段29计算机检索的基本知识数据库记录与字段数据库类型30基本知识:数据库存储在计算机相关设备的数据集合。设备:

14、磁带、磁盘(硬盘、软盘)、光盘等。31数据库结构记录:构成数据库的信息单元字段:一条记录中各个数据项。标题:作者:地址:文摘:各个字段32 (3)数据库的分类 据统计,目前世界上有近万种数据库。数据一般依存贮对象区分为: 数值型数据库、事实型数据库、文献型数据库。 (A)数值型数据库: 是以数值为主要内容的数据库,除存贮各类数值外,还存贮运算公式,规划(如货币兑换算)等。金融、证券系统数据库大多属于此类。 (B)事实型数据库: 是指既有数字又有文字的数据库,如人口数据库、名录数据库、自然资源数据库,社会调查数据库等,总是以特定的事实或数字回答用户的查询。 (C)文献型数据库: 是指以各类型文献

15、为内容的数据库,包括最为常见的二次文献数据库,如书目、索引、文摘等。随着计算机技术进步,全文数据库、超文本型数据库等不断出现新型数据库。如中国生物医学文献数据库、中药药典数据库、法律数据库、人民日报数据库、MEDLINE数据库等等。 33实例说明:1).书目检索,例如“有关海底隧道有些什么文献?”(见文献检索);2).事实检索,例如“世界最长的海底隧道是哪一条?”;3).数值检索,例如“某海底隧道有多长?”;4).文献全文检索,所检索出来的是有关文献的全文,可能回答-例如“某文献全文中有哪些句子提到了海底隧道?”的问题。34由于数据库内信息存在形态不同和物理存放位置不同,数据库还可分为:层次型

16、数据库、网状型数据库、关系数据库或分为集中型数据库系统和分布式数据库系统。 (4)数据库的发展趋势 a)数据库与Internet结合,即数据库上网运行; b)将相关数据库集合在一起,组成数据仓库(Data Warehouse); c)随着全球信息高速公路的发展,联机数据库将占据数据库媒体的统治地位,光盘数据库数量将逐渐减少。 (四)网络电子信息源 由于Internet的发展,传统的联机网络的局限性显得越来越明显,以致目前世界上许多的联机系统如American Online,DIALOG,STN等都上了网络,成为Internet网络的一部分。、网络电子信息源的特点有:()以网络为传播媒体;35

17、()以多媒体为内容特征;()传播方式具有多样性,交互性。2、网络电子信息源的类型分为: a)联机数据库; b)联机馆藏目录库; c)电子图书; d)电子期刊; e)电子报纸; f)软件与娱乐游戏类; g)教育培训类; h)动态性信息类。36计算机检索文献信息的步骤与方法计算机检索和手工检索的目的一致,所使用的检索工具的内容一致,两者之间的区别仅仅由于文献信息载体的不同而引起的一些操作方法上的不同。计算机检索文献信息步骤如下:一、分析检索课题,明确检索要求二、选择数据库 三、制定检索策略37目前全世界有近万种数据库,选择数据库时应注意以下几点: 、数据库收录的文献内容;、数据库收录文献的出版类型

18、;、是否能索取到原文;、数据库的收费标准;、数据库中收录文献的时间范围;、数据库的更新情况。38 制定检索策略包括: 选择检索词、确定检索词之间的逻辑、位置关系。 制定检索策略的两个重要概念是: 查准率,查全率。 (1)申请科研项目或鉴定科研成果检索文献,要求有较高的查全率; (2)抢救一个危重病、疑难病作特殊治疗方案需检索文献时,要求有较高的查准率。 39检索效率,张琪玉教授在情报语言学基础一书中,概括为“全、准、快、便、省”五个字,“全”指检全率,“准”指检准率,“快”指检索速度快,“便”指检索方便性,“省”指检索成本与效益。其主要是全和准。检全率和检准率可用下列公式表示:4041与检全率

19、对应的是漏检率,即未被检出的相关文献数与检索系统中相关文献总数的百分比;与检准率对应的是误检率,即指那些带出的无关文献与检出文献总数的百分比。检全率和漏检率、检准率和误检率分别是同一问题的两个相对的概念。42一、分类索引 产生 漏检 和 误检 的原因1 、 检索范围大于检索要求 例如:要检索的只是“关于肺原性心脏病”的文献,其实只要查“R541.5肺原性心脏病”就可以了,但读者往往翻遍所有“R54心脏、血管(循环系)疾病”或“R541心脏疾病”,浪费了时间,增加了误检。“关于肺原性心脏病” R 541.5三级类目-查找就可以了 R54为二级类目432、 检索范围小于检索要求 例如 要检索:“关

20、于肾疾病”的文献,应当查“R692【肾疾病】”、“R527.1【肾结核】”、“R737.11【肾、肾盂肿瘤】”等类目,如包括小儿肾疾病,还需查“R726.92【小儿肾疾病】”。“R726.92【小儿肾疾病】”如果只查了R692及其下位类,就会产生漏检。需查:四个类目 R692 ; R527.1 ; R737.11; R726.92 ;四类目都需要查到443 、检索范围与实际文献需要不符,产生漏检和误检. 如检索: “糖尿病 并发青光眼” 的文献,误到 “R775.3继发性青光眼” -类目下查找,结果产生-漏检?应到 “R587.1糖尿病”和 “R587.2糖尿病性昏迷及其他并发症”这两个专类中

21、查找才是恰如其分的。 (参阅张琪玉:分类目录产生漏检和误检的原因, 刊载于图书情报知识1980年第一期)。453 、检索范围与实际文献需要不符,产生漏检和误检.糖尿病 并发 青光眼R775.3继发性青光眼”类目下查找,结果产生漏检R587.1R587.2糖尿病糖尿病性昏迷及其他并发症46一、主题索引 产生 漏检 和 误检 的原因1 、 检索范围大于检索要求 如要查阅: “腭裂的外科手术”文献, 只要检索 “腭裂/外科手术”(CLEFT PALATE / SURGERY)就可以了,检索者却没有组配,用“腭裂”查找,甚至用“外科手术”,“口腔”(SURGERY,ORAL)来检索,检索出不少无关文献

22、,增加了误检。472 、 检索范围小于检索要求 如要查:“关于血压”的文献,只检索了“血压”(BLOOD PRESSURE)这一主题,而未检索-“高血压”(HYPERTENSION)和“低血压”(HYPOTENSION)这两个主题, 而产生漏检。483 、 检索范围与检索需要不符 如要查幽门梗阻的文献,词表中没有这个词,靠题标引为“幽门狭窄”,结果 一无所获 或 收效 甚微。其实词表中有“胃出口梗阻”, 由于未查到专指词使漏检增加。494、 不适当地利用布尔逻辑表达式 逻辑(AND)用的太多,使检索范围缩小,使检全率降低;逻辑或(OR)用的太多,必然查出一些不相关文献,导致检准率降低;逻辑非(

23、NOT)用的越多,检全率越低。505 、 截词检索 截词检索可扩大检索的网罗度(即标引深度),提高检全率,但检准率下降,因此,切忌将词干截得过短。人们总希望有参考价值的文献全部被检出,被检出的文献都是有参考价值的,即检全率是100%,检准率也为100%。但实际上,不仅不可能达到这种理想的检索效率,甚至要达到较高的检索效率也不是很容易的。 51(一)选择检索词 注意使用规范化的医学术语并能计算机识别。(二)选择布尔逻辑运算符 运算符在计算机检索中起着十分重要的作用它能用来组合检索词,构成检索语句,达到扩大或缩小检索范围,提高检索效果的目的。 该算符由英国数学家乔治布尔提出, 也称作布尔算符。 布

24、尔逻辑符有三种: (1)逻辑乘(用“AND”或“”表示) (2)逻辑加(用“OR”或“+”表示) (3)逻辑非(用“NOT”或“-”表示52531、AND逻辑乘,通常也用“”表示。 AND是:具有概念交叉关系和限定关系的一种组配。 检出文献-需同时含有两个或多个检索词。 特点:常用来缩小检索范围,提高查准率。 例如:检索式Viruses AND Infection 逻辑与 检出的文献 特点是,凡 在同一篇文献中包括 有病毒同时也包括传染这两个概念的文献为命中文献。逻辑乘示意图54 例如:检索由 流行性感冒 引起 咳嗽 的有关文献 逻辑与检出的文献特点是,凡在同一篇文献中(用逻辑与“AND”联接

25、),包括有流行性感冒同时也包括咳嗽这两个概念的文献为命中文献,下面两圆的相重叠部分为命中文献: 逻辑乘示意图55简例:逻辑运算 AND糖尿病的饮食治疗糖尿病饮食治疗562、OR 逻辑和,通常用“+”表示。 OR 是具有概念并列关系的一种组配。 检出文献可同时或只含其中任何一个检索词。 特点:常用来扩大检索范围,提高查全率。 例如:检索式Hepatitis A OR Hepatitis B 用这一检索式可检索出所有有关肝炎A的文献和所有有关肝炎B的文献。逻辑和(或)示意图57 2、OR 逻辑和,通常用“+”表示。 例如:检索有关“流行性感冒或者咳嗽”的一些文章,用逻辑或(也叫逻辑和)联接。可检索

26、出所有有关流行性感冒的文献和所有有关咳嗽的文献,即两圆非重叠部分的文献。还可以检索出那些涉及流行性感冒,又涉及咳嗽的文献,即图中两圆相重叠部分的文献。逻辑和(或)示意图58简例:逻辑运算 OR微量元素 与 克山病 的关系ABC593、NOT 逻辑非也叫逻辑差,通常用“-”或“”表示。 “NOT”具有不包含某种概念关系的一种组配。 或者说用于表达概念的排斥关系。从检出文献中剔除部分文献。特点:一般用来缩小检索范围,增强专指性。例如:检索式Diarrhea NOT Vomiting这种检索式可将文献中排除即含 腹泻 与 呕吐 的文献, 检出只带-腹泻文献逻辑非示意图排斥 2、3、需要1文献60 3

27、、NOT 逻辑非也叫逻辑差,通常用“-”或“”表示。例如:流行性感冒; 流行性感冒引起咳嗽症状; 咳嗽症状要检索有关不带有咳嗽的流行性感冒的文献,用逻辑非“NOT”联接,检索或可将所有不带有咳嗽的流行性感冒的文献检索出来。但是在用逻辑非检索时,需要注意逻辑非还能把那些既论流行性感冒又论咳嗽的文献 排斥掉。逻辑非示意图61简例:逻辑运算 NOT非病毒性肝炎(除 病毒性肝炎 之外 的其它 肝炎)A NOT BA:各种肝炎 B:病毒性肝炎62布尔逻辑检索(Boolean searching) 布尔逻辑运算符主要有三种:表达方式布尔逻辑运算符逻辑“与”(AND)、 - 逻辑与(并且)、“*”星号; 逻

28、辑“或” (OR)、 -逻辑或(或者)、“+”号;逻辑“非”(NOT)、- 逻辑非(不包含) 、“-”减号布尔逻辑运算符的运算次序:(刮号)NOTANDOR 重点记忆63(三)选择位置运算符 (1)“NEAR” 两个词在同一个句子中出现; near表示:检索词存在于同一句子中,词序可以颠倒。 例如:information NEAR retrieval NEAR后加正整数 表示检索词之间最多允许插入几个词。 例如:acute NEAR 2 infarction 表示两词之间最多允许插入一个其他单词,可检出acute myocardial infarction。 NEAR3 NEAR4 表示检索词

29、之间最多允许插入3个单词或4个单词,以此类推。64位置算符near: 检索式:A near B表示:检索词A和检索词B不仅同时出现在一条字段里,还要同时出现在一个句子里。 Near n表示0n-1个间隔。65同句检索 near同句检索:即在两个词之间用near的一种检索技术。同句相邻词检索:用 near 加数字, 把两个词连起来,如 Diagnosis near 3 virus,就是凡在同一字段中有Diagnosis与virus之间相隔3个词以内的文献即为命中文献。如diagnosis of HB Virus infection66(2)“WITH” with表示: 连接两个词检索,凡是在同一

30、记录的同一字段中出现两个词;表示 检索词存在于同一字段,如篇名、摘要等,词序可颠倒,检索词之间的位置要求 比 “near” 宽。 例如:women WITH hepatoma 用with连接两个词检索,其检索结果为:凡是在同一记录的同一字段中出现这两个检索词的文献,都算是命中文献,且不论这两个词次序如何。67位置算符with: 检索式:A with B 表示:检索词A和检索词B不仅同时出现在一条记录中,还要同时出现在一个字段里。68同字段检索with同字段检索:即在两个词之间用with的一种检索技术。凡文献中,只要所要求的两个词在同一句子中即为命中文献,如G with H。只要G和 H 在同一

31、句中即可检出。如cough (咳嗽) with asthms (哮喘)。69Near、 with 指定两个检索词之间的位置With的含义:两个检索词在同一字段中出现。With的用法:检索词A with 检索词BNear的含义:两个检索词不仅在同一字段中出现。 而且可限定两个词之间的间隔距离。70是一种指定检索词在某一字段中出现的限定性检索。in 是一种包含(相似)关系。= 为精确的比较。in 的用法: 检索词 in 字段名称= 的用法: 字段名称=检索词特别提示:需要注意的是在特定的数据库中,哪些字段可以运用=,哪些只能用in。限定字段检索71包含检索和精确检索的涵义1 包含检索 (in)检索

32、词包含于检索字符串中,如: 检索作者马智,可检索出作者为马智、马智明、马智慧等的文献。2 精确检索(=)检索词与检索字符串 完全 相等,如:检索作者马智,仅检索出作者为马智的文献,而不会将作者名中含有马智片段的文献代出。3 所有字段均可进行包含检索,精确检索仅限于作者、期刊、卷、期、ISSN、出版地、主题词、特征词、关键词、人名主题、分类号字段。72(3)“in” 指定在某个字段进行检索;指定-字段检索符 用“in”指定-在某个字段进行检索。这种检索可节约系统在其他字段的搜索时间,检索的结果比较精确。检域限定检索或称=限定字段检索是指检索词限定出现在某一特定字段者,为命中文献。就是在检索词之后

33、用限定符号 in,再加字段简称。如arrhythmia in TI,就是在题名中arrhythmia(心律不齐)的文献即为命中文献。可限定检索的字段有TI、AU、 CP、 LA 、SO、 AD、 MeSH、 MMH,等。限定字段检索是一种缩小检索范围的检索技术,而且使检出的文献非常准确、切题。73常用的限制性字段1.篇名:chemistry in ti2.文摘:cancer in ab3.出版年:2000 in py4.出版类型或文献类型:review in pt,pt=editorial5.作者:han-j-s in au6.通讯地址:beijing in ad74( 四)运算符的排列次序

34、在实际检索工作中,有时为了表达各种逻辑位置关系,在一个检索式中很可能要使用多种运算符。在这样的复合检索式中,1).NOT运算优先级最高,2).AND,NEAR,WITH次之,3).OR 的最低。 但可以利用括号“()”改变运算次序,因为绝大多数检索系统优先处理括号内的检索式。75(五)截词符 截词符 以符号 取代 检索词中部分 字母 从而检出 同类词。 在英语中,同一个词有多种表现形式,如有单、复数形式,有英、美不同拼写形式,有名词、动词、形容词和副词形式。 为了能够查得全,不遗漏文献,经常要使用截词检索。 截词可分为:有限截词、无限截词 (1)“”无限截词符也叫开放性截词符。 如“compu

35、ter ”,在computer之后允许有零到任何多个字母出现; (2)“?”有限截词符 用“?”只能代表零到1个字母,“?”“?” 2个字母、3 个字母等。76例如:child?可检出:children。 “?”中间截断也叫屏蔽符例如:colo?可以检索出color和colour,dra?可以检索出draft,draught等,这种截词法通常用于那些有不同拼法的词,检索时只需对词中的不一致部分使用中间截断即可。77截词检索截词检索:是在词干的后面运用截词符号 * 进行扩大检索范围的一种检索技术。即英文中有许多词有一些同根词,词尾形态不同,词义相近,-如 digest(消化,动),digesta

36、nt(助消化的),digestibility(可消化性),digestion(消化,名词),digestive(消化的、助消化的,消化药)都与消化有关。78不同机检系统,截词方式也不完全相同。按截词位置和符号不同,如下:3种有前截词,中间截词和后截词。截词符号也有用“?”若将截词符号加在digest之后,即digest *,则凡文献中有前方词干digest相同,而词尾不同的文献,全部都是命中文献。79 选择位置运算符“in” 指定字段检索符 (字段限定符) 如:leukocytes in ti;xian in ad; “with” 同字段检索符 如:drug with abuse “near” 相邻检索符 如:cough near influenza (同一个句子中) cough near2 influenza (两词之间的单词数量不超过两个) 80在 DIALOG 检索系统中,邻近运算符有: W 两词紧邻,次序不能颠倒,中间可有空格或标点 n W 两词间可有0-n个词,两词次序不能颠倒 N 两词紧邻,可颠倒 n N S 两词同一句子 F 两词同一字段 81检索策略的编制和调整(一)编制检索策略检索策略是在正确分析信息需求的基础上,确定确切的检索词,明确各检索词之间的逻辑关系与查找步骤,编制出符合检索课题的检索提问式。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论