医学文献信息检索概论课件专家讲座_第1页
医学文献信息检索概论课件专家讲座_第2页
医学文献信息检索概论课件专家讲座_第3页
医学文献信息检索概论课件专家讲座_第4页
医学文献信息检索概论课件专家讲座_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学文件信息

检索概论

1医学文献信息检索概论课件专家讲座第1页

信息检索在科研活动中所占百分比2医学文献信息检索概论课件专家讲座第2页1文件信息基本概念2信息检索理论3医学文件检索策略医学文件信息检索概论3医学文献信息检索概论课件专家讲座第3页1文件信息基本概念

1.1信息、知识、文件概念1.2文件类型4医学文献信息检索概论课件专家讲座第4页信息:是对客观世界中各种事物运动状态和改变反应,是客观事物之间相互联络和相互作用表征,表现是客观事物运动状态和改变实质内容。

能够使消息中所描述事件不确定性降低。1.1信息、知识、文件概念

5医学文献信息检索概论课件专家讲座第5页知识:是人们在认识与改造客观世界实践中所取得认识与经验总和,是人类经过对信息感知、获取、选择、处理等一系列思维过程,形成对客观事物本质和规律认识。分为隐性知识和显性知识。1.1信息、知识、文件概念与关系

6医学文献信息检索概论课件专家讲座第6页文件:国家标准《文件著录规则》中对文件定义为:“统计有知识一切载体。”人类积累创造知识,用文字、图形、符号、音频、视频等伎俩统计保留下来,并用于交流传输一切物质形态载体,都称为文件。1.1信息、知识、文件概念7医学文献信息检索概论课件专家讲座第7页信息、知识、文件形成关系:

产生大脑加工统计事物信息知识文件1.1信息、知识、文件概念8医学文献信息检索概论课件专家讲座第8页信息、知识、文件相容关系:1.1信息、知识、文件概念9医学文献信息检索概论课件专家讲座第9页

(1)按载体形式(2)按出版形式

(3)按信息揭示深度1.2文件信息类型10医学文献信息检索概论课件专家讲座第10页a、印刷型文件:纸张为载体、以手写或印刷而形成一个文件类型。b、缩微型文件:感光材料为载体,利用光学统计技术而形成文件类型。如缩微胶卷、缩微平片。c、视听型文件:又称直感资料、声像资料,它包含唱片、光盘、科技电影、幻灯片等。这种文件直接记载声音和图像。d、数字型文件:以数字信号方式将图、文、声、像等信息存放到磁、光、电等介质上。(1)按载体形式11医学文献信息检索概论课件专家讲座第11页a、图书b、期刊c、年鉴d、会议论文e、学位论文f、科技汇报g、专利文件h、政府出版物(2)按出版形式12医学文献信息检索概论课件专家讲座第12页a、图书图书是较系统阐述某一专题或学科知识出版物。除了记载有知识信息这一本质特征外,篇幅不少于49页非定时出版物称为图书。国际标准书号(InternationalStandardBookNumber,简称ISBN)(2)按出版形式13医学文献信息检索概论课件专家讲座第13页a、期刊一个以印刷形式或其它形式逐次刊行,通常有数字或年月次序编号,并打算无限期地连续出版下去出版物。每种经申请获准连续出版连续出版物都能够得到一个固定不变国际标准连续出版社物编号(InternationalStandardSerialNumber)(2)按出版形式14医学文献信息检索概论课件专家讲座第14页

非正式期刊和正式期刊

非正式期刊是指经过行政部门审核领取“内部报刊准印证”作为行业内部交流期刊(普通只限行业内交流不公开发行),但也是正当期刊一个,普通正式期刊都经历过非正式期刊过程。正式期刊是由国家新闻出版署与国家科委在约定数额内审批,并编入“国内统一刊号”,办刊申请比较严格,要有一定办刊实力,正式期刊有独立办刊方针。“国内统一刊号”是“国内统一连续出版物号”简称,即“CN号”,它是新闻出版行政部门分配给连续出版物代号。内刊没有CN号期刊分类15医学文献信息检索概论课件专家讲座第15页普通期刊与关键期刊

关键期刊,是指在某一学科领域(或若干领域)中最能反应该学科学术水平,信息量大,利用率高,受到普遍重视权威性期刊。国内对关键期刊测定,主要利用文件计量学方法,以及经过教授咨询等路径进行。关键期刊是期刊中学术水平较高刊物,是进行刊物评价而非详细学术评价工具。了解关键期刊含有主要意义。就编者而言,能够从关键期刊吸收经验。就读者而言,树立关键期刊意识,能够明确价值取向,提升阅读档次。就图书馆而言,在经费有限情况下,订阅时当然是以关键期刊为首选目标。就科研管理部门而言,能够统计分析单位或个人在关键期刊上发表论文情况,以此作为衡量其学术水平一项主要指标。期刊分类16医学文献信息检索概论课件专家讲座第16页关键期刊国内主要有7大关键期刊(或起源期刊)遴选体系:1、北京大学图书馆“汉字关键期刊”;2、南京大学“汉字社会科学引文索引(CSSCI)起源期刊”;3、中国科学技术信息研究所“中国科技论文统计源期刊”(又称“中国科技关键期刊”);4、中国社会科学院文件信息中心“中国人文社会科学关键期刊”;5、中国科学院文件情报中心“中国科学引文数据库(CSCD)起源期刊”;6、中国人文社会科学学报学会“中国人文社科学报关键期刊”;7、以及万方数据股份有限企业正在建设中“中国关键期刊遴选数据库”。17医学文献信息检索概论课件专家讲座第17页

三大国际检索系统:SCI(ScienceCitationIndex,科学引文索引)、EI(EngineeringIndex,工程索引)、ISTP(IndextoScientific&TechnicalProceedings,科技会议录索引)是世界著名三大科技文件检索系统,是国际公认进行科学统计与科学评价主要检索工具。SCI最能反应基础学科研究水平和论文质量,该检索系统收录科技期刊比较全方面,能够说它是集中各个学科高质优异论文精粹,该检索系统从来成为世界科技界亲密注视中心和焦点。

18医学文献信息检索概论课件专家讲座第18页

SCI——科学引文索引

SCI全称是ScienceCitationIndex,是美国科学情报研究所(InstituteforScientificInformation,简称ISI)出版一部世界著名期刊文件检索工具。SCI收录全世界出版数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科关键期刊约3500种。ISI经过它严格选刊标准和评定程序挑选刊源,而且每年略有增减,从而做到SCI收录文件能全方面覆盖全世界最主要和最有影响力研究结果。ISI每年还出版JCR(《期刊引用汇报》,全称JournalCitationReports)。JCR对包含SCI收录3500种期刊在内4700种期刊之间引用和被引用数据进行统计、运算,并针对每种期刊定义了影响因子(ImpactFactor,IF)等指数加以报道。

19医学文献信息检索概论课件专家讲座第19页EI——工程索引EI是美国《工程索引》(TheEngineeringIndex)简称。EI创刊于1884年,由美国工程情报企业(EngineeringInformationCo.)出版发行。EI是工程技术领域内一部综合性检索工具,报道内容包含:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。ISTP——科技会议录索引《科技会议录索引》(IndextoScientific&TechnicalProceedings,简称ISTP)创刊于1978年,由美国科学情报研究所编辑出版。该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科会议文件,包含普通性会议、座谈会、研究会、讨论会、发表会等。包括学科基本与SCI相同。20医学文献信息检索概论课件专家讲座第20页c、年鉴年鉴是以全方面、系统、准确地记述上年度事物运动、发展情况为主要内容资料性工具书。汇辑一年内主要时事、文件和统计资料,按年度连续出版工具书。它博采众长,集辞典、手册、年表、图录、书目、索引、文摘、表谱、统计资料、指南、便览于一身,

含有资料权威、反应及时、连续出版、功效齐全特点。属信息密集型工具书。《中国药年鉴》、《中国卫生年鉴》、《中国药品监督管理年鉴》、《中国内科年鉴》、《中国外科年鉴》等。(2)按出版形式21医学文献信息检索概论课件专家讲座第21页d、会议论文会议是在学术会议上发表(宣读)研究汇报、论文等。会议论文所表述最新研究结果或阶段性结果,能使专业人士获取许多有价值信息和有益启示而倍受青睐。会议论文是属于公开发表论文,普通正式学术交流会议都会出版会议论文集。(2)按出版形式22医学文献信息检索概论课件专家讲座第22页e、学位论文学位论文是表明作者从事科学研究取得创造性结果或有了新看法,并以此为内容撰写而成,作为提出申请授予对应学位时评审用学术论文。依据《中华人民共和国学位条例》要求,学位论文分为学士论文、硕士论文、博士论文三种。(2)按出版形式23医学文献信息检索概论课件专家讲座第23页f、科技汇报描述一项科学技术研究结果或进展;或是一项技术研制试验和评价结果;或是叙述一项科学技术问题现实状况和发展文件。科技汇报意在提供系统、详实信息,不以发表为目录,是科研历程及其结果完整记载。一些科技汇报含有阶段性和保密性。(2)按出版形式24医学文献信息检索概论课件专家讲座第24页g、专利文件

专利文件是包含已经申请或被确认为发觉、创造、实用新型和工业品外观设计研究、设计、开发和试验结果相关资料,以及保护创造人、专利全部些人及工业品外观设计和实用新型注册证书持有些人权利相关资料已出版或未出版文件(或其摘要)总称。

(2)按出版形式25医学文献信息检索概论课件专家讲座第25页h、政府出版物由政府机关负责编辑印制,并经过各种渠道发送或出售文字、图片、以及磁带、软件等。政府用以公布政令和表达其思想、意志、行为物质载体,同时也是政府思想、意志、行为产生社会效应主要传输媒介。(2)按出版形式26医学文献信息检索概论课件专家讲座第26页a、一次文件b、二次文件c、三次文件d、零次文件

(3)按信息揭示深度27医学文献信息检索概论课件专家讲座第27页

a、一次文件:又称原始文件,是情报学中一个主要文件,指以作者本人工作经验、观察或者实际研究结果为依据而创作含有一定创造创造和一定新看法原始文件,如期刊论文、研究汇报、专利说明书、会议论文、学位论文、技术标准等。(3)按信息揭示深度28医学文献信息检索概论课件专家讲座第28页

b、二次文件:二次文件又称二级次文件,是对一次文件进行加工整理后产物,即对无序一次文件外部特征如题名、作者、出处等进行著录,或将其内容压缩成介绍、提要或文摘,并按照一定学科或专业加以有序化而形成文件形式,如目录、文摘杂志(包含介绍式检索刊物)等。它们都可用作文件检索工具,能比较全方面、系统地反应某个学科、专业或专题在一定时空范围内文件线索,是积累、报道和检索文件资料有效伎俩。(3)按信息揭示深度29医学文献信息检索概论课件专家讲座第29页

c、三次文件:是选取大量相关文件,经过综合、分析、研究而编写出来文件。它通常是围绕某个专题,利用二次文件检索搜集大量相关文件,对其内容进行深度加工而成。是对现有结果加以评论、综述并预测其发展趋势文件,属于这类文件有综述、述评、进展、动态等。在文件调研中,能够充分利用这类文件,在短时间内了解所研究课题研究历史、发展动态、水平等,方便能更准确地掌握课题技术背景。(3)按信息揭示深度30医学文献信息检索概论课件专家讲座第30页d、零次文件

统计在非正规物理载体上未经任何加工处理源信息叫做零次信息,比如书信、论文手稿、笔记、试验统计、会议统计等,这是一个零星、分散和无规则信息。零次信息载体形式就称之为零次文件,这是近来被逐步认识和重视一类文件,它含有原始性、新奇性、分散性和非检索性等特征。(3)按信息揭示深度31医学文献信息检索概论课件专家讲座第31页

一次文件是检索对象,二次文件是检索工具,三次文件是一次、二次文件浓缩与延伸。(3)按信息揭示深度32医学文献信息检索概论课件专家讲座第32页2.1信息检索语言2.2信息检索路径2.3信息检索技术2信息检索理论33医学文献信息检索概论课件专家讲座第33页检索语言是应文件信息加工、存放和检索共同需要而编制专门语言,是表示一系列概括文件信息内容和检索课题内容概念及其相互关系一个概念标识系统。

2信息检索语言34医学文献信息检索概论课件专家讲座第34页作用:检索语言在信息检索中起着极其主要作用,它是沟通信息存放与信息检索两个过程桥梁。在信息存放过程中,用它来描述信息内容和外部特征,从而形成检索标识;在检索过程中,用它来描述检索提问,从而形成提问标识;当提问标识与检索标识完全匹配或部分匹配时,结果即为命汉字献。2信息检索语言35医学文献信息检索概论课件专家讲座第35页(1)表示文件外部特征检索语言表示文件外部特征检索语言主要是指文件篇名(题目)、作者姓名、出版者、汇报号、专利号等。(2)表示文件内容特征检索语言表示文件内容特征检索语言主要是指所叙述主题、观点、看法和结论等。包含分类语言、关键词和主题词。2信息检索语言36医学文献信息检索概论课件专家讲座第36页

依据信息分类工具,将内容属性或其它特征相同信息归在一起,区分出内容属性与它不一样信息,依据相互关系组成一个系统。国内外比较著名分类法有《杜威十进分类法》、《国际十进分类法》、《国会图书馆分类法》、《中国图书馆分类法》文件分类法37医学文献信息检索概论课件专家讲座第37页《中国图书馆分类法》(ChineseLibraryClassification,简称《中图法》)将知识门类分为5大部类,22个基本大类,其中R类为医药、卫生类,下设17个基本类目。《中图法》标识符号由拉丁字母和阿拉伯数字组成,我国图书馆普通采取《中图法》来组织图书文件,图书馆图书书脊上都贴着书标,书标上显示是索书号,索书号由分类号和其它特征标识组成,图书馆图书按照索书号次序排列,位置固定,方便人们索取利用。38医学文献信息检索概论课件专家讲座第38页

《中国法》5大部类:马克思主义、列宁主义、毛泽东思想、邓小平理论哲学、宗教社会科学自然科学综合性图书39医学文献信息检索概论课件专家讲座第39页《中国图书馆分类法》22个基本大类《中图法》共分22大类,即社会科学包含九个学科,自然科学包含十个学科,再加上马列、哲学和综合性图书。(26个英文字母除去L、M、W、Y)40医学文献信息检索概论课件专家讲座第40页

基本大类(22个)backA马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教

C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书41医学文献信息检索概论课件专家讲座第41页R类为医药、卫生类,下设17个基本类目:

R1预防医学、卫生学R2中国医学

R3基础医学R4临床医学

R5内科学R6外科学

R71妇产科学R72儿科学

R73肿瘤学R74神经病学与精神病学

R75皮肤病学与性病学R76耳鼻咽喉科学

R77眼科学R78口腔科学

R79外国民族医学R8特种医学

R9药学42医学文献信息检索概论课件专家讲座第42页

《中国图书馆分类法》以科学分类为基础,结合信息特点,采取逻辑分类普通规则,从总到分,从上到下,从普通到个别,逐层进行概念划分和概括,是层层展开概念等级体系。比如R医药卫生【一级类目】R5内科学【二级类目】R53寄生虫病【三级类目】R531原虫病【四级类目】R531.1阿米巴病【五级类目】R531.11肠阿米巴病【六级类目】R531.12肠外阿米巴病【六级类目】43医学文献信息检索概论课件专家讲座第43页例:

孙建萍主编人民卫生出版社出版《老年护理学》在我馆索书号(索取号或排架号)为:R473.59-43151:3

44医学文献信息检索概论课件专家讲座第44页例:

孙建萍主编人民卫生出版社出版《老年护理学》在我馆索书号(索取号或排架号)为:R473.59151:3

45医学文献信息检索概论课件专家讲座第45页关键词:关键词是指表示信息主体内容,含有实质意义关键性语词,是未经人工选择和控制自然语言。关键词法是以关键词作为检索标识和查询依据组织法,为适应计算机检索需要而产生。关键词多项选择自信息标题、文摘及正文,使用者不需接收专门培训。

46医学文献信息检索概论课件专家讲座第46页关键词优点:使用方便,不需要培训,能够检索到新近出现科技名词术语。关键词缺点:(1)于自然语言存在大量同义词和近义词,也就是多词一义。采取关键词组织信息,轻易出现相同主题内容信息分散在不一样语词之下。如evidence-basedmedicine,有翻译成循证医学、证据医学、实证医学,这一主题文件就有可能分散于不一样关键词中。阿尔茨海默型”、“老年性痴呆”、“原发性变性痴呆”、“阿尔茨海默”、“老年期阿尔茨海默病”、“老年期痴呆综合症”、“急性精神错乱老年性痴呆”(2)也有一词多义情况,不一样意义内容集中同一关键词下。

显然,使用关键词组织信息,信息将呈分散状态,检索时难以查全。也会降低查准率,查到与主题无关内容,所以需要主题组织法。47医学文献信息检索概论课件专家讲座第47页主题词:经过采取人工控制规范化语言语词表示信息内容及概念,并按一定次序排列成一套标识系统,采取这套系统组织信息即为主题组织法。这一套标识系统就是主题词表。国际上最具代表性医学主题词表是《医学主题词表》48医学文献信息检索概论课件专家讲座第48页

《医学主题词表》(MedicalSubjectHeadings,简称MeSH),由美国国家医学图书馆自1960年编制一部规范化、可扩充动态性词表,词表中有主题词约2.7万个。MeSH含有规范性和动态性特点。MeSH对医学文件中自然语言进行规范,使概念和主题词一一对应,假若一个概念存在同义词和近义词,则只选其中一个词作为主题词,防止同一概念信息被分散在多个“主题词”之下。动态性是指MeSH每年更新,进行内容修改、增补和调整,增加新术语,淘汰旧术语。49医学文献信息检索概论课件专家讲座第49页

MeSH主要由主题词字顺表、树状结构表及副主题词表组成。(1)医学主题词字顺表:是MeSH主表,全部主题词依字母次序排列,用于信息标引和检索。(2)树状结构表也称范围表,从学科分类角度将MeSH主题词划分为15大类,大类下再细分可达9级,反应主题词概念之间内在关系。(3)副主题词表对主题词做深入限定,说明所描述信息内容限于该主题某个方面,故也称限定词。50医学文献信息检索概论课件专家讲座第50页2.2信息检索路径(1)分类路径(2)主题路径(3)关键词路径(4)题名路径(5)著者路径(6)引文路径(7)机构路径(8)序号路径51医学文献信息检索概论课件专家讲座第51页(1)分类路径按学科分类体系来检索文件,通常选择分类名或分类号作为检索入口。

如《中国生物医学文件数据库》提供分类路径,是基于《中国图书馆分类法》52医学文献信息检索概论课件专家讲座第52页(2)主题路径主题路径是利用反应文件资料内容主题词来检索文件。主题词是经过规范化处理词汇,其作用在于对同义词、近义词进行归并,能确保词语与概念一一对应,还能显示概念之间相互关系如等级关系和上下位关系等,因而有利于提升查全率和查准率。如PubMed、《中国生物医学文件数据库》提供主题检索路径,是利用美国国立医学图书馆编制《医学主题词表》(Mesh)53医学文献信息检索概论课件专家讲座第53页(3)自由词路径是利用与该篇文件主题相关词汇进行检索,其结果是包含该词全部文件。自由词是检索工具中所出现任意词汇,包含题名词、关键词、文摘词和全文词等含有实质意义词汇。54医学文献信息检索概论课件专家讲座第54页(4)题名路径利用书、刊、杂志名称进行查找文件,是查找文件最方便路径55医学文献信息检索概论课件专家讲座第55页(5)著者路径是利用文件上署名作者、编者或机关团体名称作为检索入口查找文件。

在外文检索工具中,通常采取姓全称在前,名缩写在后形式进行检索,如利用PubMed检索吴建国发表文件时,需采取WuJG进行检索。

56医学文献信息检索概论课件专家讲座第56页(6)引文路径引文路径是以文章末尾所附参考文件为检索入口查找文件路径。经过引文检索能够查找一篇文件被后人引用情况,评价该文学术质量,同时也能够将主题上含有继承和发展关系文件找出。

参考文件引证文件57医学文献信息检索概论课件专家讲座第57页(7)机构路径以机构名称作为检索词查找该机构作者发表文件路径。有些检索系统中机构信息并入作者地址字段中。58医学文献信息检索概论课件专家讲座第58页(8)序号路径是利用文件特有序号作为检索入口查找文件路径。文件序号主要有专利号、公开号、汇报号、协议号、标准号、国际标准书号和刊号、化学物质登记号等。59医学文献信息检索概论课件专家讲座第59页2.3信息检索技术(1)布尔逻辑检索(2)截词检索(3)词组检索(4)邻近检索(5)扩展检索(6)加权检索(7)跨库检索60医学文献信息检索概论课件专家讲座第60页信息检索技术(1)布尔逻辑检索:即利用布尔逻辑算符表示检索词之间逻辑运算关系检索技术。惯用布尔逻辑算符有逻辑“与”、逻辑“或”、逻辑“非”。61医学文献信息检索概论课件专家讲座第61页信息检索技术(1)布尔逻辑检索:“与”“AND”或“*”算符实现逻辑“与”组配,检索时,命中信息同时含有两个概念,专指性强。如:medicalANDinformation

62医学文献信息检索概论课件专家讲座第62页信息检索技术(1)布尔逻辑检索:“或”

“OR”或“+”算符实现逻辑“或”组配检索,命中信息包含所相关于逻辑A或逻辑B或同时有A和B内容,检索范围比AND扩大。如:维生素COR维生素E

63医学文献信息检索概论课件专家讲座第63页信息检索技术(1)布尔逻辑检索:“非”

“NOT”或“–”算符实现逻辑“非”组配命中信息包含逻辑A但不包含逻辑B,排除了不需要检索词。如:乙肝病毒NOT人类64医学文献信息检索概论课件专家讲座第64页信息检索技术

NOT>AND>OR次序65医学文献信息检索概论课件专家讲座第65页信息检索技术

维生素C或维生素E对糖尿病患者肾脏保护作用维生素C维生素E糖尿病肾66医学文献信息检索概论课件专家讲座第66页信息检索技术

维生素C或维生素E对糖尿病患者肾脏保护作用

维生素Cor维生素Eand糖尿病and肾

维生素Cor维生素E)and糖尿病and肾67医学文献信息检索概论课件专家讲座第67页信息检索技术(2)截词检索截词检索是指将检索词在适当地方截断,是用检索词一个局部进行检索,凡是满足这个局部统计,系统都命中。截词检索在外文数据库中广泛使用。

有利于检索词单复数形式,同一词英、美不一样拼法,词根相同词检索。

这么既可降低检索词输入量,又可扩大查找范围,提升查全率。

按截词位置分:有前截断、后截断、中截断、复合截断;

表示截词截断符号有?、*、#、$等,各检索系统有不一样要求,没有统一标准。Embase中“?”为有限截词符,代表1个字符,“*”为无限截词符,代表任意个字符。68医学文献信息检索概论课件专家讲座第68页信息检索技术(2)截词检索后截断后截断是在检索词词干后面加截词符,查找词干相同全部词。

从检索性质上讲,后截断是“前方一致”检索。分为:非限制截断和限制截断非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可改变字符位数。例:comput?表示允许其后可带有任何字符且数量不限,相当于查找compute、computed、computes、computing、computer、computers、computerize、computerized、computation、computations、computational、computationally等词。

librar?相当于Libraries,librarian,library……不宜将词截得过短,不然轻易造成误检。

限制截断:是在检索词词干后面加若干个截词符,表示限制可改变字符数。例:fib??相当于查找fiber或fibre……educat??相当于Educator,educated……69医学文献信息检索概论课件专家讲座第69页信息检索技术(2)截词检索前截断前截断是在检索词词干前面加截词符,查找词干相同全部词。从检索性质上讲,前截断是“后方一致”检索。检索式“*magnetic”它能够检索出含有magneticelectromagneticparamagneticthermomagnetic等词汇结果。70医学文献信息检索概论课件专家讲座第70页信息检索技术(2)截词检索中截断

是把截断符号置于一个检索词中间,对词中间出现改变字符数加以限定。普通中截断仅允许有限截断。例:organi#ation,可检索到包含organization和organisation统计。

一个?代表零个或任意个字符。例:colo?r,可检索到包含color、colour、colonizer、colorimeter统计。一个?和数字,其中数字代表可替换字符数。例:colo?1r,只能检索到包含colour统计。71医学文献信息检索概论课件专家讲座第71页信息检索技术(2)截词检索复合截断

是指同时采取两种以上截断方式,

比如?chemi?能够检出chemicalchemistchemistryelectrochemicalphysicochemicalthermochemistry72医学文献信息检索概论课件专家讲座第72页信息检索技术(3)词组检索也称为短语检索或字符串检索,是指所检信息与所输入词组完全一致匹配检索技术,是提升检索准确度一个方法。在许多检索系统中用引号来表示,

如检索“medicalretrieval”则只有包含与medicalretrieval完全相同词串文件才能被检索出来,而medicalinformationretrieval、

medicalbookretrieval等文件则不能检索出来。73医学文献信息检索概论课件专家讲座第73页信息检索技术(4)邻近检索邻近检索又称位置检索,是利用位置算符表示检索词与检索词之间位置关系检索技术。这种检索技术通常只出现在外文数据库中,是调整检索策略一个主要伎俩。比较常见运算符有WITH、NEAR,不一样检索系统中位置算符要求有所不一样。

74医学文献信息检索概论课件专家讲座第74页信息检索技术(4)邻近检索wtihWith缩写为(W)

(W)表示此算符两侧检索词必须按此先后次序相邻排列,次序不可变,且两词之间不许有其它词或字母,空格和标点符号除外。用CD(W)ROM将命中CDROM或CD-ROM

(nW)则表示两个检索词之间最多嵌入n个词。比如,

而用price(2W)inflation,则可能检出pricelevelsandinflation。

75医学文献信息检索概论课件专家讲座第75页信息检索技术(4)邻近检索Near

Near缩写为N(N)表示此算符两边检索词必须紧密相连,此间不允许插入其它单词或字母,空格和标点除外,但词序能够颠倒。(nN)算符则表示在两个检索词之间最多能够插入n个单词,且词序能够颠倒。

76医学文献信息检索概论课件专家讲座第76页信息检索技术(5)扩展检索是一个扩大检索范围、提升查全率技术,表现为一词输入、多词命中,即当用户输入一个检索词后,系统不但能够检出含有该检索词文件,还能检出与该检索词同属于一个概念同义词或下位词文件。需要主题词表或分类词表支持。如PubMed提供下位主题词扩展检索、《中国生物医学文件数据库》提供下位分类号扩展检索。

“阿米巴病”包含“肠阿米巴病”和“肠外阿米巴病”,用“阿米巴病”检索,相当于用“阿米巴病”、“肠阿米巴病”和“肠外阿米巴病”三个词检索。77医学文献信息检索概论课件专家讲座第77页信息检索技术(6)加权检索是一个定量检索技术,不但关注检索提问词是否存在,更关注检索词或字符串在满足检索条件后对文件命中是否影响程度。加权检索基本方法是:在每个提问词后面给定一个数值表示其主要程度,这个数值称为权,在检索时,先查找这些检索词在数据库统计中是否存在,然后计算存在检索词权值总和。权值之和到达或超出预先给定阈值,该统计即为命中统计。如在PubMed中就有加权检索功效。78医学文献信息检索概论课件专家讲座第78页信息检索技术(7)跨库检索又称一站式检索,是一次对多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论