现代2讲信息查询基础知识_第1页
现代2讲信息查询基础知识_第2页
现代2讲信息查询基础知识_第3页
现代2讲信息查询基础知识_第4页
现代2讲信息查询基础知识_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容:2.1信息源2.2信息检索2.3信息检索途径2.4信息检索工具2.5信息检索技术2.6信息检索基本流程重点与难点:重点:文献信息源的分类;文献信息源的外部特征与内部特征;一次文献、二次文献和三次文献;布尔逻辑检索技术;截词检索技术;字段检索技术;信息查询的基本流程。难点:中图分类法在实际中的应用;一次文献、二次文献、三次文献的特点和区分;文献信息源的外部特征和内容特征;对于不同的检索需求如何选择信息源;理解信息查询基本流程中七个步骤之间的关系。信息查询基础学问学习目标--理解并驾驭文献及构成要素。--了解并驾驭文献信息源的类型及特点。--明晰信息检索的类型与特点。--驾驭信息检索的内外表检索途径。--了解文献信息检索的基本技术。--了解信息查询的基本流程。科技文献信息源分类:献、档1擎P251.不同加工深度的信息源零次文献一次文献名人手稿一般图书三次文献二次文献图书书目百科全书不同加工深度文献的关系不同加工深度的文献在内容上不断的浓缩和精练,在时间上有出版的先后依次,其具体的关系是:零次文献一次文献二次文献三次文献整理、创作、发表分析、提取、整理综合、浓缩、重组从零次信息到一次、二次、三次文献是一个从分散到集中,从无序到有序,对信息进行不同层次加工的过程。零次信息是一次信息的素材,一次文献是最基本的信息源,是信息检索和利用的对象.二次文献是对一次文献的重新组织和有序化,它是文献检索的工具.三次文献是借助二次文献的帮助,把分散在一次文献中的各类信息,依据专题或学问的门类进行文献重组,是高度浓缩的文献信息.它既是检索对象,又是检索工具.2.不同出版形式的信息源(1)图书:依据确定体例格式编排的,有确定页码数量的印刷品;识别图书的外表特征项主要有:书名(或叫题名)、著者(或叫责任者)、出版项(出版地、出版社、出版时间)、版次、总页数ISBN、价格等。(2)期刊(杂志):指有固定名称,定期或不定期出版,汇合了多篇单独论文的连续出版物;识别期刊的外表特征主要有:期刊名、期刊出版者、出版地、出版的年月日期、期刊的卷、期号、期刊的ISSN号、国内统一刊号CN、邮发代号、价格等。(3)报纸:是以刊载新闻和评论为主的出版周期最短的定期连续出版物,主要起报道、通讯和消遣的功能。(4)专利文献:专利文献是包含已经申请或被确认为发觉、独创、好用新型和工业外观设计的探讨、设计、开发和试验成果的有关资料,以及疼惜独创人、专利全部人及工业品外观设计和好用新型注册证书持有人权利的有关资料的已出版或未出版的文件(或其摘要)的总称。识识别专利文献的法律信息特征包括:申请号(ApplicationNumber)、申请日期、专利号、授权日期、优先号、优先国家、代理人、专利权属人、专利代理人、机构、独创人(Inventor)、权项等。识别专利的技术信息特征包括:专利分类号(PatentClassification)、专利名称(Title)、文摘(Abstract)、检索领域(Subject)等。(5)标准文献:技术标准、技术规格和技术规则等文献的总称,为在确定的范围内获得最佳秩序,对活动或其结果规定共同的和重复运用的规则、导则或特性的文件识别标准的外表特征项有:标准级别、标准名称、标准号、标准提出单位、审批单位、批准时间实施时间等。(6)会议文献:指由国内外重要学术会议上发表的论文和报告,也包括一些非学术性会议的报告。识别会议文献的外表特征项有论文名称、著者和著者工作单位、会议录名称、会议录出版状况、会议名称、会议时间、会议地点、会议届次等。会议录名称英文表达有:Congress(会议)、convention(大会)symposium(专题探讨会)、seminar(学术研讨会)Conference(学术探讨会)、meeting(小型会议)Proceeding(会议录)等(7)学位论文:学位论文(Thesis,Dissertation)是高等学校、科研机构的毕业生、探讨生为获得各级学位所撰写的论文。识别学位论文的外表特征项有:论文名称、著者、学位、授予学位的高校名称、时间、论文页码、导师或答辩委员会顾问的姓名、学位名称、高校名称等。(8)科技报告科技报告(Sci-TechReports)是围绕某个课题所取得的阶段性进展或最终性成果的记录与书展报告。包括技术报告书(TechnicalReports,R)、技术备忘录(Memorandumbook)、札记(Notes)、论文(Papers)、通报(Bulletin)等。科技报告的内容专深、牢靠、涉及专业探讨课题尖端、新颖 ,是重要的科技情报源、商贸信息源和竞争情报源。识别科技报告的特征项有:报告篇名、著者和工作单位、报告号、出版年月等。(9)政府出版物(GovernmentPublication)是指各国政府部门及其设立的特地机构所颁发的文件和出版的出版物。又称官方出版物。就其性质而言,分为行政性和科技性文献两类。行政性文献(包括立法、司法文献),主要有政府法令、方针政策、规章制度、决议、指示和统计资料等。主要涉及政治、法律、经济等方面。科技文献主要是政府部门的探讨报告、标准、专利文献、科技政策文件、公开后的科技档案等。政府出版物作用:对了解一个国家或地区的政治形势、方针政策、经济状况、科技发展战略和水同等有着独特的、较高的参考价值。一般不公开出售。(10)科技档案科技档案文献(TechnologyArchives,TechnicalRecords)是指在生产建设和科技部门的技术活动中形成的、有确定具体工程对象的技术归档文件。包括任务书、协议书、技术指标和审批文件、探讨支配、方案、大纲和技术措施;有关项目睥技术调查材料、设计计算;试验项目、方案、记录、数据、报告;设计图纸;工艺卡片以及应入档的其他技术资料等。具有保密性,是科研和生产建设中积累阅历、吸取教训和提高质量的重要依据。具有重要的凭证价值、参考价值、情报价值。

(11)产品资料(ProductLiterature)

是国内外生产厂商或经销商为推销产品而印发的企业出版物,用来介绍产品的状况,以产品书目、产品样本、产品说明书、企业介绍等多种形式对外宣扬,反映的技术较为牢靠成熟,图文并茂、直观形象、数据翔实。,对了解产品的新颖 水平,发展动向具有实际参考价值,是有用的科技信息源、商贸信息源和竞争情报源,免费赠送的较多。档案产品资料科技报告3.不同传播形式的信息源P27-30按信息源传播形式的不同,信息源分为:文献型、口头型、实物(现场)型、体语型、电子型和网络型。口头型:通过交谈、探讨、报告等方式沟通传播的信息。主要传播形式有:对话、报告会、洽谈、沟通、探讨会等。实物型:指以实物(自然实物和人工实物)为载体并承载才智和技能的信息源。包括有文物、产品样本、模型、建筑物、碑刻、雕塑等。体语信息源:是指以手势、表情、姿态等身体符号方式表述出来的信息资源。常见的如舞蹈、体育竞赛、杂技、行为艺术等。电子型信息源:指通过运用电子技术实现信息传播的信息源,包括广播、电视、电话、电子刊物等。方式有光盘、磁盘、磁带等。网络信息源:是指通过计算机网络可以利用的各种信息资源的总和,是以数字化形式记录,以多媒体形式表达、存储在网络计算机磁、光介质以及各类通信介质上,并以网络为传播媒介进行传递的信息内容的集合。网络信息源又有不同类型的划分:1)不同传输协议的网络信息。2)不同加工形式的网络信息。从信息资源的加工形式分,主要有网络资源指南和搜寻引擎、联机馆藏书目、网络数据库、电子出版物、电子参考工具、软件资源及动态信息。3)不同组织形式的网络信息分为文件、数据(仓)库和超媒体三种类型(P29)2.1.3信息源的外表特征和内容特征(1)外表特征由构成文献信息源的载体、符号系统和记录方式三要素中提取出的特征构成。常见的外表特征有:标准号例如:我们很简洁地知道一本书的外表特征题名(书名、篇名)著者ISBN专利号报告号(2)内容特征由构成文献信息源的内容要素的特征与学科属性形成。常见的内容特征有:主题词、关键词、分类号等。例如:通过图书的版权页,可以发觉部分内容特征主题词关键词分类号主题词和关键词的区分与联系主题:指文献所论述的主要对象,包括事物、问题和对象等。主题词:经过选择、规范化并用来表达文献主题的语词,称为主题词。关键词:关键词就是能描述文章本质的词语,信息检索领域将关键词理解为表示文献实质意义的那些名词或词组,常出现在文献篇名或文献正文中,并未经过规范化处理。如文献“PersonalComputer(PC)的原理”主题词是“个人计算机”,关键词有“PersonalComputer”和“PC”规范化的主题词来源有科学技术文献出版社出版的《汉语主题词表》国家特地组织编撰的《汉语主题词表》,排列了描述一切学科事物的规范性用语很多信息检索工具都自备了主题词表分类与分类法(P24)分类:就是依据事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种相识事物的方法。分类法:依据信息内容的学科属性,运用概念划分与归纳的方法形成各级类从而组织信息形成一种有序化的学问体系,这样组织信息的方法称为分类法。目前,我国通用的分类法主要有三种:1《中国图书馆图书分类法》(简称《中图法》)2《中国科学院图书馆图书分类法》(简称《科图法》)3《中国人民高校图书馆图书分类法》(简称《人大法》)我国普遍运用的分类法是《中国图书馆图书分类法》现为第五版,2010年由北京图书馆出版社出版⑴《四部分类法》:中国古代传统图书的分类法。⑵《杜威十进分类法》简称DDC:1873年由美国图书馆学家MelvilDelwey创立,目前DDC已被翻译成30多种语言,全球超过135个国家的20多万个图书馆运用。⑶《国际十进分类法》即UDC(UniversalDecimalClassification),又称为通用十进制分类法,:是在DDC的基础上发展起来的,是世界上规模最大、用户最多、影响最广泛的一部文献资料分类法。为世界各国发类科技文献所通用,目前已有23种语言版本。如:电化学的UDC分类号是544.6《中图法》有22个大类,分类号接受字母与阿拉伯数字相结合的号码;其中字母代表大类,数字代表大类下的细分,我校图书馆藏书分类皆依据中图法进行分类管理。从网络地址“://ztflh/”可以访问《中图法》具体类目《中图法》有五个部类:马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书,在此基础上扩展为22大类,大类下再分小类,层层绽开,形成一个树状等级结构。《中图法》1975年由北京图书馆等单位倡议,全国36个图书馆共同编辑出版。现已多次修订,2010年已出版第五版,它广泛用于我国图书的分类。分解为:I文学I7

美洲文学I712

美国文学I712.45

美国文学长篇、中篇小说分类法(分类语言):优点:1.用分类方法检索文献具有较高的查全率。分类法是一种体现学问等级概念的标识系统,具有按学科或专业集中地、系统地揭示文献信息内容的功能,便于收集某门学科或专业全面、系统的全部文献。2.分类将概念逐级划分,具有等级结构,便于扩大和缩小检索范围。3.分类法既能用于组织检索工具和检索系统,又能用来组织图书资料的分类排架。4.用分类号检索,不受语种限制。如可用国际专利分类号检索全世界各国的专利信息。缺点:1.间接性。分类法用分类号作为检索标识,不能干脆表达概念。检索时须要将检索的主题概念转换成分类号。要求熟悉分类法。2.分类法不能常常修订,因而不能刚好反映新的科技技术主题,对于新兴学科的文献,会找不到特殊切题类目和分类号。3.分类法的类目不行能详尽无余的列举一切事物概念,遇到检索主题狭窄的文献,可能难以找到相应的类目和分类号,检索结果查准率不高。例:“计算机网络平安法律法规”学科涉及:计算机网络、通讯、法律三个学科2.2信息检索信息检索(InformationRetrieval)指将信息按确定的方式组织和存储起来,并依据用户的需求揭示、查找、传递相关信息的过程,包含了存储和查找两个过程。2.2.1信息检索的基本概念(其次章2.2、2.3、2.4、2.5小节)信息存贮过程

原始信息

主题概念分析信息检索过程

检索课题课题主题内容分析

检索语言(分类号、主题词等内容特征语言)信息标引标识

检索标识

检索工具和系统

检索结果信息检索类型1.按不同的检索对象分为:

数据检索(dataretrieval)事实检索(factretrieval)文献检索(documentretrieval)下面几例检索分别哪种类型的检索类型淘宝2011年的毛利率是多少?国家标准中水泥的标号是如何规定的?西南科技高校的发呈现状如何?什么叫金融危机?查找两篇与我国发展航天飞船有关的论文,并记录下论文的作者、单位、发表的期刊名、卷、期数以及页码。查找西南科技高校近三年发表的论文被美国《科学引文索引》收录的状况。数据检索:以特定数据为检索对象和检索目的的一种检索。数据作为一般名词,是指进行各种统计计算、科学探讨、或技术设计等所依据的即具有数量性质并以数值形式表示的信息检索。查字词、查人名机构名、地名、公式、规格、型号等这类检索得到的是结果,而不是所需信息的线索,是确定性检索。有结果或无结果,或结果正确或错误。索事实检索(FactRetrieval)是获得事物的实际状况的信息。检索对象是一些事实。是指某一事物的基本概念、基本状况、事物发生的时间、地点、相关事实与过程等。是以从文献中抽取的事项为检索内容。文献检索:是以文献为检索对象的信息检索类型。是从一个文献集合中查找特定文献的过程。依据所检索内容的不同分为书目检索和全文检索。凡是查找某一课题、某一著者、某一地域、某一机构、某一事物的有关文献的出处和保藏单位等。均属于文献检索。文献检索结果供应的是与用户的信息需求相关的文献的线索或原文。这些线索有的对口,有的不对口,有的部分对口,总是伴有确定的误差,是不确定性检索。(1)请从本校的图书馆查找雨果《凄惨世界》一共保藏有多少册,保藏在什么地方,是否能借阅。(2)查找两篇与我国发身航天飞船有关的论文,并记录下论文的作者、单位、发表的期刊名、卷、期数以及页码。并同时下载全文。(3)查找西南科技高校近三年发表的论文被美国《科学引文索引》收录的状况。文献检索示例:数据事实检索文献检索

比较(区分)1.检索对象不同。数据检索以特定数据为检索对象,这里的数据是精确的。事实检索以获得事物的实际状况为检索对象,着重于事和实两个字。文献检索以独立的文献篇章为单位和检索对象2.检索结果不同。数据检索和事实检索是确定性检索。文献检索是不确定性检索3.检索工具不同。数据事实检索检索工具是参考工具书。包括词典、百科全书等。文献检索检索工具是全文数据库等。2.按检索方式划分(P22)

手工检索:运用印刷型检索工具人工查找,检索过程通过手翻、眼看、大脑推断。计算机检索:是以计算机技术为手段,通过光盘、联机和网络等现代载体进行的信息检索。重点驾驭:1.信息检索类型2.文献检索与事实数据检索的区分检索途径:是由提取信息源的外部和内部特征形成的。检索途径又叫检索点或检索入口检索点:每件信息都有其内部特征和外部特征,这些特征可以作为检索的动身点和匹配依据,它们就是信息的检索点。

检索途径

信息检索途径检索途径依据信息外表特征分类途径主题词途径关键词途径题名途径责任者途径机构途径代码/序号途径…依据信息内容特征依据文献引文特征引文途径内容特征途径(P23)1.分类途径:依据文献信息所属学科(专业)属性进行检索的途径。利用分类途径检索文献,首先要对课题内容进行分类分析,明确课题学科属性,分类等级,按分类法进行分类,获得分类号。计算机检索:提交分类号进行检索即可.特点:便于从学科体系的角度获得较系统的文献线索,即具有族性检索的功能,提高课题信息的查全率。2.主题途径:按文献信息的内容主题进行检索的途径。对课题内容进行主题概念分析,提炼主题概念,选择能表达主题概念的语词,确定主题词,利用主题词表和主题索引实施检索的途径。SubjectIndex

关键词途径:关键词是从文献的题目正文或摘要中选出的,表征文献主题内容的具有实际意义的词汇.关键词选择比较自由,干脆运用自然语言.关键词与主题词不同的地方,在于主题词是规范化的语言,而关键词则是接受原文献的同义词,而不予以规范化.关键词检索途径:用于网络信息检索.KeywordIndex外表特征途径.责任者途径:用责任者检索信息,可以跟踪从事科技探讨的个人或团体在某一时期的学术探讨成果和探讨动态.机构名称途径:依据机构名称检索该机构出版或发表的文献信息状况,以了解统计该机构的学术和科研成果。.编号途径:依据文献信息的出版或发布时给出的编号来检索文献信息。包括:ISBN号、ISSN号、专利申请号专利号、标准编号、报告合同号等。两种途径的侧重点:①分类途径按文献所属的学科内容从分类角度来检索,检索的学科专业系统性强,适合于学科的族性检索。②主题途径打破了学科之间的界限,按主题聚集不同学科的文献,能干脆、灵敏精确表达课题和检索提问的主要概念,能集中检索出特指内容的有关文献信息。③比较而言,主题途径更简洁理解与运用。思索:分类途径与主题途径的相同点、侧重点及在信息查询中的作用?两种途径的共同点:①.信息查询中运用频率最高的检索途径,②,都是从文献的内容特征查找文献的途径;每一个选项都是一种检索途径与检索途径对应的检索标识、检索词2.4信息检索工具(P26)信息检索工具:指人们为存储、报道和检索文献的须要,依据所收录文献的外部特征和内容特征对文献进行组织,用于报道、存储和查找文献的工具。包括两大类:文献检索工具:书目、题录、索引、文摘,主要获得文献线索。参考工具书:字词典、百科全书、年鉴、名录、表谱等。检索工具组织所收录文献条目的方法有:字顺法、分类法、主题法、时序法、地序法。(P26)字顺排检法:包括形序排检法、音序排检法。形序排检法是以汉字字形的特点为基础设计的排检方式。包括部首法和笔画笔形法。主题排检法:以规范化的语言(主题词)标引文献中心内容,使论述同一主题的内容集中在一起的一种排检方法。如《Ei》.分类排检法:将词目或文献按其学问内容、学科属性分门别类加以集中的一种排检方法。如《CA》.时序排检法:依据内容或词目的时间先后依次进行编排。多用于年表、历表、大事记及历史纲要等工具书。地序排检法:主要适用于地图集和年鉴工具书。信息检索工具的特点:一般检索工具必需具备四个以下条件:⑴必需具体记录文献的的外部特征和内容特征;⑵必需具有既定的检索标识。如主题词、分类号、著者姓名和文献序名等;⑶必需依据标识的依次,系统地、科学地排列文献,使其成为一个有机的整体;⑷能够供应多种检索途径。信息检索工具的分类(P27)1.依据信息存储手段和载体划分(1)手工检索工具指印刷版的检索工具,靠人的手工操作来排检,用户处理的信息量大。(2)计算机数据库检索工具指用计算机数据库存储和组织大量信息资源,检索时主要利用计算机的强大信息处理实力来进行匹配。(3)网络检索工具指利用网络强大的通信功能,存储和检索互联网上分布式存储的网络信息。并可实现实时沟通,典型的网络检索工具是搜寻引擎。信息检索工具的分类2.依据信息著录特征划分(1)数据事实检索工具包括词典、百科全书、手册、名录、年鉴、指南等类型及其相对应的数据库及网络检索工具。(2)一次文献检索工具(又名全文检索工具)包括检索图书、期刊、报纸、专利文献、标准文献、会议文献、学位论文、科技报告、档案文献等全文的手工检索工具或电子全文数据库(3)二次文献检索工具书上的第三章对数据事实检索工具有具体的介绍对应第三章内容二次文献检索工具定义:通过对一次文献源进行外部特征和内容特征的分析、提取、整理而形成的新的文献形式。是对无序化的一次文献信息进行收集、浓缩、整理形成的有序化的、系统化的产物.包括收录书目、题录、文摘、索引信息的数据库与网络检索工具。书目也称书目,是以整本图书、期刊等作为著录单元,揭示其出版事项或保藏信息的检索工具。定义:是对出版物的外表特征加以揭示与报道并依据确定依次编排而成的工具。其著录内容包括文献名称、著作者、出版发行状况、载体形态等主要事项。书目是以文献的“种”、“本”、“件”为著录单位。功用:在于供应书刊的出版信息、保藏信息,以备订购、选购、宣扬与学习查阅时用。类型:国家书目、馆藏书目、联合书目、书商书目等。国家书目:这是对一个国家出版的全部图书所作的登记统计性书目,如《全国总书目》和《全国新书目》出版社和书商书目:刚好报道图书出版状况的书目。馆藏书目:反映图书馆保藏图书和期刊的状况。可供读者检索。联合书目:是汇合若干个图书馆和信息部门的馆藏信息的书目。

题录定义:是将报刊中论文的篇目依据确定的排检方法编排,供人们查找篇目出处的工具。它依据论文的篇名依次排列,按“篇”报道,作用:快速、定期地把科技文献中最新的重要部分报道出来。尽可能完全地收录全世界出版的有关某一领域的文献以备检索和利用。著录项目包括篇名、著者(或含其所在单位)、来源出处(包括出版物名称、卷(期)、页数、出版年等)。如:《中国社会科学文献题录》《全国报刊索引》TP37⑥多媒体技术与多媒体⑦000512914⑤非专业的多媒体课件制作方法①/刘丽平②(成都纺织高等专科学校电气系)//成都纺织高等专科学校学报③

-2000.1(1)-35-37④全国报刊索引:文摘(Abstract)定义:在题录的基础之上,增加文献信息内容摘要的一类检索工具。又称摘要,是将论文或专著的内容加以浓缩,以最精炼、最概括的文字报道文献主题、方法和结论。一般可以通过文摘可以大致了解全文的重点在哪里,节约查询者的时间,提高了效率。作用:通过对单篇文献的内容作概略、主要的描述来揭示文献信息,精确反映原文的主要论点、观点与思想,是二次检索工具中对一次信息揭示最深化的工具。吸引读者去阅读原文,节约阅读时间。确定原文内容与查找课题的相关程度。举例:浅议低碳经济对我国社会经济的影响

[摘要]:全球气候变暖表面上是环境问题,实质上反映的是能源发展和经济竞争优势地位的问题。为减缓全球气候变暖,最根本的途径在于转变经济增长模式,使能源消费由高碳方式向低碳方式进行转型,这样才能够保证经济社会的长期可持续发展。文摘摘自<浅议低碳经济对我国社会经济的影响>,科技致富向导

,2010年21期,作者:袁冶

摘要索引将有检索意义和特征的检索项摘录出来,并依据计算机可以处理的依次排列,并指引到文献的检索工具。索引可将文献所包含的各种信息,如题名、责任者、主题、人名、地名、词语、引用文献、编号、分子式等,分别摘录出来作为排检标识,注明出处,供读者检索之用。特征:容量小、依据依次排列、计算机可自动处理索引的类型:索引按其标引对象分可分为篇目索引和内容索引;按其取材来源可分为图书索引、报刊索引和其他资料索引。依据音序排列的著者索引示例依据音序排列的关键词索引示例探讨:索引在信息检索中原委有什么作用呢?是确定要有的吗?1,必须要,否则检索系统不能运行;2,可有可无,没什么影响;3,最好要,帮助提高检索速度;4,最好不要,额外增加了计算机存储空间的开销,以及构建索引所须要的人力、物力和财力;书目、题录、文摘、索引的区分(31)(1)从著录项目看书目:包括题名、著者、出版信息、索取号或页码。题录:包括题名、原文出处(刊物名、年卷期)。文摘:包括题名、著者、原文出处、内容摘要。索引:附属于文摘、题录、书目中的帮助性检索工具。(2)从用途看三者作用各不同书目作用:侧重于对图书整体外表特征的揭示。题录作用:侧重于对单篇文献外表特征的揭示。文摘比题录对原文信息的揭示更深化。利用书目可以获得保藏与订购信息,利用文摘可以集中阅读阅读同一专题的大量文献,一般是作为获得全文前的一种筛选相关文献的方法。2.5计算机检索技术计算机检索技术:指检索词的组配技术和检索表达式构成规则。检索表达式:简称检索式,又称为检索提问式.是既能反映检索课题内容,又能为计算机识别的算式,是进行计算机检索的依据。主要运用各种逻辑运算符号、位置逻辑算符、截词符及其它限制符号等,把检索词连接组配起来,确定检索词之间的关系,精确表达检索课题的内容。检索技术包括:布尔逻辑检索技术、截词检索技术、位置检索技术。

2.6常用信息检索技术(一)布尔检索技术指利用布尔逻辑算符将简洁的概念组配成表达困难概念的检索式,用以表达用户的检索需求,计算机将检索式与系统中的记录进行逻辑匹配,并输出结果。常用的布尔逻辑算符有三种:逻辑与、逻辑或和逻辑非*逻辑与(and)

假如有两个概念A和B,AandB则可以检出数据库中同时含有A和B两个概念的全部记录。AandB如下图所示红色部分:同时包含概念A和概念B的信息才算检中。作用:限定检索结果,缩小检索范围,增加检索的专指度,提高信息的查准率。*逻辑或(or)假如有两个概念A和B,AorB则可以检数据库中含有概念A或含有概念B,或者两个概念都含有的记录。AorB如下图所示红色部分:例如:A=教化学家B=哲学家AorB=教化学家+哲学家+(教化哲学家)作用:扩检,提高查全率,防止漏检。*逻辑非(not)假如有两个概念A和B,AnotB则可以检出数据库中含有概念A而不含有概念B的记录。AnotB如下图所示红色部分:例如:A=能源B=核能A-B=不包括核能的能源作用:缩检,解除不须要的信息。增加检索的精确性布尔逻辑检索示例:以中国期刊全文数据库为例,查询在中国人在美国留学的问题(二)截词检索技术截词检索是用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论