




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、群号:群号:回顾:回顾: 信息、知识、情报、文献的概念及关系 文献的种类按文献的载体:印刷型、微缩型、声像型、机读型按文献的加工:零次文献、一次文献、二次文献和三次文献按文献的出版:图书、期刊、报纸、学位论文、会议文献、专利文献、标准文献、科技报告、政府出版物、产品资料在德国柏林大学图书馆的大门上刻着这样的一名言:这把金钥匙就是信息检索方法。现代信息社会,科技信息数量急剧增长,不仅数量庞大,而且增长的速度也令人惊叹!据统计:非科技内容的文献每3050年才增长1倍;科技文献平均每科技文献平均每7 78 8年增长年增长1 1倍;倍;如计算机科学的文献,每如计算机科学的文献,每2 23 3年就翻一番
2、年就翻一番;科技文献内容交叉重复、文献失效加快、文献出版分散等内容交叉重复、文献失效加快、文献出版分散等都给文献的利用带来不便。但是但是,现代信息传播技术的进步,使信息检索,电子原文传递现代信息传播技术的进步,使信息检索,电子原文传递等现代化信息传播方式得以实现,人们可以利用互联网多途径、等现代化信息传播方式得以实现,人们可以利用互联网多途径、多选择、多层次地检索所需文献信息多选择、多层次地检索所需文献信息催生了信息检索技术。催生了信息检索技术。 信息检索的概念及类型信息检索的概念及类型 检索途径与检索语言检索途径与检索语言 检索系统与检索方法检索系统与检索方法 检索步骤与检索策略检索步骤与检
3、索策略 检索技术与检索效果检索技术与检索效果 学习目的学习目的 了解信息检索原理了解信息检索原理 掌握信息检索技术掌握信息检索技术 了解检索步骤了解检索步骤 了解检索效果评价及调整方法了解检索效果评价及调整方法 熟悉检索语言和途径熟悉检索语言和途径一、信息检索的概念一、信息检索的概念1 1、信息检索的含义、信息检索的含义(广义的信息检索)(广义的信息检索)(information storage & information storage & Information Retrieval)全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息
4、的过程。(狭义的信息检索)(狭义的信息检索)(Information Retrieval)为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。2. 2. 信息检索的实质信息检索的实质 信息检索的实质是将描述用户所需信息信息检索的实质是将描述用户所需信息的提问特征,与信息存储的检索标识进行比的提问特征,与信息存储的检索标识进行比较,从中找出与提问特征一致或基本一致的较,从中找出与提问特征一致或基本一致的信息。信息。 信息检索是对信息集合与需求集合的匹信息检索是对信息集合与需求集合的匹配与选择。配与选择。3. 3. 信息存储与信息检索
5、的关系信息存储与信息检索的关系 信息存储与信息检索是密不可分的两个信息存储与信息检索是密不可分的两个过程,同时又是互逆的。存储是为了检索,过程,同时又是互逆的。存储是为了检索,而检索必须先要存储。没有存储检索就无从而检索必须先要存储。没有存储检索就无从谈起。这是存储与检索相辅相成、相互依存谈起。这是存储与检索相辅相成、相互依存的辩证关系。的辩证关系。 原理示意图如下图所示。1. 1. 存储存储的存储过程的存储过程。是把描述“一次文献”特征信息按照检索语言规则,进行规范标引按照检索语言规则,进行规范标引形成“二次文献二次文献”,并存储在“文献检索系统”中,这就是对一次文献组织加工和记录的过程,即
6、建立建立“文献检索系统文献检索系统”2. 2. 检索过程检索过程是读者根据“检索课题”,分析出检索提问词检索提问词与与数据库文献记录中的数据库文献记录中的标引词标引词进行对比,当进行对比,当提问词与标引词匹配一致时,即为命中,检索成提问词与标引词匹配一致时,即为命中,检索成功。功。4. 4. 信息检索的作用信息检索的作用 1) 1) 避免重复研究或走弯路避免重复研究或走弯路 2) 2) 节省学习者的时间节省学习者的时间 3) 3) 是获取新知识的捷径是获取新知识的捷径 二、信息检索的类型二、信息检索的类型 按检索内容可分为:按检索内容可分为:数据信息检索(Data Information Re
7、trieval) 、事实信息检索(Fact Information Retrieval)和文献信息检索(Document Information Retrieval)按组织方式可分为:按组织方式可分为:全文检索(Full-Text Retrieval) 、超文本检索(Hyper-Text Retrieval )和超媒体检索(Hyper-Media Retrieval)按检索手段可分为:按检索手段可分为:有手工检索、机械检索和计算机检索按检索内容或检索目标分 1) 文献型信息检索 文献型信息检索是指利用检索工具或检文献型信息检索是指利用检索工具或检索系统查找文献的过程,索系统查找文献的过程,包括
8、文献线索检索包括文献线索检索和文献全文检索。和文献全文检索。 文献线索检索是指利用检索工具或检索文献线索检索是指利用检索工具或检索系统查找文献的出处,检索结果是文献线索。系统查找文献的出处,检索结果是文献线索。 文献全文检索是以文献所含的全部信息文献全文检索是以文献所含的全部信息作为检索内容,即检索系统存储的是整篇文作为检索内容,即检索系统存储的是整篇文章或整部图书的全部内容。文献全文检索是章或整部图书的全部内容。文献全文检索是当前计算机信息检索的发展方向之一。当前计算机信息检索的发展方向之一。2) 事实型信息检索 事实型信息检索是以特定客观事实为事实型信息检索是以特定客观事实为检索对象,借助
9、于提供事实检索的检索工具检索对象,借助于提供事实检索的检索工具与数据库进行捡索。其检索结果为基本事实。与数据库进行捡索。其检索结果为基本事实。如某个字、词的查找,某一诗词文句的查找,如某个字、词的查找,某一诗词文句的查找,某一年、月、日的查找,某一地名的查找,某一年、月、日的查找,某一地名的查找,某一人物的查找,某一机构的查找某一事某一人物的查找,某一机构的查找某一事件的查找,某一法规制度的查找,某一图像件的查找,某一法规制度的查找,某一图像的查找,某一数据、参数、公式或化学分子的查找,某一数据、参数、公式或化学分子式的查找等。式的查找等。 3) 数据型信息检索 数据型信息检索是一种确定性检索
10、,数据型信息检索是一种确定性检索,是以数值或图表形式表示的数据为检索对象是以数值或图表形式表示的数据为检索对象的信息检索,又称的信息检索,又称“数值检索数值检索”。检索系统。检索系统中存储的是大量的数据,这些数据既包括物中存储的是大量的数据,这些数据既包括物质的各种参数、电话号码、银行账号、观测质的各种参数、电话号码、银行账号、观测数据、统计数据等数字数据,也包括图表、数据、统计数据等数字数据,也包括图表、图谱、市场行情、化学分子式、物质的各种图谱、市场行情、化学分子式、物质的各种特性等非数字数据。特性等非数字数据。按系统中信息的组织方式分 1) 全文检索 指检索系统中存储的是整篇文章乃至指检
11、索系统中存储的是整篇文章乃至整本图书。用户根据个人的需求从中获取有整本图书。用户根据个人的需求从中获取有关的章、节、段、句等信息,并且还可以做关的章、节、段、句等信息,并且还可以做各种统计和分析。各种统计和分析。2) 超文本检索 超文本结构类似于人类的联想记忆结超文本结构类似于人类的联想记忆结构,它采用了一种非线性的网状结构组织块构,它采用了一种非线性的网状结构组织块状信息,没有固定的顺序也不要求读者必状信息,没有固定的顺序也不要求读者必须按照某个顺序来阅读。采用这种网状结构,须按照某个顺序来阅读。采用这种网状结构,各信息块很容易按照信息的原始结构或人们各信息块很容易按照信息的原始结构或人们的
12、的“联想联想”关系加以组织。关系加以组织。3) 超媒体检索 由于把多媒体信息引入超文本里产由于把多媒体信息引入超文本里产生了多媒体超文本,也即超媒体。它是对超生了多媒体超文本,也即超媒体。它是对超文本检索的补充,其存储对象超出了文本范文本检索的补充,其存储对象超出了文本范畴,融入了静态、动态图像及声音等多媒体畴,融入了静态、动态图像及声音等多媒体信息。信息存储结构从单维发展到多维,存信息。信息存储结构从单维发展到多维,存储空间范围不断扩大。储空间范围不断扩大。按检索手段可分为:按检索手段可分为:手工检索:是人直接用手、眼、手工检索:是人直接用手、眼、 脑组织、查找印刷型文献的检索。具有直脑组织
13、、查找印刷型文献的检索。具有直观、灵活、无需各种设备和上机费用的优点。观、灵活、无需各种设备和上机费用的优点。 机械信息检索:机械信息检索:2020世纪世纪5050年代开始年代开始, ,过渡阶段过渡阶段, ,分机电信息检索和光电信息分机电信息检索和光电信息检索。检索。 机电:使用诸如打孔机、验孔机、分类机等机电设备记录二次文献,用机电:使用诸如打孔机、验孔机、分类机等机电设备记录二次文献,用电刷作为检索元件的信息检索系统。电刷作为检索元件的信息检索系统。 光电:使用缩微照相记录二次文献,以胶卷或胶片边缘部分若干黑白小光电:使用缩微照相记录二次文献,以胶卷或胶片边缘部分若干黑白小方块的不同组合做
14、检索标志,利用光电检索元件查找文献的系统。方块的不同组合做检索标志,利用光电检索元件查找文献的系统。计算机检索:将检索提问标识与存储在数据库中的标引标识自动进行比较,计算机检索:将检索提问标识与存储在数据库中的标引标识自动进行比较,含有该标识选出相匹配的信息就会从数据库中并通过计算机输出的过程。含有该标识选出相匹配的信息就会从数据库中并通过计算机输出的过程。第二节第二节 检索途径与检索语言检索途径与检索语言一、检索途径一、检索途径 1. 1. 以文献的外部特征为检索途径以文献的外部特征为检索途径 1) 1) 题名途径题名途径 文献题名是指文献的名称,如图书的书名、期刊文献题名是指文献的名称,如
15、图书的书名、期刊的刊名、报纸的报纸名称、光盘的光盘名称等。它的刊名、报纸的报纸名称、光盘的光盘名称等。它是认识一篇文献的起点。通过题名途径可查找图书、是认识一篇文献的起点。通过题名途径可查找图书、期刊、单篇文献。检索工具中的书名索引、会议名期刊、单篇文献。检索工具中的书名索引、会议名称索引、书目索引、刊名索引等都提供了从题名进称索引、书目索引、刊名索引等都提供了从题名进行文献检索的途径。行文献检索的途径。 2) 2) 著者途径著者途径 文献著者是指对文献内容负有责任的个人或机文献著者是指对文献内容负有责任的个人或机关团体,也就是我们常说的作者、编者、译者等。关团体,也就是我们常说的作者、编者、
16、译者等。著者途径也是人们检索文献经常使用的一条途径,著者途径也是人们检索文献经常使用的一条途径,包含个人著者、团体著者、专利发明人、专利权人、包含个人著者、团体著者、专利发明人、专利权人、合同户、学术会议主办单位等。利用责任者途径检合同户、学术会议主办单位等。利用责任者途径检索文献,主要利用的是作者索引、作者目录、个人索文献,主要利用的是作者索引、作者目录、个人作者索引、团体作者索引、专利权人索引等。作者索引、团体作者索引、专利权人索引等。 3) 代码途径 很多文献因其本身特点有特定序号,如科技报很多文献因其本身特点有特定序号,如科技报告号、专利号、标准号、信息收藏单位的入藏号、告号、专利号、
17、标准号、信息收藏单位的入藏号、ISBNISBN、ISSNISSN等。代码途径就是依据文献信息出版时等。代码途径就是依据文献信息出版时所编的代码顺序来检索文献信息的途径。这些序号所编的代码顺序来检索文献信息的途径。这些序号往往具有唯一性,可以据此识别特定的文献信息。往往具有唯一性,可以据此识别特定的文献信息。依据这些序号数字顺序可编制序号索引,提供序号依据这些序号数字顺序可编制序号索引,提供序号检索途径。同时,许多检索系统利用事物本身具有检索途径。同时,许多检索系统利用事物本身具有的某种符号代码编制成分子式、元素符号、结构式的某种符号代码编制成分子式、元素符号、结构式等索引,提供从特定符号代码顺
18、序进行检索的途径,等索引,提供从特定符号代码顺序进行检索的途径,如化合物索引。如化合物索引。2. 以文献的内容特征为检索途径 1) 分类途径 分类途径是以课题的学科属性为出发点,分类途径是以课题的学科属性为出发点,按学科分类体系来查找文献信息,以分类作按学科分类体系来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、分为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来查找类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献信息。有关某一学科或相关学科领域的文献信息。它能满足族性检索的需求。它能满足族性检索的需求。 2) 主题途径 主题途径是利用信
19、息的主题内容进行检主题途径是利用信息的主题内容进行检索的途径,即利用从自然语言中抽象出来的,索的途径,即利用从自然语言中抽象出来的,或者经过人工规范化的、能够代表信息内容或者经过人工规范化的、能够代表信息内容的标引词来检索。它冲破了按学科分类的束的标引词来检索。它冲破了按学科分类的束缚,使分散在各个学科领域里的有关同一课缚,使分散在各个学科领域里的有关同一课题的信息集中于同一主题,使用时就如同查题的信息集中于同一主题,使用时就如同查字典一样方便和快捷。其最大优点是把同性字典一样方便和快捷。其最大优点是把同性质的事物集中于一处,使用户在检索时便于质的事物集中于一处,使用户在检索时便于选取,而且将
20、同类事物集中在一起的方法符选取,而且将同类事物集中在一起的方法符合人们的工作和生活习惯,直接而准确。合人们的工作和生活习惯,直接而准确。 二、检索语言 1. 检索语言的含义 检索语言是根据信息检索的需要而创造的专供信检索语言是根据信息检索的需要而创造的专供信息存储和信息检索使用的一种人工语言。息存储和信息检索使用的一种人工语言。 检索语言是在文献信息检索过程中使用的特定语检索语言是在文献信息检索过程中使用的特定语言形式,它的作用在于促成信息检索系统与检索用言形式,它的作用在于促成信息检索系统与检索用户的沟通。户的沟通。 u当存储信息时,当存储信息时,检索系统对文献内容进检索系统对文献内容进行分
21、析,概括分析出若干能代表文献内行分析,概括分析出若干能代表文献内容的语词并赋于一定的标识,如题名、容的语词并赋于一定的标识,如题名、作者、主题词等,作为存储与检索的依作者、主题词等,作为存储与检索的依据,然后纳入到数据库中。据,然后纳入到数据库中。u当检索信息时,当检索信息时,检索人员首先要对检索检索人员首先要对检索课题进行分析,同样形成若干能代表信课题进行分析,同样形成若干能代表信息需求的语词,然后通过检索系统在数息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,据库中匹配具有同样语词和标识的文献,找到自己所需的信息找到自己所需的信息。2. 检索语言的类型 1)描述文献外
22、部特征的语言 (1 1)题名语言)题名语言 (2 2)著者语言)著者语言 (3 3)代码语言)代码语言 (1 1)分类语言)分类语言按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。使用这种检索语言建立的信息进行标识的一种语言体系,也称分类法。使用这种检索语言建立的信息检索系统可以反映知识的从属、派生、重合、交叉、并列等关系,用户检索系统可以反映知识的从属、派生、重合、交叉、并列等关系,用户因此可以鸟瞰全貌、触类旁通,系统地掌握和利用一个学科或专业范围因此可以鸟瞰全貌、触类旁通,系统地
23、掌握和利用一个学科或专业范围的知识相信息。的知识相信息。 分类语言是用分类号表达学科体系的各种概念,将各种概念按学科性质分类语言是用分类号表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。进行分类和系统排列。2 2)描述文献内部特征的语言)描述文献内部特征的语言例:例:中国图书馆分类法 中国科学院图书馆图书分类法中国人民大学图书馆图书分类法杜威十进分类法DDC国会图书馆分类法LCC(2 2)主题语言)主题语言 主题主题“是一组具有共性事物的总称,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问用以表达文献所论述和研究的具体对象和问题题”,即文献的,即文献的“中心内
24、容中心内容”。每种文献都。每种文献都包含着若干主题,研究或阐述一个或多个问包含着若干主题,研究或阐述一个或多个问题。主题词就是表达主题概念的词汇。题。主题词就是表达主题概念的词汇。 人工语言人工语言自然语言自然语言标引工作量大标引工作量大自动标引完成自动标引完成需要不断维护,管理成需要不断维护,管理成本高本高灵活、检索入口多、灵活、检索入口多、管理和维护成本低管理和维护成本低用户不易掌握用户不易掌握用户易掌握,但不易用户易掌握,但不易精确精确查全率不高查全率不高查准率不高查准率不高第三节 检索系统与检索方法一、检索系统 1. 检索系统的概念 信息检索系统是为满足信息用户的检索需求而建立起信息检
25、索系统是为满足信息用户的检索需求而建立起来的、以提供信息检索为目的的信息存储与检索系统。来的、以提供信息检索为目的的信息存储与检索系统。 可以说,一个信息检索系统便是一定范围文献、信息可以说,一个信息检索系统便是一定范围文献、信息的全部记录的有序集合。的全部记录的有序集合。2. 检索系统的类型 (1) (1) 按加工手段和技术设备的不同,可将检索系按加工手段和技术设备的不同,可将检索系统分为:手工检索系统、机械检索系统、计算机检统分为:手工检索系统、机械检索系统、计算机检索系统。索系统。 (2) (2) 按载体形式不同,可分为卡片式、书本式、按载体形式不同,可分为卡片式、书本式、缩微式、磁性材
26、料式等检索系统。缩微式、磁性材料式等检索系统。 (3) (3) 按著录格式不同,可将检索系统分为目录、按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索系统。题录、文摘、索引、全文检索系统。二、检索方法 1. 常用法 常用法是利用检索工具查找信息的一种方法,常用法是利用检索工具查找信息的一种方法,因为这种方法是目前查找信息中最常使用的,故亦因为这种方法是目前查找信息中最常使用的,故亦称常用法。称常用法。 (1) (1) 顺查法顺查法 (2) (2) 倒查法倒查法 (3) (3) 抽查法抽查法 (1) (1) 顺查法顺查法 是指按年代由远及近的顺序进行查找的是指按年代由远及近的顺序
27、进行查找的方法,如检索方法,如检索“电视文化电视文化”这一课题,首先这一课题,首先要弄清起始时间,即要弄清起始时间,即“电视文化电视文化”产生的时产生的时间是哪一年,然后从这一年开始查起,一直间是哪一年,然后从这一年开始查起,一直查到当前查到当前“电视文化电视文化”方面的相关信息为止。方面的相关信息为止。这样,这样,“电视文化电视文化”课题就检索完毕。这种课题就检索完毕。这种方法的查全率和查准率都较高,但是检索整方法的查全率和查准率都较高,但是检索整个课题较费时费力。个课题较费时费力。 (2) (2) 倒查法倒查法 是指按年代由近及远的逆时间查找方法,是指按年代由近及远的逆时间查找方法,这种方
28、法多用于新课题、新观点、新理论、这种方法多用于新课题、新观点、新理论、新技术的检索,检索的重点在近期信息上,新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。使用这种方只需查到基本满足需要时为止。使用这种方法可以最快地获得新资料,而且近期资料总法可以最快地获得新资料,而且近期资料总是既概括、引用前期的成果,又反映最新的是既概括、引用前期的成果,又反映最新的水平和动向,因此这种方法比较省力,但查水平和动向,因此这种方法比较省力,但查全率不高。全率不高。 (3) (3) 抽查法抽查法 是一种针对学科发展特点,抓住该学科是一种针对学科发展特点,抓住该学科发展迅速、信息发表较多的年代发
29、展迅速、信息发表较多的年代( (信息的高峰信息的高峰期期) ),抽出一段时间,抽出一段时间( (几年或十几年几年或十几年) ),再进行,再进行逐年检索的方法。这种方法费时较少,获得逐年检索的方法。这种方法费时较少,获得信息较多,检索效率较高。但是这种方法的信息较多,检索效率较高。但是这种方法的成功率和有效率必须建立在熟悉学科发展特成功率和有效率必须建立在熟悉学科发展特点的基础上。也就是说,只有对该学科或课点的基础上。也就是说,只有对该学科或课题的发展熟悉的情况下,才适合使用。题的发展熟悉的情况下,才适合使用。2. 追溯法 追溯法是一种跟踪查找的方法,即以文追溯法是一种跟踪查找的方法,即以文献后
30、面所附的参考文献为线索,逐一追溯查献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。找相关文献的方法。3. 循环法 循环法是常用法和追溯法的结合,检循环法是常用法和追溯法的结合,检索时,先利用检索工具查出一批文献,然后索时,先利用检索工具查出一批文献,然后选择出与检索课题针对性较强的文献,再按选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,检索线索,分期分段地交替进行,循环下去,直到满意为止。直到满意为止。4. 检索方法的选择原则 (1) (1) 检索条件检索条件 (2) (2) 检
31、索要求检索要求 (3) (3) 学科特点学科特点 第四节第四节 检索技术与检索效果检索技术与检索效果一、常用检索技术 1. 布尔逻辑检索 1) 逻辑与“AND” 逻辑与(逻辑与(ANDAND或或“”)是反映概念之间)是反映概念之间交叉和限定关系的一种组配方式,用以缩小交叉和限定关系的一种组配方式,用以缩小检索范围,减少输出结果,提高查准率。检索范围,减少输出结果,提高查准率。 A AND B A AND B表示同时含有表示同时含有A A、B B两检索项两检索项的才为检索结果的才为检索结果 2) 逻辑或“OR” 逻辑或(逻辑或(OROR或或“+”+”)是反映概念之间)是反映概念之间并列关系的一种
32、组配方式,使用它相当于增并列关系的一种组配方式,使用它相当于增加检索词主题的同义词与近义词,可扩大检加检索词主题的同义词与近义词,可扩大检索范围、增加输出结果,提高查全率。索范围、增加输出结果,提高查全率。 A OR B A OR B表示文献信息中凡含有检索表示文献信息中凡含有检索词词A A或者检索词或者检索词B B或者同时含有检索词或者同时含有检索词A A和和B B的的即为命中结果即为命中结果 3) 逻辑非“NOT” 逻辑非(逻辑非(NOTNOT或或“”)可以用来排除)可以用来排除不希望出现的检索词,它与逻辑与不希望出现的检索词,它与逻辑与“AND”AND”的的作用类似,能够缩小命中信息的范
33、围,提高作用类似,能够缩小命中信息的范围,提高检索的查准率。检索的查准率。 A NOT B A NOT B用于从包含用于从包含A A的文献信息范的文献信息范围中减去含有围中减去含有B B的内容的内容布尔逻辑检索布尔逻辑检索: 即运用布尔逻辑算符对检索词进行逻辑组配即运用布尔逻辑算符对检索词进行逻辑组配,表达表达两个概念之间的逻辑关系两个概念之间的逻辑关系 ,有三种,有三种:布尔逻辑用在何处?布尔逻辑用在何处?布尔逻辑用在何处?布尔逻辑用在何处?布尔逻辑检索词之间的逻辑关系?检索词之间的逻辑关系?布尔逻辑布尔逻辑And, or, notCNK高级检索界面高级检索界面EBSCO高级检索界面高级检索
34、界面AB4.4.) 布尔逻辑算符的运算及次序布尔逻辑算符的运算及次序 ,如:如:car and industry ,检中结果中必须检中结果中必须同时含同时含有有 car 和和 industry 才符合要求。才符合要求。运算符为运算符为AndAnd、* *、& &表示;检索时表示;检索时, ,命中信息同时含有两个概念命中信息同时含有两个概念, ,专指专指性强性强. .可以缩小检索范围可以缩小检索范围, ,提高查准率。提高查准率。 如:如:college or university ,检中结果中检中结果中 含有含有 college 或或 university 任一个就符合检索要求任
35、一个就符合检索要求. .运算符为运算符为 Or Or 、或、或“+ +”表示。检索时,命中信息包含所有关于逻辑表示。检索时,命中信息包含所有关于逻辑A A或逻辑或逻辑B B或同时有或同时有A A和和B B的,可以扩大检索范围,提高查全率。的,可以扩大检索范围,提高查全率。如如 television not cable, 检中结果中检中结果中出现出现 television 但不能出现但不能出现 cable 电缆电缆.运算符(运算符( Not Not 、或、或“- -”表示,命中信息包含逻辑表示,命中信息包含逻辑A A,不包含逻辑,不包含逻辑B,B, 可以排除不必要的信息,提高查准率。可以排除不必
36、要的信息,提高查准率。4.4.优先级运算优先级运算:(:( ) Not And Or (EBSCO 规则)规则) 2、截词检索、截词检索在西文数据库中广泛用。在西文数据库中广泛用。截词检索是用截断词的一个局部进行的检索,凡是满足这个截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符截词所有字符( (串串) )的记录,系统都为命中。的记录,系统都为命中。 * *、?、?均可以均可以 表示截词的截断符号,各检索系统有不同的表示截词的截断符号,各检索系统有不同的规定,没有统一标准。规定,没有统一标准。分为:分为:有限截词有限截词即一个截词符只代表一个字符;即一个截词符只代表一个字符;无
37、限截词无限截词即即一个截词符可代表多个字符。一个截词符可代表多个字符。按截词的位置划分为:按截词的位置划分为: 前截、中截、后截:前截、中截、后截:前截断(后方一致):又称左截断,前截断(后方一致):又称左截断,截词符在词的左边,例截词符在词的左边,例将截词符将截词符“* *”置于词干的左边。置于词干的左边。 如:如:* *computer,其含义为:其含义为:computer、microcomputers等词皆为命中词。等词皆为命中词。中截断中截断(通配符或屏蔽通配符或屏蔽)是把截断符号置于一个检索词的中间,是把截断符号置于一个检索词的中间,“?” 只替代一个字符,只替代一个字符, (EBS
38、CO规则)规则)例如:输入例如:输入ne?t,可检索出,可检索出neat, nest,next 。后截断是前方一致检索,又称右截断,后截断是前方一致检索,又称右截断,截词符放在被截词的右截词符放在被截词的右边,是最常用的检索技术边,是最常用的检索技术,例如:,例如:“*” 可以替代一个以上字符串,(可以替代一个以上字符串,(EBSCO规则)规则)例如:输入例如:输入comput* * ,可检出,可检出computer,computing 等等。等等。限制截断:限制截断:是在检索词词干后面加若干个截词符,表示限制是在检索词词干后面加若干个截词符,表示限制可变化的字符数。可变化的字符数。例:例:e
39、ducat* 相当于相当于educated 教育,教育,Educator 教育家,教育家,根据截断的数量不同可分为:根据截断的数量不同可分为:无限截断:不限制被截断的字符数量;无限截断:不限制被截断的字符数量;有限截断:限制被截断的字符数量,有限截断:限制被截断的字符数量,例如例如educat*,可以检索,可以检索educator,educated。各检索系统有不同的规定,没有统一标准各检索系统有不同的规定,没有统一标准。使用时要注意看使用时要注意看3. 限制检索 1) 检索系统中的限制检索 在检索系统中,使用缩小和限定检索范在检索系统中,使用缩小和限定检索范围的方法称为限制检索。限定检索条件
40、多种围的方法称为限制检索。限定检索条件多种多样,主要和常用的是字段限制。多样,主要和常用的是字段限制。 其中,主题字段如题名(其中,主题字段如题名(TitleTitle)、叙)、叙词(词(DescriptorDescriptor)、标识词()、标识词(IdentifierIdentifier)、)、文摘(文摘(AbstractAbstract)等;非主题字段如作者)等;非主题字段如作者(AuthorAuthor)、文献类型()、文献类型(Document TypeDocument Type)、)、语种(语种(LanguageLanguage)、出版年份()、出版年份(Publication P
41、ublication YearYear)等。)等。 2) 搜索引擎中的限制检索 搜索引擎中的字段检索多表现为前缀符搜索引擎中的字段检索多表现为前缀符限制形式,其中,表示内容特征的主题字段限制形式,其中,表示内容特征的主题字段有有TitleTitle,KeywordsKeywords,SubjectSubject,SummarySummary等;等;表示外部特征的非主题字段限制有表示外部特征的非主题字段限制有imageimage,texttext,appletapplet等;此外,搜索引擎还提供了等;此外,搜索引擎还提供了带有典型网络检索特征的字段限制类型。带有典型网络检索特征的字段限制类型。
42、限定字段检索限定字段检索是指在是指在限定的字段范围检索限定的字段范围检索 (range searching) ,达到优化检索结,达到优化检索结果的方法。特别在使用自由词进行全文检索时,需要用字段限制检果的方法。特别在使用自由词进行全文检索时,需要用字段限制检索的范围。被指定的字段也称检索入口,检索时,系统只对指定字索的范围。被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率,字段检索常用代码来表示,段进行匹配运算,提高了效率和查准率,字段检索常用代码来表示,常用的字段代码如下表常用的字段代码如下表 所示:所示:检索字段检索字段检索入口检索入口检索途径检索途径位置
43、检索位置检索位置算符检索在西文数据库中广泛使用,能提高检索的准确性位置算符检索在西文数据库中广泛使用,能提高检索的准确性,当要求两个检索词在记录中位置当要求两个检索词在记录中位置相邻相邻/ /相连相连时,可使用位置算符。时,可使用位置算符。下面介绍几种数据库经常使用的位置运算符:下面介绍几种数据库经常使用的位置运算符:1.W - WithW W 算符是算符是WithWith的缩写,表示在此算符两侧的检索词必须按输入时的前两侧的检索词必须按输入时的前后顺序排列,不能颠倒。后顺序排列,不能颠倒。例:例:intelligent (W) robot? (智能机器人智能机器人 ) (Ei Compend
44、ex Plus)Wn( 或或nW) 表示在此算符表示在此算符两侧的检索词必须按输入时的前后顺序排列,两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入不能颠倒。但允许在连接的两个词之间最多插入n n个单元词个单元词。 例:例:intelligent w1 robot* (OCLC FirstSearch) 2. N NearN算符是算符是Near的缩写,表示此算符的缩写,表示此算符两侧的检索词必须紧密相连,所连两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。例:例: i
45、ntelligent Near robot* ( Ei CPX Web)算符算符作用作用表达式表达式检索结果检索结果W、W/N、WITH两词相邻,两词相邻,词语词语出现次序固定出现次序固定Education(w)schoolEducation WITH schoolEducation schoolEducation schoolsnW两词相邻,按顺两词相邻,按顺序排列,词间可序排列,词间可插入插入n个词个词Education(1w)schoolEducation schoolEducation schoolsEducation and music schoolPRE两词相邻两词相邻,词语词语出
46、现次序固定出现次序固定Education PRE schoolEducation schoolEducation schools算符算符作用作用表达式表达式检索结果检索结果N、NEAR、ADJ两词相邻,顺两词相邻,顺序可颠倒序可颠倒Education(N)schoolEducation NEAR schoolEducation schoolEducation schoolsSchool of educationnN两词相邻,顺两词相邻,顺序可颠倒序可颠倒,两词两词间可插入间可插入n个个词词Education (1N) schoolEducation schoolSchool of educat
47、ionSchool of music and educationF两词同在一个两词同在一个字段中字段中Education (F) schoolSAME两词同在一个段两词同在一个段落中落中Education SAME school3 3)文献检索新分法)文献检索新分法目前信息检索类型出现一种新的三分法:即文本检索、数值检目前信息检索类型出现一种新的三分法:即文本检索、数值检索、声频与视频检索。索、声频与视频检索。1. 1. 文本检索文本检索文本检索文本检索(Text Retrieval)是文献信息检索的一部分,是指是文献信息检索的一部分,是指根据文本内容,如关键字、语意等对文本集合进行检索、分类
48、、根据文本内容,如关键字、语意等对文本集合进行检索、分类、过滤等。过滤等。如:如:.DOC.DOC、.PDF.PDF、.PPT.PPT、.XLS.XLS、.TXT.TXT等等格式。格式。2. 2. 数值(数据)检索数值(数据)检索狭义的数值检索仅指从某数据集合中查出所需要的数据。狭义的数值检索仅指从某数据集合中查出所需要的数据。回答:回答:“世界上最长的铁路大桥有多长?世界上最长的铁路大桥有多长?”之类的问题。之类的问题。3. 3. 事实检索事实检索事实检索是以文献中抽取的事项为检索内容的检索,或称事实检索是以文献中抽取的事项为检索内容的检索,或称“事事项检索项检索”。回答:回答:“世界上最长
49、的铁路大桥是哪一条?世界上最长的铁路大桥是哪一条?”之类的问题。之类的问题。4. 4. 声频与视频检索声频与视频检索1 1)对于音频信息来说,其基于内容检索的主要类型有:)对于音频信息来说,其基于内容检索的主要类型有: 语音检索; 音乐检索; 其他音频检索。2 2)其基于内容检索的主要类型有:)其基于内容检索的主要类型有: 基于颜色特征的检索; 基于形状特征的检索; 基于纹理特征的检索; 忌与视频动态特征的检索; 其他检索,二、检索效果 1. 检索效果评价 1) 检索效果评价的指标 检索效果是指检索系统检索信息的有检索效果是指检索系统检索信息的有效程度,反映了检索系统的检索能力。效程度,反映了
50、检索系统的检索能力。 (1) (1) 质量标准质量标准 (2) (2) 费用标准费用标准 (3) (3) 时间标准时间标准1) 检索效果评价的指标表2.2 检索效果评价22表 a检出的相关文献量;检出的相关文献量; c未检出的相关文献量;未检出的相关文献量; ac系统相关文献总量。系统相关文献总量。b检出的非相关文献量;检出的非相关文献量;ab检出的文献总量;检出的文献总量;d未检出的非相关文献量未检出的非相关文献量2) 查全率和查准率 (1) 查全率 查全率是指检索出的相关信息量与系统查全率是指检索出的相关信息量与系统中的相关信息总量之比。中的相关信息总量之比。 (2) 查准率 查准率是指检
51、索出的相关信息量与检索查准率是指检索出的相关信息量与检索出的信息总量之比。出的信息总量之比。2. 检索效果优化 (1) (1) 提高检索系统的质量提高检索系统的质量 (2) (2) 提高用户利用检索系统的能力提高用户利用检索系统的能力 (3) (3) 制定优化的检索策略制定优化的检索策略 (3) (3) 制定优化的检索策略制定优化的检索策略 提高查全率的方法提高查全率的方法 为了提高查全率,往往通过采用提高为了提高查全率,往往通过采用提高检索词的泛指度,选全同义词、近义词,多检索词的泛指度,选全同义词、近义词,多用截词符;减少使用逻辑用截词符;减少使用逻辑“与与”、逻辑、逻辑“非非”运算符,增
52、加使用逻辑运算符,增加使用逻辑“或或”运算符;取消运算符;取消某些限制符,在多字段或全文中检索;采用某些限制符,在多字段或全文中检索;采用分类号检索等多种方法。分类号检索等多种方法。 (3) (3) 制定优化的检索策略制定优化的检索策略 提高查准率的方法提高查准率的方法 为了提高查准率,往往通过采用提高为了提高查准率,往往通过采用提高检索词的专指度,增加或者使用下位词及专检索词的专指度,增加或者使用下位词及专指性较强的自由词,少用截词符;增加使用指性较强的自由词,少用截词符;增加使用逻辑逻辑“与与”、逻辑、逻辑“非非”运算符,减少逻辑运算符,减少逻辑“或或”运算符;多用限制符或限制字段;用运算
53、符;多用限制符或限制字段;用文献的外部特征限制等多种方法。文献的外部特征限制等多种方法。 第五节第五节 检索步骤与检索策略检索步骤与检索策略一、检索步骤 1 1分析检索课题分析检索课题 2 2选择检索系统选择检索系统 3 3确定检索途径和检索方法确定检索途径和检索方法 4 4构建检索式构建检索式 5 5检索并调整检索策略检索并调整检索策略 6 6获取原文获取原文在进行资料检索之前,必须分析研究课题,制定检索需求描在进行资料检索之前,必须分析研究课题,制定检索需求描述,索取原始文献,学习了解新知识,调整检索策略。述,索取原始文献,学习了解新知识,调整检索策略。第一步、分析检索课题第一步、分析检索
54、课题1. 分析检索课题,明确以下问题:分析检索课题,明确以下问题: 分析课题分析课题:课题的主要内容以及所涉及的知识点?课题的主要内容以及所涉及的知识点? 明确需要的文献特征:明确需要的文献特征:即需要的文献种类,语种,年代以即需要的文献种类,语种,年代以及文献量?及文献量? 明确查询的侧重点:明确查询的侧重点:对查新,查准,查全的指标要求?对查新,查准,查全的指标要求? 确定所需的文献应该具备的外部特征?确定所需的文献应该具备的外部特征? 确定所需的文献应该具备的内部特征确定所需的文献应该具备的内部特征?一般课题检索分析一般课题检索分析(1 1)是找具体问题的准确答案?)是找具体问题的准确答
55、案?使用目的是解决问题,或作为论据和引证。查找事实或数值使用目的是解决问题,或作为论据和引证。查找事实或数值型信息大多属于此类。型信息大多属于此类。(2 2)是查找特定文献?)是查找特定文献?根据某一篇文献的线索查找原文;根据某一篇文献的线索查找原文;或报考某导师的研究生,查询其所有发表的文章。或报考某导师的研究生,查询其所有发表的文章。对这种检索课题、类型很简单,只要正确选择了检索工具和对这种检索课题、类型很简单,只要正确选择了检索工具和参考资源,便可以一步到位查到所需要的信息,很快地达到参考资源,便可以一步到位查到所需要的信息,很快地达到检索目的。检索目的。(3 3)是对某一问题的大致了解
56、?)是对某一问题的大致了解?对于这种类型的检索课题,只需要浏览一些简短的摘要或者对于这种类型的检索课题,只需要浏览一些简短的摘要或者参考几篇概论性文章就可以了。参考几篇概论性文章就可以了。有的课题则需要搜集各种翔实、深入的信息,才能圆满完成。有的课题则需要搜集各种翔实、深入的信息,才能圆满完成。研究课题检索分析研究课题检索分析研究课题通常是学术水平较高,专业较深的课题研究课题通常是学术水平较高,专业较深的课题.撰写综述、研究报告撰写综述、研究报告查全查全撰写综述或研究报告,讲求系统全面,必须以时间为轴做纵向、深撰写综述或研究报告,讲求系统全面,必须以时间为轴做纵向、深度的考察。对课题做全面的调
57、查研究,了解整个发展过程。度的考察。对课题做全面的调查研究,了解整个发展过程。包括书包括书籍、期刊、报纸、报告、政府出版物。籍、期刊、报纸、报告、政府出版物。撰写研究报告、学术论文撰写研究报告、学术论文查准查准撰写研究报告、学术论文,需要在具体细微的专业问题做深入的专撰写研究报告、学术论文,需要在具体细微的专业问题做深入的专题研究,在充分掌握材料和该领域重要研究成果的基础上,提出创题研究,在充分掌握材料和该领域重要研究成果的基础上,提出创新性的观点或论断,这是基本要求。新性的观点或论断,这是基本要求。做新技术、新理论的研究做新技术、新理论的研究动态动态在做新技术、新理论的研究时,需要查阅某一专
58、题的最前沿和最新在做新技术、新理论的研究时,需要查阅某一专题的最前沿和最新资料,了解研究动态、发展趋势。资料,了解研究动态、发展趋势。做同类研究项目比较做同类研究项目比较查新查新在做同类研究项目比较时,或做创新性的课题项目、研究成果或要在做同类研究项目比较时,或做创新性的课题项目、研究成果或要求较高的学位论文,求较高的学位论文,必须保证取材的数量和学术质量达到一定的深必须保证取材的数量和学术质量达到一定的深度和广度,重点参考各种学术品质较高的期刊论文、会议论文、研度和广度,重点参考各种学术品质较高的期刊论文、会议论文、研究报告、学位论文、重要专著等;究报告、学位论文、重要专著等;明确课题明确课
59、题对文献的需求量?对文献的需求量?在确定了检索课题的类型之后,在此基础上,还要在确定了检索课题的类型之后,在此基础上,还要考虑下面几个问题:考虑下面几个问题:(1)该课题需要的)该课题需要的文献量?文献量?(2)该课题查检文献的)该课题查检文献的广度与深度如何?广度与深度如何?(3)该课题对)该课题对时效性时效性有什么要求?有什么要求?(4)该课题对文献资料的数据类型是否有所限定或)该课题对文献资料的数据类型是否有所限定或侧重?侧重?第二步、选择检索工具或数据库第二步、选择检索工具或数据库目前,常用文献类型及选择检索的数据库如下:目前,常用文献类型及选择检索的数据库如下:1. 1. 数字图书馆
60、数字图书馆(1)超星数字图书馆:)超星数字图书馆:http:/ http:/ 2. 数字期刊、特种文献数字期刊、特种文献(1)读秀学术搜索:)读秀学术搜索:http:/ EBSCOhost http:/ 确定检索途径确定检索途径1. 1. 以文献的以文献的内容特征内容特征为检索途径为检索途径分类检索途径:分类检索途径:是是从学科分类角度来查找文献的一种途径。从学科分类角度来查找文献的一种途径。 特点:族性检索,特点:族性检索,会检索到一批相关文献。会检索到一批相关文献。主题检索途径:主题检索途径:是从是从文献主题内容角度来检索文献的一种途径。文献主题内容角度来检索文献的一种途径。 特点:特性检索,特点:特性检索,适合比较具体专深
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国桨叶项目投资可行性研究分析报告
- 2025年高档涂白卡纸项目可行性研究报告
- 对外汉语口语教学中的纠错技巧
- 2025年双层全塑钢双桶洗衣机行业深度研究分析报告
- 中国五矿化工产品行业市场前景预测及投资价值评估分析报告
- 中国分散剂DC项目投资可行性研究报告
- 单频超声波处理机行业深度研究报告
- 2023-2029年中国甘草行业市场深度评估及投资战略规划报告
- 2025年中国空气冷却式冷凝器行业市场前瞻与投资战略规划分析报告
- 2025年人造石英晶体项目可行性研究报告
- 《米酒的酿造过程》课件
- 2024手机摄影课ppt课件完整版
- 医院班子成员考核方案
- 2024年九省联考安徽省新高考历史试卷(含答案)
- 汽车维修保养协议书
- HG T 3690-2022 工业用钢骨架聚乙烯塑料复合管
- 单色版画课件
- 《现代教育技术》教案-第一章 教育技术概述
- 《理想信念的内涵及重要性》教学教案
- 北师大版五年级下册数学早读课所背知识点
- 三位数除以一位数(商为三位数)练习题含答案
评论
0/150
提交评论