信息检索与应用基础知识_第1页
信息检索与应用基础知识_第2页
信息检索与应用基础知识_第3页
信息检索与应用基础知识_第4页
信息检索与应用基础知识_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索与应用根底知识信息检索与应用根底知识信息检索与应用根底知识内容提要第一页,共41页。内容提要第二页,共41页。信息的定义信息:是客观事物存在的方式或运动状态,以及关于客观

存在方式或运动状态的陈述。知识:知识是人们对客观事物存在和运动规律的认识。文献:任何人类的知识用文字、图形、符号、声频、视频

的手段记录下来的东西。统统可称为文献。

文献也可称为固化在一定载体上的知识。第三页,共41页。信息、文献、知识之间的联系第四页,共41页。第五页,共41页。信息检索的定义信息检索〔InformationRetrieval〕广义:将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程和技术。全称“信息存储与检索〞〔InformationStorageandRetrieval〕。狭义:从信息集合中找出所需要的信息的过程。又相当于“信息查寻〞〔InformationSearch〕。第六页,共41页。第七页,共41页。信息级别第八页,共41页。一次信息二次信息三次信息知识产生记录档案学位论文标准科技报告专利说明书会议论文期刊论文专著目录索引文摘传播信息利用述评综述词典年鉴手册百科全书第九页,共41页。内容提要第十页,共41页。信息检索语言的定义信息检索语言:是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,它是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。是一种人工语言。有分类检索语言和主题检索语言两种。第十一页,共41页。分类检索语言〔以?中图法?为例〕中图法五个部类:马克思主义、列宁思想、毛泽东思想;哲学;社会科学;自然科学;综合性图书。22个大类〔一级类目〕采用字母与数字相结合的方式编制第十二页,共41页。建议总结Proposals?中图法?第十三页,共41页。主题检索语言主题检索语言:关键词检索语言和标题词检索语言。关键词检索语言:关键词是指那些出现在文献的标题〔篇名、章节名〕以及摘要、正文中,对表征文献主题内容具有实质检索意义的词,亦即对提醒和描述主题内容来说是重要的、带关键性的可以作为检索“入口〞的那些词。标题词检索语言:标题词是指表征文献内容特征的、经过标准化了的名词术语〔包括词组和短语〕。标题词语言是先组式检索语言,组配固定,不易混乱,标题词表是标题词及其使用规那么的汇编,是一部标题词词典。第十四页,共41页。内容提要第十五页,共41页。信息检索工具信息检索工具是根据某种信息需要而按照一定的规那么组织编制的工具或系统。传统的信息检索工具如字典、百科全书、文摘、书目、索引等,现在流行的检索工具如数据库、搜索引擎、专业性网站等。具备的4个条件:1.对所收录信息的各种特征要有详细的描述;2.每条描述记录都标明有可供检索用的标识;3.全部描述记录科学地组织成一个有机的整体;4.具有多种必要的检索手段。第十六页,共41页。信息检索工具的分类按著录信息特征分第十七页,共41页。目录型检索工具一切可供检索使用的目录均可称为目录型检索工具。它主要报道信息的外表特征,著录具体出版事宜及其收藏信息。常见的目录按其收录范围可以分为国家目录、联合目录、馆藏目录;按报道的范围分为综合性目录和专题性目录。第十八页,共41页。索引型检索工具将信息的外部特征或内部特征(例如题名、著者、主题、分类等)用各种检索语言进展描述,并将它们按照一定的方法组织起来,用户根据查处的线索可以进一步查找原始信息内容的工具。索引与目录的区别在于它不仅能提醒信息的外部特征,还能提醒信息的内部特征。常见的索引有主题索引、分类索引和关键词索引。第十九页,共41页。文摘型检索工具文摘一般由题录和内容摘要两局部组成,它在描述信息外部特征的根底上,还增加有提醒内容特征的摘要局部,是系统地报道、积累和检索信息的主要检索工具,也是传统检索工具的核心。按文摘的目的和用途划分,它可以分为报道性文摘、指示性文摘、报道—指示性文摘和评论性文摘。第二十页,共41页。数据库数据库包括目录、索引、文摘、搜索引擎等工具的内容,但是由于其组织的特殊性,也可以认为是一种检索工具。第二十一页,共41页。参考工具书参考工具书是分析和著录大量具体而常用的科学数据库与事实以备查用的各种常用工具书的总称。其中包括字典、词典、年鉴、百科全书、指南、手册、名录等。第二十二页,共41页。搜索引擎将网络信息分门别类地组织起来,通过搜索网址的方式来实现信息检索的工具就是搜索引擎。它是一种网络检索工具,检索到的既可以是一般的信息线索,也可以是原始信息全文,既可以是一般的文本信息,也可以是多媒体信息。第二十三页,共41页。信息检索工具的分类按收录范围分第二十四页,共41页。综合性检索工具收录的学科范围较广,涉及的信息种类和语种也比较多。例如,美国的?工程索引??Ei?第二十五页,共41页。专业性检索工具收录的学科范围比较窄,仅限于报道某学科或专业的信息,但收录该学科信息的类型比较全。例如,美国的化学学会电子期刊数据库——ACS第二十六页,共41页。单一性检索工具指收录的文献类型比较单一,文献的著录格式也标准、标准。例如?中国专利公报?,就是典型的单一性检索工具,它仅仅收录单一的文献类型——专利文献,著录格式简单标准,易于查找。第二十七页,共41页。内容提要第二十八页,共41页。信息检索途径第二十九页,共41页。内部特征途径分类途径:按学科分类体系来检索文献。主题途径:通过反映文献资料内容的主题词来检索文献。第三十页,共41页。外部特征途径题名途径:题名包括书名、刊名等。著者途径:从著者、编者、译者、专利权人的姓名或机关团体名称字顺进展检索的途径统称为著者途径。引文途径:文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。序号途径:有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。代码途径:利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进展检索。第三十一页,共41页。内容提要第三十二页,共41页。信息检索技术布尔逻辑检索技术:指利用布尔逻辑运算符连接各个检索词,然后由计算机进展相应逻辑运算,以找出所需信息的方法。截词检索技术:截词是指在检索词的适宜位置进展截断,然后使用截词符进展处理,这样既可节省输入的字符数目,又可到达较高的查全率。第三十三页,共41页。布尔逻辑检索技术逻辑与“AND〞和“*〞用"AND"和"*"表示。可用来表示其所连接的两个检索项的穿插局部,也即交集局部。如果用AND连接检索词A和检索词B,那么检索式为:AANDB(或A*B):表示让系统检索同时包含检索词A和检索词B的信息集合C。第三十四页,共41页。布尔逻辑检索技术逻辑或“OR〞和“+〞用"OR"或"+"表示。用于连接并列关系的检索词。用OR连接检索词A和检索词B,那么检索式为:AORB或(A+B)。表示让系统查找含有检索词A、B之一,或同时包括检索词A和检索词B的信息。第三十五页,共41页。布尔逻辑检索技术逻辑非“NOT〞和“–〞用"NOT"或"-"号表示。用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用NOT连接检索词A和检索词B,检索式为:ANOTB(或A-B)。表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。第三十六页,共41页。截词检索技术截词算符在不同的系统中有不同的表达形式,需要说明的是不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词〔即一个截词符只代表一个字符〕和无限截词〔一个截词符可代表多个字符〕。第三十七页,共41页。截词检索技术—无限截词举例前截断:前方一致。如:?computer表示minicomputer,microcomputer等。中截断:中间一致。如?comput?表示minicomputer,microcomputers等后截断:前方一致。如:comput?表示computer,computers,computing等第三十八页,共41页。短语检索技术短语检索又叫“准确检索〞,用双引号“〞表示,要求检索出来的表现形式和输入的表现形式完全一致。一般在以下情况下使用:1、机构名称

2、人名

3、地名

4、专业名称第三十九页,共4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论