计算机信息检索重点_第1页
计算机信息检索重点_第2页
计算机信息检索重点_第3页
计算机信息检索重点_第4页
计算机信息检索重点_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号•一般指原始,未处理过的数据。信息(Information):1。物质存在的一种方式。一般指数据、消息中所包含的意义.可以使消息中所描述的事件的不定性减少。2.是事物运动的状态与方式的反映。知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。提供某种经过思考的判断和某种实验的结果.(信息是知识的原材料,知识是信息加工的抽象化产物.)情报(Information):钱学森:“情报是活化了的、激活了的知识”。可以理解为是指传递着的有特定效用的知识或信息。三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体.三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。)、知识(反映了文献的信息内容.)、记录(信息的一种人工编码,通过人工、机械以资料内容仅供您学习参考,如有不当之处,请联系改正或者删除及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-—--—手工检索,缩微时期-—--—缩微检索,20世纪90年代后期,光盘时期-—--—单机检索,网络初期-——--联机检索21世纪,网络兴盛—--——网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。二、信息检索的类型(一、)以检索内容划分(重点)文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息2。 数据信息检索(DataRetrieval)凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息.事实信息检索(FactRetrieval)凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。(二、)以信息存储和检索的方式和技术划分(掌握)1。 手工检索(ManualRetrieval)手工检索简称“手检",是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书.检索过程是由人工以手工的方式完成的.2。 计算机检索(Computer—basedRetrieval)计算机检索简称“机检”资料内容仅供您学习参考,如有不当之处,请联系改正或者删除,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机的协同作用下完成的.三、信息检索的意义(重点)(会用自己的语言表达)1。避免重复研究或走弯路—科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。节省研究人员的时间3。是获取新知识的捷径一、检索工具的定义(了解)用来揭示、存储和查找信息的工具,主要指手工检索工具。2。检索系统则是由一定的检索设备(如计算机)和经过加工整理并存储在相应载体(如磁带、磁盘等)上的信息集合及其他设备共同构成的一种具有存储和检索功能的信息服务系统。二、检索工具的类型(了解)目录目录款目索引索引款目文摘1、目录综合性目录:是以各个学科门类的图书或者报刊文献为揭示对象的目录。如《全国总书目》、《中国国家书目》、《中国报纸名录》、《中国期刊名录》等。(1)专题目录(2)馆藏目录(3)联合目录2、 索引(Index)(1)索引是指将信息中所包含的主题词、分类号、著者姓名、论文题名等内容摘录出来,并注明它们所在图书、期刊或检索工具中的位置,然后按照一定的规则编排组织起来所形成的检索工具。如《工程索引》(Ei)的“主题索引"、“著者索引"等。⑵索引条目至少有两个著录项目:标目(标识Heading)和存储地址,有时候可能还会有说明语.主题索引、著者索引是最常用的索引。3、 文摘(Abstract)(1) 文摘就是对一份文献的内容所进行的简略而准确的描述。通俗地讲,文摘就是原始文献的内容摘要。它是将论文或书籍的主要论点、数据和结论等信息简明扼要地摘录出来,注明出处,并按一定方式编排的一种文献检索和阅读工具。它是检索工具的主体,二次信息的核心。美国的《工程索引》(Ei)和英国的《科学文摘》(SA)等均属此类检索工具。(2) 文摘通常以一个内容上独立的文献单元(如期刊中的一篇论文、会议录中的一篇会议论文或一种图书)为基本著录单位(见第五章《工程索引》文摘款目的样页)。它和目录的主要区别在于:资料内容仅供您学习参考,如有不当之处,请联系改正或者删除目录以单位出版物为著录对象,而文摘的著录对象可以是一个单位出版物,也可以是单位出版物的个别内容;目录反映的是文献的外部特征,而文摘既反映文献的外部特征,又反映文献的内容特征.三、信息检索的方法(掌握):1、常规法2、追溯法3、交替法(一) 常规法:常规法就是利用检索工具查找信息的方法,因在信息检索中经常使用而得名。它又分为顺查法、倒查法及抽查法三种。顺查法一顺查法即是利用检索工具、根据课题研究的起始年代由远及近逐年查找信息的方法。顺查法比较费时间,但由于是逐年查找,因而有较高的查全率。倒查一一倒查法与顺查法相反,它是利用选定的检索工具由近及远、逐年逐卷地进行查找信息的方法。当检索者的要求是获取近期文献时,最好采用倒查法。倒查法的查准率较高,查全率比顺查法低。抽查法一抽查法是针对课题研究所处的发展高峰阶段进行的信息检索,它往往用来解决要求快速检索的课题•抽查法有较高的检索效率,但使用该方法的前提是必须事先了解该研究课题的历史背景。(二) 追溯法:追溯法又称引文法,主要有以下两类。传统追溯一一它是利用一次信息所附的参考文献进行追溯查找的方法。检索时可以先查找出几篇与课题有关的专著或述评(这类文献往往附有大量的参考文献,多时可达上百篇),以此作为起点进行检索。2.引文追溯法资料内容仅供您学习参考,如有不当之处,请联系改正或者删除它是一种由远及近的检索方法,即找到一篇与课题有关的论文后进一步查找该论文被哪些文献引用过、是否有人对该领域做过进一步研究、实践结果如何、最新的进展怎样等。由远及近地追寻,信息愈来愈新,研究也就越深入。这种方法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)等。(三)交替法1、 交替法就是以追溯法和常规法交替使用来查找信息的方法,又称分段法或综合法。2、 即先利用检索工具查出一批相关信息,然后利用这些信息所附的参考文献进行追溯,扩大线索,由此获得更多信息。交替法比前两种方法的检索效果好,是一种立体型的检索法。3、 当检索工具缺期或缺卷时,使用该方法也能连续获得所需年限以内的信息四、信息检索的程序(重点)(会用自己的语言表达)1、分析检索课题2、选择检索工具3、选择检索途径,确定检索标识4、选择检索方法5、获取原始文献(一)分析检索课题课题分析是信息检索过程中最重要的环节.每一项检索课题都有明确的目的和具体的要求。课题分析应从以下几方面进行。1.分析主题内容确定文献的学科范围,其次找出课题研究需要解决的关键问题,选择恰当的主题词或关键词,这是成功检索的第一步。2。分析时间范围分析查找年代,确定检索的时间范围,可避免浪费时间和精力.根据课题的历史背景和检索要求,推算出所需信息最为适当的时间段.例如,为了了解某个领域的最新研究进展,只查询近一两年的文献就可以了。如果是专利的查新检索,回溯年限则相对要长些。分析信息类型在进行信息检索时,还要进一步确定待查信息的类型。因为不同的检索工具对不同信息的收集量不同.如研究基础理论课题,则应侧重于检索期刊论文、专著和会议论文;如果是技术应用和开发的课题,则侧重于检索专利文献、标准文献及科技报告等。明确信息类型,可为选择检索工具和检索手段提供依据,提高检索的针对性,否则将会降低检索效率,甚至一无所获。(二)、选择检索工具选择检索工具的依据有以下两方面。1.根据课题涉及的学科范围进行选择如果课题复杂,涉及的学科多,应选择综合性和专业性检索工具相结合的方法进行检索:如果课题资料内容仅供您学习参考,如有不当之处,请联系改正或者删除涉及学科单一,可以以专业性检索工具为主、综合性检索工具作为补充。如要查找关于“计算机软件"的信息,可以先利用专业性较强的《科学文摘》(SA)的C辑“计算机与控制文摘(CCA)”查找,然后再用综合性的工具《工程索引》(Ei)作为补充•如果检索课题涉及某种特定的信息类型,则应选用收录特定信息类型的检索工具。比如要检索专利文献,应选用<〈中国专利公报》、《世界专利索引》(WPl),或者专利信息数据库等检索工具。2.根据检索工具收录范围和编制体系进行选择不同的检索工具在收录范围、报道形式、编排体系、著录格式和索引系统等方面不尽相同,使用时可根据具体检索要求加以选择。这里需要强调的是,对于类型相似的检索工具,应该根据收录的信息量、文摘和题录的质量、标引的质量、使用的方便程度及出版的周期等加以选择。(三)选择检索途径,确定检索标识检索途径是检索的入口。主要有两类:一是反映信息内容特征(主题、分类)的检索途径,二是反映信息外部特征(著者、题名、代码等)的途径。1.选择检索途径(1)分类途径-—它是按学科分类体系查找信息的途径,主要有分类目录和分类索引.它以学科概念的上、下、左、右关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求.主题途径题名途径著者途径如著者索引、著者目录、全国报刊索引。资料内容仅供您学习参考,如有不当之处,请联系改正或者删除缺点:无系统性和完整性.(5)信息代码途径通过已知信息的专用代码查找信息的途径。ISBN、ISSN、专利号、合同号、标准号、入藏号等。2•确定检索标识每个检索途径对应一种检索标识。采用主题词做检索标识时,应考虑该词的同义词、近义词,以免漏检。上位类(放大)、下位类(缩小)(四) 选择检索方法(五) 获取原始文献1•判断信息的发表类型2。 缩写语和非拉丁语系文字的音译问题3。 通过其他方式获得资料内容仅供您学习参考,如有不当之处,请联系改正或者删除4馆际互借、代购、向著者索取、向出版发行机构购买、联机订购、数据库全文.信息检索是一种逻辑思维与推理过程.第二章信息检索语言信息检索的意义和作用(掌握)信息检索的意义:检索语言就是为沟通信息标引与信息检索两个过程而编制的人工语言,是连接标引人员与检索人员双方思路的桥梁信息检索的作用:(1)帮助信息工作人员完整、准确、快速地标引信息的内容特征和外表特征,完成信息的存储过程,也就是利用检索语言编制检索工具或建立检索系统.各种图书资料分类表、主题词表都是利用检索语言编制而成的.(2)帮助检索者系统、全面、准确地查找所需的文献资料,完成文献的检索过程。(3)帮助信息管理人员系统地组织大量而无序的文献,从而使信息的管理科学化.检索者为了查

找所需的文献资料,必须具备检索语言的基本知识,熟悉和掌握各种检索语言的结构体系.第二节信息检索语言的基础一、概念及其逻辑关系(掌握)信息检索的基本原理是将用户的检索提问标识与检索工具或数据库记录中的信息特征标识进行对资料内容仅供您学习参考,如有不当之处,请联系改正或者删除比,当二者一致时,即为检索命中。由此可见,能否准确地检索出用户所需的信息,关键在于能否准确地选择表达检索提问的标识•这里讲的“准确”,是指用户所选用的检索提问标识必须与检索工具或数据库中标引文献记录所甲的信息特征标识完全一致,这就要求检索人员和标引人员必须遵循同一种规则,这个规则就是检索语言。检索语言就是为沟通信息标引与信息检索两个过程而编制的人工语言,是连接标引人员与检索人员双方思路的桥梁。逻辑关系:等同关系属分关系相关关系(一)等同关系等同关系是指两个或两个以上的词所表达的概念完全相同或基本相同。它包括同义关系和准同义关系。1•同义关系同义关系指所表达的概念完全相同。其逻辑关系如图2-1所示.图中A、B分别表示两个同义词,重合的A、B两圆代表这两个同义词所表达的概念具有同义关系,即A和B外延完全重合。同义词的形式主要有:规范词与俗称(如引桥与桥头引线):全称与简称(如澳大利亚与澳洲)等。2•准同义关系:指所表达的概念基本相同或相近。准同义词的形式主要有:近似词(如汽车排气与汽车废气);资料内容仅供您学习参考,如有不当之处,请联系改正或者删除泛指词与专指词(如汽车管理与汽车检验);部分反义词(如稳定性与不稳定性)等。在检索语言中,为了保持事物一概念一语言形成一一对应的关系,只能选择一个概念作为正式的标引词。(二)属分关系属分关系又称属种关系。它是指这样两个概念:其中一个概念完全被包括在另一个概念的外延里,是另一个概念外延的一部分。外延较大的概念称为属概念(上位概念),外延较小的概念称为种概念(下位概念)。(三)相关关系指概念之间关系密切但又不同于等同关系和属分关系的一种关系•它不像前两种关系那样密切,灵活性较大。相关关系一般有以上三种类型。(交叉关系、矛盾关系、对立关系)二、检索语言类型(掌握)表述文献外部特征的检索语言表述文献内容特征的检索语言文献外部特征的检索语言和表述文献内容特征的检索语言。文献的外部特征通常指题名、著者、专利号、报告号等信息,而内容特征通常指文献的主题概念、文献所属的学科等•在揭示文献内容和表达检索提问方面,内容特征比外部特征更具有深度。(一)表述文献外部特征的检索语言(二)表述文献内容特征的检索语言资料内容仅供您学习参考,如有不当之处,请联系改正或者删除检索语言类型有:一、描写文献外部特征:1、题名语言2、著者语言3、号码语言二、描写文献内容特征:1、主题语言:(1)单元词语言、(2)标题词语言、(3)关键词语言、(4)

叙词语言;2、分类语言:(1)体系分类语言、(2)组配分类语言、(3)混合分类语言

第三节分类语言一、分类语言(掌握)1、 先组式(pre—coordination)语言:先组式语言:是指在检索实施前已事先组配好的一种检索语言,用户只能用这种已经固定好的检索词组形式去完成检索,它有较好的直接性和专指性,但灵活度差,比如标题词语言。2、 后组式(post-coordination)语言:后组式语言:是指在检索实施前未事先组配好的、以单元词等形式出现的一种检索语言,在检索时将它们临时组配起来,表达一定的概念,来完成检索•这种后组方式提供了灵活的组配方式,在计算机检索中的到广泛应用。如单元词法和叙词法。《中图法》是我国第一部集中了全国图书馆和信息部门的力量共同编制的一部综合性大型文献分类表.1975年初版,到1999年已出版第四版(印刷版和机读版)。目前《中图法》广泛应用于各类型图书馆。《中图法》主要由类目表、辅助表和索引三部分构成。(一)类目表(掌握)类目表是《中图法》最主要的组成部分,它由基本部类、基本大类、简表及详表构成。1•基本部类和基本大类《中图法》有五个基本部类:马克思主义、列宁主义、毛泽东思想、邓小平理论;哲学、宗教;社会科学;自然科学;综合性图书•这是整个分类表最先确定、最本质、最概括的区分二、主题词语言(了解)主题词语言很多,如:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词汇之间的关系。第四节主题语言叙词语言(掌握)叙词语言:以叙词作为信息内容标识和检索依据的一种主题词语言•叙词又称主题词,是从自然语言中选取的经过规范化处理的词汇,也就是将自然语言中的词汇进行统一规划、控制和管理,使其变成词和概念的—对应.叙词语言是一种后组式语言。它是在分类语言、标题词语言、关键词语言和单元词语言的基础上产生出来的一种新型的信息检索语言。叙词语言的组配原理(了解)资料内容仅供您学习参考,如有不当之处,请联系改正或者删除叙词是以概念为基础的、经过规范化处理的名词术语,具有单一性、组配性好的特点.叙词之间的组配是概念组配,即以概念的分解为手段,以概念间的逻辑关系为基础,对概念进行分析与综合的一种组配方式,重在拆义.比如“香蕉苹果"这个概念,用字面组配的方式为:香蕉+苹果f香蕉苹果;若用概念组配的方式即为:香蕉味水果+苹果f香蕉苹果。显然,用概念组配表达叙词之间的关系更为准确。概念组配是叙词组配的基本原理,是叙词语言的灵魂。三、叙词语言的组配形式(掌握)交叉组配交叉组配是指用具有交叉关系的若干个主题词的组合表示一个复合概念的组配,组配的结果形成一个新的概念,使概念的范围缩小。“汽车保养”和“汽车修理”的组配即是交叉组配,“汽车保修”则是其共有的种概念•交

叉组配的必要条件是概念之间具有交叉关系,组配后的概念应是被组配者的共有种概念。限定组配资料内容仅供您学习参考,如有不当之处,请联系改正或者删除限定组配是一个表示“事物”的叙词与另一个表示事物“某一方面”的叙词之间进行概念限定的组配。组配的结果形成一个新的种概念,使概念的范围缩小。以“电子计算机"和“存储器”为例,在图2—8中,A代表电子计算机,B代表存储器、C代表“电子计算机存储器”。限定组配的必要条件是:概念之间,一个表示事物,另一个表示事物的方面.(3)概括组配概括组配即具有并列关系的叙词之间的组配。组配的结果形成一个新的属概念,使概念的范围扩大。以“有轨电车”和“无轨电车”为例,在图2-9中,A代表有轨电车,B代表无轨电车,A、B两图2—8限定组配个圆代表“电车”。第三章中文工具书的使用一、 工具书的类型(掌握)工具书的类型繁多,对其的划分历来存在很多不同的看法。人们从不同的角度,如语种、内容、载体形式、编制特点等,将其划分为多种类型。即使依据相同的划分标准,所得细类的具体内容也存在差异。在本书中主要依据工具书的编制特点和功能,将其划分为以下几类:目录、索引、文摘;字典、词典;百科全书;年鉴、手册、名录;表谱;图录等。二、 工具书综合利用要领(掌握)由于各类型的工具书都有自己独特的性质特点和作用,而且每一种具体的工具书也都有自己的特定收录内容、编排体例和功能用途。因此,工具书的综合利用属于一种检索策略,要求我们从广度和深度方面去掌握和使用工具书,即在分析问题的基础上,选择查找资料的最佳途径和方法,7/24资料内容仅供您学习参考,如有不当之处,请联系改正或者删除以解决查全率和查准率的问题。熟悉工具书②分析问题③选择查找资料的途径和方法。三、中文工具书举要1、中文检索工具书目录索引文摘2、中文参考工具书(1)词语与学科知识检索工具--辞书与百科全书(2)年度统计资料与统计数据的检索工具-—年鉴(3)数据规格、技术方法的检索工具——手册(4)人物、机构和地域信息检索工具-—名录(5)实、历法和历史沿革信息的检索工具—-表谱3、图像信息检索工具——图录《中文核心期刊要目总览》(掌握)资料内容仅供您学习参考,如有不当之处,请联系改正或者删除中文核心期刊要目总览》由北京大学图书馆和北京市高校图书馆期刊工作研究会联合研制,北京大学出版社出版,每四年一版,1992年推出第一版,2004年推出第四版.2004年版评选出1798种核心期刊,将其归入分属7个大编的74个学科类目.这7编为:哲学、社会学、政治、法律、军事;经济;文化、教育;自然科学;医药、卫生;农业科学;工业技术。正文内容按学科顺序排列74个核心期刊表,每一核心期刊表之前均有该表的研制报告。款目按国家标准著录,包括刊名、并列刊名、编辑单位、出版事项、出版频率、中图分类号、ISSN、国内统一刊号、邮发代号、国外发行号、地址、邮编、电话、网址及E—ma订地址和内容简介等•款目按刊名汉语拼音顺序排列。书后附有各学科专业期刊一览表(包括核心期刊)、检索性期刊一览表,国内版外文期刊一览表,核心期刊刊名索引。四、计算机信息检索系统的构成(了解)从整体上讲,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论