版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《信息检索》讲稿第一章信息检索概述第一节信息的概念与类型一、信息的概念信息是人类与载体(包括人脑)上的已知或未知的可利用的信息。信息中的载体信息和主体信息是使信息的最基本的组成部分。二、信息的特点1.客观性。信息不是能源,也不是物质,无论是否认识到,信息总是存在着。2.寄载性。信息必须借助于一定的符号与一定的载体中(包括人脑,才能被表现,没有载体,就没有信息。信息与载体,两者不能割裂开。3.传递性。信息可以通过一定的载体在空间、时间上传递,从近到远,从古到今都能传递。4.动态性。信息是对事物存在方式及运动方式的反映,随着事物的变化,信息也将变化。这里动态性是指信息的时效性。5.相对性。人们认识能力与认识条件不同,信息接受者(信宿)获得信息与信息量的多寡不同,从这个意义上说,信息的价值具有相对性。6.增长性。信息的使用,不但使信息减少,再利用中,还会产生的信息。7.共享性。使用同一种信息,均不需要任何的限制条件,信息资源共享的双方或多方均不回损失信息内容,相反还会产生新的信息。《信息检索》讲稿第一章信息检索概述第一节信息的概念与类型一、信息的概念信息是人类与载体(包括人脑)上的已知或未知的可利用的信息。信息中的载体信息和主体信息是使信息的最基本的组成部分。二、信息的特点1.客观性。信息不是能源,也不是物质,无论是否认识到,信息总是存在着。2.寄载性。信息必须借助于一定的符号与一定的载体中(包括人脑,才能被表现,没有载体,就没有信息。信息与载体,两者不能割裂开。3.传递性。信息可以通过一定的载体在空间、时间上传递,从近到远,从古到今都能传递。4.动态性。信息是对事物存在方式及运动方式的反映,随着事物的变化,信息也将变化。这里动态性是指信息的时效性。5.相对性。人们认识能力与认识条件不同,信息接受者(信宿)获得信息与信息量的多寡不同,从这个意义上说,信息的价值具有相对性。6.增长性。信息的使用,不但使信息减少,再利用中,还会产生的信息。7.共享性。使用同一种信息,均不需要任何的限制条件,信息资源共享的双方或多方均不回损失信息内容,相反还会产生新的信息。8.规模性。信息作为整体要有一定的量,分散、片面地信息不能较好地反映事物的情况。三、信息的类型按照信息的开发程度来区分,可分为潜在信息与现实信息资源两大类。现实信息又可分为口语信息、体语信息、实物信息、文献信息、网络信息和多信息。1. 口语信息。交谈、聊天、授课、讨论等方式获得的信息。特点是传递迅速,互动性强,但稍纵即逝、久传易出差异。因此通过这种方式了解到的信息应下来,并加以证实。2.体语信息。以手势、表情、如舞蹈、体育比赛、杂技等方式传递的信息。特点是直观性强生动丰富、印象深刻、富有力,但此类信息的容量有限。3.实物信息。以实物如文物、样本、模型、碑刻、雕塑等形式表示的信息。特点是直观性强、感觉实在、信息量大,但需要通过知识、智慧、经验和工具挖掘大量隐含的信息。等方式在各种载体上的知识和信息,包括标准、回忆录、物等特种文献。特点是经过加工、整理,较为系统、准确、可靠,便于保存与利用,但也存在信息相对滞后,部分信息尚待证实的情况。8.规模性。信息作为整体要有一定的量,分散、片面地信息不能较好地反映事物的情况。三、信息的类型按照信息的开发程度来区分,可分为潜在信息与现实信息资源两大类。现实信息又可分为口语信息、体语信息、实物信息、文献信息、网络信息和多信息。1. 口语信息。交谈、聊天、授课、讨论等方式获得的信息。特点是传递迅速,互动性强,但稍纵即逝、久传易出差异。因此通过这种方式了解到的信息应下来,并加以证实。2.体语信息。以手势、表情、如舞蹈、体育比赛、杂技等方式传递的信息。特点是直观性强生动丰富、印象深刻、富有力,但此类信息的容量有限。3.实物信息。以实物如文物、样本、模型、碑刻、雕塑等形式表示的信息。特点是直观性强、感觉实在、信息量大,但需要通过知识、智慧、经验和工具挖掘大量隐含的信息。等方式在各种载体上的知识和信息,包括标准、回忆录、物等特种文献。特点是经过加工、整理,较为系统、准确、可靠,便于保存与利用,但也存在信息相对滞后,部分信息尚待证实的情况。文献的一些主要类型:1)。对(book)49献。是文献中最古老、最重要的类型。按文种来分可分为:中文图书、日文、西文等;按作用范围可分为通俗具书等;按写作方式可分为专著、编著、翻译、编译等;按卷可分为单卷本、多卷本等;按刊行情况可分为单性本、、抽印本等;按版次情况可分为初版、重版、修订本等。2)连续物。具有同一题名、定期或不定期以分册形式、有卷期或年月标识、计划无限期连续的文献。包括期刊、报纸、年度出版物及其他连续报告、会议路、专著性丛刊等。连续物是与并列的最主要的文献类型,其特点是内容新颖、及时、连续、信息密集、形式一致等。据统计目前世界上连续130连续503)特种文献。有特定内容、特定用途、特定读者范围、特定方式的文献,包括、样本、会议录、和物。国内外(greyliteratre,尽管这类文献并非很成熟,但他们内容新颖专深、实用性强、信息量大、参考性高,利用率大,是极为重要的信息。4)网络信息。以电子形式存贮于成千上万台计算机组成的网络中的信息、业活动等各种信息。文献的一些主要类型:1)。对(book)49献。是文献中最古老、最重要的类型。按文种来分可分为:中文图书、日文、西文等;按作用范围可分为通俗具书等;按写作方式可分为专著、编著、翻译、编译等;按卷可分为单卷本、多卷本等;按刊行情况可分为单性本、、抽印本等;按版次情况可分为初版、重版、修订本等。2)连续物。具有同一题名、定期或不定期以分册形式、有卷期或年月标识、计划无限期连续的文献。包括期刊、报纸、年度出版物及其他连续报告、会议路、专著性丛刊等。连续物是与并列的最主要的文献类型,其特点是内容新颖、及时、连续、信息密集、形式一致等。据统计目前世界上连续130连续503)特种文献。有特定内容、特定用途、特定读者范围、特定方式的文献,包括、样本、会议录、和物。国内外(greyliteratre,尽管这类文献并非很成熟,但他们内容新颖专深、实用性强、信息量大、参考性高,利用率大,是极为重要的信息。4)网络信息。以电子形式存贮于成千上万台计算机组成的网络中的信息、业活动等各种信息。2070200020054851.2户,并以每月20万个新用户的速度递增。中国从1994,20026301613总数达到4580万,CN下的达126146个;WWW站点数()293213预计,中国将发展成为全球网上第一大用户,届时网上的中文信息也将越来越多。但在海量的信息中,重复交叉较多,信息也会很多。根据不同的标准,可将网络信息划分成各种不同的类型:从利用性质上分,有开发性信息、式信息、交流式信息;从存取方式分,有邮件型信息、型信息、揭示版型信息、广播型信息、馆型信息、数目型信息;从内容上分,有商务信息、科技信息、社科信息、教育信息、信息等。5)多信息2070200020054851.2户,并以每月20万个新用户的速度递增。中国从1994,20026301613总数达到4580万,CN下的达126146个;WWW站点数()293213预计,中国将发展成为全球网上第一大用户,届时网上的中文信息也将越来越多。但在海量的信息中,重复交叉较多,信息也会很多。根据不同的标准,可将网络信息划分成各种不同的类型:从利用性质上分,有开发性信息、式信息、交流式信息;从存取方式分,有邮件型信息、型信息、揭示版型信息、广播型信息、馆型信息、数目型信息;从内容上分,有商务信息、科技信息、社科信息、教育信息、信息等。5)多信息将电信、电视、计算机三网相互融合,集图、文、声于一体的信息。包括网上广播电视、专题、网上等。多信息打破了、报刊、广播、电视单项的界限,形成交互式信息,可通过主题、文本、模版匹配,检索等方式对其进行检索。第二节信息检索的概念与类型信息检索(InformationRetrieval)又成为情报检索,萌芽于馆的参考咨询工作,20世纪50年代才固定成术语。一、信息检索的概念代表性的定义有以下几种:1.馆学百科全书》认为:信息检索是“知识的有序化识别和查找的过程广义的情报检索包括情报的检索与存2.全息检索说。上海交通大学信息检索王永成教授认为:全息检索就的多种形式的信息中高速准确地查找,并可以任意要求的信息形式和组织方式输出,也可仅输出人们所需要的一切3.概念信息检索说。Chank等认为,概念信息检索是基于自然语言处理中队只是在语义层次上的析取,并由此形成知识库,再根据对用户提问的理解来检索其中的相关信息。它用概念而不是来组织信息。4.大量相关信息检索说。叶继元等教授认为,信息检索是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。、主题词、概念分析方法等人工或自动将信息有序化用户全方位、多角度提供检索和检索结果。信息检索包括与检索两个部分。是对有关信息进行选择、并对信息特征进行著录标引和组织,建立信息数据库;检索则根据提问制定策略和表达式,利用信息数据库。这里要理解概念分析。概念分析即将概念转化成系统语言,是与一、信息检索的概念代表性的定义有以下几种:1.馆学百科全书》认为:信息检索是“知识的有序化识别和查找的过程广义的情报检索包括情报的检索与存2.全息检索说。上海交通大学信息检索王永成教授认为:全息检索就的多种形式的信息中高速准确地查找,并可以任意要求的信息形式和组织方式输出,也可仅输出人们所需要的一切3.概念信息检索说。Chank等认为,概念信息检索是基于自然语言处理中队只是在语义层次上的析取,并由此形成知识库,再根据对用户提问的理解来检索其中的相关信息。它用概念而不是来组织信息。4.大量相关信息检索说。叶继元等教授认为,信息检索是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。、主题词、概念分析方法等人工或自动将信息有序化用户全方位、多角度提供检索和检索结果。信息检索包括与检索两个部分。是对有关信息进行选择、并对信息特征进行著录标引和组织,建立信息数据库;检索则根据提问制定策略和表达式,利用信息数据库。这里要理解概念分析。概念分析即将概念转化成系统语言,是与检索共有的过程,因此从这个意义上说,信息是信息检索的逆过程,两者是不可分割的一个整体。二、信息检索的类型1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查处可回答某一问题的数据的检索。这些数据包括物理性能常数、统计数据生产总值、外汇收支等。这类检索不仅查处数据,还可以提供一定的推导、运算的能力。Information于数据库中的关于某一发生的时间、地点、经过等情况查找出来的检索。它既包含数值数据库的检索、运算、推导,也包括事实、概念等的检索、比较、逻辑判断。3)文献信息检索(DocumentInformationRetrieval)是将于数据等二次文献,以原始文献的出处为检索目的,可以向用户提供原文献2.按组织方式分,可有全文检索、超文本检索和超检索1)全文检索(FullTextRetrieval)是将在数据库中的整本书、整篇文章中的任意内容信息查找出来的检索。可以根据需要获得全文中的有关章、节、断、句、词等的信息,也可进行各种统计和分析。2)超文本检索(HyperTextRetrieval)是对每个节点中所存的信息以及信息链构成的网络中信息的检索。强调中心节点之间的语义联结结检索共有的过程,因此从这个意义上说,信息是信息检索的逆过程,两者是不可分割的一个整体。二、信息检索的类型1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查处可回答某一问题的数据的检索。这些数据包括物理性能常数、统计数据生产总值、外汇收支等。这类检索不仅查处数据,还可以提供一定的推导、运算的能力。Information于数据库中的关于某一发生的时间、地点、经过等情况查找出来的检索。它既包含数值数据库的检索、运算、推导,也包括事实、概念等的检索、比较、逻辑判断。3)文献信息检索(DocumentInformationRetrieval)是将于数据等二次文献,以原始文献的出处为检索目的,可以向用户提供原文献2.按组织方式分,可有全文检索、超文本检索和超检索1)全文检索(FullTextRetrieval)是将在数据库中的整本书、整篇文章中的任意内容信息查找出来的检索。可以根据需要获得全文中的有关章、节、断、句、词等的信息,也可进行各种统计和分析。2)超文本检索(HyperTextRetrieval)是对每个节点中所存的信息以及信息链构成的网络中信息的检索。强调中心节点之间的语义联结结构,靠系统提供的工具进行图示穿行和节点展示,提供浏览式,可进行跨库检索。3)超检索(HyperMediaRetrieval)是对的文本、图像、声音等多种信息的检索。它是结构,有向的,与超文本检索一样,可提供浏览式和跨库检索。3.按检索分,有手工检索和检索1)手工检索(HandRetrieval)是人直接用手、眼、脑组织、查找印刷型文献的检索。具有直观、灵活、无需各种设备和上机费用的优点。2)对已数字化的信息,按照设计好的程序进行查找和输出的过程。按检索的处理方式分又有脱机检索和联机检索;按方式分,有光盘检索和网络检索。机检可大大提高检索效率,扩宽检索领域。三、信息检索的研究内容、研究方法和作用1.检索理论研究检索理论是检索活动中总结出来的系统化的知识,研究内容包括信息与信息定义、信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。当前要多做信息检索知识体系化、整合化的研究。2.检索语言研究原指从自然语言中精选出来,并以简练形式表示文献、信息的受控语言的集合。现指受控语言和自然语言(未规范的语言。研究内容包括、主题词、词表编制、分类表编制、概念分析、规范档、代码标识构,靠系统提供的工具进行图示穿行和节点展示,提供浏览式,可进行跨库检索。3)超检索(HyperMediaRetrieval)是对的文本、图像、声音等多种信息的检索。它是结构,有向的,与超文本检索一样,可提供浏览式和跨库检索。3.按检索分,有手工检索和检索1)手工检索(HandRetrieval)是人直接用手、眼、脑组织、查找印刷型文献的检索。具有直观、灵活、无需各种设备和上机费用的优点。2)对已数字化的信息,按照设计好的程序进行查找和输出的过程。按检索的处理方式分又有脱机检索和联机检索;按方式分,有光盘检索和网络检索。机检可大大提高检索效率,扩宽检索领域。三、信息检索的研究内容、研究方法和作用1.检索理论研究检索理论是检索活动中总结出来的系统化的知识,研究内容包括信息与信息定义、信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。当前要多做信息检索知识体系化、整合化的研究。2.检索语言研究原指从自然语言中精选出来,并以简练形式表示文献、信息的受控语言的集合。现指受控语言和自然语言(未规范的语言。研究内容包括、主题词、词表编制、分类表编制、概念分析、规范档、代码标识等。3)数据库研究数据库是多个互相关联的数据的集合,是信息检索系统必不可少的组成部分。研究内容包括数据库建设规划与协调共享、收录信息与文献的筛选、文档结构、维护与更新、、市场、效果评价、数据库跨库检索、Z39.50标准等的研究。目前要加强异构数据库系统信息整合和检索、知识库、数据仓库的研究。4)著录法研究的方法。研究内容包括国内外著录标准与规则,格式,各种信息与文献著录方法,CN-MARC,UNI-MARC,US-MARC,DublinCor(都柏林)元数据,XML等的研究,目前要重视电子型文献及网络信息的著录研究。a)标引和组织法研究标引是通过对信息内容的过程。组织法即排检法,是指按一定次序将标引标识(如主题词、分类号)排列起来的反方法。以上研究内容包括信息的阅读、分析、词表的编制与选用、标引规则、中外文排检、类序、失序、地序、谱系序等。目前应重点研究网络信息资源的镖隐语排序、数字的全球统一的分类体系、主题分类词表(用、等。3)数据库研究数据库是多个互相关联的数据的集合,是信息检索系统必不可少的组成部分。研究内容包括数据库建设规划与协调共享、收录信息与文献的筛选、文档结构、维护与更新、、市场、效果评价、数据库跨库检索、Z39.50标准等的研究。目前要加强异构数据库系统信息整合和检索、知识库、数据仓库的研究。4)著录法研究的方法。研究内容包括国内外著录标准与规则,格式,各种信息与文献著录方法,CN-MARC,UNI-MARC,US-MARC,DublinCor(都柏林)元数据,XML等的研究,目前要重视电子型文献及网络信息的著录研究。a)标引和组织法研究标引是通过对信息内容的过程。组织法即排检法,是指按一定次序将标引标识(如主题词、分类号)排列起来的反方法。以上研究内容包括信息的阅读、分析、词表的编制与选用、标引规则、中外文排检、类序、失序、地序、谱系序等。目前应重点研究网络信息资源的镖隐语排序、数字的全球统一的分类体系、主题分类词表(用、(GreatGlobalGrid)的研究。6)检索系统研究检索系统是由有序化的信息研究内容包括系统设计、运行和评价。目前重点研究计算机检索系统软硬件配置、设计与评价、智能化应用等。7)检索策略研究检索策略是在分析信息需求检索提问时确定的检索途径与检索用词,并明检索表达式、检索符号的设置与应用、步骤优化。目前应加强检索策略自动调节、修改的研究。8)检索服务研究检索服务是根据用户需求,由专门帮助查找信息,并将结果提供给用户的工作,研究内容包括服务、服务方式、用户培训、检索效果(查准率、查全率)等。目前应加强个性化信息服务的研究。2.研究方法信息检索的研究从属于馆学与情报学。涉及到自然科会科学、人文科学的许多学科和领域。通用的方法有:观察法、实验法、法、模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研究方法。3.信息检索的作用1)能较全面地掌握有关的必要信息信息检索可以有目的、较系统地获得某一主题的必要信息。2)能提高信息利用的效率,节省时间与费用检索系统是由有序化的信息研究内容包括系统设计、运行和评价。目前重点研究计算机检索系统软硬件配置、设计与评价、智能化应用等。7)检索策略研究检索策略是在分析信息需求检索提问时确定的检索途径与检索用词,并明检索表达式、检索符号的设置与应用、步骤优化。目前应加强检索策略自动调节、修改的研究。8)检索服务研究检索服务是根据用户需求,由专门帮助查找信息,并将结果提供给用户的工作,研究内容包括服务、服务方式、用户培训、检索效果(查准率、查全率)等。目前应加强个性化信息服务的研究。2.研究方法信息检索的研究从属于馆学与情报学。涉及到自然科会科学、人文科学的许多学科和领域。通用的方法有:观察法、实验法、法、模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研究方法。3.信息检索的作用1)能较全面地掌握有关的必要信息信息检索可以有目的、较系统地获得某一主题的必要信息。2)能提高信息利用的效率,节省时间与费用一般公信度高的,较准确的信息才会被收集、组织或在检索工具或数据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数十倍。3)能提高信息素质,成才信息素质(InformationLliteracy)是指具有获取信息的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。中国的高等教育法明确要求大学生要具备信息素质。第二章信息检索理论与方法第一节信息检索原理一、信息检索策略信息检索策略是为实现检索目标而制定的计划和方案,是对整个检索过程的谋划和指导。即是对检索过程的安排。检索策略有两种方式:手工检索策略和计算机检索策略。在计算机检索的条件下,检索策略的构造应是在明确检索目标和信息需求的基础上进行的,包括选择检索数据库、确定检索项、选定检索范围和检索方法,运用逻辑算符拟定检索表达式,按照一定的步骤实施检索,并根据需要进行反馈调整。信息需求按范围和程度的不同,可分为三种类型:——普查型:需要全面收集某一主题的文献资料;——型:需要收集有关某一主题的某一特定方面的文献资料,以解决科研生产中的关键问题;一般公信度高的,较准确的信息才会被收集、组织或在检索工具或数据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数十倍。3)能提高信息素质,成才信息素质(InformationLliteracy)是指具有获取信息的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。中国的高等教育法明确要求大学生要具备信息素质。第二章信息检索理论与方法第一节信息检索原理一、信息检索策略信息检索策略是为实现检索目标而制定的计划和方案,是对整个检索过程的谋划和指导。即是对检索过程的安排。检索策略有两种方式:手工检索策略和计算机检索策略。在计算机检索的条件下,检索策略的构造应是在明确检索目标和信息需求的基础上进行的,包括选择检索数据库、确定检索项、选定检索范围和检索方法,运用逻辑算符拟定检索表达式,按照一定的步骤实施检索,并根据需要进行反馈调整。信息需求按范围和程度的不同,可分为三种类型:——普查型:需要全面收集某一主题的文献资料;——型:需要收集有关某一主题的某一特定方面的文献资料,以解决科研生产中的关键问题;——探索型:需要了解和掌握某一领域的最新研究或研究成果查出的文献具有新颖及时的特点。并要明确课题对查新、查全和查准的要求,包括信息的形式需求和内容需求。制定检索策略就是在确定检索主题的基础上,选择检索系统,确定检索途径和拟定检索程序,它包括手工检索策略和检索策略的制定。1、选择检索系统覆盖信息面广、及时、揭示信息内容准确、有一定深度的数据库以及系统的检索功能是否完善等。选择检索系统关键是数据库的选择,如书目型数据库可检索文献《医学MEDLINEINSPEC《美国化学》CHEMICALABSTRACTS)事实型数据库可检索文字、图形、声像、计算机程序等《中国。如《工程索引》数据库就有三个版本,印刷版(TheEngineeringIndex--Ei,1884-——探索型:需要了解和掌握某一领域的最新研究或研究成果查出的文献具有新颖及时的特点。并要明确课题对查新、查全和查准的要求,包括信息的形式需求和内容需求。制定检索策略就是在确定检索主题的基础上,选择检索系统,确定检索途径和拟定检索程序,它包括手工检索策略和检索策略的制定。1、选择检索系统覆盖信息面广、及时、揭示信息内容准确、有一定深度的数据库以及系统的检索功能是否完善等。选择检索系统关键是数据库的选择,如书目型数据库可检索文献《医学MEDLINEINSPEC《美国化学》CHEMICALABSTRACTS)事实型数据库可检索文字、图形、声像、计算机程序等《中国。如《工程索引》数据库就有三个版本,印刷版(TheEngineeringIndex--Ei,1884--、光盘版(EiCompendexPlus,1989--、网络版pendexWeb, /ei-village/plsg/switch.main,197--2、确定检索词检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。检索词分为四类:1)表示主题的检索词——标题词:指经规范化处理得先组定组式的词汇。——单元词:指从信息内容中抽出的最基本的词汇。名词或术语,它是经规范化处理的自然语言词汇。——息主体内容的具有实质意义的词语,它是规范化处理的自然语言词汇。2)表示作者的检索词。如作者姓名、机构名。3)表示分类的检索词。如分类号4)表示特殊意义的检索词。如ISBN、ISSN、引文标引词等。检索词的选择与确定要遵循以下两个原则a) 根据检索课题所涉及的学科专业和技术内容选词。b) 对检索词进行处理。如使用检索词表进行比较对照,选用规范化的词汇作为检索词。3、构造检索表达式在计算机检索过程中,检索提问与标识之间的对比是由进行的,构造检索表达式的是构造一个既能表达检索课题需求,又能被计算机识别的检索表达式。构造检索表达式前要弄清所使用数据库的检索功能和所采用的操作算检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。检索词分为四类:1)表示主题的检索词——标题词:指经规范化处理得先组定组式的词汇。——单元词:指从信息内容中抽出的最基本的词汇。名词或术语,它是经规范化处理的自然语言词汇。——息主体内容的具有实质意义的词语,它是规范化处理的自然语言词汇。2)表示作者的检索词。如作者姓名、机构名。3)表示分类的检索词。如分类号4)表示特殊意义的检索词。如ISBN、ISSN、引文标引词等。检索词的选择与确定要遵循以下两个原则a) 根据检索课题所涉及的学科专业和技术内容选词。b) 对检索词进行处理。如使用检索词表进行比较对照,选用规范化的词汇作为检索词。3、构造检索表达式在计算机检索过程中,检索提问与标识之间的对比是由进行的,构造检索表达式的是构造一个既能表达检索课题需求,又能被计算机识别的检索表达式。构造检索表达式前要弄清所使用数据库的检索功能和所采用的操作算符,才能有效地进行信息检索。如截词符,在Ei*”表示,在DIALOG,UMI中用“?”表示,在OCLC中用“+”表示。检索表达式中用于连接各词的算符按其功能不同可分为逻辑算符、位置算符、截词算符和限制符等,不同的数据库会采用不同的符号或文字来描述词与词之间的组配关系。逻辑算符:又称布尔逻辑算符,利用布尔代数中的逻辑运算符来描述检索词之间的关系。常用的三种:逻辑与(AND或*、逻辑或(OR或+逻辑非(NOT或-修饰,限制词与词之间位置关系,弥补布尔逻辑算符只是定性规定检索词的范围,可提高查准率。常用的位置算符有:W——With的缩写,表示算符两侧的检索词按此符,才能有效地进行信息检索。如截词符,在Ei*”表示,在DIALOG,UMI中用“?”表示,在OCLC中用“+”表示。检索表达式中用于连接各词的算符按其功能不同可分为逻辑算符、位置算符、截词算符和限制符等,不同的数据库会采用不同的符号或文字来描述词与词之间的组配关系。逻辑算符:又称布尔逻辑算符,利用布尔代数中的逻辑运算符来描述检索词之间的关系。常用的三种:逻辑与(AND或*、逻辑或(OR或+逻辑非(NOT或-修饰,限制词与词之间位置关系,弥补布尔逻辑算符只是定性规定检索词的范围,可提高查准率。常用的位置算符有:W——With的缩写,表示算符两侧的检索词按此但允许两词之间有空格或标点符号。nW——nWord的缩写,表示算符两侧的检索词之间允许个实词或系统禁用词,如冠词、介词和连接词。N——Near的缩写,表示算符两侧的检索词必须紧密连接,词间只允许有空格或标点符号。同时出现在文献的同一字段中nN——表示算符两侧的检索词之间允许n个实词或系统禁用词,两词词序可变。同时出现在文献的同一字段中S——Subfield的缩写。表示算符两侧的检索词必须同时出现在文献的同一字段、句子或短语中,允许n个实词或系统禁用词,词序可变。F——Field的缩写。表示算符两侧的检索词必须同时出现在文献纪录的同一字段中,允许n个实词或系统禁用词,词序可变。C——Citation的缩写。表示算符两侧的检索词必须同时出现在一条文献的中,词间允许n个实词或系统禁用词,词序可变。L——Link的缩写。表示算符两侧的检索词之间有一定的从属关系。截词符:是指在检索词的合适位置进行截断。截词符的作用是对检索词进行截词处理,解决一个词的单复数问题,词干相同而词尾不同的问题和英美词汇拼写差异的问题。常用的截词符有“*$字符数量可分为有限截断和无限截短。有限截断是指检索词串与被检索词实现只能在指置可以不一致的acid,可以匹配acid,acidic但不能匹配acidi可变。F——Field的缩写。表示算符两侧的检索词必须同时出现在文献纪录的同一字段中,允许n个实词或系统禁用词,词序可变。C——Citation的缩写。表示算符两侧的检索词必须同时出现在一条文献的中,词间允许n个实词或系统禁用词,词序可变。L——Link的缩写。表示算符两侧的检索词之间有一定的从属关系。截词符:是指在检索词的合适位置进行截断。截词符的作用是对检索词进行截词处理,解决一个词的单复数问题,词干相同而词尾不同的问题和英美词汇拼写差异的问题。常用的截词符有“*$字符数量可分为有限截断和无限截短。有限截断是指检索词串与被检索词实现只能在指置可以不一致的acid,可以匹配acid,acidic但不能匹配acidiy。无限截断是指检索词串与被检索词实现部分一致的匹配。常用“*”表示。其截断形式有左截断、中截断、右截断。左截断是指检索词与被检索词实现词间的后部相同,即对同词干而前缀不同的概念进行检索如*magnetic,可检出magnetic,or,paramagnetic中断截词是指检索词与被检索词之间只需任意部分匹配即可。如:限制符:其作用是限制检索词或检索式在数据库中出现的字段位置。数据库中可供检索的字段通常分为基本检索字段和辅助检索字段。(TI)(AB(DE(ID适用于各种数据库。辅助检索字段主要有作者(AU,语种(LA,年代(PY)名(JN(DT不同的表达形式和使用规则,使用时要参照有关数据库的使用说明。避免产生误检。要注意选择的检索标识只能表达信息需求的不同侧面,而不能反映需求的完整内容,只有用逻辑表达式将不同的检索标识组合在一起,才有可能表达完整的检索课题数据库中可供检索的字段通常分为基本检索字段和辅助检索字段。(TI)(AB(DE(ID适用于各种数据库。辅助检索字段主要有作者(AU,语种(LA,年代(PY)名(JN(DT不同的表达形式和使用规则,使用时要参照有关数据库的使用说明。避免产生误检。要注意选择的检索标识只能表达信息需求的不同侧面,而不能反映需求的完整内容,只有用逻辑表达式将不同的检索标识组合在一起,才有可能表达完整的检索课题表达得越深,切题性就比较高。造纸——papermaking,paperpulp废水——wasterwater处理——treat,treatment构造检索式:(paperwmakingorpaperwpulp)andwasterwaterand(treatortreatment)。4、实施检索策略1)获取检索信息手工检索策略的实施,主要将检索策略中信息需求所涉及到的有关提问特征如:主题词、分类号、作者姓名等与检索系统中的检索标识进行比较分析,筛选与信息需求相一致的检索结果。计算机检索策略的实施,是将构造好的检索提问表达式,输入计算机检索系统,使用检索系统认可的检索指令进行逻辑匹配运算,并输出检索结果。以上两种检索策略若检索结果内容较多,还需要进行二次检索进行缩检。1)索取原始信息最有价值的原始信息。5、修改检索策略和检索词之间的逻辑关系直接有关,还有检索对语言学的了解、对事物的认知能力、专业知识水平的高低有密切关系,另对检索系统的特性和功能的掌握,以及外语水平都会影响到课题检索的结果。检索策略的修改反映在检索前、检索过程中、检索后。检索前要一次文献、词表和数据库指南。检索过程中要充分利用人——机的有利条件,随时据信息反馈情况调整检索策略。检索后对检索结果进行分析评价,建立文档、为今后的检索积累经验。二、信息检索步骤信息检索步骤就是根据既定课题要求,利用检索工具查找有关资料的具体过程。它是检索策略的具体化,包括明确需求、分析主题、选择检索计算机检索策略的实施,是将构造好的检索提问表达式,输入计算机检索系统,使用检索系统认可的检索指令进行逻辑匹配运算,并输出检索结果。以上两种检索策略若检索结果内容较多,还需要进行二次检索进行缩检。1)索取原始信息最有价值的原始信息。5、修改检索策略和检索词之间的逻辑关系直接有关,还有检索对语言学的了解、对事物的认知能力、专业知识水平的高低有密切关系,另对检索系统的特性和功能的掌握,以及外语水平都会影响到课题检索的结果。检索策略的修改反映在检索前、检索过程中、检索后。检索前要一次文献、词表和数据库指南。检索过程中要充分利用人——机的有利条件,随时据信息反馈情况调整检索策略。检索后对检索结果进行分析评价,建立文档、为今后的检索积累经验。二、信息检索步骤信息检索步骤就是根据既定课题要求,利用检索工具查找有关资料的具体过程。它是检索策略的具体化,包括明确需求、分析主题、选择检索工具或数据库,确定检索次、构造检索表达式、提交检索表达式、现实与优化检索结果等。三、信息检索方法信息检索的方法有多种,分别使用于不同的检索目的和检索要求。归纳起来,常用的信息检索方法有常规检索法、回溯检索法、循环检索法。1.常规检索法。又称常用检索法、工具检索法。它以主题、分类、作者等为检索点,利用检索工具获的信息的方法。根据检索方式,常规检索法又分为直接检索法和间接检索法;根据检索需求,常规检索法又分为顺查法、倒查法和抽查法。词典、手册、年鉴、图录、百科全书等进行检索。这种方法多用于查找一些内容概念较稳定较成熟、有定论可依的指示性问题的。即可解决事实性的检索和数据性的检索。2)间接检索法。利用检索工具间接检索信息的方法。3)顺查法。根据检索课题的起始年代,利用选定的检索工按照从旧到新、由远及近、由过去到现在顺时序逐年查找,直至满足课题要求为止的查检方法。这种方法费力、费时,工作量大,多在缺少评述文献采取此法。因此可用于事实性检索。论、新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。此法查处的信息新颖,但查全率不高。工具或数据库,确定检索次、构造检索表达式、提交检索表达式、现实与优化检索结果等。三、信息检索方法信息检索的方法有多种,分别使用于不同的检索目的和检索要求。归纳起来,常用的信息检索方法有常规检索法、回溯检索法、循环检索法。1.常规检索法。又称常用检索法、工具检索法。它以主题、分类、作者等为检索点,利用检索工具获的信息的方法。根据检索方式,常规检索法又分为直接检索法和间接检索法;根据检索需求,常规检索法又分为顺查法、倒查法和抽查法。词典、手册、年鉴、图录、百科全书等进行检索。这种方法多用于查找一些内容概念较稳定较成熟、有定论可依的指示性问题的。即可解决事实性的检索和数据性的检索。2)间接检索法。利用检索工具间接检索信息的方法。3)顺查法。根据检索课题的起始年代,利用选定的检索工按照从旧到新、由远及近、由过去到现在顺时序逐年查找,直至满足课题要求为止的查检方法。这种方法费力、费时,工作量大,多在缺少评述文献采取此法。因此可用于事实性检索。论、新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。此法查处的信息新颖,但查全率不高。重点和发展阶段,拟出一定时间范围,进行逐年检索的法。此法检索效率较高,但漏检的可能性大,检索必须熟悉学科的发展特点。2.回溯检索法。又称追溯法、引文法、引证法、是一种跟踪查找的方法。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。在没有检索工具或检索工具不齐美的情况下,利用此法能够获取一些所需要的文献资料,但往往查全率不高,回溯年代越远,所获取的文献越成旧。科学引文索引》科学3.循环检索法。又称交替法、综合法、分段法,检索时,先利用检索工具从分类、主题、责任者、题名等入手,查出一批文献,然后再选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满意为止。在实际检索中,采用哪种检索方法最合适,应根据检索条件、检索要求和检索背景等因素确定。四、信息检索途径信息检索工具是把众多的各类信息进行分析加工后,按照一定的特征标识排检组织而形成的信息集合体。信息检索就是分析一些既定标识,从信息集合中选择信息。信息检索途径是与文献信息的特征和检索标识相关。据文献外部特征和内部特息检索途径分为两大类。重点和发展阶段,拟出一定时间范围,进行逐年检索的法。此法检索效率较高,但漏检的可能性大,检索必须熟悉学科的发展特点。2.回溯检索法。又称追溯法、引文法、引证法、是一种跟踪查找的方法。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。在没有检索工具或检索工具不齐美的情况下,利用此法能够获取一些所需要的文献资料,但往往查全率不高,回溯年代越远,所获取的文献越成旧。科学引文索引》科学3.循环检索法。又称交替法、综合法、分段法,检索时,先利用检索工具从分类、主题、责任者、题名等入手,查出一批文献,然后再选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满意为止。在实际检索中,采用哪种检索方法最合适,应根据检索条件、检索要求和检索背景等因素确定。四、信息检索途径信息检索工具是把众多的各类信息进行分析加工后,按照一定的特征标识排检组织而形成的信息集合体。信息检索就是分析一些既定标识,从信息集合中选择信息。信息检索途径是与文献信息的特征和检索标识相关。据文献外部特征和内部特息检索途径分为两大类。1.以文献的外部特征为检索途径1)题名途径。可查找、期刊、单篇文献。检索工具中的书名索引、的途径。2)合同户、学术会议主办等。利用责任者检索文献,主要利用的是作者索引、作者目录、个人作者索引、团体作者索引、专利权人索引等。3)号码途径。据文献信息时所编的号码顺序来检索文献信息的途告的报告好、合同号、任务号、馆藏编的馆藏号、索取号、排架号等。优点:它的排列与检索方法以字顺或数字为准,比较机械、单纯,不易错检或漏检,若已知书名、刊名,作者姓名或序号数码的文献,可直接判断该文献的有与无。2.以文献内容为检索特征文献的内容特征是指从文献所载的知识信息中隐含的、潜在的特征,如:分类、主题等,内容特征作为检索途径更适宜检索未知线索的文献。1)来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献信息。1.以文献的外部特征为检索途径1)题名途径。可查找、期刊、单篇文献。检索工具中的书名索引、的途径。2)合同户、学术会议主办等。利用责任者检索文献,主要利用的是作者索引、作者目录、个人作者索引、团体作者索引、专利权人索引等。3)号码途径。据文献信息时所编的号码顺序来检索文献信息的途告的报告好、合同号、任务号、馆藏编的馆藏号、索取号、排架号等。优点:它的排列与检索方法以字顺或数字为准,比较机械、单纯,不易错检或漏检,若已知书名、刊名,作者姓名或序号数码的文献,可直接判断该文献的有与无。2.以文献内容为检索特征文献的内容特征是指从文献所载的知识信息中隐含的、潜在的特征,如:分类、主题等,内容特征作为检索途径更适宜检索未知线索的文献。1)来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献信息。它能满足族性检索的需求。2)主题检索。以课题的主题内容为出发点,按主题词、、叙词、主题索引等按主题词的字顺编排的检索工具来查找有关某一主题或课题。3)分类主题索引。是分类途径与主题途径的结合。第二节文献信息著录法著录,是指在编制目录时,对具体文献的各种形式特征、内容特征及物质形态等进行分析、选择和的过程。著录法。是关于如何进行著录的具体的规定和具体做法。款目或。按照一定的方法和规则,对某一具体文献或信息源的内容和形式特征所作的描述。一条款目或是一种文献或一种信息源的高度概括和浓缩。目前国内外常用的著录方法和规则有《英—美编目条列CatalogingRulesversion2(ISBDIntenationalStandard它能满足族性检索的需求。2)主题检索。以课题的主题内容为出发点,按主题词、、叙词、主题索引等按主题词的字顺编排的检索工具来查找有关某一主题或课题。3)分类主题索引。是分类途径与主题途径的结合。第二节文献信息著录法著录,是指在编制目录时,对具体文献的各种形式特征、内容特征及物质形态等进行分析、选择和的过程。著录法。是关于如何进行著录的具体的规定和具体做法。款目或。按照一定的方法和规则,对某一具体文献或信息源的内容和形式特征所作的描述。一条款目或是一种文献或一种信息源的高度概括和浓缩。目前国内外常用的著录方法和规则有《英—美编目条列CatalogingRulesversion2(ISBDIntenationalStandardBibliographicDescripion、中国物著录规则》一、传统著录法按照《国际标准书目著录》ISBD等标准和规则的要求,统一进行规范化的著录。文献著录的结果是款目。款目是揭示文献内容和形式特征的事项。文献内容指文献的学科内容,基本特征从文献的正文获得通过提要项和排检相中的分类号、主题词反映出来。文献的形势包括两种,一是文献外表的文字特征,如:题名、责任者、出版情况等,其基本特征从题名页、页等处获得,通过题名与责任者项、版本项、项、丛编项反映出来;二是文献物质形态,其中又可区分为内容形态和外部形态,前者指数量(页数、图,后者指文献的、开本、装订、附件等,其基本特征从文献的整体形态获得。通过载体形态项反映出来。据中国文献著录大项:题名与责任者项;版本项;文献特殊细节项;项;载体形态项;丛编项;附注项;文献标准标号及有关记载项;提要项。元数据1.元数据概述元数据(Metadata)是关于数据的数据(dataaboutdata,元数据的含义是逐步发展的,这一词于计算机科学,主要指网络的描述数据,但由于传统的书目数据与数字信息的描述数据本质相近,因此元数据这一术语适用于各种类型信息的描述。元数据描述的对象包括:、科技报告及各种形式的网络信息等。描述成分通常是指从信息中抽取出来的用于说明其特征、内容的数据,如题名、版本、数据、相款目是揭示文献内容和形式特征的事项。文献内容指文献的学科内容,基本特征从文献的正文获得通过提要项和排检相中的分类号、主题词反映出来。文献的形势包括两种,一是文献外表的文字特征,如:题名、责任者、出版情况等,其基本特征从题名页、页等处获得,通过题名与责任者项、版本项、项、丛编项反映出来;二是文献物质形态,其中又可区分为内容形态和外部形态,前者指数量(页数、图,后者指文献的、开本、装订、附件等,其基本特征从文献的整体形态获得。通过载体形态项反映出来。据中国文献著录大项:题名与责任者项;版本项;文献特殊细节项;项;载体形态项;丛编项;附注项;文献标准标号及有关记载项;提要项。元数据1.元数据概述元数据(Metadata)是关于数据的数据(dataaboutdata,元数据的含义是逐步发展的,这一词于计算机科学,主要指网络的描述数据,但由于传统的书目数据与数字信息的描述数据本质相近,因此元数据这一术语适用于各种类型信息的描述。元数据描述的对象包括:、科技报告及各种形式的网络信息等。描述成分通常是指从信息中抽取出来的用于说明其特征、内容的数据,如题名、版本、数据、相关说明等。传统文献的著录只是局限于完整的、静止的信息内容的处理;不适于网络环境下动态的多信息的处理。元数据是识别信息的所在及其属性的等信息源的数据,也包括系统、情报系统等人工加工后的种种结构化的数据,如书目信息、、索引、综述等。元数据项目适应于和原稿的有EAD,广泛适用于馆界和情报界的DC,这些元数据虽有相似性,但彼此之间难于兼容。目前在W3C(因特网)的下,制定出符合多种需要,且具有灵活性RDF(描述框架,来支持因特网上的各种元数据格式。RDF是一个与任何特定语法无关的抽象的资料表达模式,用于反映资源、属性和属性的价值,可把XML和RDF结合起来,使得各种元数据的格式可以出现或运行在同一界面上,提高了元数据的规范化和可操作性。2.元数据的应用元数据的应用主要入图像检索、导航和图像集合中的浏览、、声频和,结构化的文献管理,地理和环境信息系统,数字馆,支持信息存取的混合多等。元数据在国外的应用。1)美国的教育资料网关(GEM,GatewaytoEducationalMaterias,它为的教师在因特网上提供教学计划、课程单元和关说明等。传统文献的著录只是局限于完整的、静止的信息内容的处理;不适于网络环境下动态的多信息的处理。元数据是识别信息的所在及其属性的等信息源的数据,也包括系统、情报系统等人工加工后的种种结构化的数据,如书目信息、、索引、综述等。元数据项目适应于和原稿的有EAD,广泛适用于馆界和情报界的DC,这些元数据虽有相似性,但彼此之间难于兼容。目前在W3C(因特网)的下,制定出符合多种需要,且具有灵活性RDF(描述框架,来支持因特网上的各种元数据格式。RDF是一个与任何特定语法无关的抽象的资料表达模式,用于反映资源、属性和属性的价值,可把XML和RDF结合起来,使得各种元数据的格式可以出现或运行在同一界面上,提高了元数据的规范化和可操作性。2.元数据的应用元数据的应用主要入图像检索、导航和图像集合中的浏览、、声频和,结构化的文献管理,地理和环境信息系统,数字馆,支持信息存取的混合多等。元数据在国外的应用。1)美国的教育资料网关(GEM,GatewaytoEducationalMaterias,它为的教师在因特网上提供教学计划、课程单元和其他因特网上的教育检索家里一个可操作性架构。可利用它开发使用HTML规范和因特网浏览器。2)北欧的万维网索引(NWI,NordicWebIndex)是利用北欧各国的5个合作服务点而建立的,该系统以元数据为基础,可以实现包括题名、文献作者和URL等字段的检索。ofaEuropeanServiceforInformationonResearchandEducation是用一般的元数据格式,编制了用于转换的表。元数据在中国的应用。行业标准供陆各级馆以计算机可读形式建立馆藏数字化中文全文文献。该标准适用于采用中文全文检索技术的计算机系统。等类型文献元数据的规范和定义,可用于普通、古籍、连续物、标准文献、科技报告、、地图资料、缩微资料、计算机文档等类型文献的元数据处理。2)陆的数字馆项目:a中国实验型数字馆。建设一个规范化的分布式数字式库,在组织和描述上,强调符合项目总体技术的统一要求。该项目计划由中国馆、上海馆、馆、中山馆、南京馆、辽宁馆参与,模仿美国数字馆计划,侧重技术方案的实现,兼顾的数字化。b中国数字馆工程。其中需要建立数字馆中心的元数据共享检索系统和元数据中心,该中心使用并行数据库技术和分布式计2)北欧的万维网索引(NWI,NordicWebIndex)是利用北欧各国的5个合作服务点而建立的,该系统以元数据为基础,可以实现包括题名、文献作者和URL等字段的检索。ofaEuropeanServiceforInformationonResearchandEducation是用一般的元数据格式,编制了用于转换的表。元数据在中国的应用。行业标准供陆各级馆以计算机可读形式建立馆藏数字化中文全文文献。该标准适用于采用中文全文检索技术的计算机系统。等类型文献元数据的规范和定义,可用于普通、古籍、连续物、标准文献、科技报告、、地图资料、缩微资料、计算机文档等类型文献的元数据处理。2)陆的数字馆项目:a中国实验型数字馆。建设一个规范化的分布式数字式库,在组织和描述上,强调符合项目总体技术的统一要求。该项目计划由中国馆、上海馆、馆、中山馆、南京馆、辽宁馆参与,模仿美国数字馆计划,侧重技术方案的实现,兼顾的数字化。b中国数字馆工程。其中需要建立数字馆中心的元数据共享检索系统和元数据中心,该中心使用并行数据库技术和分布式计算机系统来支撑海量的元数据系统。c建筑数字馆。提供中国营造社史信息导航、学科资料成果信息导航以及新营造资料方面的服务。d的中文Metadata标准研究。以中文文献为实体对象,标引法标引是通过对文献或信息的分析,选用确切的检索标识,如分类内容的过程。加工中的重要环节,使款目或记录编排的重要根据,对信息检索效果有直接的影响,通过标引,才可编成各种目录和索引等检索工具。各种标引词于计算机内,才可实现文献或信息的检索。利用不同的检索便是进行标引,就形成了不同的标引方法,目前主要的标引方法有:分类标引法、主题标引法、标引法和名称表引法等(人名、地名、书名。由于计算机信息检索系统和信息数据库的应用,还出现了自动标引。一、分类标引的内容特征进行分析、判断,赋予分类标识的过程。通过对信息赋予分类标识,信息机构可以将各种信息纳入相应的知识门类,建立起相应的分类检索系统。信息用户只要根据一定的信息特征,就可以按系统提供的途径查找到所需的文献。算机系统来支撑海量的元数据系统。c建筑数字馆。提供中国营造社史信息导航、学科资料成果信息导航以及新营造资料方面的服务。d的中文Metadata标准研究。以中文文献为实体对象,标引法标引是通过对文献或信息的分析,选用确切的检索标识,如分类内容的过程。加工中的重要环节,使款目或记录编排的重要根据,对信息检索效果有直接的影响,通过标引,才可编成各种目录和索引等检索工具。各种标引词于计算机内,才可实现文献或信息的检索。利用不同的检索便是进行标引,就形成了不同的标引方法,目前主要的标引方法有:分类标引法、主题标引法、标引法和名称表引法等(人名、地名、书名。由于计算机信息检索系统和信息数据库的应用,还出现了自动标引。一、分类标引的内容特征进行分析、判断,赋予分类标识的过程。通过对信息赋予分类标识,信息机构可以将各种信息纳入相应的知识门类,建立起相应的分类检索系统。信息用户只要根据一定的信息特征,就可以按系统提供的途径查找到所需的文献。1.掌握分类标引的要求。具有准确性、充分性、一致性、实用性。2.掌握分类标引的规则。传统文献的分类体系,是以学科为中心建立的类目体系,应在分析文献主体对象的同时考虑其内容的学科属性。P54区域大地构造学”类,再加华北地区区分号“822P548.22”网络分类体系,是以主题或学科为中心建立的类目体系,应根据类目的设置特点各入其类。工具书、目录、索引、等一般归入Z综合类后,再按专业分散处理。馆分类法》《中国大学馆《美国国会馆二、主题标引是依据一定的主题词表和主体标引规则,赋予信息语词标识的过程。具体是在主题分析的基础上,以一定的词表和标引规则作为依据,将信息中具有检索意义的特征转换成相应的主题词,并将其组织成能表达信息内容特征的标识的过程。1.掌握标引方式。标引方式是根据特点和使用需要确定的标引和解释文献主题的形式。标引方式有:整体标引、全面标引、对口标引、综合标引和分析标引。1.掌握分类标引的要求。具有准确性、充分性、一致性、实用性。2.掌握分类标引的规则。传统文献的分类体系,是以学科为中心建立的类目体系,应在分析文献主体对象的同时考虑其内容的学科属性。P54区域大地构造学”类,再加华北地区区分号“822P548.22”网络分类体系,是以主题或学科为中心建立的类目体系,应根据类目的设置特点各入其类。工具书、目录、索引、等一般归入Z综合类后,再按专业分散处理。馆分类法》《中国大学馆《美国国会馆二、主题标引是依据一定的主题词表和主体标引规则,赋予信息语词标识的过程。具体是在主题分析的基础上,以一定的词表和标引规则作为依据,将信息中具有检索意义的特征转换成相应的主题词,并将其组织成能表达信息内容特征的标识的过程。1.掌握标引方式。标引方式是根据特点和使用需要确定的标引和解释文献主题的形式。标引方式有:整体标引、全面标引、对口标引、综合标引和分析标引。2.掌握标引规则。3(汉表《中国三、标引使用非规范化的自然语言——来表达文献或信息主题内容的过程。它属于主题标引的一种。1.标引的类型标引通过轮排生成各种类型的索引,包括题内索引、题外索引、双重索引。1)题内索引(KWIC。选择标题中具有检索意义的词作为。排检点设于标题的中部;所有索引条目按的字顺竖向排列。保留文献篇名前后的上下文。2)题外索引(KWOC。对(KWIC)索引的改进形式。将索引标目的位置从中部移至左端或左上方,标目下完整列举文献篇名。编制索引时,置于左端,将条目轮流置于篇名中的每个之下,整个条目按的字顺排列。3)双重索引(DoubleKWICIndex。采重标目,在篇名之外设置第一个主标目,再在篇名的左端按副标目(第二)排列。双重可以通过两个的组配进行查找。2.索引编制的步骤1)将文献篇名输入计算机;2.掌握标引规则。3(汉表《中国三、标引使用非规范化的自然语言——来表达文献或信息主题内容的过程。它属于主题标引的一种。1.标引的类型标引通过轮排生成各种类型的索引,包括题内索引、题外索引、双重索引。1)题内索引(KWIC。选择标题中具有检索意义的词作为。排检点设于标题的中部;所有索引条目按的字顺竖向排列。保留文献篇名前后的上下文。2)题外索引(KWOC。对(KWIC)索引的改进形式。将索引标目的位置从中部移至左端或左上方,标目下完整列举文献篇名。编制索引时,置于左端,将条目轮流置于篇名中的每个之下,整个条目按的字顺排列。3)双重索引(DoubleKWICIndex。采重标目,在篇名之外设置第一个主标目,再在篇名的左端按副标目(第二)排列。双重可以通过两个的组配进行查找。2.索引编制的步骤1)将文献篇名输入计算机;2)计算机自动进行分词和抽词,并取除介词、连词等非;3)进行论排,使每个都轮流用作标目,同时保留其上下文;4)排序和编辑。四、名称标引名称标引是用责任者、地名、题名表达文献或信息主题内容的过程。它包括责任者标引、题名标引、地名标引等。1.责任者标引。责任者是指对文献中的著作内容进行创造、整理、负有直接责任的个人或团体。责任者有个人责任者和团体责任者,个人责任者包括第一责任者和其他责任者;团体责任者包括机构名称和会议名称,中国责任者标引时,采用直序的方法,外国责任者则视情况有的采用直序的方法,有的采用倒序的方法,名在前,姓在后。2.题名标引。题名是指直接表达或象征、隐喻文献内容的主题及其特征,并是指个别化的名称。提名包括正题名、并列题名、副题名、说明题名文字等,标引时,选择适当的题名名称加以标引。排检法信息检索工具常用的排检反方法分为两大类:一类是字序法,如字顺法和查字法;一类是类序法,如分类法、主题法,另外还有其他的如:时序法、地序法、谱序法。一、字序法又称字顺法或查字法,是按一定的顺序排检单字或复词的法。一般的字典、词典、索引和百科全书都采用这种反方法。2)计算机自动进行分词和抽词,并取除介词、连词等非;3)进行论排,使每个都轮流用作标目,同时保留其上下文;4)排序和编辑。四、名称标引名称标引是用责任者、地名、题名表达文献或信息主题内容的过程。它包括责任者标引、题名标引、地名标引等。1.责任者标引。责任者是指对文献中的著作内容进行创造、整理、负有直接责任的个人或团体。责任者有个人责任者和团体责任者,个人责任者包括第一责任者和其他责任者;团体责任者包括机构名称和会议名称,中国责任者标引时,采用直序的方法,外国责任者则视情况有的采用直序的方法,有的采用倒序的方法,名在前,姓在后。2.题名标引。题名是指直接表达或象征、隐喻文献内容的主题及其特征,并是指个别化的名称。提名包括正题名、并列题名、副题名、说明题名文字等,标引时,选择适当的题名名称加以标引。排检法信息检索工具常用的排检反方法分为两大类:一类是字序法,如字顺法和查字法;一类是类序法,如分类法、主题法,另外还有其他的如:时序法、地序法、谱序法。一、字序法又称字顺法或查字法,是按一定的顺序排检单字或复词的法。一般的字典、词典、索引和百科全书都采用这种反方法。1.中文排检法。包括形序法、音序法和号码法。形序法有:笔画法。笔顺法。部首法。音序法有:汉语拼音排检法。注音字母排检法。号码法:四角号码法。2.外文排检法。目前世界上有2000多种语言,多数有文字,适用范围超过500013正式的工作语言有:汉、英、俄、西、法、6外文工具书的排检法主要有字顺排检法、分类或主题排检法、时序排检法、地序排检法和列表排检法等。字顺排检法。机械地按照字母或词的顺序进行排列,是编制工具书最常用的一种反方法,一般包括书名、著者名和主题字顺。按字母系统可以分为:拉丁文字顺排检法、日文字顺排检法、俄文字顺排检法。二、类序法按照文献或信息的内容,分门别类排列的方法。它包括分类法和主题法。但分类法地是按代表类名的、由字母或数字代码组成的类号排列;主题则按主题类名的字顺排列。注意分类法排列中除体系分类法之外还有四部分类法。时序法。按照文献的写作、和年代或事物发生发展的先后顺序来编排文献的法。一些时间性较强的工具书如:年表、历表、史事纪》等。地序法。按照文献中所涉及的1.中文排检法。包括形序法、音序法和号码法。形序法有:笔画法。笔顺法。部首法。音序法有:汉语拼音排检法。注音字母排检法。号码法:四角号码法。2.外文排检法。目前世界上有2000多种语言,多数有文字,适用范围超过500013正式的工作语言有:汉、英、俄、西、法、6外文工具书的排检法主要有字顺排检法、分类或主题排检法、时序排检法、地序排检法和列表排检法等。字顺排检法。机械地按照字母或词的顺序进行排列,是编制工具书最常用的一种反方法,一般包括书名、著者名和主题字顺。按字母系统可以分为:拉丁文字顺排检法、日文字顺排检法、俄文字顺排检法。二、类序法按照文献或信息的内容,分门别类排列的方法。它包括分类法和主题法。但分类法地是按代表类名的、由字母或数字代码组成的类号排列;主题则按主题类名的字顺排列。注意分类法排列中除体系分类法之外还有四部分类法。时序法。按照文献的写作、和年代或事物发生发展的先后顺序来编排文献的法。一些时间性较强的工具书如:年表、历表、史事纪》等。地序法。按照文献中所涉及的、地域等为标识来编排文献的方法。利用这一方法能集中同一或地区的全部文献,较全面地反映某一地区、某一的历史和现状。采用这一方法主要用于编制地理、地方志、和有民图籍录》等。此法需要有辅助的索引配合,才能在不知所属地区时按地名查找。谱序法。按照机构建制、血缘关系依次编排文献的方法。常见的检索工具央到地方逐级排列各机构的职官;世袭表和族谱则按照血缘关系依次(1981年版)第三章 信息检索工具与数据库检索工具的定义:检索工具适用于、、和查找各类信息的工具。包括传统的二次、三次、印刷性的检索工具,面向计算机网络的联机数据库检索系统、光盘数据库系统、搜索引擎等各种网络检索工具。3(计划委员会、国家科学技术委员会、信息中心编,计划,1996)共收录中国自建的,能提供对外服务的,既有一定数据量的和使用范围的各种数据库1038的数据库共有11339个。4.搜索引擎概况。陆有搜索引擎约60个,地区中文搜索引擎约20用这一方法能集中同一或地区的全部文献,较全面地反映某一地区、某一的历史和现状。采用这一方法主要用于编制地理、地方志、和有民图籍录》等。此法需要有辅助的索引配合,才能在不知所属地区时按地名查找。谱序法。按照机构建制、血缘关系依次编排文献的方法。常见的检索工具央到地方逐级排列各机构的职官;世袭表和族谱则按照血缘关系依次(1981年版)第三章 信息检索工具与数据库检索工具的定义:检索工具适用于、、和查找各类信息的工具。包括传统的二次、三次、印刷性的检索工具,面向计算机网络的联机数据库检索系统、光盘数据库系统、搜索引擎等各种网络检索工具。3(计划委员会、国家科学技术委员会、信息中心编,计划,1996)共收录中国自建的,能提供对外服务的,既有一定数据量的和使用范围的各种数据库1038的数据库共有11339个。4.搜索引擎概况。陆有搜索引擎约60个,地区中文搜索引擎约20陆常用的,性能较稳定的各类中英文搜索引擎20余个,国外已开发的各类搜索引擎近200个。四、检索工具的类型按检索的不同,检索工具可以分为传统检索工具和网络检索工具两大类型。这里主要介绍传统的检索工具。传统检索工具主要是各种类型的工具书。工具书是根据一定的需要,比较完备地汇集某一方面的资料,并按特定的方法加以编排,专供读者查考检索有关知识、资料、事实的书籍。据工具书的体例和功能,可分为检索型工具书、参考性工具书、词语性工具书、表谱性工具书、图录性工具书和边缘性工具书6种类型。1.检索性工具书。是在一次文献的基础上整理、编制出的提供文献信息检索的二次文献。包括树木、索引、、文献指南。主要用于查找国内外书刊资料。文献的与揭示,并按一定的方法加以编排的检索工具,通常揭示书名、作者、卷册、版本、者、年、价格、内容简介等。据编制目的、收录范围和内容,可由以下4种书目。书目。揭示某一时期的各类的总目。如总书书目》报刊书目的各类报刊的总目》《中国报刊大全期刊要目总览Web网杂志目录》等。国外已开发的各类搜索引擎近200个。四、检索工具的类型按检索的不同,检索工具可以分为传统检索工具和网络检索工具两大类型。这里主要介绍传统的检索工具。传统检索工具主要是各种类型的工具书。工具书是根据一定的需要,比较完备地汇集某一方面的资料,并按特定的方法加以编排,专供读者查考检索有关知识、资料、事实的书籍。据工具书的体例和功能,可分为检索型工具书、参考性工具书、词语性工具书、表谱性工具书、图录性工具书和边缘性工具书6种类型。1.检索性工具书。是在一次文献的基础上整理、编制出的提供文献信息检索的二次文献。包括树木、索引、、文献指南。主要用于查找国内外书刊资料。文献的与揭示,并按一定的方法加以编排的检索工具,通常揭示书名、作者、卷册、版本、者、年、价格、内容简介等。据编制目的、收录范围和内容,可由以下4种书目。书目。揭示某一时期的各类的总目。如总书书目》报刊书目的各类报刊的总目》《中国报刊大全期刊要目总览Web网杂志目录》等。和连续物目录》等。馆藏书目。揭示一个馆收藏的目录。有卡片目录和书本是目录两种。卡片目录通常配有3套即分类目录、书名目录和作者目录。供用户从不同的途径去检索。书本式目录是馆藏目录的印刷型。可为到馆的用户查阅使用,也可为不到馆的用户提供函借或复印。目录。是汇集某个地区或系统,乃至的馆或文献中心文献信息收藏实况的目录。把分散在各馆的书刊从目录上连成一体,使用户既能文参考工具书地方史资料馆连续物目录》等。题目、并注明出处,按一定的方法编排起来的检索工具书。报刊索引哲社版》就是将公开和内部的2000多种报刊中所载的所在报刊的卷期、页码,专供用户查找有关之用,主要的索引还有《科学文献题录》国科学索引》人名索引。和连续物目录》等。馆藏书目。揭示一个馆收藏的目录。有卡片目录和书本是目录两种。卡片目录通常配有3套即分类目录、书名目录和作者目录。供用户从不同的途径去检索。书本式目录是馆藏目录的印刷型。可为到馆的用户查阅使用,也可为不到馆的用户提供函借或复印。目录。是汇集某个地区或系统,乃至的馆或文献中心文献信息收藏实况的目录。把分散在各馆的书刊从目录上连成一体,使用户既能文参考工具书地方史资料馆连续物目录》等。题目、并注明出处,按一定的方法编排起来的检索工具书。报刊索引哲社版》就是将公开和内部的2000多种报刊中所载的所在报刊的卷期、页码,专供用户查找有关之用,主要的索引还有《科学文献题录》国科学索引》人名索引。语姓名译名手册地名索引。主要的有外历史地名大辞典世界地名词典》等。主要的有代格言大全3)或书籍中的内容进行浓缩,概括地陈述其主要论点、数据、结论等,并注明其出处,按一定的方式编排起来的检索农业科学索引和学》等。物2.参考性工具书指能为读者提供各种所需的具体资料的工具书。与检索工具书仅提供文献语姓名译名手册地名索引。主要的有外历史地名大辞典世界地名词典》等。主要的有代格言大全3)或书籍中的内容进行浓缩,概括地陈述其主要论点、数据、结论等,并注明其出处,按一定的方式编排起来的检索农业科学索引和学》等。物2.参考性工具书指能为读者提供各种所需的具体资料的工具书。与检索工具书仅提供文献线索相比较,参考工具书提供的资料更具体,包括百科全书、类书、政书、年鉴、、手册。科全书系统、扼要地阐述各科知识,并对每一学科提供定义、原理、方法、历史及现状、统计数字及参考书等方面的资料,并着重反映
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招投标项目成本控制与优化
- 节能减排廉洁自律招投标守则
- 咖啡馆租赁合同草稿
- 腹股沟斜疝修补术后护理
- 建筑施工劳务合同:旅游设施建设
- 医疗机构市场营销与市场定位
- 公路充电设施维护合同范本
- 木材加工安全事故预防
- 屋顶修复漏水施工合同
- 制造业用工规范承诺书
- 《手表基础知识》课件
- GB/T 28054-2023钢质无缝气瓶集束装置
- 小学《道德与法治》课程学习评价
- 2023年度武汉房地产市场报告2024.1.12
- 2024线上冲锋衣市场趋势报告
- 新人教版九年级下数学27-1《图形的相似》课件
- 全国优质课一等奖七年级心理健康教育《学习心理-学习从心开始》课件
- 基础拓扑学讲义答案尤承业
- 高考模拟作文“相信与怀疑”导写及范文
- 新人教版高中地理必修一第四章第一节-常见的地貌类型
- 荔枝包装工艺设计
评论
0/150
提交评论