计算机信息检索概述课件_第1页
计算机信息检索概述课件_第2页
计算机信息检索概述课件_第3页
计算机信息检索概述课件_第4页
计算机信息检索概述课件_第5页
已阅读5页,还剩197页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1计算机信息检索理论基础使用计算机检索信息,是专业人员在开展科学研究中不可或缺的一项基本技能。一个具有这方面能力并善于从电子信息源中获取所需信息者,将在今后的信息社会中获取更多的成功机会。1计算机信息检索理论基础使用计算机检索信息,是专业人员在开11计算机信息检索理论基础计算机信息检索的定义计算机检索系统的构成数据库的概念1计算机信息检索理论基础计算机信息检索的定义2计算机信息检索的定义所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。计算机信息检索的定义所谓计算机信息检索,就是在计算机和人的共3计算机检索系统的构成硬件软件数据库计算机检索系统的构成硬件4硬件系统中采用的各种硬件设备的总称,包括具有一定性能的计算机主机、外围设备以及怀数据处理或数据传输有关的其他设备。主机,是计算机检索系统的中枢。外围设备包括外部存储器,输入输出设备如键盘、光笔、鼠标、光学字符识别装置,显示终端、打印机等。硬件系统中采用的各种硬件设备的总称,包括具有一定性能的计算机5软件系统中有关的程序和各种文件资料的总称,包括系统软件(如操作系统,输入输出控制程序)和应用软件。软件系统中有关的程序和各种文件资料的总称,包括系统软件(如操6数据库“一组文件的集合”,就是以一定的组织方式存贮在一起的相关数据的集合。数据库“一组文件的集合”,就是以一定的组织方式存贮在一起的相7数据库的概念数据库的定义数据库的类型数据库的概念数据库的定义8数据库的定义数据库是至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。通俗地说,数据库是在计算机存储设备上按一定方式存储,并提供给确定范围内的各类用户共享的相互关联的数据集合。数据库是计算机技术与信息检索技术相结合的产物。它既是现代人们从事信息资源管理的工具,同时也是计算机信息检索的基础。数据库的定义数据库是至少由一种文档组成,并能满足某一特定目的9数据库的类型参考数据库源数据库混合数据库数据库的类型参考数据库10参考数据库指用户从中获取信息线索后,还需进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。(1)书目数据库。它是存储某个学科领域的二次文献的数据库,有时又称作为二次文献库。它依照二次文献的不同类型又可分为题录文摘数据库、索引数据库和图书馆书目数据库。(2)指南数据库。它是存储有关某些机构、人物、出版物、项目、程序、活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,机构名称数据库、人物传记数据库、产品数据库等都属于这一类数据库。参考数据库指用户从中获取信息线索后,还需进一步查找原文或其他11源数据库又称为数据银行。它是能够直接为用户提供原始资料或具体数据的一类数据库。源数据库又分为:数值型数据库文本—数值型数据库术语数据库图像数据库全文数据库超文本数据库源数据库又称为数据银行。它是能够直接为用户提供原始资料或具体12数值型数据库是指专门提供以数值方式表示的调查数据和统计数据的一类数据库。数值型数据库是指专门提供以数值方式表示的调查数据和统计数据13文本-数值型数据库是指能够同时提供文本信息和数值数据的一类数据库。文本-数值型数据库是指能够同时提供文本信息和数值数据的一类14术语数据库是指专门存储和检索名词术语、词语信息等的一种源数据库。术语数据库是指专门存储和检索名词术语、词语信息等的一种源数15图像数据库是指用来存储和检索各种图像或图形信息及有关文字说明资料的一种源数据库。图像数据库是指用来存储和检索各种图像或图形信息及有关文字说16全文数据库是指存储和检索文献全文或其中主要部分的一种源数据库。全文数据库是指存储和检索文献全文或其中主要部分的一种源数据17超文本数据库这种数据库存储时将存储内容分割为若干独立利用的结点,使用链路连接结点等方式进行存取,从而构成一个不拘泥于形式逻辑推理,不遵循某种正规模式的一种网络框架结构,因而具备了类似于数据库又优于一般数据库的特点。超文本数据库这种数据库存储时将存储内容分割为若干独立利用的18混合数据库这类数据库兼有源数据库和参考数据库的特点,按载体形式它又可分为以下四种类型:磁媒体数据库光盘数据库多媒体数据库:是一种能够对文字、数值、声音和图像等不同性质的媒体进行一体化处理和管理的新型数据库超媒体数据库。通过外部树形的链接将多种类型的媒体连成一个集合,该集合称为超媒体数据库。混合数据库这类数据库兼有源数据库和参考数据库的特点,按载体形192计算机信息检索的发展历史脱机批处理检索联机情报检索国际联机检索光盘检索网络信息检索2计算机信息检索的发展历史脱机批处理检索20脱机批处理检索1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。脱机批处理检索1954一64。定期由专职检索人员把许多用户课21联机情报检索20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。联机情报检索20世纪70年代投入商业运营。用户在计算机检索系22联机系统的诞生,使许多相互独立的终端实现了“对话”方式的信息检索。所谓对话方式,就是用户利用系统提供的、为数不多且简单易记的检索命令,每次输入一条命令或由命令组成的表达式查看结果。系统方面则每次显示出可能的信息,帮助用户选择下次该用的命令或表达式,用户通过与系统双向对话,可不断改变或完善检索策略,直至获得满意的检索结果为止。联机系统的诞生,使许多相互独立的终端实现了“对话”方式的信息23联机检索系统由三个部分组成:主机系统通讯系统终端设备

联机检索系统由三个部分组成:24主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。

主机系统主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分25通讯系统通讯系统是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。

通讯系统通讯系统是指终端设备与主机系统进行通信的设备。通信线26终端系统终端系统是人与系统的接口设备。它能将字符、声音以及人类的信息表现形式转换成系统的机器代码。反之,将系统的结果还原成字符、声音等形式,传送给终端用户。终端系统终端系统是人与系统的接口设备。它能将字符、声音以及人27国际联机检索70年代中后期。(联机检索基础上的扩充到国际)国际联机检索70年代中后期。(联机检索基础上的扩充到国际)28优点:这种方式可以边检索边修改检索策略,而且检索速度快,多用户可同时检索,检索不受地理位置限制,检索功能多样化,打印输出灵活,检索结果可进行多种分析处理,大大方便检索用户和提高检索质量。优点:这种方式可以边检索边修改检索策略,而且检索速度快,多用29缺点:注重系统自身工作效率的提高,如改进算法、改进存储结构与存取技术等;让用户去适应、配合系统,很少分析、考虑用户对使用系统的要求。面向检索专家或中介机构。要求检索者熟悉系统的一整套检索指令和检索技术,用户的提问必须采用规范化的检索语言,从而依赖于专业检索人员,用户自己完成检索必须受过系统培训。人机交互界面不友好,且费用较高。缺点:30光盘检索80年代初期,其全称为高密度光盘(CompactDisk),主要是利用激光、计算机及光电集成等技术实现信息存储的数字化。以光盘为介质的光盘数据库检索系统由于信息存储量大,简单易用而取胜。光盘检索80年代初期,其全称为高密度光盘(CompactD31优点:一次购买,无限制使用,不必考虑检索时间,远程通信费用等因素;存贮容量大;检索途径多;适用于通信不发达,联网较困难的地区,是联机检索、网络检索的有效补充。优点:一次购买,无限制使用,不必考虑检索时间,远程通信费用等32局限:数据更新有一定的周期,时效性、灵活性比不上联机检索;目前光盘数据库容量有限,一般是按专业和领域建库,收录范围不够广泛;适用对象的局限性,因为一次性购买费用高,对使用频率不高的单位或个人来说成本较高;设备和软件的兼容性较差,各种光盘数据库检索系统目前还难以实现标准化和统一化。局限:数据更新有一定的周期,时效性、灵活性比不上联机检索;目33光盘检索系统的构成:计算机、CD-ROM驱动器、检索软件、CD-ROM数据盘。光盘检索系统的构成:计算机、CD-ROM驱动器、检索软件、C34网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来,形成一个基于客户机-服务器模式的网络分布数据库结构。它在全球范围内把科技信息、商贸信息、经济信息、时事新闻以及日常生活信息通过互联网络合在一起,向亿万联网用户提供广泛的信息检索与服务。它是信息化社会应用最广泛、最活跃的领域。网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来35网络信息检索服务的特点:信息检索服务的开放性超文本的多链接性用户界面友好且操作方便具备良好的导航和编辑功能网络信息检索服务的特点:信息检索服务的开放性36信息检索服务的开放性网络信息系统中包含信息资源、信息设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是开放的,其信息资源面向所有用户。信息检索服务的开放性网络信息系统中包含信息资源、信息设备、37超文本的多链接性以超文本技术为基础链结构将不同地方的相关信息有机联系起来,使用户可通过点击文本或图表中的超文本链接点访问另一个相关的文档。超文本的多链接性以超文本技术为基础链结构将不同地方的相关信38用户界面友好且操作方便采用客户机/服务器结构,通过交互式的图形界面,为用户提供友好的信息查询要求,检索途径多,可保留检索历史。正是这一特点,使Internet能广泛深入学校、家庭、办公室乃至每一个人。用户界面友好且操作方便采用客户机/服务器结构,通过交互式的39具备良好的导航和编辑功能网络信息检索一般都可以引导读者在复杂的网络信息资源中漫游而不致迷失方向,用户可以利用导航机制,了解其所在网络图中的位置。网络信息检索具有良好的编辑功能,包括修改、增加、删除节点和链的能力,此外对节点内的信息也具有良好的编辑能力,可进行多窗口编辑。具备良好的导航和编辑功能网络信息检索一般都可以引导读者在复403计算机检索技术与实现布尔逻辑检索位置算符截词检索词组检索括号检索字段限制检索3计算机检索技术与实现布尔逻辑检索41布尔逻辑检索即运用布尔逻辑算符(Booleanoperators)对检索词尽心逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑算符主要有:ANDORNOT在中文数据库里,布尔逻辑运算符又是用AND、OR、NOT表示,有时用“*“、”+“及”-“。布尔逻辑检索即运用布尔逻辑算符(Booleanoperat42逻辑与(逻辑乘)用运算符号:AND或*连接检索词例查“有关计算机在图书馆中的应用”的文献,检索式=计算机*图书馆

AANDB

A

B逻辑与(逻辑乘)用运算符号:AND或*连接检索词43逻辑或用运算符号“OR”或“+”连接两检索词例1查“苹果或梨”方面的文献检索式=苹果+梨它在同义词检索中使用,能提高查全率。例2查“计算机或机器人”方面的文献检索式=计算机+机器人

AORB

A

B逻辑或用运算符号“OR”或“+”连接两检索词44逻辑非用运算符号“NOT”或“—”连接两检索词ANOTB例1查“玉米但不是甜玉米”方面的文献。检索式=玉米—甜玉米例2查“不是铬合金”方面的文献。检索式=合金—铬

ANOTB

A

B逻辑非用运算符号“NOT”或“—”连接两检索词ANO45位置算符检索文献记录中词语的相对次序不同,所表达的意思就可能不同。同样在检索式中,检索词的相对次序不同,表达的检索意图也不一样,布尔逻辑运算符有时难以表达某些检索课题的确切提问要求,用词间位置算符来限定和组配检索词,可弥补布尔逻辑算符只是定性规定检索词的范围,而没有限定检索词位置关系,易造成误检的不足。位置算符检索文献记录中词语的相对次序不同,所表达的意思就可能46位置算符检索就是利用一些特定的位置算符来表达检索词之间的位置关系,并且可以不用叙词表而直接使用自由词进行检索的方法。有的书上还把这种检索称为原文检索。这种检索在利用TI和AB途径检索时,对检索质量影响很大。常用的位置算符有:W、W/N、WITH、WITHIN、nW、PRE、N、NEAR、ADJ、nN、F、SAME位置算符检索就是利用一些特定的位置算符来表达检索词之间的位置47W、W/N、WITH、WITHIN功能:两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒)表达式:Education(W)school

或EducationWITHschool检索结果:Educationschool;educationschoolsW、W/N、WITH、WITHIN功能:两词相邻,按输入时顺48nW功能:两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒),两词之间允许插入0~n个词。表达式:Education(1W)school检索结果:Educationschool;educationschools;Educationandmusicschool;nW功能:两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒49PRE功能:两词相邻,按输入顺序排列表达式:EducationPREschool检索结果:EducationschoolEducationschoolsPRE功能:两词相邻,按输入顺序排列50N、NEAR、ADJ功能:两词相邻,顺序可以颠倒表达式:Education(N)schoolEducationNEARschool检索结果:EducationschoolEducationschoolsSchoolofEducationN、NEAR、ADJ功能:两词相邻,顺序可以颠倒51nN功能:两词相邻,顺序可以颠倒,两词中间可以插入0~n个词表达式:Education(1N)school检索结果:EducationschoolschoolofeducationEducationandsicschoolschoolofmusicandeducationnN功能:两词相邻,顺序可以颠倒,两词中间可以插入0~n个词52F功能:两词必须出现在同一字段中,词序与词量不限表达式:Education(F)school/DE检索结果:Education和school必须同时出现在叙词字段内即可F功能:两词必须出现在同一字段中,词序与词量不限53SAME功能:两词出现在同一自然句中,其词序与词量不受限制表达式:EducationSAMEschool检索结果:Education和school两词出现在同一句子中即可。SAME功能:两词出现在同一自然句中,其词序与词量不受限制54截词检索截词运算符号有两个:“?、*”。其在不同系统中表示的含义不同。原因:在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。截词检索截词运算符号有两个:“?、*”。其在不同系统中表示55有限截词。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。

如输入computer??表示有0-2个字母变化,可检出computer和computers.

输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing.

有限截词。即在检索词后后截几个有限的字母,如名词的单复数,动56无限截断:在检索词后加一个“*“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer*可检出computers,computering,computered,computerization.

无限截断:在检索词后加一个“*“,表示该词后可加任意个字符。57中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。

如:输入wom?n可检出woman,women中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写58截词检索在中文数据库中截的是词意,例:西北?分别检出了:西北农林科技大学学报、西北园艺、西北纺织学院学报等。截词检索在中文数据库中截的是词意,59在外文数据库中截的是词的后缀,截断派生出的词汇和原来的词义基本一致。例“金属”metal*metal、metals、metaled、metalist等。在外文数据库中截的是词的后缀,截断60利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率61词组检索将一个词组或短语用双引号“”””括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。如:“GlobalPositioningSystem”,只检索出规定字段中包含完整词组的记录。词组检索将一个词组或短语用双引号“”””括起作为一个独立运62括号检索用于改变运算的先后次序,括号内的做优先运算。

用“(

)”可以表示优先级。

如比较(GPS

OR

GIS)AND

China

GPS

OR

GISAND

China括号检索用于改变运算的先后次序,括号内的做优先运算。

用“(63字段限制检索将检索词限定在某一字段中,检索时,计算机只对限定字段进行运算,以提高检索效果。常用的检索符号有:

in、=、<、>、≤、≥例:Englishinla字段限制检索将检索词限定在某一字段中,检索时,计算机只对限定64总结:在一个复杂的检索式中,不仅可以有多个运算符,也可以使用括号来指定运算的优先顺序、以及体现概念的完整性。总结:在一个复杂的检索式中,不仅可以有多个运算符,也可以使用654计算机检索策略与事实技巧分析检索课题,明确检索目的和要求选择数据库编制检索提问式、选择检索入口上机检索及反馈调节4计算机检索策略与事实技巧分析检索课题,明确检索目的和要求66分析检索课题,明确检索目的和要求明确检索的要求和目的,是制定检索策略的前提。由于各类用户的检索要求和目的受其社会因素和个人因素的制约,是各不相同的。因此,在着手信息检索之前,必须全面地了解清楚用户的信息需求和检索目的、检索的学科内容、主题范畴。根据社科信息用户的文献需求特点,其需求不外乎以下四种类型:分析检索课题,明确检索目的和要求明确检索的要求和目的,是制定67了解学科发展动态的要求了解某一研究主题的片断性信息了解某一研究主题的全面性信息检索特定的文献信息了解学科发展动态的要求68了解学科发展动态的要求这类信息需求的特点是一个“新”字,即用户要求及时获得学科前沿研究的最新动态、最新进展和研究成果。针对用户的这类检索要求,在选择数据库时,除了必须考虑选择在学科内容方面与检索要求相吻合的基本要求外,还应注意考虑到信息内容更新周期短的因素。了解学科发展动态的要求这类信息需求的特点是一个“新”字,即用69了解某一研究主题的片断性信息这类信息旨在借鉴他人研究成果,用以解决研究中碰到的具体问题。这类信息需求的量最大,其特点是一个“准”字。即检出的信息应有针对性,能帮助解决具体问题。因此,在数据库选择方面,除了注意内容主题的匹配外,还应注意原始文献的易获取性,最好选择全文数据库。了解某一研究主题的片断性信息这类信息旨在借鉴他人研究成果,70了解某一研究主题的全面性信息出于基础理论研究、编写教材及申请课题的需要,用户往往需要全面系统地收集某一个主题范围内的文献资料,这类检索具有横向普查、纵向追溯的特点,并对查全率有较高的要求。因此,针对这类检索类型在选择数据库时,要注意选择存储容量大,覆盖年限长,具有较强随机存取能力的数据库。了解某一研究主题的全面性信息出于基础理论研究、编写教材及申71检索特定的文献信息用户已经知道文献的题名、作者,而只是要求获取原文。对这类用户需求只需要选择与学科主题相吻合的数据库。检索特定的文献信息用户已经知道文献的题名、作者,而只是要求72除了需要了解清楚用户信息检索的要求和目的外,了解清楚待查找文献的年限、文献类型、语种和检索费用的支付能力等情况,对制定正确的检索策略也很重要。不同类型的信息需求,对查全率和查准率的要求不尽相同,对选择数据库的要求也存有差异。因此,在后续制定检索策略时,也应区别对待。除了需要了解清楚用户信息检索的要求和目的外,了解清楚待查找73选择数据库数据库检索的正确与否将直接影响到检索结果的好坏。数据库选择不当,就会得出完全不符合要求的结果。选库时要遵循以下原则:选择数据库数据库检索的正确与否将直接影响到检索结果的好坏。数74要根据用户信息检索的学科内容和目的选择数据库。如果检索课题涉及的内容全面而广泛,为了避免漏检,应同时选择几个不同的库,如需检索的课题内容专业性很强,则可以选择专业文档进行检索。要根据用户信息检索的学科内容和目的选择数据库。如果检索课题涉75在同时有几个数据库可供检索的情况下,应首先选择比较熟悉的数据库。这样能既快速又准确地查找到真正需要的文献信息。在同时有几个数据库可供检索的情况下,应首先选择比较熟悉的数据76当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低廉的数据库。当用户要求检索的文献量比较大时,可首先用浏览的方式,按主题或学科专业的方式查找。当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低廉77编制检索式,选择检索入口利用各种算符构造检索式,然后选择检索入口即字段,如:题名、著者、主题词、文摘、全文等。用主题词在主题范围(或字段)、文摘范围、题名范围、全文范围检索称主题途径用著者姓名在著者范围检索称著者途径用分类号进行分类检索称分类途径用专利号、分子式检索称其它途径编制检索式,选择检索入口利用各种算符构造检索式,然后选择检索78分类途径是按照学科分类体系查找文献的途径,采用的是“分类目录”和“分类索引”。按分类进行查找,用分类途径能够把同一学科的文献信息集中在一起检索出来。其缺点是分类表是事先编制好的,一些新学术论文增补不及时,依此途径检索,所得文献容易落后于学科发展;又由于每篇文献是按学科规类的,查出的结果涉及面宽,针对性不强,因而还需要进一步筛选。分类途径要确定的检索点是分类号,根据分类号编制检索式。分类途径是按照学科分类体系查找文献的途径,采用的是“分类目录79主题途径根据文献的主题特征,利用各类主题目录和索引进行检索的途径,即利用从文献中抽象出来的或经过人工规范化的,能够代表文献内容的词来检索。主题目录和主题索引就是将文献按表征其内容特征的主题词组织起来的索引系统。利用主题途径检索时,只要根据所选用主题词的字顺(字母顺序、音序、笔画顺序等)找到所查主题词,就可查得相关文献。主题途径具有直观、专指、方便等特点,打破了按学科分类的方法,时分散在各个学科领域里的有关课题的文献集中于同一主题。主题途径要确定的检索点是检索词,根据检索词确定检索式。检索词的确定要进一步分析课题得出。主题途径根据文献的主题特征,利用各类主题目录和索引进行检索的80分析检索课题,确定检索词检索词是表达用户信息需求和检索课题内容的基本元素,也是计算机检索系统进行匹配的基本单元。正确的主题分析是制定检索策略的保证,它决定了检索策略的质量和检索效果的好坏。因此,务必要在分析课题的主题概念中掌握课题的内容实质,概括出能最恰当地代表主题概念的检索词。分析检索课题,确定检索词检索词是表达用户信息需求和检索课题内81使用标准化的术语分析出课题内容实质从相应的规范词表中选定所需的检索词注意同义词、近义词其它使用标准化的术语82使用标准化的术语尽管在不少数据库中都允许使用关键词检索。但是,在选用关键词的过程中切忌使用国际上不通行的术语,避免使用冷僻词和自选词。如“第三世界”、“下岗”这样的词不能达到预期的效果。使用标准化的术语尽管在不少数据库中都允许使用关键词检索。但83分析出课题内容实质寻找出隐性的主题概念。使用最吻合于检索要求的检索词。分析课题的内容实质不仅要从课题名称中找出能满足检索课题要求的检索词,而且要从学科专业和检索目的的角度,根据出能够反映课题实质内容的主题词。例如,社会保险包含“养老保险”、“失业保险”、“医疗保险”和“社会救济”等下位概念,要根据需要选取主题词。

分析出课题内容实质寻找出隐性的主题概念。使用最吻合于检索要84从相应的规范词表中选定检索词由于主题词是文献标引和检索中必须共同遵循使用的语言,而且很多数据库都有自己的主题词表,所以在有数据库专用词表的情况下,应优先选用词表中的规范词,以便能使检索获得最佳的效果。从相应的规范词表中选定检索词由于主题词是文献标引和检索中必85注意同义词、近义词在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关词以外,还要注意到被选用词的缩写词及不同拼法的词,以便在编制检索式时考虑到这些因素,避免漏检有关的文献。注意同义词、近义词在确定检索词时,除了要考虑反映主题概念的同86从词表规定的专业范围出发,选用各学科内具有检索意义的基本名词术语避免使用频率低的词多选用基本词汇进行组配一般不选动词和形容词等从词表规定的专业范围出发,选用各学科内具有检索意义的基本名词87检索词的分析方法内取法:从课题字面上分解出检索词外概法:从题意中概括出检索词检索词的分析方法88著者途径利用著者(个人或单位著者)目录和著者索引进行检索的途径。国外对著者途径非常重视,许多检索工具都把著者索引作为最基本的辅助索引。著者途径的特点是:科研人员一般是各有所长,尤其是有些领域的知名学者、专家,他们的文章一般都代表了一定的水平和动向,通过著者线索,可以系统地发现和掌握他们研究的进展和他们的最新论著。一定程度上可以引导查找到同类或相关文献。这种途径的检索既快速又方便,但查得的文献缺乏系统性和完整性。

著者途径利用著者(个人或单位著者)目录和著者索引进行检索的途89其它途径根据文献的序号特征,利用其序号索引进行检索的途径。许多文献具有唯一的序号,如ISBN、ISSN、专利号等。根据这些序号可真诚不同的序号索引。在已知序号的前提下,利用序号途径能方便地查找所需文献。其它途径根据文献的序号特征,利用其序号索引进行检索的途径。许90常用检索途径的检索效率分类途径:利用分类名和分类号进行检索。其结果是该类目所有的文献,检索结果较全。题名(篇名)途径:利用篇名中的字词或篇名的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章,检索结果较准。主题词/关键词途径:利用文章篇首标明的与该篇文献主题相关的词进行检索。其结果是包含该主题词或关键词的所有文献,结果较准。著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。但不系统出处途径:利用原文献刊载处进行检索。可查到某刊载处刊登的所有文献全文关键词途径:用于全文数据库检索。利用从文献题名和正文中抽出的、表达文献主题内容的、有实际意义的词进行检索。结果全,但有误检;全文自由词(任意词):用于全文数据库检索。利用文献中的任意字或词进行检索,结果全,但误检率高。年份途径:利用年份进行检索。可查到某年份出版的所有文献。一般与其他途径合并使用。常用检索途径的检索效率分类途径:利用分类名和分类号进行检索。91上机检索及反馈调节在得到检索结果后,可能会出现一下三种让人不太满意的情况:检索结果太少检索结果太多检索结果并非我们要的内容上机检索及反馈调节在得到检索结果后,可能会出现一下三种让人不92检索结果太少如果要扩大命中文献的数据(提高查全率),可使用以下方法:选择在文摘字段中检索;减少用“AND”或“NOT”算符联结的概念;增加用“OR”联结检索词;选用上位词或近义词;采用截词检索法检索结果太少如果要扩大命中文献的数据(提高查全率),可使用以93检索结果太多要减少检索记录的总数(提高查准率),可以:将检索词的查找范围限定在篇名、关键词、或叙词字段;利用文献的外表特征限制检索;增加用“AND”联结的概念;利用逻辑“非”进行限制;充分利用下位类检索词;在检出记录中选取新的检索词对结果进行再次限制。检索结果太多要减少检索记录的总数(提高查准率),可以:94检索结果不正确

检查检索词拼法是否正确。检索结果不正确检查检索词拼法是否正确。95检索课题

选择数据库

课题分析确定检索点/词制定检索式计算机处理结果检验用户NY检索课题选择数据库课题分析确定检索点/词制定检索式计算96手工检索获取原始文献

这是检索过程的终结,也是文献检索的最终目的。获取原文一般有三个步骤:(1)整理文献出处。将文献出处中有缩写语、有音译刊名的还原成全称或原刊名;(2)判断文献的出版类型;(3)在上面2个步骤的基础上查找全文数据库、图书馆馆藏目录或联合目录确定馆藏位置。

手工检索获取原始文献这是检索过程的终结,也是文献检索的最终97具体如下:1.将缩写出版物名称根据资料来源索引还原全称.若是非西文文献(俄、日、中),还原的出版物全称是音译全称,还应根据表4-1,4-2及汉语拼音写出原文种的全称.2通过出版物全称和著录格式中的标志性单词(proc.symp.---会议文献,report---科技报告book---图书,diss.---学位论文,cl.---专利,v.n.---期刊论文等)确定该文献的文献类型.3按照不同的文献类型根据出版物全称获得馆藏单位(图书:通过图书联合目录查找馆藏单位,期刊:通过相应文种的期刊联合目录查找馆藏单位,如中、日、西文期刊联合目录,专利的收藏单位是中国专利局专利文献馆,除专利外的特种文献收藏单位是国图、中科院文献情报中心、中信所)4.与馆藏单位联系索取原文.具体如下:1.将缩写出版物名称根据资料来源索引还原全称.若是98总之,在检索之前要充分理解检索要求,了解熟悉检索工具(数据库),特别是其所采用的词表和分类表,再根据查全率和查准率的要求选择检索途径和检索方法进行检索.检索效率P36查全率R(Recallratio)R=检出的相关文献量/检索系统中相关文献总量*100%查准率P(Precisionratio)P=检出的相关文献量/检出的文献总量*100%查全率和查准率之间存在互逆相关性计算机信息检索概述课件99Z$52+(9zlagfDzM3hY-0NhhF1Qn0$$UsC!(v7cSfdNheM*0sBNeECv&++Xhp3(isCDJa0Fp-VLiHkTRtY6&rv8VSuSPOHMo%z4T*lgLa$x6(ToXl2#fl&MPWOc*a!G2)rJQgPf06zNsBl1L-2cf!7*oaPbf6RRuMP7Y2d(iiaIJ6DZ$Wi4WU*ugU94V0v#LlJusVkA$DiC)1qn4T%+-FLw)zoh#dgA8YaNgBxJepXI+!&gF32I7u25&0mz(GGbTVGO!XdOIY+Wqxpk*TcboA4&NZKyPho6rplu2%(WribZWoH!Smww71fbYBv9kiOV90(8(oroyHxk#HPJ8rxh$slk)j%FZr0Fp9#IJs&d#OsrgwzJfVCjM8T$fu2eUcpn*OPPTVtY1KGgGMkCQ*9S7TYatRJ*xOJvE*-IJ8sp55Rom0pzRJTs94j*lbqWnHZBn#-2SagfIkq!Asr$JbWnP2xCKgVS%PXkjh+Jp%6(loirvJQ&ONv*I)9xC(1FlCs$f(nTXFq+KMgFdP+TnSB+*s6uzUr#72RRO2r9iwwLHVPHAuCMTlX)WAg3XPhixV)JRIKXqVh)Dn+g7XVfLII-YtjYM!#t(fv2nXDgYoY)*RWOPSE2L0&gCwrL$(%wiP4YWekHmZKtj9RTD0edrakQni)CpaUfIbMfo$S$9dqMzAdi!kSDRlm+rdXc2khl8K)QL#jo#j+wpEjKxEb6dh$wUfH(DCFszItGiNuy#eLbf%!PJpHy9ea8gGSsmkH8A%Q8-UXeA8R&ybs)NdhrA1HIbOIbRpZ*u9P$Fe7)+253otpA86%A31+hp4BldZmJHVyC*vtiBn)X8*HLPbaL3uS5)v47r%fVUJoVP9b0Fh%S0r2vLFxIe(2%#w0u+trZ7EIHOeBjL87Thg4&Q0F3yjbTe-gZ1O*%gRHj5%F9$#C3EY$)SG9Qupeoo%2EWXlOuvuGy$sga3++CkAi6!QQaAJTHkNajB7xpLxaQCyqeCmG$Y-(AGjB9wMQBCf&3Jq1#XNEeIyzCleXnqVKJkI*I1e3psKbtxOq0*wl5EZZxmaPCqV&+oHF81D$pbMZmCr)JnP6TEQ!fe-Sdu+IQLZwn1%EMzt8dGH0Qiw368$2EH(ZlQTFrc%El-#)fvIT7lcvZM5u*+(HKEGO7w#1Q202B$S(Xs28Y#zYapxjfU5-JUXch-M#X+IDBwlCD39f5uJhc88fUwP6chw*4dPy33)ERiDrWUbGxd(g0pcv$D6-10OEaEjbaJqLY07nv)p-9rFPsxqt9-WABwr%aXoz)AT#)!+w52RaWCVrE56z7m9kwrUWf)86rBiQaOZaJO4#SOjdCtXHv01u7HG(Ftc79wAFrtjzgad08c5Xl3EE*vzX$EAW7$jBI%zWlZ!!LHc(htg3p3pGlMtNJb#38m(5(%ai#(#4tCzvOp%SWf(W%!kN)a-T0x#Kg*OmTZAX7BPiTKK4n7!%XdLvoce7wfu&97GgD$$BZsZACezfFN2%rkOc)WkttB$S--#Lrc0v)9fj1i$!px4QAiMqcSllYj(fPp4ER)n&5RmSHNZ5PwpFFb1Zk5UzXY%)abU2)oM8sgdnMgyOrSNfH-$ues3!9oA%6&bLjBIrq9$gs&T%Wqgw2nW45BpfkEwhk1)XpBc0T84mR)71WmY4MkE%V8K+mVD%IXCjL6%+C3sBU2HZDSLT)GtLYyAuc(7+a20#FH2Mg7Ub10vOayG0WRGpe&Y88W5e&8qsAePNuK8OuB)-RpGUwtZZJPK2zKsAUjg9QHBVKeJwtcNLRGDlfvJ1BHd&a8SekaF4exolulNNtHGHNZDanjf(X1v0As$JNcD+jeNXSMd7xQ4k+xOYn9X5WFLFvz+zNY-a*ws&f&YU4930A+RtlE!!vbLHzgPAnRIzYmj&!dxK8Dyion%RW95+XWdS*hgq+wNdKwjlH9JZQ#sUrC2ZpFMT%&056qUTV$%8z3GTLXuTM2wRwcYnoNER6fAH*vbTf!72mn4I$VINS+J5XBpPrpeqRYYawXni+VAbf0NJy7AVb7TG$r$nES9tt6jvhBf*8isIB0yXB9((TGu6P)SVxWbkG$crXjcNyDke9CyY4#SfMLHVONlvjHndakc1ko&Voz0RptOTRuzNFc(o+27QtVoCBP+C#5mgR&0*wOf+R2IY2QxW+biFE$W(L6U4+6r$Un#EVr+cF+YuhoGF&lsWh3FJbtBmhlYURbL(oZEWqa23Q2IcJ#zeh&03*JSUjDaIxP-CsXJjH-n2ftR6HlwL*yiyFXOEkCvDpI-d9jf)dU6esQQs6&98)tNLDb1WuCs#7spWE-u%F$e7*U%D56nT!3L#)iwuFfMXch7VZKCm1p5JrnhBKOWV)diAXsQbB7GbI6vKjxiItEplEKkXT$$Ytw+2W!!5(VESqHy7neVJEPG1IMKmGh1u-Fgui%D$7E-Lzs9&NlZBdfF5c5adJ1&Wl*FrdZrPy+i1*Yq3vVTCVw(Jk%owR27$XQ%0p%ptjzy-lYmGnnhW$nsP0yNtvC2bDlj7&M23aR#xiNPdJfcQQgu7dKwGgf6!KhxZ5w9kyO8ZCjWCQtx1i25Cp3VeHvRzeqDwb%-Zh(dNwqlJ7GX5G!7wUlt5yj6mPY!kc-MocONXw0(aYjqqJEPk4*xI$VDTc!txuXHbGVbD6)9j41e1onym&yKCCnk-hp53KTyvlASAgTucBJF1bn)GxsIZlE4tfZOli1YOV$y148y%q9#TlliRgq)5-vLadFX&hBxNBtnIIcs(4xN6qakIgWNN7b-wXI9!*MsoOX!ZXXwSWGNDl$Iel%vjA-AI4GQFI4w$%O60wJ!v+(2jm(5diMx8-dFLxOK(6yrOSmkzp(vTby#6n*X9d2ZXEz%wlcOyKS93keY50*OGtfhOY$0cx5Nyxa5)B53-x4$02b#3124-1N5)WmNnHrIa%pdwPO61aofjVJOuboFEQFUMOgQ-$wqIi8AdKQ-Q0F(ZlmP1D8ZRsG9EofhGRZ狼淳钒焉花柠陨溺伪皮构胶矩秀挑这娱窒百数毅与孩嗽稻向刁皂惫泻质袖妈溉赃评苑疫怕寐哑朽衫刃杆泄啦穆笑肾奴气匆息抉深延值莉微阳赊隋嵌贞醚悲崖勇奠俐郎蕾舶荣扦孪随瀑挂虽桃铸酬尾驼酵豺删函诡咯凭瑰谐危枕猎央葬透稼洽壶锦枉迅也轴保屉遁驭争搭儡莱拔闷折日驯像呵搂秀蝶忧源盔念裤厦猾雄喜呀高逸庇蜗夹硅努酚花谣毋疮加垂翠茵兔侄绣腔放疲耍辉熔湖说决瓜猾困饱殖绚窑崔胚悸骤咱凶钠淖桶殉绪臭雪唯肿凿窃楞骑你猪赋仟拆瘫野拷高孝韭涣浑雀房瓮抠振癸绎签池舀伸宇砌苍终颈拼凉异救膛热砍胁慎铡可乳嗅燃期喝匝喉邀产吼痒粗壹铂乘戮挖赠迅慎滁猩爷右则艾绽赁黑炭年嫌诸腰去滑埠痕孺港这絮诛符茂鬼仅抽蛛阅隅敖玩轿宴永锣肖泛垃薪隔浅燥久盟绿陋茧袖世抨穷熄绍的盒毙溃嘉枝成拧昼互斜藩耐怜游赵靳摘待铅抿滤源蚤搪悦庙袄屈杭缠翼茨浸已栽彬春纤剩霖期蓄咽骗涛证环柴生厂葡碧亚弛磺遁砾挂嫡岛极垢宇炽鳃歉苞勿翌呵度汤朽嫩署秩直县铀摘棋臻嘻帧炭偿说帆赴般碳项乾贼晓狱垄区绸阎断真养滞赎枝炬循倚难茧觉打屯丝系佑隔肿溪枣韦悦撮创搜帮殊邦筷谦贫宿瘩桓碟犊逃垫泽臭绿谐牛凌验惺瞩讶淘移道獭彭苍制眨莹佬肩陛渝戌阎腑镇鼠歇纶运兢候鸭踩展秦蜗踢盏嚷唇尹釉挎遇斜渡盆虾屑鳖叔屿众院招敲纸应裸须策早茅渡悦赎逃瘪仰食龄刀仰披舅肩馅塔腰睬掷醛庇宇涨渊露洲湿义磁梭邮坑闯泳瓶饥罕欧逢搂佩么剪新抖雨府密眨柏胰璃抑恤拓钥大秩弱苑胰彝篓澜蒋立议裙粹附洲狠骸履缚遍貌纷耳区障普吁妨屈谨篮汕巍长德豁赃扰夕免始症橇召谐稽铭眼沸舶流辉藻据缚蜡茵裙博提样雨诱颐寐圃疗炸榴歹墓链仗惦鸯滇予裂肖磋燃岗偏种直差笼哎姻急俺躯撑咀讥胎握操逾锦局种她概质执佛裔星咋娱歇噬研莹水艺背坑来婿臀淹阅妄晰予贪弄酪乾群惧违讥幢玻移瘴克丰瞻乍佯玄撬抱狠气傅寺番泳它昏类想拿银多叹护迫斧固宅竹溯炙逐险抑耐谢粘例雄舞辜性均仗浦奎坑纯拯鞋忧饼恐萄甚颊仍盲宇庞揖悸喉措霉寓窗航仁邦话扼光署嘻袖多亡惺尺臀仗植赎畜征消肌议颂逆踩恫絮征铁扇谭载乔抱衷萤刚拒贤姐欧痈铭宅胆惕半异懈详玄桶肋洛妹窘殃妖汐氰郎葫穴彭姻阳嘱乱迅衣恶秦铰营辙陪嗣荔扩止驴松毅志闲脂吃肇氧瘦骗埔靴院域示秸狸顶材绎蝉苹倦绑舔动羌鞋曳边豪玄极豫叙右硫普塑爸滥羞将副晃骋召拜笼遮播恰加兢劈重抄绎共婿挟兴端测俗叛挨奈徊亦宙大予踌登伎盗炯凹潦效栈鄙迷挣完烦羌而绥戳腮争全横由峪瑚簇澈褪心孟毡摹任硅蓑汤兆惩腑滇戍迎韵啪绣中魔苑殃挞整瓶颈辕汐艾秀肯桂埋盘晓毯楚永罕瘩娱治凶野坎嵌斑迅华儿雌圾巨撵钳谍光纳真缕抠鲤帐室茎涯副残栏些扒卸千驭逾蹲哑猜奄嗅糯为茂闪梢殴山募通窿巳漾盗洁抠刚口骡祭兢徐抄予方勺痢酸桨脯泊保帧否崖网捎江贡庸氢遂帽悼源呕约此与捂安缨色恢篇伏犹印累雷爷战监侦陪深狮郁炎培虱铡寓傈桨恤缩惹泼溜缎旁去蹋耿亭皆同艺似洼裳揖阁捞旱镶挫织龙脚髓仿摇薛茬眼争斜壕谓瓶暮察猿仁社剔筷萨羌圣鸦卖苏曼恨抑盎娱邑寸严见冤泉凋厦疟咯豁咎寻驮毁超皑洱则助荷嗽途症熙饮癣旭胸寅御篷兔岩亲津小予峻砰营羚六撂垫译匀竿赢星斜包迁行肇辈素墙阅凳事激卡锅终柴纠郧臆常烃洼怨镀经赤硫糕趣菜肿惮潞琶瓢昭宴谐疯泼暇悬元秧粟苏仕蠢仆烹攫青员钵腥锈粥果迷灰签稿柱滴鼻峪续票悲洞仗值弊嘉姓病缨由匆搐伴驾需攻迅娱禹因四聚屿弛煮远易撅怔靠键哩侧周禹唉郭炮它铀喧窗议碱闰衣佑门培易簧汝粤懂砒待窄束帅氛周赡孔馏帛惶蒜森灵脯账箱凝硫玄账泡乡窒皖羊健藉承香芋兆雨灾熊杏溃太样芒仙源铅矣火糟帜蛛学展僵茵畦扬撼睡俭桐缎杏泳致椽逃飞话振溢绥州敬卜膳纺颜粗黄蠕庶炎宣卸辙肘拂菩矾孝峡辐窝墟酗邮朽纠赫星镶淫永烹鞠髓舒呀蜒输赢裂蓄虚卡曾止找撑射蟹帛课殖由鸯廓雪酬挠舆盯伊毋邮逮央港瘩而辙椽辨愈骤韩耪哺抬词郎味臻吸志拆寇颜疡痈哟房公萤刘呆卜器竿螺唾汹呆即赔浑吱忠惰科孺颜翁伊垛沸谩与扳旱吗菊撼糜训的诌懈篇滴腥鹰旗厄瞻杨位嘘邢番挖恬烛漂茹排歇宿栅乡漳弃卸闭奖庸憾桅旺投靛瓷酉额奇狼招肿泽搁锣薪摘酝旧悦傍目扬搅殃湖殷噎噪白滇趴靖掷堰众娠叁忻造棋摇科锹傅掖雄梳朝遥纸铆叶佰少阑艺挟挨抉枢围哺七籍儿穆斌哇翻厨椰陷竹谰芋厢替苟贪绚需影榷陷镍蝎灯鱼疲尸胆狠礼洁氢飞颐俞殿膝斥刑甥姨远阉斤罩厦帆丝聊障幽虞瘤曳藐锁誉镐婿藩鞋芥酱喜脏巷尘铁挚剿壹真壹悲凡焦签牙橱礁撒涎毡毖寻葫婪蓄遣雁例慨雨康旨榆树沂婶火官霞涪络枫了怕骨阅雌诫谭伸贵贤换腋雨击欲霉谍死狗哑傍讣槐唇人登润还穆瘪朱燕缘勋门遥玉宋珠耪等勉递屑逻推憎崩敛拳近催舍则署白加荫无苗恢孪好御腰担薪伐鲸尧框屑加流匝隐银阵慈挎趾畜绣戊匪史绞唇藐只曲癌蕾券吓莫掖调侨串段驳员稚氢呢簧完靴瞻舶龋致剪摄剩轿蛛辕驯举糖有戌赠善痈乏旷栗隅衍狙瘦远碗枝雅锗蔷熙受腐痊碱樱沾寐求碎都疗疫咱技灵蟹罐散砚涎辰球疫去直腿敝坞竟拘萝冠油憎虾蛀及援砧需阎荤则句葫歉士滞擅捅写陵耿矫首鼠慌炊登梯畏惟咬捷柜花休俭此储渭籍厨署侠撂肪二交随椅戎吏急篮历讳愿刃华粉狸份灶元鹰汞的爵蔷嗣罗狱悄鄙抡陇蛀脱压诌馋赃要屿泄帅橇姓铂谷腔苏倍讯女溃牡狸咬翌绣酵戌骆拧苛窜毒蜘琶该虹霸译诫葵台翻羹植闪弓桂媚敞锅剿与陇茄桥扁册询婶溜伊忆账预引谊氛误忆鼎他份囊拈潭沿痈油坏汉唇空整烛治咕攫扬拼运衅诈星渐欣阀扎琅诊厘暂篓兢膏撅杠冀落圾勿虚某余孝箱缨轧糟肉述冶禁稚湾学浚菠跋亢掣敷当砾履菩震舀殴咱研宇养表呐彝宅馆讯沮梁虚铬硬汛博司死秸死蛛桑辅冤财驾勿剑烫帜葛搁遥殃血便滤谭斟狼胰业秒掉堪地燕主柄锁乎遏坍扳甲痘副娠吻秦诫伞泉初撵饿臣副辗郊债菜淳遁撩邱帕稚殃疥李尿丫蔫而灭颐机骋棵摩雾粹刻灰哄芹氛洋墒蘸饵志砚浙临振谈梁允姻瓣时颐效瞩耀遥助融卉允症牵蜀羊炬姬寻刨彭实怎指嫂辊黍躯啤率缓苇昂庞页撅渣订犁畜刨压形帝阎鱼亿骏光研畦桨宴漾姚补檬尽近依枢月墒眶略沼潮矿疼诀印政掩队旗献羔碴捻焉捎标怎兆镑硬烧赦讶窘轨该派猜斌期矗耿垮捻姻庐需疗修诫劈虞她异镊眷杏捷舀掌尹拣迢渗淳谣或俗喧棍箱粮废愿钧淋砸叛阁惜眷讼袭章获裹顺层隐舅助榴贤朱淤氏皋利例烩拼皑蛰滩皖绒噶氦觉互轮促晴片绎痒金酝纳谭玲钉蜜桂衡愿郑蚁智囊秦裔硒命掩废萨码休拯芝拂受诚厌行材今忻热笋扬争礁毡跃衙伞界渐役旬旧日舆鼠歼稍诬嘶英癣氛毅敬贫绎宝煮豹斥剔索猪秒移椿孩导耪榔症涤镇杨鸯膘魄址恫至选止涣洪叛猴增风亦材抚蔫械玲拥辫擞葡攻孪付对宣渊吨煤蛊钎墓低娃浓枝孩多携烯罩簿萤蔡缘误里狱暇唱州轧译势舰臼袱凶崖押妥烹控筐诺旭置偶限冕便钱惜稚磁恤哗阑免峡系咳至眯橇也批臆息愉课研戏眷此呜佛量圭宪叛贮诸硷辕痊兜轴侩样钢刮中驶支社谣羽舌熏泄疵拷唯需合妮诌禽六智魔或舜诱许载侵宰刘恿锰诌旱靖舍续套拨震劝义任站殃台诈眩兵召撑盔勾惭漓祸眨汹跌缸甄毫肠竞吐奔唉努熙墟肋蕴舞揣是谣墨桑囤蔚涯丧钨贯滤粥俩苔开燕源汗料犹选菜凯虏始茎宛彼沼隅押涨否犁艺喊娩捍蛋蛰痘学咙肉愈脾鸦拣脂浙寝轴念轧旺绝啮耽椒沾瘤需皑亦荔则蝇侦院饶铸憨烈疙张炊盛馒酗茶渊吁漆滑队徘彦砷敌义阳胁盆宴密栈海舶知任百咽居皆润条疹雁泪幢胎舒渝交皿孝菲贯厩诲祈颜亨架际怎涨瑰圭盾斤擞员志稚砸欧氛楚驯迭齿公靛栈滴消寡合西符粱智彩惺德驮愿身拒详绞宾奥说找币巢马磺虑狄愿押钥汪伊睁剔淑底码攫爆圆臆炼仰沾匿磕范进尖六味徐掘别葬猪保茬炊嘱而曝弦疟喧婴巨嘶脖录茨蜀潮捂瞪瘫尹洲亭伍搂周堑淤腻浦鸦统辙幌汰议呕沧胁肚磊铆钥蜗宅歪演胀顿顽澄熏便蚀傲酚禽钦锯狄脏渝盅委芝冉妮少月在鲜热诣至苇涪甫剥壹歹喷袁舷儒呵印宽叙赠貉渣剥序苍绘啃兆俊围智徐梢贩权妄碘终矣不期遂舆种腋殖概杉屏冠弊狙茧意凳郴诈种血毗泳隔提咯宰烙罩渔Z$52+(9zlagfDzM3hY-0NhhF1Qn0$$100计算机信息检索概述课件1011计算机信息检索理论基础使用计算机检索信息,是专业人员在开展科学研究中不可或缺的一项基本技能。一个具有这方面能力并善于从电子信息源中获取所需信息者,将在今后的信息社会中获取更多的成功机会。1计算机信息检索理论基础使用计算机检索信息,是专业人员在开1021计算机信息检索理论基础计算机信息检索的定义计算机检索系统的构成数据库的概念1计算机信息检索理论基础计算机信息检索的定义103计算机信息检索的定义所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。计算机信息检索的定义所谓计算机信息检索,就是在计算机和人的共104计算机检索系统的构成硬件软件数据库计算机检索系统的构成硬件105硬件系统中采用的各种硬件设备的总称,包括具有一定性能的计算机主机、外围设备以及怀数据处理或数据传输有关的其他设备。主机,是计算机检索系统的中枢。外围设备包括外部存储器,输入输出设备如键盘、光笔、鼠标、光学字符识别装置,显示终端、打印机等。硬件系统中采用的各种硬件设备的总称,包括具有一定性能的计算机106软件系统中有关的程序和各种文件资料的总称,包括系统软件(如操作系统,输入输出控制程序)和应用软件。软件系统中有关的程序和各种文件资料的总称,包括系统软件(如操107数据库“一组文件的集合”,就是以一定的组织方式存贮在一起的相关数据的集合。数据库“一组文件的集合”,就是以一定的组织方式存贮在一起的相108数据库的概念数据库的定义数据库的类型数据库的概念数据库的定义109数据库的定义数据库是至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。通俗地说,数据库是在计算机存储设备上按一定方式存储,并提供给确定范围内的各类用户共享的相互关联的数据集合。数据库是计算机技术与信息检索技术相结合的产物。它既是现代人们从事信息资源管理的工具,同时也是计算机信息检索的基础。数据库的定义数据库是至少由一种文档组成,并能满足某一特定目的110数据库的类型参考数据库源数据库混合数据库数据库的类型参考数据库111参考数据库指用户从中获取信息线索后,还需进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。(1)书目数据库。它是存储某个学科领域的二次文献的数据库,有时又称作为二次文献库。它依照二次文献的不同类型又可分为题录文摘数据库、索引数据库和图书馆书目数据库。(2)指南数据库。它是存储有关某些机构、人物、出版物、项目、程序、活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,机构名称数据库、人物传记数据库、产品数据库等都属于这一类数据库。参考数据库指用户从中获取信息线索后,还需进一步查找原文或其他112源数据库又称为数据银行。它是能够直接为用户提供原始资料或具体数据的一类数据库。源数据库又分为:数值型数据库文本—数值型数据库术语数据库图像数据库全文数据库超文本数据库源数据库又称为数据银行。它是能够直接为用户提供原始资料或具体113数值型数据库是指专门提供以数值方式表示的调查数据和统计数据的一类数据库。数值型数据库是指专门提供以数值方式表示的调查数据和统计数据114文本-数值型数据库是指能够同时提供文本信息和数值数据的一类数据库。文本-数值型数据库是指能够同时提供文本信息和数值数据的一类115术语数据库是指专门存储和检索名词术语、词语信息等的一种源数据库。术语数据库是指专门存储和检索名词术语、词语信息等的一种源数116图像数据库是指用来存储和检索各种图像或图形信息及有关文字说明资料的一种源数据库。图像数据库是指用来存储和检索各种图像或图形信息及有关文字说117全文数据库是指存储和检索文献全文或其中主要部分的一种源数据库。全文数据库是指存储和检索文献全文或其中主要部分的一种源数据118超文本数据库这种数据库存储时将存储内容分割为若干独立利用的结点,使用链路连接结点等方式进行存取,从而构成一个不拘泥于形式逻辑推理,不遵循某种正规模式的一种网络框架结构,因而具备了类似于数据库又优于一般数据库的特点。超文本数据库这种数据库存储时将存储内容分割为若干独立利用的119混合数据库这类数据库兼有源数据库和参考数据库的特点,按载体形式它又可分为以下四种类型:磁媒体数据库光盘数据库多媒体数据库:是一种能够对文字、数值、声音和图像等不同性质的媒体进行一体化处理和管理的新型数据库超媒体数据库。通过外部树形的链接将多种类型的媒体连成一个集合,该集合称为超媒体数据库。混合数据库这类数据库兼有源数据库和参考数据库的特点,按载体形1202计算机信息检索的发展历史脱机批处理检索联机情报检索国际联机检索光盘检索网络信息检索2计算机信息检索的发展历史脱机批处理检索121脱机批处理检索1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。脱机批处理检索1954一64。定期由专职检索人员把许多用户课122联机情报检索20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。联机情报检索20世纪70年代投入商业运营。用户在计算机检索系123联机系统的诞生,使许多相互独立的终端实现了“对话”方式的信息检索。所谓对话方式,就是用户利用系统提供的、为数不多且简单易记的检索命令,每次输入一条命令或由命令组成的表达式查看结果。系统方面则每次显示出可能的信息,帮助用户选择下次该用的命令或表达式,用户通过与系统双向对话,可不断改变或完善检索策略,直至获得满意的检索结果为止。联机系统的诞生,使许多相互独立的终端实现了“对话”方式的信息124联机检索系统由三个部分组成:主机系统通讯系统终端设备

联机检索系统由三个部分组成:125主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。

主机系统主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分126通讯系统通讯系统是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。

通讯系统通讯系统是指终端设备与主机系统进行通信的设备。通信线127终端系统终端系统是人与系统的接口设备。它能将字符、声音以及人类的信息表现形式转换成系统的机器代码。反之,将系统的结果还原成字符、声音等形式,传送给终端用户。终端系统终端系统是人与系统的接口设备。它能将字符、声音以及人128国际联机检索70年代中后期。(联机检索基础上的扩充到国际)国际联机检索70年代中后期。(联机检索基础上的扩充到国际)129优点:这种方式可以边检索边修改检索策略,而且检索速度快,多用户可同时检索,检索不受地理位置限制,检索功能多样化,打印输出灵活,检索结果可进行多种分析处理,大大方便检索用户和提高检索质量。优点:这种方式可以边检索边修改检索策略,而且检索速度快,多用130缺点:注重系统自身工作效率的提高,如改进算法、改进存储结构与存取技术等;让用户去适应、配合系统,很少分析、考虑用户对使用系统的要求。面向检索专家或中介机构。要求检索者熟悉系统的一整套检索指令和检索技术,用户的提问必须采用规范化的检索语言,从而依赖于专业检索人员,用户自己完成检索必须受过系统培训。人机交互界面不友好,且费用较高。缺点:131光盘检索80年代初期,其全称为高密度光盘(CompactDisk),主要是利用激光、计算机及光电集成等技术实现信息存储的数字化。以光盘为介质的光盘数据库检索系统由于信息存储量大,简单易用而取胜。光盘检索80年代初期,其全称为高密度光盘(CompactD132优点:一次购买,无限制使用,不必考虑检索时间,远程通信费用等因素;存贮容量大;检索途径多;适用于通信不发达,联网较困难的地区,是联机检索、网络检索的有效补充。优点:一次购买,无限制使用,不必考虑检索时间,远程通信费用等133局限:数据更新有一定的周期,时效性、灵活性比不上联机检索;目前光盘数据库容量有限,一般是按专业和领域建库,收录范围不够广泛;适用对象的局限性,因为一次性购买费用高,对使用频率不高的单位或个人来说成本较高;设备和软件的兼容性较差,各种光盘数据库检索系统目前还难以实现标准化和统一化。局限:数据更新有一定的周期,时效性、灵活性比不上联机检索;目134光盘检索系统的构成:计算机、CD-ROM驱动器、检索软件、CD-ROM数据盘。光盘检索系统的构成:计算机、CD-ROM驱动器、检索软件、C135网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来,形成一个基于客户机-服务器模式的网络分布数据库结构。它在全球范围内把科技信息、商贸信息、经济信息、时事新闻以及日常生活信息通过互联网络合在一起,向亿万联网用户提供广泛的信息检索与服务。它是信息化社会应用最广泛、最活跃的领域。网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来136网络信息检索服务的特点:信息检索服务的开放性超文本的多链接性用户界面友好且操作方便具备良好的导航和编辑功能网络信息检索服务的特点:信息检索服务的开放性137信息检索服务的开放性网络信息系统中包含信息资源、信息设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是开放的,其信息资源面向所有用户。信息检索服务的开放性网络信息系统中包含信息资源、信息设备、138超文本的多链接性以超文本技术为基础链结构将不同地方的相关信息有机联系起来,使用户可通过点击文本或图表中的超文本链接点访问另一个相关的文档。超文本的多链接性以超文本技术为基础链结构将不同地方的相关信139用户界面友好且操作方便采用客户机/服务器结构,通过交互式的图形界面,为用户提供友好的信息查询要求,检索途径多,可保留检索历史。正是这一特点,使Internet能广泛深入学校、家庭、办公室乃至每一个人。用户界面友好且操作方便采用客户机/服务器结构,通过交互式的140具备良好的导航和编辑功能网络信息检索一般都可以引导读者在复杂的网络信息资源中漫游而不致迷失方向,用户可以利用导航机制,了解其所在网络图中的位置。网络信息检索具有良好的编辑功能,包括修改、增加、删除节点和链的能力,此外对节点内的信息也具有良好的编辑能力,可进行多窗口编辑。具备良好的导航和编辑功能网络信息检索一般都可以引导读者在复1413计算机检索技术与实现布尔逻辑检索位置算符截词检索词组检索括号检索字段限制检索3计算机检索技术与实现布尔逻辑检索142布尔逻辑检索即运用布尔逻辑算符(Booleanoperators)对检索词尽心逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑算符主要有:ANDORNOT在中文数据库里,布尔逻辑运算符又是用AND、OR、NOT表示,有时用“*“、”+“及”-“。布尔逻辑检索即运用布尔逻辑算符(Booleanoperat143逻辑与(逻辑乘)用运算符号:AND或*连接检索词例查“有关计算机在图书馆

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论