版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学院研究生院科技文献检索课程第八讲计算机信息检索第8讲计算机信息检索
计算机信息检索的定义与类型计算机信息检索发展概况计算机信息检索原理国际著名联机检索系统第8讲计算机信息检索计算机信息检索的定义
计算机信息检索是指利用计算机进行信息存贮和检索的全过程。广义上讲,凡是用计算机来查询特定的问题都可以说是计算机信息检索。又可以定义为利用计算机在有限的数据集合中查找具有某些特性的子集的过程。第8讲计算机信息检索计算机信息检索的定义
一般来说,一个计算机信息检索系统应由三部分构成:(1)计算机硬件:包括计算机、输入输出设备,及网络系统等。(2)计算机软件:包括数据加工、处理和检索的各种系统软件和应用软件。(3)机读数据库:包括各种类型的数据集合,是检索的对象,存储在磁带、磁盘或光盘上。第8讲计算机信息检索计算机信息检索的类型根据检索系统的工作方式,可以分为:(1)脱机检索:利用计算机的输入输出装置进行检索,用户不参与检索过程。(2)联机检索:用户直接与计算机对话,参与检索过程,可随时修改检索策略。(3)网络化信息检索:利用网络,特别是互联网进行检索的方式。(4)光盘检索:利用光盘存储和传送数据,在本地进行检索的方式。第8讲计算机信息检索计算机信息检索的类型根据信息的服务方式,可以分为:(1)定题检索:根据课题的需要,事先编写出检索提问式,定期检索不断更新的数据库,定期将检索结果提供给用户。(2)回溯检索:针对某一课题的需要,一次检索若干年的数据,或检索数据库中所包含的所有数据。第8讲计算机信息检索计算机信息检索发展概况
40多年来,随着现代计算机技术、现代通讯技术以及存贮介质的发展,计算机信息检索大体经历了三个阶段:(1)脱机检索阶段(1954——1964)(2)联机检索阶段(1965——1972)(3)网络化联机检索阶段(72年至今)第8讲计算机信息检索脱机检索阶段(1954——1964)
1946年发明计算机,50年代开始应用于信息检索。54年美国海军建成世界第一个试验性的计算机检索系统,59年建成第一个定题检索服务系统,61年CA开始用计算机编制《化学题录》,64年美国医学图书馆完成医学文献分析与检索系统MEDLARS。第8讲计算机信息检索联机检索阶段(1965——1972)
60年代初已开始进行计算机联机信息检索试验,62年MIT建成试验性的联机检索系统。65年进行了首次全国性的联机检索表演,67年后,许多联机检索系统相继建成。包括69年的NASA的RECON系统,70年的洛克希德公司的DIALOG、SDC的ORBIT和MEDLARS的MEDLINE系统。第8讲计算机信息检索网络化联机检索阶段(72年至今)
现代通讯技术的发展,为网络化的联机检索阶段奠定了基础。72年DIALOG、ORBIT和MEDLINE相继开展网络化的联机检索服务,通过电缆和卫星通讯进行易地联机检索。90年代以来,互联网逐步成为世界上规模最大、用户最多的通讯工具。第8讲计算机信息检索光盘检索阶段(1985年至今)1985年世界上第一张商品化的光盘数据库-Bibliofile问世,随即出版了大量的以光盘为载体的电子出版物和文摘数据库。在10余年的时间里,处于与国际联机检索平分秋色地位。目前仍有着广泛的应用领域。第8讲计算机信息检索
我国计算机检索发展概况1、试验准备阶段--70年代中期至80年代初期2、联机检索阶段--80年代中期至90年代初期3、网络化检索阶段--90年代中期至现在第8讲计算机信息检索检索原理(一)
计算机信息检索是用计算机代替人工检索的匹配过程。计算机一方面接受检索提问(即检索提问表达式),另一方面从数据库中接受文献记录,然后在两者之间进行匹配运算,即将检索提问与数据库中文献记录标识进行比较,如果比较结果一致,那么这篇文献可能是需要的;如果比较结果不一致,则这篇文献就不是符合检索要求的,不是用户所需要的。第8讲计算机信息检索检索原理(二)计算机信息检索的原理可以用下图表示:检索提问匹配运算数据库命中文献第8讲计算机信息检索检索技术1、逻辑检索2、加权检索3、词表助检4、截词检索5、限定检索第8讲计算机信息检索机读文献数据库的类型1、文献参考数据库ReferenceDatabase①书目数据库BibliographicDatabase②指示数据库ReferralDatabase2、源数据库SourceDatabase①数值数据库NumericDatabase②事实数据库FactDatabase③全文数据库Full-textDatabase第8讲计算机信息检索计算机信息检索的基本程序与策略
一、分析检索课题二、选择检索系统和数据库三、选择检索词,构造检索提问式,确定检索策略四、分析检索结果,调整检索策略第8讲计算机信息检索分析检索课题分析检索课题应注意以下几个方面:1、了解情报需求的目的和意图。2、分析检索课题的主题要求。3、时间要求。4、检索效果要求。5、检索费用及其它要求。第8讲计算机信息检索选择检索系统和数据库在具体数据库选择过程中应注意:1、明确数据库收录的数量、类型、存贮年限和更新周期。2、明确数据库所具有的独特性和交叉性。3、明确数据库所提供的检索途径、功能和服务方式。第8讲计算机信息检索检索词的选择(一)
检索词是表达文献信息需求的基本元素,也是计算机检索系统中有关数据库进行匹配的基本单元。在计算机检索系统中,检索词一般有如下三种形式:1、规范词:是经过规范化处理的词或词组。2、规范化的代码:是经过规范化处理的索引代码。3、自由词:是未经规范化处理的自然语言词汇。第8讲计算机信息检索检索词的选择(二)选择检索词一般要考虑以下基本原则:1、所选数据库具有叙词表和主题词表的,优先选用叙词或主题词作为最基本的检索项目。2、要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词术语。3、如选择的检索词无词表可查,或在词表中未反映的,此时,检索词为自由词。4、选词要适应待检数据库的检索用词规则。5、要多选常用的基本词汇进行组配。第8讲计算机信息检索检索提问式的构造方法
检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号组成。一种规范性地构造检索式的方法叫做“聚类组合法”,它是对构造检索式的思维过程加以总结和规范化的结果,是指对课题名称按序实施如下七项操作:切分、删除、替换、聚类、补充、增加、组合,从而生成检索式的方法。第8讲计算机信息检索第一步切分例:“染料电化学性能的研究”,经切分后为“|染料|电化学|性能|的|研究|”
注意:词是语义切分的最小单元,也是检索单元。切分必须到词为止,否则就会失去原来的涵义而产生错误。如上例中若将“电化学”继续切分为“|电|化学|”,就会与原义相差甚远。第8讲计算机信息检索第二步删除
删除是对经切分后的课题语句中不适宜作为检索词的词进行删除。1、删除不具有检索意义的虚词及其他非关键词。2、删除过分宽泛和过分具体的限定词。3、删除存在蕴涵关系的可合并词。第8讲计算机信息检索第三步替换
用户在提出课题时,可能会用一些表达欠佳的词汇来表达其情报需求,或用词太宽泛,或太狭窄,或根本不可作为检索词的词。在这些情况下,应用概念替换法,引入更明确、更具体、更本质的概念作为替换词或补充词。例如:大气中细菌浓度的计算方法大气污染的计算方法(替换为)第8讲计算机信息检索第四步聚类“聚类组合法”的第四步是对切分出来的单元按语义进行聚类(同类合并),即将“彼此非常相关的词”归于一组。“彼此非常相关的词”意指同义词或彼此有依附关系的词等,亦即在检索式中可以相互替换、相互补充以及相互等效的词。聚类的实质是进行组面分析,经过聚类,语句由词的集合转换为概念(组面)的集合。第8讲计算机信息检索第四步聚类(二)
例如:高层建筑的优化设计(切分)高层|建筑|的|优化|设计(删除)高层|建筑|优化|设计(替换)高层|建筑|优化|结构设计(聚类)高层建筑|优化|结构设计第8讲计算机信息检索第五步补充
许多名词是由词组缩略而成的;有的词或词组具有同义词或相关词。对于由词组缩略而成的词,它一般与原词组同义,为了提高检索结果的查全率,我们可以采用与缩略相反的操作程序——补充还原,并将补充还原得到的词组作为原词的同义词,补充检索提问式。例如:煤田勘探煤田勘探+煤田*地质第8讲计算机信息检索第六步增加限义词
采用增加“限义词”的手段可以解决由于检索词一词多意而造成误检的问题。增加“限义词”的方法有两种,逻辑“与”和逻辑“非”。例:将检索范围限定在煤田勘探方面,可以采取勘探勘探*煤田(与)要将其检索范围限定在煤田勘探以外,可以采取勘探勘探--煤田(非)第8讲计算机信息检索第七步组合
一个检索课题在经过上述六个步骤之后,即可将它们组合成合乎需要的检索式。第8讲计算机信息检索分析检索结果,调整检索策略(一)扩检时,调整检索式的主要方法1、选全同义词并以“OR”方式与原词连接后加入到检索式中。2、降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。3、采用分类号进行检索。4、删除某个不重要的概念组配。5、取消某些过严的限制符。6、调整位置算符,由严变松。第8讲计算机信息检索分析检索结果,调整检索策略(二)缩检时,调整检索式的主要方法:1、提高检索词的专指度,增加或换用下位词和专指性较强的自由词。2、增加概念组配。3、限制检索词出现的可检字段。4、利用文献的外表特征限制。5、用逻辑非来排除一些无关的检索项。6、进行加权检索。7、调整位置算符,由松变严。第8讲计算机信息检索DIALOG联机检索系统OCLC联机检索系统STN联机检索系统国际著名联机检索系统第8讲计算机信息检索
联机检索是一种使用最广泛、最方便的计算机信息检索系统。它允许用户通过网络系统以联机会话的方式直接访问异地的检索系统及数据库。联机检索系统主要由联机检索中心、通信网和检索终端三大部分构成。联机检索第8讲计算机信息检索联机检索的特点
可供选择的数据库多,学科覆盖面广联机数据库收录文献的时间长,可以进行追溯检索联机数据库的数据标引质量高、检索入口点多具有原文支持能力方便、快捷的检索功能
第8讲计算机信息检索DIALOG联机检索系统
美国DIALOG系统是目前世界上最强大的国际联机检索系统,也是目前运作最成功的联机商业数据库系统之一,它拥有80多个国家约10万多个终端用户,主机系统位于美国加利福尼亚州的PALOALTO市。DIALOG拥有近600个联机数据库,其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊,它的服务是收费服务。第8讲计算机信息检索DIALOG数据库的学科范围
DIALOG学科覆盖面广,几乎涉及全部学科范围。包括综合性科学、自然科学、应用科学和工艺学,社会科学和人文科学,时事报道和商业、经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。第8讲计算机信息检索DIALOG的一些著名数据库列举DIALOG的近600个数据库中,有许多极具代表性的和常用的数据库,著名的数据库如CA(化学文摘)、INSPEC(英国科学文摘)、MEDLINE(医学文献数据库)、MATHSCI(数学文献数据库)、BA(生物学文摘)、NTIS(美国政府报告)等都加入到DIALOG系统中。第8讲计算机信息检索DIALOG的一些著名数据库列举(续)
还有SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)、SSCI(社会科学引文索引)、A&HSCI(艺术与人文科学引文索引)等。再有世界著名的DERWENT专利数据库,以及美国专利、欧洲专利、日本专利数据库等。DIALOG更有一些全文数据库,如IAC的计算机全文库、《纽约时报》和《华盛顿邮报》的全文库等。第8讲计算机信息检索DIALOG系统主要数据库简介参见:index/ljjx/dialog2.htm第8讲计算机信息检索OCLC联机检索系统OCLC(OnlineComputerLibraryCenter,Inc.),即联机计算机图书馆中心,是世界上最大的文献信息服务机构之一。它的总部设在美国的俄亥俄州,主要通过Internet远程通讯网向成员馆及其它组织提供各种文献信息服务。
第8讲计算机信息检索FirstSearch系统简介FirstSearch联机信息检索服务是OCLC从1992年开始推出的一个产品。1999年8月,OCLC完成了FirstSearch系统更新工作。新系统以Web为基础,采用当前信息通讯领域的高新技术,提供给用户一个便捷、友好的界面。目前,通过该系统可检索70多个数据库,其中30多个库可检索到全文,总计包括7,500多种期刊的联机全文,达900多万篇全文文章。数据库涉及广泛的主题范畴,覆盖了各个领域和学科。第8讲计算机信息检索FirstSearch系统简介
通过一个简单的界面,FirstSearch可完成对OCLCILL(馆际互借)的无缝链接,可在记录表中显示用户所在图书馆的馆藏标识等。数千种印刷型和电子版期刊的全文的跨数据库的联机显示,直接链接Internet资源,帮助使用者选择合适的数据库,具有灵活的检索功能。第8讲计算机信息检索FirstSearch数据库简介
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营销活动执行合同
- 家政工合同范本家主
- 合同补充协议细节
- 工作失误保证书范本
- 基础商业物品采购合同
- 就读保证书范文的示例文本
- 农村地基买卖合同签订费用是多少详解
- 世界博物馆日活动
- 物业管理 补充合同模板
- 商品合同和服务合同模板
- 江苏省海绵型道路建设与运行维护指南
- 眼镜验光员(二级)技能鉴定考试题及答案
- 期中试卷(1-5单元)(试题)-2024-2025学年五年级上册数学苏教版
- 人工智能岗位招聘笔试题及解答(某大型央企)2025年
- 政府机关内部合同管理规定
- 《某汽配企业员工招聘管理问题及完善对策研究(论文)》7200字
- 食堂食材配送采购 投标方案(技术方案)
- 第一单元 圆 (单元测试)-2024-2025学年六年级上册数学北师大版
- 《诗意的色彩》课件 2024-20245学年人美版(2024)初中美术七年级上册
- 2025届江苏省南通市海安市海安高级中学高三下学期一模考试生物试题含解析
- 2024年全国职业院校技能大赛(节水系统安装与维护赛项)考试题库(含答案)
评论
0/150
提交评论