信息组织(检索一)课件_第1页
信息组织(检索一)课件_第2页
信息组织(检索一)课件_第3页
信息组织(检索一)课件_第4页
信息组织(检索一)课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2、6 信息检索(一)1、信息检索概述2、信息检索发展历史2、6 信息检索(一)一、信息检索概述:信息检索是一门关于信息资源存储、整序、查找理论和方法的学科,是利用一定的检索算法,借助于特定的检索工具,从结构化或非结构化的数据中获取有用信息的过程。一、信息检索概述:信息检索是一门关于信息资源存储、整序、查找文档集合(document collection)在信息检索中,把文档看作一个检索单元,组成检索对象的多个文档称为文档集合。用户提交的检索需求又称查询(query)。文档集合(document collection)在信息 原理: 相 关 反 馈 检索系统查询的内部表示文档的内部表示匹配检索

2、结果查询请求文档集合用户 原理:查询的内检索步骤 明确需求,分析主题选择检索工具或数据库提交检索表达式显示与优化检索结果完成确定检索式构造检索表达式修改检索式检索步骤 明确需求,分析主题选择检索工具或数据库提1、信息检索的类型按检索内容分:数据检索(Date Information Retrieval):事实检索(Fact Information Retrieval): 文献检索(Document Information Retrieval) 1、信息检索的类型按检索内容分:数据检索(Date Info 数据检索(Date Information Retrieval): 是针对回答某一问题数据

3、的检索。如回答“2005年经济增长率是多少”?事实检索(Fact Information Retrieval): 查找某一事件发生的时间、地点、经过等情况。它即包括对数值的检索、运算和推导,也包括概念比较、判断,比数据检索复杂。 数 文献检索(Document Information Retrieval)是关于对某一主题文献的线索的查找,通常通过目录、索引、文摘等二次文献,查找出原始文献,所以,又称为“书目检索”。 文献检索(Do 2)按组织方式 3)按检索设备 手工检索机器检索联机检索光盘检索网络检索全文检索超文本检索超媒体检索 2)按组织方式 手工2、信息检索研究内容:信息检索是一门关于信

4、息资源存储、整序查找理论和方法的学科,其研究内容主要包括: 检索服务检索策略检索系统信息表音著录法数据库检索语言检索理论研究内容2、信息检索研究内容:信息检索是一门关于信息资源存储、整序1、检索理论研究内容包括:信息与信息资源定义;信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。1、检索理论研究内容包括:2、检索语言研究原指受控语言的集合,现指受控语言和自然语言(未规范的书面语言)。其研究内容包括:关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识等。尤其还包括网络数据库中不同检索语言的转换、自动分类、自动标引、网络检索根

5、据等的研究。2、检索语言研究原指受控语言的集合,现指受控语言和自然语3、数据库的研究数据库建设规划与协调共享收录信息与文献的筛选文档结构、维护与更新版权、市场跨库检索等3、数据库的研究数据库建设规划与协调共享4、著录法研究包括国内外著录标准的研究各种著录方法的研究电子型文献及网络信息的著录研究4、著录法研究包括国内外著录标准的研究5、标引和组织法的研究标引:通过对信息资源的分析,选用确切的检索标识反映信息资源内容的过程。组织方法:即排检法,主要是词表的编制与选用。当前研究重点为网络信息资源的标引与排序、数字资源的全球统一分类体系、自动标引与排序、智能搜索引擎、网格研究等。5、标引和组织法的研究

6、标引:通过对信息资源的分析,选用6、检索系统研究 检索系统是由有序化的信息资源、设备、检索方法和策略等组成的集合体。其研究内容主要包括:系统设计、运行和评价。6、检索系统研究 检索系统是由有序化的信息资源、设备、检7、检索策略研究所谓检索策略是指:在分析信息需求提问时确定的检索途径与检索用词,并明确各词之间逻辑关系和查找步骤的安排。包括:用户需求提问分析检索式表达检索符号的设置与应用、步骤优化等。7、检索策略研究所谓检索策略是指:在分析信息需求提问时确8、检索服务研究服务范式检索效果用户培训服务手段检索服务研究8、检索服务研究服务范式检索效果用户培训服务手段检索服务3、信息检索的研究方法信息检

7、索的研究涉及到诸多学科,如认知科学、计算机科学、信息科学、语言学、逻辑学以及概率论、最优化理论、模式识别、系统分析等,因此研究方法也多种多样。3、信息检索的研究方法信息检索的研究涉及到诸多学科,如认知科除各科学通用的观察法、实验法、调查法、模拟法、归纳与演绎法、分析与比较法外,还采用:文献计量学方法目录学方法分类法主题法排序法咨询法除各科学通用的观察法、实验法、调查法、模拟法、归纳与演绎法、二、信息检索发展简史20世纪中期以前:完全手工阶段1950S:第一个计算机情报检索试验系统1960s:批处理检索(脱机检索)1970s- 1980s:联机检索1990以后:Internet信息检索二、信息检

8、索发展简史20世纪中期以前:完全手工阶段信息检索的源起信息检索源起于19世纪前期。由于近代科学团体的大量涌现,文献数量的增多,导致了文献检索业务社会分工的出现。19世纪20世纪初,出现了多种覆盖各个专业的检索工具,其中一些经长期发展调整,成为世界著名的检索工具,如美国的工程索引、化学文摘、英国的科学文摘等。信息检索的源起信息检索源起于19世纪前期。由于近代科学团体的、20世纪中期以前:手工检索阶段一般以1830年柏林科学院在柏林和莱比锡出版的文摘刊物药学总览为手工检索的开端。以1876年美国图书馆协会第一届大会的召开为规范化信息检索工作的正式起点。、20世纪中期以前:手工检索阶段一般以1830

9、年柏林科学院直到20世纪40年代,信息检索还只有手工检索一种方式。这一时期的特点表现为:以印刷文献,(图书、期刊、会议、专利文献等)为主要检索对象;以各类(文摘、题录、和目录性)工具书为检索工具;以图书馆的参考咨询部为开展信息检索的中心机构。直到20世纪40年代,信息检索还只有手工检索一种方式。这一时手工检索工具:手工检索工具:2、计算机化检索阶段(20世纪50年代初-90年代初) 1951年,世界上出现了最早的计算机检索系统。自20世纪60年代起,随着计算机性能的提高,储存量的增大,价格的下降,为计算机检索的发展提供了坚实的物质基础。2、计算机化检索阶段(20世纪50年代初-90年代初) 3

10、、网络化检索阶段(20世纪90年代初期-):信息检索的主流平台转移到以WWW为核心的网络环境中。1994年春,网上出现了第一个web搜索引擎。网络检索以极低的费用、海量的信息、迅速地存取以及对多媒体功能的支持等,对联机检索和光盘检索造成冲击。3、网络化检索阶段(20世纪90年代初期-):信息检索的手工信息检索工具检索性工具书书目、索引、文摘参考性工具书百科全书、类书、政书、年鉴、名录、手册词语性工具书字典、词典图录性工具书地图、历史图录、人物图录、文物图录、艺术图录、科技图录等边缘性工具书位于工具书和非工具书之间,如资料汇编、史书、方志等。手工信息检索工具检索性工具书书目、索引、文摘手工检索工

11、具的排检技术1、字顺排检技术2、分类排检技术3、主题排检技术4、时序排检技术(多用于编制年表、年谱等)5、地序排检技术(集中某一地区的有关信息)手工检索工具的排检技术1、字顺排检技术介绍几种著名的科技检索期刊1、美国工程索引(The Engineering Index,简称EI)。1884年10月创刊。目前由美国工程信息公司负责编辑。EI名为索引,实际上是文摘性刊物,是世界著名的工程技术方面的综合性检索工具。特点:1)收录范围大。收录50多个国家26种文字的5400多种工程期刊、会议录、科技报告年报道量约22万条。中国有60多家期刊被EI收录。介绍几种著名的科技检索期刊1、美国工程索引(The

12、 Engi2)报道的学科多、内容广。较全面地报道了工程技术各个领域和科学管理方面的文献。3)报道的文献质量高。大多经编辑人员精选,比较有参考价值的才予以收录。4)查找方便。可根据文献主题或姓名查找。对于光盘数据库和网络数据库还可以根据著者的工作单位、刊物名称、年代等途径查找。2)报道的学科多、内容广。较全面地报道了工程技术各个领域和科EI的出版形式包括有: 工程索引月刊 印刷版 工程索引年刊 工程索引累积索引 缩微版 磁带版 机读版 光盘版EI的出版形式包括有: EI的检索途径 确定主题词核对工程叙词表确定正确主题词EI的主题索引 文献正文 EI的个人著作索引已知著者姓名已知团体机构EI年刊本

13、中的劳动者单位索引原文个人团体著者主题EI的检索途径 确定主题词核对工程叙词表EI的主题索2、英国科学文摘(Science Abstracts,简称SA)1898年创刊,由英国电气工程师学会负责编辑出版。分4个分辑出版: A辑 物理文摘,半月刊。 B辑 电器与电子学文摘,月刊。 C辑 计算机与控制文摘,月刊。 D辑 信息技术,月刊。 2、英国科学文摘(Science Abstracts,简SA是科学技术方面的综合性文摘,文献来源包括50多个国家4200多种的期刊、科技报告、会议文献、学位论文等。以英美文献为主,年报道量大约40万条。SA有印刷版、缩微版、磁带版、网络版、光盘版等不同形式的出版物

14、。SA是科学技术方面的综合性文摘,文献来源包括50多个国家42SA的体系结构 1、文摘(SA的正文,最主要的组成部分) 2、辅助索引 主题指南主题索引 著者索引 参考文献索引 图书索引 会议索引 团体著者索引SA的体系结构 1、文摘(SA的正文,最主要的组成部分)主题SA的检索途径分类索引主题索引著者索引SA的分类索引主题索引著者索引3、美国化学文摘(Chemical Abstracts,简称CA)1907年创刊,由美国化学学会化学文摘服务社编辑出版,现为周刊。每年出版两卷,每卷26期。特点:范围广(不仅报道化学化工文学,还报道生物医学相关文献。收录150多个国家56种文字的约14000种化学

15、化工期刊,年报道量达773000条,其中专利占123000条,占据了化学化工世界95%的文献)。出版迅速、内容准确、详细、索引系统完备。出版物形式有:印刷、缩微、磁带、光盘、网络版。3、美国化学文摘(Chemical Abstracts,CA的索引体系 期索引关键词索引著者索引专利索引登记号索引索引指南登记号索引资料来源索引卷索引累积索引化学物质索引普通主题索引分子式索引环系索引杂原子索引专利索引著者索引CA的索引体系期索引关键词索引著者索引专利索引登记号索引索引4、美国科学引文索引(Science Citation Index,SCI)1961年创刊,双月刊,美国费城“科学信息研究所”编辑出

16、版。收录40多个国家的科技期刊、会议录、论文集、专著、丛书等。报道范围为数、理、化、农、林、医、生物科学、工程技术等。有印刷版、数据库、联机版、网络版。4、美国科学引文索引(Science Citation SCI的主要用途1、作为检索工具可以从引文入手进行检索,提供了一条新的检索途径。2、作为分析工具常被用于引文分析,在研究工作中得到广泛应用: 1)文献评价 2)科学史研究 3)科学交流模式研究SCI的主要用途1、作为检索工具可以从引文入手进行检索, SCI的结构1、引文索引2、来源索引3、轮排索引4、专利引文索引5、机构索引SCI的结构1、引文索引2、来源索引3、轮排索引4、专利引文SCI

17、的检索途径1、引文途径2、主题途径 3、来源著者途径 4、著者机构途径 5、综合循环检索法SCI的检索途径1、引文途径2、主题途径 3、5、美国生物学文摘(Biological Abstracts, BA)创刊于1926年,有美国“生物学文摘生物科学情报服务社”编辑出版,半月刊,一年两卷,摘录110多个工架9000多种期刊、以及专题论文、科技报告、学位论文、图书、会议文献、档案资料等16000多种文献。5、美国生物学文摘(Biological AbstracBA的结构1、文摘2、索引 著者索引 生物系统索引 属种索引 主题索引BA的结构1、文摘6、日本科学技术文献速报1958年创刊,由日本情报中心编辑出版。内容以理工科为主,但不包括数学和天文学。收录一万多种期刊和其他出版物,以日文文献为主,一般只收录原始文献、评论性文章、实用技术资料等。分12个分册,各册每年第一期于4月出版,最末一期于次年3月

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论