第1章 信息检索的基础知识(第二部分).ppt_第1页
第1章 信息检索的基础知识(第二部分).ppt_第2页
第1章 信息检索的基础知识(第二部分).ppt_第3页
第1章 信息检索的基础知识(第二部分).ppt_第4页
第1章 信息检索的基础知识(第二部分).ppt_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章:信息检索的基础知识(第二部分),主讲人:盛 芳 Email: 电 话: 67791306 地 址: 图文信息中心535室,信息检索的基础知识,2.1 信息检索及其基本原理 2.2 检索途径 2.3 检索语言 2.3.1 分类法 中国图书分类法 国际专利分类法 2.3.2 主题法,2.1信息检索及其基本原理,信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。又称信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。 狭义的信息检索就是从信息集合中找出所需

2、要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。,信息检索的基本原理,对信息集合与需求集合的匹配与选择 检索需求: 读者或者用户要求检索系统提供服务的真实需求,这种需求通常用检索语言来表达。 检索语言: 用于标引文献内容特征和标识用户检索需求的一套体系和规则,由检索标识和标引规则组成。,信息检索的基本原理,文献 信息,检索 课题,检索 提问 信息,文献 信息 特征,检索 语言 和 名称 规范,文献 信息 标识 (检索点),检索 提问 标识 (检索词),检索工具,检 索 结 果,检索过程,存储过程,文献信息检索的实质: 文献标

3、识和检索标识的匹配和选择,检索工具: 是指用以存储、报道和检索文献的工具。因此,具有存储和检索的功能。 四个基本条件: 详细著录文献的外部特征和内容特征。 具有既定的检索标识。 必须根据标识的顺序,系统科学地排列文献、使其成为一个有机的整体。 提供多种检索途径。,检索工具,信息检索的基础知识,2.1 信息检索及其基本原理 2.2 检索途径 2.3 检索语言 2.3.1 分类法 中国图书分类法 国际专利分类法 2.3.2 主题法,2.2 检索途径,是由提取信息源的外部与内部特征形成的,又称为检索点或检索入口。 外部特征 责任者(著者、译者、编者等)形成责任者途径 题名(书名、刊名等)形成题名途径

4、 专利号、ISBN等形成代码途径 引用文献形成引文途径 内容特征 分类途径 主题途径,外部标识,检索标识,内容标识,书名、刊名 题名,专利号、ISBN、文献号 代码,著者、译者、编者 责任者,分类号,主题词,分类途径的优缺点,优点 具有族性检索的功能,查全率较高。 以学科分类为基础,容易被人们接受和应用。 适用于信息需求不很明确时的闲逛搜索。 缺点 不适用于特性检索,查准率比主题词低。 不能适应学科发展中的变化,难以反映新学科和新名词术语。 人的认识不统一,往往造成分类不一致及排检错误,不易反映交叉学科。,主题途径的优缺点,优点: 1、适合特性检索,查准率高 例如:主题词“C语言程序设计”就比

5、分类号TP312表达得更准 2、能将不同学科的信息集中到一起 缺点: 通常不适合族性检索,查全率比分类号低,信息检索的基础知识,2.1 信息检索的基本原理 2.2 检索途径 2.3 检索语言 2.3.1 分类法 中国图书分类法 国际专利分类法 2.3.2 主题法,2.3.1 检索语言分类法,分类是人类的基本逻辑思维形式之一,是人类认识客观事物和区分客观事物的思维活动。 分类法反映了对人类全部知识体系的认识。 是一种专用于文献标引和检索的人工语言体系,由分类号和分类规则组成。,中国图书馆分类法,发展简介 体系结构 宏观结构 微观结构 图书资料分类规则,1975年正式出版第一版; 1980年出版第

6、二版; 1990年出版第三版; 1999年出版第四版, 更名为中国图书馆分类法 , Chinese Library Classification ,简称CLC; 2010年出版第五版。,中图法体系结构,以自然科学、社会科学、哲学作为人类知识领域的基本构成建立基本序列。并将作为社会主义分类法编制指导思想的“马列宁主义” 和文献特殊性设置的“综合性图书” ,形成五个部类的基本序列。 设置了22个基本大类,大体按“上层建筑经济基础意识形态”,即“政治经济文化”的次序排列。,自然科学各大类的排列则按学科的属性遵循从一般到特殊、 从简单到复杂、从低级到高级、从理论到应用的次序进行, 并形成“基础理论技术

7、科学应用科学”三个层次。,表2-2文学类的类目设置,国际专利分类法,(International Patent Classification , IPC),结构:,部,大类,小类,组,一级类目。一个字母。(八部) A:生活需要(农、轻、医) B:作业、运输 C:化学、冶金 D:纺织、造纸 E:固定建筑物(建筑、采矿) F:机械工程;照明;加热;武器;爆破 G:物理H:电技术,二级类目 两个数字,三级类目 一个字母,C04B35/00主组 C08F210/16 小组 斜线()之前规定最多三位数 斜线之后最多为五位数,国际专利分类法,符号X,为暂时无法归类的新类的标记 比如:B01G/00X。 符

8、号/ 发明情报与附加情报之间的区分 括号 ( ) ,表示补充类号,发明情报:与专利申请所要求保护的技术主 题直接的内容,是以权利要求书为主确 定的技术特征。 附加情报:对发明情报进行限定的从属权利 要求中内容, 但没写入权利要求书中的 有检索意义的内容,完整的IPC:,发明情报/附加情报(补充情报),完整的IPC号码,C08F210/16、255/04 / A61K47/00、C09J151/06 (C08F210/16,214:06) (C08F255/04、214:06) C08F210/16 乙烯与-链烯的共聚物,如乙丙橡胶 C08F255/04 接到乙烯丙烯共聚物上的高分子化合物 A6

9、1K47/00 以所用的非有效成分为特征的医用配制品, C09J151/06 接枝到只含有1个碳碳双键的脂族烃的 均聚物或共聚物上 C08F214:06 氯乙烯 (C08F210/16,214:06) 含氯的乙烯与-链烯的共聚物 (C08F255/04,214:06),信息检索的基础知识,2.1 信息检索的基本原理 2.2 检索途径 2.3 检索语言 2.3.1 分类法 中国图书分类法 国际专利分类法 2.3.2 主题法,2.3.2 检索语言主题法,主题法的类型 概括主题词的一般方法,主题法的类型,主题法 是指直接以表示文献或信息主题的语词作标识,提供字顺检索途径,并主要采用参照系统揭示词间关

10、系的标引和检索文献的方法。 主题法一般分为: 标题法、单元词法、叙词法、关键词法,关键词,属于自由词 凡是能概括文献主题或读者需求的、有检索意义的实词都可以作为关键词; 没有词表,不是受控制词; 适应计算机检索需要; 全文检索技术的实现。,检索语言主题法,主题法的类型 概括主题词的一般方法 概念转换的方法 复杂概念分析方法 主题词替换方法,概念转换的方法,适于用固定词组表示检索需求的情况 概念比较单一的文献需求 单字段检索 适于用逻辑组配表示检索需求的情况 用单词表示复杂的概念 逻辑与组配检索,通用的专称、术语 经济危机、万有引力 复合的概念 (字面分解后会产生歧义或是失去了检索意义 ) 剩余价值、猎户星云,复杂概念分析方法,“最小概念原则” 弥雾喷粉喷烟机 划分成具有交叉关系的并列概念 食品的低温贮藏 划分成主体概念和限定概念 环境污染取样分析 液压系统油泵 日本电子工业 钛合金管 超音速飞机空气动力学,弥雾机 喷粉机 喷烟机,食品贮藏 低温贮藏,主题词替换方法,同义词、近义词 计算机电脑 客运旅客运输 上位词 (概念扩大) 计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论