信息检索复习_第1页
信息检索复习_第2页
信息检索复习_第3页
信息检索复习_第4页
信息检索复习_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索 物质存在的一种方式、形态 或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。信息定义信息的特点1.普遍性 2.时效性 3.传递性 时间传递 空间传递4.共享性5.可转换性 6.可伪性7.载体的依附性:信息要依附一定的载体信息源文献信息源电子信息源实物信息源口头信息源 主要的文献信息源图书专利文献会议文献灰色文献技术档案灰色文献政府出版物、期刊标准文献科技报告 学位论文信息的分类按照信息的加工程度划分,信息可分为 零次信息 、一次信息、 二次信息 、 三次信息、零次信息。一次信息:指处在原始形式中的信息,包括阅读性图书、期刊性论文、

2、科技报告、会议论文、专利说明书、学位论文信息检索的类型按照检索的信息类型划分 文献检索:以文献为检索对象,检索结果是文献资料。 数据检索:以文献中的数据为检索对象,检索结果是特定的数值性数据,是用户可以直接利用的信息。 事实检索:以事实为检索对象,检索某一事物发生的时间、地点以及过程。信息检索语言 信息检索语言是信息汇集、存储和检索时共同使用的一种约定性语言,是一种人为创造的人工语言,用来保证信息存储和检索的一致性,提高检索效率。类型: 分类语言 主题语言 代码语言 引文法分类语言 以科学分类为依据,加上一些必要的规定来区分世界上所有的事物。分类能够将事物区分开来,揭示事物之间的本质的、内在的

3、联系。常用的分类法 中国图书分类法(中图法) 中国科学院图书馆图书分类法(科图法) 美国国会图书馆图书分类法(LCC) 杜威十进制分类法(DDC) 国际十进分类法(UDC)A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理 N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书中国图书分类法(中图法)我校图书馆采用的图书分类法是中图法,包含 22 个基本大类; 其中“工业技术”下共有16个二级类目,如

4、TP代表 自动化技术、计算机技术 ;TN代表 无线电电子学、电信技术 。中国图书分类法(中图法)主题检索语言 标题词型主题检索语言 叙词型主题检索语言 关键词型主题语言主题法系统构成 主题语言能够用于描述、存贮、检索信息主题而作为建立检索工具或检索系统的一种规范化的词汇,它能够与所要表达的事物概念达到一一对应。 主题语言是直接用代表信息主题概念的主题词作为信息的标识的一种检索语言。关键词语言 直接选用文献中的自然语言作为基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语言作为关键词进行标引的一种检索语言。代码语言 根据事物的某些方面的特征,用某种代码系统来表达和排列事物概念,从而提供检

5、索的检索语言。检索效果的评价检索效果:指信息系统检索信息的有效程度,反应了信息系统的检索能力。检索效果包括技术效果和经济效果。评价指标:收录范围、查全率、查准率、相应时间、用户负担和输出形式。 又称检全率、命中率,是指通过检索系统检出与某一检索提问相关的文献数与检索系统中与该提问相关的实有文献数之比。查全率(recall factor 表示为R)查全率= 检索出的相关文献总数 *100% 全部相关文献总数 又称检准率、相关率,指通过检索系统检出的与某一检索提问相关的文献数与检出文献总数之比。查准率(precision factor表示为P)查准率= 检出相关文献总数*100% 检索出的全部文献

6、总数漏检率 = 100%-查全率(R)误检率 = 100%-查准率(P) 漏检率和误检率课堂练习1.利用某个检索系统查某课题,检出的文献总篇数为50篇,经审查确定其中与项目相关的只有40篇,假设在该系统文献库中共有相关文献为80篇,求查全率,查准率,漏检率,误检率。 课题分析不透,“学科归属不清” “语言”表达不一致 主题概念不恰当,不是大了,就是小了 “同义”词库不全 核心词太多误检、漏检原因分析提高检索效率的方法 正确分析课题 正确选择检索工具 正确选择检索途径 确定合适的检索词 对检索的结果进行合适的修正计算机检索基础知识概念:狭义:计算机信息检索经常称为机检,是指以计算机技术为手段,从

7、计算机信息系统中查检所需信息的过程。广义:信息存储信息检索 检索技术(布尔检索 概念)用布尔逻辑算符来表达检索词间的逻辑组配关系“与”逐步减少检出文献的数量,提高检出文献与检索要求的相关性,提高查准率。(A and B) (A * B)“或”扩大检索的范围,提高文献的检出数量,防止漏检,提高查全率。(A or B) (A + B)“非”使用较少,减少文献输出量,提高检索 词的准确性。(A not B) (A B)例:1、查南京工业大学(A)或南京化工大学(B)或南京化工学院(C)的涂善东(D)或许仲梓(E)的文章2、作者姓王(A)或姓李(B)。他的文章篇名中包括“产业经济学”(C),关键词中包

8、含“创新”(D),但是篇名中不能含有“模式”(E)这个词。例:查南京工业大学(A)或南京化工大学(B)或南京化工学院(C)的涂善东(D)或许仲梓(E)的文章(A or B or C ) and ( D or E)例:作者姓王(A)或姓李(B)。他的文章篇名中包括“产业经济学”(C),关键词中包括“创新”(D),但是篇名中不能含有“模式”(E)这个词。(A or B) and (C E) and D(A or B) and C and D not E知识产权知识产权是指人们的创造性智力劳动成果依照知识产权法享有的权利 。知识产权著作权(copyright)工业产权(industrial prop

9、erty)也叫版权,是指文学、艺术、科学作品的作者,对其创作的作品,依照法律享有的专有权利。专利、商标等。图书及其检索内容纲要: 图书分类法 ISBN 汇文图书管理系统 超星数字图书馆 方正Apabi数字图书系统国际标准书号(ISBN) 国际通行的出版物代码 由英国图书界首创(1967年) ISBN号具有专指性,唯一代表某种书的某一版本国际标准书号(ISBN)2007年1月1日后:由13位阿拉伯数字组成,分成五部分,在10位数前加上EAN(国际物品编码协会)提供的3位数字前缀“978”ISBN EAN-UCC前缀-组号-出版者号-出版序号-校验号例:ISBN 978-7-122-3392-5注

10、:“978”用完后,可以用“979”、“980”图书馆的数据库及电子图书资源。电子图书资源有超星数字图书馆、Apabi电子图书中文数据库有:中国期刊网、维普数据库、万方数据库、人大复印报刊资料等;外文数据库有:CA化学文摘,EI工程索引数据库、Web of Science数据库等; 搜索引擎是一个庞大的网址数据库,它是网络信息资源管理和检索的重要工具,不是靠人工发现和选择信息,而是由一个被称作“蜘蛛”的程序在网络中爬行,依据一定的网络协议在网络中发现、加工、整理信息。搜索引擎搜索引擎 根据搜索引擎的检索范围,可分为:通用搜索引擎和学科专业搜索引擎。通用搜索引擎:Google、yahoo、百度、搜狐等专业搜索引擎:Chemfinder 、化学之门、化工引擎等专利的类型发明专利实用新型专利外观设计专利专利的类型1发明专利:发明专利包括对产品、方法或其他改进所提出的新的技术方案。 保护对象是技术领域的发明,既保护产品发明,又保护方法发明。 发明与发现不同。对科学发现、创新理论计算公式和管理方案不保护。 保护期为20年专利的类型2实用新型专利:对产品的形状、构造所提出的适于实用的新技术方案。对创造性要求较低,但对实用性要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论