版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索基本知识及技巧1第一页,共六十一页,2022年,8月28日目录outline信息检索的定义、分类及其作用二检索语言三检索的效率、手段和方法2023/1/18第二页,共六十一页,2022年,8月28日信息检索的定义、分类及其作用1.1信息检索的定义信息检索(InformationRetrieval):,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(InformationStorageandRetrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(InformationSearch)。2023/1/18第三页,共六十一页,2022年,8月28日1.2信息检索的手段(1)手工检索eg:美国工程索引(2)光盘检索eg:medline(3)网络检索eg:springerlink2023/1/18第四页,共六十一页,2022年,8月28日1.3信息检索的对象(1)文献检索(DocumentRetrieval):是以文献(包括题录、文摘和全文)为检索对象的检索。可分为全文检索和书目检索两种。
(2)事实检索(FactRetrieval):是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
(3)数据检索(DataRetrieval):是以数值或数据(包括数据、图表、公式等)为对象的检索。
2023/1/18第五页,共六十一页,2022年,8月28日1.4信息检索的作用(1)信息检索是获取知识的捷径
eg:princeton的学生约翰·菲利普利用图书馆公开资料设计原子弹。
(2)信息检索是科学研究的向导
eg:(美)阿波罗飞船的燃料箱的重复研究问题。(3)信息检索是终身教育的基础
unesco:可以防止知识老化,不断更新知识2023/1/18第六页,共六十一页,2022年,8月28日二信息检索的要素
(1)前提——信息意识/信息素养informationliteracy新闻阅读:《武汉的士起步价调为两公里16元12月1日起执行》
看到标题,能联想到什么?
从信息认知、信息情感和信息行为三个方面进行分析!2023/1/18第七页,共六十一页,2022年,8月28日(2)基础——信息源A、信息的载体:
印刷型
缩微型机读型声像型2023/1/18第八页,共六十一页,2022年,8月28日B、信息的内容和加工级次:
一次文献
二次文献三次文献2023/1/18第九页,共六十一页,2022年,8月28日C、信息的出版形式:图书期刊会议资料学位论文专利标准报告百科全书、类书2023/1/18第十页,共六十一页,2022年,8月28日图书的检索途径主要用到:
书名作者出版社ISBN关键词期刊的检索途径主要用到:
刊名篇名作者关键词ISSN2023/1/18第十一页,共六十一页,2022年,8月28日会议论文的检索途径主要用到:
会议名称主办单位会议地点关键词作者会议文章篇名学位论文的检索途径主要用到:
作者学位授予单位导师姓名关键词论文篇名2023/1/18第十二页,共六十一页,2022年,8月28日专利资料的检索途径主要用到:
关键词专利权人发明人国际专利分类号公开号标准资料的检索途径主要用到:
标准编号标准名称发布单位发布日期关键词2023/1/18第十三页,共六十一页,2022年,8月28日报告资料的检索途径主要用到:
报告号关键词作者报告单位合同户报告代码百科全书、类书资料的检索途径主要用到:
音形义2023/1/18第十四页,共六十一页,2022年,8月28日(3)核心——信息利用能力掌握各种信息源掌握检索语言熟练使用检索工具对检索结果的评价,判断2023/1/18第十五页,共六十一页,2022年,8月28日附:期刊的指数计算(1)影响因素=该年引用该刊前两年文章的总次数当年该刊所发表文章的总数即年指标前两年该刊所发表文章的总数=一特定年度对该刊当年发表文章的引用次数影响因素是一种期刊中论文的平均被引率特定年度的影响因素用于测度一种期刊被利用的速度,也是测度期刊重要性的依据即年指标2023/1/18第十六页,共六十一页,2022年,8月28日自引率与被引率
自引率是指一种期刊中引用本刊的参考文献对全部参考文献之比;被自引率是一种期刊被本刊中文章引用的次数与该刊被引用的总次数之比。=自引率某刊自引的引文量该刊全部引文量被引率
=某刊自引的引文量某刊被引用的总次数2023/1/18第十七页,共六十一页,2022年,8月28日二检索语言2.1按表现形式划分的检索语言
外表特征语言内容特征语言2023/1/18第十八页,共六十一页,2022年,8月28日外表特征:就是文献上记明的、显而易见的特征。外表特征语言(书目引文语言)题名(书名、篇名)著者姓名文献序号(如:ISBN、ISSN、专利号、报告号等)书目引文出版事项文献类型2023/1/18第十九页,共六十一页,2022年,8月28日
内容特征语言非句法语言句法语言等级制体系分类法标题词关键词叙词单元词加标志的叙词组面词(如:组面分类法)短语文献全文的自然语言2023/1/18第二十页,共六十一页,2022年,8月28日2.2按应用功能划分的检索语言
分类语言主题语言2023/1/18第二十一页,共六十一页,2022年,8月28日2.21分类语言
是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言。分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。2023/1/18第二十二页,共六十一页,2022年,8月28日杜威十进分类法——
DeweyDecimalClassification,DC/DDC美国M.杜威编制的综合性等级列举式分类法。分为详、简两种版本,详本于1876年问世,取名为《图书馆图书小册子排架及编目适用的分类法和主题索引》,1951年的第15版改名《杜威十进分类法》000总论
100哲学
200宗教
300社会科学
400语言
500自然科学和数学
600技术(应用科学)
700艺术、美术和装饰艺术
800文学
900地理、历史及辅助学科
第一层展开层630农业
631农业经营
631.5作物栽培
2023/1/18第二十三页,共六十一页,2022年,8月28日
通用十进制图书分类法——UniversalDecimalClassificationUDC十进制图书分类法由两位比利时书目专家(PaulOtlet、HenrilaFontaine)19世纪末在杜威十进制图书分类法的基础上继续研发的分类方法。此种分类方法由数字和特殊符号组成,把涉及各种知识体系及学科的书籍予以分类。介于数字和符号无语言障碍的特性,该分类法在世界各地的图书馆中被广泛应用。
总分类0总汇1哲学,心理学2宗教,神学3社会学,政治,经济,法律,教育,人类学4暂无(由图书馆具体添加)5自然学科,数学6实用学科,医学,科技,企业经济学,计算机
7艺术,手工艺品,音乐,竞技,体育8语言学,文学9地理,生物,历史2023/1/18第二十四页,共六十一页,2022年,8月28日附加+:并列符(例:178.1+33酒精主义者和国民经济)::关系符(例:178.1:33酒精主义对国民经济的影响)
/:包含符(例:592/599系统动物学,从592到599)
=:语言符(例:=71拉丁语)(0...):书类符(例:(042)演讲,讲义)(...):地域符(例:(234.3)阿尔卑司)2023/1/18第二十五页,共六十一页,2022年,8月28日美国国会图书馆图书分类法——LibraryofCongressClassification
2023/1/18第二十六页,共六十一页,2022年,8月28日第一层2023/1/18第二十七页,共六十一页,2022年,8月28日末层2023/1/18第二十八页,共六十一页,2022年,8月28日中国图书馆图书分类法——ChineseLibraryClassification,
CLC
中国图书馆分类法,简称《中图法》。包括“马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类,具体如下:2023/1/18第二十九页,共六十一页,2022年,8月28日中国科学院图书馆图书分类法简称科图法。1958年由中国科学院图书馆编写,1974年、1979年、1994年分别进行了修订。分为25大类。中国科学院图书馆图书分类法2023/1/18第三十页,共六十一页,2022年,8月28日国际专利分类法——InternationalPatentClassification,IPC
《关于国际专利分类斯特拉斯堡协定》与1975年10月7日生效,它为发明专利,包括出版的专利申请书、发明证书说明书、实用新型说明书(一下简称为“专利文献”)提供了一种共同的分类。分类表示使各国专利文献获得统一分类的一种工具。它的基本目的是作为各专利局以及其他使用者在确定专利申请的新颖性、创造性(包括对技术先进性和实用价值作出评价)而进行的专利文献检索是的一种有效检索工具。
2023/1/18第三十一页,共六十一页,2022年,8月28日2023/1/18第三十二页,共六十一页,2022年,8月28日2023/1/18第三十三页,共六十一页,2022年,8月28日2023/1/18第三十四页,共六十一页,2022年,8月28日2023/1/18第三十五页,共六十一页,2022年,8月28日2023/1/18第三十六页,共六十一页,2022年,8月28日2023/1/18第三十七页,共六十一页,2022年,8月28日2023/1/18第三十八页,共六十一页,2022年,8月28日2023/1/18第三十九页,共六十一页,2022年,8月28日2023/1/18第四十页,共六十一页,2022年,8月28日2023/1/18第四十一页,共六十一页,2022年,8月28日2023/1/18第四十二页,共六十一页,2022年,8月28日2023/1/18第四十三页,共六十一页,2022年,8月28日技术主体的分析2023/1/18第四十四页,共六十一页,2022年,8月28日2.22主题语言
2023/1/18第四十五页,共六十一页,2022年,8月28日2023/1/18第四十六页,共六十一页,2022年,8月28日
INSPEC叙词表举例:Locomotive
NT①
diesel-electriclocomotiveBT
②vehicles
TT③
vehiclesRT
④railtrafficrailwaystractionCC⑤
B8520-nC3360DFC
⑥
b8520-nc3360DeDI
⑦January19731、下位叙词2、上位叙词3、族首词4、相关词5、INSPEC数据库使用的分类号6、输入到INSPEC数据库使用的分类号7、该叙词的启用日期英国电气工程学会(InstituteofElectricEngineering简称IEE)下设的国际物理和工程信息服务部(InternationalInformationServicesforthePhysicsandEngineeringCommunities,简称INSPEC)2023/1/18第四十七页,共六十一页,2022年,8月28日三检索的效率、手段和方法3.1检索效率评价2023/1/18第四十八页,共六十一页,2022年,8月28日3.2索引语言中改善查全率的措施(1)同义词控制法
是指当一个概念具有多个同义词的时候,为了保证标引与检索的一致性,避免文献的分散和漏检,指引词汇的使用者从其他的同义词找到一个被专门选择作为正式主题词的词的用法。例如:用符号USE、SEE、Y(用)从正式词引见非正式的词,则用USEFOR、D(代)2023/1/18第四十九页,共六十一页,2022年,8月28日(2)词的关联法索引词的关联,最普通的形式是等级上的关联。例如:A、由专指词到较泛指的词,使用符号BT(broaderterm),或者S(属)
B、由泛指词到较专指的词,使用符号NT(narrowerterm),或者F(分)
C、由指向近义的词,使用符号RT(relatedterm),或者C(参),或seealso(参见)
2023/1/18第五十页,共六十一页,2022年,8月28日《汉语主题词表》词的关联举列
交流发电机F同步发电机异步发电机S发电机
交流换向电机D交流整离子电机S交流电机Z电机C调速电动机异步电动机2023/1/18第五十一页,共六十一页,2022年,8月28日(3)字形的控制法
即把具有同一词根的字组合在一起。当然这不是提供标引的措施,而是提供检索用的辅助手段。在计算机检索中,是采用截词实现的:例如:“反射”、“反射波”、“反射性”、“反射望远镜”等。都有reflect,用reflect进行截词检索,就能检索出与“反射”有关的所有文献。2023/1/18第五十二页,共六十一页,2022年,8月28日(4)聚类法
在对检索词进行统计的基础上,将有关的索引次进行聚类,可以查出更多的文献,从而改善查全性。例如:“枯萎”是与“庄稼”、“植物生长”联系在一起的,如果“锈菌”也是常与“植物生长”等词联系在一起的话,我们就可以推断“枯萎”与“锈菌”之间存在某种联系。2023/1/18第五十三页,共六十一页,2022年,8月28日3.3索引语言中改善查准率的措施组配即两个或两个以上概念的组合,有两种组配形式,先组和后组。
先组式是指概念之间的组合是在词表编制阶段就已经定义好的,组配后的符合概念成为供标引的完整索引词。
心理声学(是心理学与声学的组配)蒸发冷却(是蒸发与冷却的组配)
后组式是指在检索阶段把两个或两个以上的有关索引词进行组合。
“计算机”与“设计”2023/1/18第五十四页,共六十一页,2022年,8月28日
先组式有助于提高索引词的专指度,减少标引到每个词的文献数量,减少和避免假组配,从而有利于查准率。但是先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索。
后组式便于各种角度和深度的检索,有利于查准率的提高,但是可能出现假组配,致使误检的增多。对于先组和后组式的评价2023/1/18第五十五页,共六十一页,2022年,8月28日3.4计算机检索语言(1)布尔逻辑检索功能逻辑或(OR、+)检索项A、B若用“逻辑或”组配,则逻辑式为“AORB”,或者“A+B”AB表示被检索的文献只要包含有其中的一个检索项,或者同时含有这两个检索项,那么它就会被命中。202
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海工会管理职业学院《图形与图像处理》2023-2024学年第一学期期末试卷
- 网络管理员技能鉴定测试题(附参考答案)
- 幼儿园冬至集体课程设计
- 早教数理课特色课程设计
- 电气工程师供配电练习
- 加强中小学科学实验教学的实效性
- 广西xx工业废盐资源化利用项目可行性研究报告
- 平安夜圣诞节介绍活动方案326
- 未来救护车课程设计
- 电力系统自动化考试参考资料(打印)(课本版)
- 化工装备的选型与设计
- 外卖小哥培训道路安全管理
- 上市公司投资报告分析报告
- 中医诊疗设备种类目录
- (完整)马克思主义政治经济学习题及参考答案
- 中原文化介绍
- 医院预防保健科工作制度及职责范本
- 分离工程课件
- 中国风古诗词诗歌朗读比赛大会唐诗宋词含内容课件两篇
- 计算机网络技术基础(第6版)全套教学课件
- 12、口腔科诊疗指南及技术操作规范
评论
0/150
提交评论