信息检索技术课件_第1页
信息检索技术课件_第2页
信息检索技术课件_第3页
信息检索技术课件_第4页
信息检索技术课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索技术与方法主讲:黄艳娟huangyanjuan@Tel:82519545信息检索技术与方法主讲:黄艳娟1

提纲信息检索方法信息检索途径信息检索技术信息检索步骤网络信息资源检索提纲信息检索方法2信息检索方法直接检索法间接检索法追溯检索法循环检索法顺查法倒查法抽查法信息检索方法直接检索法顺查法倒查法抽查法3间接检索方法顺查法:按时间顺序,从过去到现在,由远及近地利用检索系统进行文献信息检索的方法。倒查法:利用检索工具从最近期向早期查找。抽查法:根据检索课题的特点,选择有关课题的文献发表较多的年代,利用检索工具进行重点检索的方法。间接检索方法顺查法:按时间顺序,从过去到现在,由远及近地利用4追溯检索法

是指不利用检索工具,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献的信息范围,一环扣一环地追查下去的方法。追溯检索法是指不利用检索工具,而是利用文5信息检索途径责任者途径题名途径分类途径主题途径序号途径引文途径信息检索途径责任者途径6信息检索技术布尔逻辑检索截词检索邻近检索字段限制检索模糊检索信息检索技术布尔逻辑检索7布尔逻辑检索布尔逻辑检索8截词检索对于词干相同而词尾不同的词,如computercomputecomputing等,可以采用截词检索。Comput*截词的方式有前截断、中截断和后截断。bas?s=basisbases等截词符号有*?$#等。截词检索对于词干相同而词尾不同的词,如computerco9邻近检索邻近检索表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)(nN)等W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。

information2Wmanagement可包括Informationtechnologiesandmanagement和Informationmanagement

邻近检索邻近检索表示两词之间的位置邻近关系,常用到的位置算符10N算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。informationNretrievalinformation2NretrievalN算符是near的缩写,表示在此算符两侧的检索词必须紧密相11字段限制检索字段限制检索是限定检索词在数据库中出现的字段范围的一种检索方法。如:作者=张三题名=金属热处理字段检索词字段限制检索字段限制检索是限定检索词在数据库中出现的字段范围12模糊检索模糊检索(fuzzysearch)也称概念检索。是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。当输入一个只表达所要查检信息的检索词或词语,系统即可以反馈一串与此内容相近的词或词语。模糊检索模糊检索(fuzzysearch)也称概念检索。是13信息检索的步骤

课题分析选择相关信息资源制定检索策略,选择检索入口试验性检索和修改检索策略检索结果的评价信息检索的步骤课题分析14课题分析1明确检索目的

*需要关于某一课题的系统详尽的信息

*需要关于某课题的最新信息

*了解一些片段信息,解决一些具体问题2明确课题的主题或主要内容要形成若干个既能代表信息需求又具有检索意义的主题词(关键词),及其关系3

课题涉及的学科范围4所需信息的数量、语种、年代范围等指标

课题分析1明确检索目的15课题一深潜器的发展综述二我国近3年深潜器的研究三哈尔滨工程大学2005年发表的有关机器人方面的论文四纳米管的结构和制备五聚氯乙烯的机理及应用研究课题一深潜器的发展综述16选择相关信息资源是否所有与检索课题相关的信息资源都检索选择哪些学科的信息资源选择哪些语种的信息资源信息资源覆盖的年限范围信息资源的特点及针对性选择相关信息资源是否所有与检索课题相关的信息资源都检索17制定检索策略,选择检索入口检索策略是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。

(篇名=深浅器or潜器)and年代=2000-2007制定检索策略,选择检索入口检索策略是为完成检索课题,实现检索18选择检索入口(检索途径/字段)题名责任者篇名主题词文摘关键词选择检索入口(检索途径/字段)题名19CNKI数据库简单检索CNKI数据库高级检索CNKI数据库二次检索CNKI数据库简单检索CNKI数据库高级检索CNKI数据库二20试验性检索和修改检索策略无论是手工检索还是计算机检索,对于较大的检索课题,一般应先进行快速、少量的试验性检索,以检验检索策略是否合理有效。然后根据试验见过确认或修改原定的检索策略。试验性检索和修改检索策略无论是手工检索还是计算机检索,对于较21检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。查准率:指数据库中检出的相关文献量与检出的文献总量的比率。检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总22查全率=a/a+c×100%查准率=a/a+b×1000%查全率=检出的相关文献数系统中的相关文献总数查准率=检出的相关文献数检出的文献总数查全率=a/a+c×100%查全率=检出的相关文献数系统中的23例题:如CNKI数据库中共有“企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?例题:如CNKI数据库中共有“企业管理”24KEY查全率47.1%查准率82.5%KEY查全率47.1%25索原文原文的含义如果索取原文索原文原文的含义26什么是原文原文就是原始文献。相对于题名、文摘、参考文献等从不同侧面描述文献的检索标识和著录信息来说,原文就是我们所要查找的文献本身。什么是原文原文就是原始文献。相对于题名、文摘、参考文献等从不27如何索取原文通过相应的链接直接获取原文通过专门收藏机构获取原文在相应的数据库或检索系统中检索后,直接采取单篇购买方式获取全文如何索取原文通过相应的链接直接获取原文28

网络信息资源检索网络信息资源检索29网络信息资源检索

网络信息资源的含义网络信息资源的检索工具国内外典型搜索工具网络信息资源检索网络信息资源的含义30网络信息资源的含义网络信息资源是指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息资源。网络信息资源的含义网络信息资源是指以电子数据的形式将文本、图31网络信息资源的检索工具FTPBBSRSS搜索引擎FTP是英文FileTransferProtocol的缩写,译为文件传输协议。它的主要功能就是完成从一个系统到另一个系统的完整的文件拷贝。BBS称为电子公告板,BulletinBoardSystem。它提供一块公共电子白板,每个用户都可以在上面发布信息或提出看法,具有信件交流、软件交流、信息发布等功能。RSS是简易信息聚合(RSS:ReallySimpleSyndication)的英文缩写,使用RSS订阅功能就如同线下订阅报纸、杂志一样,并且更加地便捷。本站每一个频道,例如新闻、个人Blog、论坛、黄页、分类信息等等,都提供了RSS订阅功能,使用RSS阅读器,例如Foxmail6.0以上版本,您就可以从中订阅自己感兴趣的内容。RSS阅读器会自动收集您订阅的最新信息,保持信息内容的及时性,无需您再逐页访问网站,目标性强,为您节省宝贵的时间。搜索引擎(searchengines)是对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为用户提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。网络信息资源的检索工具FTPFTP是英文FileTrans32信息检索技术33国内外典型的搜索工具国内外典型的搜索工具34网络免费信息资源网络免费信息资源35网上免费电子图书网站网上免费电子图书网站36信息检索技术与方法主讲:黄艳娟huangyanjuan@Tel:82519545信息检索技术与方法主讲:黄艳娟37

提纲信息检索方法信息检索途径信息检索技术信息检索步骤网络信息资源检索提纲信息检索方法38信息检索方法直接检索法间接检索法追溯检索法循环检索法顺查法倒查法抽查法信息检索方法直接检索法顺查法倒查法抽查法39间接检索方法顺查法:按时间顺序,从过去到现在,由远及近地利用检索系统进行文献信息检索的方法。倒查法:利用检索工具从最近期向早期查找。抽查法:根据检索课题的特点,选择有关课题的文献发表较多的年代,利用检索工具进行重点检索的方法。间接检索方法顺查法:按时间顺序,从过去到现在,由远及近地利用40追溯检索法

是指不利用检索工具,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献的信息范围,一环扣一环地追查下去的方法。追溯检索法是指不利用检索工具,而是利用文41信息检索途径责任者途径题名途径分类途径主题途径序号途径引文途径信息检索途径责任者途径42信息检索技术布尔逻辑检索截词检索邻近检索字段限制检索模糊检索信息检索技术布尔逻辑检索43布尔逻辑检索布尔逻辑检索44截词检索对于词干相同而词尾不同的词,如computercomputecomputing等,可以采用截词检索。Comput*截词的方式有前截断、中截断和后截断。bas?s=basisbases等截词符号有*?$#等。截词检索对于词干相同而词尾不同的词,如computerco45邻近检索邻近检索表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)(nN)等W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。

information2Wmanagement可包括Informationtechnologiesandmanagement和Informationmanagement

邻近检索邻近检索表示两词之间的位置邻近关系,常用到的位置算符46N算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。informationNretrievalinformation2NretrievalN算符是near的缩写,表示在此算符两侧的检索词必须紧密相47字段限制检索字段限制检索是限定检索词在数据库中出现的字段范围的一种检索方法。如:作者=张三题名=金属热处理字段检索词字段限制检索字段限制检索是限定检索词在数据库中出现的字段范围48模糊检索模糊检索(fuzzysearch)也称概念检索。是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。当输入一个只表达所要查检信息的检索词或词语,系统即可以反馈一串与此内容相近的词或词语。模糊检索模糊检索(fuzzysearch)也称概念检索。是49信息检索的步骤

课题分析选择相关信息资源制定检索策略,选择检索入口试验性检索和修改检索策略检索结果的评价信息检索的步骤课题分析50课题分析1明确检索目的

*需要关于某一课题的系统详尽的信息

*需要关于某课题的最新信息

*了解一些片段信息,解决一些具体问题2明确课题的主题或主要内容要形成若干个既能代表信息需求又具有检索意义的主题词(关键词),及其关系3

课题涉及的学科范围4所需信息的数量、语种、年代范围等指标

课题分析1明确检索目的51课题一深潜器的发展综述二我国近3年深潜器的研究三哈尔滨工程大学2005年发表的有关机器人方面的论文四纳米管的结构和制备五聚氯乙烯的机理及应用研究课题一深潜器的发展综述52选择相关信息资源是否所有与检索课题相关的信息资源都检索选择哪些学科的信息资源选择哪些语种的信息资源信息资源覆盖的年限范围信息资源的特点及针对性选择相关信息资源是否所有与检索课题相关的信息资源都检索53制定检索策略,选择检索入口检索策略是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。

(篇名=深浅器or潜器)and年代=2000-2007制定检索策略,选择检索入口检索策略是为完成检索课题,实现检索54选择检索入口(检索途径/字段)题名责任者篇名主题词文摘关键词选择检索入口(检索途径/字段)题名55CNKI数据库简单检索CNKI数据库高级检索CNKI数据库二次检索CNKI数据库简单检索CNKI数据库高级检索CNKI数据库二56试验性检索和修改检索策略无论是手工检索还是计算机检索,对于较大的检索课题,一般应先进行快速、少量的试验性检索,以检验检索策略是否合理有效。然后根据试验见过确认或修改原定的检索策略。试验性检索和修改检索策略无论是手工检索还是计算机检索,对于较57检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。查准率:指数据库中检出的相关文献量与检出的文献总量的比率。检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总58查全率=a/a+c×100%查准率=a/a+b×1000%查全率=检出的相关文献数系统中的相关文献总数查准率=检出的相关文献数检出的文献总数查全率=a/a+c×100%查全率=检出的相关文献数系统中的59例题:如CNKI数据库中共有“企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?例题:如CNKI数据库中共有“企业管理”60KEY查全率47.1%查准率82.5%KEY查全率47.1%61索原文原文的含义如果索取原文索原文原文的含义62什么是原文原文就是原始文献。相对于题名、文摘、参考文献等从不同侧面描述文献的检索标识和著录信息来说,原文就是我们所要查找的文献本身。什么是原文原文就是原始文献。相对于题名、文摘、参考文献等从不63如何索取原文通过相应的链接直接获取原文通过专门收藏机构获取原文在相应的数据库或检索系统中检索后,直接采取单篇购买方式获取全文如何索取原文通过相应的链接直接获取原文64

网络信息资源检索网络信息资源检索65网络信息资源检索

网络信息资源的含义网络信息资源的检索工具国内外典型搜索工具网络信息资源检索网络信息资源的含义66网络信息资源的含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论