信息技术基础 课件 第7章信息检索_第1页
信息技术基础 课件 第7章信息检索_第2页
信息技术基础 课件 第7章信息检索_第3页
信息技术基础 课件 第7章信息检索_第4页
信息技术基础 课件 第7章信息检索_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章信息检索本章要点 常用的信息检索方法

搜索引擎 信息检索的概念 信息检索的类型 专用平台的信息检索学习目标掌握布尔逻辑检索、截词检索、位置检索、限制检索等检索方法。掌握通过不同信息平台进行信息检索的方法。理解信息检索的基本概念和信息检索的基本流程。掌握常用搜索引擎的自定义搜索方法。掌握通过期刊、论文等专用平台进行信息检索的方法。强化信息意识,培养学生创新精神学习目标掌握布尔逻辑检索、截词检索、位置检索、限制检索等检索方法。掌握通过不同信息平台进行信息检索的方法。理解信息检索的基本概念和信息检索的基本流程。掌握常用搜索引擎的自定义搜索方法。掌握通过期刊、论文等专用平台进行信息检索的方法。强化信息意识,培养学生创新精神CONTENTS7.3常用的信息检索的方法7.4搜索引擎7.1信息检索概述7.2信息检索的类型7.5专用平台的信息检索017.1信息检索概述7.1信息检索概述7.1.1信息检索的概念1237.1.2信息检索的工作过程7.1.3信息检索的意义7.1.1信息检索的概念信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,所以它的全称又叫“信息的存储与检索”。信息检索的概念7.1.1信息检索的概念信息检索的全过程应包括两个主要方面:信息标引和存储过程。信息的需求分析和检索过程。信息检索的全过程7.1.2信息检索的工作过程(1)分析检索目标,确定检索方向。(2)确定检索方法。(3)确定检索工具。(4)确定检索途径。(5)实施检索。(6)索取原始文献。信息检索的工作过程7.1.3信息检索的意义1.信息检索是获取知识的捷径2.信息检索是科学研究的向导3.信息检索是终身教育的基础信息检索的意义027.2信息检索的类型7.2信息检索的类型7.2.1按检索对象划分127.2.2按检索手段划分7.2.1按检索对象划分(1)文献检索(2)数据检索(3)事实检索按检索对象划分7.2.2按检索手段划分手工检索机械检索计算机检索按检索手段划分7.2.2按检索手段划分(1)手工检索(manualretrieval)是一种传统的检索方法,即以手工翻检的方式,利用工具(包括图书、期刊、目录卡片等)来检索信息的一种检索手段。按检索手段划分7.2.2按检索手段划分(2)机械检索:即利用探针或检索器件,对代表检索标识的穿孔卡片进行选取。这种机械的扫描大大提高了检索效率。优点:速度快缺点:回溯性不好,且有时间限制。按检索手段划分7.2.2按检索手段划分(3)计算机检索:计算机检索的机制与手工检索类似,是指利用计算机存储和检索信息。优点:速度快、耗时少,查阅范围广,甚至可以查到国外刚刚出版的期刊论文信息。按检索手段划分037.3常用的信息检索的方法7.3常用的信息检索的方法7.3.1布尔检索12347.3.2截词检索7.3.3位置检索7.3.4字段限定检索7.3.1布尔检索布尔检索(BooleanRetrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术。逻辑关系有三种:逻辑与逻辑或逻辑非概念7.3.1布尔检索具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示。例如:AANDB、A*B1.逻辑与图7-1逻辑与7.3.1布尔检索逻辑“或”是一种具有概念并列关系的组配,用“+”或“OR”算符表示。例如:AORB、A+B2.逻辑或图7-2逻辑或7.3.1布尔检索逻辑“非”是一种具有概念排除关系的组配,用“–”或“NOT”算符表示。例如:ANOTB、A-B3.逻辑非图7-3逻辑非7.3.2截词检索截词检索(truncationretrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。截词检索7.3.2截词检索截词符多采用通配符“?”、“$”、“*”等,因此,截词检索有时也称为通配符(wildcard)检索。例:child*可以检索出含有child、children、childhood等词的文献。截词检索7.3.3位置检索位置检索(proximityretrieval),又称为“邻近检索”、“词位检索”、“全文检索”,是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。例:literature(S)foundation只要literature和foundation两词出现在同一句子中,就满足检索条件。位置检索7.3.4字段限定检索字段限定检索(fieldlimitingretrieval)是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。例如:(CloudComputing/DE,TIORArtificialIntelligence/ID,TI)ANDPY=2018ANDLA=English字段限定检索047.4搜索引擎7.4搜索引擎7.4.1搜索引擎的类型12347.4.2常见的搜索引擎7.4.3搜索引擎的使用方法7.4.4搜索引擎的技巧7.4.1搜索引擎的类型全文搜索引擎元搜索引擎垂直搜索引擎目录搜索引擎类型7.4.1搜索引擎的类型根据搜索结果来源的不同,可以分为两类:一类是拥有自己的蜘蛛程序的搜索引擎另一类则是租用其他搜索引擎的数据库,然后按照自己的规则和格式来排列和显示搜索结果的搜索引擎。1.全文搜索引擎7.4.1搜索引擎的类型元搜索引擎(METASearchEngine)在接受用户查询请求后会同时在多个搜索引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。2.元搜索引擎7.4.1搜索引擎的类型垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是根据特定用户的特定搜索请求,对网站(页)库中的某类专门信息进行深度挖掘与整合后,再以某种形式将结果返回给用户。3.垂直搜索引擎7.4.1搜索引擎的类型目录索引(SearchIndex/Directory)也称为分类检索,是互联网上最早提供的网站资源查询服务。目录搜索引擎是网站内部常用的检索方式。典型代表:国内:新浪、搜狐、网易分类目录和Yahoo。国外:OpenDirectoryProject(DMOZ)、LookSmart、About。4.目录搜索引擎7.4.2常见的搜索引擎百度360搜狗谷歌Bing常见搜索引擎7.4.2常见的搜索引擎百度搜索是全球领先的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。网址:1.百度7.4.2常见的搜索引擎360搜索属于全文搜索引擎,是目前广泛应用的主流的搜索引擎之一。360搜索包含了网页、新闻、影视等搜索产品,能为用户带来更安全、更真实的搜索服务体验。网址:/2.360

7.4.2常见的搜索引擎搜狗搜索是全球首个百亿规模中文搜索引擎,收录100亿网页,再创全球中文网页收录量新高。每日网页更新量达5亿,用户可直接通过网页搜索而非新闻搜索,获得最新新闻资讯。地址:https:///3.搜狗7.4.2常见的搜索引擎谷歌是全球最大的搜索引擎,是互联网上最受欢迎的网站之一,同时也拥有大量的用户群体。谷歌以简单、干净的页面设计和最相关的搜索结果赢得了用户的认可。谷歌搜索引擎每天需要处理2亿次搜索请求,数据库存有30亿个WEB文件。提供常规搜索和高级搜索两种功能。信息条目数量,并用多种语言。网址:/4.谷歌7.4.2常见的搜索引擎Bing(必应)是微软公司于2009年推出的搜索引擎,它集成了搜索首页图片设计,崭新的搜索结果导航模式,创新的分类搜索和相关搜索用户体验模式,视频搜索结果无须单击即可直接预览播放,图片搜索结果无须翻页等功能。5.Bing7.4.3搜索引擎的使用方法百度搜索引擎简单方便,仅需输入查询内容并按下回车键(Enter),即可得到相关资料,或者输入查询内容后,用鼠标点击“百度搜索”按钮,也可得到相关资料。例如:使用方法7.4.3搜索引擎的使用方法注意:百度搜索引擎严谨认真,要求“一字不差”。输入多个词语搜索可以获得更精确的搜索结果。例如:“雷峰塔”和“雷风塔”,会得到不同的结果。使用方法7.4.4搜索引擎的技巧减除无关资料并行搜索相关检索百度快照在指定网站内搜索在标题中搜索技巧列表7.4.4搜索引擎的技巧百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一个空格。例如:要搜寻关于“武侠小说”,但不含“古龙”的资料,可使用如下查询:”武侠小说–古龙”。1.减除无关资料7.4.4搜索引擎的技巧方法:使用“A|B来搜索“能够搜出包含词语A,或者包含词语B”的网页。例如:“图片|写真”2.并行搜索7.4.4搜索引擎的技巧3.相关检索7.4.4搜索引擎的技巧点击每条搜索结果后的“百度快照”,可查看该网页的快照内容。百度快照不仅下载速度极快,而且您搜索用的词语均已用不同颜色在网页中标明。4.百度快照7.4.4搜索引擎的技巧在一个网址前加“site:”,可以限制只搜索某个具体网站、网站频道、或某域名内的网页。例如:“体育site:”表示在网站内搜索(官方网站)和“体育”相关的资料。5.在指定网站内搜索7.4.4搜索引擎的技巧在一个或几个关键词前加“intitle:”,可以限制只搜索网页标题中含有这些关键词的网页。例如:“intitle:计算机、“intitle:百度互联网”6.在标题中搜索057.5专用平台的信息检索7.5专用平台的信息检索7.5.1学术信息检索12347.5.2专利信息检索7.5.3期刊信息检索7.5.4商标信息检索57.5.5学位论文检索7.5.1学术信息检索互联网中有很多用于检索学术信息的网站,在其中可以检索各种学术论文。百度学术于2014年6月上线,是百度旗下的免费学术资源搜索平台,提供海量中英文文献学术资源,涵盖各类学术期刊、学位、会议论文,致力于将资源检索技术和大数据挖掘分析能力贡献于学术研究,优化学术资源生态,引导学术价值创新,旨在为国内外学者提供最好的科研体验。简介7.5.1学术信息检索(1)打开“百度学术”网站首页,在首页的搜索框中输入要检索的关键词“智能算法”,如图7-4所示,然后单击“百度一下”按钮。

百度学术检索图7-4百度学术7.5.1学术信息检索(2)在打开的页面中可以看到检索结果,如图7-5所示。(3)单击要查看的某个论文的标题,在打开的页面中可以查看更详细的信息。百度学术中检索图7-5搜索结果7.5.2专利信息检索专利信息检索是指根据一项或数项特征,从大量的专利文献或专利数据库中挑选符合某一特定要求的文献或信息的过程。简介7.5.2专利信息检索国家知识产权局负责全国的专利保护工作。网址:/;栏目:“政务服务”

“专利检索”专利信息检索7.5.2专利信息检索(1)进入“专利检索”页面后,系统默认显示“常规检索”页面,如图7-6所示。搜索有关“传感器”的专利信息图7-6“常规检索”页面7.5.2专利信息检索例如:搜索有关“传感器”的专利信息步骤:选择“自动识别”输入“传感器”选择数据范围点击“检索”按钮搜索有关“传感器”的专利信息图7-7“常规检索”数据范围7.5.2专利信息检索在“自动识别”中检索,如果多个关键词之间用空格分隔,系统按照多个关键词之间“AND”的关系进行检索。在“自动识别”中检索,支持最多输入20个检索词

在“检索要素、申请号、公开(公告)号、申请(专利权)人、发明人、发明名称”中检索,如果多个关键词之间用空格分隔,系统按照多个关键词之间“OR”的关系进行检索。注意事项:7.5.3期刊信息检索期刊是指定期出版的刊物,包括周刊、旬刊、半月刊、月刊、季刊、半年刊、年刊等。期刊7.5.3期刊信息检索例:在国家科技图书文献中心网站中,检索有关“电子技术与软件工程”的期刊,其具体操作如下:打开“国家科技图书文献中心”网站首页;撤销选中“会议”“学位论文”两个选项;然后在“文献检索”搜索框中输入关键词;单击“检索”按钮。检索“电子技术与软件工程”期刊图7-8“国家科技图书文献中心”网站首页7.5.3期刊信息检索在打开的页面中可以看到查询结果。检索“电子技术与软件工程”期刊图7-9文献检索结果7.5.4商标信息检索商标是用来区分一个经营者和其他经营者的品牌或服务不同之处的。商标信息检索也就是商标查询。商标信息检索7.5.4商标信息检索例:在中国商标网中查询与“趵突泉”类似的商标,其具体操作如下:(1)“中国商标网”

“商标网上查询”(2)“商标网上查询”

“商标近似查询”(3)输入查询信息。(4)查看结果商标信息检索7.5.5学位论文检索学位论文是作者为了获得相应的学位而撰写的论文,其中硕士论文和博士论文非常有价值。学位论文检索7.5.5学位论文检索例:在中国知网的学位论文中心服务系统中检索有关“工业互联网”的学位论文,其具体操作如下:(1)打开中国知网的主页/,如图7-11所示。学位论文检索图7-11中国知网7.5.5学位论文检索(2)点击输入框下方的“学位论文”链接,进入知网的“学位论文库”。学位论文检索图7-12学位论文库7.5.5学位论文检索(3)输入关键词“人工智能”;(4)在打开的页面中可以看到查询结果。学位论文检索图7-13论文检索结果本章小结信息检索是人们进行信息查询和获取的主要方式,是查找信息的方法和手段。掌握网络信息的高效检索方法,是现代信息社会对高素质技术技能人才的基本要求。本章通过信息检索基础知识、搜索引擎使用技巧、专用平台信息检索等内容的介绍,要求理解信息检索的基本概念,了解信息检索的基本流程;掌握常用搜索引擎的自定义搜索方法,掌握布尔逻辑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论