信息技术(基础模块)课件 第4章-信息检索_第1页
信息技术(基础模块)课件 第4章-信息检索_第2页
信息技术(基础模块)课件 第4章-信息检索_第3页
信息技术(基础模块)课件 第4章-信息检索_第4页
信息技术(基础模块)课件 第4章-信息检索_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索《信息技术》InformationRetrieval

讲授:****任务目标01信息检索基础知识02使用搜索引擎进行信息检索03使用专用平台进行信息检索信息检索《信息技术》任务一信息检索基础知识

讲授:****任务目标01任务描述02知识讲解任务描述任务一信息检索基础知识01任务描述信息具有使用价值,能满足人们的特定需要,为社会服务。人们进行生产经营、科研等活动,产生各种原始记录以及成果,然后将其以文字、图形、符号、音视频等方式记录在载体上形成信息资源供他人检索使用。人们常通过报纸、图书、电视、互联网站、微博、微信、论坛、朋友圈等获取信息资源,也通过期刊、论文、专利等平台进行信息检索。认识各种信息资源,了解其加工、整理、组织并存储的方式,掌握信息检索的基本概念和工具方法,是准确进行信息检索的基础,是生活在信息爆炸时代必备的技能知识。。知识讲解信息与信息资源的概念信息处理的方法与技术信息检索的基本概念02知识讲解1.信息与信息资源的概念信息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。信息资源有狭义和广义之分。狭义的信息资源是指信息本身或信息内容,即经过加工处理,对决策有用的数据。开发利用信息资源的目的是充分发挥信息的效用,实现信息的价值。广义的信息资源是指信息活动中信息、信息技术,以及相应的设备、资金和人等各种要素的总称。信息资源由信息生产者、信息、信息技术三大要素组成。知识讲解1.信息与信息资源的概念存在形式语言信息资源实物信息资源文献信息资源文献内容的特点图书、期刊、会议论文、学位论文、科技报告、专利文献、标准文献、政府出版物、档案文献和产品资料等文献内容内容的加工深度一次文献(也称原始文献)二次文献:报刊索引三次文献:百科全书文献的展现形式纸质印刷型信息资源网络电子型信息资源信息属性不同,信息资源划分类型不同:存在形式、文献内容的特点、内容的加工深度、文献的展现形式知识讲解1.信息与信息资源的概念加工深度举例知识讲解2.信息处理的方法与技术信息处理技术是指信息的生产工具,是对信息进行收集、加工、组织、存储和传递等的手段和方法。收集加工组织存储传递知识讲解2.信息处理的方法与技术信息收集是指通过各种方式获取所需要的信息。信息加工是指对信息的接收、存储、操作运算和传送,或对存储在信息加工系统中的各种符号结构的操作和处理。信息的筛选和判别、分类和排序、分析和研究。信息组织是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。信息存储是将获得的或加工后的信息保存起来,以备将来查询检索、管理、共享等。信息存储的介质包括纸、胶卷、计算机等,信息存储应当决定,什么信息存在什么介质中比较合适。随着技术的发展,人们在做信息存储的时候可以采用:存储虚拟化技术、分级存储技术、数据保护技术等。知识讲解2.信息处理的方法与技术从大数据的数据处理技术全过程理解信息处理技术知识讲解3.信息检索的基本概念信息检索(InformationRetrieval)是人们进行信息查询和获取的主要方式,是查找信息的方法和手段,是人们获取知识的途径也是科学研究的向导。信息检索有广义和狭义之分。狭义的信息检索仅指信息查询(InformationSearch)。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程,又称信息的存储与检索。一般情况下,信息检索指的就是广义的信息检索。知识讲解3.信息检索的基本概念用户根据需要输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。信息检索系统的体系结构如图12346信息检索的基本步骤包括:问题分析、选择检索工具、抽取检索词、构造检索式、文献检索及检索式的调整、检索结果的处理等。知识讲解3.信息检索的基本概念51、问题分析。分析实质问题,确定对应的主题概念以及各主题概念之间的关系,以及涉及的学科、时间、语种等。2、选择检索工具。从专业性、权威性等角度综合考虑选择合适的检索工具。3、抽取检索词。确定检索词一定要准确、专业、全面。4、构造检索式5、文献检索及检索式的调整6、检索结果的处理构造检索式:检索式是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种布尔逻辑算符、截词符(通配符)、位置算符、嵌套算符(优先算符)等构成。知识讲解3.信息检索的基本概念截词检索是预防漏检提高查全率的一种常用检索技术,截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。不同的系统所用的截词符也不同,常用的有“?、*”等。“?”通常可表示0或1个字符,如:“apple?”可以表示“apple”或“apples”,“*”通常可表示1个或多个字符,包括空字符,例如“computer*”可以检索出computer、computers、computering、computerization等结果。位置检索是用一些特定的位置算符(如“W”“N”“S”)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。“W”算符两侧的检索词必须紧密相连,除空格和标点符号外,且两词的顺序不能颠倒,如:“Artificial(W)Intelligence”,表示“N”算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。信息检索《信息技术》任务二使用搜索引擎进行信息检索

讲授:****任务目标01任务描述02技术分析03示例演示04任务实现05能力拓展任务描述任务二使用搜索引擎进行信息检索01任务描述网络上的信息资源内容极其丰富,形式多样,包括目录、索引、全文、程序、声音、图像和多媒体等。对于网络信息资源的获取,人们最常用的方式是使用“搜索引擎”,了解和学习一些搜索引擎的检索原理与检索方法,掌握其使用技巧有利于提高对网络资源的利用效率。技术分析搜索引擎的基本概念与原理搜索引擎的分类搜索引擎的使用社交软件搜索02技术分析1.搜索引擎的基本概念与原理搜索引擎(SearchEngines)是指收集了互联网上几千万到几十亿个网页并对其中的每个词(关键词)进行索引,建立索引数据库以提供给用户进行查询的一种检索系统机制。当用户查找某个关键词时,所有包含了该关键词的网页都将作为搜索结果被搜出来。搜索引擎的基本结构:信息采集子系统、信息分析标引子系统、信息检索子系统和管理维护子系统。搜索引擎原理:抓取网页(从互联网上采集信息)→处理网页(建立索引数据库)→提供检索服务(在索引数据库中搜索排序)。技术分析

2.搜索引擎的分类搜索方式全文搜索国外有Google、Bing等,国内有百度、搜狗等。从网上提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。分类目录分类目录引擎是网上最早提供WWW资源查询的服务,它是将网页的内容,按其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构的一种目录索引。新浪、搜狐。元搜索元搜索引擎是一种在接收用户检索请求后,在一个统一的搜索界面帮助用户同时在多个搜索引擎上实现检索操作的搜索引擎。InfoSpace、360垂直搜索专注于特定的搜索领域和搜索需求(如机票搜索、旅游搜索、小说搜索、视频搜索等)。如淘宝、天猫、京东、去哪儿网。技术分析3.搜索引擎的使用关注:CNNIC的报告《中国互联网络发展状况统计》技术分析4.社交软件搜索由于移动终端的便捷性,越来越多的用户喜欢用微信上的搜索功能。CNNIC第49次《中国互联网络发展状况统计报告》显示,微信搜索布局进一步巩固,2021年9月,搜狗宣布完成私有化交易,成为腾讯全资子公司,在保留独立搜索品牌的同时,为微信提供搜索技术与内容支持,进一步提升微信的内容分发能力。报告还显示字节跳动旗下搜索产品进一步发展,截至2021年2月,抖音视频搜索月活跃用户已超过5.5亿,搜索投入力度持续加大。在搜索方式方面,微信“搜一搜”的电脑端应用对搜索方式进行升级,用户选中聊天信息即可直接实现搜索;在内容方面,微信电脑端“搜一搜”新增公众号、小程序、新闻、视频等内容,进一步丰富了微信搜索生态,提高竞争力。示例演示使用搜索引擎查找信息03示例演示1.使用百度搜索引擎(1)简单搜索浏览器打开百度网站“”后,百度的检索框输入“实现中国奇迹的关键驱动力”后,点击“百度一下”。示例演示1.使用百度搜索引擎(2)多关键词搜索逻辑AND:多个关键词用空格分隔时,逻辑OR:关键词之间加上符号“→”。如果对关键词进行双引号标识,则表明这是一个完整的关键词,不能进行拆分和演变。例如,输入“北京

核酸检测政策”、““北京

核酸检测政策””、“北京→核酸检测→政策”结果是完全不一样的。示例演示1.使用百度搜索引擎(3)高级搜索。在百度输入框的右侧,在“设置”菜单中选择“高级搜索”选项示例演示1.使用百度搜索引擎(4)搜索范围限定在网页标题中。例如搜索框输入“跳水intitle:全红婵”示例演示1.使用百度搜索引擎(5)搜索范围限定在特定网站中。例如在网站“”中搜索“百度影音”,搜索框输入“百度影音site:”,示例演示1.使用百度搜索引擎(6)用inurl指令进行搜索。“inurl:xxx”作用是查找url中包含xxx的网页,例如“inurl:”就是指在搜索引擎中寻找url包含的网页。例如搜索框中输入“inurl:toutiao”,网页正文包含“toutiao”关键字的网页;“inurl:xxx关键词”,表示要搜索引擎查找满足url和关键词这两个要求的网页;例如:“就业创业inurl:gjzwfw”,网页正文包含“就业创业”且url中有“gjzwfw”的网页示例演示2.使用社交媒体微信(wechat)搜索(1)用微信“搜一搜”功能,打开手机端微信APP,点开“发现”选项页的“搜一搜”(2)在搜索框输入“故宫博物馆”,就会出现有关的搜索结果示例演示3.在“去哪儿网“查找机票打开“去哪儿网”的网址:“/”,如图4.18中输入机票的出发和到达地点,选择日期,点击“立即搜索”任务实现用百度搜索“python”的学习资料04任务实现打开百度后,在搜索框输入“python的视频教程”,发现排在前面的基本上都是广告。1.百度搜索视频教程资源可以采取在url中限定为视频资源的搜索方式可以获得比较良好的效果,例如搜索框输入“python视频教程inurl:video”任务实现(1)首先搜索python编辑器,后进入网站查看介绍后选用“PyCharm”这个编辑器,再在百度搜索框输入“PyCharm官网”如图4.24所示,点击页面进入官网进行下载。2.百度搜索python编辑器和实用技巧文档资源任务实现(2)、在百度搜索框输入“python实用技巧filetype:doc”或者“python实用技巧filetype:pdf”,查找关于python实用技巧“doc或者pdf”文档2.百度搜索python编辑器和实用技巧文档资源能力拓展在多个平台查询武汉大学录取分数线05能力拓展1.

通过搜索引擎查询打开百度搜索引擎,输入“武汉大学+录取分数线”,如图所示,选择高考主会场或者武汉大学官网进入。能力拓展2.通过微信“搜一搜”功能查询打开手机微信APP,在“发现”的“搜一搜”界面输入“武汉大学分数线”,通过公众号或者小程序进入查询信息检索《信息技术》任务三使用专用平台进行信息检索

讲授:****任务目标01任务描述02技术分析03示例演示04任务实现05能力拓展任务描述

任务三制作“工作总结”信息检索01任务描述

作为一个生活在信息时代的大学生,每天都接收到大量的信息,明确自己的信息需求,获取到自己所需要的准确信息变得尤为重要,获取图书信息资源和期刊、专利、标准、政府报告等文献信息资源对我们的学习、工作、生活更具有重要意义,需要我们掌握图书检索系统和文献检索系统的使用。技术分析馆藏图书、电子图书、数据库信息资源、国家智慧教育公共服务平台等02技术分析1.图书图书作为历史最悠久的一种文献信息资源,其使用范围广、种类丰富且阅读人群众多。纸质图书是指各类学校或公共图书馆内的藏书,均会向用户提供馆藏书目检索系统,这是一种联机目录检索形式。联合目录查询。CALIS联合目录公共检索系统是CALIS联机合作编目形成的联合目录数据库,属于中国高等教育文献保障系统的一个子系统。用户通过该系统能查询全国各成员馆的馆藏信息。电子图书(又称e.book)是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用的一种新型图书信息资源。电子图书有着与传统书籍一样的编排格式,以适应读者的阅读习惯。电子图书的检索系统有很多,如中国国家图书馆、书生之家等。技术分析2.数据库信息资源除图书信息资源外,其他如期刊、专利、标准、政府报告等文献也都有以专门数据库形式出现的信息资源检索系统,如中国知网、维普、万方等中文数据库系统,以及SpringerLink、EI等外文数据库系统。CNKI(ChinaNationalKnowledgeInfrastructure,中国知识基础设施工程),也称中国知网,是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月,其网址为。CNKI知识资源数据库系统是一个大型动态数据库、知识服务平台和数字化学习平台。该数据库由中国学术期刊、中国优秀博硕士学位论文、中国重要会议论文、中国重要报纸全文、工具书、专利、标准等十多个子数据库构成。万方学术资源数据库()是由万方数据股份有限公司开发的一个高效、先进的信息服务系统,始建于2000年。万方学术资源数据库由中国学位论文全文数据库、中国学术期刊库、中国科技专家库、中国学术会议文献库、中国法律法规库、中外标准数据库、中国机构库、中国特种图书库、中文科技报告库、中国科技成果库和学者库等18个子数据库构成,涵盖中外学术期刊论文、会议文献、学术成果、标准、专利、特种图书、科技报告等多种信息资源。技术分析3.国家智慧教育公共服务平台国家智慧教育公共服务平台是由中华人民共和国教育部指导,教育部教育技术与资源发展中心(中央电化教育馆)主办的智慧教育平台。教育部推出“智慧高教”平台,旨在解决各类学习者在使用中遇到的资源分散、数据不通、管理不规范等问题,这是一个为全国高校师生和社会学习者提供高效便捷的教与学服务的国家级资源平台。平台2022年3月28日开通以来,正式运行国家中小学智慧教育平台、国家高等教育智慧教育平台、国家职业教育智慧教育平台、24365国家大学生就业服务平台。2022年7月14日,教育部召开新闻发布会,国家智慧教育平台上线后,截至7月12日,门户平台和4个子平台的总浏览量已超过30.3亿次,总访客量达4.3亿人。示例演示使用专用平台检索图书、期刊、论文等信息03示例演示1.纸质图书信息资源检索(1)馆藏书目检索图书信息用户根据索书号的指引,可直接入馆查看或进行借阅,在“武汉大学图书馆”的馆藏目录检索系统中,通过题名途径,检索到该大学图书馆包含“人工智能”的图书信息示例演示1.纸质图书信息资源检索(2)联合目录查询图书信息在CALIS联合目录公共检索系统(/opac/simpleSearch.do)内,以题名为途径,检索书名中包含“人工智能”的图书信息示例演示2.电子图书信息资源检索打开读秀数字图书的网址:“”,查找作者为“鲁迅”的图书作品。示例演示3.CNKI数据库系统资源检索(1)多库联合一站式检索。在多库间以关键词“人工智能”为检索途径,示例演示3.CNKI数据库系统资源检索(2)在结果中检索。在上一个例子的结果中,在期刊子系统中检索,添加关键词为“物联网”的相关文献。示例演示3.CNKI数据库系统资源检索(2)在结果中检索。系统对检索到的1370条信息进行分组浏览,默认为按发表年度排序。为提高检索准确率,再向系统指定第二项检索条件:在上述检索的基础上,再选择“主题”途径,并输入检索词“智能家居”,然后单击“结果中检索”按钮,得到更精确的检索结果。示例演示3.CNKI数据库系统资源检索(3)高级检索。通过“高级检索”则可以对多条件同时进行限定,使检索更加精准。在“高级检索”界面中,用户可根据需求特征,选择相应的检索途径进行条件限制,如主题、篇名、关键词、摘要等,然后在其后面的检索框中输入检索词。若一个检索项需要多项条件限制,则可选择“AND”、“OR”、“NOT”的逻辑运算关系,示例演示4.国家智慧教育公共服务平台相关资源检索(1)国家职业教育智慧教育平台检索资源。打开国家智慧教育公共服务平台网站(),点击“智慧职教”进入国家职业教育智慧教育平台,

可以输入“专业、课程教师或者学校名称”进行检索相关资源。输入“大数据技术”点击搜索示例演示4.国家智慧教育公共服务平台相关资源检索(2)利用24365国家大学生就业服务平台找工作。打开国家智慧教育公共服务平台的子平台“24365国家大学生就业服务平台”,毕业生和用人单位都可以注册账号登录开展求职或招聘等工作。任务实现检索某课题的文献信息资源04任务实现1.制定第一次检索策略要对课题“高职院校大数据技术专业人才培养模式研究”进行文献信息的检索,首先制定第一次检索策略表检索系统检索词检索表达式检索途径时间范围文献

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论