版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模块四信息检索——穿过茫茫信息海洋勇登彼岸想象一下,你在马路上走着,某个陌生人刚与你擦肩而过,最多通过六个人你就能够认识ta,奇妙吗?这就是小世界理论(也叫作六度空间理论):你和任何一个陌生人之间所间隔的人不会超过六个,世界上所有的人其实都是相互认识的,只是可能需要通过或多或少的中间人,如图4-1所示。人际关系就好比一张网络,同样地,分布在网络各个节点的所有信息之间其实也存在联系。我们可以根据其一个或多个特征,合理使用信息检索技术,快速准确地找出想要获取的信息,探索信息世界的奥秘。千淘万漉虽辛苦,吹尽狂沙始到金。身处当今信息爆炸的时代,作为一名现代信息高素质大学生,从浩瀚无垠的信息大浪中,要想充分准确汲取到知识精华,淘到知识和信息的“金”,耐心灵活运用各种信息检索方法,是非常有必要的。本模块将结合信息检索基础知识,介绍几种常用的信息检索技巧,如通过搜索引擎、专用平台、网页、社交媒体等不同信息平台进行信息检索。让我们开始遨游在“信息大海”中,运用手中的“探照灯”(信息检索技巧),探索世界的奥秘吧!图4-SEQ图4-\*ARABIC1小世界理论项目4.1善用搜索引擎——成为一名掌舵手如今,互联网已成为人们学习、工作和生活中不可缺少的平台,搜索引擎是一种工作于互联网上的检索技术,从互联网上采集信息并进行组织处理,最后将检索到的相关信息结果呈现给用户。伴随互联网的发展,搜索引擎也历经了四代进化,日趋成熟,为我们信息探索提供了有力保障。(活页:搜索引擎的历史)本项目将介绍常用搜索引擎的自定义搜索方法、布尔逻辑检索、截词检索、限制检索等检索方法,鼓励各位同学巧用搜索引擎的信息检索技巧,勇当信息时代排头兵,合力探索信息世界奥秘。4.1.1任务:自定义搜索——规划最适用的航道工欲善其事必先利其器。有时候,我们在搜索引擎进行信息筛选的时候,常会有不相关的内容出现在搜索列表,此时,选择适合的搜索引擎(活页:自定义搜索引擎)和适当的自定义高级搜索设置,可以使我们在信息检索的过程中事半功倍,让我们为信息海洋探索之旅规划一条最合适的航线吧!【任务描述】本任务以百度这个搜索引擎为例,通过“搜索设置”对搜索列表的显示进行设置。按高级搜索不同的筛选条件,让搜索引擎对搜索结果进一步检索。【示例演练】在日常生活中,我们最常用到的搜索引擎有百度、谷歌、搜狗、360等主流引擎,这些搜索工具能帮助我们在海量的信息中搜寻目标信息,但同时可能会出现一些干扰信息,比如推送广告、关键字不完全匹配目标信息等。那么,此时我们可以通过自定义搜索方法来对搜索引擎的基本搜索条件(例如语言范围、搜索框默认提示数量、是否实时预测等)和高级搜索条件(例如关键词、时间出现的位置、文档格式、是否指定站内搜索等)加以限制,以此来帮助我们在茫茫信息海洋中更高效地汲取到有效信息精华。【任务实现】1.首先,我们进入百度官网,网址为/,如下图4-2所示。图4-SEQ图4-\*ARABIC2百度首页2.点击右上角“设置”,出现下拉菜单,单击“搜索设置”。弹出提示框,上面显示以下内容:搜索框提示:是否希望在搜索时显示搜索框提示;搜索语言范围:设定您所要搜索的网页内容的语言,可选全部语言、仅简体中文、仅繁体中文;搜索结果显示条数:设定您希望搜索结果显示的条数,可选每页10条、每页20条、每页50条;实时预测功能:是否希望在您输入时实时展现搜索结果;搜索历史记录:是否希望在搜索时显示您账号下的搜索历史。我们可以根据实际使用需求来设置上述各种基本搜索设置选择,同时,也切换到“高级搜索”标签栏,出现以下选项内容:图4-SEQ图4-\*ARABIC3高级搜索3.在高级搜索设置模块中,我们可以设置:搜索结果。根据我们的需要设置搜索结果,比如是否需要包含全部关键词、是否包含以下完整关键词、是否包含以下任意一个关键词或者不包括以下关键词;时间、文档格式等相关内容。我们可以限定要搜索的网页的时间,如全部时间或某年某月某日;可以设置网页格式为网页或文件等形式;关键词的位置在网页任何地方,或者仅仅只匹配网页标题中的关键字等;具体文件类型。可以设置为所有网页和文件、.pdf、.doc、.xls、.ppt等,这样使得我们的搜索更具目标性,且能更快更方便地找到需要的文件。高级搜索,其实相当于搜索运算符的可视化界面,使我们可以不去记那些众多的搜索运算符,目的是帮助我们更加精确地获取搜索结果。4.搜索引擎中常用的搜索算法(1)精准匹配,需要加上双引号,不加双引号搜索的结果中关键词可能会被拆分,如图所示:图4-SEQ图4-\*ARABIC4精准匹配示意图4-SEQ图4-\*ARABIC5非精准匹配(未加双引号)(2)不包含指定关键词的搜索,是通过一个减号(-)来实现的,它的使用语法是前一个关键词与后一个关键词之间用减号连接,且减号的左边是空格,例如:我爱花-朵,如图所示:图4-SEQ图4-\*ARABIC6不包含指定关键词的搜索(3)包含指定关键词的搜索,是通过一个加号(+)来实现的,它的使用语法是前一个关键词与后一个关键词之间用加号连接,且加号的左边是空格,例子:我爱花+朵,如图所示:图4-SEQ图4-\*ARABIC7包含指定关键词的搜索查询指定的文件格式,支持的文件格式可以是pdf/txt/doc等;例子:花朵filetype:pdf。如图所示:图4-SEQ图4-\*ARABIC8查询指定的文件格式并行搜索,是通过符号(|)连接关键词的,使用语法是A|B,搜索的结果显示是A或B,例子:花|草图4-SEQ图4-\*ARABIC9并行搜索接下来,请同学们动手实践,以百度网站为例,进行基本和高级搜索设置,找出今年以来网页标题中包含“我和我的祖国”完整关键字的新闻吧!【能力拓展】搜索引擎的隐私设置以百度为例,在官网右上角“设置”,出现下拉菜单,单击“隐私设置”,我们可以:1)对用户的搜索行为日志(可以理解为“记录”)进行开启或关闭,如果关闭,搜索引擎将不再记录我们的搜索行为,虽然可以提高网络安全性,但不利于用户重复搜索,降低搜索效率。2)是否展现搜索下拉框中的搜索历史词汇,我们搜过什么,下拉框便会记录并显示历史搜索词。3)查看或清理历史词。4)设置手机号搜索展现保护,开启后,搜索绑定的手机号时,结果中将不再展示用户的个人信息。5)身份证号搜索展现保护,开启后,搜索绑定的身份证号时,结果中将不再展示个人信息。图4-SEQ图4-\*ARABIC10搜索引擎的隐私设置4.1.2任务:布尔逻辑搜索——选择最缜密的工具“百度”搜索支持多种信息搜索技术,我们先来认识一个最简单的搜索方法——布尔逻辑搜索。首先,什么是布尔逻辑?我们可以联系计算机二进制的1和0,1代表真,0代表假,通过对一些数值进行“与、或、非、异或”等运算出的结果,要么不等于0(为真)要么为0(为假),这称为布尔逻辑运算。同理,在搜索技术中,运用布尔逻辑运算符对信息进行检索的过程称为布尔逻辑检索,也称作布尔逻辑搜索。严格意义上的布尔检索法是指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。它使用面最广、使用频率最高。布尔逻辑运算符的作用是把检索词连接起来,构成一个逻辑检索式。(活页:布尔逻辑)本任务将以最常用的“与”、“或”两种布尔逻辑为例展开讲解,以期匹配更加精确的关键字,运用缜密的逻辑思维助力目标信息岛的登陆进程!【任务描述】在为搜索引擎进行了自定义设置以后,我们还能运用布尔逻辑来对搜索范围进行进一步的限定,缩小搜索范围,从而在海量信息量中获取到目标信息,实现更精确的检索效果。【示例演练】运用布尔逻辑“与”搜索和“央视”有关的“美丽中国”的相关内容。运用布尔逻辑“或”搜索和“中国”或者“美丽”的相关的网页。【任务实现】1.通过布尔逻辑“与”搜索打开计算机上的任意一个浏览器,在网站搜索框中输入“百度”或“”,打开“百度”搜索界面,在该界面搜索框中输入关键字“美丽中国AND央视”,如图4-11所示,与所输入文字相匹配的内容将立即出现在该搜索框的下方。由于做了布尔逻辑“与”搜索的限制,只有与“央视”相关的“美丽中国”素材被筛选出。图4-SEQ图4-\*ARABIC11布尔逻辑“与”搜索通过布尔逻辑“或”搜索在“百度”搜索界面搜索框中输入关键字“中国OR美丽”,如图4-12所示,由于没有强限定“美丽中国”,所以任意与“美丽”和“中国”相关的内容都被显示出来。图4-SEQ图4-\*ARABIC12布尔逻辑“或”搜索【能力拓展】布尔逻辑的“非”在关键字之间增加“空格”和“-”,意味减去。如需检索除了欧洲之外的金融危机的相关信息,你可以输入”金融危机-欧洲“,如下图示例:图4-SEQ图4-\*ARABIC13布尔逻辑“非”搜索4.1.3任务:截词搜索——开拓最广阔的视野在信息检索技术中,截词检索是预防漏检提高查全率的一种常用检索技术,大多数搜索引擎都提供了截词检索的功能。截词,顾名思义,就是将我们的索引词用一定的符号(我们称为“截词符”)来进行分割,达到截断的效果,这样既可节省输入的字符数目,又可达到较高的查全率。(活页:截词检索的概念)但是,在使用截词检索表达式时,一定要合理使用,截断部分要适当,不要截得太短,以免增加检索噪音,查出很多无关的信息。截词检索的思路是,用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的内容,都为目标内容;它是扩大检索范围的手段和防止漏检的有效工具,具有方便用户、增强检索效果的特点,帮助我们在茫茫信息海面上用更宽广的视野寻找目标彼岸。【任务描述】不同的系统所用的截词符也不同,常用的有?、$、*等。本节将以“百度”搜索引擎常用的截词符“*”和空格截词符为例,讲解常用搜索引擎中的截词检索技巧。(活页:截词检索的分类)【示例演练】①运用截词检索的“*”截词符来搜索和“欢迎”、“学生”、“入学”的相关内容。②运用截词检索的空格截词符来搜索和“欢迎”、“你们”、“到来”的相关内容。【任务实现】在“百度”搜索界面搜索框中输入截词表达式“欢迎*学生*入学”,由于运用了“*”截词符,所有包含了“欢迎”、“学生”、“入学”3个关键字的链接都会被显示出来,如图4-14所示。图4-SEQ图4-\*ARABIC14截词搜索在“百度”搜索界面搜索框中输入截词表达式“欢迎你们到来”,由于运用了空格截词符,所有包含了“欢迎”、“你们”、“到来”3个关键字的链接都会被显示出来,如图4-15所示。图4-SEQ图4-\*ARABIC15截词搜索【能力拓展】搜索引擎排名优化在搜索引擎里输入一个关键字,通常得到很多搜索结果,这些搜索结果的排名有先后之分,这就是搜索引擎排名。提高在搜索引擎中的自然排名,吸引更多的用户访问,提高访问量,从而提高商品的销售能力和宣传能力,从而提升商品的品牌效应。搜索引擎优化的技术方法主要有结构优化、站内导航优化、标题标签优化、关键词优化、链接优化、内容优化和URL优化共七种。那具体应该怎么实现呢,首先,设计的网页,排版简单、以达到直观、打开速度快的目的;其次,合理的把需优化的关键词放到页面里,让搜索引擎认为不是作弊,但密度又很高;最后,命名易记的域名,域名具有品牌效应,且汉语拼音类的域名和数字域名权重较高。大家可以通过查找相关资料,搜索更多提升引擎排名的方法。4.1.4任务:位置检索——锁定最理想的彼岸其实,搜索引擎本身就是一种基于位置索引进行检索的技术。什么是索引?举个例子,我们都用过新华字典,当我们想要通过偏旁部首来查字词的时候,在字典目录按照偏旁部首查字的部分就是索引;当我们想要通过拼音来查字词的时候,拼音首字母就是索引。也就是说,索引是帮助我们更好地定位到索引词的精确位置的记号。那么,有什么工具可以帮助我们快速建立起索引(航道),并且顺藤摸瓜利用索引定位我们要登陆的彼岸呢?(活页:位置检索)【任务描述】在检索时,通过一些特定算符来表达检索词之间位置关系的过程叫做位置检索。常用的算符有NEAR、WITH等。在这些算符后面加上数字,表示间隔几个词的位置。一般情况下词之间没有先后顺序,表示两个词之间位置。本节将重点学习NEAR算符。NEAR,一般也可以用“~”来表示。它用于寻找在一定区域范围内同时出现的检索单词的文档,但这些单词可能并不相邻,间隔越小的排列位置越靠前。其语法为“词一NEAR/N词二”,词一和词二这2个参数的间距可以通过“/N”来控制,N是大于1的整数,表示检索单词的间距最大不超过N个单词。举个例子,“人工智能/NEAR10推荐算法”,表示检索全文某个句子中同时出现“人工智能”和“推荐算法”,且两个词间隔不超过10个字词。【示例演练】①运用位置检索的“NEAR”截词符来搜索两个关键词“前端开发”和“思政”之间不超过5个字词的相关内容。②运用位置检索的语法,即,关键字后先空格,再增加后缀"site:url",在指定网页区域内搜索和“庆祝”、“共产党”、“100周年”的相关内容。【任务实现】1.在“百度”搜索界面搜索框中输入截词表达式“前端开发/NEAR5思政”,由于运用了“NEAR/N”位置算符,所有包含了“前端开发”和“思政”且间隔不超过5个字符的结果都会被显示出来,如图4-16所示。图4-SEQ图4-\*ARABIC16位置搜索2.在指定网页区域搜索利用语法格式为“关键字后先空格,再增加后缀“site:url””,其中url为需要检索的网页域,搜索引擎就会在这个网站内检索出你想要的内容。例如我们希望检索百度经验里面包含养生的内容,输入如下检索内容:“养生site:”,如下图为检索结果,全部为百度经验的养生的相关内容。图4-SEQ图4-\*ARABIC17指定网页搜索【能力拓展】多学一招:利用网页快照来搜索如果页面因网络故障等原因打开失败,可以利用“网页快照”的功能来重新查看。(活页:网页快照)网页快照,即为引擎对搜索结果的自动缓存,所以进入界面的速度相较于直接打开网页要快许多。它还有一个好处就是:搜索关键词用亮色标记,因此用户可以快速定位关键词,提高搜索效率。以“祖国最美”为例,在百度搜索框输入检索词(图1),点击第二个红框的“百度快照”字眼,打开搜索结果的网页快照如下图2所示:图4-SEQ图4-\*ARABIC18网页快照搜索图4-SEQ图4-\*ARABIC19网页快照搜索结果4.1.5任务:限制搜索——聚焦最关键的海域限制检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在这里,联系我们在4.1.1介绍的“高级搜索”功能来讲解如何通过对关键字段范围的限定来缩小导航范围,从而寻找到目标海岸的踪影。(活页:限制检索)【任务描述】为了验证搜索引擎的限制搜索功能,即通过限定检索字段范围,使用百度搜索引擎的“高级搜索”功能,来查找某段时间内某个网站中标题中包含某些关键词的相关信息。【示例演练】①运用限制检索查找一天内在百度网站中出现的标题包含“祖国最美”的目标信息。②运用限制检索查找自2011-12-12以来,在新浪网站中出现的标题包含“祖国”的目标信息。【任务实现】一天内在百度网站中出现的标题包含“祖国最美”的目标信息进入百度首页,点击右上角“设置”下拉菜单中的“高级检索”,接着,输入相关限定字段的内容,在此任务中,我们需要在“包含全部关键词”中填入“祖国最美”的检索词,在“时间”选项选择“时间不限”,在“关键词位置”选项点击“仅网页标题中”,在“站内搜索”模块填写“”,如下图所示。图4-SEQ图4-\*ARABIC20限制搜索设置点击“高级检索”按钮以后,搜索引擎便向我们呈现了检索结果,如下图所示。图4-SEQ图4-\*ARABIC21限制搜索结果可以看到,百度搜索引擎为我们自动生成了检索表达式“site:()title:(祖国最美)”,并在百度网站中查找了所有时间内标题中包含了“祖国最美”字样的结果;此外,我们还可以对搜索框下面的3个下拉选项进一步设置,在“时间不限”菜单中选择“一天内”,如下左图所示,最终搜索结果如下右图所示。图4-SEQ图4-\*ARABIC22限制搜索结果新浪网站自2011-12-12以来标题包含“祖国最美”的目标信息进入百度首页,点击右上角“设置”下拉菜单中的“高级检索”,输入相关限定字段的内容,在此任务中,我们需要在“包含全部关键词”中填入“祖国”的检索词,在“时间”选项选择“时间不限”,在“关键词位置”选项点击“仅网页标题中”,在“站内搜索”模块填写“”,如下图所示。图4-SEQ图4-\*ARABIC23限制搜索设置点击“高级检索”按钮以后,搜索引擎便向我们呈现了检索结果,如下图所示。图4-SEQ图4-\*ARABIC24限制搜索结果自动生成了检索表达式“site:()title:(祖国)”,并在所有新浪相关网站(包括官网、博客等)中查找了所有时间内标题中包含了“祖国”字样的结果;此外,我们还可以对搜索框下面的3个下拉选项进一步设置,在“时间不限”菜单中自定义选择“2011-12-12至今”,如下左图所示,最终搜索结果如下右图所示。图4-SEQ图4-\*ARABIC25限制搜索设置图4-SEQ图4-\*ARABIC26限制搜索结果【能力拓展】什么是Cookie?大家可能认识“Cookie”这个单词,有时我们也用复数形式“Cookies”,它的英文释义是曲奇饼干,在计算机软件专业领域,它表示的是“储存在用户本地终端上的数据”,大家可以理解为“小型文本文件”。那么,Cookie的作用是什么呢?举个例子,某Web站点可能会为每一个访问它的用户产生一个唯一的ID,并以Cookie文件的形式保存在每个用户的电脑上。如果使用浏览器访问该Web,会看到所有保存在硬盘上的Cookie。每个Cookie文件都是一个简单而又普通的文本文件。通过它的文件名,可以看出是哪个Web站点在机器上放置了Cookie(当然,站点信息在文件里也有保存)。总而言之,Cookie是由用户客户端计算机暂时或永久保存的信息,建立Cookie的目的是为了辨别用户身份。项目4.2巧用资源专用平台——玩转掌中的罗盘漫漫求学之路,我们在书籍的海洋徜徉,探索知识的奥秘;如今,进入大学校园,更需要掌握相关的检索技能,以助力我们在信息大洋中处于不败之地。此时,灵活玩转手中的罗盘,妙用检索技巧,可以帮助我们在海量文献中寻找到知识精髓。(活页:中国知网之检索技巧)4.2.1任务:字段检索——稳住“易晃”的指针【任务描述】在知网使用“字段搜索”查询“量子通信”相关的文章。在知网通过作者、摘要等字段搜索与“量子通信”相关的论文。【示例演练】字段检索即检索字段,实际上就是不同的检索点。不同的文献的检索字段是不一样的。在数据库中通过对字段的限制检索,可以控制检索结果的相关性,提高检索效能。检索是从已储存的信息库中索取、找出所需要的信息的过程。进入“中国知网”网站,进入主页后可以看到文献搜索的范围为学术期刊、学位论文、会议、报纸、专利等。如果要查询量子通信最新的学术期刊和学位论文,则可以取消勾选其他复选项,仅保留“学术期刊”和“学位论文”,如图4-27所示。图4-SEQ图4-\*ARABIC27输入关键字“量子通信”【任务实现】当搜索到某个作者的“量子通信”的文章后,如果对其发表的其他文章感兴趣,可以通过名字等字段搜索,将作者已公开发表的文章搜索出来。鼠标悬浮在知网主页搜索框左侧“作者”关键字上,会出现搜索类别的下拉列表框,包括主题、关键词、作者、摘要等,直接选择“作者”项,在搜索框输入要搜索的作者名字,即可查询该作者已公开发表的文章,如图4-28所示。图4-SEQ图4-\*ARABIC28搜索作者的结果如图4-29所示,搜索出的结果会显示“题名”“作者”“来源”和“发表时间”等关键信息,在“作者”一栏中显示该文章所有作者姓名,直接单击第一作者“周贤韬”后,会自动链接到该作者的简介页面。图4-SEQ图4-\*ARABIC29直接单击作者姓名的搜索结果【能力拓展】搜索插件在使用某种功能前,常出现提示需安装某种插件。插件其实是一种遵循一定规范的应用程序接口编写出来的程序,其只能运行在程序规定的系统平台下,而不能脱离指定的平台单独运行。很多软件都有插件,例如,在IE中,安装相关的插件后,Web浏览器能够直接调用插件程序,处理特定类型的文件。日常中,搜索引擎也有插件,在jQuery插件库网站中,提供了很多定制化搜索插件,如弹窗插件实现键入关键字后同时打开各大搜索引擎(百度、谷歌、搜狗等),在页面钟可以选择切换搜索方式。请在jQuery插件库网站选择下载安装一个喜欢的搜索插件。要说明的是,善意的插件会使软件的功能更加完善或强大。但目前,很多的搜索插件被制作成了广告或流氓软件,会影响系统运行速度,乱弹广告网页,甚至破坏系统文件及窃取用户资料等。4.2.2任务:混用字段检索与限制搜索——对准永远的North【任务描述】在“中国专利公布公告”查询最近两年与“基于人工智能技术的最新应用”相关的专利。学习使用专业网站搜索商标。【示例演练】字段检索和限制检索常常结合使用,字段检索就是限制检索的一种,因为限制检索往往是对字段的限制。在搜索引擎中,字段检索多表现为限制前缀符的形式。以使用“国家知识产权局”专用平台搜索“基于人工智能技术的最新应用”相关内容为例,搜索最新已发表的发明专利。在百度搜索页面,输入关键字“中国专利公布公告”,进入主页后可以看到公布公告的范围为发明公布、发明授权、实用新型、外观设计。如果需要查询“基于人工智能技术的最新应用”的发明专利,可以利用字段检索,只输入“人工智能”,并勾选“发明授权”项,如图4-30所示。图4-SEQ图4-\*ARABIC30进入“中国专利公布公告”网查询发明专利如果想查询最近专利,则需要使用限制搜索进行限制搜索范围,可在网站选择“高级查询”,以近两年为例,时间从2019.10.15至2021.10.15,文本名称输入“人工智能”,搜索结果如图4-31所示,此外,还包括申请号、专利人、摘要等多个选择项。图4-SEQ图4-\*ARABIC31高级搜索近两年“人工智能”的相关专利【任务实现】如果要注册公司,一般需要注册商标,下面就以查询儿童服装商标为例,查询已被注册的近似商标。首先在百度搜索“商标局官网”,选择带有“官方”字样的搜索项,进入后选择“商标网上查询”选项,如图4-32所示,进入商标查询页面,选择“商标近似查询”。图4-SEQ图4-\*ARABIC32国家商标局官方网站利用字段检索,直接搜索“服装”,结果显示出服装属于“25第二十五类服装,鞋,帽”,如图4-33所示。图4-SEQ图4-\*ARABIC33搜索作者的结果限制检索是通过限制检索范围,达到优化检索结果的方法。在搜索框输入汉字“头号”,单击“搜索”按钮,此时会跳出验证码,按提示输入后,如图4-34(a)所示,是已被申请过的包含“头号”字样的商标;再在搜索框输入“小精灵”,如图4-34(b)所示,无任何显示,表示该命名商标没被注册过,可申请注册“小精灵”商标,。(a)(b)图4-SEQ图4-\*ARABIC34搜索“头号”和“小精灵”的字段搜索结果【能力拓展】使用VPN进入专用搜索平台有些下载网站,并不能通过外网进入,例如,在家里并不能访问学校图书馆网站。此时需要通过学校VPN进入,VPN属于远程访问技术,简单地说就是利用公用网络架设专用网络。。学校图书馆网站属于专用搜索平台,其购买了知网、IEEE等知识搜索资源。请通过学校外部计算机,进入学校图书馆网站,在知网下载一篇博士论文。项目4.3活用公共信息平台——抬起手中的望远镜4.3.1任务:位置检索——凝望远方的彼岸位置检索也叫全文检索、邻近检索。所谓全文检索,主要是对网站内部进行检索,即利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。通过位置检索,我们可以锁定目标,全力航行,穿越茫茫信息海面和星辰大海,奔赴彼岸。【任务描述】使用“搜索”文本框搜索“火车”相关的内容,单击并进入相关搜索页面。在浏览器网页中打开“中国铁路12306”官网查询火车车次及时间。【示例演练】打开计算机搜索界面,获取“火车”的相关信息,会显示出“火车票”“火车票查询”“火车票订购网站12306”等,选择“火车票查询”选项,进入浏览器页面,单击“中国铁路12306”搜索项进入铁路官网,如图4-35所示。图4-SEQ图4-\*ARABIC35输入关键字“火车”在“中国铁路12306”首页显示需要选定车票的基本信息,包括车票的出发地、到达地及出发日期,其中出发地、到达地等位置信息对应位置搜索的检索词,单程、往返、接续换乘是表示位置检索的特定的算符,用来表达检索词间的邻近关系,如图4-36所示。图4-SEQ图4-\*ARABIC36“中国铁路12306”官网首页【任务实现】在“出发地”文本框输入并选择长沙,在“到达地”文本框输入并选择深圳,在“出发日期”中选择“2021-10-07”,单击“查询”按钮。如图4-37所示,10月7日从长沙到深圳的车次将立即出现在该搜索框的下方。图4-SEQ图4-\*ARABIC37搜索结果布尔检索等无法对检索词之间的相对位置进行限制。而位置检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的临近关系,可以不依赖主题词表而直接使用自由词进行检索的方法。【能力拓展】使用网站搜索资料在手机浏览器中搜索“学习强国”网站,并在该网站搜索相关内容资料,如“美丽中国”“量子通信”等,看看搜索到的结果与直接在“百度”搜索网站中查询出的内容是否相同,思考与搜索网站查询的差异点。4.3.2任务:限制检索——拨开海面上的雾团【任务描述】使用“搜索”文本框搜索“京东”相关的内容。直接在“京东”搜索结果页签选项中单击“计算机、办公”。使用“天眼查”查询公司信息。(活页:天眼查)【示例演练】由于网购越来越普及,人们越来越频繁地通过购物网站购买心仪的商品。下面以购买笔记本计算机为例,演示在京东购物网站查找一台联想笔记本。在Windows10的“开始”菜单右键,选择“搜索”命令,在“搜索”界面输入关键字“京东”,如图4-38所示,与“京东”相匹配的项将立即出现在该搜索框的上方。直接在匹配结果中选择“电脑、办公”,即直接进入“京东”相关子类商品网站,由于计算机配置及网速差异,请耐心稍等几秒。图4-SEQ图4-\*ARABIC38输入关键字“网络设置”【任务实现】1.使用“限定搜索”查询商品进入购物网站后,一般会有商品搜索栏,同时下面有类别选择的参数,以联想笔记本商品为例,搜索选项包括处理器、内存、屏幕尺寸等,如图4-39所示。图4-SEQ图4-\*ARABIC39搜索结果通过限制检索命令,将商品通过价格限制检索范围,如图4-40所示。此外,如果需要特定的性能参数,可以通过选择某几项参数,如内存容量选择16GB,将某特定内存的商品筛选出。相关商品通过限制搜索筛选出后,再根据喜好及承受范围,挑选出心仪商品,在页面单击商品图标即可进入购买界面。图4-SEQ图4-\*ARABIC40限制搜索结果2.使用“天眼查”查询公司信息进入天眼查官网等招聘网站后,一般会有提供岗位的主体信息选择项,如公司名称、老板姓名、品牌名称等,以“华为”为例,搜索后会弹出限制词帮助人们进一步筛选等,如图4-41所示。图4-SEQ图4-\*ARABIC41搜索“华为”结果如果公司在全国各省份都有分公司或子公司,此时可以限制搜索某些省份以查询感兴趣的省市地区的分公司信息,如图4-42所示。图4-SEQ图4-\*ARABIC42限制搜索结果【能力拓展】打开新的标签页当我们在某网站搜索答案时,大多数情况我们不仅仅只浏览一个页面的内容,而且多次点击“后退”的重复操作也会大大降低我们的搜索效率。此时,我们可以使用“打开新的标签页”的功能,具体操作方法:按住Ctrl键,点击搜索结果,页面就会在新的标签打开,方便页面间的内容对比。4.3.3任务:桌面搜索——擦亮千里眼,勇登彼岸(活页:桌面搜索)【任务描述】 使用window自带搜索框中搜索桌面搜索软件“everything”,进入官网下载安装该软件。 使用桌面搜索磁盘中全局搜索与“人工智能”相关内容的素材,打开所在目录及文件。【实例演练】当某个文件放在某个多级子文件夹下时,如果没有养成对资料分类命名存放的习惯,往往一时很难找到文件路径,而在硬盘内直接全局搜索文件时,有常搜索缓慢,此时可以通过桌面搜索软件快速搜索。通过快捷菜单打开“搜索”栏,搜索“everything”,搜索该款桌面搜索软件。选择“搜索”界面的文本框上方“everything官网”,如图4-43所示。图4-SEQ图4-\*ARABIC43搜索结果在官网软件下载模块中,根据电脑配置,选择相应版本下载安装,启动后界面如图4-44所示。图4-SEQ图4-\*ARABIC44everything官网下载页面及软件安装后主界面【任务实现】在“everything”搜索框中搜索指定文件并打开该文件路径:①打开“everything”搜索窗口,搜索各磁盘内包含特定关键字的文件或文件夹,这里选择搜索“人工智能”。②搜索结果如图4-45所示,包含与关键字相关的文件及文件夹快速全部被搜索出,选择最后一个文件,右键单击,在选择列表中选择“打开路径”,然后单击,搜索结果如下图所示。此外,在搜索结果框内单击文件可以直接打开相应文件,单击文件夹可以直接打开对应文件夹。如果无任何显示,表示无对应关键字命名的任何文件。图4-SEQ图4-\*ARABIC45“everything”搜索“人工智能”相关结果【能力拓展】页面查找快捷键:Ctrl+F在Office中,我们可以通过快捷键“Ctrl+F”来快速查找目标文本内容,而在网页中,此快捷键同样适用,只不过它的功能变成了查找页面功能,这可以让我们的搜索事半功倍。具体操作方法是:在页面键入输入“Ctrl+”F,弹出搜索框,键入关键词,结果会高亮显示,能够使我们更快定位到需要的地方。同学们,快来试试吧!项目4.4知识讲解什么是信息?“信息”一词在英文、法文、德文、西班牙文中都拼写为“information”,在日文中称为“情报”,我国台湾叫“资讯”,我国古代用的是“消息”。日常生活中,我们接触到的手机短信、微信消息、邮件其实都可以算是信息。我们可以笼统地认为,信息是为我们带来有意义的内容;而从学术型角度解释,信息指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。信息检索简介信息检索有广义和狭义的之分。广义的信息检索称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。狭义的信息检索通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。狭义的信息检索包括三个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。布尔逻辑检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或、逻辑与、逻辑非。布尔逻辑“与”搜索,简单理解为交集,找并集。布尔逻辑“与”搜索可以协助我们缩小检索范围并提高检准率。布尔逻辑“与”搜索用AND或“*”连接检索词。使用布尔逻辑“与”搜索时,只有同时含有两个检索词时的内容才能被筛选出来。布尔逻辑“或”搜索,表示平行、并列,用运算符号“OR”或“+”连接检索词。使用布尔逻辑“或”搜索时,含有其中一个检索词或同时含有两个搜索词的内容都将被筛选出来。布尔逻辑“非”搜索,表示排除某关键词之外进行检索,用运算符号“-”连接检索词。使用布尔逻辑“非”搜索时,筛选出来的结果不包含“-”后面的关键词。截词检索截词检索是当前预防漏检,提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数量,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林艺术学院《外国文学》2021-2022学年第一学期期末试卷
- 文言主观简答试题专训(二)-2025新高考语文一轮复习
- 吉林艺术学院《概念设计》2021-2022学年第一学期期末试卷
- 手工品订单承揽协议书范文范本
- 2024年大学生接活互助协议书模板
- 吉林师范大学《习近平总书记关于教育的重要论述研究》2021-2022学年第一学期期末试卷
- 2024年处理废石协议书模板
- 农村地基自建房转让协议书范文
- 畜牧业对气候变化的影响分析报告
- 企业卫生安全检查管理制度
- 肾内科激素的用药知识-健康科普知识讲座课件
- 农业银行安全培训课件
- 小学绘本阅读《白雪公主》
- 2024届新结构“8+3+3”选填限时训练1~10(学生版)
- JTT791-2010 公路涵洞通道用波纹钢管(板)
- 2024年航空职业技能鉴定考试-无人机AOPA驾驶证考试(视距内驾驶员视距内驾驶员)笔试历年真题荟萃含答案
- JC-T 738-2004水泥强度快速检验方法
- 科研的思路与方法
- 山东联通公司招聘笔试题
- 2024年新智认知数字科技股份有限公司招聘笔试参考题库含答案解析
- 金属探测器检测记录
评论
0/150
提交评论