网络基础与应用22(网络搜索).ppt_第1页
网络基础与应用22(网络搜索).ppt_第2页
网络基础与应用22(网络搜索).ppt_第3页
网络基础与应用22(网络搜索).ppt_第4页
网络基础与应用22(网络搜索).ppt_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络应用之二:网络搜索,搜索引擎(Search Engine)是一类运行特定程序的、专用于帮助用户查询Internet上的WWW服务器信息的Web站点,有的搜索引擎还可以查询新闻服务器的信息。如果说Internet上的信息浩如烟海,那么搜索引擎就是海洋中的导航台。但搜索引擎找出的不是用户最终所需要的信息,而只是“到哪些网页去查找所需要的信息”,即相关的网页的链接。用户通过搜索引擎的查询结果,知道了信息所处的站点,再通过链接,就可以从该网站获得详细资料。,搜索引擎向用户提供的信息搜索方式一般有两种:按目录搜索和按关键字搜索。 所谓“目录搜索”是将各种各样的信息按大类、子类、子类的子类、直到相关信息的网址,即按树形结构组成供用户搜索的类目和子类目直至找到感兴趣的内容,类似于在图书馆按分类目录查找你所需要的书。而从大类直到最终相关信息网址也是依靠树形链接组成的,用户上网极为方便。例如,用户可以选择“艺术和娱乐”类,再进入“电影”子类,再进入“中国电影”子类等等。这种方式适用于按普通主题查找。,“关键字搜索”是搜索引擎向用户提供一个可输入待查询的关键词、词组、句子的查询框界面,用户按一定规则输入关键字后,按紧靠查询框的“搜索”按钮提交关键字,搜索引擎即开始在其索引数据库中查找相关的信息,然后将结果返回用户。,常见的搜索引擎,搜索引擎的语法规则 使用搜索引擎搜索信息的最简单方法是通过关键词搜索,但返回的结果并不都令人满意。如果想要最佳的搜索效果,就要使用搜索的基本语法来组织要搜索的条件关键词。 搜索引擎中常用的逻辑关系语法是:AND,OR,NOT。 在填写搜索关键词时,AND(与)用“&”来表示;OR(或)用“|”来表示:NOT(非)用“!”来表示。例如想要查找广州或北京的房地产情况但不要期楼资料,可在查找关键词处用“(广州|北京)&房地产!期楼”作为查询关键词(引号不用写)。 多词汇查询方法:使用分隔号(,)可分隔多个条件,例如想查找有关广州、北京、上海的相关内容,可在查询处输入“广州,北京,上海”(引号不写)。如果想要的资料应含有“广州”,但是不要“北京”,而“上海”则可有可无,这时,你可用“+广州,-北京,上海”作为查询关键词。 以上搜索语法对各种搜索引擎都适用,但各个搜索引擎本身又有各自的特点。在使用搜索引擎时,充分利用它们各自的特点,可得到最佳及最快捷的查询结果。,搜索关键词的提炼 学会从复杂搜索意图中提炼出最具代表性和指示性的关键词对提高搜索效率至关重要,这方面的技巧或者说经验是所有其他搜索技巧的基础。 选择搜索关键词的原则是,首先确定所要达到的目标,即确定要找的到底是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位要找的东西,而且多数时候根本不需要用到其他更复杂的搜索技巧。,搜索条件的细化 搜索时给出的搜索条件越具体,搜索引擎返回的结果也会越精确。有时甚至可以问搜索引擎一个问题。 由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入“电脑游戏 冒险”,而不是“电脑冒险游戏”。 此外,一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略。,精确匹配搜索 除利用前面提到的逻辑命令来缩小查询范围外,还可使用”引号(注意为英文字符)来进行精确匹配查询(也称短语搜索)。如: “computer adventure games” 它与 +computer +adventure +games 的区别是:虽然后者限定网页中要同时包含三个关键字,但其顺序和相邻位置允许是任意的。而前者不仅要求网页中必须同时包含三个关键字,关键字的顺序也要求完全相同,并且它们必须还是挨在一起的,所以带“”号的查询范围更小。 此外使用“”号进行精确匹配查询,还可用来达到特殊的搜索目的。比如一般情况下“who”、“i”作为停用词被搜索引擎忽略,但有时在搜索特别类型的信息时又必须包含这些停用词(如搜索影片名称“Who Am I”),这时我们就可以将全部关键词用“”号引起来,就可以强制搜索引擎将停用词作为短语的一部分进行搜索。 通过对上面这些逻辑符号的组合,能组成复杂的搜索条件,如“computer game“ -adventure +new等等,使查询结果更加准确。,特殊搜索命令的使用 1针对网页标题搜索命令“title:”,在Yahoo中是“t:” 例子: title(或t):computer adventure games 2网站搜索命令 “site:”(Google)、“host:”(AltaVista)、url: (Infoseek)或 “domain:”(HotBot)。 如site(或 host/url/domain):www.AAA.com 还可以在其中加入其他命令组成复杂的搜索条件,如 site:www.AAA.com +title:“computer games“ adventure 意思是查找AAA公司网站中所有标题里含有computer games的 网 页,但排除关于冒险游戏的网页。 3链接搜索命令 “link:”命令查找某网站的外部导入链接(inbound links)。 如:link:www.AAA.com 还有命令,如“filetype:”(限定搜索的文档类别)、“daterange:” (限定搜索的时间范围)、“phonebook:”(查询电话)等。,课堂练习,1、请比较常见的几种搜索工具,了解它们的功能、特点,并以百度为例,归纳常用的搜索技巧。 2、什么是“人肉搜索”?请谈谈它的利与弊并思考如何从法律角度来规范“人肉搜索”。 3、路线搜索:假如你(1) 从西政渝北校区前往重庆市公安局; (2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论