实验报告“计算机网络-搜索引擎”_第1页
实验报告“计算机网络-搜索引擎”_第2页
实验报告“计算机网络-搜索引擎”_第3页
实验报告“计算机网络-搜索引擎”_第4页
实验报告“计算机网络-搜索引擎”_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机网络实验报告一、实验名称:搜索引擎的原理与使用技巧二、实验目的:了解网络搜索引擎的基本工作原理;熟悉各种网络搜索引擎的特点和功能;掌握常用网络搜索引擎的使用方法;学会利用网络搜索引擎搜索各种资料;掌握网络搜索引擎提供的新应用;三、实验内容:掌握搜索技巧的必要性:目前全世界的搜索引擎有数千个,其中搜索引擎也可以细分为普通搜索引擎、集成搜索引擎、专业搜索引擎。一般,搜索引擎均提供分类目录及关键词检索。而这些搜索引擎的基本用法是在输入框内输入要查找内容的关键字或词,再按搜索或Search等按钮即可。用户只需通过搜索引擎提供的链接地址,就可以访问到相关信息。但是用这种方法检索可能会找到许多内容,难以筛选。首先得了解搜索引擎的分类:网络搜索引擎可以分为:全文搜索引擎和目录搜索引擎。全文搜索引擎是一种基于关键字的搜索方式,当用户输入要查询的关键字后,检索与用户查询条件相匹配的记录,按一定的排列顺序将结果返回给用户。它的优点是信息量大、更新及时、不需人工干预,但也有缺点:信息量过多,用户必须从结果中进行筛选。如我们常用的百度,谷歌等。目录搜索引擎则以人工方式或者半自动方式搜集信息,人工形成信息摘要,并将信息存储在事先确定好的分类框架中,它的优点是查询信息准确度高,缺点是需要人工维护量大,搜集到的信息少,信息更新不及时。常用的有hao123网址之家和8684网址导航等。其次还应了解搜索引擎的工作原理:从互联网上抓取网页:利用能够从互联网上自动收集网页的Spider(蜘蛛)系统程序,自动访问互联网,并沿着任何网页上的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。这样我们面对的问题就是如何快速的让自己的网站被搜索引擎检索以及如何不让自己的网站被搜索引擎检索。可以像搜索引擎登陆自己的站点或在其它重要网站放置到自己网站的链接,例如百度和谷歌的首页网址。而禁止,因为spider遵守互联网robots协议,可以利用robots.txt文件完全禁止spider访问自己的网站或网站上的部分文件。robots.txt文件应该放置在网站根目录下。建立索引数据库:对收集回来的网页进行分析,提取网页信息,根据一定的算法进行大量复杂计算,得到每一个网页针对页面内容中的每一个关键词的相关度,然后利用这些信息建立索引数据库搜索排序:当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符号该关键词的所有相关网页,并按相关度数值排序。或者使用比较复杂的PageRank算法。重点就是掌握常见的搜索引擎技巧:1、利用搜索逻辑命令可以更准确的搜集到所需信息。逻辑命令指布尔命令AND(与)、OR(或)、NOT(非),与之对应的逻辑符号是“+”“|”“-”,AND(+)必须同时包括所有关键词网络+计算机,OR(|)至少包含关键词中的一个网络|计算机,NOT(-)表示搜索结果不包含该关键词如“网络–计算机”就是指包括网络但不包括计算机的内容。(其中+、|、-必须为英文状态下的符号,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。)分别举例:比如说想搜索PS相关学习方法如果只是单纯的键入“PS”,则会出现很多下载链接,很难找到想要的信息:如果使用逻辑命令“+”,可以键入关键字“PS+教程”,如图,出来的结果大多是关于相关教程的,内容就接近很多了。使用逻辑词“|”也可以达到目的,可以键入“PS教程|PS学习”,结果如下,也是很让人满意的。也可以使用逻辑词“-”,键入“PS–下载”,结果明显筛掉了PS软件下载部分,使我们的信息筛选更简单。2、利用引号:关键词不加引号,搜索结果虽然包含关键词,但顺序未必一致,加引号,搜索结果顺序一致。例如:基础计算机与“基础计算机”基础计算机的结果大多数为计算机基础,而“基础计算机”则全部精准的显示所要检索的信息,为我们精确检索提供了技术基础。3、利用书名号:加上书名号的查询词,有两层特殊功能:一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。4、filetype:搜索指定的文件类型。例:HTTP协议filetype:ppt可以找到相关的PPT文档5、site:搜索指定的网站。有时候如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式就是在查询内容的后面,加上“site:站点域名”。例:例如想查找北京邮电大学的教务处,如果只键入“教务处”,结果如下,没有一条是预想的。可是如果换成“教务处site:”结果就大不相同了。运用site命令后:四、实验总结通过此次对搜索引擎的工作原理及使用技巧的了解,我终于知道了在平时认为很简单的百度、谷歌表面下隐藏的高明的使用技巧,而这些简明技巧可以在很大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论