




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章网络搜索引擎
3.1搜索引擎概述3.1搜索引擎概述
在互联网发展初期,网站相对较少,信息查找比较容易。随着因特网的迅猛发展,网络信息大量增加(据估计,全球目前的网页超过5500亿),用户要在如此浩瀚的信息海洋里寻找信息,就象大海捞针、沙里淘金一样,必然会无功而返。这时为满足大众信息检索需求的专业搜索网站——搜索引擎便应运而生了。它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。据中国国家互联网中心(CNNIC)2004年6月30日发布的第14次互联网发展统计报告。我国的网络用户有8,700万人,是1997年1O月统计人数的140.3倍。其中有42.3%的用户上网最主要的是为获取信息,搜索引擎的作用量占用户信息利用行为总量的71.9%。在用户经营使用的网络服务中,搜索引擎仅次于电子邮箱排在第2位。而86.9%的用户得知新网站的主要途径是搜索引擎,搜索引擎已成为未知状态下发现有效信息的最有效方式。3.1.1搜索引擎的产生与发展
现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生AlanEmtage发明的Archie。虽然当时WWW还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此AlanEmtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。3.1.1搜索引擎的产生与发展
Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达SystemComputingServices大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。3.1.1搜索引擎的产生与发展
当时,“机器人”一词在编程者中十分流行。电脑“机器人”(ComputerRobot)是指某种能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。3.1.1搜索引擎的产生与发展世界上第一个用于监测互联网发展规模的“机器人”程序是MatthewGray开发的WorldwideWebWanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。与Wanderer相对应,MartinKoster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo!3.1.1搜索引擎的产生与发展随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在MatthewGray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、TheWorldWideWebWorm(Goto的前身,也就是今天Overture),和Repository-BasedSoftwareEngineering(RBSE)spider最负盛名。3.1.1搜索引擎的产生与发展然而JumpStation和WWWWorm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。3.1.1搜索引擎的产生与发展最早现代意义上的搜索引擎出现于1994年7月。当时MichaelMauldin将JohnLeavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,DavidFilo和美籍华人杨致远(GerryYang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!3.1.1搜索引擎的产生与发展随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi(已被Yahoo收购),它本身并不是直接面向用户的搜索引擎,但像包括Overture(原GoTo,已被Yahoo收购)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类,搜狐和新浪用的就是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。3.1.2搜索引擎的分类
目前,Internet上已有数千个能提供检索服务的站点,这些站点的搜索引擎在收录的范围、内容、检索方法上都各有不同,采用的技术也各具特色。但总的来看,根据它们所基于的搜索技术原理,一般可把它们分成三大类:机器人(Robot)搜索引擎,分类目录式(DirectorySearchEngine)搜索引擎和元搜索引擎(Meta-searchEngine)。3.1.2搜索引擎的分类
1.机器人(Robot)搜索引擎Robot“搜索引擎”的一个重要的特征是通过Robot,自动搜集各种web页面,并存入搜索引擎数据库。所谓Robot,即一个用c++、perl、Java或其它语言编写的网页自动搜索程序,它可以运行在Unix、Solaris、Windows、NT、Os2和MAC等平台上。该程序启动后,Robot会根据所给的网络地址(URL)自动对目的网页进行浏览,并将网页内容存储在搜索引擎的数据库中。同时,它还会根据网页的链接进一步提取其它网页,或转移到其它站点上,直到没有满足要求的新网页或网站为止。3.1.2搜索引擎的分类
其工作原理为:首先,由自动搜索软件Robot根据给定的URL,访问目的站点,并通过其中的链接遍历www中的其它站点,然后将获得的站点信息形成一个巨大的网页信息库以备用户查询。当用户通过查询内容提出检索要求时,系统就会在数据库中找到相关内容,并按照既定规则进行排序输出。由于是通过Robot自动寻找网络资源并编制索引摘要,减少了人工作业,其优点明显表现为:信息搜集速度快,资源收录多、全,结果更新及时。同时,这也是其不足之处:收录的资源良莠不齐,查询结果准确度低,用户很难通过检索真正获得所需结果。这类搜索引擎的主要代表有Google、AltaVista、Northernlight、Excite、Lycos,国内的有天网、悠游等。3.1.2搜索引擎的分类
2.目录(Directory)搜索引擎目录(Directory)搜索引擎,或称主题查询型搜索引擎,它提供一种可检索和查询的等级式主题目录,以超文本链接方式把资源按不同类型划分成不同的目录,各类目录下面引出属于这一类别的网站名称和网址链接以及每个网站的内容简介。用户在查询信息时,只需按分类目录逐层查找,搜索引擎就会将找到的相关网站名称、网址及内容简介显示在屏幕上,用户单击网站名称即可进入相应的网站。目录搜索引擎与Robot搜索引擎的主要区别在于目录搜索引擎是通过人工方式进行资源搜集,且采取人工方式来进行网站描述。首先,系统雇用的大量编辑,会进行广泛的网站或网页搜集。这些编辑在访问某个WEB站点时,会对该站点作适当的描述,并根据站点的内容和性质将其归为一个预先分好的类别,把站点的URL和描述放在该类别中,即建立了目录数据库。3.1.2搜索引擎的分类
检索子系统,一般提供两种信息查询方式,用户可根据实际情况选择关键词搜索或按分类目录逐层查找。由于目录是依靠人工进行整理搜索的,而且只在保存的对站点的描述中进行搜索,因此搜索范围较小,查全率较低,对偏僻主题、新兴学科、交叉学科不能很好地涵盖,类目间的交叉又会导致重复和资源浪费。另外,由于数据库更新速度比较慢,站点本身的动态变化不能及时地反映到搜索结果中,严重影响了查询结果的时效性。这是目录搜索引擎相对于Robot搜索引擎的不足之处。但同时,由于用户在进行信息查询时,只要遵循系统的分类体系按图索骥、层层深入即可,操作比较简单,大大方便了用户。另外,由于系统是依靠人工来评价描述网站,准确性比较高,因此用户从目录搜索所得到结果的准确度一般比较高,参考价值也比较高。3.1.2搜索引擎的分类3.元搜索引擎元搜索引擎(Meta-searchEngine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(Themotherofsearchengines)”。元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“元搜索引擎”(sourceEngine),或“搜索资源”(searchingresources),整合、调用、控制和优化利用元搜索引擎的技术,称为“元搜索技术”(Meta—searchingtechnique),元搜索技术是元搜索引擎的核心。3.1.2搜索引擎的分类检索时,元搜索引擎根据用户提交的检索请求,调用元搜索引擎进行搜索,对搜索结果进行汇集、筛选、删并等优化处理后,以统一的格式在同一界面集中显示。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。如提交检索请求时,根据元搜索引擎的特点和技术参数,指定优先顺序,并对检索时间、检索结果数量进行控制;3.1.2搜索引擎的分类作为若干元搜索引擎的检索接口代理,元搜索引擎必须具有较强的字符和语法转换功能,使用户的检索请求为各具语法特点的不同的元搜索引擎所认知和接受;而对检索结果的显示,不同的元搜索引擎有不同的处理技术。由于元搜索引擎设定的检索结果排序依据、最大返回结果数量、相关度参数及优化机制等不同,调用相同的元搜索引擎的不同元搜索引擎显示检索结果的数量多少、排序先后、结果信息描述选择亦有较大差异。3.1.2搜索引擎的分类目前运营的元搜索引擎各具特色,功能各有侧重,完全“理想”的尚不多见。元搜索引擎的功能受着元搜索引擎和元搜索技术的双重制约:一方面,元搜索引擎的各具特色的强大功能在元搜索引擎中受到限制而不能充分体现,而另一方面,任何一种元搜索技术都不能发掘和利用元搜索引擎的全部功能。尽管元搜索引擎存在着这样那样的功能局限,但其以涵盖较多的搜索资源,能够在尽可能短的时间内提供相对全面、准确的检索结果等诸多优异功能。从而受到用户的青眯,已渐成为一种不可或缺的极具潜力的网络检索工具。3.1.3搜索引擎的工作原理
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。3.1.3搜索引擎的工作原理搜索引擎的原理,可以看作:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。3.1.3搜索引擎的工作原理1.从互联网上抓取网页各个搜索引擎一般都利用高性能的“蜘蛛”程序(spider)去自动地在互联网中搜索信息。一个典型的“网络蜘蛛”工作的方式,是查看一个页面,并从中找到相关信息,然后它再从该页面的所有链接中出发,继续寻找相关的信息,以此类推,直至穷尽。“蜘蛛”为实现其快速地浏览整个互联网,通常在技术上采用抢先式多线程技术实现在网上聚集信息。通过抢先式多线程的使用,你能索引一个基于URL链接的Web页面。启动一个新的线程跟随每个新的URI链接,索引一个新的URI起点。由于网络信息的不断变化,“蜘蛛”也不断的把以前已经分类组织的目录不断更新。不同的搜索引擎在完成这些工作的迅速性和综合性方面是不同的。这是各搜索引擎的最初工作步骤。3.1.3搜索引擎的工作原理2.建立索引数据库这一过程关系到用户能否最迅速地找到最准确、最广泛的信息,对“网络蜘蛛”抓来的网页信息极快地建立索引,保证信息的及时性。不同的搜索引擎会在搜索结果的数量和质量上产生明显的差异。有的搜索引擎把“网页搜索软件”发向每一个站点,记录下每一页的所有文本内容;另一些搜索引擎则首先分析数据库中的地址,以判别那些站点最受欢迎(一般都是通过测定该站点的链接数量),然后再用软件记录这些站点的信息。记录的信息包括从HTMI标题到整个站点的所有文本内容以及经过算法处理后的摘要。当然。3.1.3搜索引擎的工作原理最重要的是数据库的内容必须经常更新、重建。以保持与信息世界的同步发展。3.1.3搜索引擎的工作原理3.用户检索过程搜索引擎索引数据库建立以后,每个搜索引擎都必须提供一个良好的信息查询界面,并具有帮助功能。用户只要把想要查找的关键词(keyword)输入查询框中,并按“search”按钮(或类似的按钮),则检索器根据用户输入的查询关键词,在索引库中快速检出文档,因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。用户只要通过搜索引擎提供的链接,就可以访问到相关信息。这个过程是对前两个过程的检验,检验该搜索引擎能否给出最准确、最广泛的信息,检验该搜索引擎能否迅速地给出用户最想得到的信息。3.1.3搜索引擎的工作原理搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。3.1.3搜索引擎的工作原理互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。3.1.4搜索引擎的检索技巧
人们在网络检索实践中往往对检索结果不满意,如何提高检索的精度和广度,如何加快检索速度,这对于专业检索人员也是一种挑战,但也并非无法控制。如果能掌握一些常用的检索技巧,就可以减少检索过程中的挫折和增加获取到有用资源的可能性。3.1.4搜索引擎的检索技巧1.选择合适的检索工具不同的检索工具有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。因此,要熟悉和掌握一些常用的搜索引擎的性能、特点和使用方法。3.1.4搜索引擎的检索技巧(1)细节查询或强调获取较为具体、特定的信息时,一般应利用关键词进行大范围的快速检索,方便、快捷地查询到针对性较强的检索结果。(2)一般性的浏览查询或强调获取较为综合、准确的信息时,一般应利用分类检索,用户可按思维的逻辑顺序或按照其主题目录体系的导引去浏览、追踪、查找信息。3.1.4搜索引擎的检索技巧(3)在查询一些较模糊或就某一课题的网络资源进行调查、摸底、综览时使用多元搜索引擎。3.1.4搜索引擎的检索技巧2.巧用关键词搜索搜索引擎是将输入的关键词与其数据库中存储的信息进行匹配,直到找出结果。如果输入的关键词过于简单,那么得到的搜索结果将不计其数。选择正确的关键词是一切有效搜索的前提。首先应从复杂的搜索意图中提炼出最具代表性的关键词,这方面的技巧是所有搜索技巧之母。其次,搜索条件越具体,搜索引擎返回的结果就越精确,有时多输入一两个关键词效果就完全不同,这是搜索的基本技巧之一。3.1.4搜索引擎的检索技巧例如:以“网络”作为关键词,与之相关的信息就太多了。同样,如果在搜索引擎中输入一个关键词“安徽”,搜索引擎不知道要找什么.它可能会返回很多莫名其妙的结果。如搜索安徽旅游方面的信息,可以这样查询:在搜索引擎中输入关键词“安徽旅游”,假如把搜索范围锁定在安徽的黄山地区,则应该输入关键词“安徽黄山旅游”。这样用搜索引擎找到的信息就会更加准确。因此,搜索中应学会使用两个以上的关键词搜索的方法,或应养成使用多个关键词搜索的习惯。当然,大多数情况下使用两个关键词搜索已经足够了。3.1.4搜索引擎的检索技巧另外,由于中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得中文切词成为搜索引擎的一大挑战。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但求其完美无缺也不太现实。因此在搜索关键词较多的情况下,建议主动将中文字词之间用空格隔开,以避免过多的无效搜索。比如查中文电脑冒险游戏的资料,输入“电脑游戏冒险”,而不是“电脑冒险游戏”。3.1.4搜索引擎的检索技巧3.减号“-”的运用“-”号的作用是为了去除无关的搜索结果,提高搜索结果相关性。若在搜索结果中见到很多不相关的搜索结果,则可用“-”号减掉不相关结果的特征关键词。比如要找“申花”的企业信息,输入“申花”却找到一大堆申花队的新闻,这些新闻的共同特征是“足球”.输入“申花-足球”来进行搜索,查询的结果里就不会再有体育新闻了。假如查找合肥地区的电信信息,但想排除与手机相关的信息,输入关键词“合肥电信-手机”。“手机”前面多了一个“-”号,表示排除与手机相关的信息。3.1.4搜索引擎的检索技巧因此,要学会使用“-”号等逻辑符号命令来进行文献信息搜索,则可使日常搜索达到事半功倍的效果。4.利用双引号“”进行精确匹配搜索精确匹配搜索也是缩小搜索结果范围的有利工具,此外,还可以用它来达到某些其他方式无法完成的搜索任务。简单搜索往往会反馈回大量不需要的信息,如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号引起来(即在英文输入状态下的双引号).这样得到的信息结果最少、最精确。例如在搜索引擎的查询框内输入“电脑技术”,就等于告诉搜索引擎只需要反馈回网页中有“电脑技术”这个关键词的网址,而输入电脑技术则会反馈出很多不需要的信息来。因此,应充分学会利用“”双引号来进行搜索。3.1.4搜索引擎的检索技巧5.正确使用高级检索利用高级搜索,正确使用布尔逻辑算符and(表示逻辑“与”。可用“&”表示,在中文中一般用半角的“+”表示,用于搜索两个以上关键词,如“法国农业+巴西农业+中国农业”,表示检索内容必须同时包括“法国农业、巴西农业、中国农业”3个关键词);or(表示逻辑“或”,可用半角的“,”来表示,有的搜索引擎使用空格,如“法国农业,巴西农业,中国农业”表示检索内容不必同时包括3个关键词,只要包括其中一个即可);3.1.4搜索引擎的检索技巧not(表示逻辑“非”,可用“!”来表示,也可在要排除的关键词前加半角的“-”,如“新闻not经济”表示检索内容包含“新闻”但排除其中有“经济”这个词语的文档,“电脑-硬件”表示要检索“电脑”但不包含“硬件”的文档)等,有的搜索引擎不完全支持上述算符,如yahoo尚不支持not,不同的搜索引擎表达方式不同。3.1.4搜索引擎的检索技巧6.使用目录导航检索方式的技巧如果想查找的信息不是很具体,通过网站的分类目录搜索通常会比寻找单个网站来得有效。例如,要利用搜狐找关于体育彩票的信息,在“首页>娱乐休闲>彩票>体育彩票”类目下有许多高质量的网站。这比起通过输入关键词后,在搜索结果页面中一页一页翻动效率要高。另外,在关键词搜索结果页面中看到了似乎合适的一个网站.可以点击进入列在该网站下面的该网站所在的类目,在这个类目下可能就有许多相关的网站。3.1.4搜索引擎的检索技巧7.使用多个搜索引擎据搜索内容的不同,有针对地选择不同的搜索引擎,往往会收到较好的效果。如果想查英汉或汉英词典,或想查询某地方的天气预报,可以选Google搜索;如果想找mp3的话,一般教育网上比较多,可以考虑用天网进行搜索。总之,应学会使用多个搜索引擎.因为很少有人使用一个搜索引擎就能找遍互联网上的所有信息。同样,每个搜索引擎的性能是不同的,所以,在为找不着所需的信息而着急的时候,不妨再用别的搜索引擎试试,或者用浏览器打开多个搜索引擎进行同时搜索。每一个搜索引擎在使用上都有细微的差别,所以在使用前应先查阅相关的使用方法,这些信息的链接通常就在关键字输入框的旁边。3.1.4搜索引擎的检索技巧8.重复检索网络信息的开放性使检索的结果具有动态性,每一次可能都不一样,要取得较好的检索结果往往需要在一段时间进行若干次检索。9.注意搜索中常见的错误在搜索过程中经常会有这样的事情发生:虽然已尽全力来搜索,但依然没有找到需要的答案,这时应认真回顾检查一下整个搜索过程,也许只是因为一个小差错,纠正过来就会找到有用的信息。下面是初学者搜索时容易犯的几个低级错误和解决方法。(1)错别字。即在你输入的关键词中含有错别字,例如“星际争吧”、“以德制国”等等。3.1.4搜索引擎的检索技巧(2)用通用词汇来检索。搜索引擎对常见的词汇搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万的网页中,使得它们事实上不能被用来找到什么有用的内容。比如,搜索“电话”,有无数个网站均会提供跟“电话”相关的信息,从网上黄页到电话零售商再到个人电话号码等都有信息反映。所以当搜索结果太多太乱的时候,应该尝试使用更多的关键词或者用减号“-”来搜索,不应使用太常见的关键词来搜索。3.1.4搜索引擎的检索技巧(3)使用了多义词,很多词具有一词多意的特性。比如,“笔记本”,可以指用来手写的笔记本,也可作为笔记本电脑代名词。遇到这类词,需要在搜索框中尽量输入单义词,如直接输入“笔记本电脑”。又如搜索“Java”,要找的这个信息究竟是一个岛屿?一种咖啡?还是一种计算机语言?搜索引擎一般是不能理解或辨别多义词的。因此,要小心使用多义词,解决的办法只能是用短语、多个关键词或者用其他的词语来代替多义词作为搜索的关键词。3.1.4搜索引擎的检索技巧(4)关键词应用不妥。搜索失败的另一个常见原因就是不会输入关键词。比如类似这样的检索:“现代爱情故事歌词”、“上海到西安列车时刻表”。搜索引擎一般是机械的,当用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。而正确的关键词应该是输入“现代爱情故事歌词”、“上海西安列车时刻表”。(5)在错误的地方搜索。搜索引擎从抓取网页、解析、索引到提供检索是有周期性的,而各搜索引擎的信息滞后周期一般是从一周到一月不等,所以查找最新内容应该去看新闻,3.1.4搜索引擎的检索技巧用搜索引擎一般是寻找不到最新内容的。搜索引擎对动态内容,如:论坛、数据库内容以及带frame结构的网页检索能力较弱,所以这类信息也不适合用搜索引擎,而是应该去相关的网站进行搜索。3.1.4搜索引擎的检索技巧总之,如何利用搜索引擎这一强有力工具,快速准确地检索网络信息,从信息资源宝库中找到所需的各种各样的信息,关键是摸索出一套适合自己的搜索策略和搜索方法。因此,我们除了熟悉各种搜索引擎的特点外,还应掌握搜索引擎的使用技巧,从不同形式的数字化信息中进行搜集,并对发现的信息进行理解、提取、组织和处理,这样才能快速找到所需要的信息。3.2Google搜索引擎
3.2.1Google简介Google是目前世界上最优秀的搜索引擎之一,是由美国斯垣福大学的二位博士生LarryPage和SergeyBrin于1998年9月发明的,1999年成立公司,2000年7月,Google替代Inktomi成为Yahoo!公司的搜索引擎,(注:Yahoo已于2004年2月前终止与Google的合作关系。)同年9月,Google成为网易公司的搜索引擎。在短短的时间里这一网站已在全球范围内拥有了一个正在快速增长的忠实用户群。根据美国著名网络评估公司尼尔森公司公布的最新数据显示,2005年12月,Google在美国网络搜索市场的领先优势继续扩大,已占据了48.8%的份额。此外,技术创新也为该公司Google带来了多项荣誉,如美国《时代》杂志评选的“1999年度十大网络技术”之一,《个人电脑》杂志授予的“最佳技术奖”,TheNet授予的“最佳搜索引擎奖”等。德国互联网杂志《今日在线》最近分别测试15个主要搜索引擎和门户网站,就网站结构是否清晰、搜索功能的解释是否清楚明白,以及提供的搜索服务是否准确做出评分,结果Google获选为最佳搜索引擎。3.2.1Google简介
Google一词是由英文单词“googol”变化而来,“googo1”这个词是由美国数学家EdwardKasner的侄子MiltonSirotta创造的,表示1后面带有100个零的数字,Google用这个词作为搜索引擎的名称,代表它征服网上无穷无尽资料的雄心。目前,Google的目录中收录了80亿多个网址,10亿多张图片,这在同类搜索引擎中是首屈一指的,同时,Google将其特有的网页级别技术与完善的文本匹配技术结合在一起,它所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足用户的查询要求,为用户快速地找到最重要、最有用的网页。由于Google的强大的智能搜索技术和开创新思维,已使得其成为网络上最具竞争力的搜索引擎。3.2.1Google简介
要用Google做搜索,当然要先进Google网站,第一次进入Google,它会根据你的操作系统,确定语言界面,Google的首页很清爽,如图3-2-1所示。一个搜索内容输入框,一组搜索种类选择链接(包括网页、图片、新闻论坛、网页、目录)再加上一个搜索按钮就是这个页面的全部家当。3.2.1Google简介
3.2.2基本搜索
1.搜索入门Google查询简洁方便,仅需输入查询内容并敲一下回车键(Enter),或单击“Google搜索”按钮即可得到相关资料。Google查询严谨细致,能帮助用户找到最重要、最相关的内容。例如,当Google对网页进行分析时,它会考虑与该网页链接的其它网页上的相关内容。Google还会先列出那些搜索关键词相距较近的网页。3.2.2基本搜索
2.初阶搜索(1)搜索结果要求包含两个及两个以上关键字一般搜索引擎需要在多个关键字之间加上“+”,而Google无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。比如,我们要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。3.2.2基本搜索
示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页搜索:“搜索引擎历史”结果:简体中文网页中,约有3,240,000
项符合搜索引擎历史的查询结果,以下是第1-10
项。(搜索用时0.15
秒)(2)搜索结果要求不包含某些特定信息3.2.2基本搜索Google用减号“-”表示逻辑“非”操作。“A–B”表示搜索包含A但没有B的网页。(“-”,英文字符)。但在减号之前必须留一空格。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页3.2.2基本搜索搜索:“搜索引擎历史-文化-中国历史-世界历史”结果:简体中文网页中,约有2,130,000
项符合搜索引擎历史-文化-中国历史-世界历史的查询结果,以下是第1-10
项。(搜索用时0.32
秒)(3)搜索结果至少包含多个关键字中的任意一个。3.2.2基本搜索Google用大写的“OR”表示逻辑“或”操作。搜索“AORB”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。3.2.2基本搜索示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。搜索:“搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化”结果:简体中文网页中,约有249,000
项符合搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化的查询结果,以下是第1-10
项。(搜索用时0.56
秒)3.2.2基本搜索搜索引擎最基本的语法“与”“非”和“或”,在Google中分别用“”(空格)、“-”和“OR”表示。顺着上例的思路,便可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。3.2.2基本搜索图3-2-2Google搜索结果页面3.2.2基本搜索3.辅助搜索(1)通配符问题Google使用的通配符属于“全词通配符”(full-word
wildcard)是指代替一个单词而不是单词中的某个或几个字母的键盘字符,Google的全词通配符是*(星号),一次检索可以使用若干个*。这意味着一个语句可以写成用带有星号“*”代替未知内容的形式。这一功能使得查找某资料片断变得更快更容易了。(2)关键字的字母大小写3.2.2基本搜索Google对英文字符大小写不敏感,搜索Three,three,THREE都可以得到相同的结果。(3)搜索整个短语或者句子Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。示例:搜索关于第一次世界大战的英文信息。3.2.2基本搜索搜索:“"worldwarI"”结果:简体中文网页中,约有37,900
项符合"worldwarI"的查询结果,以下是第1-10
项。(搜索用时0.25
秒)(4)搜索引擎忽略的字符以及强制搜索Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。示例:搜索关于www起源的一些历史资料。搜索:“www的历史internet”3.2.2基本搜索结果:以下的字词因为使用过于频繁,没有被列入搜索范围:www的.已搜索有关www的历史internet的中文(简体)网页。约有604,000
项符合www的历史internet的查询结果,以下是第1-10
项。(搜索用时0.49
秒)。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。搜索:“+www+的历史internet”结果:简体中文网页中,约有482,000
项符合+www+的历史internet的查询结果,以下是第1-10
项。(搜索用时0.30
秒)
3.2.2基本搜索另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”worldwarI””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。3.2.3高级搜索
1.对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。3.2.3高级搜索示例:搜索中文教育科研网站(edu.cn)中所有包含“金庸”的页面。搜索:“金庸site:”结果:
的简体中文网页中,共有70,000
项符合金庸的查询结果,以下是第1-10
项。(搜索用时0.08
秒)3.2.3高级搜索注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。3.2.3高级搜索2.在某一类文件中查找信息“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。3.2.3高级搜索目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。示例:搜索几个网络信息检索的Office文档。搜索:“网络信息检索filetype:docORfiletype:xlsORfiletype:ppt”结果:简体中文网页中,约有47,900
项符合网络信息检索filetype:docORfiletype:xlsORfiletype:ppt的查询结果,以下是第1-10
项。(搜索用时0.53
秒)3.2.3高级搜索图3-2-3Google高级搜索页面3.2.3高级搜索3.搜索的关键字包含在URL链接中“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。3.2.3高级搜索示例:查找movie“骇客帝国”。搜索:“inurl:movie“骇客帝国””结果:简体中文网页中,约有63,700
项符合inurl:movie
骇客帝国的查询结果,以下是第1-10
项。(搜索用时0.05
秒)注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。3.2.3高级搜索4.搜索的关键字包含在网页标题中“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分,网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。示例:查找超女周笔畅的照片集搜索:intitle:周笔畅照片结果:简体中文网页中,约有16,700
项符合intitle:周笔畅照片的查询结果,以下是第1-10
项。(搜索用时0.32
秒)
3.2.4其他应用技巧
1.汉语拼音输入检索为了方便使用中文的用户在网上搜索,Google允许用户直接在键盘上输入汉语拼音来检索相关事物,例如:输入shanghaishikebiao
检索结果提示:“您是不是要找:上海时刻表”3.2.4其他应用技巧这正是我们需要查找的关键词,用户可以据此浏览相关结果,这包括上海地区的各种交通工具的时刻表。如果需要查找更详细的资料“上海飞机航班时刻表”,则只要在原来的检索结果“上海时刻表”中间输入feijihangban,例如:“上海feijihangban时刻表”。Google的这项新功能,可以免除用户在中文和拼音输入方面的互相转换。用户在输入拼音时,不要留有空格,否则Google会误认为英文。Google把拼音与常用的字或者词组一一对应,因此,过于生僻的字或词组不适合于用这个方法查找。3.2.4其他应用技巧2.中英文字典经常使用计算机的用户手头上自然会有一、两个字典软件,用于查找和翻译中英文的词义。作为一种使用频率较高的工具,Google也提供了一个中英文字典,很方便使用。用户可以按照下列方法查找词义查找英文的中文词义则输入fycomputer;查找中文的英文词义则输入“翻译计算机”3.天气查询天气情况也是人们经常要查询的信息之一,Google提供的天气查询来自于一个更新及时的中文气象网站,适合中国人使用。用户输入中文和英文都可以查询,例如要了解世界杯期间德国的天气情况,可以按照下列方法输入:3.2.4其他应用技巧德国天气germany
tq返回的查询结果中会在第一条出现一个“德国天气预报”,用户点击后就可以看到当天德国的天气情况。如果地名相同者,用户还需要进行一次选择。4.股票查询查询股票的网站已经很多了,Google提供的股票查询只是更方便一些而已,用户可以按照股票名称、股票代码或者股票名称的声母字母查询,下列为查询“中国联通”股票行情的举例。3.2.4其他应用技巧中国联通股票zglt
gp
gp6000505.邮政编码和区号查询人们时常需要查询邮政编码和电话区号,Google提供了这样一个实用的功能,用户据此能够获得所要查询的省市名称,邮政编码及长途电话区号,下面为查询举例:邮编杭州区号绍兴yb
杭州qh
绍兴需要注意的是用户只能查询到城市级别的邮政编码和区号,而无法进一步查询区县的具体信息。3.2.4其他应用技巧6.手机归属地查询用户在输入手机号码后可以获得号码段、归属地、卡类型、邮政编码和电话区号的信息,但是从实用的角度看,其中只有手机归属地的信息较为有用。7.计算器使用Google有计算器的功能,例如在google检索框中输入45*86+35/7,就会得到结果:(45*86)+(35/7)=38753.2.4其他应用技巧8.购物检索Google新开设的购物检索称之为Froogle,网址为http:///用户只要输入商品的名称,就可以看到该商品的图片和价格,用户还可以限定一种商品的价格进行检索,并且将检索结果按需要从高价到低价排序列出,许多商品可以直接在网上订购,这种图文并茂的检索购物方式较受用户青睐。3.2.4其他应用技巧Google的检索工具栏功能强大,有拖放和右击检索功能,新闻阅读,广告拦截,网站排名显示和搜索字词标明等,工具栏可以附在浏览器下,使用更加方便。用户可以首先在Google网站下载并安装一个检索工具栏,然后根据需要在工具栏的选项中进行设置,我们推荐用户使用这个检索工具栏,它将给用户带来许多意想不到的方便。(1)Google新闻Google的新闻来源于4500家报刊杂志和通讯社,在精选以后持续播出世界各国的新闻,每条新闻都有更新的时间,并联接相关的新闻。用户可以使用免费的新闻通知服务,通过电子邮件收到自己感兴趣的新闻。3.2.4其他应用技巧(2)网站排名Google通过对Web链接结构和许多其它变量自动计算,对网页的重要程度进行评定。网站排名根据这个评定能够显示用户正在访问的网站的重要程度,用一根绿色线条显示,直观而明确。(3)搜索字词标明搜索字词标明通过鲜艳的色彩标明用户所检索的字词在每个网页上的位置,便于用户查阅,单击“搜索字词标明”按钮可以打开和关闭标明状态。3.2.4其他应用技巧(4)拖放和右击检索拖放检索功能使检索更为方便,用户可以把在网页上所选取的字词直接拖放到检索框中,Google会自动进行检索。对于与Web浏览器同时运行的许多文字处理应用程序中的文字,也可以使用此功能。右击检索是指用户可以在网页上选取文字后,右击鼠标,然后从弹出式菜单中选择“Google搜索”便可以自动检索。3.2.5Google搜索结果页指南
图3-2-4
Google搜索结果3.2.5Google搜索结果页指南
A. 常用链接可以选择网页搜索、图片搜索或论坛搜索等搜索功能。B. Google搜索按钮单击此按钮可以提交另一个搜索请求。也可以通过敲击Enter键来提交查询。C. 高级搜索链接到一个网页,如有必要,从这个网页搜索可以控制搜索的范围。D. 搜索字段用以输入说明性的关键词。敲击Enter键(回车键)或单击Google搜索按钮,即可得到相关资料的列表。3.2.5Google搜索结果页指南
E.使用偏好可以设置搜索偏好,包括每个网页上默认的搜索结果数量、界面语言,以及查询语言。F. 统计行这里是有关查询结果及搜索时间的统计数字。G. 网页标题第一行是查询到的网页的标题,有时会显示为网址。这表明Google还未将此页编入索引,或此页作者还没给它定标题。但这并不影响该网页的质量。之所以会查询到该页是因为其它网页和它之间具有链接,而Google已为那些网页建立了索引。与这些链接相关联的文本如果同查询内容相匹配,该网页就会作为查询结果返回,即使其完整文本尚未建立索引。3.2.5Google搜索结果页指南
H. 标题下文本该文本是网页摘要,搜索关键词以粗体显示。单击查询结果之前,您可以通过这些网页摘要浏览一下关键词在该网页中的上下文。I. 网址这是该网页的网址。J. 文本大小这个数字是这一网页文本部份的大小。未被Google编入索引的网站不会有此项资料。K.网页快照单击“网页快照”可以查看Google已编入索引的网页的内容。如果因为某种原因,通过站点链接无法访问当前的网页,还可以通过检索网页快照来查找您需要的信息。搜索词在网页快照中突出显示。L.类似网页单击“类似网页”时,Google便开始寻找与这一网页相关的网页。3.3百度搜索引擎
3.3.1百度简介“众里寻他千百度”,“百度”二字源自辛弃疾的《青玉案》,象征百度对中文信息检索技术执著的追求。百度是目前世界上规模最大的中文搜索引擎,它拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。简单强大的搜索功能深受网民的信赖,每天有超过七万用户将百度设为首页。据研究机构艾瑞克市场咨询有限公司发布的报告显示,去年中国用户最常使用的搜索引擎是百度,市场份额达到56.6%,Google位居其次,占32.8%。业界认为,百度在中文搜索的领军地位已形成,短期内将很难有公司能撼动它的地位。百度公司自进入中国互联网及软件市场以来,就一直以开发真正符合中国人习惯的互联网核心技术为使命,依靠自身实力不断研发出拥有自主知识产权的可扩展的网络应用软件。3.3.1百度简介
百度公司于1999年底成立于美国硅谷,它的创建者为资深信息检索技术专家、超链分析专利的唯一持有人——百度总裁李彦宏,及其好友——在硅谷有多年商界成功经验的百度执行副总裁徐勇博士。创立之初,百度就将自己的目标定位于打造中国人自己的中文搜索引擎,并愿为此目标不懈的努力奋斗。3.3.1百度简介
2000年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布Baidu搜索引擎。2005年8月5日,百度在美国纳斯达克上市,成为2005年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。3.3.2百度搜索的使用方法
百度的网址是:http://。首页如图3-2-1所示,其使用方法非常简单,只要在搜索框中输入关键词,然后单击“百度搜索”按钮,或直接按回车键即可获得相关搜索结果。3.3.2百度搜索的使用方法
图3-3-1百度主页界面3.3.2百度搜索的使用方法
1.基本语法(1)输入多个词语搜索输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。例如:想了解北京暂住证相关信息,在搜索框中输入3.3.2百度搜索的使用方法
获得的搜索效果会比输入“合肥暂住证”得到的结果更好。在百度查询时不需要使用符号"AND"或"+",百度会在多个以空格隔开的词语之间自动添加"+"。百度提供符合您全部查询条件的资料,并把最相关的网页排在前列。(2)减除无关资料有时候,排除含有某些词语的资料有利于缩小查询范围。百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。例如,要搜寻关于“武侠小说”,但不含“古龙”的资料,可使用如下查询:
3.3.2百度搜索的使用方法
(3)并行搜索使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。例如:您要查询“图片”或“写真”相关资料,无须分两次查询,只要输入“图片|写真”搜索即可。百度会提供跟“|”前后任何字词相关的资料,并把最相关的网页排在前列。3.3.2百度搜索的使用方法
2.高级搜索语法(1)把搜索范定在网页标题中——intitle,网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。例如,找林青霞的写真,就可以这样查询:写真intitle:林青霞
注意,intitle:和后面的关键词之间,不要有空格。(2)把搜索范围限定在特定站点中——site3.3.2百度搜索的使用方法
有时候,你如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。例如,天空网下载软件不错,就可以这样查询:msnsite:注意:“site:”后面跟的站点域名,不要带“http://”和“/”符号;另外,site:和站点名之间,不要带空格。3.3.2百度搜索的使用方法
(3)把搜索范围限定在url链接中——inurl网页url中的某些信息,常常有某种有价值的含义。于是,你如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。例如,找关于photoshop的使用技巧,可以这样查询:photoshop
inurl:jiqiao上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。注意,inurl:语法和后面所跟的关键词,不要有空格。3.3.2百度搜索的使用方法
(4)精确匹配——双引号和书名号如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果你对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。3.3.2百度搜索的使用方法
3.3.2百度搜索的使用方法
例如,搜索上海科技大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。3.3.2百度搜索的使用方法3.百度网页搜索特色功能(1)百度快照如果无法打开某个搜索结果,或者打开速度特别慢,该怎么办?“百度快照”能帮你解决问题。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度速度较快,你可以通过“快照”快速浏览页面内容。不过,百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。如果你无法连接原网页,那么快照上的图片等非文本内容,会无法显示。3.3.2百度搜索的使用方法(2)相关搜索搜索结果不佳,有时候是因为选择的查询词不是很妥当。你可以通过参考别人是怎么搜的,来获得一些启发。百度的“相关搜索”,就是和你的搜索很相似的一系列查询词。百度相关搜索排布在搜索结果页的下方,按搜索热门度排序。下面是“小说”的相关搜索。点击这些词,可以直接获得他们的搜索结果。3.3.2百度搜索的使用方法3.3.2百度搜索的使用方法(3)拼音提示如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输入太麻烦,该怎么办?百度拼音提示能帮你解决问题。只要你输入查询词的汉语拼音,百度就能把最符合要求的对应汉字提示出来。它事实上是一个无比强大的拼音输入法。拼音提示显示在搜索结果上方。如:输入“zhurongji”,提示如下:您要找的是不是:朱鎔基3.3.2百度搜索的使用方法(4)错别字提示由于汉字输入法的局限性,我们在搜索时经常会输入一些错别字,导致搜索结果不佳。别担心,百度会给出错别字纠正提示。错别字提示显示在搜索结果上方。如:输入“唐醋排骨”,提示如下:您要找的是不是:糖醋排骨。3.3.2百度搜索的使用方法(5)英汉互译词典百度还有线上英汉互译词典,随便输入一个英语单词,或者输入一个汉字词语,留意一下搜索框上方多出来的词典提示。如:搜索“apple”,点击结果页上的“词典”链接,就可以得到高质量的翻译结果。百度的线上词典不但能翻译普通的英语单词、词组、汉字词语,甚至还能翻译常见的成语!你也可以通过“百度词典搜索界面”(http:///search/dict.html),直接使用英汉互译功能。3.3.2百度搜索的使用方法(6)计算器和度量衡转换Windows系统自带的计算器功能过于简陋,尤其是无法处理一个复杂计算式,很不方便。而百度网页搜索内嵌的计算器功能,则能快速高效的解决你的计算需求。只需简单的在搜索框内输入计算式,回车即可。如果你要搜的是含有数学计算式的网页,而不是做数学计算,点击搜索结果上的表达式链接,就可以达到目的。3.3.2百度搜索的使用方法(7)专业文档搜索很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、Powerpoint)、AdobePDF文档、RTF文档和Txt文档也进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。“Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、TXT、RTF、ALL。其中,ALL表示搜索所有这些文件类型。3.3.2百度搜索的使用方法(8)股票、列车时刻表和飞机航班查询在百度搜索框中输入股票代码、列车车次或者飞机航班号,你就能直接获得相关信息。例如,输入深发展的股票代码“000001”,搜索结果上方,显示深发展的股票实时行情。也可以在百度实用搜索中,进行上述查询。3.3.2百度搜索的使用方法4.百度其它产品(1)百度新闻搜索百度新闻是全球最大的中文新闻平台,如图3-3-2所示。它是一种24小时的自动新闻服务,不含任何人工编辑成分,没有新闻偏见,它从上千个新闻源中收集并筛选新闻报道,将最新最及时的新闻提供给用户,突出新闻的客观性和完整性,真实地反映每时每刻的新闻热点。百度新闻每天发布80000—100000条,365天,7×24小时,每一小时的每一分钟,永不休息,风雨无阻。3.3.2百度搜索的使用方法图3-3-2百度新闻搜索3.3.2百度搜索的使用方法(2)百度图片搜索(http://)百度图片搜索引擎是世界上最大的中文图片搜索引擎,如图3-3-3所示。百度从8亿中文网页中提取各类图片,建立了世界第一的中文图片库。截止2004年底,百度图片搜索引擎可检索图片已超过7千万张。3.3.2百度搜索的使用方法在百度图片搜索引擎主页搜索框中直接输入检索词,然后点击"百度图片搜索"按钮或直接按键盘上的回车键(即Enter键)即可。需要指出的是,虽然百度是世界第一的中文图片库,但某些图片可能仍未被百度收录,某些图片对关键词不敏感,所以输入某个关键词搜索并不能保证搜索到互联网上所有与该关键词相关的图片,您可以换用其它关键词(同义词)以找到更多相关图片。3.3.2百度搜索的使用方法图3-3-3百度图片搜索主页3.3.2百度搜索的使用方法(3)百度MP3搜索()百度中文搜索引擎是世界最大的中文搜索引擎,百度在天天更新的8亿中文网页中提取MP3下载链接,建立庞大的MP3歌曲下载链接库。百度MP3搜索引擎拥有自动验证下载速度的卓越功能,总是把下载速度最快的排在前列,使用户下载MP3歌曲的速度总是保持最快。百度在推出mp3搜索以后,利用自身强大技术实力,推出了方便易用的歌词搜索,无论歌名或还是你在路边听到的一句歌词片断,都可以用来寻找你想要的歌词。在歌词搜索结果右下角,提供mp3搜索有结果的链接。3.3.2百度搜索的使用方法在百度mp3搜索引擎主页,如图3-3-4所示。搜索框中输入歌手名或歌曲名,并按一下搜索按钮,百度就会自动找出相关的mp3。输入关键词后,直接按键盘上的回车键(即Enter健),百度也会开始搜索。mp3搜索关键词主要是歌手名和歌曲名,准确的歌手名或歌曲名是mp3搜索的关键,如果搜索结果不理想,建议检查输入文字有无错误,变换关键词,查看百度mp3搜索的提示。如果无法确认某个歌手拼写,可以输入歌手汉语拼音,百度会提示合适关键词。用歌手名搜索不能搜到歌手的全部作品,搜歌曲最好直接用歌曲名搜索,如果歌曲名太常见,搜索结果很多,可以用歌曲名加歌手名一起搜,在歌手名和歌曲名之间要加一空格,百度歌词搜索引擎能够搜到歌词,还能用来寻找mp3。3.3.2百度搜索的使用方法图3-3-4百度mp3搜索3.3.2百度搜索的使用方法(4)百度贴吧(http://)传统搜索引擎局限于搜寻互联网上有限的“已存在”信息,虽然百度已能搜寻高达8亿中文网页上的信息,但跟8000万中国网民脑中的所有知识之和相比,仍然只是沧海一粟。“百度贴吧”如图3-2-5所示。其诞生的意义是让用户可以把头脑中的知识、想法和经验与大家分享,让中国网民不但能搜寻网上“已存在”的有限信息,还能搜寻人类头脑中那些互联网上“没有”的无限信息。“贴吧”通过任意关键词,能把相同兴趣的人集中在一起。用户可以方便的与热爱相同偶像的陌生网友、喜欢相同歌曲的网友、对相同学科、相同事件感兴趣的网友交流。3.3.2百度搜索的使用方法图3-3-5百度贴吧主页3.3.2百度搜索的使用方法(5)百度知道(http://)百度于2005年11月推出了其新一代搜索产品“百度知道”如图3-3-6所示。百度知道就是把用户脑海中的隐性知识变成显性知识,通过对回答的沉淀组织形成新的信息库,其中信息可以被用户进一步检索利用——这意味着,人的智慧,加入了被搜索的行列,用户既是搜索引擎的使用者,同时也是搜索引擎的创造者。这还意味着,用户通过百度知道,可以分享千万网友的智慧,来获取自己所需要的结果。3.3.2百度搜索的使用方法图3-3-6百度知道主页3.3.2百度搜索的使用方法6)百度百科(http:///)百度百科如图3-3-7所示。它是一部开放的百科全书,每个人都可以自由访问并参与撰写和编辑,分享及奉献自己所知的知识,共同编写一部完整的百科全书,并使其不断更新完善。它遵循开放、合作、平等、共享的网络原则,有着简单易用、自由开放的使用特点。和传统百科全书由固定专家编写、权威化解释、出版后无法修改、所包括词目有限的特点相对应,百度百科由网友共同编写,任何一个不违反法规、不含色情、暴力、反动内容的词条,都可以由网友自由添加,具有“无限”与“即时”的特征。3.3.2百度搜索的使用方法图3-3-7百度百科主页3.4其它常用中文搜索引擎
3.4.1雅虎(Yahoo)1.雅虎简介Yahoo!是由美国斯坦福大学电机工程系博士生杨致远和大卫·费罗创建。它是全球第一个也是目前www环境下最著名的分类主题索引。据Aiexa监测的排名,截止2004年2月,Yahoo!已成为全球访问量最大的网站。3.4.1雅虎(Yahoo)Yahoo属于目录索引类搜索引擎,可以通过两种方式在上面查找信息,一是通常的关键词搜索,一是按分类目录逐层查找。以关键词搜索时,网站排列基于分类目录及网站信息与关键字串的相关程度。包含关键词的目录及该目录下的匹配网站排在最前面。以目录检索时,网站排列则按字母顺序。Yahoo2004年2月18日宣布弃用Google搜索技术,继而采用自主算法的检索技术“Yahoo!SearchTechnology”替代Google行使搜索任务,并将默认搜索设置为网页搜索。3.4.1雅虎(Yahoo)雅虎在全球共有24个网站,12种语言版本,其中雅虎中国网站()于1999年9月正式开通(见图3-4-1),它是雅虎在全球的第20个网站。雅虎中国网站为用户提供了强大的搜索功能,通过其14类简单易用、手工分类的简体中文网站目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、文化、科技、房地产、教育、艺术、娱乐、体育等各方面的信息。3.4.1雅虎(Yahoo)图3-4-1中文雅虎主页3.4.1雅虎(Yahoo)2.雅虎检索方法(1)分类目录检索雅虎的分类目录位于其主页的中部。用户可以根据查找的内容所属的类别在分类目录中逐级逐类地选择相应的类目,经过多次选择后,就可以访问到包含所查找内容的站点。例如,要查找科学领域的内容,首先在主页的分类目录中点击“科学”大类,进入有关科学领域的下级类目页面。在该页面中,列出有关科学领域的详细分类,如地理学、工程学、能源、生物学、天文学、物理学与图书馆等。再点击“图书馆”,就会出现有关图书馆方面的站点信息。3.4.1雅虎(Yahoo)(2)关键词检索如果用户已知要查找内容的主题概念,就可以利用关键词检索方式。在检索文本框中输入要找的关键词,然后点击“搜索”按钮,中文雅虎就会在数据中查找与关键词匹配的记录,并将符合检索条件的结果显示出来。使用关键词检索还有简单方法与复杂方法之分,简单方法就是将关键词直接输入检索文本框中,可以输入一个词也可以输入几个词,并对检索要求不加限制,系统在处理时会按照自身的规则将用户的查询字符串分为几个部分,这样返回的结果可能与用户想要的相差甚远。复杂方法就是利用字段限定符号和限制选项构建复杂的检索表达式来进行检索,这样会获得比较准确的查询结果。中文雅虎支持以下几种限定检索操作符:3.4.1雅虎(Yahoo)(1)用引号(“”)来查询完全符合关键词字符串的网站。(2)在关键词前加“t:”,搜索引擎仅限在网站名称中查找。(3)在关键词前加“u:”,搜索引擎仅限在URL中查找。(4)包含关键字:在要加入的词前输入一个空格。例如,您要搜索张学友的歌曲,您可以在“张学友”后面输入一个空格,再输入“歌曲”,就能得到有关张学友歌曲的网站。在要加入的词前输入半角的加号“+”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 加盟连锁招商合同范本
- 国家旅游课题申报书
- 办公购置合同范本
- 单位套房出售合同范本
- 售卖义齿器械合同范本
- 建设知识产权保护高地的实施细则与规划
- 员工欠款合同范本
- 党务材料外包合同范本
- 品牌油漆采购合同范本
- 合同范本书库
- 2024年上海烟草集团有限责任公司招聘笔试真题
- 加油站合作经营协议书范本
- 人工智能对舆情管理的价值
- 地理-河南省部分重点高中九师联盟2024-2025学年高三下学期2月开学考试试题和答案
- 老年护理相关法律法规
- 《陶瓷工艺技术》课件
- 变更强制措施的申请书
- 《苗圃生产与管理》教案-第二章 园林苗木的种实生产
- 供电所安全演讲
- 供应链韧性提升与风险防范-深度研究
- 《智能制造技术基础》课件-第4章 加工过程的智能监测与控制
评论
0/150
提交评论