Internet 网络信息存取_第1页
Internet 网络信息存取_第2页
Internet 网络信息存取_第3页
Internet 网络信息存取_第4页
Internet 网络信息存取_第5页
已阅读5页,还剩140页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章Internet网络信息存取第一节网络信息存取原理与方法

第二节Internet网络存取系统及其检索第三节网络信息检索策略与技巧复习:1.要使用百度引擎搜索含有“油画艺术”词组的文本文件,使用的检索策略应为( )。2.要使用百度引擎搜索中标题含有“污水处理”检索词的网页,使用的检索策略为应为( )。3.百度引擎检索策略表达式:intitle:存款利率filetype:xls中运用了( )和( )算符,其中filetype:xls的含义是( )。6.1概述(补充)Internet网络上蕴藏着非常丰富的信息资源,从电子期刊、电子工具书、商业信息、新闻、大学和专业机构介绍、软件、数据库、图书馆资源、国际组织和政府出版物,到娱乐性信息等等。它已经成为全球范围内传播科研、教育、商业和社会信息的最主要的渠道。但要从这个信息海洋中准确迅速地找到并获得自己所需的信息,却往往比较困难。正是为了解决这个问题,从20世纪80年代起人们就开发了各种网络信息检索工具。6.1网络信息存取原理与方法6.1.1网络信息检索的特点(P190)

存取范围覆盖Internet上的几乎所有资源Internet上的信息,包括WWW、FTP、Telnet、Usenet、Gopher等,用户不必预先知道某种资源的具体地址。

传统检索方法与全新检索技术相结合传统检索方法:布尔逻辑检索、加权检索、全文检索、模糊检索新的检索技术:超文本检索注意:不同技术在不同网站上表现出不同的实现细节。

用户界面友好且操作方便网络信息存取工具采用C/S结构,交互方式较好,输入检索式,点击检索,即可获得包括题目、内容简介、HTTP地址等信息,并可进一步获得更为详细的信息。可做书签标记,保留检索历史。良好的信息反馈和瞬间响应功能。容易学习。

具备良好的导航和编辑功能网络信息存取系统可用导航机制,了解资源在网络图中的位置。具有良好的编辑功能,可修改、增加、删除结点和链。

用户透明度6.1.2网络信息检索一般方法

浏览:顺链而行

通过资源指南(ResourceGuide)来查找相应的信息:专业人员利用自身对网络信息资源的产生、传递与利用、分布机制的广泛了解,对各种网络信息资源采用采集、组织、评价、过滤、控制、检索等手段开发出的可供浏览和检索的书目之书目,又称网上虚拟图书馆。资源指南分为综合性资源指南和专业性资源指南。但是几乎每过6个月就需要对其进行更新,因此要注意是否过时。此外资源指南凝聚了专业人员的工作,值得参考。如:

利用网络信息检索工具WWW、FTP、Telnet、Gopher、Wais等性能优越的信息查询工具。

RSS:RSS是站点用来和其他站点间共享信息的一种简易方式,用户只要使用相应的客户端工具就能在不打开网站页面情况下读取自己感兴趣的网站内容。RSS的特点:RSS阅读器可以自动更新新闻内容,保持与网站内容一致;可以定制多个RSS提要,所新闻整合成单个数据流;没有广告或图片等内容的骚扰,阅读更加方便。

使用搜索软件针对搜索引擎的不足,国内出现了许多专业搜索软件,其特点是搜索速度快,搜索范围广,同时启动多个搜索引擎进行搜索。缺点:需要安装软件,准确性不高,个别软件无法有效过滤重复信息。

充分利用E-mail获取信息资源用户加入电子论坛的专题讨论组后,有关该专题所有言论会传递到用户E-mail信箱,从而达到搜集、开发与利用网络信息的目的。用户可以通过E-mail订阅电子期刊,定期收到专题信息。6.1.3网络信息存取工具网络信息检索工具(P193):在因特网上提供信息检索服务的计算机系统,其检索对象往往是存在于因特网信息空间中各种类型的网络信息资源.网络资源检索工具分类:根据检索工具检索网络资源类型的不同,可以将其分为万维网检索工具和非万维网检索工具。万维网检索工具主要检索万维网站点上的资源,它们常被称为搜索引擎,而且由于万维网资源常以网页的形式存在,它们的检索结果常常被称为网页。非万维网检索工具主要检索特殊类型的信息资源,如Archie一检索FTP文件;Veronica一搜索Gopher服务器;WAIS-查询Usenet新闻组资源;DejaNews-检索新闻组等。不过越来越多的万维网搜索引擎具备了检索非万维网资源的功能,使它们成为检索多类网络信息资源的集成化工具。为此,本章将搜索引擎为例介绍网络信息检索的基本原理和方法。搜索引擎的工作原理就像超市索引生成器(网页数据库)爬行器(蜘蛛)查询检索器(用户查询)因特网6.1.4搜索引擎的工作原理搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的内容,还分析所有指向该网页的链接的URL、AnchorText,甚至链接周围的文字。如网页本身无“信息存贮与检索”,但如有网页用“信息存贮与检索”指向这个网页,该网页也会被找出。而且这类网页越多,或是链源越优秀,该网页排序也会越靠前。6.1.5搜索引擎的基本结构(P194)用户系统用户接口搜索器索引器检索器www信息资源FTP信息资源Gopher信息资源WAIS信息资源搜索引擎网络网络Telnet信息资源用户服务组信息资源搜索器又称为Robot(机器人)、spider(蜘蛛)、webcrawler(爬行者)或Worm等。是一个自动收集网页的系统程序,其功能是日夜不停地在互联网中漫游,“筢”回信息。它要尽可能多、尽可能快地搜集各种类型的新信息,还要定期更新已经搜集过的旧的信息,以避免死链。目前有两种搜集信息的策略:从一个起始URL集合开始,顺着这些URL中的超链接,以宽度优先、深度优先或启发式方式循环在互联网中发现信息。这些起始URL可以是任意的URL,但常常是一些非常流行、包含很多链接的站点,如Yahoo。将WEB空间按域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。搜索器搜集的信息类型多种多样,包括网页文件、有的搜索器能处理字处理文档,甚至数据库文件。搜索器将“筢”回的每个文档过滤掉格式符,提取文本数据Fulltext。每个文档对应一个Fulltext文件,内容包括网页标题、网页URL、大小、时间、类型、分类等属性及文本内容,所有生成的这些文件交给Indexer进行索引处理。搜索器一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样网页的具体内容和变化情况就会反映到用户查询的结果中。索引器:索引器的功能是理解搜索器所搜索的信息,由分析索引系统程序对收集回来的网页进行分析,提出相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其他网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容及超链接中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。索引项分为客观索引项和内容索引项两种。客观索引项与文档语义无关,如作者、URL、更新时间、编码、长度、链接流行度等。内容索引项用来反映文档内容,如关键词及其权重、短语、单字等。一般而言,标引的索引项越多,检索的全面性越高,检准率就相对较低。检索器:根据用户的查询在索引库中快速检索出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制,如基于内容、基于链接分析的方法进行相关度排序。用户接口:输入用户查询,显示查询结果,提供用户相关性反馈机制。UI的主要目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。包括简单接口和复杂接口两种。简单接口只提供用户输入查询串的文本框;复杂接口可以让用户对查询进行限制,如逻辑运算、相近关系、域名范围、出现位置、信息时间、长度等。

搜索引擎工作原理用户访问策略搜索引擎用户界面接口搜索引擎本地的摘要信息数据库各万维网站点资源各记录链接详细信息反馈访问摘要信息反馈6.1.6

搜索引擎的分类(补充)

1.全文搜索引擎(FullTextSearchEngine)通过从互联网上提取的各个网站的信息(以网页文字为主)建立的数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度、中文搜索、北大天网等。

全文搜索引擎的优点:全文搜索、检索功能强、信息更新速度快等。缺点:提供的信息虽然多而全,但可供选择的信息太多反而降低相应的命中率,并且提供的查询结果重复链接较多,层次结构不清晰,给人一种繁多杂乱的感觉。

2.目录索引类搜索引擎(SearchIndex/Directory)目录索引由人工建立,通过“人工方式”将站点进行了分类,将该网站划分到某个分类下,再记录一些摘要信息,对该网站进行概述性的简要介绍,用户提出搜索要求时,搜索引擎只在网站的简介中搜索。

国外有代表性的有Yahoo雅虎、OpenDirectoryProject(DMOZ)、LookSmart、About等。国内有搜狐(Sohu)、中文Yahoo、新浪(Sina)、网易搜索(NetEase)等。主要优点有:①层次、结构清晰,易于查找;②多级类目,便于查询到具体明确的主题;③内容提要、分类目录下,有简明扼要的内容,可以使用户一目了然。缺点:搜索范围较小;更新速度慢;查询交叉类目时容易遗漏。3.元搜索引擎(MetaSearchEngine)元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。除上述三大类引擎外,还有以下几种非主流形式:(1)集合式搜索引擎。如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。(2)门户搜索引擎。如AOLSearch、MSNSearch等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。(3)免费链接列表(FreeForAllLinks,FFA)。这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。6.1.7搜索引擎的特点(补充):(1)搜索引擎是一个双层C/S结构的体系当用户访问搜索引擎时:用户端为客户机,向搜索引擎提出检索请求,搜索引擎为服务器,检索自己的索引数据库并将检索结果以应答形式提交给用户。当搜索引擎采集数据时:搜索引擎为客户机,向WWW站点等实际资源系统提出搜索请求,各类实际资源系统为服务器,将有关数据(例如网页)作为应答提交给搜索引擎。(2)搜索引擎是一个"网络导航工具"与用于提供图书馆馆藏信息的目录系统相似,搜索引擎本身并不提供任何实际的Web文档,而仅提供关于网页的信息。搜索引擎为所采集的每一个网页建立一条记录,记录包括对网页的简单描述、标题以及实际网页所在服务器的URL等信息,这些记录的集合就构成了索引数据库。搜索引擎通过对索引数据库的采集与调用来实现网络导航功能。6.1.8检索方法(补充):搜索引擎常用的检索方法有关键词检索和目录浏览两种形式。关键词检索:用户直接输入检索词,搜索引擎通过查找索引数据库中包含有检索词的记录来提供用户所需的信息资源。检索方便直接,而且可以使用逻辑算符、位置算符、截词符等来构成检索式,可以限制检索对象的地区、数据类型、时间等,因而可准确检索满足特定条件的网络资源。关键词什么是关键词就是您输入搜索框中的文字,也就是您命令搜索引擎寻找的东西。提炼正确的关键词无庸至疑,选择正确的关键词是一切的开始。学会从复杂搜索意图中提练出最具代表性和指示性的关键词对提高信息查询效率至关重要,这方面的技巧(或者说经验)是所有搜索技巧之母。例如:多少级以上的地震会造成破坏?

a)4.5级b)5级c)6级关键词:震级造成破坏目录浏览:用户通过浏览层次型的目录来寻找相关的信息资源。目录按一定的主题分类体系组织,并辅之年代、地区等分类。用户一般采取逐层浏览目录、逐步细化来寻找合适的类别直至具体资源。以雅虎网站为例。Yahoo把信息分为很多类,从艺术和商业到科学和社会,可以选择自己所需查询的类别点击进入。例如:我们打算查找与操作系统有关的网站,可以单击“电脑与因特网”链接点进入更细的分类查询。从中选择“操作系统”,这时就会出现进一步分类和网站链接清单,然后从中选择自己所需的站点进入。6.1.9网络信息检索工具的功能(P198)

基本检索功能

布尔逻辑检索(NOT/nor/!、AND/and/&、OR/or/|)

字符串检索(“”功能)

截词检索

字段限制检索(题名,著者,关键词等)

位置检索

高级检索功能

自然语言检索(直接输入自燃语言)

模糊检索(搜寻相关概念,上下位概念)

概念检索(指同义词和近义词)

区分大小写检索

管道检索(用管道符“|”表检索顺序)

相关信息反馈检索(点击相关网页,网站等。Yahoo,Lycos的“morelikethis”等)

检索范围限制(语言、地域、类型、后缀、时间等)

6.1.10网络信息检索工具类型(P196-198)

按照网络信息资源类型划分

www检索工具

非www检索工具

按照检索机制划分(分析其优缺点)

关键词检索工具

分类目录检索工具

混合型检索工具

按照包含检索工具数量划分

单一型检索工具

多元型检索工具(并行,串行,ALL-IN-ONE方式)

按照检索内容划分

综合型检索工具

专题型检索工具

特殊型检索工具6.1.9网络检索方法的发展(补充):随着技术的进步,不少原先仅在实验室内进行研究的检索方法,已开始应用于网络信息的检索。加权检索加权检索,即在检索时,给某个检索词一定的权值,以表示其重要程度。在现有的网络信息检索工具中,多采用加、减号来表现检索词在检索提问中的分量。用加号表示某检索词一定要包含在检索结果中,如检索式“十亚洲十金融风暴”的含义是:找出关于在亚洲发生的金融风暴的信息,即检索结果中必须同时含有“亚洲”和“金融风暴”这两个词;用减号表示某检索词一定不能包含在检索结果中,如检索式“十亚洲十金融风暴一南美洲”的含义检索结果除一定包含"亚洲"和"金融风暴"这两个词之外,还要排除关于南美洲的信息,即检索结果中一定不能有"南美洲"这个词。自然语言检索自然语言检索指用户在检索时可输入自然语言表达的检索要求,例如“pleasefindformesomethingaboutautomobilesaleinNewYorkstate”,检索工具会按照提问检索出关于在纽约州(NewYorkstate)汽车销售(automobilesale)的信息。这种检索的基本处理过程是:检索工具在收到用户提问后,首先利用一个禁用词表从提问中剔除那些没有实质主题意义的词汇,例如各种副词、介词、代词、常用请求词(please、help、would、may等)、检索提问词(find、search、locate、check、information、materials等),然后将余下的词汇:纽约州(NewYorkstate)、汽车销售(automobilesale)作为关键词进行检索。相关信息反馈检索在检索过程中人们会发现某个结果非常符合自己需要,因此希望能进一步检索到与该结果类似的结果,这称之为相关信息反馈检索。在网络环境中,相关信息反馈检索可由检索工具自动进行,例如Excite的"Searchformoredocumentslikethisone"检索以及Lycos的"MoreLikeThis"检索。

相关信息反馈检索的基本原理是检索工具将用户所选定的结果网页中包含的关键词找出,通过它们在这个网页中出现的频率和位置等来计算各自的相关度,然后选出相关度较高的词汇作为下一步检索的检索词。但由于词汇选择只考虑了词汇出现的频率和位置,而没有考虑用户对各个词汇重要性的主观判断,所以其结果并不一定非常合适。模糊检索简单地说,模糊检索就是允许检索单元和检索提问之间存在一定的差异,这种差异即“模糊”在检索中的含义。模糊检索中所指的差异往往来自于用户在输入检索提问时的输入错误,如少键入一个字,打错一个字母等等。另一类差异来自某些词汇不同的拼写形式,例如,单复数,"catalog"和"catalogue"。这时检索工具应该能够检索到用正确词汇或其它变形形式标引的结果,而不是简单地告诉"输入错误"或"没有结果"。概念检索所谓概念检索,是指当用户输入一个检索词后,检索工具不仅能检索出包含这个具体词汇的结果,还能检索出包含那些与该词汇同属一类概念的词汇的结果。例如,检索“automobile”时能找出包含“automobile”、“car”、“truck”、“van”、“bus”等任一词汇的结果。又如,在查找“公共交通”这一概念时,有关“公共汽车”或“地铁”的信息也能随之检得。在此意义上,概念检索实现了受控检索语言的一部分功用,即考虑到了同义词、广义词和狭义词的使用。至今为止,Excite在概念检索方面取得了比较明显的成就。搜尋引擎查詢的方式關鍵字搜尋(keywordsearch)概念式搜尋(conceptsearch)網頁分類目錄相關查詢(RelatedSearches)相似網頁(FindSimilar)結果再查詢(SearchWithin)建議使用適用時機所要查詢的資料非常明確時,建議先利用概念式搜尋找到相關的資料,再利用關鍵字索引做廣泛的搜尋如果所要查詢的資料不太容易界定歸類,建議直接利用關鍵字搜尋引擎,但是最好能儘量將相關的關鍵字一一輸入查詢,才能得到較完整適用的資料。

此外,在网络信息检索领域还陆续出现了一些与检索相关的功能,它们包括以下几个方面:检索提问的修改与限制用户在得到检索结果之后,可选择把新一轮的检索范围限制在已获得的检索结果之内,以提高检索效率。此外,用户可以在键入检索提问之前或获得检索结果之后,从语种(如英文或中文)、日期(如前一周或上个月)、地理范围(如中国或美国纽约州)、域名范围(如.edu或.com)、网络信息类型(如万维网或用户网)、信息媒介类型(如文本信息或图像信息)等方面进行限制,以检得更确切的信息。按相关度排列结果各种检索工具都在检索中计算检索结果的相关度,并按相关度顺序从高到低排列结果,许多还在每条结果旁给出相关度值。大多数检索工具是通过计算检索词在每个结果中的出现次数和出现位置来计算相关度的,因此如果一个网页中包含的检索词越多、出现的位置越重要(例如出现在网页标题中、网页元数据中、网页内容标题中),则这个网页的相关度就越高。有的检索工具还采用了其它辅助方式,例如Google就考虑了网页被链接程度,如果有大量网页链接到某一网页或有一些非常重要的网页链接到该网页,Google在计算网页相关度时,会增加该网页的重要性。支持检索与浏览并行允许用户在浏览过程中,随时在当前所处的类别中进行检索。检索和浏览在信息查询过程中各有其功用。一般地说,检索便于有的放矢,直接获取检索结果;浏览利于边查边看,发现未曾预料的结果。支持检索结果的翻译和多语种检索翻译的语种现只有西文,如英文、法文、德文、西班牙文等等。英文和其它几种语言可以对译,如英文译法文,法文又译成英文。检索结果的翻译自然极大地方便了网络用户,但翻译质量的提高还有待于机器翻译研究的新成果。

总之,从检索功能来看,网络信息检索工具的发展已取得长足的进步。尽管如此,至今仍没有一个网络信息检索工具可以完全支持上述所有功能。换言之,网络检索工具作为一个整体,已经具备了相当齐全和复杂的检索功能,然而具体到单个检索工具,它们的功能还有待完善。此外,与联机和光盘环境下的检索工具(如DIALOG,SilverPlatter)相比,网络信息检索工具的检索功能还有待改进,尤其是在提高查准率方面。6.1.11目前搜索引擎存在的主要问题搜索引擎的原理起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的排序文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。

1.网络搜索引擎目前存在的主要问题(1)检出的信息相关度低(2)检出的重复信息多(3)信息更新慢,时效性差(4)覆盖面有限

2.解决途径建立搜索引擎数据库时对WEB信息的唯一性进行处理。需要应用人工、自然语言识别等技术对WEB信息进行处理,根据WEB信息的标题、作者、关键词和全文分析的结果对WEB进行信息唯一性标识。当WEB信息出现在WEB站点时给出一个唯一的标识,如对原创WEB信息给予其原创标识、标题标识、作者标识、所在站点和位置的标识、信息类别标识、首次刊登时间标识,由所有这些标识或这些标识的部分形成一个WEB信息的唯一标识;而对转载的WEB信息,应给予转载者标识、转载位置标识及原作标识。

6.2网络信息检索策略与技巧(P223)6.2.1网络信息检索策略(1)明确搜索目标,确定检索项

分析检索课题的主题,选择适当的检索关键词以陈述句或疑问句形式写下要检索的主题,并确定关键词或词组;把最重要的概念定为检索关键词,并注意检索词的同义词、单复数、拼写变异、单词结尾的不同等;确定包含检索主题的较广的类别,使用分类检索;选定可能包含检索主题的组织或机构;如果主题范围狭小,不防用两三个关键词试一试;不使用过于通俗简单的语词;要注意一词多义问题。如笔记本:手写的本子?计算机?对检索项进行逻辑组配,构造检索表达式使用与、或、非;使用括号或引号组合关键词;使用星号通配符等。(2)选定适合的检索工具

掌握网上检索工具的类型与特点多元搜索引擎:首选;不能进行有效的复杂信息检索。关键词检索:特定信息查找;所用的引擎数据库容量很大时。分类目录检索:分类明确的信息查找;文献量有限,时滞问题。分类目录加关键词联合检索:先找到信息所属范围,在该分类目录下用关键词检索。垂直引擎检索:特定的信息,如MP3、地图等,最好用专门的MP3、地图等搜索引擎。直接进入信息源查找:词组搜索太精确或一个词组无法准确表达所需信息时,可直接到信息源查找.

熟悉要使用的检索工具

注意收集具体的检索网址关注、收集一些网上有用的、学术性强的检索网页。(3)正确对待检索结果

可只阅读搜寻结果的前面几条信息:最符合条件的放在最前面.

缩小搜索范围:返回结果不在最前面几页时,可改变关键词、改变搜索范围、使用逻辑符and、引号等缩小查询范围.找不到网页的对策:是否有拼写错误、搜索关键词间有矛盾吗、换一种搜索引擎。认真回顾检查搜索方法并进行纠正:改变检索策略,查找相近页,发邮件给主页管理者等。(4)提高上网速度,选择最佳上网时间:节省上网时间和费用,建立书签体系、使用缓存、设置浏览器起始位置,选择距离最近的网站,避免装载图像等。检索学术性强的信息可选择深夜,检索娱乐或消费的信息可选在白天。6.2.2网络信息检索技巧(P227)

扩大检索范围降低检索词的专指度;调节检索式的网罗度,如删除某个不甚重要的概念组面;使用同义词、近义词查询;使用all-in-one整合型检索。

缩小检索范围提高检索词的专指度,用逻辑与连接,利用文献的外表特征(类型、语种、年代、学科等)进行限定;利用前一次检索的结果作为后一次检索的基础等。All-in-one:资源整合后的检索平台,一次获得所有相关资源。Ctrl+F连接到相关网页后未发现相关文件,可能放在当前网页的底部,用Ctrl+F键在当前网页中查找特定文件。

给检索结果做标签如果以后还可能用到的重复检索,制成标签。

右切断URL很长的网址连接不上时,或是返回很多的文档网址时,可右截断URL直到连接成功。

猜测站点的URL根据URL的知识和对某些站点的了解构造URL,如,或是某些网页将1.html改为2.html等。6.3Google简介Google速度极快,据说有10000多台服务器;Google的搜索结果摘录查询网页的含有关键字的内容,搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;Google智能化的“手气不错”功能,提供可能最符合要求的网站;Google的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。基本搜索信息对象选择检索提问

输入框检索按钮语种选择基本搜索技巧在没有任何限定情况下,Google自动分解输入的检索词;例如检索:中南民族大学,被自动分解为:中南、民族、大学三个词三个词的任意组合的短语(术语)都被认为是检索词,并进行检索。Google默认术语组合关系是“并且”、“与”;Google默认搜索网页,需要搜索其它类型资源,需要另外选择活用Google搜索技巧

——「“”」的基本用法

检索类:「“”」语意:查询符合引号间的语句全体的网页资料(强迫搜寻完整词组)基本查询语法:「“关键词”」使用时机:当想要进行确定短语,而不进行自动关键词拆分的检索范例:「“苹果好吃”」,以「苹果好吃」四个字,作为完整的关键词来查询注意事项:无活用Google搜索技巧

——「+」或「空格」的基本用法

检索类:「+」或「空格」语意:和基本查询语法:「关键词1」+「空格」或「+」+「关键词2」使用时机:想要查询两个关键词都包含的网页范例:苹果计算机或苹果+计算机,可以找到有关苹果计算机相关资料的极大值注意事项:使用「+」时不可以有空格活用Google搜索技巧

——「-」的基本用法

检索类:「-」语意:“减去”基本查询语法:「关键词1」+「空格」或「-」+「关键词2」使用时机:从关键词1检索结果中取出含有关键词2的部分资料范例:苹果-计算机,不会出现苹果计算机等不相关的网页资料注意事项:在「-」号之间要先空一格活用Google搜索技巧

——「OR」的基本用法

检索类:「OR」语意:或者基本查询语法:「关键词1」+「空格」+「OR」+「空格」+「关键词2」使用时机:查询与关键词1与关键词2的相关数据范例:四级ORCET4,会按照「四级」→「CET4」→「四级CET4」这样的检索词顺序显示检索结果注意事项:OR一定要大写活用Google搜索技巧

——「site」的基本用法

检索类:site基本查询语法:「关键词」+「site」+「:」「网站名称」or「国别」使用时机:1.查询单一网站中的资料2.限定查询资料的网页国籍范例:CET4site:,在教育网中查找有关CET4的网页资源注意事项:在查询的网站前面不可加上「http」以及「www」的网址部份连结的网页活用Google搜索技巧

——「inurl」的基本用法检索类:inurl基本查询语法:「inurl」+「:」+「关键词1」+「空格」+「关键词2」使用时机:想要更精确定位在网页中的资料,针对特定连结做搜寻范例:inurl:mp3白桦林,检索出所有资源URL中含有mp3、网页中还有白桦林的网页资源注意事项:其实质是URL字段对关键词的包含关系,「inurl」后面续接的关键词不可以有空格活用Google搜索技巧

——「intitle」的基本用法

检索类:intiltle基本查询语法:「intitle」+「:」+「关键词1」+「空格」+「关键词2」使用时机:查询特定标题网页中的资料范例:intitle:免费软件下载,检索出所有资源网页Title中含有免费软件下载的网页资源注意事项:「intitle」检索语与关键词间不可以有空格活用Google搜索技巧

——「filetype」的基本用法

检索类:filetype基本查询语法:「filetype」+「:」+「档案类型」+「空格」+「关键词1」使用时机:查询特定类别的文献资料范例:filetype:DOC

保先教育,检索出所有资源内容包含保先教育的Word文档资源注意事项:适用此检索方式之前,确定其网的文献资源的扩展名检索结果显示A检索框

BGoogle搜索按钮

C“手气不错”按钮“手气不错™”按钮自动将您带到Google推荐的网页。

D结果数量设定菜单

E网页标题

G标题下文本

H统计行

I缩进显示的查询结果:首先显示最合适的结果,其他的就以缩进的形式排在下方.

J网址

K网页快照

L文本大小

M相似网页:网页性质类似的网页

高级搜索

按照提示在相应的检索输入框中,输入检索提问。检索提问之间是逻辑“与”的关系。Google检索技巧利用一些特色服务,查询特殊的信息结果,例如:货币转换计算器股票查询英汉互译天气查询邮编区号手机号码定义参见相应的帮助文档Google检索实例检索电影《神话》的下载地址分析:网页多是介绍《神话》剧情的如果要提供下载,必定给出完整的URL电影资源的提供一般有http、rstp、mms、ftp几种模式文件的扩展名可能是rmvb、rm、asf、avi检索方案:神话下载httpORrstpORmmsORftprmvbORrmORasfORaviGoogle的高级检索例:高级检索查找我国百白破疫苗接种率 包含全部字词:我国百白破疫苗 包含以下完整字句:接种率为 搜索网页语言:中文简体 网页更新日期:过去一年

网域:仅.(仅在卫生部网站中搜索)高级检索实例Google的高级检索Google网页高级搜索界面Google网页高级检索结果例:查找与美国国立卫生研究院类似的网站(http://)。在SearchbyURL区域,Findwebpagessimilarto后输入。点击右侧searchbyURL按钮。例:查找网页中含有美国国立卫生研究院链接的网页。在SearchbyURL区域,Findwebpagesthatlinkto后输入。点击右侧searchbyURL按钮。Google高级检索实例Google网页高级检索结果翻译网页网页字节数Google学术搜索含期刊论文、学位论文、图书、预印本、文摘、技术报告等学术文献,文献源自学术出版物、专业学会、预印本库、大学及网上学术论文。http://按相关度排序,考虑全文、作者、出版物及被引情况。采取自动分析与抽取引文的方法了解有关某一领域的学术文献;某一作者的著述,并提供书目信息Google学术搜索例:检索有关电子商务市场规模的文献包含全部字词:

marketvalue包含任何一个字:

e-businesse-commerceGoogle学术搜索检索结果翻译功能某些搜索引擎提供了翻译功能,如AltaVista和Google等,提供了多种语言(包括简繁中文)相互之间的翻译服务,并可按指定URL实时翻译整个网页。http://错别字改正Google、Baidu等网站的错别字改正软件系统会对输入的关键词进行自动扫描,检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google会自动提示“您是不是要找:互联网”。如果您点击“互联网”,Google将以“互联网”作为关键词进行搜索。拼音识别在使用Google、Baidu等网站的全文搜索功能时,如果我们不清楚关键词的写法,但只要知道关键词的拼音,搜索引擎会根据输入的拼音查找对应的最常用关键词。例如,在上个例子中,我们只需要输入“Hulianwang”,Google也会提示“您是不是要找:互联网”。点击这个链接即可以以“互联网”为关键词进行查询。计算器Google为用户提供了一个内置计算器。只需要在搜索字段中输入算式,按一下回车键或者搜索就可以了。这个计算器可以用来做所有简单的计算,一些复杂的科学计算,单位换算,以及提供各种物理常数。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论