信息与引擎搜索_第1页
信息与引擎搜索_第2页
信息与引擎搜索_第3页
信息与引擎搜索_第4页
信息与引擎搜索_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息与引擎搜索第一页,共一百二十二页,2022年,8月28日第一节信息素质

一、信息素质

1、定义:信息素质是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。

第二页,共一百二十二页,2022年,8月28日2、信息素质构成要素:

信息意识:强烈的信息意识——对信息敏感。

信息能力:信息的搜集获取能力主要包括信息接受能力力;信息捕捉能力;信息吸收能力;信息检索能力等。其中信息检索能力指熟悉各种信息源,掌握信息检索的基础理论和基本技术,熟练地利用各种手工检索工具和计算机检索系统查找所需信息的能力。信息道德:在信息领域中用以规范人们相互关系的思想观念与行为准则。

第三页,共一百二十二页,2022年,8月28日3、信息素质可分为:工具素质:能用印刷和电子信息资源的有关工具,如计算机、软件等;资源素质:了解信息资源的种类、形式和查找、检索方法;社会结构素质:掌握信息的社会地位、作用、影响;研究素质:掌握利用信息进行有关学科研究的技能;出版和传播信息素质:能利用文本或多媒体报告研究结果。第四页,共一百二十二页,2022年,8月28日

4、美国信息素质评价1999年1月,美国大学与图书馆协会通过了“美国高等教育中学生信息素质能力标准”,共5条,每条附有具体的操作说明,为教师或图书馆对学生、用户、读者的信息素质评价提供了依据。这5条主要内容如下:(1)能确定信息资源的特点和范围;(2)能有效地获取所需信息;(3)能评价信息及其来源,(4)利用其知识基础和价值系统选择适当的信息;(5)能有效利用所获得的信息实现特定的目标;第五页,共一百二十二页,2022年,8月28日美国信息素质评价要点:(1)能运用新的和以前的信息开发新产品或项目;(2)能调整开发产品或项目的过程;(3)能与别人就产品或项目情况进行有效的沟通(4)了解信息使用的经济、法律和社会问题,在信息获取和利用时自觉遵守道德规范和有关的法律。(即在产品或项目开发中能正确使用有关信息资源,如合理使用或引用等)第六页,共一百二十二页,2022年,8月28日第二节信息与科研一、学术研究中的时间分配据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科研文献查询的时间为全部科研时间一半还要多。第七页,共一百二十二页,2022年,8月28日信息检索、分析。。。SynthesisofAminoAcids1JACS19952JOC1987SynthesisofAminoAcids问题?创意?试验、计算。。。发表:口头报告、论文、专利。。。1JACS19952JOC1987SynthesisofAminoAcidsSynthesisofAminoAcids新的问题?发展、延伸。。。同行评价、引用、应用。。。二、科研流程图第八页,共一百二十二页,2022年,8月28日三、科研选题和文献检索科技信息是知识创新的源泉:世界上任何一项科研成果或创新都是在吸取和借鉴前人或他人研究成果的基础上,再加上自己的钻研和创新所获得的。科技信息是科研的先决条件。第九页,共一百二十二页,2022年,8月28日四、科研选题及其步骤课题是为了实现某个特定目标所需要研究的一个或一组科学问题。

科研选题就是形成、选择和确定所要研究和解决的课题。科研选题的步骤一般是:文献调研和实际考察——提出选题——初步论证——评议和确定课题。第十页,共一百二十二页,2022年,8月28日第十一页,共一百二十二页,2022年,8月28日第三节、Internet概论

一、Internet简介

INTERNET中文译为因特网,它是由众多计算机网络互联而成的,也称网间网(NetworkofNetworks),是覆盖全球的信息交流与共享网络。计算机网络是一个数据通信系统,是由相互独立的计算机相互连接在一起的计算机集合,它跨越了时空的限制,最大限度地实现了信息资源的共享。计算机网络经过了由最简单的两台计算机通过诸如电缆连接而成,发展到今天的由全世界上亿台计算机通过电缆、光缆和无线等方式连通的全球Internet。第十二页,共一百二十二页,2022年,8月28日二、计算机网络的分类:(按分布距离的长短)1、局域网(LAN):将有限范围内的各计算机、终端和外部设备互联成网。可分为共享式和交换式两种。最大距离不超过10KM。特点是容易管理与配置,拓扑结构简洁整齐,传输速率高、延迟短、成本低、应用广、级网方便、使用灵活。例如图书馆网络。2、城域网(MAN):将现有的局域网互连起来的一种规模较大的城市范围内的网络。范围为几十公里。3、广域网(WAN):一种跨城市、地区甚至国家的远程网络。采用分组交换技术,点对点通信技术。4、互联网(Internet):将不同的物理网络技术按某种协议统一起来的一种高层技术。第十三页,共一百二十二页,2022年,8月28日三、Internet在中国的发展1986年拨号到欧洲一些国家,1994年4月正式接入Internet网。四个骨干网:中国公用计算机互联网(Chinanet)中国教育与科研计算机网(Cernet)中国科技计算机网(Cstnet)中国金桥互联网(ChinaGBN)第十四页,共一百二十二页,2022年,8月28日四、Internet相关概念1、传输控制协议/网间协议(TCP/IP)传输控制协议/网间协议:(TransmissionControlProtocol/InternetProtocol/TCP/IP)是Internet的基础协议。是不同型号的计算机和操作系统进行数据传输的一种规则。TCP/IP协议好比因特网上一种公共语言,使来自各个不同国家和地区的人们可以相互交流和建立联系。第十五页,共一百二十二页,2022年,8月28日2、IP地址为了保证Internet上的计算机(主机)在通信时能相互识别,TCP/IP协议要求Internet上任何一台计算机都有一个不允许重复的地址,这个地址就是IP地址(InternetProtocolAddress)。IP地址由四组数字组成,每组数字中间用点隔开,如:是的主机在Internet上的IP地址。图书馆购买的数据库的使用权限绝大多数通过IP控制。第十六页,共一百二十二页,2022年,8月28日3、WWWWWW(WorldWideWeb),译为万维网。是一种基于超文本(Hypertext)方式的信息查询工具。

WWW通过这种超文本的方式,把世界各地服务器上的信息连接在一起,图文并茂地显示在用户面前。

WWW基于以下几个基本概念:

超文本标记语言(HTML)超文本传输协议(HTTP)统一资源定位符(URL)浏览器(BROWSER)WEB服务器(WEBSERVER)第十七页,共一百二十二页,2022年,8月28日4、浏览器(Browser)浏览器是用户访问WWW的工具。与其它浏览器不同的是WWW浏览器不仅可以浏览简单的二进制文件,还可以浏览超文本标记语言中所能描述的图形、图像、声音、动画、表格以及进一步的连接信息。目前流行的浏览器主要有:NetscapeNavigator和MicrosoftInternetExplorer(简称IE)。第十八页,共一百二十二页,2022年,8月28日IE浏览器是目前应用最普遍的浏览器。通常计算机WINDOWS桌面上,可以找到上面的图标,这就是IE浏览器的标示。双击它可打开浏览器。第十九页,共一百二十二页,2022年,8月28日五、Internet的主要服务功能(1)电子邮件服务(E-mail)(2)文件传输服务(Ftp)(3)远程登录服务(4)万维网(5)电子论坛(BBS、Blog)第二十页,共一百二十二页,2022年,8月28日第四节网络信息资源一、网络信息资源定义(NetworkInformationResource)

指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷质的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源。随着因特网的迅速发展和普及,网络信息资源主要指放置在因特网上的信息集合,但并非包含所有因特网信息,而只是指其中能满足人们信息需求的那一部分。第二十一页,共一百二十二页,2022年,8月28日二、网络信息资源的类型1、依据信息源的信息内容则可将网络信息源分为以下类型:

(1)联机数据库各类数据库是联机存储电子信息源的主体,据统计,仅至1991年中期,世界上就有数据库7600个。目前,很多重要的数据库都已经联入Internet,仅DIALOG就有400多个。这些数据库包括各个学科,涉及各种文献的信息。第二十二页,共一百二十二页,2022年,8月28日(2)联机馆藏目录库目前Internet上的电子图书馆很多,国内外的许多图书馆都已经在网上提供服务。包括美国国会图书馆在内的许多著名公共图书馆、大学图书馆及学术机构的图书馆的馆藏机读目录库,通过网络对外开放,提供OPAC(图书馆联机公共目录查询系统)服务。第二十三页,共一百二十二页,2022年,8月28日(3)网络图书电子图书在Internet上越来越多,电子图书涉及的领域特别广泛,包括文学、艺术、科学、人文等各个领域。其中网上的电子词典、百科全书更是独树一帜。(4)网络报刊在Internet上,已有很多的电子期刊对用户提供服务。世界著名的《Times》、《Forbes》、《Science》、《Nature》等都有网络电子版。我国的很多刊物报纸也都已经上网提供服务。如:《人民时报》、《经济日报》第二十四页,共一百二十二页,2022年,8月28日(5)软件与娱乐游戏类网上的这类资源也很多,且大都是免费的。如Internet上有搜索引擎的介绍、语言帮助、幼儿教育之类的培训信息。而且随着远程教育的发展,这类信息的数量将大量增加。(6)动态性信息在Internet上有许多动态性信息,如BBS、广告、新闻时事等。第二十五页,共一百二十二页,2022年,8月28日三、文献信息网络检索工具网络检索工具,是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。

科研文献信息网络检索主要分为两种方式:

网络资源检索

专业数据库检索第二十六页,共一百二十二页,2022年,8月28日第五节网络资源检索方法

网络资源检索和数据库检索有相同之处,也有不同点,总的来讲,网络资源检索的目标是检索与要求相关的网站或网页,通过这些网站或网页所提供的信息来决定检索的最终选择。网络资源检索的方法主要有以下几种:

一、布尔逻辑检索大多数网络检索工具都支持布尔逻辑检索,即:用布尔逻辑算符来表达检索词之间的逻辑关系。

第二十七页,共一百二十二页,2022年,8月28日常用的布尔逻辑算符有:逻辑或(+,OR)逻辑与(*,AND)逻辑非(--,NOT)逻辑或(+,OR):表达检索词间的并列关系。可扩大检索范围,提高查全率。如:A+B,表明结果中含有A或B都为检索命中逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中

逻辑非(-,NOT):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A—B,表明结果是A中不包含B的那部分。第二十八页,共一百二十二页,2022年,8月28日逻辑或逻辑与逻辑非ABABAB第二十九页,共一百二十二页,2022年,8月28日第三十页,共一百二十二页,2022年,8月28日第三十一页,共一百二十二页,2022年,8月28日第三十二页,共一百二十二页,2022年,8月28日二、截词检索(通配符检索)又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。

检索系统不同,截词符也不同,常用的有:#,?,*等。

截词检索也是一般数据库检索中常用的方法。

截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。第三十三页,共一百二十二页,2022年,8月28日

1.右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。而在搜索引擎中,目前多只提供右截法。而且搜索引擎中的截词符则通常采用星号*。如educat*。相当于education+educational+educator。

若输入PY=199?,会把90年代的记录全部查出来。

第三十四页,共一百二十二页,2022年,8月28日2.左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。

3.中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。

第三十五页,共一百二十二页,2022年,8月28日4.复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。第三十六页,共一百二十二页,2022年,8月28日按截断长度可以分为有限截断和无限截断。1、.有限截断:是指允许截去有限个字符。例如“acid??”表示截去一个字符,它可检出acid、acids,但不能检出acidic、acidicity、acidity等词。又如comput????可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。

注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。

第三十七页,共一百二十二页,2022年,8月28日2、无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。

任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。

第三十八页,共一百二十二页,2022年,8月28日另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。并不是所有检索工具都能使用通配符检索,有些检索工具可以自动截词,如:Yahoo。第三十九页,共一百二十二页,2022年,8月28日第四十页,共一百二十二页,2022年,8月28日三、词组检索词组检索是将一个词组(通常用双引号“”括起)当作一个独立运算单元,进行严格匹配,以提高检索的精度和准确度,它也是一般数据库检索中常用的方法。

如:要检索“计算机网络”方面的网站或网页,可输入“computernetwork”。词组检索实际上体现了临近位置运算(Near运算)的功能,即它不仅规定了检索式中各个具体的检索词及其相互间的逻辑关系,而且规定了检索词之间的临近位置关系。第四十一页,共一百二十二页,2022年,8月28日几乎所有的搜索引擎都支持词组检索,并且都采用双引号来代表词组,如“信息教育”。但在Infoseek中,除了用双引号外,还使用了短横线“-”来代表词组,如digital-library-definition,区别在于以“-”表示的词组不区分大小写。

InfoSeek是1995年2月由InfoSeek公司推出的搜索引擎。2001年2月InfoSeek改用Overture的搜索结果。

InfoSeek公司后被Disney公司兼并,InfoSeek搜索引擎成为G的一部分,并采用Google的引擎技术。其网址是::

第四十二页,共一百二十二页,2022年,8月28日第四十三页,共一百二十二页,2022年,8月28日第四十四页,共一百二十二页,2022年,8月28日四、限制检索

限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。

1.字段检索:是把检索词限定在某个/些字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。

在搜索引擎中,字段检索多表现为限制前缀符的形式。第四十五页,共一百二十二页,2022年,8月28日属于主题字段限制的有:Title,Subject,Keywords,Summary等。

属于非主题字段限制的有:Image,Text等。字段限制也可以用缩写:

TI(题名)AU(作者)AB(文摘)JN(刊名)PY(年代)LA(语种)……如:information/TILA=english文摘=网络信息资源

第四十六页,共一百二十二页,2022年,8月28日作为一种网络检索工具,搜索引擎提供了许多带有典型网络检索特征的字段限制类型,如主机名(host);域名(domain);链接(link);URL(site);新闻组(newsgroup)和E-mail限制等。这些字段限制功能限定了检索词在数据库记录中出现的区域。由于检索词出现的区域对检索结果的相关性有一定的影响,因此,字段限制检索可以用来控制检索结果的相关性,以提高检索效果。在著名的搜索引擎中,目前能提供较丰富的限制检索功能的有AltaVista,Lycos和Hotbot等。第四十七页,共一百二十二页,2022年,8月28日

如:用标题字段检索时可输入标题字段的标示符,通常是英文词“title”加“:”构成。用URL字段检索时用输入“url”加“:”,冒号后面跟上检索式。如:检索标题为运动与健康方面的网页,可以输入:title:sportandhealth,冒号后不能有空格。并不是所有检索工具的标题字段检索都使用titlt,如:Yahoo的标题字段检索可使用“title”也可使用“t”。因此,要根据不同的检索工具的检索功能使用检索词或标示符。除常用的标题字段以外,还有域名字段、主机字段及出版物字段等。第四十八页,共一百二十二页,2022年,8月28日第四十九页,共一百二十二页,2022年,8月28日

2.使用限制符:用表示语种、文献类型、出版国家、出版年代等的字段标识符来限制检索范围。例如要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊,则检索式为:(microcomputer??/de,ti,abORpersonalcomputer/ti,ab)ANDPY=1999AND(LA=ENORFR)ANDDT=Serial

第五十页,共一百二十二页,2022年,8月28日

3.使用范围符号:

如:、Lessthan、Greaterthan、Fromto等,如查找1989~1999年的文献,可表示为:PY=1989:1999或者PY=1989toPY=1999

又如查找2000年以来的计算机方面的文献,可表示为computer??AndGreaterthan1999查找在指定的文摘号范围内有关地震方面的文献,可表示为earthquake?/635000-800000第五十一页,共一百二十二页,2022年,8月28日

4.使用限制指令:限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限制)、全限制指令(Limitall,它是在输入检索式之前向系统发出的,它把检索的全过程限制在某些指定的字段内)。

例如:LimitS5/328000-560000表示把先前生成的第5个检索集合限定在指定的文摘号内。又如:Limitall/de,ti表示将后续检索限定在叙词和题名字段。

上述几种限制检索方法既可独立使用,也可以混合使用。第五十二页,共一百二十二页,2022年,8月28日五、位置算符通过位置算符对复合检索词进行加工,限定词与词之间的位置关系,提高检准率。

(W)算符:表示该算符两边的检索词顺序排列,不能颠倒,且除空格和标点符号外,不能插入其他词或字母。

例:High(w)Strength结果:HighStrengthHigh_Strength在google,yahoo,baidu中,检索“产品(W)蒸馏”,都没有得到理想结果。第五十三页,共一百二十二页,2022年,8月28日

(nW)算符:允许两词间最多插入n个词例:Heat(1W)Combustion结果:HeatofCombustion

(N)算符:除空格和标点符号外,不得插入其它词或字母,但两词顺序可以颠倒。例:money(N)supply结果:moneysupplysupplymoney

(nN)算符:两词顺序可以颠倒,中间可以插入最多n个词。例:number(2N)theory结果:numbertheorytheoryofnumbertheoryofthenumber第五十四页,共一百二十二页,2022年,8月28日

六、加权检索加权检索:用专门符号规定某个检索词在检索结果中的权值

例:+environment表示关键词environment必须出现在结果中例:-truck表示关键词truck一定不能出现在结果中第五十五页,共一百二十二页,2022年,8月28日第六节网络资源检索工具搜索引擎一、搜索引擎的定义:

搜索引擎(SearchEngine)是INTERNET上完成各种信息检索任务的一种工具。广义上是指一种基于INTERNET的信息查询系统,包括信息抓取、信息管理和信息检索;狭义上是指一种为搜集INTERNET上的网页信息而设计的检索软件。它通过分析Web页面的标题并跟踪它们所含的具体信息,整理成含有站点及Web页的URL、关键字等信息的庞大数据库,并根据用户的检索请求,返回其需要的信息。第五十六页,共一百二十二页,2022年,8月28日二、搜索引擎的主要功能:1、在INTERNET上搜集信息;2、对搜集到的信息进行标引和分类等处理,并以此来建立或更新数据库;3、接受用户的访问,提供实时的检索服务。作为因特网上专门提供网上信息查询服务的网站,搜索引擎可以在浩如烟海的网站中迅速查找有效信息,具有强大的导航作用,已经成为人们上网时必备的工具。第五十七页,共一百二十二页,2022年,8月28日中文雅虎若比邻中文搜索引擎天网百度搜索客1.AltaVista()2.Excite()3.Webcrawler()4.Lycos()5.Opentext()6.Infoseek()7.Yahoo!()8.HotBot()10.Magellan()第五十八页,共一百二十二页,2022年,8月28日三、典型搜索引擎Yahoo

1、Yahoo简介

Yahoo!是世界上第一个搜索引擎,也是Internet最著名的查询系统,提供免费查询服务。

Yahoo!是由两名斯坦福大学电机工程博士生DavidFilo和JerryYang(杨致远,华人)于1994年开发的,并于1995年成立Yahoo!公司。

Yahoo!拥有第一流的Web目录和最佳的新闻链接以及许多附加服务,因而Yahoo拥有许多用户,每天约有400万人次访问,在短短的几年里,Yahoo就成为网上最热门的搜索工具,而且还为Internet增添了无穷魅力。第五十九页,共一百二十二页,2022年,8月28日Yahoo!对收集到的信息都进行严格的审核和分类,从而保证了内容馈乏的网站不会在Yahoo!中找到。如果用户的检索要求没有满足,Yahoo会自动将用户的检索要求转到Google进行查寻。在浏览器地址框键入即进入Yahoo!世界。第六十页,共一百二十二页,2022年,8月28日第六十一页,共一百二十二页,2022年,8月28日第六十二页,共一百二十二页,2022年,8月28日2、Yahoo搜索功能:

Yahoo!提供一些操作符用以对检索项的限定,主要包括以下几种:

(1)+:表示结果中必须包含这个词,如:+market检索表示检索结果中必须含有market一词。(2)-:表示限定检索字串一定不要出现在结果中,如:+market-survey表示检索结果中一定不包含有survey一词。注意“-”与词之间不能有空格。第六十三页,共一百二十二页,2022年,8月28日(3)词组检索:把检索词放在双引号“”中,则此检索词作为短语检索,如“AmericanMarketingAssociation”。若没有双引号则表示各单词为“或”的关系,即“+”功能。

(4)截词检索:通配符号用“*”,但词干部分必须有3个字母。

(5)字段检索:Yahoo允许两种类型的字段检索,title和url。

t:表示只查网站名称,如t:football,在网站名称中查football。u:表示只查询网址(url),u:football网址中含football。第六十四页,共一百二十二页,2022年,8月28日3、Yahoo搜索方式:

目录查询

普通搜索

高级搜索第六十五页,共一百二十二页,2022年,8月28日(1)Yahoo目录查询Yahoo的真正优势在于其分类目录的内容组织,其目录和分类系统比其它搜索引擎详细。Yahoo数据库有65,000篇HTML文献和其它Internet资源,共20多万个条目,提供优秀的主题浏览工具,对网站信息按主题建立分类索引,按字母顺序列出14个大类,每个大类所包含的子类有精炼的描述,每个子类有数以千计的相关Internet网站信息。

Yahoo的目录查询使用很简单,只要进入其主题分类界面,选定所查主题,逐级进入即可。如查科学技术,链接科学技术选项即可。第六十六页,共一百二十二页,2022年,8月28日第六十七页,共一百二十二页,2022年,8月28日(2)Yahoo普通搜索打开Yahoo!主页进入普通搜索界面,在窗口的对话框中直接输入关键词进行检索,此时将在Categories(类目);WebSites(网站);WebPages(网页);NewsStories(新闻故事);NetEvents(网络新闻);Images(图像);Products(产品)中进行。Yahoo!会从其数据库里检索符合条件的主题目录的Web站点,其结果依次为站点(TheWeb),目录(Directory),新闻(News),Products(产品),要想查看检索到的目录、站点和新闻,直接点击即可。第六十八页,共一百二十二页,2022年,8月28日第六十九页,共一百二十二页,2022年,8月28日第七十页,共一百二十二页,2022年,8月28日第七十一页,共一百二十二页,2022年,8月28日(3)Yahoo高级搜索(AdvancedSearch):高级搜索界面提供多种选择,包括搜索方式、搜索范围、时间范围以及显示结果数等,同时,还提供了检索词的逻辑组配方式,包括

逻辑与(includeallofthewords)词组检索(includethisexactphrase)逻辑或(includeatleastoneofthesewords)逻辑非(excludethesewords)第七十二页,共一百二十二页,2022年,8月28日第七十三页,共一百二十二页,2022年,8月28日第七十四页,共一百二十二页,2022年,8月28日第七十五页,共一百二十二页,2022年,8月28日第七十六页,共一百二十二页,2022年,8月28日第七十七页,共一百二十二页,2022年,8月28日4、Yahoo搜索结果:Yahoo!搜寻引擎会根据分类类目网站信息与关键字的相关程度来排列出相关的Yahoo!类目和网站。影响相关程度的因素有:与关键词相同的词的多少,相同的词愈多,表示相关程度愈高。(2)与关键词完全符合(ExactMatch),相关程度高于部分符合。(3)与关键词符合的词的位置。网站名称(或新闻标题)符合关键词的相关程度高于网址(或新闻内文)符合关键词的网站。(4)对新闻检索而言,新闻更新的时间也是搜寻结果排序的考虑要素,最新更新的新闻将优先列出。第七十八页,共一百二十二页,2022年,8月28日四、典型搜索引擎Google()1、Google简介Google由两位斯坦福大学的博士生LarryPage和SergeyBrin于1998年创立。GoogleInc.于1999年创立。Google通过自己的公共站点提供服务。Google收录的网站内容丰富,在主页中使用“I`mfeelinglucky”,“手气不错”按钮,可以使检索直达与关键词最相关的网站中,这是该搜索引擎的一个特色。Google包含20多亿网页,搜索速度快。现在,Google每天提供1.5亿次查询服务。第七十九页,共一百二十二页,2022年,8月28日第八十页,共一百二十二页,2022年,8月28日

2、Google搜索功能:自动使用“and”进行查询:不需在关键词之间加上逻辑算符“and”或“*”,关键词之间“空格”表示逻辑关系与。忽略词:Google会忽略最常用的词和字符,这些词和字符称为忽略词。Google自动忽略“http”,“.com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。

使用英文双引号可将这些忽略词强加于搜索项。第八十一页,共一百二十二页,2022年,8月28日截词检索:为提供最准确的资料,Google不支持截词(通配符*)搜索,即Google只搜索与输入的关键词完全一样的字词。

忽略大小写:Google搜索不区分英文字母大小写,所有的字母均当做小写处理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的结果都一样第八十二页,共一百二十二页,2022年,8月28日搜索方式-目录搜索

Google目录搜索,按照主题分为若干类,其搜索方法与Yahoo!基本相似。第八十三页,共一百二十二页,2022年,8月28日搜索方式-基本搜索:进入Google的查询界面即为基本搜索,其搜索简洁方便,仅需输入关键词并按回车键(Enter),或单击“Google搜索”按钮即可得到最相关的内容。第八十四页,共一百二十二页,2022年,8月28日第八十五页,共一百二十二页,2022年,8月28日第八十六页,共一百二十二页,2022年,8月28日第八十七页,共一百二十二页,2022年,8月28日第八十八页,共一百二十二页,2022年,8月28日搜索方式-高级搜索(AdvancedSearch):点击“高级搜索”即可进入高级搜索界面,高级搜索界面提供多种选择,包括搜索方式、搜索范围、时间范围以及显示结果数等。同时,还提供了检索词的逻辑组配方式包括:逻辑与(包含以下全部的字词)词组检索(包含以下的完整字句)逻辑或(包含以下任何一个字词)逻辑非(不包括以下字词)第八十九页,共一百二十二页,2022年,8月28日第九十页,共一百二十二页,2022年,8月28日第九十一页,共一百二十二页,2022年,8月28日Google的特殊功能:查找PDF文件:除一般网页外,Google现在还可以查找文档格式为PDF的文件。如果某个搜索结果是PDF文件而不是网页,它的标题前面会出现以蓝色字体标明的[PDF]。这样,用户就知道需要启动AcrobatReader程序才能浏览该文件。单击[PDF]右侧的标题链接就可以访问这个PDF文档。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论