实践四典型搜索引擎训练_第1页
实践四典型搜索引擎训练_第2页
实践四典型搜索引擎训练_第3页
实践四典型搜索引擎训练_第4页
实践四典型搜索引擎训练_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实践四典型搜索引擎训练 1信息工具与资源实践内容 实践3.1:搜索引擎高阶利用(实践1学时)(1)通过上机实践掌握Google、Baidu的初高级检索功能和一些特色功能;(2)通过上机实践掌握学术搜索的途径和方法; 2一知识点回顾搜索引擎, Search Engine是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息的一种工具。由搜索模块,索引模块,检索模块和用户接口四个部分组成, 从检索系统来看它实质是对 WWW 站点资源和其它网络资源进行标引和检索的一类检索系统机制。参见教材13.2.13一

2、知识点回顾参见教材13.2.1搜索引擎的原理,可以看做三步:从互联网上抓取网页建立索引数据库在索引数据库中搜索排序。 搜索引擎并非直接搜索互联网,也是搜索它的索引数据库。 索引数据库的更新速度直接影响搜索引擎是否可以搜索到最新的资料。4常用搜索引擎的搜索技巧比较baidugoogle雅虎搜狗搜索技巧?-实践重点5百度的高级检索逻辑与双引号逻辑或逻辑非逻辑与:空格或+, 如“计算机 防火墙”。逻辑或:| ,如“计算机 | 电脑” 。逻辑非:-, 例如,要搜寻“武侠小说”,但不含“古龙”的资料,则可输入“武侠小说 - 古龙”。百度不支持 “通配符”,要求所输入的关键词完整、准确,一字不差,才能得到

3、最准确的资料。6Google的高级检索逻辑与双引号逻辑或逻辑非46种语言246国家、地区参见教材13.2.2(P280-281)7Google的高级检索逻辑与双引号逻辑或逻辑非Google支持逻辑运算:在词前加上一个减号(“-”, 英文字符),在减号之前留一空格表示排除搜索某个词语;在关键词中间留空格,Google会在关键词之间自动添加“AND”;Google 不使用“词干法”、不支持“通配符”(*) 搜索;不区分英文字母大小写,所有的字母均当做小写处理;给词语加上双引号可进行短语精确搜索。Google将连字号、斜线、句点、等号和省略号当作短语连接符。Google允许用户直接在键盘上输入汉语拼

4、音来检索相关事物例如:输入sichuanfengjingmingsheng,检索结果提示:您是不是要找:四川风景名胜。用户在输入拼音时,字母中间不能留有空 ,否则Google会误认为是英文。 参见教材13.2.2(P280-281)8百度(baidu)高级搜索语法专业文档搜索“:”(DOC、XLS、PPT、PDF、RTF、ALL) 把搜索范围限定在网页标题中intitle把搜索范围限定在特定站点中site 把搜索范围限定在url链接中inurl 精确匹配双引号和书名号(加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分)要求搜索结果中不含特定

5、查询词减号语法9Google高级检索技术 具有特殊功能的查询字包括、define、site、cache 、info 、link,inurl,allinurl,intitle,allintitle。用于查找特定的文档,输入格式为:“关键词 :*”,*为文档类型,Google可以支持13种非HTML文件的搜索,包括PDF文档、icrosoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档;如输入“冒险岛”即搜索有关冒险岛的Flash文档。Define用于查看字词或词组的定义,输入格式为:“defin

6、e词 ”中间有一个空格,该操作符与您需要其定义的字词之间不留空格,如“define知识经济”即获得有关知识经济定义的列表。参见教材13.2.2(P281-282)10Google高级检索技术 Site用于表示在某个特定的域或站点中进行搜索,输入格式为:“关键词site:域或站点”, site后的冒号为英文字符,而且,冒号后不能有空格,如输入“留学site:”表示搜索中文教育科研网站()上有关留学的的页面。Cache在原始网页暂时不可用(比如该网页的服务器发生故障)时,用于检索该网页的cache版本。输入格式为“cache: 网页URL”,中间不能有空格,如“cache:” 显示Google主页

7、的cache页面。 参见教材13.2.2(P281-282)11Google高级检索技术 Info表示返回所有可供该特定URL使用的信息输入格式为“info: 网页URL”,中间不能有空格,如“info:” 将显示与Google主页相关的信息。 link表示将显示所有指向该网址的网页格式为“link: URL地址”。 “link:”后面无空格;如“link:”表示搜索Google中文 参见教材13.2.2(P281-282)12Google高级检索技术 具有特殊功能的查询字包括、define、site、cache 、info 、link,inurl,allinurl,intitle,allin

8、title。用于查找特定的文档,输入格式为:“关键词 :*”,*为文档类型,Google可以支持13种非HTML文件的搜索,包括PDF文档、icrosoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档;如输入“冒险岛”即搜索有关冒险岛的Flash文档。Define用于查看字词或词组的定义,输入格式为:“define词 ”中间有一个空格,该操作符与您需要其定义的字词之间不留空格,如“define知识经济”即获得有关知识经济定义的列表。Info表示返回所有可供该特定URL使用的信息输入格式为“in

9、fo: 网页URL”,中间不能有空格,如“info:” 将显示与Google主页相关的信息。 link表示将显示所有指向该网址的网页格式为“link: URL地址”。 “link:”后面无空格;如“link:”表示搜索Google中文 inurl表示搜索结果将被限定于那些在URL中包含该字的文件格式为“inurl:关键词”,“inurl:”后面不能有空格。如“inurl: 发现号”表示返回的网页链接中包含发现号的资料;如“inurl: photo Shuttle Discoverysite: ”表示在美国航空航天宇航局网站上搜索有关发现号航天飞机的照片;“inurl: photo发现号”表示在

10、网页上搜索有关发现号的照片;第一个关键词多采用资源名称如mp3、gallary、album、news、photo、image等,用第二个关键词确定具体专题。allinurl: 表示搜索结果将被限定于那些在URL中包含所有查询字的文件。 如, “allinurl: 布达拉宫 西藏”表示搜索结果为在URL中同时具有“布达拉宫”和“西藏”的文件。在您的查询中的每个字之前放置“inurl:” 等同于在您所有查询字之前加 “allinurl:”。 参见教材13.2.2(P281-282)13Google高级检索技术 intitle将搜索结果限定于那些在HTML标题中包含该字的文件。输入格式为:“inti

11、tle: 关键字关键字”,第二个词也可不输入,“intitle:”和字之间不能有空格。如“intitle:布达拉宫 西藏” 表示搜索结果为在HTML标题中提及布达拉宫,而在文件中的任何地方(既可以是标题也可以是文件的任何其他位置)提及西藏的文件。 allintitle 表示搜索结果限定在那些其HTML标题中包含所有查询字的文件中,如“ allintitle:布达拉宫 西藏”表示搜索结果为在HTML标题中同时包含“布达拉宫”和“西藏”的文件。在您的查询中的每个字之前放置 “intitle:” 等同于在您所有查询字之前加 “allintitle:”。 参见教材13.2.2(P281-282)14雅虎(yahoo)的搜索技巧如何使搜索结果中的查询词不被拆开?在查询词前后加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论