搜索引擎介绍 - 三峡大.ppt_第1页
搜索引擎介绍 - 三峡大.ppt_第2页
搜索引擎介绍 - 三峡大.ppt_第3页
搜索引擎介绍 - 三峡大.ppt_第4页
搜索引擎介绍 - 三峡大.ppt_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、可以分为搜索引擎介绍、网络信息资源分类、简单的两类茄子:一类是官方文件信息源中的信息:高质量、可靠的内容,一般是搜索平台,花钱方便使用。(例如CNKI数据库)是任何类型网站上的信息。也就是说,涵盖所有内容,参差不齐,通常通过搜索引擎搜索。注:科研所需的文献资料一般应通过图书馆网站上的各种数据库获得。网络信息资源分类(例如,取决于所采用的网络传输协议):WWW信息资源FTP信息资源(FTP:/) Telnet信息资源(远程医疗)用户服务组信息资源GOPHER信息资源、web搜索工具搜索引擎、internet具有丰富的信息资源。它已成为全球传播科学研究、教育、商业和社会信息的最重要渠道。我们如何在

2、信息的海洋中准确、快速地找到所需的信息?从20世纪80年代开始,人们开发了各种网络信息检索工具。1989年,万维网诞生了。WWW的资源已成为互联网的主流,越来越多的全球资讯网搜索引擎成为搜索网络信息资源的工具。所以我们在这里介绍WWW的搜索引擎。1,搜索引擎概述,本课程内容,1,搜索引擎概述1,常规搜索引擎简介2,搜索引擎的关键字语法规则3,谷歌和百度的搜索技术4,网络免费学术资源简介,搜索引擎概述-概念,1,搜索引擎(Seare搜索引擎也是一种web网站,)在万维网上,您可以字典主动搜索其他网站上的信息,并自动编制索引。也就是说,可以记录每个web页的URL地址,并在可用查询的索引数据库中按

3、顺序排列其索引内容。搜索引擎概述-类型,2,根据搜索引擎收集信息的方式和提供服务的方式,(1)全文搜索引擎(机器人搜索引擎)(2)基于目录的搜索引擎(3)元搜索引擎的本质区别:目录索引搜索引擎的数据数据库,全文搜索引擎的存储库存储了internet上每个网站所有网页的完整内容(威廉莎士比亚、模板、搜索词、搜索词、搜索词、搜索词、搜索词、搜索词、搜索词)、谷歌主页、百度主页、雅虎搜索主页、搜索引擎工作方式、互联网上网页信息检索、收集、信息提取和组织、构建索引库、)它们是通过从internet提取每个网站的信息(基于web文本)创建的数据库,用于搜索与用户查询条件匹配的相关记录,然后按特定排序顺序

4、将结果返回给用户,因此是实际的搜索引擎。外国的代表性是谷歌等。国内著名百度、专业搜索引擎提供的完整信息、专业搜索引擎工作原理、工作原理是网络机器人软件ROBOT,每天24小时不断访问网络上的网站,根据页面上的链接从一页跳到另一页,提取网页和标题。(阿尔伯特爱因斯坦、美国电视电视剧、美国电视电视剧检索到的网页信息存储在数据库中,用机器自动索引建立索引,创建索引库。)。1.1,Google搜索引擎简介,Google搜索引擎简介,Google创立于斯坦福大学博士生拉里佩奇(Larry Page)和赛吉布莱恩(Sergey Brin)牙齿1998年,是目前世界上最大、用户数、全球公认的最佳搜索引擎。网

5、站地址(.hk/)或(),根据Google搜索引擎,Google在英语单词“Google”中发生了变化,表示1后面有100个0牙齿的数字。谷歌代表了公司使用牙齿单词征服在线无穷无尽资料的野心。谷歌支持100多种语言,2005年增长到80亿页,整理网页,为全球用户提供方便的在线信息查询。Google概述,优点:信息量大,更新快,为用户提供最全面、最广泛的搜索结果。缺点:出现了很多没有相关的信息,必须降低其命中率,从结果中重新过滤。提供的查询结果重复链接更多。2006年四月在中国重命名“Google”,搜索路径(web、照片、视频、新闻、音乐等)、搜索路径、搜索门户、高级搜索页面、搜索功能、Goo

6、gle提供了两种茄子搜索方法:基本搜索和高级搜索。1、基本搜索2、高级搜索在搜索结果区域中,四种茄子匹配方法表示“and”、“精确短语搜索”、“or”和“not”。每个搜索框只能输入搜索词,不能输入运算符。对时间、语言、域等的限制也是可能的。基本搜索语法规则(记住第1,4条),(1)基本搜索:输入多个搜索单词,以空格分隔。默认值为AND匹配。最多可以输入10个搜索词。也就是说,在关键字之间自动添加AND,而不使用AND或符号。空格表示逻辑and。(2)逻辑“or”搜索:将多个搜索词连接到大写“OR”。高级搜索仍然包含具有大量OR逻辑关系的字段。(3)逻辑“非搜索”:搜索词前有减号“-”(减号前

7、必须有空格),逻辑“郑智薰”,不包含搜索词的网页搜索,基本搜索语法规则,(4)短语搜索:用半角双引号将短语或短语括起来,例如:“(5)谷歌不区分英语字符的大小写。“god”和“GoD”的搜索结果相同。不支持搜索“*”。(6)不支持“通配符”(*)搜索。也就是说,谷歌仅搜索与输入的关键字完全相同的单词,在基本搜索中限制搜索,(1)网站:在特定域或站点中限制搜索。命令格式:查询词网站3360域名示例:三峡旅游网站3360 com,意思是在商业网站上搜索包含“三峡旅游”牙齿的网站。基本搜索中的限制搜索,(2)intitle:是指在网页标题中限制搜索。命令格式:intitle:搜索词示例:意思是在in

8、title:王菲照片、网页上搜索包含“王菲照片”牙齿的网页。基本命令格式:关键字Filetype:档案类型示例:搜索文档Filetype:PPT,在网页上搜索包含“搜索文档”内容的PPT档案,在基本搜索中进行有限搜索,(4)在inurl 3360网页的url中搜索指定内容inurl后面的关键字是webURL中文称为统一资源定位器。命令格式:inurl:限定字符串搜索词示例:inurl:MP3宋周永表示宋周永可以出现在web页上的任何位置,MP3表示必须出现在web页的url中。例:搜索三峡旅游相关网站,用网站:限定三峡大学毕业论文格式,不限制搜索也能找到,但准确性低的方法:搜索词直接输入基本搜

9、索框。搜索结果=138000个,搜索王妃的照片(intitle:宋祖英的MP3音乐(inurl:MP3宋祖英),在论坛上确认教育技术博士点高中有什么(教育技术博士点inurl:bbs),搜索引擎会自动将中国寿司街分为中国人和寿司这两个搜索词进行搜索。(2006年搜索结果),第一种搜索方法在前10个中找不到答案(2006年结果),第二种搜索方法,用户自愿用空格分隔。搜索结果如下:积极使用空格的搜索效果。结果可以在第三次(2006年的结果)看到。第三种搜索方法,用半角双引号将短语或短语括起来。匹配正确的短语,用半角双引号括住“中国寿司”,然后输入搜索框。搜索结果(2006年结果)、2007年数据库

10、更新完成的搜索情况、数据更新完成的搜索情况、2011年二月搜索情况、高级搜索、高级搜索结果区域中提供的四个茄子逻辑匹配方法表示“与”、“精确短语搜索”、“。每个搜索框只能输入搜索词,不能输入运算符。还提供了语言、更新时间、搜索词位置、域等限制,可以通过“类似网页”搜索相关网站。将高级搜索、搜索范围限制为从特定网站排除特定网站的网页,将搜索限制为特定语言,以查找链接到指定网页的所有网页,从而查找与指定网页相关的网页。示例1:在Microsoft网站上查找windows2000的安全挑战资料。高级搜索,高级搜索介面,安全性,windows 2000,m,搜索结果,高级搜索的语义解释,1,包含以下内

11、容的单词:与单词之间的“and”关系相同,2,包含以下内容的完整单词33666 3:包含以下单词之一的:对应于单词之间的“or”关系4,不包含以下单词的:对应于单词之间的“not”关系。高级搜索示例,示例2:“写医学论文”方面的网页和PPT课件,包括以下所有单词,结果=1440,000个,“写医学论文”方面的PPT课件,PDF PPT DOC XLS SWF,搜索结果=620个,搜索结果=620个web快照:单击“web快照”即可。查找搜索功能:通过“手好”键完成。类似网页:除了PDF、DOC、PPT和xls文档外,Google现在还可以搜索shock wave flash(swf)、post

12、script(PS)和其他类型的文档。要仅查找PDF或Flash文件(而不是常规网页),只需搜索“关键字filetype:pdf”或“关键字filetype:swf”。例(1)流氓兔子filetype:swf (2)查找chalung cancer的pdf外语专业文献lung cancer filetype 3360 pdf, PDF文档,PDF单击“web快照”时,Google索引相应的网页时会显示该页面。百度的“首页快照”不全面。角色:根据这些快照分析网页的内容,大致了解是否满足要求。无限首页快照、首页快照、无限首页快照、Google的特殊功能、3

13、、位置搜索功能搜索方法很简单。直接向用户推荐与搜索提问词最相关的网站,提高搜索效率。通过“手艺好”功能键实现。例(1)找到“北京大学”,就可以直接去北京大学网站。位置搜索功能,手艺好,北京大学首页,谷歌的特殊功能,4,类似网站通过点击“类似网页”或在高级搜索介面“地区”输入所需网址,可以获得所有类似的网页。角色:了解这些网站的状态和介绍有助于提高搜索效率。例:查看武汉大学类似网站,点击类似网站,类似首页、类似首页结果、谷歌结果显示技术、谷歌搜索结果排序的核心技术是独创的网站级PageRankTM专利技术,根据网站连接的次数评价一页的重要性,决定排名顺序,使排名客观、公正等可用资金购买排名,有时

14、结果会失去定义。1.2,百度搜索引擎,百度搜索引擎介绍,百度搜索是留学学生回国创立的。1999年底在美国硅谷成立,从2000年1月开始在北京上海深圳相继成立百度网络技术(北京)有限公司和事务所。搜索范围涵盖中国大陆、香港、台湾、澳门、新加坡等中华地区和北美、欧洲的部分网站。目前拥有世界上最大的中文信息库。百度目前主要提供中文(简/繁体)网络搜索服务。百度首页,更多进入,更多搜索(字典、百科全书等),百度帮助文档,为此,请在“Filetype:”后输入DOC、XLS、PPT、PDF和RTF档案格式。例如,寻找有关张五章牙齿交易费方面的经济学论文。您还可以通过“交易费张五章filetype:doc

15、”,通过百度文档搜索介面(专业文档搜索、百度文档搜索介面、每张申请表格、搜索结果、基本搜索、基本搜索规则、多字搜索输入)进行搜索。在百度查询时不需要使用“AND”或“”符号。百度在空格分隔的多个单词之间自动添加“”。把最相关的网站列为前几名。高级搜索语法,1,intitle:将搜索范围限制为网页标题。例如,浏览网页标题中包含三峡大学的网页。查询格式:intitle:三元组注意,intitle:和后面的关键字之间不能有空格。高级搜索语法,2,网站3360将搜索范围限制在特定站点。在查询内容后添加“网站3360网站域名”以使用。例如,请注意,天网下载软件查询格式:MSN网站3360是“网站3360”后的网站域名为“网站3:”,而不是“http:/”牙齿。此外,网站:和网站名称之间不要空格。高级搜索短语,3,双引号-完全匹配输入的搜索词较长可能会导致百度分析并分割给定搜索结果中的查询词。如果你对这种情况不满意,可以试着不要分割百

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论