搜索引擎课件_第1页
搜索引擎课件_第2页
搜索引擎课件_第3页
搜索引擎课件_第4页
搜索引擎课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

搜索引擎邮箱:

10/6/20231搜索引擎7/29/20231概念以及原理Seachengine:根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和储存以及处理后,为用户提供检索服务的系统是一种用于检索互联网的软件系统表现形式:网站和网站的检索入口10/6/20232概念以及原理Seachengine:根据一定的策略,运用特工作原理构成:

搜索器:承担网络数据的抓取功能,负责访问各种站点,在互联网中搜索发现和收集信息,取回web网络信息。索引器:对搜索到的信息进行整理,在文档中建立一种便于检索的数据结构,即索引检索器:一般是一个web应用程序,获取用户指定的搜索规则,查询索引库,提供排序的搜索结果返回用户接口:提供可视化查询输入和结果输出原理:网页信息的储存和输出10/6/20233工作原理构成:7/29/20233分类

按照搜索引擎的内容组织分类全文搜索引擎(fulltextseach):用户能够对各网站的每个主页中的每个词进行搜索。目录搜索引擎(indextextseach):用人工方式将所收录的站点进行分类而建立数据库,以提供查询。10/6/20234分类按照搜索引擎的内容组织分类7/29/202按照工作机理划分独立搜索引擎:自建数据库,提供基于自身索引库的查询服务集成搜索引擎(元搜索引擎):多个独立搜素引擎的组合,没有自建数据库,只有将多个搜索引擎集中在一起提供一个检索界面。10/6/202352按照工作机理划分7/29/202353按照搜索引擎检索的网络资源不同而分类Web搜索引擎

web的含义:(Worldwideweb)≠internet因特网络资源中Web资源是主流需要了解的几个web概念:HTTP(hypertextTransferprotocal)10/6/202363按照搜索引擎检索的网络资源不同而分类7/29/20236HTML(hypertextmakeuplanguage)URL(uniformresourcelocation)利用web浏览器,通过超链接(hyperlink)和统一资源定位器,可以方便的从一个网页到另一个网页,简单快速的浏览查找获取遍布全球的所需的web资源例::使用http协议,连接到因特网上地址为的计算机上获取index.htmp的信息。10/6/20237HTML(hypertextmakeuplangua非WEB资源搜索引擎网络论坛电子邮件(e-mail)translateprotocal)10/6/20238非WEB资源搜索引擎7/29/20238综合搜索引擎使用举例谷歌(goole)Google首席执行官埃里克-施密特访华时正式宣布,Google全球中文品牌名为“谷歌”,这是Google在全球范围内唯一一个非英文的名字。施密特自曝中文品牌“谷歌”来得很“蹊跷”,他用七巧板的方式,排出了中文品牌“谷歌”。“Google来到中国已有很多年,但却没有被中国人所熟悉的中文名称”,施密特在解释为什么要启动中文名称时讲到,“谷歌将更加贴近全球的中文语言用户,是播种与期待之歌,也是收获与欢愉之歌”,对于两个名称的关系,施密特称中文名称“谷歌”不会代替英文名称,我们希望中、英文名称能互为支撑。10/6/20239综合搜索引擎使用举例谷歌(goole)7/29/20232000年9月12日,Google宣布在G增加简体及繁体两种中文版本,开始为全球中文用户提供搜索服务。

·2004年9月10日,G推出简体中文版Google新闻。

·2005年,Google中国部门从位于北京建国门外的新华保险大厦搬至清华东门边上的科建大厦;此外,Google在北京财富中心还有一个办公点。

·2005年7月19日,李开复加盟Google,正式出任Google中国区总裁。同日,Google宣布将在中国设立研发中心。

·2006年1月,简体中文版Google新闻改名为“Google资讯”。

·2006年1月26日,Google正式启用中国大陆版Google专用域名“G”。

·2006年2月,路透社报道,Google在中国没有ICP牌照、涉嫌非法经营……[详细]2010年1月谷歌中国关闭10/6/2023102000年9月12日,Google宣布在G常用搜索引擎综合搜索引擎介绍10/6/202311常用搜索引擎综合搜索引擎介绍7/29/202311典型全文搜索引擎1)国外:(1)Google

Google是由两位斯坦福大学的博士生LarryPage和SergeyBrin在1998年创立的。可以说是目前世界上最大最全的搜索引擎,在搜索引擎市场上居龙头宝座地位。目前已经收集了超过30亿的网页,而且检索速度快,功能强大。现在,Google每天需要提供1.5亿次查询服务,而且每条搜索所用时间通常不到半秒。网易使用的是Google的网页搜索服务。10/6/202312典型全文搜索引擎1)国外:7/29/20231210/6/2023137/29/202313大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就会减慢,而Google却利用相互链接的PC来快速查找每个搜索的答案。这一创新技术成功地缩短了响应时间,提高了可扩展性,并降低了成本。这也是其他公司一直在效仿的技术。10/6/202314大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就网站排名Google检索到的网站排名是按照网站的被链接数量由高到低排列,不存在人为的干预因素。因此最先出现的往往都是质量较高的网站。PageRank技术:通过对由超过50,000万个变量和20亿个词汇组成的方程进行计算,PageRank能够对网页的重要性做出客观的评价。PageRank并不计算直接链接的数量,而是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。这样,PageRank会根据网页B所收到的投票数量来评估该页的重要性。

此外,PageRank还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么Google会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。10/6/202315网站排名Google检索到的网站排名是按照网站的被链接数量由主要功能手气不错

按下“手气不错”按钮将自动进入Google查询到的第一个网页。您将完全看不到其它的搜索结果。如:输入中央电视台,会直接转到中央电视台的网站。网页快照

Google在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到Google将该网页编入索引时的页面。Google依据这些快照来分析网页是否符合您的需求。在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求Google删除其快照,这些网站也没有“网页快照”。自动使用“and”进行查询

Google只会返回那些符合您的全部查询条件的网页。不需要在关键词之间加上“and”或“+”。如果您想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。10/6/202316主要功能手气不错7/29/202316主要功能逻辑或用OR(大写的)分别输入“鲁迅or周树人”和“鲁迅OR周树人”,所得到结果数量完全不同,因为前者要求网页中必须同时有“搜索引擎”和“历史”两个关键字,而后者则只要求其中之一就满足条件了,当然出现的结果数量差异就比较突出类似网页如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google会帮您找到其他与此网页网址相关的类似资料的网站。高级搜索1Link:表示语法返回所有链接到某个url的网页例如,“link:”将找出所有指向大连理工大学图书馆主页的网页。不能将link:搜索与普通关键词搜索结合使用。搜索所有指向华军软件园的链接:link:2指定网域site要在某个特定的域或站点中进行搜索,可以在Google搜索框中输入“site:”。例如,要在大连理工大学站点上查找“访问校内资源”的方法,可以输入:访问校内资源site:(注意:中间用空格,标点符号要用半角英文标点)10/6/202317主要功能逻辑或用OR(大写的)7/29/202317例:在中文教育科研网站上寻找关于朱自清的页面:朱自清site:3Inurl语法:语法中返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或网页中例:查找微软网站上关于windows2000的安全课题资料:inrul:securitywindowsite:intitle:在网页的标题进行查询图片intitle:九寨沟

related用来搜索的内容方面相似的网页10/6/202318例:在中文教育科研网站上寻找关于朱自清的页面:朱自清sit主要功能英文字典输入:“fy心理学”就可以检索出心理学的英文拼写。查找手机号码属地直接在检索词输入框输入手机号码即可。检索特定类型的文件如:搜索引擎:ppt

就可以检索到有关搜索引擎的教学课件。后面可以跟文件类型的扩展名,如:doc、pdf、xls、rtf、ppt等网络安全:doc10/6/202319主要功能英文字典7/29/20231910/6/2023207/29/202320地图搜索:10/6/202321地图搜索:7/29/202321Google的图书搜索2004年12月,Google宣布联手纽约公共图书馆、斯坦福大学、哈佛大学、密歇根州大学以及牛津大学,将这些图书馆的全部或部分馆藏扫描,制成电子版向全世界读者开放,有人把这一发展与印刷术的发明相提并论,并且认为这一信息革命将改变世界。搜索结果可以看到图书的目次信息,可在图书里检索相关内容,可免费看2页相关内容的全文,可链接到网上书店购买喜欢的图书。Google尊重知识产权,对于有版权的图书不能免费浏览全文。10/6/202322Google的图书搜索2004年12月,Google宣布联手图书搜索10/6/202323图书搜索7/29/20232310/6/2023247/29/20232410/6/2023257/29/20232510/6/2023267/29/20232610/6/2023277/29/202327例题:利用goole搜索引擎检索最近一年内教育科研相关网站上发布的有关“信息资源检索”方面的中文ppt10/6/202328例题:利用goole搜索引擎检索最近一年内教育科研相关网站上10/6/2023297/29/20232910/6/2023307/29/202330不用高级检索的情况下:编辑检索式:allintitle:信息资源检索site:10/6/202331不用高级检索的情况下:7/29/202331例题二用百度搜索引擎,查找“张五常”关于交易费用方面的经济学论文通过,进入百度搜索引擎主页(后面可跟doc/xls/ppt/pdf/ptf)直接输入:张五常交易费用10/6/202332例题二用百度搜索引擎,查找“张五常”关于交易费用方面的经10/6/2023337/29/20233310/6/2023347/29/202334目录搜索引擎常用引擎10/6/202335目录搜索引擎常用引擎7/29/202335目录搜索引擎10/6/202336目录搜索引擎7/29/20233610/6/2023377/29/202337元搜索引擎中文元搜索引擎

1、万纬搜索

据说是最早的中文元搜索引擎,还有学术论文以其作代表论述元搜索引擎。但现在貌似不可用了,速度慢且不说,搜索完成后,出来一句话:共查到N条记录符合字符串X本次取出1-0

没有结果,怎么玩!2、壹家搜

速度慢,动不动就宕掉了;标题都显示是“百度快照”。3、知合网的网页搜索

速度较慢,这个知合网的网页搜索,以前是综合百度、Google搜索结果的,但现在跟百度的结果完全相同。这样的话,有什么意义呢!10/6/202338元搜索引擎中文元搜索引擎

1、万纬搜索

据说是最早的中4、我要搜搜你首页上介绍说“综合了Baidu,Google,Yahoo的搜索结果”“结果比他们好一些”,但随意搜索几个词,很明显是比他们差很多。

搜“Google”,Baidu,Google,Yahoo排第一的都是Google的主站(G或G),而我要搜搜你排第一的是下载Google桌面,这个结果仅仅在百度排第五,Google、Yahoo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论