SEO教程:搜索引擎优化-第1章-搜索引擎简述课件_第1页
SEO教程:搜索引擎优化-第1章-搜索引擎简述课件_第2页
SEO教程:搜索引擎优化-第1章-搜索引擎简述课件_第3页
SEO教程:搜索引擎优化-第1章-搜索引擎简述课件_第4页
SEO教程:搜索引擎优化-第1章-搜索引擎简述课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SEO 教程:搜索引擎优化基础实战入门第1章 搜索引擎简述本章导读本章主要讲解了搜索引擎的种类和搜索引擎的工作原理通过本章学习,读者对搜索引擎的工作流程将有一个大概的了解学习目标了解搜索引擎掌握搜索引擎工作流程掌握百度特效搜索技能要点掌握搜索引擎工作流程如何吸引搜索引擎蜘蛛来抓取页面掌握搜索引擎的抓取顺序实训任务模拟百度蜘蛛抓取页面提取文字测试百度特效搜索效果欣赏 1.1 了解搜索引擎 1.1.1 搜索引擎定义搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 1

2、.1.2 搜索引擎的种类 1国内搜索引擎市场份额如图 1-1 所示,图中为大家展示的是 2017 年 6 月国内主要搜索引擎的市场份额,其中:百度国内市场份额为 80.50%,排名第一(即最大) ;360 搜索排名第二,市场份额为 8.83%;神马排名第三,市场份额为 4.82%;搜狗搜索排名第四,市场份额为 2.50%;Google 排名第五,市场份额为 1.70%;必应排名第六,市场份额为 1.11%;图1-1 中的大部分搜索引擎大家都应该有所了解,这里重点讲解一下神马搜索。神马搜索是手机端UC 浏览器默认的搜索引擎,是 UC(优视)公司和阿里巴巴集团在 2013 年成立合资公司推出的移动

3、搜索引擎。图 1-1 2017 年 6 月国内主要搜索引擎的市场份额 2全球搜索引擎市场份额 图1-2展示的是 2017 年 4 月全球主要搜索引擎的市场份额,其中:Google 全球市场份额从 92.34%上升至 92.5%(0.16%) ,排名第一(即最大) ;Bing 排名第二,市场份额从 2.93%下降至 2.87%;(0.06%)Yahoo!排名第三,市场份额从 2.20%下降至 2.01%;(0.19%)百度排名第四,市场份额从 1.05%上升至 1.11%;(0.06%)Yandex 排名第五,市场份额从 0.73%下降至 0.71%。(0.02%)图 1-2 2017 年 4

4、月全球主要搜索引擎的市场份额1.2 搜索引擎工作流程 1.2.1 抓取模块1蜘蛛搜索引擎为了抓取互联网中的各种页面,必须有一个 24 小时自动抓取页面的程序,我们称这个程序为“蜘蛛” ,它在互联网中也被称为“机器人” 。百度的抓取程序我们一般称为百度蜘蛛,常见的有 Baiduspider、Baiduspider-mobile(抓取 wap)Baiduspider-image(抓取图片)Baiduspider-video(抓取视频)Baiduspider-news(抓取新闻) 。谷歌的抓取程序我们一般称为谷歌机器人,常见的有 Googlebot、Googlebot-Mobile(抓取 wap)

5、。360 的抓取程序我们一般称为 360 蜘蛛,常见的只有一个:360Spider。蜘蛛访问任何一个站点的时候都会访问网站根目录中的 robots.txt 文件。这个文件限制了搜索引擎蜘蛛的抓取范围,所有的蜘蛛都必须遵守这个文件中的协议。另外,我们可以从一些站点中的 robots.txt文件中查看搜索引擎蜘蛛的最新名称。 2跟踪链接(蜘蛛抓取顺序)为了抓取互联网中更多的页面,搜索引擎会根据网页中的链接从一个页面抓向另一个页面,就像蜘蛛在蜘蛛网上爬行一样,这也就是搜索引擎蜘蛛这个名字的由来。如图 1-3 所示,蜘蛛顺着一个 A 页面爬行到 A1、A2、A3、A4,直到页面没有链接之后就会返回 A

6、页面,然后爬行到另外一个页面;同样按照 B1、B2、B3、B4 的顺序抓取,有点类似于不撞南墙不回头的样子。这就是我们说的深度优先策略。图 1-3 深度优先策略 如图 1-4 所示,蜘蛛从 A 页面开始顺着链接爬行到 A1、B1、C1 页面,直到 A 页面上的链接都爬完之后,再从 A1 页面开始抓取下一层的链接页面,分别爬行到 A2、A3、A4这就是我们说的广度优先策略。图 1-4 广度优先策略在实际应用中,两种策略通常是互相混合使用的,这样可以抓取到互联网中更多的页面,特别是网站中内页深度比较深的一些页面。3如何吸引蜘蛛来抓取网站中的页面(1)权重越高、蜘蛛来得越频繁;(2)更新越快,蜘蛛来

7、得越频繁;(3)导入链接越多,蜘蛛来得越频繁;(4)与首页点击距离越小,蜘蛛收录得越快。网站建立初期,搜索引擎有可能是不知道咱们站点的,我们需要通过以下两个方法来告诉搜索引擎。 (1)加入百度站长平台,提交网址链接并在网站布置自动推送代码(见图 1-5) 。 (2)外部链接:我们可以在一些已经被收录的站点中放置我们自己的站点链接以此来吸引蜘蛛访问,可以发布软文也可以交换友情链接。图 1-5 百度站长平台提交网址链接4如何查看蜘蛛是否访问过站点 (1)百度站长平台蜘蛛抓取频次工具(见图 1-6) 。 工具地址:/pressure/index图 1-6 百度站长平台蜘蛛抓取频次工具 (2)服务器日

8、志。如果你的服务器开启了日志功能,通过网站日志可以清楚地得知用户在什么 IP、什么时间、什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功(见图 1-7) 。图 1-7 服务器日志 1.2.2 过滤模块由于互联网中存在大量的垃圾页面、复制内容页面和无内容页面,这些页面大大浪费了搜索引擎的服务器资源,对用户来说也是无用的。 所有搜索引擎为了避免这些垃圾页面占用自己的资源,同时也为了更好的用户体验,搜索引擎需要将蜘蛛抓取回来的这些页面进行过滤。搜索引擎在后台通过提取文字、中文分词、去停止词、去除重复内容等方法过滤掉垃圾页面。其中的去重大家尤为留意一下,同一篇文章

9、重复出现在不同的站点中或者同一个站点的不同网址中,搜索引擎是非常讨厌这样的内容页面的,甚至会被认为是垃圾页面。 1.2.3 收录模块凡是被搜索引擎认为有价值、对用户有用的页面,搜索引擎会将其存储到索引数据中,我们称之为收录模块。只有被搜索引擎存储到索引数据库中的网址才有可能参加排名。 1如何查看一个页面是否被收录 如图 1-8 所示,最常见的办法将页面的网址(URL)放到百度搜索框中,如果出现了该页面的搜索结果,那么就证明该页面已经被百度收录了(其他搜索引擎同理) 。图 1-8 百度搜索框 2如何查看一个站点的收录量 (1)最准确的方法就是通过百度站长平台查询。此种方法一般查询自己管理的站点(

10、见图 1-9) 。图 1-9 百度站长平台索引量查询 (2)如果查询别人的站点我们可以使用类似站长工具、爱站网之类的网站辅助我们查询,我们也可以通过 site 指令直接查询(见图 1-10) 。图 1-10 site 指令查询网站收录数量 1.2.4 排序模块 对存入搜索引擎索引库的页面,通过正排索引、倒排索引以及各种算法之后得到每一个页面的排名分数,根据所得分数将其进行排序,这就是我们看到的最终排序结果。1.3 百度特效搜索所谓的百度特效搜索指的是在百度中搜索某一个特定的关键词,会触发相应的事件,常见的有两种特效,即视觉特效和声音特效。 1.3.1 视觉特效 1黑洞 我们在百度中搜索“黑洞”时,效果如图 1-11 所示。图 1-11 百度中搜索“黑洞”效果 2翻转 我们在百度中搜索“翻转”时,效果如图 1-12 所示。图 1-12 百度中搜索“翻转”效果 1.3.2 声音特效声音特效没有办法在本书中体现,大家可以在百度中尝试搜索打雷、大风、布谷鸟等音效。 图1-13所示为百度中搜索“布谷鸟”效果,大家在搜索结果的上方会发现一行字:欢迎体验有声的搜索结果!图 1-13

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论