全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
最近百度似乎在做一些更新调整,很多站长抱怨百度收录困难!甚至在寻找了大量链接后百度都不收录你的站,是不是百度真的不愿意收录新站呢?可能确实做了一些调整,但是应该是站长方法不对。下面我给大家讲讲搜索引擎收录过程,并且用一个案例来说明怎么让百度更快的收录你的网站。搜索引擎收录过程:1、抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 2、处理网页 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。 3、提供检索服务 用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 这是摘自的一段总结:首先蜘蛛读取抓取站点的URL列表,取出一个站点URL,将其放入未访问的URL列表(UVURL列表)中,如果UVURL不为空刚从中取出一个URL判断是否已经访问过,若没有访问过则读取此网页,并进行超链分析及内容分析,并将些页存入文档数据库,并将些URL放入已访问URL列表(VURL列表),直到UVRL为空为止,此时再抓取其他站点,依次循环直到所有的站点URL列表都抓取完为止。如何更快被百度收录:先给大家看个成功案例(图一),当天建立的网页当天被收录。另外还有几个案例,我不一一截图了,最快有个域名我当天晚上7点多才注册的,更晚些时候就被收录了,我给大家一个方法,大家可以按照此方法做:1. 建立一个单页面,从百度百科找一段关于网站关键词的介绍,再去其他地方找另外一种介绍。如网站做SEO,就找SEO在百科的解释,再去维基百科找找seo的介绍,二者结合拼凑成一个单页面;2. 单页面命名为index.htm或者default.htm,成为网站的首页。再去百度的登录入口去登录一次你的网站:/search/url_submit.html3. 无需任何外部链接,最多两天后你将在搜索引擎看到你的网站在当天就被收录了!比如 你27日登录的,虽然百度可能27日就收录了你的站,但是你可能需要再过一两天才能看到被收录。/ 4. 以上方法我已经测试了数十个域名,屡试不爽!收录后再改版你的网站吧最后给大家一些收录的建议:核糖体/ 1. 收录前就把首页title的关键词定义好,避免更改关键词太快,引起搜索引擎反感2. 主动去登录你的网站,而不需要急着去找任何外部链接(新站的目标是被收录)3. 安装好搜索引擎工具条/ 4. 单页面文件不要太长太大,100K以内最好5. 随时关注收录情况,去搜索新站的网址或者site一下问题:我如何在 Sitemaps 中表示网址? 对于所有 XML 文件,任何数据数值(包括网址)都应使用以下字符实体转义码:& 符号 (&)、单引号 ()、双引号 ()、小于 ()。还应确保所有网址遵循 RFC-3986 URI 标准、RFC-3987 IRI 标准以及 XML 标准。如果您要使用脚本来生成网址,通常可以使用网址转义的方式将其转义为该脚本的一部分。并且您仍然需要对它们进行实体转义。例如,以下 Python 脚本实体转义 /view?widget=3&count2 以下是引用片段:$python Python2.2.2(#1,Feb242003,19:13:11) importxml.sax.saxutils xml.sax.saxutils.escape(/view?widget=3&count2) 以上示例所得网址为:/view?widget=3&count>2 问题:使用哪种字符编码方法生成 Sitemaps 文件有关系吗? 是的。您的 Sitemaps 文件应该使用 UTF-8 编码。 问题:如何指定时间? 对此协议中的 lastmod 时间戳以及所有其他日期和时间,请使用 W3C Datetime 编码。例如,2004-09-22T14:12:14+00:00。 此编码允许您省去 ISO8601 格式的时间部分,例如:2004-09-22 也是有效的。然而,如果您的网站频繁更改,则鼓励您使用时间部分,以便抓取工具可获取关于您网站的更全面的信息。 问题:如何计算 lastmod 日期? 对于静态文件,这是实际的文件更新日期。可以使用 UNIX 日期命令获取此日期:以下是引用片段:$date-iso-8601=seconds-u-r/home/foo/www/bar.html 2004-10-26T08:56:39+00:00对于许多动态网址,您可以根据基本数据的更改时间或使用一些基于定期更新(如果可行的话)的近似值轻松地计算 lastmod 日期。使用一个近似日期或时间戳就可以帮助抓取工具避免抓取还未更改的网址。这将降低 Web 服务器的带宽和 CPU 要求。 问题:我将 Sitemaps 放在哪里?强烈建议将 Sitemaps 放置在 HTML 服务器的根目录中,即,将其放置在 /sitemap.xml.gz。 在某些情况下,您或许会希望在网站上针对不同的路径创建对应的 Sitemaps 例如,如果在您的组织中,安全许可对应不同目录划分上传权限。 我们认为如果您有上传 /path/sitemap.xml.gz 的许可,那么您也可以通过 /path/ 报告元数据。 问题:我的 Sitemaps 可以有多大? Sitemaps 在压缩时不应超过 10MB(10,485,760 字节),且最多可以包含 50,000 个网址。也就是说,如果您的网站包含的网址超过 50,000 个或 Sitemaps 大于 10MB,您需要创建多个 Sitemaps 文件,并使用 Sitemaps 索引文件。即使您的网站较小,但计划的网址数量超出 50,000 个或文件大小超过 10MB,也应使用 Sitemaps 索引文件。 问题:我的网站拥有数千万个网址;我可以采用某种方式只提交最近更改过的网址吗? 您可以在少数频繁更改的 Sitemaps 中列出已更新的网址,然后使用 Sitemaps 索引文件中的 lastmod 标记验证这些 Sitemaps 文件。随后,搜索引擎即可逐步抓取(只抓取)这些已更改的 Sitemaps。 问题:创建 Sitemaps 后会发生什么? 在创建 Sitemaps 后,您需要通知搜索引擎 Sitemaps 的位置。得到通知的搜索引擎就可以检索您的 Sitemaps 并使网址可以由抓取工具抓取。 问题:需要完整地指定 Sitemaps 中的网址吗? 是的。您需要在网址中提供协议(例如,http)。如果 Web 服务器有要求,您还需要提供尾随斜线。例如,/ 是有效的 Sitemaps 网址,而 则不是。 问题:我的网站有“http”和“https”两个网址版本。需要把它们都列出来吗? 否。请在您的 Sitemaps 中只列出一种版本的网址。包含多个版本的网址可能导致抓取工具无法完整抓取您的网站。问题:我网站上的网址中包含会话 ID 号。需要将其删除吗? 是的。网址中包含会话 ID 号可能导致网站抓取不完整以及重复抓取。 问题:Sitemaps 中网址的位置是否会影响它的使用? 否。网址在 Sitemaps 中的位置不会影响搜索引擎对它的使用或识别方式。问题:我们网站上的一些网页使用框架。我们应该提供框架组网址或框架内容的网址吗? 请将两种网址都包括进来。问题:可以压缩 Sitemaps 吗?或者需要以 gzip 压缩吗? 请使用 gzip 压缩您的 Sitemaps。 问题:XML Sitemaps 中的“priority”提示会改变我的网页在搜索结果中的排名码? 否。Sitemaps 中的“priority”提示只表示在您网站上,某一特定网址与其他网址的相对重要性。 问题:有可以用作 XML Sitemaps 验证依据的 XML 架构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版房地产开发幼儿园项目规划设计合同
- 生产工厂销售合同范例
- 模具规格合同范例
- 2024大鹏租赁合同租赁合同合同
- 2024年度教育培训预付款垫付合同
- 浙江省金华市东阳市江北五校联考2024-2025学年八年级上学期11月期中数学试题(解析版)-A4
- 小型年会策划方案(3篇)
- 2024年学生会宣传部工作计划书模版(3篇)
- 煤矿技改合同范例
- 2024年度航天器发射与数据服务合同
- dzz4四、六要素自动气象站用户手册
- EMS能源管理平台用户手册
- YY/T 1493-2016重力控制型腹膜透析设备
- GB/T 8685-2008纺织品维护标签规范符号法
- GB/T 4435-2010镍及镍合金棒
- GB/T 21661-2008塑料购物袋
- GB/T 19914-2005射钉弹
- 中国少先队史(原创)
- 2023年初二语文备课组小结
- 《第8课 画一幅简单的画课件》小学信息技术甘教课标版四年级下册课件39027
- 数学王子-高斯课件
评论
0/150
提交评论