• 百度搜索引擎蜘蛛详解
  • 源码下载
    HTML源码 ASP源码 PHP源码 .NET源码 其他源码
  • 网站模板
    织梦模板 ShopEx模板 EcShop模板 Discuz模板 帝国模板
  • 网站素材
    字体下载 高清图片 网页模板 PSD素材 矢量素材
  • 网页特效
    返回顶部 图片代码 鼠标特效 菜单导航 HTML5特效
  • 站长资讯
    网站运营 建站经验 搜索优化 互联网
快捷导航

源码下载

HTML源码 ASP源码 PHP源码 .NET源码 其他源码

网站模板

织梦模板 ShopEx模板 EcShop模板 Discuz模板 帝国模板

网站素材

字体下载 高清图片 网页模板 PSD素材 矢量素材

网页特效

返回顶部 图片代码 鼠标特效 菜单导航 HTML5特效

站长资讯

网站运营 建站经验 搜索优化 互联网

软件下载

电脑软件 安卓软件 苹果软件

建站功具

WEB服务器 网页设计 FTP工具 建站辅助

建站教程

服务器教程 CMS教程 脚本之家
重庆站长网

模板PHPOK企业招聘人才博客微博人力资源

投稿中心
  • 重庆站长

  • 源码下载

  • 网站模板

  • 网站素材

  • 网页特效

  • 站长资讯

  • 软件下载

  • 建站功具

  • 建站教程

  • 程序插件

  • 网站基础

  • 帮助中心

HTML源码 ASP源码 PHP源码 .NET源码 其他源码 微擎微赞模块 VIP源码 淘宝客网站源码

织梦模板 ShopEx模板 EcShop模板 Discuz模板 帝国模板 WordPress主题

字体下载 高清图片 网页模板 PSD素材 矢量素材 免抠素材 PPT模板

返回顶部 图片代码 鼠标特效 菜单导航 HTML5特效 css3特效 日期时间 选项卡_滑动门 HTML5小游戏 动画效果 表单按钮 jquery特效

网站运营 建站经验 搜索优化 互联网

电脑软件 安卓软件 苹果软件

WEB服务器 网页设计 FTP工具 建站辅助

服务器教程 CMS教程 脚本之家

shopex插件 Discuz!插件 pjblog插件 wordpress插件 dedecms插件 ecshop插件 phpcms插件

HTML教程 DIV&CSS Javascript/Ajax Dreamweaver XHTML教程 W3C教程

关于我们 联系我们 广告服务 投稿指南 友情链接 积分金币规则 加入VIP会员

当前位置:重庆站长网 > 站长资讯 > 搜索优化 > 百度搜索引擎蜘蛛详解

百度搜索引擎蜘蛛详解

时间:2019-11-14 11:43:02 来源:用户投稿 浏览: 次

百度蜘蛛是不是越多越好呢?其实也不见得,得看是什么样的蜘蛛到达了我们的网站。今天,SEO百科网带来的是《百度蜘蛛是什么?百度搜索引擎蜘蛛详解-什么是搜索引擎》。希望对大家有所帮助。

2.9.1 百度蜘蛛是什么

百度蜘蛛,全称应该为“百度搜索引擎蜘蛛”,英文为“Baidu Spider”,是百度搜索引擎系统中的一个自动程序,主要负责访问并收集互联网上的页面。后面其他程序会进行分类整理并建立索引数据库,在用户在百度搜索时,会从索引数据库中调用数据,并呈现出程序认为最合适的排名结果页面。

2.9.2 百度蜘蛛的工作原理

1)百度蜘蛛是如何爬行的

百度搜索引擎蜘蛛访问(爬行)网站页面的过程和我们平时使用浏览器基本相同。

a、百度蜘蛛请求

百度搜索引擎蜘蛛发出页面访问的请求。

b、服务器响应

服务器返回HTML代码。

c、百度蜘蛛保存代码

百度搜索引擎蜘蛛将收到的代码保存至原始页面数据库中。后期其他程序会进行复杂操作,大部分优质内容会被放入索引数据库,一部分低质将会被忽略。

2)百度蜘蛛是如何工作的

百度搜索引擎蜘蛛为了提高爬行和抓取的效率,采用多个蜘蛛并发分布爬行。有两种策略。

a、深度优先

深度优先是顺着链接一直向前爬行,直到前面再也没有其他链接,然后返回第一个页面,沿着另外一个链接继续一直往前爬行。

b、广度优先

广度优先是指先爬行当前页面上的所有导出链接,然后再去爬行某一导出链接页面上的所有链接。

3)百度蜘蛛还做了哪些工作

a、深度优先对网站复制内容的检测

对于某些权重较低的网站复制内容过多,搜索引擎蜘蛛可能就不会再继续爬行。

b、不爬行与抓取地址库中的URL

百度搜索引擎建立一个地址库,如果url已经在地址库中,百度搜索引擎蜘蛛就不会重复去爬行与抓取,所以,百度蜘蛛在发现链接后,并不是马上去访问,而是先将URL存入地址库中,然后统一安排抓取。

4)通常地址库的URL有几种来源

a、百度搜索引擎蜘蛛抓取

主要来源之一。

b、站长sitemap提交

网站站长为了网站文章更快被搜索引擎所收录,通常会提交网站的XML地图给搜索引擎,XML地图包含了网站所有的链接。

c、站长提交网址

站长可以提交未被百度收录的网站首页或内容页。

d、百度工作人员主动录入种子网站

百度搜索引擎会把认为网站比较重要,比较有前途的网站主动人工录入。

2.9.3 怎么让百度蜘蛛每天抓取

秒收录是每一个站长的心愿,原来做到秒收录确实挺难的,可现在有了百度熊掌号,原创优质文章几乎可以达到秒收录,不过官方声明为1小时内收录。除了百度熊掌号外,还有几点可以吸引百度蜘蛛每天来抓取我们的网站。

1)页面更新频率

网站更新文章频率越高越好,前提是保证文章质量与原创比例的前提下。

2)导入链接

网站导入链接越多越好,前提是优质的导入链接,友链和单向外链均可。

3)URL结构

URL结构要扁平化,浅一些可能收录效果会更好。

4)网站权重

网站权重越高,蜘蛛来访越频繁,都是相辅相成的。

5)与首页的距离

文章页面最好与首页不要太远,如三级即可。

6)页面质量

文章质量一定要保证,原创优质文章也好,转载的文章也好,总之一定要优秀。

2.9.4 如何查看百度蜘蛛是否过来网站

可以通过查看网站日志进行分析。Windows服务器的IIS与Linux服务器的apache都有记录网站日志的功能。

2.9.5 如何辨别百度蜘蛛

百度官方给出的辨别百度蜘蛛的方法如下。

1)查看UA

首先要UA正确,百度公布过的UA有如下这些。

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

2)反查IP

可以通过dns反差ip的方法判断是否是百度蜘蛛,只要不是来自“. baidu . com”或“. baidu . jp”即为假冒的百度蜘蛛。

2.9.6 如何诊断百度蜘蛛是否能够正常抓取网站内容

百度seo教程认为很多网站因使用JavaScript代码或框架结构等问题,不能被百度蜘蛛所抓取。这里进行诊断也是为了防止蜘蛛来网站后,因为不能正常抓取而离开,导致网站收录很差,快照不更新等问题。

如果诊断结果有问题,则需要修正问题,提升与百度蜘蛛的友好度。

百度官方在线抓取诊断工具,选好网站(主页或其他页面)后,选择PC UA 或者移动UA,最后点击“抓取”即可。

稍等片刻,刷新页面会显示“抓取成功”,或者失败。可以点击查看“抓取成功”或失败的详细信息。

2.9.7 如何通过百度蜘蛛IP得知网站状态?

百度seo教程认为以下内容仅供参考。

1)抓取你网站的网页蜘蛛

60.172.229.61

61.129.45.72

61.135.162.*

2)百度竞价蜘蛛

61.135.165.134

117.34.74.66

118.122.188.194

119.63.196.9

125.39.78.185

3)百度统计的蜘蛛

61.135.186.*

4)站长工具的模仿的百度蜘蛛

61.147.98.146

61.188.39.16

113.98.254.245

117.21.220.245

117.28.255.42

5)搜外站长工具的模仿的百度蜘蛛

124.248.34.52

6)114站长工具箱模仿的百度蜘蛛

119.147.114.213

121.10.141.*

7)百度图片蜘蛛

123.15.**.**

8)抓取网站内页收录的权重较低的非原创,需要通过一段时间考察

123.125.71.*

9)站长工具检测造成的无用

125.90.88.*

10)百度考察期蜘蛛或降权蜘蛛

159.226.50.*

180.76.5.*

180.76.5.87

220.181.158.107

11)伪装百度蜘蛛

180.149.130.*

12)新站及站点有不正常现象

183.91.40.144

203.208.60.*

13)不间断巡逻各站就是路过

210.72.225.*

14)沙盒或者有被K站

123.125.68.*

218.30.118.102

220.181.68.*

15)此ip爬过的文章或首页,绝对24小时内放出来和隔夜快照

220.181.108.*

16)百度蜘蛛IP来过,准备抓取

123.125.66.*

220.181.7.*

17)度过新站考察期

121.14.89.*

18)百度抓取首页的专用IP,网站首页快照更新快,隔夜更新

220.181.108.95

19)百度的权重IP段,抓取的文章第二天放出来,权重较高

220.181.108.92

20)综合性权重IP,抓取文章和首页,权重较高

220.181.108.91

220.181.108.75

21)抓取内页收录的,但权重较低

123.125.71.95

123.125.71.97

123.181.108.77

123.125.71.106

22)抓取网站首页的,也属于权重段,权重较高。

220.181.108.89

220.181.108.94

220.181.108.97

220.181.108.80

220.181.108.77

220.181.108.83

220.181.108.86

以上就是SEO百科网带来的是《百度蜘蛛是什么?百度搜索引擎蜘蛛详解-什么是搜索引擎》。感谢您的观看。更多seo教程搜索“错误教程网”。原创文章欢迎转载并保留版权:https://www.cuowu.com/


本文标题:百度搜索引擎蜘蛛详解 - 搜索优化
本文地址:http://www.admin023.cn/news/ssyh/279.html

    (作者:佚名)   /   责任编辑:重庆站长网
    • 上一篇:平头哥SEO教程:五个步即可优化一个新网站
    • 下一篇:玩转百度经验,如何让关键词秒上百度首页
    • 收藏
    • 打印

    相关阅读

  • 什么是核心关键词?该如何选择核心关键词?

    每个SEO人员都会对核心关键词有一个自己的定义,百度核心关键词,一直以来都是人们讨论的话题,我们知道这是一个流量泛滥而又稀缺的时代,核心关键词的选择,则决定了我们对流量的选择...

  • 2019-11-14
  • 分析网站跳出率的原因及处理办法

    网站的跳出率高,意味着这个用户在网站停留的时间很短,也就意味着这个网站不够吸引力,那么网站跳出率高对于网站的搜索排名有何影响呢?今天 亚盘分析预测 就来聊聊这档子事...

  • 2019-11-14
  • 百度疑似取消熊掌号小图标

    最近,在使用百度的时候突然发现,很多网站已经不显示百度熊掌号,只有一些开通小程序的网站还保留了,目前还不清楚原因,也没有官方说法。 起初,以为是浏览器问题,后来测试...

  • 2019-11-14
  • 长尾关键词怎么挖掘?为什么没效果?

    网站添加关键词的时候基本都是让企业核心关键词放在网站首页,长尾关键词放在栏目和内页,于是好多的站长每天都去优化首页的关键词,从而无视了长尾关键词。但是长尾关键词也...

  • 2019-11-14
  • 「网站优化」收录和索引究竟“谁”是搜索引擎的“亲儿子”

    在网站SEO优化中,有一个非常重要的参考数据,也是评判一个网站优化是否做得好的一个数据,就是收录量。大部分搜索引擎收录量是可以用命令:site命令来进行查询的。【有些不了解...

  • 2019-11-14
  • 百度刷下拉框的工具原理及方式

    自从搜索引擎推广逐渐盛行以来,很多SEO推广人员纷纷研究出了多种推广方式,有搜索引擎排名优化方式,也有相关搜索方式,还有百度刷下拉框的方式进行推广。今天,QICQ博客就给大...

  • 2019-11-14
  • 长尾关键词挖掘方法和技巧

    现在做搜索营销营销业务的人员们,都在忙着挖掘长尾词,覆盖长尾词的排名。本文就是告诉你比较全面的长尾词挖掘方法,这些都是从业多年互联网营销而积累的方法,今天分享给大...

  • 2019-11-14
  • 新网站SEO优化怎样快速超过老网站?

    因为有同行做互联网营销效果不错,所以我们企业也想玩玩互联网营销推广,然而作为新手入行怎样快速超过同行呢?或者说怎样可以抢一块蛋糕呢? 守护袁昆一直专注于网站SEO优化,...

  • 2019-11-14

    资讯列表

    • 网站运营
    • 建站经验
    • 搜索优化
    • 互联网

    文章排行榜

    • 1 影响网站页面浏览量的因素有哪些
    • 2 百科外链时代终结:百度百科参考资料全部替换为百度快照
    • 3 解决DedeCms5.7更新软件不能上传图片问题
    • 4 大型强子对撞机首次加速原子:达到接近光速
    • 5 企业网站制作怎么样可以把握好用户体验
    • 6 网页文本排版知识:为正确的内容使用恰当的标签
    • 7 移动web端屏幕适配(rem)
    • 8 自身产品运营数据分析的5个步骤
    • 9 CSS基础入门教程之CSS id 选择器
    • 10 众盟数据蝉联创业邦中国创新成长企业100强

    热门标签

      魅族 魅族Flyme Facebook Facebook隐私 Faceboo 漏洞 HTTPS 融360 叶大清 融360法人 PHP8 JIT 荣耀10i 京东 京东汽车 汽车 电商 Ruby 恶意后门 代码
    返回
    顶部
    关于我们 联系我们 广告服务 投稿指南 友情链接 积分金币规则 加入VIP会员

    备案号:

    Copyright © 2016-2018 重庆站长网 版权所有

    ×