商丘做网站,商丘网站优化,商丘网络推广,商丘网络公司
当前位置:首页 > 新闻资讯 > 网站优化 >

商丘网站seo优化:搜索引擎蜘蛛是如何爬行与抓取页面的?

发表日期:2018-08-14 08:56聚圣源浏览次数: 本文关键词:商丘,网站,seo,优化,搜索引擎,蜘蛛,是,如何,

  搜索引擎蜘蛛,在搜索引擎系统中又被称之为“蜘蛛”或“机器人”,是用来爬行和访问页面的程序。

  今天,seo优化为大家带来的是《搜索引擎蜘蛛是如何爬行与抓取页面的》教程。希望对大家有所帮助。

商丘网站seo优化:搜索引擎蜘蛛是如何爬行与抓取页面的?

  一、搜索引擎蜘蛛简介

  搜索引擎蜘蛛,在搜索引擎系统中又被称之为“蜘蛛”或“机器人”,是用来爬行和访问页面的程序。

  ① 爬行原理

  搜索引擎蜘蛛访问网页的过程,就好比用户使用的浏览器。

  搜索引擎蜘蛛向页面发出访问请求,该页面的服务器则返回该页面的HTML代码。

  搜索引擎蜘蛛将收到的HTML代码存入搜索引擎的原始页面数据库中。

  ② 如何爬行

  为了提高搜索引擎蜘蛛的工作效率,通常采用多个蜘蛛并发分布爬行。

  同时,分布爬行还分为两种模式:深度优先和广度优先。

  深度优先:沿着发现的链接一直爬行,直到没有任何链接。

  广度优先:先这一页面上的所有链接爬行完毕之后,才会沿着第二层页面继续这样爬行。

  ③ 蜘蛛必遵守的协议

  搜索引擎蜘蛛在访问网站之前,都会先访问网站根目录下的robots.txt文件。

  搜索引擎蜘蛛不会去抓取robots.txt文件中禁止爬行的文件或目录。

  ④ 常见搜索引擎蜘蛛

  百度蜘蛛:Baiduspider

  谷歌蜘蛛:Googlebot

  360蜘蛛:360Spider

  SOSO蜘蛛:Sosospider

  有道蜘蛛:YoudaoBot,YodaoBot

  搜狗蜘蛛:Sogou News Spider

  必应蜘蛛:bingbot

  Alexa蜘蛛:ia_archiver

  二、如何吸引更多搜索引擎蜘蛛

  互联网信息爆炸,搜索引擎蜘蛛不可能将所有网站的所有链接全部爬行到,那么如何吸引更多的搜索引擎蜘蛛到我们网站上来爬行变得非常重要。

  ① 导入链接

  无论是外部链接,还是内部链接,只有有导入,才能被搜索引擎蜘蛛知道该页面的存在。所以,多多做外链建设有助于吸引更多蜘蛛来访。

  ② 页面更新频率

  页面更新频率越高,搜索引擎蜘蛛来访的次数也会越多。

  ③ 网站和页面权重

  整个网站的权重以及某一页面的权重(包括首页也是页面)影响着蜘蛛的来访频率,权重高、权威性强的网站一般都会增加搜索引擎蜘蛛的好感。

  ④ 与首页的距离

  首页>一级目录>二级目录>三级目录>四级目录…很显然,目录越深蜘蛛来访的几率和次数就会越少,因为一般外链都是指向首页的,首页再向下爬行,只会越来越少。

  这里给大家的建议是,做外链的时候,不要只做首页外链,偶尔做一做栏目和聚合页面的外链也还是不错的哦~

  有些时候,URL短,蜘蛛可能也会觉得这个链接的权重哦,所以,最好只做一级栏目,然后就是文章页面。

  三、搜索引擎蜘蛛地址库

  搜索引擎蜘蛛有一个专门的地址库,用来存放已经被发现的URL(已被抓取和未被抓取的都算,只要是被发现的URL都算),这样就不会出现重复爬行和抓取页面的情况了。

  ① 地址库URL来源

  蜘蛛抓取的页面中发现的新的URL;

  站长后台自主提交的URL;

  站长后台提交的XML地图中的URL;

  站长后台提交的网站URL;

  ② 对于未被抓取的URL

  对于未被抓取的URL,不管是以什么方式获取的,哪怕是搜索引擎蜘蛛自己发现的,也会先放入地址库中,然后在做统一抓取。

  四、页面数据存储

  搜索引擎蜘蛛将抓取的页面数据会存入搜索引擎的原始页面数据库中,其实,就可以理解为快照中看到的页面数据,和用户看到的是一样的,每一个页面的URL地址都有一个唯一的编号。

  五、复制内容检测

  搜索引擎蜘蛛在爬行的过程中,会进行一定程度的复制内容检测。如果是权重低的网站上,发现了大量的转载或抄袭内容时,可能会停止爬行,这些页面可能也会不抓取与收录。

  但并不是说网站就不能转载,像一些权重很高的平台,哪怕是转载了一篇旧闻排名也可以很好,因为搜索引擎蜘蛛可能会觉得,就算是旧闻可能也是高质量的吧。

  以上就是seo优化为大家带来的是《搜索引擎蜘蛛是如何爬行与抓取页面的》教程。感谢您的观看。

如没特殊注明,文章均来自网络! 转载请注明来自:http://www.jushengyuan.com.cn/news/wzyh/10237.html

网站设计案例推荐

热门文章

商丘做网站的公司:展柜设计网...

网络推广人员在进行SEO优化这一长期而系统的工程时,会出现一些在日常生活中常见但与优化中的意义完全不同的词语,读来让人倍感神秘而又十分有趣,现在就让小编带你去感受一下这些“神...

日期:2018-04-19 浏览次数:2218

2018年发博客外链对SEO还有效果吗...

博客群发软件可以让SEO外链员轻松了不少,自动或半自动化操作确实很方便。然而,随着百度算法的更新,这些博客群发软件产出的外链变得毫无价值,被称为了垃圾外链,不仅对网站...

日期:2018-03-19 浏览次数:2084

商丘SEO指南:如何快速制定一份...

如果你是一家初创公司,这意味着你的资源有限,当然你迫切需要客户,又想低成本的获取潜在的用户,那么最好的选择就是搜索引擎优化,其实它并不复杂,自然搜索流量往往会带来...

日期:2018-07-25 浏览次数:1528

SEO外链优化策略:你还只看重收...

经常听到有人说SEO外链操作没用了,反正不管有没有用,岑辉宇依然每天坚持给自己的博客发布外链,效果的话仁者见仁智者见智了。很多人觉得发布外链没有用的原因,可能是因为搜...

日期:2018-03-12 浏览次数:1446

关于如何做好企业站SEO的日常工...

所谓知己知彼百战不殆,首先一定要知道自家站点的SEO综合信息,知道目前站点收录怎么样,当前的主词百度排名,友链状态,外链情况,另外可以用第三方的统计代码来查看自家站点...

日期:2018-09-19 浏览次数:1396

相关文章

百度收录越多,网站排名就越高...

项目招商年末回馈 入驻既享多重推广福利 在做SEO的历程中,我们常常谈判论网站收录的题目,许多早期的SEO从业职员,常常会有一个误区,那就就是网站收录越多,排名就会越好。 而...

日期:2018-12-26 浏览次数:160

给零基础自学SEO新手的八大建议...

抢!抢!抢! 双12大促项目招商整年只需4999 随着当下互联网的不停生长,许多人也渐渐打仗了SEO行业,有的是在企业当网络推广员,有的是本身在创业,因此就有许多人想要学习SEO,...

日期:2018-12-22 浏览次数:82

网站SEO优化中必须掌握的10个基...

抢!抢!抢! 双12大促项目招商整年只需4999 许多站长历尽艰辛好不轻易做好了一个网站,但却由于操纵失误,而导致网站迟迟没有排名及流量,大概是网站做了好久,却没有任何变革...

日期:2018-12-22 浏览次数:85

SEO优化时如何选择合适的关键词...

抢!抢!抢! 双12大促项目招商整年只需4999 好推建站以为SEO优化是最紧张的事情之一,也是始终贯串在优化历程中的一项事情,就是对要害词的优化。而要害词优化是否能到达精良的...

日期:2018-12-22 浏览次数:89

如何理解“跳出率”,它对SEO有...

抢!抢!抢! 双12大促项目招商整年只需4999 跳出率是搜刮引擎优化专家,多年以来热衷讨论的话题,特殊是在权衡企业网站相干产物转化率的时间,有偏重要的参考代价,但在以往的...

日期:2018-12-22 浏览次数:70

随机推荐

第一次做Google SEO,如何才能做好...

民权新媒体:百度熊掌号内容源同...

冰桶算法再更新,百度搜索全力...

seo的文章你真的会写吗?...

隐藏在自然排名中的百度推广...

一个知名问答社区的简单SEO方案...