加载中...
搜索引擎原理都不懂,还谈什么软文引流,SEO优化?
返回列表
查看次数:61278次 发布日期:2017-8-17

生活中大家对于蜘蛛并不陌生,都知道蜘蛛是一种吐丝结网的爬行动物。那么你知道吗,在网络里也有一只,在网上爬行的蜘蛛。


百度,这个被大家熟知的网站,被戏称为:万能的百度,能搜前世今生。其实,你所搜索到的问题答案,就是百度养的一只名为baiduspider的蜘蛛带给你的。


baiduspider通常被站长们称为百度蜘蛛,是通过网站的链接地址爬行于整个网络,从一个页面到另一个页面,一只循环往复,爬行于整个网络。 在百度蜘蛛爬行过程中访问到的全部网站和网页便会记录下网址,把页面内容带回临时数据库储存,这个过程被称为抓取。一个新建网站要想让蜘蛛快点来访问你,来抓取你的网页,可以通过百度站长工具,来告诉蜘蛛你的网站链接地址,这样蜘蛛就会通过链接地址访问你的网站,或者也可以通过发送一些友情链接到各大网站,蜘蛛也会通过友情链接来到你的网站抓取你的网站内容。


百度蜘蛛把抓取到的网站内容从临时数据库进行筛选,符合规则要求的优质内容网站会存储到正式的索引库保存,而一些不符合规则要求的,被判定为垃圾网站页面的就会直接被删除,这个过程被称为过滤。比如一些网站,全部是图片页面,或者空白页面,还有的是注册页面,这些页面不能被蜘蛛识别,就会被判定为垃圾页面。蜘蛛本身无法识别图片,所以图片页面在精致也是无效的,空白页面就不用说了,页面什么内容都没有,肯定被删除的。这里说下注册页面,有的网站打开就跳出一个注册首页,其实是错的。蜘蛛本身是个程序,按照一定的规则进行选取,它可不会注册,所以不能识别。蜘蛛能有效识别的是文字,所以大家在建设网站时候要多引用文字、文章,这样你的网站才是一个高质量的网站。


百度蜘蛛会把存放在索引库中的优质内容按照类别进行整理、分类、归档,大概原理就像字典的索引目录,并且会根据网站的布局,内容质量的好坏等等一系列的规则进行一个序列排名。当用户进行搜索的查找的时候,就可以根据索引目录的分类,快速的找到相应的资料信息反馈给用户,方便用户使用阅读。更好,更精确快捷的满足用户需求。 排名优秀的会出现在百度搜索结果的首页第一位,这也是每个站长梦寐以求的位置。 站长们都在为这一个位置进行着不断的努力,不断的优化自己的网站,使得自己网站有个好的排名,这个就行为被称为SEO优化。 最后附上一张百度蜘蛛工作原理图,方便大家学习理解。


简单来说搜索引擎的工作原理分为四个流程:抓取—过滤—收录—排序 

一、抓取 百度蜘蛛(Baiduspider)抓取互联网上的网站内容,蜘蛛从URL开始爬,爬完一个URL后往下一个URL爬,尽可能抓取到更多的网页信息。 

二、过滤 对抓取回来的网页信息进行识别分析,对于一些空白内容页面、质量差的页面、没有价值的网页进行弃掉处理。 

三、收录 对抓取回来有价值的网页信息进行标记、归档,建立连接存储系统、网页存储系统。 

四、排序 当用户输入关键词搜索,百度对收录的网站进行网页质量、内容质量、关键词匹配程度、相关性评价,按照评价得分高低排名,展现给客户。

  • 蓝巢工作流
  • 协同办公
  • 企业邮局
  • 内部论坛
Copyright © 2016.BlueNested All rights reserved.      东莞蓝巢信息科技有限公司 2016/06  粤ICP备14098752号-1