百度排名规则及算法(百度内部资料)

今天一个自称百度内部人士给我上了一门关于百度排名规则和算法的课程。刚听的时候,好像很疯狂。越到后面越觉得开了,可以分享给你。

百度给你的网站排名只有三个原因。第一,你给百度钱;第二,你是百度旗下的公司或产品;第三,你提供了有价值的内容,提升了百度搜索的用户体验。除了这三个原因,你不想让百度给你排名,那我们就围绕这三个原因开始分析吧。

百度竞价

百度竞价主要根据关键词竞价排名。对百度竞价不太了解。一般我都知道,当你1元一次点击竞价排名第三的时候,人家要想超过你,就得1元以上的竞价。原理是这样的。

通常最好的状态是把百度的付费广告排名控制在2-3,排名第一,基本上竞争对手都在点击你的网站。所以控制在2-3是最好的位置。

百度竞价最大的优势就是对时间段进行排名,马上投放广告,马上就有排名。所以很多公司选择百度竞价进行前期推广,百度竞价的原理也很简单。百度公司想赚钱生存,所以推出了这个百度付费推广模式,通过他们在后台的直接运营给你排名,你可以用排名赚钱,但是你要给他们钱,不可能永远靠百度竞价,所以除了百度竞价,我们

百度下也有很多产品,也有很多产品可以参与排名,比如百度文库、百度知道、百度百科、百度体验、百度百家等。这些百度产品只是一个平台,百度官方从来不编辑里面的内容。这些平台里面的内容都是第三方企业或者个人编辑的。既然需要编辑,推广机会就来了。先说说他们的排名算法和规则。

百度的产品都是百度自己开发的,排名优势很大。优势在哪里?是通过阿拉丁通道排名的,说白了就是走后门。

前面提到过付费竞价推广是直接通过后台给出排名的,但是百度的产品平台和付费推广是不一样的。不属于推广,直接先展示自己网站的排名。呈现形式与普通网站自然排名相同。

但是阿拉丁频道的排名是有规则的。第一,他们没有包容规则。基本上批准的内容是直接收录的,所以要看你的内容会不会被审核。然而,他们的排名是定期的,基于他们的需求。比如

我曾经写过一篇文章《谷粉搜搜:一个神一般优化的网站》,第一次发在我的博客上,然后在A5、iResearch、新浪等上百个大大小小的平台上转载我的文章,但是最后的排名是基于百度的经验。

之所以能参与排名,是因为有这个需求的人太多了。由于谷物搜索是一个新站,短短几个月从权重0到权重6肯定是个奇迹,所以很多SEOER都是借鉴他们的优化经验,所以需求很大。可以肯定的是,就算我不在百度体验发布,也一定有其他网站对这个页面进行排名,这也是我的文章。

接下来是百度的阿拉丁频道。论权重,新浪、搜狐等大型网站并不比百度的体验差。但百度为了让自己的产品生存下来,获得流量,只使用后门技术,直接用百度的体验页面排名。百度的经验排名之所以不给我做原创博客,是因为我的博客目前缺乏可信度,俗称权重不足。

百度免费排名是大家最关心的,因为我们不是百度家族的亲戚,也不是本地玩家,所以在其他两个方面,我们没有优势,只好选择百度免费排名,百度免费排名的规则和算法也是最,也是最麻烦的,一般以可信度(权重)为中心。从综合因素来看,这种可信度不是单一的优势。

百度免费排名是大家最关心的,因为我们不是百度家族的亲戚,也不是本地玩家,所以在其他两个方面,我们没有优势,只好选择百度免费排名,百度免费排名的规则和算法也是最,也是最麻烦的,一般以可信度(权重)为中心。从综合因素来看,这种可信度不是单一的优势。

Inclusion Rules

如果你想在排名的前提下被收录,那么在收录的前提下是有内容的,所以很多网站太单一了,不能被收录,但也有明显有内容不被收录的网站。这就是我对包容的理解。

抓取:百度收录一个网站或页面的前提是该网站已经被百度抓取,即百度的机器已经到了你的站点,来你站点的前提是有入口,百度有三个入口,分别是第一个自提交,第二个SEO外链,第三个浏览器。你可能不太懂浏览器。当你的网站刚刚建立的时候,没有人知道你的网站已经建立了。自然百度不会知道。你只知道你自己。如果你用百度浏览器打开你的网站,这就意味着百度浏览器已经知道这个网站的存在,数据就交给百度搜索引擎,从而达到爬行的效果。抓取是不够的,不是所有的内容都会被百度收录,所以他们也需要判断内容标准。

标识:抓取一个页面,必须有内容。如果没有内容,很难被收录。什么是没有内容的页面,比如登录页面,是有内容没有意义的页面?会直接在空白页列出。还有很多网站喜欢这种页面,比如:关于我们,联系我们等等。

所以页面必须有内容,而且必须是可识别的。可识别的内容是文字内容。百度搜索引擎就是一台识别它的机器。说到视频、图片和flash,他们不知道视频和图片中显示的是什么,所以无法识别。所以,前期最好以人物为主。

Release:最终会考虑发布。如果发布了,此时可以通过百度搜索你的URL,有条件发布你的页面是必须的。

首先会判断你的页面有很多站外推荐,也就是说如果是高质量的页面,站外会推荐这个页面,容易被收录,然后站内会推荐,也就是说如果是高质量的页面,站内会推荐这个页面。说白了,要发布的内容肯定是优质内容,除非发生以下情况。

最容易收录的内容肯定是网上新闻来源最多的内容。说白了,很多抄袭者的内容是最容易被收录的。这个时候太多人不容易理解,越抄袭越容易被收录?

新闻内容是时间敏感的。当一条新闻发布后,很多媒体会立即转载你的内容。百度机器识别出很多新闻源都有相同的内容,包含在新闻的主题页面中。所以包含这个内容很简单,一天或者几天都不会包含。如果过几天收录,这个新闻内容就过时了,自然会影响百度的体验。

排名规则

参与排名的规则并没有想象中那么复杂。听了这位大哥的分析,觉得有一定的价值,但实际上只是解决了几个方面的排名问题。

评分规则:评分规则是根据网站的整体可信度来综合判断的,如网站原创性、网站停留时间、网站跳转率、网站打开速度、网站图片处理、网站代码优化等。

点击规则:当你的网站可信度达到一个基本标准,你的网站上会出现一些非常长尾的关键词。可能关键词排名不在首页。此时按照点击率规则计算排名。如下图所示,当一个关键词的外观和点击率达到一定比例时,你的排名就会上升一个等级。这个比例是根据用户点击量来计算的,不是百度定义的。比如搜索关键词“翻墙”时,排名第二的网页比排名第一的网页点击率高,自然排名第二的网页会把他排在第一。

链接规则:当你的文章被站外链接推荐过多,说明文章价值很大,否则对方不会推荐,站内也多次推荐,也说明文章价值很大,所以链接规则很简单。不过因为百度的绿萝卜算法一直在打击垃圾链接,自然链接比较好。

百度算法规则

我不相信百度的算法有这么神奇,但是百度确实公布了这一系列算法和K站降功率的举动,所以我不得不仔细分析百度算法的原理。以下算法只是我个人的推测。

百度绿萝卜算法:我一直不相信百度绿萝卜算法能算出你的链接是否被购买,但是百度确实做到了。主要原则是判断是否有反向链接,以及从一个网站到另一个网站的链接数量。

百度石榴算法:石榴算法主要针对低质量页面,其中百度蜘蛛主要根据网站的html代码进行抓取,搜索引擎根据文章的标签(包括排版)和重复阅读来判断网站的质量。

百度星火计划:星火计划的原计划是打击抄袭者。星火计划的原理很简单,就是通过反复阅读来判断一个网站是否抄袭。同时,百度蜘蛛也肯定了自己的爬行程序,现在正在向各个网站爬行越来越近。

总结:自称百度官方的人给了我百度排名规则和算法。经过我的判断,这三年来好像一直在根据这个条件进行优化。