Web 站内


搜狗搜索引擎的网页排名算法规则推测

(www.marketingman.net 冯英健 2005-09-21)

摘要:王小川先生在介绍搜狗搜索结果的用户体验时,附带介绍了搜狗的部分网页排名算法的几个相关概念:PageRank、网站推荐(其他网站的链接)、权威网站等。据此可以对搜狗搜索引擎的网页排名算法推测的是,搜狗搜索在决定一个网站/网页的排名级别时,在分析用户检索所用的关键词与网页内容的相关性的同时,也会注意这个网站的重要程度(或者叫权威性),也就与google网页排名算法之一的网站PR值类似。


搜狐推出的搜狗搜索引擎(sogou.com),一年来访问量上升很快(通过ALEXA网站访问排名来看),而且从收录网页数量和质量来看,在某些方面已经具有一定的领先优势,因此到了值得网络营销人员关注的时候了。作为搜索引擎营销研究,我们关注的不仅是搜狗的访问量排名,而且还关注其自然检索的规则,尤其是搜狗搜索引擎网页排名算法。

在2004年8月初搜狗刚推出的时候,尽管搜狐高调宣传其第三代搜索引擎的特征——互动性,但从自己所关注的网络营销相关检索内容来看,感觉不到搜狗有多大的优势,有些信息甚至比较陈旧,好像直接调用了搜狐分类目录数据库的信息,而这些内容可能很少更新,因此对于搜狗的所谓互动性,便没有了太大的兴趣。随后很长时间,几乎没有再去关注搜狗的发展。

大概到了2005年4月份之后,通过网站流量统计信息发现,来自搜狗的自然检索用户有了一定的增长,这才让我重新想起了搜狗搜索引擎,并且随后在进行《B2B电子商务网站诊断研究报告》的被调查网站取样时,搜狗的分类目录还帮了我不少的忙,于是对搜狗的好感增加了不少。但对于搜狗自然检索的排名算法,一直没有太多的考虑,自己的几个网站,都是随其自然发展的。2005年8月15日下午,我应邀参加搜狐公司在广州举办的“搜索生活每一天 搜狗一周年”活动时(我演讲的题目是“搜索引擎营销的现状与发展趋势www.marketingman.net/about/blog/20050916.htm),听到搜狗技术总监王小川先生对搜狗一些精彩功能的介绍时,才较多地了解了搜狗的一些互动特色,并且也是第一次通过搜狗搜索的开发者了解了搜狗的部分网页排名规则。

王小川先生在介绍搜狗搜索结果的用户体验时,附带介绍了搜狗的部分网页排名算法,对此我特别用心地注意到他所提到的几个相关概念:“PageRank”、“网站推荐(其他网站的链接)”、“权威网站”等,这些排名算法与google的网页排名规则是比较接近的,当然不会完全相同,但据此可以对搜狗(sogou.com)搜索引擎的网页排名算法规则推测的是,搜狗搜索在决定一个网站/网页的排名级别时,在分析用户检索所用的关键词与网页内容的相关性的同时,也会注意这个网站的重要程度(或者叫权威性),也就与google网页排名算法之一的网站PR值类似。

当我用更多的关键词进行检索,并对排名靠前的网站进行初步分析发现,搜狗在索引网页的摘要信息时与google有一定的差异,几乎不考虑网页中的META标签内容,而是更加重视网页标题以及网页内容中所包含的关键词。另外,据王小川先生介绍,搜狗网页提高用户体验的算法规则之一是,相同内容的网页只出现一个,不像有些搜索引擎一样,同样内容的网页可能有无数个,至于出现的是哪一个网页,个人推测大概与该网站的“权威性”有关,但网站的权威性未必与“PR值”是一回事,权威性可以增加PR值,但PR值并不完全等于权威性,因为PR值还要考虑更多的因素,是网站各种因素综合计算的排名级别。对于搜狗这一增加用户体验的规则,我有点纳闷的是,如果被搜狗认为是“权威”的网站出现的信息,有可能是转自其他网站,如果这个“权威网站”属于侵权转载(例如没有说明原文来源和版权信息),那岂不是很对不住那些不是
“权威”的网站?当然,也许搜狗已经有自己的办法解决这一问题。

(版权所有 未经书面许可 严禁任何形式的转载和传播)
搜索引擎营销
关于网上营销新观察| 网站地图| 本站动态| 媒体报导| 版权声明| 联系方式| 冯英健的博客文章
网上营销新观察版权所有| 本站法律顾问:于国富律师
粤ICP备2020132712