博客文章下载中......
博客文章下载中......
 当前位置:网上营销新观察营销人博客首页— 我的博客
   
搜索引擎系列03
By  lch723 发表于 2006-11-9 11:11:17 

研究对象为Google、百度(Baidu)一搜(Yisou)、中搜(Zhongsou)、爱问(iAsk)、搜狗(Sogou)。

搜索引擎质量主要指网页搜索质量评测,网页搜索是搜索引擎的基础与根本。搜索引擎质量评测包括标准搜索方式下检索结果相关性、网页覆盖率、死链率、作弊率、结果重复率、中文分词技术。为了让测评更客观公证,除了以上6项,清华大学 IT 可用性实验室还加入了新闻及时性、图片搜索、MP3搜索3项。

评测关键词解释:

搜索引擎的相关性关系着用户的搜索效率和满意程度,相关性好的搜索引擎可以节省用户的时间和网络资源,对于任何一个搜索引擎,相关性至关重要。

网页覆盖率又称为索引库大小,也就是所能搜索到的网页数量。

死链指搜索结果中指向已不存在(或无法访问)的互联网资源的链接。

网页作弊率是指网页通过程序或人工的手段,非法地提升自己在搜索引擎中的排序,提高自身的点击率等非法获益行为。

重复是影响网页质量的一个重要因素。重复内容多不但影响用户感受,还很耗费系统资源,影响检索效率。

中文分词,是指把输入计算机的汉语语句自动切分为词的序列的过程。

清华的评测结果是:

 

Google

一搜

百度

中搜

爱问

搜狗

相关性

71.68%

66.17%

70.60%

69.82%

61.59%

63.13%

网页覆盖率

26.62%

17.51%

32.52%

24.73%

12.45%

8.80%

死链率

7.85%

5.02%

5.20%

6.53%

10.77%

6.50%

作弊率

4.67%

5.39%

3.64%

2.69%

6.49%

3.65%

分词

80%

77.80%

90%

81.10%

74.40%

76.70%

注: 死链率和作弊率数值越低搜索引擎质量越高。

从表中可以看出,在网页搜索质量方面本土搜索引擎百度和中搜的许多指标开始超过Google。百度在总体指标上已超过Google成为第一。

 
阅读全文 | 回复(0) | 编辑

发表评论:

    昵称:
    密码:
    标题:

 
 博客个人信息
博客文章下载中......
站点日历
博客文章下载中......
最新日志
博客文章下载中......
最新评论
博客文章下载中......
最新留言
博客文章下载中......
友情链接
站点统计
博客文章下载中......
日志搜索
用户登陆