欢迎光临本站!

已有工作概述

来源:技术探讨    更新时间:2019-12-19 14:38:11    编辑:老王    浏览:329

  2003年第十四、十五期中国互联网络发展状况统计报告[6]指出,2004年中国搜索引擎用户已占互联网用户的95.2%,每天的搜索请求量达到近1.9亿次。而根据最近发布的壹期中国互联网络发展状况统计报告[8],截止到2005年12月31日,我国的网民数达到了1.11亿,65%的用户指出搜索引擎是他们经常使用的网络服务功能。另外,根据Sullivan的统计[9],2004年底,Google作为世界上索引量最大和访问频率最高的搜索引擎,能够索引到超过80亿的网络页面,而其每天处理的用户查询则超过2.5亿个。

  面对如此庞大的搜索需求,深入挖掘发现用户行为特点,进而提高搜索引擎算法的效率和准确率显得尤其重要。1998年,CraigSilverstein等人对大规模英文搜索日志进行了分析[4],结论指出85%的查询用户都只翻看了查询结果的第一页内容等。这些结论都对英文搜索引擎的算法改进和发展起到了有益的作用。由于中文网络数据的特殊性以及中英文网民行为的差异,对中文搜索引擎进行较大规模的分析以找出中文搜索引擎用户的行为特征是很有必要的。

  此外,对用户检索目的的分析也是近年来用户行为分析研究的热点之一,IBM研究院的Broder首先提出了“任务驱动”的概念,在他构想的用户检索流程模型中,查询任务决定了用户的查询需求,进而反映在查询词上。他在文献[10]中指出,用户的查询任务包括导航类、信息类和事物类三类。对查询任务进行划分的出发点在于,针对三类检索可以使用不同的检索模型、参数,甚至评价方法也随着检索类别的变化而有所区别。因此实现检索类别的自动划分对于提高检索性能和增加检索评价的可信度都有非常重要的意义。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜