欢迎光临本站!

基于大规模日志分析的搜索引擎用户行为分析

来源:技术探讨    更新时间:2019-12-19 14:36:58    编辑:老王    浏览:2217

  随着网络与信息资源的飞速发展,网络搜索引擎已经成为人们获取网络信息的主要途径。但现在人们通常只是简单地通过短短几个词的查询与检索系统进行沟通,而在网络信息资源规模如此庞大的情况下这种沟通是远远不够的,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索引擎的用户行为分析是非常必要的。

  搜索引擎日志是网络搜索引擎用户行为的重要载体,国内外的不少研究者都针对网络搜索引擎的用户日志进行了相关的研究。网络信息检索工具得到普及之后,面向网络信息检索的用户行为分析得到了更多的关注,文献[1~3]就分别在90年代中期左右对Web用户的浏览行为进行了调研和分析;到1998年前后,部分研究者如文献[4,5]等就开始对商业搜索引擎的用户日志进行大规模的分析。但由于各方面条件的限制,这种研究,例如查询词频分布规律的研究等,都很少集中在中文网络用户的行为分析上。

  中文网络数据环境与英文的有较大的差异,除了数据上的,还有使用群体的文化、语言习惯等差异,这些都造成了中文搜索引擎用户行为上的特异性。因此有必要对中文搜索引擎的用户行为进行分析,以针对中文搜索引擎的算法或检索性能评测方法等指出有益的方向。

  本文将对为期一个月的真实规模中文搜索引擎网络日志进行研究,从较大规模的数据中分析中文搜索引擎用户行为的一些特点,为中文搜索引擎算法的改进和检索性能的评测等提供一定依据和方向。因为日志数据规模较大,所以更具一般性,更能反映出大部分用户的行为特征。在下文中我们将首先对已有工作和搜索引擎的日志设计等作简单的介绍;然后对基于日志的搜索引擎用户的行为进行分析;最后针对中文与英文搜索引擎用户行为差异尝试提出一些对于中文搜索引擎算法设计、评测方法设计有益的启示。

上一篇:已经是第一篇

下一篇:已有工作概述

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜