欢迎光临本站!

基于日志的搜索引擎用户的行为分析_其他用户行为相关分析

来源:技术探讨    更新时间:2019-12-19 14:49:46    编辑:老王    浏览:4778

  在不同的用户群体中表现出来的用户行为特征是有所不同的。例如用户习惯点击的结果在搜索引擎返回结果中的大体位置如何,或者中文用户有多少会提交含有英文的查询、有多少用户会采用高级检索或直接键入URL地址作查询词等。这个部分将对这些问题进行一定分析。

  点击次数与rank之间的关系分析

  用户提交一个查询后,搜索引擎可能会返回很多页结果,但是并不见得这些结果都会对用户有用,因为用户一般不会将这些结果点击浏览过。在我们的实验中,我们分析了搜索引擎返回的结果的顺序排名(rank)与被点击次数的关系如图3,取对数值后则得图4。

基于日志的搜索引擎用户的行为分析_其他用户行为相关分析

  实验数据显示约85%的用户只翻看搜索引擎返回结果的前10个结果,即返回结果页面的第一页。这个用户行为决定了尽管搜索引擎返回的结果数目十分庞大,但真正可能被绝大部分用户所浏览的,只有排在最前面的很小一部分而已。所以传统的基于整个结果集合查准率和查全率的评价方式不再适用于网络信息检索的评价,我们需要着重强调在评价指标中有关最靠前结果文档与用户查询需求的相关度的部分。TREC在近年组织的网络信息检索评测[11,12,14,15]中,以及针对中文网络信息检索的评测[15,16]都采用了更重视检索结果最前的少数几篇文档是否满足用户需求。

  用户使用高级检索的比例

  在1998年CraigSilverstein等人分析的结果中[4],超过20%的查询中含有+、-、and、or等符号以运用高级检索功能进行检索。但在我们的实验结果中,却只有约0.73%的查询中含有用于高级检索功能的符号,即目前中文检索用户更多的检索方式只是简单地输入几个关键词用以查询。这说明在使用检索系统的过程中,简便仍是被用户所看重的,也说明了各种复杂功能的指定应从用户使用便利的角度出发。

  直接输入URL作为查询词的比例

  在实验结果中,有2.82%的查询是用户直接输入URL部分或全部地址进行查询的。对这些包含URL的查询进行统计分析后发现,平均有32.41%的点击数点击的结果就是用户输入的URL的网址。从这个比例可以看出,很大一部分用户提交含有URL的查询是由于没有记全网址等原因而想借助搜索引擎来找到自己想浏览的网页。因此搜索引擎在处理这部分查询的时候,一个可能比较理想的方式是首先把相关的完整URL地址返回给用户,这样有较大可能符合用户的查询需求。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜