欢迎光临本站!

搜索引擎查询系统-推测用户查询意图

来源:技术探讨    更新时间:2019-12-12 14:34:17    编辑:老王    浏览:420

  推测用户查询意图首先需要对用户的查询做出基本分类,然后通过日志分析及挖掘的技巧对排名进行干预,最终通过大量用户的行为引导最终的排名结果。

  查询分类


  在实际应用中,用户检索的需求多种多样。根据 Broder等人对 Alta vista搜索引擎的用户日志分析工作,检索可以根据查找信息目的不同分为3类,即导航类查询、信息类查询和事务类查询。

  2004年, Yahoo公司的 Danny等人在 Broder工作的基础上将检索类型进行了细化。但总体分类结构则基本保持不变,这也说明了这种查询分类体制的可靠性。

  导航类查询的目标是查找一个用户已知的网页(帮助其找到对应的URL),例如,“软件学报主页”及“清华大学招生简章都属于导航类检索的范畴。导航类检索按照查找目标页面的不同细分为特殊需求页面定位任务和主页定位任务两类,主页定位任务的目标页面是站点/子站点的主页;而特殊需求页面定位任务的目标页面则是主页以外的页面。

  信息类检索的目标是查找关于某个查询主题的相关信息,如加强党的执政能力”就可以算做信息类查询。

  事务类检索则是用于查找关于某个内容的网络服务,如购物服务、查询服务及下载服务等,典型的样例如"mp3下载”等。

  在这3类查询中,不同的查询有着本质的不同。

  导航类查询,例如主页的查询可以充分利用锚文本、关键词的位量信息(标题或正文具有不同的价值)及 PageRank等信息进行查询,总体查询效果是十分理想的。目前绝大多数的搜索引擎都能对这样的查询做到“首条命中”,比如查询“南京大学首条必然是南京大学的主页。

  而信息类和事物类查询效果就目前来说,和导航类查询差距很大。例如查询“如何买南京到北京的返程票”及“z50″(南京到北京的一个火车车次),有时搜索引擎返回的查询首页中,10个查询结果中只有2个-3个是有效的。因此对于查询效果来说主要的难点在于解决信息和事物类的查询,目前各大搜索引擎都对这类查询效果表现出了极大的关注。

  推测信息类、事物类的查询意图


  导航类查询通过去除搜索结果中低质量的网页或者排名靠后的方法来提高查询效果,而信息和事务类查询是将搜索结果中高质量的网页排名靠前的方法来提高查询效果,而主要的难点在于对于信息和事务类查询。例如用户查询“Z50″,可能是一个列车的车次,也可能是一款手机的型号,或者是一款数码相机的型号。那么用户查询的到底是什么呢?在推测用户搜索意图上,查询系统做了如下的工作。

  (1)从查询日志中得到用户的这类查询中实际点击的URL,并进行排名反馈。

  如果在100个查询“Z50″的用户中,50个选择了查看列车车次的URL,10人选择了查看数码相机Z50的URL,5人选择了查看手机Z50的URL,由此反馈给排名系统。在下次再有类似的查询,将和列车车次有关的URL排第一,依次为与数码相机Z50相关的URL,以及与手机Z50相关的URL。这种利用用户的实际点击来进行排名可以满足主流查询用户的需求。

  (2)在用户的查询序列中分析查询意图,并给出搜索提示(Query Suggestion )。

  通过对用户查询日志的统计分析,例如10%的用户在查询50″后,继续查询了“火车Z50″或者“Z50车次信息”,那么可以推测用户在查询Z50后并不满意给出的结果,而使用了更加精确的查询词。因此在搜索提示(一般出现在搜索页的尾部)中给出搜索提示,帮助用户选择更好的查询词得到搜索效果,同时将在查询“Z50后的搜索结果中涉及火车车次信息的结果排名靠前。

  综上所述,这类信息和事务类查询大多通过事后分析及日志挖掘的技巧将分析结果反馈给排名系统,使得在接下来的排名更加科学。因为具有了用户的点击反馈和查询反馈,所以一个搜索引擎的用户越多,其查询效果就越好。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜