欢迎光临本站!

搜索引擎查询系统-搜索结果页的缓存

来源:技术探讨    更新时间:2019-12-12 14:29:10    编辑:老王    浏览:270

  在查询系统中,搜索结果页的缓存( Cache)是对搜索“效率贡献最大的设计。由于缓存中的搜索结果页都是前人查询的结果,因此用户的查询请求如果在缓存中命中(和前人的查询相同),则查询系统直接把缓存中存放的搜索结果页返回给用户。

  搜索结果页的缓存


  用户在使用搜索引擎进行检索时,查询词可能干差万别。但是如果从大量用户的查询统计上看总会有一些词汇经常被查询有些词汇却很少被查询。文献[王建勇,etal,2001提出了如下一些结论。

  (1)前20%的查询词的查询次数约占了总查询次数的80%。

  (2)查询具有稳定性,查过的词很可能在不久的将来还会被查询。

  搜索结果缓存的实现方法和操作系统中提到的LRU算法基本一致,下面一起回顾一下LRU缓存置换算法。

  回顾第三章中提到的网页库设计,对搜索结果页的缓存库必须能够支持随机访问,这一点很重要。如何支持这种随机访问其内部原理和数据库设计很相似,这里不再展开,有兴趣的读者可以参考B+树等这类能够支持随机访问的索引方式。

  有了搜索结果页缓存的设计,搜索引擎查询层就能够大大降低重复的计算量,提高同时响应用户检索请求的能力。具有搜索结果页缓存功能支持的查询系统如图6-22所示。

搜索引擎查询系统-搜索结果页的缓存

  增加了缓存功能后查询系统可以较少执行实际的查询计算,而采用重用缓存中保存的历史相同的查询结果网页的方法来大大提高查询效率。目前的技术能够达到在缓存中命中99%的查询,因此用户实际的查询绝大多数情况都是取自缓存的搜索结果页,这就是搜索引擎为什么能够如此快速地返回查询结果的一个重要原因。

  也许是由于搜索结果页缓存的出色设计,在“效率”和“效果”之间的竟争上,“效率”占据了优势。因此近年来,查询系统的研究方向主要在“效果”上,而效果的追求还需要推测用户的查询意图。如果能正确地推测出用户的查询意图,那么对效果的改善可以说是大大有利的。下一节中我们将了解一些关于搜索引擎推测用户查询意图的思想和方法。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜