欢迎光临本站!

全文检索

来源:技术探讨    更新时间:2019-12-12 09:46:25    编辑:老王    浏览:441

  全文检索( full-text retrieval)技术的出现是信息检索领域的一场革命,它细化了信息检索的粒度。提供了实现多角度,多侧面且全新的信息检索体验。因此搜索引擎全面采用了这种崭新的技术,并使之成为主流的检索方法。

  全文检索


  早期的信息检索主要通过检索数据信息的外部特征,例如标题、作者、摘要、附录及资料的编号等。这样的检索系统常见于图书馆的馆藏图书检索中,它主要存在如下两个大问题。

  (1)检索结果排序不理想。

  (2)只能对标题进行检索。

  出现这些问题是因为没有考虑到文档内容(本章使用文档笼统地代表书籍或者网页)全文检索顾名思义,是对文档的全部信息进行检索,这些信息包括标题和正文等。简单地说,全文检索的内在本质归纳起来就是如下两条。

  (1)文档的全部文字参与索引。

  (2)检索结果能够提供检索词出现的实际位置。

  在全文检索的过程中,只需要用户提供一个或多个检索关键词(以下简称“关键词”)不仅能够检索出命中的文本,还能够提供这些关键词在文本中出现的位置。受到搜索引擎检索结果的展示窗口的限制,不可能把全部关键词出现的位置一一列出,最终的展示效果如图5-1所示。

全文检索

  其中椭圆矩形表示网民向搜索引擎提交的关键字,矩形框表示关键字在文档中的位置。这里搜索引擎采用一种称为“标红”的技术用红色标出关键词,其余文字为黑体,这样的方法比用数字标出位置信息更加直观。接下来用户就可以通过上下文、关键词在文本中的位置,以及检索到的文档标题等因素确定哪一条才是符合需要的检索结果。例如图5-1是用“全文检索”这个关键字在 Google搜索引擎中进行检索的结果。

  当今搜索引擎无一例外地采用了全文检索,使得越来越多的人开始使用搜索引擎查找信息,信息检索的面貌也为之一新。在这革命性的搜索体验背后蕴涵的是大量的信息组织的智慧,它最终使得全文检索从梦想成为现实。

上一篇:索引系统

下一篇:索引系统-文档编号

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜