欢迎光临本站!

基于内容过滤的个性化搜索算法

来源:技术探讨    更新时间:2019-12-18 15:40:07    编辑:老王    浏览:494

  Web已成为人们获取信息的一个重要途径,由于Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息。搜索引擎是最普遍的辅助人们检索信息的工具,比如传统的搜索引擎AltaVista,Yahoo和新一代的搜索引擎Google等。信息检索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。

  个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务, 以满足不同的需求。个性化服务通过收集和分析用户信息来学习用户的兴趣和行为,从而实现主动推荐的目的。个性化服务技术能够充分提高站点的服务质量和访问效率,以吸引更多的访问者。

  目前存在着许多个性化服务系统[1,2],它们提出了各种思路来实现个性化服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协作过滤系统。

  基于规则的系统利用预定义的规则来过滤信息,其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规则的数量增多,系统将变得越来越难以管理。基于内容过滤的系统利用资源和用户兴趣的相似性来过滤信息,它的关键问题是相似性计算,其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。

  协作过滤系统利用用户之间的相似性来推荐信息,它能够为用户发现新的感兴趣的内容,其关键问题是用户聚类,其缺点是需要用户的参与。由于基于内容过滤和协作过滤各有其优缺点,所以有些系统同时采用了这两种技术。

  本文提出了一种基于内容过滤的个性化搜索算法。基于内容过滤的基本问题包括用户兴趣的建模与更新以及相似性计算方法。本文利用领域分类模型上的概率分布表达了用户的兴趣模型,然后给出了相似性计算和用户兴趣模型更新的方法。对比实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。本文只关心文本资源,比如科技论文等,实际上,我们的方法还可以应用到其他领域。

  本文第1节讨论文档和用户兴趣模型的表达。第2节讨论用户兴趣模型的更新。第3节描述相似性计算方法和基于该方法的个性化搜索算法。第4节描述实验系统并分析实验结果。第5节总结全文并进行展望。

上一篇:已经是第一篇

下一篇:文档和用户兴趣模型的表达

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜