欢迎光临本站!

面向物联网搜索的知识挖掘

来源:技术探讨    更新时间:2019-12-13 15:27:12    编辑:老王    浏览:393

  倒排索引(inverted index)

  倒排索引是一种数据结构,其显著提高了搜索的效率。倒排索引解决了如何根据属性值高效地查询记录。倒排索引表中存储这属性值以及各记录的地址[30]。由于是通过属性值来确定记录的位置,因此称其为倒排索引。

  评分与排名(scoring and ranking)

  评分是关于实体与查询相关度的一个标量值比例,排名则是依据评分得到的一个实体排序。对实体进行评分和排名首先可以为用户提供最匹配的实体,其次,通过对排在前面,匹配度高的实体先进行推送和索取提高了搜索效率。然而,如何统一化、标准化评分是其实现的关键前提。

  Top-k查询(Top_kquery)

  在实际的操作中,如果将所有的匹配结果都返回给用户,这不仅浪费了计算和通信资源,对用户来说也是没必要的。因此,用户进行查询时往往无需返回所有匹配的实体,而只需要返回最相关的k个结果,即Top-k查询。对于Top-k查询,有时可以直接查找到最相关的k个结果,而无需考虑所有的实体,这比首先找到所有可能的匹配结果,然后再返回最相关的k个结果的这种方法大大提高了查询效率。

  预测技术预测

  是对客观事物的发展规律和趋势进行的预计与推断。预测的目的是揭示事物发展规律,预测事物未来的发展趋势,并使人们可以利用事物的规律和趋势对事物进行控制,为人类提供服务。例如,文献利用卷积和傅里叶变换计算有关人类活动的周期性规律,从而达到对传感器未来的状态进行准确的预测,这不仅可以节省通信资源还可以提高物联网搜索的高效性和准确性。

  预测有2类:定性预测和定量预测。定性预测是指凭借直观,依靠经验,通过分析对事物的未来进行的一种预测。定量分析是指通过数学工具进行统计分析的方法对事物进行的一种预测。定量预测具体方法有:回归分析法和时间序列分析法。回归分析法是一种根据事物发展的因果关系进行的一种预测。回归分析主要研究引起事物变化的各因素之间的相互作用以及各因素与未来状态之间的统计关系。

  具体可以通过机器学习法建立预测模型,典型的机器学习方法包括:决策树方法、人工神经网络、支持向量机、正则化方法、近邻法、朴素贝叶斯(属于统计学习方法)等。时间序列分析法也叫趋向外推法,它是根据历史数据,对事物的发展规律进行分析推理。

  时间序列分析法把发生的时间按照时间进行排列,然后通过趋势外推进行预测。时序分析研究的是预测目标和时间之间的演化关系,因此时间序列分析法是一种定时的预测技术。物联网搜索的搜索空间是大规模的,数据也是高度动态的,而预测技术的使用不仅可以节省通信资源,还可以提高搜索的效率以及准确性。

  协同搜索技术

  当今社会分工越来越细协作越来越紧密,分工与协作在人类社会发展的历程中越来越显得重要。随着物联网技术的发展,搜索任务也越来越复杂,因此搜索同样也需要分工与协作,于是协同搜索应用而生。协同搜索是指通过众多参与者的有序分工与协作共同完成一个搜索任务。物联网的搜索数据具有异构性、多元性、多模态性、多属性和多维度性等特征,使物联网搜索比传统的互联网搜索面临的问题更多,形式更复杂,任务更艰巨,协同搜索可以降低物联网搜索的复杂性并且提高搜索的高效性和准确性。

  Web搜索通常是用户单独进行信息搜索的行为,不同的用户输入相同的搜索词,将得到相同的搜索结果。因此,人们提出了协同搜索技术,以支持多用户高效协作搜索。例如,在医学以及军事指挥等特定领域的信息搜索中,搜索任务可以通过分工协作的方式协同完成,搜索结果可在成员之间进行共享。

  开始使用协同搜索的是医学视频检索等特定研究领域。Smyth等在2003年在第18届国际人工智能联合大会(IJCAI03)上发表了论文“Collaborative Web Search”中,第一次提出了协同搜索的概念。该文基于元搜索引擎设计和开发了一个协同搜索的原型系统I-SPY。随后,Smyth等研究小组又继续发表了多篇协同搜索方面的论文。Morris研究小组[35]开发了TeamSearch、S3、Cosearch、SearchTogother等协同搜索系统。

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜