欢迎光临本站!

结论及未来展望

来源:技术探讨    更新时间:2019-12-17 14:49:36    编辑:老王    浏览:564

  网络空间中数据资源的爆炸式增长为当今社会带来了宝贵机遇,同时也为如何有效利用网络大数据提出了巨大挑战。在网络大数据4V特性的背景下,本文研究如何有效组织管理网络空间中的数据资源并实现基于数据语义的相似性搜索,分别从高维数据索引、高维数据降维及分布式语义搜索技术三方面详细回顾总结了现有研究成果,并提出了现有工作在网络大数据背景下的局限性。总体来说,对于网络大数据的研究还处于起步阶段,尚有许多问题亟待解决,将来研究可以重点关注:

  (1)如何准确提取各种网络大数据资源的语义特征信息,确保构造的高维语义空间能够准确反映网络数据资源的语义信息,尽量避免噪声等因素的干扰。

  (2)针对网络大数据资源的语义空间维数高,动态增长,数据分布不规则等特点,提出先进的降维方法以适应网络大数据的特点,在保持数据资源语义不丢失情况下,尽可能降低语义空间维数,消除“维灾”的影响。

  (3)将降维技术与高维索引技术有效结合,在降维的基础上利用高维索引技术,修剪掉大量与给定搜索无关的搜索路径,快速确定搜索范围,进一步提高基于语义相似搜索的速度及精度。

  (4)深化分布式语义搜索系统的研究,针对非结构化P2P及结构化P2P固有的优缺点,考虑对两者进行综合,取长补短,尽可能减少数据语义搜索过程中所需流量,克服负载不均衡,免费搭乘等不足,进一步提高系统的性能。

  (5)将现有成熟的信息检索技术与基于语义的相似性搜索技术相结合,实现网络空间内智能高效的数据组织及搜索发现。

  致谢在此,感谢第二届中国互联网学术年会,并向对本文提出宝贵意见的计算机学报李刚老师及各位评审专家表示衷心的感谢!


上一篇:现有分布式语义搜索技术综合比较

下一篇:已经是最后一篇

评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜