基于语义的网络大数据组织与搜索

基于语义的网络大数据组织与搜索
基于语义的网络大数据组织与搜索

基于语义的网络大数据组织与搜索

吴纯青;任沛阁;王小峰

【期刊名称】《计算机学报》

【年(卷),期】2015(038)001

【摘要】随着信息技术的飞速发展,网络空间中出现海量异构的数据资源,网络大数据逐渐引起了人们的关注.从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理并进行基于数据语义的相似搜索.为此,需要从网络数据资源中抽取其特征/属性构造高维语义空间,并将数据资源及用户查询信息抽象为语义空间中的特征向量或高维点,进而通过比较特征向量间夹角余弦值或高维点之间的距离来衡量语义相似性.高维索引技术可以对高维语义空间中的数据资源进行有效组织管理,实现基于数据语义的相似性搜索;而降维技术可以消除语义空间维数过高所引发的“维灾”影响.文中对现有的高维数据索引及降维技术进行了系统的综述,然后介绍了现有的基于分布式技术实现高维数据语义相似性搜索的研究工作,最后并展望了未来工作.

【总页数】17页(1-17)

【关键词】语义空间;高维索引;降维;相似性查询;P2P;大数据

【作者】吴纯青;任沛阁;王小峰

【作者单位】国防科学技术大学计算机学院长沙410073;国防科学技术大学计算机学院长沙410073;国防科学技术大学计算机学院长沙410073

【正文语种】中文

【中图分类】TP301

【相关文献】

相关文档
最新文档