基于知识图谱的科技大数据知识发现平台建设研究

基于知识图谱的科技大数据知识发现平台建设研究
基于知识图谱的科技大数据知识发现平台建设研究

基于知识图谱的科技大数据知识发现平台建设研究

发表时间:2020-04-10T12:32:02.969Z 来源:《科技新时代》2020年1期作者:李鸿雁[导读] 随着现代信息技术的不断发展,其在地理信息工作中的应用也逐渐发挥着越来越重要的作用,对于地理信息的收集、整理、挖掘、分析等工作有着重要的推动意义,能够更好的发挥出地理信息中所蕴含的巨大价值。重庆市地理信息和遥感应用中心重庆市 401147

摘要:在信息时代的背景下,信息呈现出了数据量大、类型多、价值密度低、传播速度快、时效性强等特点,其对于地理信息工作的开展也提出了更高的要求。本文针对大数据技术在地理信息相关工作的中的应用,对基于知识图谱的科技大数据知识发现平台建设进行了探索和研究,希望能够为相关工作提供一些参考。

关键词:地理信心;知识图谱;大数据;知识发现平台引言

随着现代信息技术的不断发展,其在地理信息工作中的应用也逐渐发挥着越来越重要的作用,对于地理信息的收集、整理、挖掘、分析等工作有着重要的推动意义,能够更好的发挥出地理信息中所蕴含的巨大价值。不过,在信息时代下也给地理信息工作的开展带来了不少的挑战,例如随着勘测技术发展地理信息数据量不断增长、数据类型不断丰富,再加上我国幅员辽阔,地理信息数据总量已经十分庞大,即使在某一地区中的地理信息工作都需要对大量的信息、数据进行处理,然而过去的地理信息工作模式已经无法满足新时期的工作需要。本文从知识图谱技术出发,对大数据知识发现平台的建设以及其在地理信息相关工作中的应用进行了探索和研究。

1.知识发现服务现状分析

知识图谱在地理信息工作中的应用能够更好的满足当下相关工作的实际需要,为相关人员和用户提供智能化、精确化、人性化的地理信息服务。例如,通过利用知识图谱技术,在相关人员录入地理信息的同时可以对这些信息进行智能分析,通过数据融合、知识发现、内容计算等,生成地理信息数据列表并形成结构化的主体信息,关联已有的数据,进而为相关人员的地理信息检索、研究工作带来加大的便利,促进地理信息价值的增值,为用户提供更好的智能化服务。

2.系统设计

在基于知识图谱的地理信息大数据知识发现平台的建设中,其设计目标为通过知识图谱技术建立地理信息数据库并对信息数据进行规范化、实体化,然后从中进行信息、关键词的抽取和关联,结合数据采集、分析、融合等相关技术来实现地理信息数据的丰富化和结构化,增强信息数据的价值,同时还要建立起地理信息相关的检索引擎,通过分布式计算、大数据等技术构建知识发现服务平台,为相关人员和用户提供丰富多样的知识发现、决策分析等服务,满足新时期地理信息工作的需要。在该平台系统的总体构架设计上,主要以分布式计算和大数据技术为平台支撑,对当前地理信息数据库中的数据资源进行抽取、规范和计算,在功能设计上重要包括知识图谱索引、语义智能检索,信息主题综述形成、信息主题聚合探索4个模块。

3.关键技术方法

3.1知识图谱索引技术

针对庞大的地理信息数据,为了实现更加有效的数据储存、搜索和分析工作,可以使用Elastic Search工具和Virtuoso 数据库相结合的方式,通过Elastic Search分布式集群的建设来补足Virtuoso 数据库自身数据检索效率不高的短板,建立起分布式多用户搜索引擎。在应用Elastic Search工具时,需要对其进行以下优化:对数据中无需检索的资源设置enable= false,提高Elastic Search索引速度;利用多线程并发写入进行数据bulk的情况,实现Elastic Search 集群写入吞吐量的最大化;对部分地理信息的字段进行预分组,通过预索引提高Elastic Search的检索和聚合速度。

3.2语义智能检索技术

该技术是通过利用知识图谱索引进行关键词抽取、信息实体主体标注以及主题与关键词的高效匹配来建立起相应的语义搜索模型,从而达到进行语义检索以及智能排序、推荐等功能。在该技术的具体实施上,首先通过使用STKOS语义知识库和数据挖掘算法对地理信息中的关键词和语义主题进行抽取,并将其作为候选词进行管理。然后通过余弦相似度算法对候选词的相关度进行分析并进行排序,分析用户的检索意图,找出要想搜索的内容返回检索结果并为其提供相关的关键词。

3.3地理信息主题综述生成技术

相关主题
相关文档
最新文档