网络空间安全知识图谱研究

合集下载

基于知识图谱的学科知识构建

基于知识图谱的学科知识构建

0引言数学作为一门最基础的工具学科,其教学工作一直广受社会各界的关注。

大量研究发现,中学生不具备对模型和建模本质的深层次的认知,更缺少用模和建模的能力[1],因而学生往往难以记住每一个知识点,无法建立各个知识点之间的联系,从而不能将知识点灵活应用。

而知识图谱中知识点之间具有关联性,有助于学生对于知识点的记忆与深层次理解,易于学生形成数学这门课程的认知网络,从而激发学生自主学习与独立思考的能力。

文献[1,2]将知识图谱引入到教学当中,主要采用构建学科知识图谱,把学科知识内容的知识点进行梳理,建立起知识点间关系的方法。

但其学科知识图谱的表示、存储与推理还是基于RDF或OWL,不适合海量知识的表达,使得知识图谱功能的发挥受到影响。

针对以上问题,本文将基于CRA模型,结合知识图谱编辑器对知识图谱进行构建与可视化展示。

利用此模型既可以更方便地构建图谱,同时也可以充分发挥知识图谱在教学中的功能。

1知识图谱在教学领域研究现状近年来,知识图谱(Knowledge Graph)无论作为技术工具还是技术理念,逐渐获得国内外科学研究学者的关注。

知识图谱,是结构化的语义知识库,用于DOI:10.16644/33-1094/tp.2021.04.018基于知识图谱的学科知识构建*李艳茹,周子力,倪睿康,马腾,高书林,王彦冰(曲阜师范大学网络空间安全学院,山东济宁273165)摘要:文章以人教版高中数学必修课程为例,探讨了面向中学生教学的学科知识图谱的构建过程与应用,具体阐述了构建学科知识图谱的方法和步骤。

针对传统知识图谱中知识点存储与推理方法的弊端,提出一种CRA模型,可以便捷且有效地构建图谱,充分发挥图谱功能。

最后,通过已构建的知识图谱编辑系统,对高中数学课程知识图谱进行构建与展示。

关键词:CRA模型;学科知识图谱;个性化学习;可视化中图分类号:TP399文献标识码:A文章编号:1006-8228(2021)04-65-04Construction of subject knowledge graphLi Yanru,Zhou Zili,Ni Ruikang,Ma Teng,Gao Shulin,Wang Yanbing(Qufu Normal University,Jining,Shandong273165,China)Abstract:Taking the compulsory high school mathematics course of PEP as an example,this paper discusses the construction process and application of the subject knowledge graph for middle school students'teaching,and elaborates the methods and steps of constructing the subject knowledge graph.Aiming at the disadvantages of knowledge point storage and reasoning method in traditional knowledge graph,a CRA model is proposed,which can construct the graph conveniently and effectively and give full play to its function.Finally,the knowledge graph of high school mathematics curriculum is constructed and displayed through the established knowledge graph editing system.Key words:CRA model;subject knowledge graph;personalized learning;visualization收稿日期:2020-12-07*基金项目:赛尔网络下一代互联网技术创新项目(NGII20190516);“数字人文与外语研究”省级青年创新团队研究项目(山东省高等学校青创人才引育计划支持);曲阜师范大学交叉学科研究项目“外语学科数字人文研究平台的建设与应用”(QFNUSKC291809120)作者简介:李艳茹(1998-),女,山东济南人,本科,主要研究方向:知识图谱、人工智能。

基于知识图谱的大坝安全智能监控预警方法

基于知识图谱的大坝安全智能监控预警方法

基于知识图谱的大坝安全智能监控预警方法龚士林;孙辅庭;黄维;陈铿;沈海尧【期刊名称】《工程科学与技术》【年(卷),期】2024(56)3【摘要】大坝监测点数量众多、分布无序,传统监控方法难以描述监测点之间的空间关系和结构机理关联特性。

针对此问题,本文提出一种基于知识图谱的大坝安全智能监控预警方法。

首先,参照知识图谱要素特征,明确大坝监测点命名规则、拟定监测点空间相邻关系和数据序列相似关系的判定规则、提取监测点的内在属性特征,提出大坝安全监控知识体系;其次,以Neo4j图数据库为基底,采用网状图结构描述监测点的复杂关系和内部特征,构建大坝安全监控知识图谱;然后,基于图数据库知识引导和多级关系查询能力,建立监测点的关联响应机制,将异常监测点识别出来并划分为不同异常测点组,明确各异常测点组之间的结构机理关联特性;进一步,提出多测点聚集度概念并构建异常测点组的空间影响区域算法,并以坝体的异常影响区域为核心计算大坝运行性态分数,从大坝整体结构层面进行综合监控预警;最后,以一座混凝土重力坝的部分坝段为例,验证所提出方法的可行性。

研究表明:该方法充分利用知识图谱在信息融合、类脑推理方面的优势,将大坝监测点整合成数据网络进行统一分析,提出异常监测点的结构影响区域概念,并以此为依据对大坝安全进行评判,在综合考虑监测点数量、空间分布、结构机理关联特性情况下实现多测点大坝安全监控预警。

【总页数】9页(P32-40)【作者】龚士林;孙辅庭;黄维;陈铿;沈海尧【作者单位】中国电建集团华东勘测设计研究院有限公司;国家能源局大坝安全监察中心;浙江大学计算机科学与技术学院【正文语种】中文【中图分类】TV39【相关文献】1.基于知识图谱的采油生产智能预警系统研究与应用2.基于网状关联分析的电力监控网络信息安全智能预警方法3.一种基于知识图谱的分布式云安全画像和风险预警模型研究4.基于知识图谱的潜江小龙虾养殖环境智能监控与预警系统设计因版权原因,仅展示原文概要,查看原文内容请购买。

知识图谱技术的研究与应用前景

知识图谱技术的研究与应用前景

知识图谱技术的研究与应用前景随着人工智能技术的不断发展,知识图谱技术也逐渐走入大众的视野。

知识图谱作为人工智能的重要组成部分,可以为企业、政府等机构提供精准的数据分析和决策支持。

本文将从知识图谱技术的基本概念、研究现状、应用场景和未来发展等几个方面,探讨知识图谱技术的研究与应用前景。

一、知识图谱技术的基本概念知识图谱是一种以图谱(Graph)方式呈现的知识表示形式。

它用一组实体、概念和关系来描述现实世界中的事物及它们之间的关系,包括人、地点、事件、产品等较大范围的实体。

在知识图谱中,实体作为图像节点,定义相应的属性和关系作为边(Edge)链接节点。

实体、属性和关系分别使用URI和命名空间表示。

通过对实体之间的关系进行抽象和组织,可以搭建出一个庞大、复杂的知识图谱体系,这种体系可以用来推断和发现新的关联,弥补知识的局限性。

二、知识图谱技术的研究现状目前,国内外都有很多机构和企业在知识图谱技术的研究与应用方面取得了显著的成果。

国外最具代表性的是Google的知识图谱(Google Knowledge Graph),这是一个拥有数十亿实体、数百亿关系的庞大知识库。

Google Knowledge Graph不仅与搜索引擎技术深度融合,还广泛应用于语音识别、智能机器人、自然语言处理和人工智能等领域。

国内,百度知识图谱则是目前最系统和完整的知识图谱体系之一,它包括了包括人物、电影、图书、地点、自然界、品牌、公司等众多领域的信息。

此外,国内外很多高校和科研机构也在开展知识图谱技术的研究,其中不乏国内的清华大学、上海交通大学等知名高校。

三、知识图谱技术的应用场景1. 搜寻引擎:百度、谷歌等搜寻引擎公司已经使用知识图谱来改进搜索引擎功能,提高搜索结果的准确性和交互性。

2. 医疗领域:知识图谱也可用于医疗领域和生物医学研究中,帮助医生和研究人员在众多疾病和药物之间的关系中找出相关性。

3. 零售和物流:企业可以使用知识图谱来优化供应链和物流管理,提高产品的准确性、交付时间和效率。

科学知识图谱研究综述

科学知识图谱研究综述

科学知识图谱研究综述一、本文概述随着信息技术的快速发展和大数据时代的到来,科学知识图谱作为一种新型的知识表示和组织方式,受到了广泛的关注和研究。

本文旨在对科学知识图谱的研究进行全面的综述,梳理其发展历程、基本原理、构建方法以及应用领域等方面的研究成果。

通过对现有文献的梳理和分析,本文旨在为相关领域的研究者提供一个清晰、系统的科学知识图谱研究视角,为未来的研究提供借鉴和参考。

本文将对科学知识图谱的基本概念进行界定,明确其研究范畴和核心要素。

接着,将回顾科学知识图谱的发展历程,分析其在不同阶段的特点和发展趋势。

在此基础上,本文将重点介绍科学知识图谱的构建方法和技术,包括知识抽取、知识融合、知识表示和推理等方面的研究进展。

还将探讨科学知识图谱在各个领域的应用实践,如智能问答、语义搜索、推荐系统等。

本文将对科学知识图谱研究面临的挑战和未来发展方向进行深入分析,以期为相关领域的研究者提供有益的启示和思考。

通过本文的综述,相信读者能够全面了解科学知识图谱的研究现状和发展趋势,为进一步推动科学知识图谱的研究和应用提供有力支持。

二、科学知识图谱的基本概念科学知识图谱,又称科学知识域可视化图谱,是一种基于图论和网络科学的知识表示方法。

它以科学知识为研究对象,通过数据挖掘、信息抽取、知识计量和图形绘制等一系列技术手段,将科学知识以图形化的方式展示,揭示出科学知识的结构、演化、关联和交叉等深层次信息。

科学知识图谱的构建基础是大量的科学文献数据,包括学术论文、专利、科研项目等。

通过对这些数据进行清洗、预处理和语义标注,可以提取出科学实体(如科学家、研究机构、关键词等)以及它们之间的关系(如合作关系、引用关系等)。

这些实体和关系被抽象为图谱中的节点和边,进而形成一张复杂的网络结构。

科学知识图谱具有多种功能和应用。

它可以作为科学计量学的研究工具,用于分析科学领域的发展趋势、研究热点和学科交叉等。

它可以作为科研人员的辅助工具,帮助他们了解研究领域的前沿动态、寻找合作伙伴和潜在的研究方向。

知识图谱的原理及应用

知识图谱的原理及应用

知识图谱的原理及应用作者:黄桂平陈巧莹何斯娜余舒红叶江彬陈金萍来源:《大东方》2019年第02期1.产生背景知识图谱的起源最早可追溯到文献计量学和科学计量学的诞生时期。

1938年Bernal制作了早期学科图谱;1948年Ellingham手工绘制了图表,形象地展示自然科学和技术分支学科间的关系。

同年,Price用简单的曲线可视化科学知识指数增长规律。

到20世纪50年代,Garfield 创制《科学引文索引》。

并以编年体形式手工绘制引文网络图谱;随后“文献耦合”(两篇文献同引一篇或多篇相同的文献)、“科学引文网络”、“同被引”(与本文同时被作为参考文献引用的文献,与本文共同作为进一步研究的基础)、“共词”(指一定频率共现于同一语篇中的词)、“引文可视化”等相继被提出,科学知识可视化成为专门领域。

近年来,因为网络信息技术的飞速发展使得网络信息呈爆炸式增长,造成大量信息冗余,资源重复率高,人们对知识与信息选择更加困难,查找精确性和效率都有了很大的影响。

为了解决上述问题并能可视化的展示知识及信息,科学知识图谱应运而生[1]。

2.含义知识图谱(Mapping Knowledge Domain)也被称为科学知识图谱、知识域可视化或知识域映射地图,旨在描述真实世界中存在的各种实体或概念,是可视化地描述人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及它们之间的相互联系,在组织内创造知识共享的环境以促进科学技术知识的合作和深入[2]。

具体分为传统科学计量图谱、三维构型图谱、多维尺度图谱、社会网络分析图谱、自组织映射图谱、寻径网络分析图谱等几个种类。

3.原理知识图谱的基本原理是科学文献、科学家、关键词等分析单位的相似性分析及测度。

根据不同的方法和技术可以绘制不同类型的科学知识图谱。

该方法首先,通过计算机和互联网搜索引擎强大的自动查询功能,在极短的时间里面完成对海量信息的准确查询。

其次,通过计算机对已查询到的海量零散信息进行文献计量统计分析,不仅可以通过量化模型将其以科学的、可视化的形式直观地呈现出来,而且还可以发现它们之间的深层次关系和趋势,为今后在该领域的研究提供更有力的客观数据和科学支持。

基于图神经网络的知识图谱嵌入算法研究

基于图神经网络的知识图谱嵌入算法研究

基于图神经网络的知识图谱嵌入算法研究最近几年,随着人工智能技术的不断发展和应用,知识图谱作为一种将信息可视化和整合的有效手段而逐渐备受关注。

知识图谱建立了一种人机交互的方法,可以为用户提供针对性更强的信息查询和服务。

在知识图谱的应用中,嵌入算法的研究被认为是一个至关重要的方向。

本文将以基于图神经网络的知识图谱嵌入算法为研究对象,探讨它在知识图谱中的应用和优势。

一、知识图谱介绍知识图谱是一个将语义关系可视化的数据结构,通常是用图的形式呈现。

知识图谱记录了不同事物之间的关系,可以为用户提供满足特定需求的最新知识和信息。

知识图谱在许多领域中都有着广泛的应用,如搜索引擎、认知计算、语义网和推荐系统等。

知识图谱的应用可以为很多领域带来极大的益处,例如,语音识别和对话系统需要对用户进行分析和理解,以便向其提供相关信息和建议。

同时,在搜索引擎领域中,建立关键字与语义之间的联系可以提高搜索效率和准确性。

二、嵌入算法介绍嵌入算法是一种将高维数据调整为低维向量表示的方法。

在嵌入向量空间中,每个词都被映射到一个连续的向量空间,从而可以通过向量来计算词与词之间的相似度。

嵌入算法的应用非常广泛,例如,自然语言处理、网络分析以及推荐系统等领域。

嵌入算法通常利用神经网络实现,也可以使用基于矩阵分解的传统技术。

较新的算法通常在更新嵌入向量时考虑到词之间的上下文信息,例如Word2vec、GloVe等。

这些算法可以通过训练数据来生成嵌入向量,同时较好地解决了维度灾难的问题。

三、基于图神经网络的知识图谱嵌入算法知识图谱比较适合用图形语言来表达,因为它们可以准确地表示实体、属性和它们之间的关系。

在图中,实体通常表示为节点,而属性表示为边。

知识图谱嵌入算法通过为每个节点或边分配一个向量来实现跨图嵌入。

这就是基于图神经网络的知识图谱嵌入算法的思想。

图卷积神经网络(GCN)是图神经网络的一种类型。

它可以对节点和边同时进行卷积,从而能够在平滑图信号时捕获不同层次的信息。

知识图谱技术在智能教育中的应用研究

知识图谱技术在智能教育中的应用研究

知识图谱技术在智能教育中的应用研究随着科技的发展,智能教育成为了当今热议的话题。

其中,知识图谱技术受到了广泛关注,它被认为是推动智能教育发展的一项关键技术。

那么,什么是知识图谱技术?如何应用在智能教育中?这些问题都将在本文中得到解答。

一、知识图谱技术概述知识图谱技术是一种将结构化和半结构化的数据转化为计算机可读的形式的技术,它通过建立实体、属性和关系之间的知识网络,形成一个具有丰富语义信息的知识库。

这种网络结构能够在计算机中进行推理、计算和查询,帮助人们更好地理解、利用数据。

二、知识图谱技术在教育中的应用知识图谱技术在教育中的应用,主要分为以下四个方面。

1.智能化推荐智能化推荐是知识图谱技术在教育领域中的重要应用之一。

利用知识图谱技术,可建立学习者、教师、课程、知识点等实体之间的关系,根据学习者的兴趣、能力、学习历史等因素,推荐适合的教师、课程、学习路径以及问题解决方案等,并通过不断学习和迭代,不断优化推荐结果。

2.知识点关联知识图谱技术可以将学科知识点之间的相互关系和依赖关系建立起来,从而达到更好的知识点关联效果。

它可以帮助学生更好地理解和掌握学科的知识,促进教学、学习的有效开展。

3.学习路径规划利用知识图谱技术,可以将学科知识点、课程、学习资源等相关数据进行建模,并通过算法计算出最优学习路径。

这也就是说,学习者可以通过自主选择学习路径来达到学习目标,从而实现个性化学习和优化学习效果。

4.智能评估知识图谱技术可以根据学习者的学习历史、学科知识点关系等信息,对其学习成果进行智能评估。

通过算法分析,可以得出学习者的学习情况和水平,帮助教师了解学生的学习状态,为其提供更准确、个性化的教学建议。

三、知识图谱技术在教育中的优势知识图谱技术在教育中具有以下优势:1.知识图谱技术可以将非结构化的教育数据转化为结构化的数据,为智能教育提供更强的数据支持和分析能力。

2.通过知识图谱技术的建模和分析,可以更好地了解学生的学习状态和学习进程,从而提供个性化的学习环境和优化的学习策略。

第13章++知识图谱与知识推理

第13章++知识图谱与知识推理

第13章知识图谱与知识推理王泉中国科学院大学网络空间安全学院2016年11月•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结实体和关系•实体 (entity):现实世界中可区分、可识别的事物或概念–客观对象:人物、地点、机构–抽象事件:电影、奖项、赛事•关系 (relation):实体和实体之间的语义关联–BornInCity, IsParentOf, AthletePlaysForTeam•知识图谱 (knowledge graph):实体和关系所构成的异质、有向图,是表征实体间语义关联的语义网络−节点代表实体−边代表不同类型的关系 (异质) −两个节点之间有边相连表明它们之间存在相应关系 −边是有向的表明关系是非对称的•三元组 (triple/triplet):也称事实 (fact),是最基本的知识存储方式,表现为(主语, 谓词, 宾语)形式(Tom, BornInCity, Paris)(Tom, LivedInCity, Lyon)(Tom, Nationality, France) (Tom, ClassMates, Bob)(Paris, CityLocatedInCountry, France) (Lyon, CityLocatedInCountry, France) (Bob, BornInCity, Paris)•三元组 (triple/triplet):也称事实 (fact),是最基本的知识存储方式,表现为(主语, 谓词, 宾语)形式BornInCity(Tom,Paris) LivedInCity(Tom,Lyon) Nationality(Tom,France) ClassMates(Tom,Bob) CityLocatedInCountry(Paris,France) CityLocatedInCountry(Lyon,France) BornInCity(Bob,Paris)谓词逻辑/一阶逻辑表达式•模式 (schema):除三元组以外的高级知识形式–实体语义类别间的从属关系•(Athlete, SubclassOf, Person)•(City, SubclassOf, Location)•(Country, SubclassOf, Location)–关系的定义域(domain)和值域(range)•(AthletePlaysForTeam, Domain, Athlete)•(AthletePlaysForTeam, Range, SportTeam)•(CityLocatedInCountry, Domain, City)•(CityLocatedInCountry, Range, Country)•知识图谱的作用–知识图谱能够提供海量、有组织的知识体系,使机器语言认知、概念认知成为可能,进而为自然语言处理和理解相关任务提供技术支撑–知识图谱为海量无结构数据提供了结构化的存储方式,方便计算机储存和管理信息–知识图谱还能借助其图结构和海量知识,帮助学习和发现事物之间的关联规律,理解事物全貌•研究现状及应用前景国际Read the WebResearch Project at Carnegie Mellon University中国教育合作项目Representing and Reasoning Knowledge目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结知识图谱构建•几种主流构建方式NELL专家人工创建•典型代表:WordNet [Miller, 1995]•方法优点–知识的准确性高–知识的完备性高,较少出现知识缺失问题•方法缺点–人力和时间成本极高–知识的覆盖面有限,知识图谱的规模有限–知识的实时更新较难,滞后性严重大众协作编辑创建•典型代表:Freebase [Bollacker et al., 2008], Wikidata •方法优点–知识的准确性较高–知识的覆盖面广,知识图谱的规模大•方法缺点–人力和时间成本较高–知识的完备性较差,知识缺失现象较为普遍–知识的实时更新较难,滞后性严重基于信息抽取自动创建•典型代表:NELL [Carlson et al., 2010], YAGO [Suchanek et al., 2007] –指定关系类型,通过人工标注的种子知识,自动实现关系抽取•方法优点–人力和时间成本较低–知识的覆盖面广,知识图谱的规模大–知识的实时更新较为容易•方法缺点–依赖众多NLP任务,错误累积问题严重,知识准确性较低–知识的完备性较差,知识缺失现象较为普遍目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结•知识推理 (knowledge inference):根据知识图谱中已有的知识,推断出新的、未知的知识(Tom, BornInCity, Paris)(Tom, LivedInCity, Lyon)(Tom, Nationality, France) (Tom, ClassMates, Bob)(Paris, CityLocatedInCountry, France) (Lyon, CityLocatedInCountry, France) (Bob, BornInCity, Paris)(Bob, Nationality, France)•知识推理 (knowledge inference):根据知识图谱中已有的知识,推断出新的、未知的知识(Tom, BornInCity, Paris)(Tom, LivedInCity, Lyon)(Tom, Nationality, France)(Tom, ClassMates, Bob)(Paris, CityLocatedInCountry, France)(Lyon, CityLocatedInCountry, France)(Bob, BornInCity, Paris)(Bob, Nationality, France)提高知识的完备性,扩大知识的覆盖面知识推理方法•表示学习技术–TransE [Bordes et al., 2013], TransH [Wang et al., 2014], TransR [Lin et al., 2015]•张量分解技术–RESCAL [Nickel et al., 2011], TRESCAL [Chang et al., 2014] •路径排序算法–PRA [Lao and Cohen, 2010], CPRA [Wang et al., 2016]目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结表示学习技术•核心思想–将符号化的实体和关系在连续向量空间进行表示–简化操作与计算的同时最大程度保留原始的图结构•基本流程–将实体和关系在隐式向量空间进行表示(向量/矩阵/张量)–定义打分函数,衡量每个三元组成立的可能性–根据观测三元组构造优化问题,学习实体和关系的表示•位移假设 (translation assumption): –China – Beijing = France – Paris = <capital-of> –Beijing + <capital-of> = China–Paris + <capital-of> = FranceTransE实体表示:向量 e i关系表示:向量 r k 位移操作:e i +r k ≈e j三元组打分:f e i ,r k ,e j =e i +r k −e j 1e i +r k ≈e j•实体和关系的向量空间表示–实体:向量e∈ℝd–关系:向量r∈ℝd•打分函数定义–距离模型:f e i,r k,e j=e i+r k−e j1f e i,r k,e j=+−•优化问题构造–观测三元组(正例)得分 f e i ,r k ,e j –相应未观测三元组(负例)得分 f e i ′,r k ,e j ′ –排序损失:若正负例得分差距大于给定阈值 δ,损失为零;否则损失大于零–排序损失最小化:正负例得分差距尽可能大min e i ,r k ��δ+f e i ,r k ,e j −f e i ′,r k ,e j ′+t −∈N t +t +∈OTransE 模型拓展•动机:弥补TransE 在自反/多对一/一对多型关系上的不足 –自反型关系:e i ,r k ,e j ∈O ,e j ,r k ,e i ∈O –多对一型关系:∀ i ∈1,⋯,n ,e i ,r k ,e j ∈O –一对多型关系: ∀ j ∈1,⋯,m ,e i ,r k ,e j ∈Oe i +r k −e j =0,e j +r k −e i =0 ⇒r k =0,e i =e j e i +r k −e j =0,∀ i ∈1,⋯,n ⇒e 1=e 2=⋯=e n e i +r k −e j =0,∀ j ∈1,⋯,m ⇒e 1=e 2=⋯=e mTransH和TransR模型•解决方案:同一实体在不同关系下有不同的表示–TransH:关系专属超平面(relation-specific hyperplanes)–TransR:关系专属投影矩阵(relation-specific projection matrices)TransH TransR•实体和关系的向量空间表示–实体:向量e∈ℝd–关系:位移向量r∈ℝd,超平面法向量w∈ℝd•打分函数定义–头实体投影:e⊥i=e i−w k T e i w k–尾实体投影:e⊥j=e j−w k T e j w k–位移操作:e⊥i+r k≈e⊥j–距离模型:f e i,r k,e j e i−w k T e i w k+r k−e j−w k T e j w k1•优化问题构造–观测三元组(正例)得分 f e i ,r k ,e j –相应未观测三元组(负例)得分 f e i ′,r k ,e j ′ –排序损失:若正负例得分差距大于给定阈值 δ,损失为零;否则损失大于零–排序损失最小化:正负例得分差距尽可能大min e i ,r k ��δ+f e i ,r k ,e j −f e i ′,r k ,e j ′+t −∈N t +t +∈O•实体和关系的向量空间表示–实体:向量e∈ℝd–关系:位移向量r∈ℝd,投影矩阵M∈ℝd×d •打分函数定义–头实体投影:e⊥i=M k e i–尾实体投影:e⊥j=M k e j–位移操作:e⊥i+r k≈e⊥j–距离模型:f e i,r k,e j M k e i+r k−M k e j1TransR 模型•优化问题构造–观测三元组(正例)得分 f e i ,r k ,e j –相应未观测三元组(负例)得分 f e i ′,r k ,e j ′ –排序损失:若正负例得分差距大于给定阈值 δ,损失为零;否则损失大于零–排序损失最小化:正负例得分差距尽可能大min e i ,r k ��δ+f e i ,r k ,e j −f e i ′,r k ,e j ′+t −∈N t +t +∈O统一框架•相同的优化方式•不同的实体/关系表示方式和打分函数 min e i ,r k ��δ+f e i ,r k ,e j −f e i ′,rk ,e j ′+t −∈N t +t +∈O目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结张量分解技术•核心思想–将知识图谱表示成张量 (tensor) 形式,通过张量分解 (tensor factorization/decomposition) 实现对未知事实的判定•典型应用–链接预测:判断两个实体之间是否存在某种特定关系–实体分类:判断实体所属语义类别–实体解析:识别并合并指代同一实体的不同名称•张量表示–知识图谱 = 三阶张量X∈ℝn×n×m–n为实体数目,m为关系数目–x ijk=1 表示e i和e j之间存在关系r k •张量分解•实体解析–根据实体的向量表示计算其相似度TRESCAL模型•动机:解决输入张量高度稀疏所带来的过拟合问题–<capital-of>:头实体仅能为城市实体,尾实体仅能为国家实体•解决方案:子张量分解(sub-tensor factorization)目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结路径排序算法•问题定义•核心思想–以两个实体间的路径作为特征,来判断它们之间可能存在的关系•基本流程–特征抽取:生成并选择路径特征集合–特征计算:计算每个训练样例的特征值–分类器训练:根据训练样例,为每个关系训练一个二分类分类器PRA模型•核心思想:以路径作为特征训练关系专属分类器–路径:连接两个实体的关系序列•特征抽取–随机游走,广度优先搜索,深度优先搜索•特征计算–随机游走概率,布尔值(出现/不出现),出现频次/频率•分类器训练–单任务学习:为每个关系单独训练一个二分类分类器–多任务学习:将不同关系进行联合学习,同时训练它们的分类器•规则自动挖掘–根据分类器权重自动挖掘并筛选可靠规则目录•13.1概述•13.2知识图谱构建•13.3 知识图谱中的知识推理–13.3.1 表示学习技术–13.3.2 张量分解技术–13.3.3 路经排序算法•13.4 本章小结知识图谱•知识图谱 (knowledge graph):实体和关系所构成的异质、有向图,是表征实体间语义关联的语义网络−节点代表实体−边代表不同类型的关系 (异质)−两个节点之间有边相连表明它们之间存在相应关系−边是有向的表明关系是非对称的知识图谱构建•几种主流构建方式NELL知识推理•知识推理 (knowledge inference):根据知识图谱中已有的知识,推断出新的、未知的知识(Tom, BornInCity, Paris)(Tom, LivedInCity, Lyon)(Tom, Nationality, France)(Tom, ClassMates, Bob)(Paris, CityLocatedInCountry, France)(Lyon, CityLocatedInCountry, France)(Bob, BornInCity, Paris)(Bob, Nationality, France)提高知识的完备性,扩大知识的覆盖面•核心思想–将符号化的实体和关系在连续向量空间进行表示–简化操作与计算的同时最大程度保留原始的图结构•基本流程–将实体和关系在隐式向量空间进行表示(向量/矩阵/张量)–定义打分函数,衡量每个三元组成立的可能性–根据观测三元组构造优化问题,学习实体和关系的表示•相同的优化方式•不同的实体/关系表示方式和打分函数 min e i ,r k ��δ+f e i ,r k ,e j −f e i ′,r k,e j ′+t −∈N t +t +∈O张量分解技术•核心思想–将知识图谱表示成张量 (tensor) 形式,通过张量分解 (tensor factorization/decomposition) 实现对未知事实的判定路径排序算法•核心思想–以两个实体间的路径作为特征,来判断它们之间可能存在的关系•基本流程–特征抽取:生成并选择路径特征集合•随机游走,广度优先搜索,深度优先搜索–特征计算:计算每个训练样例的特征值•随机游走概率,布尔值(出现/不出现),出现频次/频率–分类器训练:根据训练样例,为每个关系训练一个二分类分类器•单任务学习:为每个关系单独训练一个二分类分类器•多任务学习:将不同关系进行联合学习,同时训练它们的分类器。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络空间安全知识图谱研究作者:安景文梁志霞陈孝慈来源:《网络空间安全》2018年第01期摘要:作为一门新兴学科,网络空间安全既涉及到传统意义上的信息安全和网络安全,同时又内在拓展了除陆、海、空、天之外的信息空间安全的含义,利用科学知识图谱,清晰直观地分析相关领域研究现状与发展趋势,把握其研究动态和未来走向对于指导相关研究工作的开展具有一定的现实意义。

以2017年11月之前CSSCI索引收集的1106篇引文数据为研究对象,统计分析相关研究领域基本信息,利用Citespace软件绘制国内研究者、研究机构、研究热点知识图谱,并加以分析说明。

结果表明:网络空间安全领域尚未形成有核心影响力的研究团体和科研机构,网络空间安全相关研究仍处于从信息安全、网络安全、网络空间安全三者结合并逐步细分的初步发展过程。

关键词:网络空间安全;知识图谱;研究现状;发展趋势中图分类号:D601 文献标识码:AStudy of knowledge map of cyberspace securityAbstract: As a new discipline, cyberspace security not only involves the traditional sense of information security and network security, but also to expand meaning of the land, sea, air,space outside and the information space security. Using the scientific knowledge map to analyze the current situation and development trend of related fields in a clear and intuitive way, and to grasp their research trends and future trends to guide the research work, this work has some practical significance. The knowledge map of cyberspace security is drawn with CiteSpaceV and related statistical analysis works on the basis of published papers in CSSCI until November 2017. The results show: there are no influential researcher and research institution yet in China, and the cooperation are quite weak. Cyberspace Security related research is still in its initial development process combined with information from security, network security, network security space.Key words: cyberspace security; knowledge map; research trends; future trends1 引言网络空间(Cyberspace)意指人类生存的信息环境或信息空间[1]。

2012年,中国共产党第十八次全国人民代表大会首次采用了“网络空间安全”这一概念[2]。

网络空间安全可以视为网络安全的内在拓展,是传统网络安全的继承与补充。

但不同于传统意义上的网络安全,严格来说,网络空间安全不仅仅指称信息安全与网络安全,且更加侧重于陆、海、空、天等并行的空间概念,其反映的信息更立体、更多样、更宽广,更能体现网络和其它空间特征,更多地渗透至其它安全领域[3]。

十八大报告发布之后,网络空间安全问题已经引起了专家学者的高度关注。

董志斌[4]从现实价值、思想源流、体系构成等方面构建我国网络空间安全理论,并探讨实现路径。

方兴东[5]等以棱镜门这一网络空间安全热点事件为切入点,深入探析全球网络空间新格局,在网络空间的全新范式下思考我国网络安全战略问题。

杨良斌[6]等针对大数据背景下我国网络空间安全人才培养存在的问题和不足,对构建完整的网络空间安全培养模式提出理论建议。

但是,与发达国家相比,我国对网络空间安全的认识相对滞后。

同时,网络空间安全与网络安全具有相当的重叠和继承,而网络安全同时也是网络空间安全这一一级学科的主要研究方向[1]。

因此,要综合评定网络空间安全的发展情况,必须与网络安全有机结合。

本文以CSSCI索引数据为基础,综合运用统计学及科学知识图谱方法,分析网络空间安全的现实发展及未来趋势。

2 数据及方法中文社会科学引文索引(CSSCI)启动于1998年,首次发布于2000年。

截至2017年11月,共收录来源文献近160万条,收录期刊554种[7]。

随着CSSCI的快速发展,其已成为我国科学研究科学的重要评价平台和有效工具,CSSCI的学术性和科学性得到了广泛的认同。

CSSCI收录的相关文献,基本上综合了国内高层次研究的主要成果,具有一定的先进性和代表性[8]。

基于CSSCI平台,采用的文献检索方法为:以“网络+安全”和“网络空间+安全”作为共同关键词,检索“所有字段”,时间跨度=1998-2017,文献类型不限,共得到相关文献1120篇,经过对比筛选,最终保留1106条文献记录,每条记录都包括篇名、作者、机构、期刊、关键词等信息。

科学知识图谱是以知识域(Knowledge Domains)为对象,显示科学知识发展进程与结构关系的一种图像,作为一种新兴的科学计量方法,它既是可视化的图形,又是序列化的知识图谱,直观地描述了不同知识间隐含复杂关系,陈超美教授主持开发的CiteSpace知识可视化软件则是目前最流行的知识图谱绘制工具之一,可用于领域内研究热点追踪和发展趋势分析,了解重要的研究者及科研机构[9]。

3 研究结果及分析3.1 统计概要为了形成对相关网络空间安全相关研究的初步认识,统计分析相关数据并绘制历年期刊文献数量统计图(如图1 a)、主要研究学科分布图(如图1 b)和载文期刊分布图(如图1 c)。

如图1所示,从数量上看,我国关于网络空间安全相关研究呈现出波动不定态势,分别在2002年和2016年两次达到峰值,但高点和低点差距较大。

从学科分布来看,网络空间安全相关研究主要分布于文献及情报科学领域,其论文数量占总量34%,其次是教育学(13%)、政治学(13%)、经济学(12%)、管理学(10%)。

从刊文期刊来看教育信息化和情报科学刊文最多,图书情报工作次之,这也与前述的学科分布相符合。

3.2 研究机构分析科研机构知识图谱有助于分析机构研究、合作现状,发现领域内权威机构。

在CiteSpaceV 中设置Years Per Slice = 1,Selection Criteria: Top 30.0% Per Slice,选择分析每年发文量前30%的机构绘制科研机构知识图谱,如图2所示。

如图2所示的知识图谱中,被分析对象由年轮形结点表示,年轮每一层的颜色代表不同发文时间,厚度代表发文量的多少,结点间的连线代表对象间合作关系,连线的粗细表示合作关系的紧密程度,外层圆圈颜色深浅表示结点的中心性,中心性代表结点的重要程度,网络密度表示总体的合作紧密程度[10]。

图2中,共出现科研机构210个,机构间合作52次,网络图密度0.0024,机构之间的总体合作十分薄弱。

其中,中国社会科学院、武汉大学、西安交通大学和中国人民大学作为四个主要科研机构,发文量较多,研究时间较长。

其主要研究对象,是网络空间的治理、互联网信息传播分析以及网络空间法律规程的完善。

发文量前10的科研机构如表1所示。

3.3 核心研究者分析文献作者知识图谱能够反映研究者的发文情况以及不同研究者相互间的合作关系。

不改变其它设置,绘制研究者知识图谱,如图3所示。

结合图3研究者知识图谱分析,共出现研究者488个,研究者间合作93个,网络密度0.008。

据此可知,相关研究这不仅数量少,且研究者之间合作亟待加强。

目前而言,尚无由较强影响力的核心研究者以及相关研究团队出现。

3.4 核心共引分析学术论文的应用可以有效评定学术论文的质量和其学术影响力,一般而言,论文的被引用频次越高,其学术影响力越高[11]。

被引次数较多的学术论文如表2所示[3,12-16]。

由表2可知,相关学术论文的被引频次不高,且发文时间较晚,同时,主要研究主题仍然是未来信息安全、网络安全及网络空间安全的发展战略以及相关的理论思辨。

现有的影响力,较强学术论文中,较多综合分析国外先进理念加以借鉴。

以被引频次最多的大数据时代美国信息网络安全分析为例,通过解读美国政府的“大数据研究与开发计划”,分析了美国信息安全战略的特点,并对与未来网络安全的发展趋势进行解读。

总体来看,网络空间安全这一概念尚未有明确定义,研究者对网络空间安全的研究常结合网络安全和信息安全,关于网络空间安全的相关理论还处于发展初期,这与前文的分析一致。

3.5 研究热点及趋势分析关键词是作者对文章的概括和凝炼,体现了文章的中心思想。

不改变其它软件参数,以关键词为分析对象,以2012年网络空间安全在十八大报告首次提出为分界点,分别绘制关键词共现知识图谱(如图4a、4b所示)和时间序列图谱(如图4c所示)。

由图4a、b可知,在2012年之前,网络空间安全没有作为关键词出现,2012年之前的研究热点主要集中于网络安全以及信息安全,电子商务、电子政务、数字图书馆作为三大实践领域受到研究者的重点关注。

2012年之后,网络安全和信息安全作为主要关键词仍具有较强的影响力,但网络空间、网络治理、互联网治理等关键词多次出现。

结合图4c,在过往的研究中,除网络安全和信息安全之外,图谱中缺少中心性较高的结点,这说明相关的科学研究尚且没有明确的方向和目标。

虽然网络空间的概念在2012年即正式提出,但尚没有一定影响力的科研成果。

以2012年为分界,两阶段高频关键词如表3所示。

由表3可知,两个阶段的研究中心和研究重点发生了较大的改变。

前一阶段(1998-2011年)中,研究者更注重具体细节事务的处理。

而在后一阶段(2012-2017年),研究者主要关注网络安全、信息安全、网络空间安全与宏观事务的关联,研究领域扩展到整个网络空间。

相关文档
最新文档