知识图谱概述与应用
知识图谱概述及应用

导读:知识图谱(Knowledge Graph) 是当前的研究热点。
自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。
各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。
比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。
那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业- 互联网金融,知识图谱可以有哪方面的应用呢?目录:1. 什么是知识图谱?2. 知识图谱的表示3. 知识图谱的存储4. 应用5. 挑战6. 结语1.什么是知识图谱?知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。
在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。
知识图谱是关系的最有效的表示方式。
通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。
知识图谱提供了从“关系”的角度去分析问题的能力。
知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。
不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。
比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。
另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。
这就说明搜索引擎通过知识图谱真正理解了用户的意图。
上面提到的知识图谱都是属于比较宽泛的范畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。
接下来我们看一下特定领域里的(Domain-Specific) 知识图谱表示方式和应用,这也是工业界比较关心的话题。
知识图谱技术在企业知识管理中的应用

知识图谱技术在企业知识管理中的应用随着互联网的发展,人们对信息的获取和分享的要求越来越高。
企业作为一个独立的经济体,也需要与时俱进,善于利用先进的信息技术提高运营效率和竞争力。
知识图谱技术(Knowledge Graph)被认为是最有效的语义网络表达方法之一,其采用复杂的三元组网络结构,能够将海量数据资源进行有效的结构化表达,并为数据的存储、查询和分析提供了更加高效的途径。
本文将介绍知识图谱技术在企业知识管理中的应用,并探讨其价值和局限性。
一、知识图谱技术的概述知识图谱是一种用于表示知识的语义网络结构,它将实体(Entity)、属性(Property)和关系(Relation)用三元组的形式进行图形化呈现。
实体是事物的具体表示,属性是实体的特征描述,关系是实体之间的交互和依赖。
知识图谱技术的核心是通过构建三元组网络,整合各种数据来源,将数据进行语义链接,形成一个全面和一致的知识库。
知识图谱技术在自然语言处理、信息检索等领域得到了广泛应用。
二、企业知识管理的挑战与机遇企业知识管理是指企业利用各种信息技术工具,对企业内部的知识和信息进行有效的整合、存储和分享。
企业面临着各种数据类型、数据量和数据质量多样的挑战,如何有效地收集、处理和管理这些数据,是企业知识管理的关键所在。
企业知识管理的目的是提高企业的创新能力、降低风险、提高效率和竞争力。
知识图谱技术可以帮助企业有效地实现知识管理的各种目标。
三、1、企业内部知识的整合和检索企业内部存在着海量的数据和信息,这些数据来源于不同的信息系统、文件和文档。
如何将这些数据进行整合和利用,是企业知识管理的难点之一。
知识图谱技术可以把企业内部数据进行语义链接,建立全面的知识库。
这样一来,企业员工可以通过知识图谱技术,快速地查询到所需的知识和信息。
2、知识图谱技术在企业决策中的作用企业管理层需要通过各种数据和信息,做出正确的决策。
知识图谱技术可以把不同的数据、信息进行语义链接和分析,从而对企业的运营和市场发展提供更为精准有效的决策支持。
知识图谱概述及应用

知识图谱概述及应用
知识图谱是一种用于表示和组织知识的技术,它能够将知识以图形的方式呈现出来,并通过建立实体、关系和属性之间的链接,形成一个包含丰富语义信息的知识结构。
知识图谱可以帮助人们更好地理解和利用海量的知识资源,促进知识的共享和交流。
知识图谱的应用非常广泛,以下是一些常见的应用领域:
1.问答系统:知识图谱可以用于构建智能问答系统,通过将问题和答案映射到知识图谱中的实体和关系,实现对问题的准确理解和精确回答。
2.引擎优化:知识图谱可以用于引擎的优化,通过将结果与知识图谱中的实体和关系进行匹配,提供更准确和有关联的结果。
3.推荐系统:知识图谱可以用于推荐系统中的个性化推荐,通过分析用户的兴趣和行为数据,结合知识图谱中的实体和关系,为用户提供个性化的推荐信息。
4.信息抽取:知识图谱可以用于自动化信息抽取,从非结构化的文本数据中提取实体和关系,并将其映射到知识图谱中的结构化数据中,方便后续的分析和利用。
5.智能机器人:知识图谱可以用于构建智能机器人,通过将机器人需要的知识和信息组织成知识图谱,使机器人能够更好地理解和回答用户的问题。
6.语义:知识图谱可以用于语义,通过将语句与知识图谱中的实体和关系进行匹配,实现更准确和有意义的结果。
7.语义表达:知识图谱可以用于语义表达,通过将自然语言表达的文本映射到知识图谱中的实体和关系,实现对文本的语义理解和分析。
总之,知识图谱是一种强大的知识表示和组织技术,它在各个领域都有广泛的应用。
通过构建和利用知识图谱,我们可以更好地组织和管理知识,实现对知识的智能化利用。
未来随着知识图谱技术的发展和应用场景的扩大,相信它将在人们的日常生活和各个行业中发挥更加重要的作用。
知识图谱技术在智慧教育中的应用

知识图谱技术在智慧教育中的应用智慧教育是近年来教育行业的一个新兴概念,也是教育信息化的创新形态。
它使用先进的技术手段来实现教育教学的个性化、差异化和协同化,以更好地服务于学生的学习和发展。
而知识图谱技术的应用则为智慧教育的发展提供了一种全新的思路。
本文将探讨知识图谱技术在智慧教育中的应用,以期为读者提供新的视角和思考。
一、知识图谱技术概述知识图谱技术是一种基于本体论和语义网络的思想,通过对语义信息进行建模和分析,实现对知识的表述、存储、查询和推理。
与传统的关系式数据库不同,知识图谱技术能够更好地描述复杂的实体和关系,并支持语义上的推断和智能处理。
目前,知识图谱技术已经广泛应用于搜索引擎、机器人智能、自然语言处理等领域,并为产业和社会带来了巨大的价值。
二、知识图谱技术在教育领域的应用1. 个性化教育传统的教学模式往往是一刀切的,缺少针对学生个体差异的考虑。
而基于知识图谱技术的个性化教育则能够在形成学习者画像的基础上,为每个学生提供个性化的学习路径和推荐内容,帮助学生更好地攻克学习难点和培养自主学习能力。
例如,学生在学习某个知识点时,可以通过知识图谱技术将该知识点与相关的知识点建立起关联,形成知识关系图谱。
接着,教育系统可以根据本体和推荐算法对学习者的个性化学习路径和内容进行分析和优化,从而让学生更加高效地掌握知识。
这种方法不仅能够提高学生的学习效果,还能够帮助教师更好地了解学生的学习状态和需求。
2. 智能辅助教学知识图谱技术也能够用于教师的智能辅助教学。
在教学过程中,教师可以通过教育系统中的知识图谱模块,查询相关的知识点和教学资源。
同时,系统也可以通过分析学生的学习记录和提问等行为,为教师提供相应的建议和支持,帮助教师更好地指导学生。
另外,智能辅助教学还可以让教师更加科学地进行教学评估和反馈,进一步优化教学效果。
3. 课程设计和资源整合除了个性化教育和智能辅助教学外,知识图谱技术还能够用于课程设计和资源整合。
知识图谱构建与应用分析

知识图谱构建与应用分析随着人工智能技术的不断发展与深入,人们对于知识的获取、存储、处理和应用的要求也在不断提高。
知识图谱作为人工智能时代的一种新型的知识表示、存储、处理和应用方式,已经成为了人工智能技术研究的重要方向之一。
一、知识图谱概述知识图谱是一种描述实体之间关系的复杂图形模型,由三元组(subject,predicate,object)组成的数据结构组成。
其中,subject表示实体,predicate表示实体之间的关系,object表示实体的属性或者其他实体。
知识图谱的构建过程一般包括三个阶段:知识抽取、知识表示和知识维护。
知识抽取是指从海量的数据中抽取出有用的信息,包括实体的识别、属性的提取和关系的抽取。
知识表示是指将抽取出来的知识以符号逻辑的形式表示。
知识维护则是指对知识图谱进行更新、维护和扩充,以保证其与现实世界的同步。
二、知识图谱的构建技术知识图谱的构建技术主要包括:实体识别、实体类别分类、属性提取、关系抽取和知识表示等。
实体识别是指从文本中自动识别出具有独特标识的实体,包括人物、组织、地点、事件等。
实体类别分类是指为实体进行分类,例如把人物分为政治家、明星、企业家等。
属性提取是指从实体描述中提取出有用的属性信息,并进行分类和逐级抽象。
关系抽取是指在文本中自动抽取实体之间的语义关系,例如“X是Y的作者”、“X是Y的主要组成部分”等。
知识表示是指将抽取的知识以符号逻辑的形式表示,例如采用RDF、OWL等知识表示方法。
三、知识图谱的应用分析知识图谱的应用范围非常广泛,主要包括自然语言处理、智能问答、推荐系统、金融风险管理、医疗诊断等方面。
在自然语言处理方面,知识图谱可以用来识别实体、进行实体链接、抽取实体间关系等,从而为机器翻译、信息检索、文本摘要等任务提供基础支持。
在智能问答方面,知识图谱可以提高问答系统的准确性和交互效率。
例如,当用户提问“谁是《红楼梦》的作者?”时,通过知识图谱可以快速找到答案“曹雪芹”。
知识图谱技术在智能教育中的应用研究

知识图谱技术在智能教育中的应用研究随着科技的发展,智能教育成为了当今热议的话题。
其中,知识图谱技术受到了广泛关注,它被认为是推动智能教育发展的一项关键技术。
那么,什么是知识图谱技术?如何应用在智能教育中?这些问题都将在本文中得到解答。
一、知识图谱技术概述知识图谱技术是一种将结构化和半结构化的数据转化为计算机可读的形式的技术,它通过建立实体、属性和关系之间的知识网络,形成一个具有丰富语义信息的知识库。
这种网络结构能够在计算机中进行推理、计算和查询,帮助人们更好地理解、利用数据。
二、知识图谱技术在教育中的应用知识图谱技术在教育中的应用,主要分为以下四个方面。
1.智能化推荐智能化推荐是知识图谱技术在教育领域中的重要应用之一。
利用知识图谱技术,可建立学习者、教师、课程、知识点等实体之间的关系,根据学习者的兴趣、能力、学习历史等因素,推荐适合的教师、课程、学习路径以及问题解决方案等,并通过不断学习和迭代,不断优化推荐结果。
2.知识点关联知识图谱技术可以将学科知识点之间的相互关系和依赖关系建立起来,从而达到更好的知识点关联效果。
它可以帮助学生更好地理解和掌握学科的知识,促进教学、学习的有效开展。
3.学习路径规划利用知识图谱技术,可以将学科知识点、课程、学习资源等相关数据进行建模,并通过算法计算出最优学习路径。
这也就是说,学习者可以通过自主选择学习路径来达到学习目标,从而实现个性化学习和优化学习效果。
4.智能评估知识图谱技术可以根据学习者的学习历史、学科知识点关系等信息,对其学习成果进行智能评估。
通过算法分析,可以得出学习者的学习情况和水平,帮助教师了解学生的学习状态,为其提供更准确、个性化的教学建议。
三、知识图谱技术在教育中的优势知识图谱技术在教育中具有以下优势:1.知识图谱技术可以将非结构化的教育数据转化为结构化的数据,为智能教育提供更强的数据支持和分析能力。
2.通过知识图谱技术的建模和分析,可以更好地了解学生的学习状态和学习进程,从而提供个性化的学习环境和优化的学习策略。
知识图谱技术在知识管理系统中的应用

知识图谱技术在知识管理系统中的应用知识管理系统是一种通过存储、组织和分享知识以提升组织绩效的工具。
而知识图谱技术作为一种能够将信息与知识之间的关系进行有效表达和建模的方法,已经在知识管理系统中发挥着重要的作用。
本文将详细探讨知识图谱技术在知识管理系统中的应用,并分析其优势和挑战。
一、知识图谱技术概述知识图谱是一种以图模型为基础,利用语义关联将信息与知识相连的数据表示方法。
知识图谱由实体、属性和关系构成,可以通过节点和边的连接关系来表示知识的组织结构和语义关联。
知识图谱技术可以帮助将大量分散的数据和知识进行整合,提供更加直观且易于理解的知识表达方式。
二、知识图谱在知识管理系统中的优势1. 知识组织和检索能力:知识图谱技术可以将大规模的知识和信息进行语义关联,形成结构化的图谱,使得系统能够更加高效地组织和检索知识。
用户可以通过图谱的关系路径找到相关的知识,从而更快地解决问题和获取所需信息。
2. 知识可视化和推理能力:知识图谱可以通过可视化展示的方式将知识呈现给用户,使得用户更容易理解和利用知识。
此外,知识图谱还能够通过推理引擎实现知识的自动推理和推荐,帮助用户发现隐藏在知识之中的潜在关联和价值。
3. 知识共享和协同能力:知识图谱可以提供多用户协同编辑和分享的功能,使得团队成员能够共同构建知识图谱、分享经验和洞察。
这有助于团队的知识共享和协同创新,提高组织的整体绩效和竞争力。
三、知识图谱在知识管理系统中的具体应用1. 知识图谱驱动的知识图谱系统:基于知识图谱技术,可以构建一个完整的知识管理系统。
该系统通过知识图谱对知识进行结构化组织和语义关联,实现知识的存储、搜索、发布和共享等功能。
2. 专业领域知识图谱:通过构建专业领域的知识图谱,可以将领域内的知识进行整合和表达。
这对于专业人士和决策者来说,能够提供更加全面和深入的领域知识支持,帮助他们做出更好的决策。
3. 企业内部知识图谱:知识图谱可以帮助企业构建内部的知识图谱系统,将企业内部的知识进行整合和共享。
知识图谱及其在自然语言处理中的应用

知识图谱及其在自然语言处理中的应用一、前言随着互联网和人工智能技术的不断发展,数据量的剧增和日益高效应用的需求,人类处理和利用数据的能力面临着巨大挑战。
知识图谱(knowledge graph)因其清晰的结构、丰富的关联性和高效的查询能力,成为数据管理和智能应用领域的一种重要工具。
本文将介绍知识图谱的基本概念和构建方法,并着重探讨其在自然语言处理中的应用。
二、知识图谱概述知识图谱被认为是将自然语言文字转化为可计算的知识表示形式的一种重要途径。
它是由一系列实体、属性和关系构成的图形化知识库,在知识表达、知识检索和数据挖掘等方面具有广泛的应用。
知识图谱的核心是实体、属性和关系,分别表示了实际世界中的事物、这些事物的属性和它们之间的关联。
其中,实体通常指人、地点、组织、事件等具有实际意义的概念,属性用于描述实体的特征或状态,关系则表示实体之间的联系或连接。
知识图谱的构建可以通过多种方法实现。
最常用的是基于本体学(ontologies)的方法,即对实体、属性和关系进行分类和描述,然后将它们组织为一个层次结构,在不同层次之间建立关联。
另一种方法是基于信息抽取(information extraction)的自动构建方法,通过自然语言处理技术自动从大规模文本中抽取实体、属性和关系信息,创建一张庞大的知识图谱。
三、知识图谱在自然语言处理中的应用3.1 实体识别(entity recognition)实体识别是指从自然语言文本中识别出具有特定语义的实体。
知识图谱中的实体通常是由一个唯一的标识符和一些属性描述组成的,因此实体识别可以被看作是自然语言文本和知识图谱之间的桥梁。
实体识别的结果可以直接用于索引、检索和推荐等任务,也可以与其他自然语言处理技术相结合,如关系抽取和事件识别等。
已有的一些知识图谱中包含了大量的实体、关系信息,例如维基百科、Freebase和YAGO等。
3.2 关系抽取(relation extraction)关系抽取是指从自然语言文本中自动识别出实体之间的语义关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
导读:知识图谱 (Knowledge Graph) 是当前的研究热点。
自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。
各大互联网企业在之后的短短一年纷纷推出了自己的知识图谱产品以作为回应。
比如在国,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。
那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融,知识图谱可以有哪方面的应用呢?目录:1. 什么是知识图谱?2. 知识图谱的表示3. 知识图谱的存储4. 应用5. 挑战6. 结语1.什么是知识图谱?知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。
在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。
知识图谱是关系的最有效的表示方式。
通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。
知识图谱提供了从“关系”的角度去分析问题的能力。
知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。
不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。
比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。
另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。
这就说明搜索引擎通过知识图谱真正理解了用户的意图。
上面提到的知识图谱都是属于比较宽泛的畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。
接下来我们看一下特定领域里的 (Domain-Specific) 知识图谱表示方式和应用,这也是工业界比较关心的话题。
2.知识图谱的表示假设我们用知识图谱来描述一个事实(Fact) - “三是四的父亲”。
这里的实体是三和四,关系是“父亲”(is_father_of)。
当然,三和四也可能会跟其他人存在着某种类型的关系(暂时不考虑)。
当我们把也作为节点加入到知识图谱以后(也是实体),人和之间也可以定义一种关系叫 has_phone,就是说某个是属于某个人。
下面的图就展示了这两种不同的关系。
另外,我们可以把时间作为属性(Property)添加到 has_phone 关系里来表示开通的时间。
这种属性不仅可以加到关系里,还可以加到实体当中,当我们把所有这些信息作为关系或者实体的属性添加后,所得到的图谱称之为属性图(Property Graph)。
属性图和传统的RDF格式都可以作为知识图谱的表示和存储方式,但二者还是有区别的,这将在后面章节做简单说明。
3.知识图谱的存储知识图谱是基于图的数据结构,它的存储方式主要有两种形式:RDF存储格式和图数据库(Graph Database)。
至于它们有哪些区别,请参考【1】。
下面的曲线表示各种数据存储类型在最近几年的发展情况。
从这里我们可以明显地看到基于图的存储方式在整个数据库存储领域的飞速发展。
这幅曲线图来源于db-engines./en/blog_post//43下面的列表表示的是目前比较流行的基于图存储的数据库排名。
从这个排名中可以看出neo4j在整个图存储领域里占据着NO.1的地位,而且在RDF领域里Jena还是目前为止最为流行的存储框架。
这部分数据来源于db-engines./en/ranking当然,如果需要设计的知识图谱非常简单,而且查询也不会涉及到1度以上的关联查询,我们也可以选择用关系型数据存储格式来保存知识图谱。
但对那些稍微复杂的关系网络(现实生活中的实体和关系普遍都比较复杂),知识图谱的优点还是非常明显的。
首先,在关联查询的效率上会比传统的存储方式有显著的提高。
当我们涉及到2,3度的关联查询,基于知识图谱的查询效率会高出几千倍甚至几百万倍。
其次,基于图的存储在设计上会非常灵活,一般只需要局部的改动即可。
比如我们有一个新的数据源,我们只需要在已有的图谱上插入就可以。
于此相反,关系型存储方式灵活性方面比较差,它所有的Schema 都是提前定义好的,如果后续要改变,它的代价是非常高的。
最后,把实体和关系存储在图数据结构是一种符合整个故事逻辑的最好的方式。
4.应用在本文中,我们主要讨论知识图谱在互联网金融行业中的应用。
当然,很多应用场景和想法都可以延伸到其他的各行各业。
这里提到的应用场景只是冰山一角,在很多其他的应用上,知识图谱仍然可以发挥它潜在的价值,我们在后续的文章中会继续讨论。
反欺诈反欺诈是风控中非常重要的一道环节。
基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。
而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。
知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。
首先,知识图谱提供非常便捷的方式来添加新的数据源,这一点在前面提到过。
其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为一台机器可以理解的结构化的知识。
在这里,我们不仅可以整合借款人的基本信息(比如申请时填写的信息),还可以把借款人的消费记录、行为记录、网上的浏览记录等整合到整个知识图谱里,从而进行分析和预测。
这里的一个难点是很多的数据都是从网络上获取的非结构化数据,需要利用机器学习、自然语言处理技术把这些数据变成结构化的数据。
不一致性验证不一致性验证可以用来判断一个借款人的欺诈风险,这个跟交叉验证类似。
比如借款人三和借款人四填写的是同一个公司,但三填写的公司和四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。
再比如,借款人说跟三是朋友关系,跟四是父子关系。
当我们试图把借款人的信息添加到知识图谱里的时候,“一致性验证”引擎会触发。
引擎首先会去读取三和四的关系,从而去验证这个“三角关系”是否正确。
很显然,朋友的朋友不是父子关系,所以存在着明显的不一致性。
不一致性验证涉及到知识的推理。
通俗地讲,知识的推理可以理解成“预测”,也就是从已有的关系图谱里推导出新的关系或。
比如在上面的例子,假设三和四是朋友关系,而且三和借款人也是朋友关系,那我们可以推理出借款人和四也是朋友关系。
组团欺诈相比虚假身份的识别,组团欺诈的挖掘难度更大。
这种组织在非常复杂的关系网络里隐藏着,不容易被发现。
当我们只有把其中隐含的关系网络梳理清楚,才有可能去分析并发现其中潜在的风险。
知识图谱,作为天然的关系网络的分析工具,可以帮助我们更容易地去识别这种潜在的风险。
举一个简单的例子,有些组团欺诈的成员会用虚假的身份去申请贷款,但部分信息是共享的。
下面的图大概说明了这种情形。
从图中可以看出三、四和王五之间没有直接的关系,但通过关系网络我们很容易看出这三者之间都共享着某一部分信息,这就让我们马上联想到欺诈风险。
虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更佳便捷的分析手段。
异常分析(Anomaly Detection)异常分析是数据挖掘研究领域里比较重要的课题。
我们可以把它简单理解成从给定的数据中找出“异常”点。
在我们的应用中,这些”异常“点可能会关联到欺诈。
既然知识图谱可以看做是一个图(Graph),知识图谱的异常分析也大都是基于图的结构。
由于知识图谱里的实体类型、关系类型不同,异常分析也需要把这些额外的信息考虑进去。
大多数基于图的异常分析的计算量比较大,可以选择做离线计算。
在我们的应用框架中,可以把异常分析分为两大类:静态分析和动态分析,后面会逐一讲到。
- 静态分析所谓的静态分析指的是,给定一个图形结构和某个时间点,从中去发现一些异常点(比如有异常的子图)。
下图中我们可以很清楚地看到其中五个点的相互紧密度非常强,可能是一个欺诈组织。
所以针对这些异常的结构,我们可以做出进一步的分析。
- 动态分析所谓的动态分析指的是分析其结构随时间变化的趋势。
我们的假设是,在短时间知识图谱结构的变化不会太大,如果它的变化很大,就说明可能存在异常,需要进一步的关注。
分析结构随时间的变化会涉及到时序分析技术和图相似性计算技术。
有兴趣的读者可以去参考这方面的资料【2】。
失联客户管理除了贷前的风险控制,知识图谱也可以在贷后发挥其强大的作用。
比如在贷后失联客户管理的问题上,知识图谱可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收的成功率。
现实中,不少借款人在借款成功后出现不还款现象,而且玩“捉迷藏”,联系不上本人。
即便试图去联系借款人曾经提供过的其他联系人,但还是没有办法联系到本人。
这就进入了所谓的“失联”状态,使得催收人员也无从下手。
那接下来的问题是,在失联的情况下,我们有没有办法去挖掘跟借款人有关系的新的联系人?而且这部分人群并没有以关联联系人的身份出现在我们的知识图谱里。
如果我们能够挖掘出更多潜在的新的联系人,就会大提高催收成功率。
举个例子,在下面的关系图中,借款人跟四有直接的关系,但我们却联系不上四。
那有没有可能通过2度关系的分析,预测并判断哪些四的联系人可能会认识借款人。
这就涉及到图谱结构的分析。
智能搜索及可视化展示基于知识图谱,我们也可以提供智能搜索和数据可视化的服务。
智能搜索的功能类似于知识图谱在Google, Baidu上的应用。
也就是说,对于每一个搜索的关键词,我们可以通过知识图谱来返回更丰富,更全面的信息。
比如搜索一个人的号,我们的智能搜索引擎可以返回与这个人相关的所有历史借款记录、联系人信息、行为特征和每一个实体的标签(比如黑,同业等)。
另外,可视化的好处不言而喻,通过可视化把复杂的信息以非常直观的方式呈现出来,使得我们对隐藏信息的来龙去脉一目了然。
精准营销“A knowledge graph allows you to take core information a bout your customer—their name, where they reside, how to contact them—and relate it to who else they know, how they interact on the web, and more”-- Michele Goetz, a Principal Analyst at Forrester Research一个聪明的企业可以比它的竞争对手以更为有效的方式去挖掘其潜在的客户。