知识图谱在互联网金融行业的应用

合集下载

工商银行企业级金融知识图谱建设与实践

工商银行企业级金融知识图谱建设与实践

INTEGRATION工商银行企业级金融知识图谱建设与实践随着移动互联网、物联网等技术的快速发展,金融行业的数据呈现爆炸式增长态势,利用大数据与人工智能等技术挖掘数据价值、赋能业务,成为金融行业智能化转型的新常态。

知识图谱技术作为深化人工智能应用的重要手段,以一种更贴近人类视角的方式来描述客观世界实体及其相互关系,深度挖掘数据背后的价值,进而赋予机器理解数据、识别概念、发现知识的能力,是实现认知智能的重要基石。

目前,知识图谱技术已在众多行业广泛应用。

工商银行自2018年初率先运用知识图谱技术以来,已打造出同业领先、安全可控、功能完备的企业级知识图谱平台,沉淀企业级金融知识图谱数据资产,并将该平台广泛应用于工商银行客户服务、风险防控、产品创新等各业务领域,在获客增收、风险防控、降本增效等方面取得良好成效。

一、打造企业级知识图谱平台,加速图谱场景规模化落地工商银行秉持“科技驱动,价值创造”的发展理念,积极打造了集大规模图数据库、高性能图计算引擎及图谱构建流水线于一体的企业级知识图谱平台(如图1所示),支撑全行知识图谱的规模化生产及场景赋能。

经过近三年的建设,工商银行企业级知识图谱平台已具备性能强劲、算法丰富、简单易用、灵活可靠四大技术特点。

1.性能强劲工商银行基于开源技术自主研发分布式图数据库,通过实现分布式并行图加载、优化图查询算法等方式大幅提升图存储、查询性能,其中图导入、查询的性能较应用开源JanusGraph提升10~20倍。

截至目前,该平台可支持百亿级节点、千亿级关系的存储和查询,扩线、路径查询毫秒级响应,自主创新和研发能力同业领先。

2.算法丰富工商银行结合金融场景自主研发了30多种图分析挖掘算法及通用场景模型算法,包括带条件环路识别、交易链路追踪、加权社区划分等图分析算法,以及DeepWalk、GraphSAGE、GCN等图表示学习算法,满足中国工商银行软件开发中心大数据与人工智能实验室 贾玉红融合发展Integration and Development了全行图分析、图推理的需求。

智能客服中的知识图谱应用案例

智能客服中的知识图谱应用案例

智能客服中的知识图谱应用案例智能客服是当今互联网时代的一大创新,给企业提供了更高效、便捷的客户服务方式。

而在智能客服系统中,知识图谱的应用起到了至关重要的作用。

本文将通过介绍几个实际案例,展示知识图谱在智能客服中的应用和效果。

一、电商客服知识图谱电商行业中,客服工作一直是一项繁重且持续增长的工作。

为了提高客服效率和解决客户问题的准确性,许多电商企业开始引入知识图谱。

知识图谱通过将各类商品、常见问题、售后流程等信息进行语义建模和连接,形成一个完整的知识网络。

当用户提出问题后,智能客服系统可以通过检索知识图谱中的相关节点,给出准确的回答或建议。

这大大减轻了客服人员的负担,同时提升了客户的满意度。

二、医疗健康客服知识图谱医疗健康领域也是一个重要的智能客服应用场景。

传统的医疗客服往往会面临信息量大、专业性强的问题。

而知识图谱的引入可以有效解决这一问题。

在医疗健康客服系统中,知识图谱可以整合医学知识、病例分析、药物指南等相关信息,形成一个完整的医疗知识网络。

当用户咨询疾病、用药等问题时,智能客服系统能够通过检索知识图谱中的设定节点,提供准确的答案和建议。

此外,知识图谱还可以对用户的健康档案进行管理和分析,为用户提供个性化的健康指导和推荐,提升客户体验。

三、金融客服知识图谱金融行业对于安全和准确性要求极高,因此在智能客服系统中的知识图谱应用尤为重要。

在金融服务领域,知识图谱被用于整合各类金融产品、政策规定、风控模型等信息,并与实时市场数据进行关联。

当用户咨询贷款产品、投资理财等问题时,智能客服系统可以通过检索知识图谱中的相关节点,给出准确的解答和建议。

同时,知识图谱还可以帮助智能客服系统识别用户风险偏好和需求,为用户提供个性化的金融咨询和服务。

总结:智能客服的发展离不开知识图谱的应用。

通过建立知识图谱,智能客服系统可以从大量的信息中快速准确地找到答案,为用户提供高效的服务。

电商、医疗健康、金融等领域都已经开始应用知识图谱技术,取得了显著的成效。

知识图谱构建与应用技术的发展趋势与创新思路

知识图谱构建与应用技术的发展趋势与创新思路

知识图谱构建与应用技术的发展趋势与创新思路随着人工智能技术的迅猛发展,知识图谱作为知识表示与推理的重要工具,在各个领域中发挥着越来越重要的作用。

知识图谱的构建与应用技术不断创新,为人们在信息获取、语义理解和智能决策等方面提供了新的思路和方法。

本文将从知识图谱构建的新技术、知识图谱应用的新领域以及知识图谱的未来发展趋势与创新思路等方面进行探讨。

一、知识图谱构建的新技术1. 自动化知识抽取技术:传统的知识图谱构建需要大量的人工劳动,而自动化知识抽取技术可以从海量的文本中自动地抽取出结构化的知识,并将其构建成知识图谱。

这种技术通过机器学习和自然语言处理等方法,能够高效地提取实体、关系和属性等信息,为知识图谱的构建提供了更快速、更准确的方式。

2. 开放知识图谱构建方法:传统的知识图谱构建主要依赖于专家知识和人工标注,但是这种方法存在着知识更新慢、领域专业度差的问题。

而开放知识图谱构建方法则通过利用互联网上大量的公开知识,结合自动化知识抽取技术,构建起丰富而准确的知识图谱。

这种方法的优势在于能够快速构建和更新知识图谱,并且可以适应不同领域的知识需求。

3. 迁移学习在知识图谱构建中的应用:迁移学习是一种利用源领域的知识来提升目标领域学习性能的方法。

在知识图谱构建中,迁移学习可以从已有的知识图谱中迁移相关的实体和关系等信息,加速构建新的知识图谱。

这种方法可以大大减少新知识图谱构建的工作量,并且提高构建的效果。

二、知识图谱应用的新领域1. 金融领域的应用:知识图谱在金融领域的应用可以帮助金融机构更好地理解和分析客户需求,降低风险,并提供个性化的服务。

通过建立金融知识图谱,可以将大量的结构化和非结构化数据整合起来,识别出潜在的关联和趋势,为金融业务的决策提供支持。

2. 医疗领域的应用:知识图谱在医疗领域的应用可以提供医疗知识的整合和共享,辅助医生进行疾病诊断和治疗方案制定。

通过将医学文献、临床实验室数据和患者健康记录等信息整合到知识图谱中,可以提供更准确和个性化的医疗建议,提高医疗决策的效果。

基于知识图谱的数据挖掘与预测研究

基于知识图谱的数据挖掘与预测研究

基于知识图谱的数据挖掘与预测研究随着互联网的普及,数据已经成为了当今社会发展的核心之一。

在大数据时代背景下,如何从数据中提取有价值的信息,进而做出正确的决策已经成为了各个领域的难题。

在这个背景下,基于知识图谱的数据挖掘和预测研究变得越来越重要。

一、知识图谱的定义和结构知识图谱被定义为一种用于表示知识和关系的图结构。

它可以将各种实体和概念构成的知识表示成一个节点,并通过边表示它们之间的关系。

通过这种方式相互之间是可以自动推理和补充信息的。

知识图谱在结构上可以被分为三层:实体层、关系层和属性层。

实体层包含了各种实体和概念;关系层通过边来表示实体之间的关系;属性层则包含了每个实体的特征和属性。

二、基于知识图谱的数据挖掘基于知识图谱的数据挖掘可以通过图谱中的实体、关系和属性进行分析,发现隐藏在数据中的未知规律和趋势,进而实现精准的数据预测和决策。

以癌症治疗为例,使用知识图谱,我们可以将各种治疗方案、病理学参数和治疗结果等实体构成一个图谱,并通过边来表示它们之间的关系。

利用知识图谱中的属性进行分析,我们可以找到最佳治疗方案和最优的治疗时间,进而实现更精准的癌症治疗。

另一方面,利用知识图谱可以快速地检索和整合大量的医学文献和临床实验数据,得出相关的治疗结果和发现新的治疗指南,提高医疗决策的正确性和精度。

三、基于知识图谱的数据预测基于知识图谱的数据预测可以通过对知识图谱中的实体、关系和属性进行分析,利用分类、回归和聚类等机器学习算法,找到隐藏在数据中的规律和趋势,从而对未来的趋势进行预测。

以金融行业为例,使用知识图谱,我们可以将各种经济指标、公司舆情和政治因素等实体构成一个图谱,并通过边来表示它们之间的关系。

利用知识图谱中的属性和历史数据进行分析,我们可以对未来市场趋势进行预测,找到最佳的投资机会和风险防范策略。

另一方面,利用知识图谱可以对复杂的社交网络进行分析,找到潜在的风险和机会。

例如,利用社交网络中的实体和关系进行分析,可以检测到潜在的诈骗活动和不良交易,进而实现更有效的反欺诈和反洗钱策略。

知识图谱在金融行业中的应用

知识图谱在金融行业中的应用
知识图谱在金融 行业中的应用
课程主标题
课程概要
1 知识图谱概述 2 知识图谱在金融领域的应用 3 知识图谱的构建流程 4 案例分享
课程主标题
01 知识图谱概述
什么是知识图谱
知识图谱(Knowledge Graph),在图书 情报界称为知识域可视化或知识领域映 射地图,是显示知识发展进程与结构关 系的一系列各种不同的图形,用可视化 技术描述知识资源及其载体,挖掘、分 析、构建、绘制和显示知识及它们之间 的相互联系。
a)“ 姚明出生于上海” b )“ 姚明是篮球运动员” c)“ 姚明是现任中国篮协主席”
知识图谱的表示形式
在知识图谱中,我们用RDF形式化地表示这种三元关系。RDF(Resource Description Framework), 即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型。RDF图中一共有三种类 型,International Resource Identifiers(IRIs),blank nodes 和 literals。下面是SPO每个部分的类型约 束: 1.Subject可以是IRI或blank node。 2.Predicate是IRI。 3.Object三种类型都可以。
课程主标题
02 知识图谱在金融领域的应用
知识图谱的典型应用领域
金融风控类应用
1、反欺诈应用: 最近几年,金融欺诈的形式多种多 样,提供虚假资料,团伙欺诈,内外 勾结等手法越来越“高明”。 在这种情况下,原来通过单点突破进 行反欺诈的方法已经远远不够,需要 我们建立起一个积极有效的知识图 谱。
内审内控应用
深挖客户潜在需求
除了挖掘潜在客户外,我们也需要挖 掘现有客户的需求,针对他们的特点 推送相关产品。

知识图谱与大数据的融合应用

知识图谱与大数据的融合应用

知识图谱与大数据的融合应用随着互联网时代的到来,我们进入了一个信息爆炸的时代,每天都可以收到大量的信息流。

这些信息数据虽然对我们的生活、工作、学习等方面带来很大的便利,但同时也带来了繁琐的分析和处理工作。

为了更好地管理和利用这些数据,人们开始尝试将大数据与知识图谱融合起来,实现对信息数据的更高效管理和分析利用。

那么,知识图谱和大数据融合的具体应用有哪些呢?本文将为您详细介绍。

一、概念解析首先需要解释什么是知识图谱和大数据。

知识图谱是由Google、百度等公司发展而来的一种用于建立语义关联性的数据图谱。

知识图谱是以实体为核心,将实体之间的关系用图结构进行描述,可以轻松实现不同数据源的数据共享和复用,从而促进信息的共享和交流。

而大数据是指数据集的大小、增速或复杂度等超出常规数据处理能力的数据集。

大数据的处理一般需要借助分布式架构、并行计算和分布式存储等技术,以实现高效的数据收集并处理能力。

二、知识图谱与大数据的共同点知识图谱和大数据都是面向数据的技术,它们之间存在许多共同点。

首先,它们都致力于对海量数据进行分析、建模和管理。

其次,它们都使用了分布式存储和计算技术,以提高数据处理的效率和能力。

最后,它们都可以帮助企业和个人更好地处理和分析数据,以实现精细化管理和高效利用。

三、知识图谱与大数据融合的应用1.智能问答基于知识图谱构建的智能问答系统可以对用户问题进行深入的分析和解答,从而为用户提供优质的服务。

而融合了大数据的智能问答系统具有更高的准确率和可靠性。

例如,百度的知识图谱可以对用户的查询进行自动分类,并提供相关联的答案,同时还可提供与此相关的其他问题。

2.金融风控在金融领域中,通过构建实时数据采集、分析、建模和决策的信息系统,可以对金融产品和交易实现风险控制和预测。

这种系统需要建立基于知识图谱的实体库,并结合大数据分析技术进行风险评估和事件检测。

这种基于知识图谱和大数据的金融风控系统为金融机构提供了更加安全可靠的服务。

知识图谱构建技术与应用

知识图谱构建技术与应用

知识图谱构建技术与应用随着人工智能的不断发展和普及,各种技术手段都在迅速壮大,其中知识图谱构建技术是非常领先的一种技术手段。

它是一种利用人工智能技术解决知识管理和知识利用的方法,可以帮助人们更高效地获取、处理和利用信息,提高知识的利用价值和深度,让知识使用更加智能化和方便化。

本文将为您介绍知识图谱构建技术以及其在各种应用场景中的具体应用情况。

一、知识图谱构建技术的概念和优势知识图谱构建技术是一种基于知识表示的技术,通过数据挖掘和自然语言处理等技术,将散乱的知识元素加以关联和整合,形成一张具备结构化和语义表示的图谱,以便于更加直观地展示知识的各个层面和关系,让人们更容易地理解、维护、推理和使用知识。

与传统的知识管理系统相比,知识图谱具有以下几个重要的优势:1.结构化:知识图谱通过层级结构展示了知识元素之间的那种关系,把非结构化的信息转化为了结构化的数据,大大提高了信息的可读性和可视化性。

2.语义化:知识图谱主要体现的是具体对象之间及其属性之间的关系,对于同一个实体,可能有多种描述方式,知识图谱可以将这些描述方式统一起来,以便于对于知识的语义推理。

3.可扩展性:知识图谱的结构化和语义化让其易于扩展,新的知识点可以非常容易地加入到已有的图谱之中,保证了知识库的持续更新。

4.智慧化:知识图谱的智能化可以帮助我们更方便、更快、更准确的查询和获取信息。

二、知识图谱的构建流程知识图谱的构建流程比较复杂,主要包含了数据抽取、数据清洗、实体识别、关系抽取和关系推理几个关键步骤:1.数据抽取:一般是从互联网或企业内部系统采集原始数据,如网页、论文、报告、产品文档等;2.数据清洗:将原始数据进行过滤,去掉重复、错误、缺失等问题,以保证后续的处理的质量;3.实体识别:将数据中的各种知识元素通过NLP技术将其识别出来,包括实体、属性和关系;4.关系抽取:在已识别出的实体之间,利用各种关系抽取技术自动抽取出它们之间的联系;5.关系推理:通过推理引擎,对已有的知识进行深层次的推理,同时根据推理结果反向更新知识图谱中的实体和关系,打破原有知识图谱的局限性,扩大知识图谱的规模及呈现更多可能性的信息。

知识图谱在银行业的应用分析

知识图谱在银行业的应用分析

一、知识图谱的概念及应用1.知识图谱的概念知识图谱于2012年5月16日由谷歌正式发布,本质是基于语义网的知识库,为了描述客观世界的概念、实体及其之间的关系,由点和边组成的一种非结构化数据。

在知识图谱中,“点”表示客观世界存在的“实体”,“边”表示实体与实体之间的“关系”。

简而言之,知识图谱就是把不同类型的信息或实体进行关联而生成的一个关系网络,基于“关系”的维度来分析并解决问题。

2.知识图谱的应用当前,数据处于爆发式的增长阶段,信息服务应用逐渐向智能化方向发展,知识图谱技术已经在智能检索、智能问答、个性化推荐等领域得到广泛应用。

在智能检索应用中,系统不再局限于关键词的匹配,而是根据用户检索的环境及目的进行推理,进而呈现出更具层次化、结构化特征的检索结果。

同时,知识图谱可以让计算机理解人类的语言模式,从而智能化地反馈用户想要的信息。

百度、搜狗等搜索引擎发布了自己的知识图谱产品,如百度“知心”、搜狗“知立方”等。

知识图谱因其自身的图挖掘、图模型计算、数据可视化等优势,可以帮助银行业者在不同的业务场景下进行分析与决策,有利于建立客户画像,进行精准营销获客,更好地表达、分析银行业务场景的交易全貌。

二、知识图谱在银行业的应用随着互联网时代的到来,银行业信息化进程已逐渐发展到现在的人工智能金融,知识图谱不仅可以服务更多的银行业务场景,也可以☐ 上海浦东发展银行信息科技部 黄 炜 高岽鸣 陈 宁知识图谱在银行业的应用分析互联网的发展带来的是数据井喷式的增加,如何从海量的数据中获取有效信息成为银行需要面对的挑战。

在此背景下,知识图谱开始崭露头角。

与传统的数据存储结构不同,知识图谱是一种基于图的数据结构,将不同种类的信息连接在一起形成一个关系网络,进而可以提供从“关系”的角度分析问题、发现问题的方法。

本文就知识图谱在银行业的应用及发展进行深入阐述。

让业务场景的分析更加智能。

1.营销类应用知识图谱结合银行的客户信息,建立社交网络知识图谱模型,筛选与高净值客户具有共同或相似行为、偏好的潜在客户群体,分析并挖掘各类业务的潜在客户,制定精准营销策略,快速提升银行业务质量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

组团欺诈识别
• 相比虚假身份的识别,组团欺诈的挖掘难 度更大。这种组织在非常复杂的关系网络 里隐藏着,不容易被发现。当我们只有把 其中隐含的关系网络梳理清楚,才有可能 去分析并发现其中潜在的风险。知识图谱, 作为天然的关系网络的分析工具,可以帮 助我们更容易地去识别这种潜在的风险。
举一个简单的例子,有些组团欺诈的成员 会用虚假的身份去申请贷款,但部分信息 是共享的。下面的图大概说明了这种情形。 从图中可以看出张三、李四和王五之间没 有直接的关系,但通过关系网络我们很容 易看出这三者之间都共享着某一部分信息, 这就让我们马上联想到欺诈风险。虽然组 团欺诈的形式众多,但有一点值得肯定的 是知识图谱一定会比其他任何的工具提供 更佳便捷的分析手段。
3.把非结构化数据处理成结构化数据
• 在大数据时代,很多数据都是未经处理过的非结构化 数据,比如文本、图片、音频、视频等。特别在互联 网金融行业里,我们往往会面对大量的文本数据。
• 怎么从这些非结构化数据里提取出有价值的信息是一 件非常有挑战性的任务,这对掌握的机器学习、数据 挖掘、自然语言处理能力提出了更高的门槛。
四、知识图谱服务商
五、参考资料
一、什么是知识图谱 1. 知识图谱简介 2. 知识图谱的定义 3. 知识图谱的表示
1.知识图谱简介
• 知识图谱这个概念最早由Google提出,主要是用来 优化现有的搜索引擎。不同于基于关键词搜索的传 统搜索引擎,知识图谱可用来更好地查询复杂的关 联信息,从语义层面理解用户意图,改进搜索质量。 比如在Google的搜索框里输入Bill Gates的时候, 搜索结果页面的右侧还会出现Bill Gates相关的信 息比如出生年月、家庭情况等等。
4.通过知识推理得出隐藏的信息
• 推理能力是人类智能的重要特征,使得我们可以从已 有的知识中发现隐含的知识。常用的推理算法包括基 于逻辑的推理和基于概率的推理。
• 基于逻辑的推理:“父亲”的“父亲”可以推理出 “祖父”的关系。
• 基于概率的推理:张三的朋友很多也是李四的朋友, 那我们可以推测张三和李四也很有可能是朋友关系。
• 精准营销需要从大量客户中筛选出特定用户重点 营销,由于用户信息不全、用户数量巨大,使用 知识图谱的效果不如传统数据库。
• 风控的用户数量比营销要小若干数量级,而且用 户申请时填写了大量信息,使用知识图谱深度挖 掘用户信息,可以优化风控的各个环节。
2.分析方法
• 异常分析 • 不一致性验证 • 基于规则提取特征
2.数据清洗
• 数据中存在着很多的噪声,需要清洗数据。
• 第一,目前积累的数据本身有错误,所以这部分错误数据需要纠 正。
• 第二, 数据的冗余。比如借款人张三填写公司名字为“普惠” , 借款人李四填写的名字为“普惠金融” ,借款人王五则填写成 “普惠金融信息服务有限公司” 。虽然这三个人都隶属于一家 公司,但由于他们填写的名字不同,计算机则会认为他们三个是 来自不同的公司。那接下来的问题是,怎么从海量的数据中找出 这些存在歧义的名字并将它们合并成一个名字? 这就涉及到自 然语言处理中的“消歧分析”技术。
不一致性验证
当融合来自不同数据源的信息构成知识图谱 时,有一些实体会同时属于两个互斥的类别 (例如同时在两个不同的城市工作),或某 个实体所对应的一个属性(同一个人的住址) 对应多个值,这样就会出现不一致性,这个 不一致性即可判定为潜在的可疑点。
案例一:在下面的这个图中,李明和李飞两个人都注明了 同样的公司电话,但实际上从数据库中判断这俩人其实在 不同的公司上班,这就是一个矛盾点。
• 国内有海翼知(PlantData),明略数据(MiningLamp),海致 企业知识图谱(海致星图),文因互联(Memect),智器云科技 (火眼金睛、月光宝盒、天罗地网),艾匀科技(iEven),同 时代理IBM i2,智言科技(Webot),达观数据(Data Grand), 海知智能(ruyi.ai),渊亭科技(DataExa)。
关联方探查
通过图谱可以调查某个人或者某家申请贷款 公司的关联方信息。在贷款审核期间,申请 贷款主体的关联方信息中有借贷纠纷的诉讼 事件,担保方过多等可关注的风险点。在贷 款发放后,有时出现贷款方失联的情况,无 法通过申请贷款时提交的信息联系到借款方, 可以通探寻更“深远”的关联方找到失联的 贷款方。
异常分析
a. 静态分析
所谓的静态分析指的是,给定一个图形结构和某个时间点,从中去 发现一些异常点(比如有异常的子图)。下图中我们可以很清楚地 看到其中五个点的相互紧密度非常强,可能是一个欺诈组织。所以 针对这些异常的结构,我们可以做出进一步的分析。
b. 动态分析
所谓的动态分析指的是分析其结构随时间变化的趋势。我们的假设 是,在短时间内知识图谱结构的变化不会太大,如果它的变化很大, 就说明可能存在异常,需要进一步的关注。分析结构随时间的变化 会涉及到时序分析技术和图相似性计算技术。
• 问题:你了解的金融相关知识图谱服务商?
五、参考资料
• 2017云栖大会知识图谱专场 • AI赋能商业银行-海致智能金融知识图谱峰会 • 如何用机器学习和知识图谱来实现商业智能化? | CCAI
演讲实录 • 沈春泽:哪些黑科技正谱服务 规模增长160倍
三、知识图谱的技术问题
1. 获取海量数据 2. 清洗数据 3. 把非结构化数据处理成结构化数据 4. 通过知识推理得出隐藏的信息
1.获取海量数据
• 知识图谱需要结合大数据才能真正发挥作用。 • 行业中数据是否海量,是否有真正的大数据场景很重要。比如我
们熟知的公共安全和金融,数据量很大且丰富。公共安全系统中 的人、车、地、物、组织、出行、住宿甚至是快递数据繁多,才 形成了一个丰富数据的真实场景。 • 只有在真正的大数据场景下,知识图谱的作用才能够更好显现。
基于规则提取特征
案例一:从图中我们很容观察到二度关系中有两个实体触 碰了黑名单(黑名单由红色来标记)。
案例二:通过条件搜索指定的节点可以筛选调查风险节点, 如:“电话号码”节点的关联方大于1的节点。
3.应用案例
• 用户画像 • 组团欺诈识别 • 关联方探查
用户画像
1.基础应用:可以在图谱中直接搜索某个具体的人名字或者公司名 字,获取该人或者公司的基础信息画像,如电话,地址,关联方的 信息。
• 随着深度学习在人工智能领域的地位变得越来越重要, 基于概率的推理也成为目前研究的热点。
案例一:知识推理方法--机器学习
案例二:知识推理系统--计算知识引擎
四、知识图谱服务商
• 国外有Palantir,Kensho (已被 S&P Global 收购),IBM i2, derivo GmbH,MAANA,GraphPath。
3.高级应用:通过借款人的其他信息进行推理出其 相关信息进行验证
通过借款人的身份证号和姓名可以获得他的学历信 息和年龄,通过学历信息和年龄可以推算出其工作 年限,再根据其所在城市,行业,职位,结合互联 网上的招聘网站数据推理出其薪水范围,进而验证 他的收入水平;甚至可以通过不同借款人之间的同 事关系,验证其工作单位的真假。
2.中级应用:聚合各类数据源,逐步绘制出借款人 的用户画像,从而针对性识别欺诈风险。
以一个借款人举例,可以有身份证号、手机号、学 历等个人信息;可以有担保人或是亲属好友;有住 址、银行流水、工作单位等信息。
这些信息可由借款人自己填写、或是数据提供商提 供、或是在互联网上获得、甚至通过推理得到,往 往具有冗余性,可以通过一致性验证来确定信息的 可靠性。
• 明略数据张旭:知识图精准营销业务,研发企业知
识图谱平台 • 肖仰华:领域知识图谱落地实践中的问题与对策
案例一:借贷纠纷关联
案例二:失联客户管理
基于大数据的反欺诈
反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于: 1. 如何把不同来源的数据(结构化、非结构)整合在一起,并构建反欺
诈引擎,从而有效地识别出欺诈案件(比如身份造假、团体欺诈、代 办包装等)。 2. 不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的 挑战。
另外,对于稍微复杂的搜索语句比如 “Who is the wife of Bill Gates”,Google能准确返回他的妻子Melinda Gates。这就说明搜 索引擎通过知识图谱真正理解了用户的意图。
2.知识图谱的定义
• 知识图谱就是把所有不同种类的信息连接在 一起而得到的一个关系网络。在知识图谱里, 每个节点表示现实世界中存在的类别、实体、 属性等对象,每条边为对象之间的关系。知 识图谱提供了从“关系”的角度去分析问题 的能力。
案例一:五岳
案例二:国家、首都
3.知识图谱的表示
案例一:张三是李四的父亲,李四有一个电话
案例二:医疗
案例三:BAT相关影视传媒
二、知识图谱的应用
1.最主要的应用 2.分析方法 3.应用案例 4.基于大数据的反欺诈
1.最主要的应用
知识图谱在互联网金融中最主要的应用 是风险控制
知识图谱的需要的数据量大、技术复杂、运算时间 长、使用成本高于传统数据库,适用于数量较少、 信息较多、高价值用户的深度分析,不适合用于海 量低信息量用户的筛选。
知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。 1. 首先,知识图谱提供非常便捷的方式来添加新的数据源。 2. 其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以
帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
反欺诈的核心是人,首先需要把与借款人相关的所有的数 据源打通,并构建包含多数据源的知识图谱,从而整合成 为一台机器可以理解的结构化的知识。在这里,我们不仅 可以整合借款人的基本信息(比如申请时填写的信息), 还可以把借款人的消费记录、行为记录、网上的浏览记录 等整合到整个知识图谱里,从而进行分析和预测。这里的 一个难点是很多的数据都是从网络上获取的非结构化数据, 需要利用机器学习、自然语言处理技术把这些数据变成结 构化的数据。
相关文档
最新文档