零售关联关系图谱在反欺诈场景中的应用
网络学院(信息科技类)

金融机构内部数据反欺诈四部曲•1、对数据质量进行分析的指标不包括()(20 分)缺失异常B数值异常C长度异常D容量异常正确答案:A•1、金融反欺诈建模过程包括()四个步骤(20 分)A问题定义B明确模型目标C挖掘数据价值D线上预测正确答案:A B C D•2、数据准备包括()三个步骤(20 分)A数据融合B数据清洗C数据质量分析D数据评估正确答案:A B C•1、首期不还款是金融机构定义欺诈的一种方法()(20 分)正确错误正确答案:正确•2、社交网络中提取出来的特征被称为网络特征()(20分)正确B错误正确答案:正确人工智能反欺诈利器之特征工程题•1、“特征工程”位于反欺诈技术金字塔模型()层(20 分)A塔底中间C塔顶D不确定正确答案:B•1、优惠套利欺诈行为具有()的特点(20 分)A短时期B小欺诈额C高频次D不确定正确答案:A B C•2、欺诈者常利用网络并借助()三种载体实施欺诈(20 分)代理BVPNC分散IPD不确定正确答案:A B C•1、高质量、相关的数据及特征决定模型预测能力的上限( )(20 分)正确B错误正确答案:正确•2、设备终端与网络层面的特征是防范欺诈的第一道防线()(20分)正确B错误正确答案:正确人工智能反欺诈利器之设备指纹成绩:100.0分。
恭喜您顺利通过考试!单选题•1、“数据”位于反欺诈技术金字塔模型()层(20分)塔底B中间C塔顶D不确定正确答案:A•1、新一代设备识别技术包括()三种(20分)A主动式B被动式C混合式D不确定正确答案:A B C•2、设备特征信息主要包括()四个(20分)A浏览器特征B设备传感器特征C设备OS特征D设备配置正确答案:A B C D•1、新一代的设备指纹技术使用更多信息来完成设备识别()(20分)正确B错误正确答案:正确•2、主动式设备指纹技术一般采用JS 代码或SDK()(20分)正确B错误正确答案:正确•1、“关联图谱”位于反欺诈技术金字塔模型()层(20分)A塔底B中间塔顶D不确定正确答案:C多选题•1、描述关联图谱的指标有()三个(20分)A关联度B中心度C网络聚类D不确定正确答案:A B C•2、网络特征的直接提取是指提取出()三个特征(20分)A中心度B一度关联特征C二度关联特征D三度关联特征正确答案:A B C判断题•1、一张关联图谱由节点和边组成()(20分)正确B错误正确答案:正确•2、根据图谱边的性质,关联图谱可分为同构网络和异构网络()(20分)正确B错误正确答案:正确网络支付欺诈案例单选题•1、()可以记录用户购买历史(20分)A生物探针行为序列C关系图谱D机器学习正确答案:B多选题•1、网络支付欺诈实施流程包含()四步(20分)A放马B操盘C洗料D变现正确答案:A B C D•1、案例中,路径学习技术可以发现购买行为异常()(20分)正确B错误正确答案:正确•2、案例中,生物探针技术可以发现手机使用行为异常()(20分)正确B错误正确答案:正确•3、案例中,关系图谱技术可以对用户信用进行估值()(20分)正确B错误正确答案:正确•1、()大大拓宽了应用场景,对区块链在现实世界中的应用具有重要意义。
反欺诈技术在金融行业的应用

反欺诈技术在金融行业的应用第一章:引言随着金融业的快速发展,金融罪案件也逐年上升,包括欺诈案件。
为了保护金融机构和客户的利益,反欺诈技术在金融行业应用越来越广泛。
本文将探索反欺诈技术在金融行业应用的背景、原理和案例等方面。
第二章:反欺诈技术的背景和原理2.1背景随着全球经济一体化的发展和互联网技术的广泛应用,金融行业的欺诈案件越来越多,为金融机构和客户带来了严重的损失。
而传统的反欺诈手段,如审核、调查和人工判断等,已经无法满足反欺诈的需求。
因此,反欺诈技术应用成为了保护金融机构和客户的有效手段。
2.2原理反欺诈技术是利用计算机技术和数据分析技术,对金融业务中的各类数据进行采集、处理、分析和识别,从而发现欺诈行为并采取相应措施。
其包括以下几个方面:1.数据分析通过对银行卡、信用卡和贷款等数据进行分析,识别与正常规则不符的交易模式,如突然大额、异地交易等,并将其标记为高风险交易。
2.模型识别采用人工智能和机器学习等技术,通过对欺诈行为的数据进行建模和训练,从而识别与之相同或相似的欺诈行为。
3.网站抓捕通过监控和分析网站的访问行为、操作行为、IP地址等信息,从而发现潜在的欺诈行为。
第三章:反欺诈技术在金融行业的应用3.1 银行卡欺诈银行卡欺诈是指通过盗刷、轮盘和假卡等手段,非法获取银行卡内的资金。
银行针对该类欺诈案件,利用反欺诈技术对银行卡交易数据进行监测和分析,及时发现高风险交易,并自动拦截该交易。
3.2 信用卡欺诈信用卡欺诈是指利用伪造信用卡、盗刷、伪造交易等方式非法获取信用卡的资金。
反欺诈技术通过分析信用卡的消费模式、交易地点、消费频率等信息,识别高风险信用卡,并直接拒绝高风险交易。
3.3 网络欺诈随着互联网技术的不断发展,金融机构经常面临各种类型的网络欺诈,包括伪造邮件、假冒网站等。
反欺诈技术通过对访问行为和操作行为的监控和识别,及时发现潜在的网络欺诈行为,并阻止非法操作。
第四章:结论反欺诈技术的应用在金融行业中起着重要作用。
金融风控中的反欺诈模型应用方法

金融风控中的反欺诈模型应用方法随着金融行业的迅速发展和互联网技术的普及,金融风控面临着越来越多的欺诈行为挑战。
在金融风控过程中,反欺诈模型成为重要的工具,帮助金融机构及时识别并预防欺诈行为。
本文将介绍金融风控中的反欺诈模型应用方法,并分析其在实际场景中的应用效果。
一、反欺诈模型概述反欺诈模型是通过对历史交易数据进行分析、建模和预测,识别潜在的欺诈行为。
它基于机器学习和数据挖掘技术,运用大数据分析方法,快速、准确地识别欺诈风险,为金融机构提供决策支持。
反欺诈模型的应用范围广泛,包括但不限于信用卡欺诈、身份盗窃、虚假交易等方面。
它可以帮助金融机构提高风险识别的准确性和及时性,有效防范欺诈风险,保护用户资金安全。
二、反欺诈模型应用方法1. 数据收集和预处理反欺诈模型的第一步是进行数据收集和预处理。
金融机构需要收集大量的历史交易数据,包括交易金额、交易时间、交易地点等信息。
同时,还需要收集用户的个人信息,如年龄、收入、职业等,以便构建完整的特征数据集。
在数据预处理阶段,需要对数据进行清洗、去噪和标准化处理。
清洗数据可以去除重复、缺失或异常的数据,确保数据质量。
去噪可以过滤掉不必要的信息,提高模型的训练效果。
标准化处理可以统一数据的尺度,避免不同特征对模型产生不均衡的影响。
2. 特征工程特征工程是反欺诈模型中至关重要的环节。
特征工程的目标是选取和构建能够最有效区分欺诈和非欺诈交易的特征。
常用的特征包括交易金额、交易频率、交易地点距离等。
在特征工程过程中,可以应用一些统计学方法和机器学习算法,筛选出最具区分性的特征。
同时,也可以构建新的特征,如交易行为模式、用户信用评分等,丰富特征集,提高模型的预测性能。
3. 模型选择和训练在模型选择和训练阶段,需要根据具体的业务需求和数据特点选择合适的反欺诈模型。
常见的模型包括逻辑回归、决策树、支持向量机、神经网络等。
模型训练过程中,需要将数据分为训练集和测试集,利用训练集对模型进行训练和调优,再利用测试集评估模型的性能。
知识图谱在金融反欺诈场景中的应用二算法趣解

知识图谱在金融反欺诈场景中的应用二算法趣解知识图谱在金融反欺诈场景中的应用:算法趣解随着金融科技的迅猛发展,金融行业面临着越来越多的欺诈威胁。
为了应对这一问题,知识图谱技术被引入到金融反欺诈应用中。
在金融反欺诈场景中,知识图谱通过构建实体之间的关联关系,辅助金融机构发现和预防欺诈行为。
本文将介绍知识图谱在金融反欺诈场景中的应用,并对其中涉及的算法进行解读。
一、知识图谱在金融反欺诈中的应用1. 实体关系构建在金融反欺诈中,实体包括个人、企业、产品等。
知识图谱通过收集和整理大量数据,分析实体之间的关联关系,构建实体之间的连接。
通过实时更新和维护,知识图谱能够提供一个全面的实体关系图,为金融机构提供全面的信息支持。
2. 欺诈模式识别知识图谱通过分析已有的欺诈案例和行为模式,识别欺诈的规律和特征。
通过机器学习算法,知识图谱能够将这些规律和特征应用于实时的交易数据中,帮助金融机构及时发现和拦截可疑交易。
例如,当某个交易符合已知的欺诈模式时,知识图谱能够快速告警并采取相应的措施。
3. 风险评估与预警知识图谱还能够对个体进行风险评估,通过分析个体的交易记录、信用评分、社交网络等多个维度的数据,综合判断个体的风险程度。
在风险评估的基础上,知识图谱可以提供实时的预警信息,帮助金融机构及时采取相应的风险控制措施。
二、算法趣解1. 实体关系抽取在构建知识图谱时,需要从大量的非结构化数据中提取出实体和实体之间的关系。
这一过程被称为实体关系抽取。
常用的算法有基于规则的方法、基于机器学习的方法和基于深度学习的方法。
基于规则的方法需要人工编写一系列规则来进行抽取,虽然准确率较高,但需要大量的人力投入。
基于机器学习的方法通过训练模型来进行抽取,准确率相对较高,但需要大量标注好的数据作为训练集。
而基于深度学习的方法,可以通过神经网络自动学习特征和规则,准确率较高且无需过多的人工干预。
2. 欺诈行为检测在欺诈行为检测方面,常用的算法包括统计分析、机器学习和图挖掘等方法。
bda在各个行业中的实际应用

bda在各个行业中的实际应用BDA (大数据分析) 在各个行业中的实际应用随着信息技术的快速发展,大数据分析 (BDA) 在各个行业中的应用也日益广泛。
BDA 利用了海量的数据和先进的分析技术,帮助企业从数据中挖掘出有价值的信息,为决策提供支持。
下面将分别介绍BDA 在金融、零售、医疗和制造业中的实际应用。
在金融行业中,BDA 被广泛应用于风险管理和反欺诈。
通过对大量的金融数据进行分析,金融机构可以更好地识别潜在的风险和欺诈行为。
例如,银行可以利用 BDA 技术对客户的交易数据进行实时监测,发现异常的交易行为,并及时采取措施。
此外,BDA 还可以帮助金融机构预测市场趋势,优化投资组合,提高投资收益。
在零售行业中,BDA 可以帮助企业进行市场营销和客户关系管理。
通过对顾客购买行为和偏好的分析,零售商可以更好地理解顾客需求,精准定位目标客户,并制定个性化的营销策略。
此外,BDA 还可以帮助零售商进行库存管理和供应链优化,减少库存积压和运输成本,提高运营效率。
在医疗行业中,BDA 可以被应用于疾病预测和个性化治疗。
通过分析大量的医疗数据,医疗机构可以发现潜在的疾病风险因素,预测疾病的发生和发展趋势,并采取相应的预防措施。
此外,BDA 还可以帮助医生根据患者的个体特征和病情,制定个性化的治疗方案,提高治疗效果。
在制造业中,BDA 可以用于质量控制和生产优化。
通过对大量的生产数据进行分析,制造商可以实时监测生产过程,发现潜在的质量问题,并及时采取纠正措施。
此外,BDA 还可以帮助制造商分析设备的运行状态和维护需求,实现设备故障的预测和预防,提高生产效率和设备利用率。
除了以上几个行业,BDA 还在交通运输、能源、教育等领域得到广泛应用。
在交通运输领域,BDA 可以帮助交通管理部门优化交通流量,提高交通运输效率。
在能源领域,BDA 可以帮助能源公司进行能源消耗的分析和优化,减少能源浪费和环境污染。
在教育领域,BDA 可以帮助学校和教育机构进行学生学习行为和成绩的分析,提供个性化的学习支持和指导。
知识图谱如何针对金融领域开创反欺诈平台

知识图谱如何针对金融领域开创反欺诈平台在金融领域中,反欺诈平台的重要性不言而喻。
因为金融领域的欺诈行为极具危害性,不仅会导致金融机构遭受巨大损失,还会损害客户对金融行业的信任。
为了有效地应对欺诈行为,知识图谱成为了一种有力的工具。
本文将探讨知识图谱如何针对金融领域开创反欺诈平台。
首先,了解知识图谱的概念和原理对于理解如何应用于反欺诈平台至关重要。
知识图谱是一种基于图形数据库的知识表示形式,通过将实体、属性和关系组织成图形,可以更好地表达和推理知识。
在金融领域中,知识图谱可以用于表示各种金融实体,如客户、账户、交易等,以及它们之间的相关关系。
通过构建和分析这些知识图谱,我们可以发现潜在的欺诈行为。
其次,知识图谱可以通过多种方式开创反欺诈平台。
首先,它可以帮助金融机构建立完整、准确的客户信息。
通过将客户的个人信息、交易记录等整合到知识图谱中,金融机构可以更好地了解客户的信用和风险特征,从而找出潜在的欺诈行为。
其次,知识图谱还可以用于发现关联性。
通过分析知识图谱中实体之间的关系,我们可以找出不同账户之间的交叉持有、资金流动等模式,进一步发现可能的欺诈活动。
此外,知识图谱还可以通过机器学习和人工智能技术提供更精确的风险评估。
通过对知识图谱中的实体进行监控和分析,我们可以建立基于模型的预测,识别出潜在的欺诈行为。
同时,知识图谱还可以通过数据挖掘和规则引擎相结合,实现自动化的欺诈检测和风险管理。
这种结合能够根据规则和模式,实时监测和识别异常交易行为,及时采取措施避免金融损失。
除了以上应用,知识图谱还可以与外部数据源结合,进一步提升反欺诈平台的效果。
通过整合公共数据、社交媒体数据等等,我们可以获得更丰富的信息,对客户和交易进行更全面的分析。
此外,金融机构还可以与其他金融机构、执法机构等进行信息共享,通过共同建立知识图谱,增强对欺诈行为的识别和预防能力。
当然,要想成功应用知识图谱于金融领域的反欺诈平台,还需要面临一些挑战。
营销反欺诈大数据解决方案

“裂变拉新”业务欺诈
• 随着互联网技术的普及,黑产团队日渐壮大,越来越多的产 业会受到黑产影响。在裂变拉新领域,黑产团伙借助技术工 具大量注册账号,骗取平台奖励补贴并完成套现。
黑产技术手段解析—裂变拉新
信息搜集 收码平台
工具开发
身份证
手机号
账号/账户
密码/介质
基买卡 础数基接码据础源数打码据源
3
全球领先的数据智能科技平台
Mobtech是全球领先的数据智能平台,历时9年,融合顶尖的大数据、云计算、人工智能等多元先进 技术,构建出以数据应用为核心的业务安全风控能力,持续专研黑灰产对抗策略,在多个业务场景下 展示出了效果优异的对抗效果,并协助政府、警方等溯源定位犯罪嫌疑人。目前,Mobtech智弈风控 系统已为快消、零售、金融、汽车等行业的多个业务场景提供全方位守护。
数据是一切的基石
M o b Te c h 覆 盖 全 国 95%+的移动设备打破信 息孤岛,实现数据共享、
开放,挖掘其最大价值
生活出行
线上
电商
阅读
更多
金融理财
MobTech链接线上线下,实现数据共享、开放
城市道路规划
线下 地产
家居建材
商业地理
餐饮美食
医疗 ……
数据实力
可以覆盖国内96%+的独立设备 月活跃独立设备数 3层标签+垂直场景
营销反欺诈大数据解决方案
数据驱动智能风控
1
营销反欺诈应用场景
营销活动
• 现金红包、实物奖品发放 • 大转盘、九宫格抽奖 • 签到、任务、点赞、关注
刷单刷券
• 恶意下单退单、刷取销量 • 高价值优惠券、代金券发放 • 稀缺品秒杀、商品限时抢购
消费金融领域的反欺诈策略与技术应用考核试卷

B.批处理技术
C.数据仓库技术
D.数据挖掘技术
14.以下哪个行业通常不与消费金融公司合作提供反欺诈服务?()
A.电信
B.互联网
C.零售
D.医疗
15.以下哪种方法不适用于消费金融欺诈检测?()
A.规则引擎
B.评分模型
C.神经网络
D.问卷调查
16.以下哪个是消费金融欺诈行为的特点?()
A.高频交易
B.大额交易
C.非常规时间交易
D.所有上述特点
17.以下哪种数据源通常不用于消费金融反欺诈分析?()
A.交易记录
B.用户行为数据
C.社交媒体数据
D.医疗记录
18.以下哪种技术主要用于提高反欺诈系统的准确性?()
A.集成学习
B.深度学习
C.强化学习
D.所有上述技术
19.在消费金融反欺诈中,以下哪种方法主要用于监控可疑行为?()
A.人脸识别
B.指纹识别
C.眼纹识别
D.所有上述技术
2.在消费金融领域,以下哪项不是反欺诈的主要挑战?()
A.模仿攻击
B.数据隐私
C.伪冒申请
D.交易速度
3.哪种模型在反欺诈检测中被广泛使用?()
A.决策树模型
B.线性回归模型
C.神经网络模型
D.所有上述模型
4.以下哪种做法不是有效的反欺诈措施?()
A.经济环境
B.金融市场成熟度
C.消费者教育水平
D.信息技术发展
17.以下哪些是消费金融欺诈的典型特征?()
A.快速增长的账户活动
B.非正常的交易模式
C.多个账户间的关联交易
D.交易双方地理位置接近
18.在反欺诈策略中,以下哪些做法可以提高欺诈检测的准确性?(]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Modern Management 现代管理, 2019, 9(5), 672-676Published Online October 2019 in Hans. /journal/mmhttps:///10.12677/mm.2019.95082Application of Retail Linkage Map inAnti-Fraud ScenarioXiaoyan Zhang1,2, Hui Qiao31Postdoctoral Mobile Station of Applied Economics, Nanjing University, Nanjing Jiangsu2Post-Doctoral Scientific Research Workstation, Bank of Jiangsu, Nanjing Jiangsu3Risk Management Department, Bank of Jiangsu, Nanjing JiangsuReceived: Sep. 30th, 2019; accepted: Oct. 17th, 2019; published: Oct. 24th, 2019AbstractWith the development of Internet in financial industry, new means of financial crime and fraud emerge endlessly, and have evolved from individual fraud in the past to large-scale organized gang fraud. Compared with individual fraud, gang fraud will not only cause huge economic and credit losses to financial institutions, but also make financial institutions face severe punishment from the regulatory authorities. Retail Linkage Map is an innovative technology that integrates big data, graph mining and artificial intelligence to realize prevention and control of group fraud risk in retail business scenarios. To a certain extent, it can improve the efficiency of big data utilization, enrich anti-fraud modeling methods, and improve the effect of supervised learning model. It can be applied to the anti-fraud of online loan application groups, the excavation of abnormal groups after lending funds, the recognition of credit card maintenance cash, the identification of wool groups in marketing activities and the identification of money laundering groups.KeywordsLinkage Map, Retail Business, Gang Fraud零售关联关系图谱在反欺诈场景中的应用张晓艳1,2,乔辉31南京大学应用经济学博士后流动站,江苏南京2江苏银行股份有限公司博士后科研工作站,江苏南京3江苏银行股份有限公司风险管理部,江苏南京收稿日期:2019年9月30日;录用日期:2019年10月17日;发布日期:2019年10月24日张晓艳,乔辉摘 要随着互联网在金融行业的发展,金融犯罪和金融欺诈的新手段层出不穷,并已由过去的单兵作战演变成有规模、有组织的团伙欺诈。
相对于个体欺诈,团伙欺诈不仅会对金融机构造成巨大的经济和信誉损失,严重的还会使金融机构面临监管部门的严厉处罚。
本文指出零售关联关系图谱是融合大数据、图挖掘和人工智能以实现零售业务场景团伙风险防控的创新技术,在一定程度上能够起到提升大数据利用效率、丰富反欺诈建模方法、提高有监督学习模型效果等作用,能够应用于网贷申请团伙反欺诈、贷后资金异常团伙挖掘、信用卡养卡套现识别、营销活动中薅羊毛团体识别以及洗钱团伙识别等场景。
关键词关联关系图谱,零售业务,团伙欺诈Copyright © 2019 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/1. 引言近年来,云计算、大数据、人工智能等新技术推动了技术与金融的相互融合、相互渗透,开启了波澜壮阔的商业变革和金融创新[1]。
同时,随着互联网在金融行业的发展,金融犯罪和金融欺诈的新手段层出不穷,且趋于科技化、专业化、规模化,也更具有隐蔽性,并已由过去的单兵作战演变成有规模、有组织的团伙欺诈,严重制约了互联网金融行业的健康发展[2]。
相对于个体欺诈,团伙欺诈不仅会对金融机构造成巨大的经济和信誉损失,严重的还会使金融机构面临监管部门的严厉处罚。
因此,相应的反欺诈技术也必须要随之革新和升级。
互联网的发展促进了人与人之间的关系,而人与人之间的关系又往往可以反应出一个人的社会属性,如社会阶层、消费水平、欺诈属性等。
如何从用户的申请、交易、点击甚至是浏览行为产生的海量数据里挖掘出其社会关系,以支持不断创新和扩充的零售业务的风控反欺诈,已成为银行的核心竞争力之一。
在金融行业中,数据是非常重要的资源,利用基于关联关系的知识图谱概念,可以突破现有关系型数据库的限制,更高效、精准、迅速地获得数据带来的价值[3]。
2. 银行欺诈风险新特征2.1. 欺诈风险呈现线上化趋势通常,欺诈者会使用包括盗卡、伪造卡片、钓鱼或发动社交网络攻击等多种欺诈技术进行身份盗窃。
随着网上银行、手机银行以及直销银行等逐渐成为银行获取零售用户的主要途径,移动应用和随时转账等创新在线服务成为银行之间竞争的新方式,银行在追求更多在线产品和更好客户体验的同时,却也给新型的欺诈方式有了可乘之机。
2.2. 欺诈风险主体从个体欺诈转向团伙欺诈线上欺诈的难点在于匿名性与工具的多样化。
因此,欺诈者通常会使用大量的欺诈账户来获得非法收益,单个账户的窃取金额都较小,但总量却十分巨大。
欺诈者为了保持隐匿性,会创建多个欺诈性账张晓艳,乔辉户,使用先进的黑客工具(如云托管基础架构、匿名电子邮件、虚假GPS定位、匿名代理、移动设备劫持等)窃取大量账户。
孤立来看,单个账户更容易通过系统的检测,而如果通过关联关系识别团伙的潜在关系,则会较容易识别单个客户正常但一群客户却存在欺诈风险的情形。
3. 零售关联关系图谱概述关联关系图谱指由节点(实体)和节点之间错综复杂的关系构成的拓扑网络。
所谓复杂关系就是基于时空数据、地址数据、人物数据构成的庞大的人–人关联、人–物关联的关系网络。
关联关系图谱构建就是确认节点(实体)、关系(边)及权重,并基于动态Schema构建关系网络图的过程。
节点(实体)包括但不限于:手机号码、身份证、银行卡、设备、地址、IP等,关系(边)包括但不限于:家庭关系、担保关系、资金往来关系、设备关联关系、手机关联关系、家族关系、同事关系等,权重高低则依赖于关系强弱。
零售关联关系图谱是融合大数据、图挖掘和人工智能以实现零售业务场景团伙风险防控的创新技术,目标是建立零售客户全业务生命周期画像、客户关系画像,识别具有团伙性质的欺诈申请、贷后资金异常、养卡套现、洗钱、薅羊毛等风险。
在业务数据层面,关联关系图谱能够打通零售业务场景下的网贷申请、渠道、风控、审批、合同、放贷、日常交易、贷后行为全业务生命周期的零售客户数据。
在数据组织方式层面,关联关系图谱有别于传统数据集市,其通过从业务数据中抽象实体和关系,以关系网络的形式重新组织业务产生的数据,构建复杂的人(身份证)、设备、手机号码、银行账户、业务订单和地址等实体之间的关系。
基于构建的零售关联关系图谱,借助图论、图数据挖掘和图深度学习算法,对关联图谱中的关系网络进行拓扑结构分析、团伙发现、异常团伙挖掘、相似团伙挖掘、风险传播,以识别具有团伙性质的欺诈风险[4]。
4. 零售关联关系图谱在反欺诈中的作用4.1. 防控团伙性欺诈行为当前银行的大部分欺诈风险检测以个案为主,如判断一笔交易或者一个账户的欺诈和洗钱风险,对威胁更高的团伙性欺诈和洗钱风控建设不足。
团伙性欺诈和洗钱一般涉及多个银行账号、客户和设备协同作案,在单笔申请、交易或者单个账户视角并不能看出任何风险,但是在建立多维度、多属性关联关系(如账号交易关系、设备账号关系、担保关系、客户账号关系等)后,欺诈团伙往往呈现出明显的异常模式子图,并且已知的风险可通过关联关系进行传播扩散,以发现更多风险关系和节点,而基于构建的零售关联关系图谱能够有效识别欺诈团伙。
4.2. 提升大数据利用效率目前金融科技较为领先的银行,大都完成或正在进行大数据建设工作,系统上具备支持大数据的分布式计算、存储能力,业务上通过建设数据仓库、数据集市,以支持业务的分析挖掘工作。
但这些数据都以数据表的形式、按数据库的关系数据模型组织业务数据,这类数据格式虽然有利于数据报表类的分析,但是对业务中涉及的多种实体、网络状的复杂关系进行展示和分析比较困难。
零售关联关系图谱通过图数据库系统索引关联网络,提供高效的关联网络信息检索服务,并借助关系网络可视化技术,将检索的复杂关系进行可视化展现。
4.3. 丰富反欺诈建模方法当前反欺诈风控以基于流计算的规则策略和有监督机器学习模型为主。
而基于流计算的规则策略属于专家经验的应用,而非从数据中学习模型参数,其泛化能力较差且上线后效果衰减快;此外,受内存限制,历史数据不能充分被利用计算策略中的统计指标。
有监督学习模型则对数据样本的打标要求较高,张晓艳,乔辉在正负样本不平衡的情况下,有监督学习类型的模型效果较差,且不稳定;由于反欺诈场景中欺诈样本非常稀缺,且打标欺诈样本成本也较高,所以有监督学习模型直接应用在反欺诈场景的效果将大打折扣。