大数据征信应用与启示_以美国互联网金融公司ZestFinance为例_刘新海

合集下载

《2024年基于用户互联网行为数据的个人征信评估体系建设分析——以芝麻信用为例》范文

《2024年基于用户互联网行为数据的个人征信评估体系建设分析——以芝麻信用为例》范文

《基于用户互联网行为数据的个人征信评估体系建设分析——以芝麻信用为例》篇一一、引言随着互联网技术的迅猛发展,大数据技术已经渗透到社会生活的各个领域。

个人征信作为衡量个人信用状况的重要依据,其评估体系正逐渐从传统的金融数据转向更为广泛的互联网行为数据。

本文以芝麻信用为例,深入分析基于用户互联网行为数据的个人征信评估体系建设,探讨其发展现状、存在的问题及未来发展趋势。

二、个人征信评估体系的发展背景个人征信评估体系是指通过收集、整合和分析个人信用信息,对个人信用状况进行综合评价的体系。

随着互联网的普及和大数据技术的应用,个人征信评估体系逐渐从传统的金融数据扩展到互联网行为数据。

这些数据包括但不限于网络购物、社交网络、网络支付、搜索记录等,为个人征信提供了更为丰富和全面的数据来源。

三、芝麻信用及其应用芝麻信用是阿里巴巴集团旗下的一家独立第三方征信机构,其核心是利用用户在阿里巴巴旗下各平台的互联网行为数据,进行信用评估。

芝麻信用分是其主要产品,通过分析用户的网购、支付、社交等行为数据,综合评估用户的信用状况,为金融机构提供信贷决策参考。

四、基于互联网行为数据的个人征信评估体系建设(一)数据来源与收集基于互联网行为数据的个人征信评估体系,数据来源广泛。

除了常见的网购、社交、支付等数据外,还包括用户的搜索记录、浏览记录、消费习惯等。

这些数据的收集需要依靠大数据技术和云计算技术,对海量数据进行高效处理和分析。

(二)数据处理与分析收集到的数据需要进行清洗、整合和分析。

通过机器学习和人工智能技术,对用户的行为数据进行深度挖掘和分析,提取出有用的信用信息。

同时,还需要建立数据模型和算法,对用户的信用状况进行综合评价。

(三)评估体系构建在数据处理和分析的基础上,建立个人征信评估体系。

该体系需要综合考虑用户的个人信息、行为数据、社交关系等多方面因素,对用户的信用状况进行全面评价。

同时,还需要建立相应的监督机制和风险控制机制,确保评估结果的准确性和公正性。

数据要素市场下个人数据服务商监管研究

数据要素市场下个人数据服务商监管研究

2022年第2期总第277期征信CREDITREFERENCENo.22022SerialNo.277

收稿日期:2021-11-28基金项目:国家自然科学基金项目(71871216)作者简介:刘新海(1976—),男,河南南阳人,副研究员,博士,主要研究方向为征信、数据挖掘、风险管理和金融人工智能;宫建华(1984—),女,辽宁大连人,经济师,硕士,主要研究方向为征信、互联网金融;杜耀华(1991—),女,北京人,硕士,主要研究方向为金融理论与实务;张山立(1997—),男,河南南阳人,硕士研究生,主要研究方向为征信、个人数据、管理方法、社会信用体系理论等。

摘要:数据要素已经逐渐成为市场经济下资源配置的重要组成部分。由于个人数据商业价值高但同时又涉及消费者的切身利益,个人数据服务商的商业模式越来越得到包括业界和监管者在内的社会各界的关注。对数据服务商进行定义,介绍国内外相关的研究,分析目前个人数据服务商的监管现状(以美国为例),剖析我国个人数据产业和数据服务商存在的问题,认为在快速发展的数字经济时代,对数据服务商的监管要兼顾创新发展和消费者权益保护的平衡。关键词:数据要素;数据服务商监管;个人征信;个人信息保护;本人数据管理中图分类号:F832.31;D630文献标识码:A文章编号:1674-747X(2022)02-0006-07

数据要素市场下个人数据服务商监管研究

刘新海1,2,宫建华3,杜耀华4,张山立5(1.全联并购公会信用管理委员会,北京100026;2.北京信用学会,北京100089;3.中国人民银行大连市中心支行,辽宁大连116001;4.中国保险学会,北京100037;5.首都师范大学,北京100048)

【特别关注】

一、数据服务商定义数据服务商(DataBroker)一般指从事数据收集、处理并对外提供数据服务的机构。本文中数据服务商的定义是收集消费者的个人信息并转售或与他人共享信息的公司。数据服务商作为新兴行业,有多种不同的名称——数据经纪人(DataBroker)、数据代理商、信息经纪人(InformationBroker)、信息经销商(DataAgent)、信息产品公司、联合数据经纪人、数据提供者(DataProvider)、数据供应商(DataSupplier)、数据中介(DataIntemediaries)、数据中间商、数据集成商等[1]。在数字经济时代,拥有大数据就拥有了大商机。数据服务商主要指个人数据服务商。不断产生的海量的个人数据价值无限,驱动消费经济和数字经济创新发展。但同时,个人数据由于涉及消费者权益而显得非常敏感,在实践中也存在发生系统性大规模数据泄露的风险。最早的数据服务商就是消费者(个人)征信机构。从20世纪后期起,互联网的发展、计算机处理能力的提高和数据存储成本的降低等技术的发展使公司更容易收集、分析、存储和传输有关个人的大量数据,促进了数据服务商行业的发展。数据服务商可以收集消费者相关的不同维度的数据(如图1所示),作为产品和服务进行商业化操作。数据服务商可以被认为是一类聚合各种信息来源的企业。例如从其他公司购买信息或在互联网上爬取有关用户的有用信息;对这些信息进行处理、清洗、分析或拓展信息的维度和内涵,合法持牌拥有或出售给其他组织。

大数据征信

大数据征信

大数据征信正文:一、引言本文档旨在介绍大数据征信的相关内容。

大数据征信作为一种新型的征信方式,以大规模数据的收集、整合和分析为基础,通过算法和模型来评估个人或机构的信用状况。

本文将对大数据征信的背景、原理、应用场景和法律法规进行详细阐述。

二、背景大数据征信是随着大数据技术的发展而逐渐兴起的一种新型征信方式。

传统的征信模式主要依赖于个人或机构的金融数据和信用记录,凭借有限的数据来评估信用状况。

而大数据征信则通过收集和分析个人或机构在互联网、移动支付、社交媒体等领域的数据,以更全面和准确的方式来评估信用风险。

三、原理⒈数据收集:大数据征信通过技术手段采集个人或机构在互联网、移动支付、社交媒体等领域的数据,包括但不限于个人信息、交易记录、社交关系等。

⒉数据整合:将收集到的各种数据进行整合和清洗,消除重复数据和错误数据,可用于征信评估的数据集。

⒊数据分析:通过算法和模型对整合后的数据进行分析和挖掘,提取出与信用状况相关的特征和规律。

⒋信用评估:根据分析得出的结论,对个人或机构的信用状况进行评估,信用评分和报告。

四、应用场景⒈个人信用评估:大数据征信可以应用于个人贷款、消费信用等场景中,通过分析个人的互联网行为、社交关系等数据来评估其信用状况。

⒉企业征信:大数据征信可以评估企业的经营状况、信用风险等,对金融机构的贷款决策、供应链管理等具有重要意义。

⒊网络借贷征信:大数据征信可以帮助网络借贷平台评估借款人的信用状况,提高风险控制能力,降低借贷风险。

五、法律法规⒈征信业管理条例:征信业发展管理办法的具体规定,包括征信机构的准入条件、业务范围、运营规范等。

⒉个人信息保护法:保护个人信息的合法权益,规定征信机构需要遵守个人信息保护的原则和规定。

⒊信用信息公示管理办法:规定信用信息的公示方式和途径,加强信用信息的公开透明度。

附件:附件1:大数据征信操作手册附件2:大数据征信报告样本法律名词及注释:⒈征信机构:依法经营的从事征信业务的法人或其他组织。

互联网金融公司如何利用大数据分析提供更准确的信用评估

互联网金融公司如何利用大数据分析提供更准确的信用评估

互联网金融公司如何利用大数据分析提供更准确的信用评估互联网技术的快速发展为金融行业带来了巨大的变革,尤其是互联网金融公司。

这些公司经常处理大量用户数据,这为他们提供了实现更准确的信用评估的机会。

本文将探讨互联网金融公司如何利用大数据分析来提供更准确的信用评估。

一、引言互联网金融公司作为金融科技的代表,已经成为金融行业的一股重要力量。

为了更好地满足客户需求,提供更准确的信用评估是互联网金融公司迫切需要解决的问题之一。

大数据分析技术,凭借其数据收集和处理的高效性以及预测能力,为互联网金融公司提供了强有力的解决方案。

二、大数据在信用评估中的应用大数据分析是指收集、处理和解释大规模数据集的过程。

互联网金融公司通过收集用户的交易数据、社交媒体数据和其他行为数据,可以得到关于用户行为和信用状况的丰富信息。

利用大数据分析技术,互联网金融公司可以从庞大的数据集中提取出有价值的特征,并构建信用评估模型。

三、特征提取与建模在大数据分析中,特征提取是至关重要的一步。

互联网金融公司需要从海量的数据中挖掘出对信用评估有较高预测能力的特征。

例如,用户的消费行为模式、交易历史、社交网络活动等都可以作为重要的特征。

通过训练机器学习模型,互联网金融公司可以将这些特征与用户的信用评估进行关联,建立一个多维度的信用评估系统。

四、模型训练与优化模型训练是将特征与实际信用评估结果进行匹配的过程。

互联网金融公司可以采用监督学习、无监督学习和深度学习等机器学习方法进行模型训练。

同时,为了提高模型的预测准确性,互联网金融公司还可以通过不断优化模型参数、增加训练数据量和改进特征选择方法等手段,来不断提升信用评估模型的性能。

五、数据安全与隐私保护在大数据处理过程中,数据安全与隐私保护是互联网金融公司亟需解决的问题。

互联网金融公司需要建立完善的数据安全管理制度,确保用户数据的隐私和安全不受侵犯。

同时,互联网金融公司还需要遵守相关法律法规,合法合规地使用用户数据。

大数据分析在互联网金融中的应用

大数据分析在互联网金融中的应用

大数据分析在互联网金融中的应用互联网金融作为当今经济中的一股新力量,已经逐步成为了人们生活中不可或缺的一部分。

随着该行业的发展,数据成为了巨大的资源库,并且传统的数据处理方法已经不能满足业务要求。

这时候,大数据分析技术的出现解决了这一问题。

一、互联网金融的数据价值随着移动互联网和电子商务的快速发展,人们的金融行为越来越多地发生在网络上,如支付、理财、借贷等。

这样的交易产生了庞大的数据,成为了互联网金融业务的重要支撑和衍生品。

这些数据包含了用户的个人信息、交易行为、借贷信息、信用评估信息等,这些数据是支撑互联网金融行业的基石。

而且,互联网金融的数据分析具有非常广泛的应用场景。

最明显的例子是风险控制。

金融风险控制与数据分析密不可分。

通过分析客户行为、信用评估和市场变化等因素,公司可以降低风险并制定相应的决策。

此外,数据分析还可以帮助互联网金融业务定位目标用户,并为它们提供更加个性化、创新的产品。

二、大数据分析技术在互联网金融中的应用1.用户画像。

用户画像是指通过各种数据对用户进行分类和细分,以便更加深入地分析用户需求和市场趋势。

具体来说,用户画像会分析客户的年龄、职业、收入、消费习惯、偏好等信息,以制定更加具有实效性、个性化的互联网金融产品。

这些产品可以让企业更好地满足客户需求并赢得更多用户,提高用户黏性和业务收入。

例如,通过观察用户的借款习惯,互联网金融公司可以预测贷款需求,为客户提供个性化、高效的贷款产品。

2.信用评估。

互联网金融业务往往需要对客户的信用进行评估,以确定客户的还款能力。

电信运营商数据、天猫购物记录、购票等行为历史数据,以及客户在社交媒体上的活动等所有数据都可以被用来评估客户的信用。

传统信用评估模型是基于静态数据,即客户一次性的信用评估。

而大数据时代的信用评估,采用的是动态的数据分析,即通过对客户及其环境等数据的持续跟踪分析,确定客户的信用等级。

通过这种方式可以实现更为准确和精细的信用评估。

征信数据—征信大数据的挖掘与风控应用

征信数据—征信大数据的挖掘与风控应用

互联网金融发展的关键是风险控制,“风险控制”已然成为诸多互联网金融企业能否长大的魔咒,这个不争的事实像一座大山摆在众多互联网金融大佬与创业者的面前。

为什么阿里金融能够将它的网络小贷不良率控制在不到1%,有胆量再贷多点吗?大数据挖掘技术和互联网金融的风险控制到底是什么关系?互联网金融将怎样建立有效的风险控制生态体系?本文将带你揭开大数据挖掘与互联网金融风险控制的神秘面纱。

最近互联网金融圈不仅自己玩的很开心,而且还拉上了金融界甚至央行的大佬们一起玩的很开心。

尽管让互联网金融企业头痛的问题——央行征信系统不对市场开放,仍然没有解决,但至少央行的态度明朗,支持互联网金融的发展,并认为互联网金融是传统金融的有益补充。

生命的神奇之处在于它总能找到一个出口。

作为新生事物的互联网金融也不例外,在那扇门朝他们关闭的同时,他们却找到了另外一扇窗。

在亦步亦趋的探索中,他们中的大企业通过自身力量,小企业通过联合的力量找到了适合自身发展的风险控制生态系统,正朝着良性和有序的方向发展,正如凯文凯利在他的《失控》中描述的群氓智慧那只无形的手。

互联网金融掌握了可以颠覆传统金融的风控技术在不依赖央行征信系统的情况下,市场自发形成了各具特色的风险控制生态系统。

大公司通过大数据挖掘,自建信用评级系统;小公司通过信息分享,借助第三方获得信用评级咨询服务。

互联网金融企业的风控大致分为两种模式,一种是类似于阿里的风控模式,他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型。

另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构,再分享征信信息。

央行的征信系统是通过商业银行、其它社会机构上报的数据,结合身份认证中心的身份审核,提供给银行系统信用查询和提供给个人信用报告。

但对于其它征信机构和互联金融公司目前不提供直接查询服务。

2006年1月开通运行的央行征信系统,至2013年初,有大概8亿人在其中有档案。

征信机构商业模式发展辨析

征信机构商业模式发展辨析随着《征信业管理条例》出台,至2014年底,有50多家企业征信机构完成备案,到2015年初,央行又批复8家个人征信机构,这其中有互联网巨头开设的、有保险公司等金融机构开设的,有老牌征信公司,以及拥有数据资源的新兴公司,第一批持牌经营征信业务的机构正式诞生,我国征信市场步入多元化发展。

全球征信行业发展各异,市场自然垄断全球征信行业的发展道路不一,没有统一范式。

如:法国、德国、意大利属于政府驱动型模式,借助于中央银行建立的“中央信贷登记系统”,强制金融机构定期提供金融数据;美国、加拿大、英国是市场驱动型模式,民营征信机构来收集、加工个人和企业的信用信息,为需求方提供产品和服务;日本采用的是行业协会会员制模式,银行行业协会建立征信机构“日本个人信用信息中心”,负责对消费者个人或企业进行征信,会员银行可以共享信息。

以上三种模式,在市场特征呈现自然垄断,行业外溢效应突出,表现为行业规模孝社会效益大。

(以美国为例,Experian,TransUnion、Equifax及FICO模型提供商作为征信核心机构,覆盖85%左右的美国公民率,90%的金融机构使用其作为授信重要参考标准。

)国内征信机构模式单一,竞争压力剧增中国的企业和个人征信发展是典型的市场需求驱动型的发展模式,在没有健全的法律法规、没有优秀的实践先例的情况下,国内征信机构均是根据市场需求和国际经验,以传统的“信用报告+增值服务”的商业模式来运营的(以央行征信中心为例:个人和企业征信报告+动产融资质押登记和应收账款融资服务等增值服务)。

同时,一批狼性十足、不按常理和规则出牌、以领先技术与征信相结合的市场新入者正在进入征信行业。

他们以互联网新金融、大数据新业态进入行业,最惯用的策略是靠炒作去忽悠公众,博眼球赚名头挣市场份额;同时,通过股权联盟、兼并重组、技术革新占领市场,获取市场优势。

我们的很多行业,如汽车、零售、支付等都经历过或正在经历这些变革。

运用大数据开展P2P信用风险评估的Upstart

运用大数据开展P2P信用风险评估的Upstart
刘新海
【期刊名称】《征信》
【年(卷),期】2016(000)006
【摘要】在全球范围内,年轻消费者信贷市场具有很大的业务空间,但由于年轻消费者信用记录欠缺而发展缓慢.一些新兴P2P企业瞄准该市场,大胆尝试基于大数据的信用评估方法,其中美国的Upstart公司就是非常典型的一家.Upstart公司以其强大的智能数据管理和分析技术为基础,秉承风险投资理念,着眼于年轻消费者的未来潜力,这对刚刚起步的中国征信业和互联网金融具有一定的借鉴意义.
【总页数】3页(P18-20)
【作者】刘新海
【作者单位】中国人民银行征信中心,北京100031;北京大学金融智能研究中心,北京100871
【正文语种】中文
【中图分类】F724.6;TP311.13
【相关文献】
1.如何运用“大数据风控”助力P2P发展? [J],
2.南京医保运用大数据技术开展医用防疫物资采购调配的探索与实践 [J], 刁仁昌; 王国宝; 王阳; 卢旻; 刘俊
3.运用大数据开展内部绩效审计研究 [J], 洪堃贵
4.运用大数据思维开展高校思想政治教育 [J], 李婷
5.运用大数据开展初中数学精准教学 [J], 黄义松
因版权原因,仅展示原文概要,查看原文内容请购买。

《2024年基于用户互联网行为数据的个人征信评估体系建设分析——以芝麻信用为例》范文

《基于用户互联网行为数据的个人征信评估体系建设分析——以芝麻信用为例》篇一一、引言随着互联网的飞速发展,大数据技术为各行各业带来了巨大的变革。

在金融领域,个人征信评估作为评估个人信用状况的重要手段,正逐渐由传统的信用评估体系向基于互联网行为数据的评估体系转变。

芝麻信用作为国内领先的互联网征信平台,其成功应用互联网行为数据对个人征信进行评估的案例,为整个行业提供了宝贵的经验。

本文将基于用户互联网行为数据的个人征信评估体系建设进行分析,以芝麻信用为例,探讨其评估体系的建设、应用及未来发展趋势。

二、芝麻信用背景及发展芝麻信用是蚂蚁集团旗下的征信平台,依托于阿里巴巴集团的庞大用户群体和丰富的互联网数据资源,通过分析用户的网购、支付、社交等行为数据,对个人信用进行评估。

芝麻信用的出现,打破了传统征信的局限性,使得个人信用评估更加全面、客观、实时。

三、基于互联网行为数据的个人征信评估体系的建设1. 数据来源与采集:芝麻信用的数据来源广泛,包括但不限于用户的网购记录、支付记录、社交行为等。

通过大数据技术,实现对这些数据的实时采集和整合。

2. 数据处理与分析:通过对采集到的数据进行清洗、筛选、分析等操作,提取出有用的信息,如用户的消费习惯、还款能力等。

3. 信用评估模型:芝麻信用采用先进的机器学习算法,建立信用评估模型。

该模型根据用户的互联网行为数据,综合分析用户的信用状况,给出相应的信用评分。

4. 风险控制:在评估过程中,芝麻信用注重风险控制,通过建立完善的风险控制机制,确保评估结果的准确性和可靠性。

四、芝麻信用应用分析芝麻信用在金融领域的应用广泛,如贷款审批、信用卡申请等。

通过分析用户的信用状况,为金融机构提供决策依据。

此外,芝麻信用还广泛应用于共享经济领域,如共享单车、共享汽车等,通过评估用户的信用状况,降低违约风险。

五、未来发展趋势及挑战随着技术的发展和互联网的普及,基于用户互联网行为数据的个人征信评估体系将越来越完善。

大数据技术在互联网金融领域的应用

大数据技术在互联网金融领域的应用随着互联网的快速发展,互联网金融行业也迅速崛起。

互联网金融以其高效、便捷的特点吸引了越来越多的用户。

而大数据技术的应用,则为互联网金融行业带来了更多的机遇和挑战。

本文将探讨大数据技术在互联网金融领域的应用,并分析其对行业发展的影响。

一、大数据技术在互联网金融领域的应用1. 风险控制与评估互联网金融行业的核心问题之一是风险控制。

大数据技术可以通过对大量用户数据的分析,建立风险评估模型,实现对用户的信用评估和风险预测。

通过对用户的历史交易数据、个人信息等进行分析,可以更准确地评估用户的信用状况,从而降低风险。

2. 个性化推荐大数据技术可以通过对用户的行为数据进行分析,实现个性化推荐。

互联网金融平台可以根据用户的历史交易记录、浏览记录等信息,为用户提供个性化的产品推荐和服务。

这不仅可以提高用户的满意度,还可以提高平台的转化率和盈利能力。

3. 交易分析与预测大数据技术可以对互联网金融平台的交易数据进行分析和挖掘,从而提供更准确的交易分析和预测。

通过对用户的交易行为、市场数据等进行分析,可以发现交易规律和趋势,为用户提供更好的投资建议和决策支持。

4. 信用评估与反欺诈大数据技术可以通过对用户的行为数据进行分析,建立信用评估模型,实现对用户的信用评估和反欺诈。

通过对用户的历史交易数据、个人信息等进行分析,可以更准确地评估用户的信用状况,从而降低欺诈风险。

5. 营销与推广大数据技术可以通过对用户的行为数据进行分析,实现精准营销和推广。

互联网金融平台可以根据用户的兴趣、偏好等信息,为用户提供个性化的营销和推广活动。

这不仅可以提高用户的参与度和转化率,还可以降低营销成本。

二、大数据技术在互联网金融领域的影响1. 提高效率大数据技术可以通过对大量数据的分析和挖掘,提高互联网金融平台的运营效率。

通过对用户的行为数据、交易数据等进行分析,可以发现用户需求和市场趋势,从而优化产品设计和服务流程,提高用户体验和平台效益。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

93INTERNET FINANCETSINGHUA FINANCIAL REVIEW October 2014INTERNET

FINANCE

P2P行业的全球发展

近期,美国互联网金融公司ZestFinance受到国内互联网金融专业人士的热捧,其基于大数据的信用评估模型也越来越受到关注和效仿。本文结合美国的金融环境,对ZestFinance进行简要介绍,分析大数据征信产生的背景,剖析大数据征信技术,并全面客观地阐述了大数据征信技术对于中国互联网金融和征信业未来发展的借鉴意义。文/刘新海 丁伟 本文编辑/贾红宇

大数据征信应用与启示——以美国互联网金融公司ZestFinance为例94TSINGHUA FINANCIAL REVIEW October 2014

INTERNET FINANCE互联网金融ZestFinance简介ZestFinance,原名ZestCash,是美国一家新兴的互联网金融公司,2009年9月成立于洛杉矶,由互联网巨头谷歌(Google)的前信息总监道格拉斯·梅瑞尔(Douglas Merrill)和金融机构Capital One的信贷部高级主管肖恩·卜德(Shawn Budde)(曾管理过收益超过10亿美元的次级信贷业务)联合创办。ZestFinance的研发团队主要由数学家和计算机科学家组成,前期的业务主要通过ZestCash平台提供放贷服务,后来专注于提供信用评估服务,旨在利用大数据技术重塑审贷过程,为难以获得传统金融服务(Underbanked)的个人创造可用的信用,降低他们的借贷成本。ZestFinance起初是为传统的发薪日贷款(Payday Loans) 提供在线替代的产品。发薪日贷款因借款人承诺在发薪日还款而得名。由于美国传统的信用风险评估体系无法覆盖全部的人群,大约15%的人因没有信用评分而被银行排斥在外,无法获得基本的信贷需求。除了解决传统信用评估体系无法解决的无信用评分借贷问题,ZestFinance还主要面向传统信用评估解决不好的领域,将信用分数低而借贷成本高的人群视为服务对象,利用大数据技术降低他们的信贷成本。与传统信贷管理业务比较,ZestFinance的处理效率提高了将近90%,风险控制方面,ZestFinance的模型相比于传统信用评估模型性能提高了40%。

ZestFinance目前也正在向信用风险管理的其他领域纵深扩展,2014年2月ZestFinance宣布推出基于大数据分析的收债评分(Collection Score),旨在为汽车金融、学生贷款、医疗贷款提供一种新的评分系统。ZestFinance的未来发展方向是希望把其在这种发款日的贷款上的优势继续拓展到其他贷款领域,包括信用卡、汽车的贷款,甚至包括房屋的贷款,在未来的10~15年,这一方法将取代现行指标,成为申请信贷的唯一评估标准。ZestFinance引起国内的关注始于2013年7月,当时全球第三方支付平台PayPal联合创始人、美国知名投资人彼得·泰尔(Peter Thiel)领投了ZestFinance的2000万美元融资。

为什么要进行大数据评估传统的信用评估服务无法覆盖全体人群,特别是弱势群体图1展示了美国FICO评分与其对应的人口分布情况,初始每个

刘新海INTRODUCTION中国人民银行征信中心博士后

人的分值基数为850分,信用评分模型利用征信数据从多个评分因素考察消费者的信用风险,从850分中减分。大致来看,美国个人消费者信用评分人群分布状况呈现两头小中间大的形态,信用分数处于750~850的人群有40%之多,其中信用分数在800~850大约占总人数的13%,在750~799超过总人数的25%,这是整个信用社会的中间阶层,对应于美国的中产阶级。其中,美国个人消费者的平均FICO评分为678。从图1可以看出,还有大量的人群远低于平均的678分,如FICO评分在550~549的占8%,在500~549的占5%,小于499分的占2%。根据FICO的标准,如果人们未能如期还款,或者缺乏借贷经历,他们就会自动被视为风险人士,他们的贷款也就会被惩罚性地给以更高的利率。还有一种可能,那就是他们的贷款申请会被拒,无论是否事出有因。比如,遇到了医疗紧急事故,或者最近刚刚移民美国。表1根据FICO评分将服务人群

图1:美国FICO 评分及相应的人群分布

表1:FICO评分人群和相关的金融服务机构FICO 评分人群金融服务机构>650分美国大银行(花旗、大通、富国、美国银行等)

600分~720分互联网P2P网贷Lending club等500分~700分小贷公司Spring leaf等<500分新兴的互联网金融公司ZestFinance、Turbofinance、Thinkfinance等

30%人口%25%20%15%10%5%0%>499

2%5%8%12%15%18%27%13%

500-549550-599600-649650-699700-749750-799800+TSINGHUA FINANCIAL REVIEW October 201495

INTERNET FINANCE互联网金融分为四个区间,并对应不同的金融服务机构。信用记录不完整或者不够完善的个人消费者,依据传统信用评估体系(FICO评分),往往很难被传统金融服务机构所覆盖,即使在金融体系发达的美国也无法获得常规的金融服务,或者需要付出很大的代价才能获得常规的金融服务。传统信用评估模型信息维度比较单一传统的FICO评分模型的基本思想是比较借款人信用历史资料与数据库中的全体借款人的信用习惯,检查借款人的发展趋势跟经常违约、随意透支,甚至申请破产等各种陷入财务困境的借款人的发展趋势是否相似。如图2所示,它主要从五个方面考察用户的信贷资质。但随着信贷业务的进一步开展,FICO信用评分由于单一的标准、严苛的门槛和片面的评估结果而饱受诟病。上没有大的变化,这和2008年金融危机爆发之后出现大量坏账的现实严重不符。由于传统的基于FICO评分的信用评估模型覆盖人群窄、信息维度单一、时间上滞后,所以,在大数据时代,需要探索信用评估的新思路。国外三大征信机构和FICO公司都已经开始了如何利用大数据技术来完善传统信用评估体系的前瞻性研究,如益百利(Experian)投入研究团队关注社交网络数据对信用评分的影响,FICO公司多年前就开始了在线评估的信息工具和基于互联网的信用评估系统的项目研究。图2: 传统信用评分模型的参考要素图3: FICO评分从2005年到2011年在美国人口中的分布情况丁伟INTRODUCTION中国联通网络技术研究院高级工程师传统的信用评估模型虽然在进行信用风险管理过程中发挥了很大的作用,如曾经促进了美国房贷市场的飞速发展。但在大数据背景下个人消费者出现许多信息维度,如电子商务、社交网络和搜索行为等,传统信用评估模型解决问题的能力越来越受限。

传统信用评估模型时间上比较滞后虽然FICO评分仍然体现风险排序,但其预测绝对风险的能力和在2008年金融危机中的表现饱受指责,图3展示,FICO分数从2005年到2011年在美国人口中的分布基本

25%20052008201120%

15%10%5%0%300-499500-549550-599600-649650-699700-749750-799800-850

2.OutstandingDebt未尝债务30%

3.Credit HistoryLength信贷时长15%

4.Pursuit ofNew Credit争取新信贷10%

5.CreditMix信贷组合10%

1.PaymentHistory付款历史35%

2005200620072008200920102011300-4996.66.57.17.27.36.96.3500-5498888.28.798.7550-59998.88.78.79.19.69.9600-64910.210.29.79.69.59.59.8650-69912.812.512.11211.911.912.1700-74916.416.316.21615.915.715.5750-79920.119.819.819.619.419.519.6800-85016.917.918.418.718.217.918.1合计100100100100100100100 来源:FICO 银行分析博客@ 2011 Fair Isaac 公司96TSINGHUA FINANCIAL REVIEW October 2014

INTERNET FINANCEZestFinance大数据信用评估的实践ZestFinance的基本理念是认为一切数据都是和信用有关,在能够获取的数据中尽可能地挖掘信用信息。ZestFinance对大数据技术的应用主要从大数据采集和大数据分析两个层面为缺乏信用记录的人挖掘出信用。大数据采集技术ZestFinance以大数据技术为基础采集多源数据,一方面继承了传统征信体系的决策变量,重视深度挖掘授信对象的信贷历史。另一方面,将能够影响用户信贷水平的其他因素也考虑在内,如社交网络信息、用户申请信息等,从而实现了深度和广度的高度融合。ZestFinance的数据来源十分丰富,依赖于结构化数据的同时也

导入了大量的非结构化数据。另外,它还包括大量的非传统数据,如借款人的房租缴纳记录、典当行记录、网络数据信息等,甚至将借款人填写表格时使用大小写的习惯、在线提交申请之前是否阅读文字说明等极边缘的信息作为信用评价的考量因素。类似地,非常规数据是客观世界的传感器,反映了借款人真实的状态,是客户真实的社会网络的映射。只有充分考察借款人借款行为背后的线索及线索间的关联性,才能提供深度、有效的数据分析服务,降低贷款违约率。如图4所示,ZestFinance的数据来源的多元化体现在:首先,对于ZestFinance进行信用评估最重要的数据还是通过购买或者交换来自于第三方的数据,既包含银行和信用卡数据,也包括法律记录、搬

家次数等非传统数据。再次是网络数据,如IP地址、浏览器版本甚至电脑的屏幕分辨率,这些数据可以挖掘出用户的位置信息、性格和行为特征,有利于评估信贷风险。此外社交网络数据也是大数据征信的重要数据源。最后,直接询问用户。为了证明自己的还款能力,用户会有详细、准确回答的激励,另外用户还会提交相关的公共记录的凭证,如水电气账单、手机账单等。多维度的征信大数据可以使得ZestFinance能够不完全依赖于传统的征信体系,对个人消费者从不同的角度进行描述和进一步深入地量化信用评估。大数据分析模型图5展示了ZestFinance的信用评估分析原理,融合多源信息,采用了先进机器学习的预测模型和集成学习的策略,进行大数据挖掘。首先,数千种来源于第三方(如电话账单和租赁历史等)和借贷者的原始数据将被输入系统。其次,寻找数据间的关联性并对数据进行转换。再次,在关联性的基础上将变量重新整合成较大的测量指标,每一种变量反映借款人的某一方面特点,如诈骗概率、长期和短期内的信用风险和偿还能力等。然后将这些较大的变量输入到不同的数据分析模型中去。最后,将每一个模型输出的结论按照模型投票的原则,形成最终的信用分数。其中,ZestFinance开发了10个基于机器学习的分析模型,对每位信贷申请人的超过1万条数据信

相关文档
最新文档