大数据对征信工作的启示与思考

大数据对征信工作的启示与思考
大数据对征信工作的启示与思考

互联网金融信用风险分析与大数据征信体系构建

互联网金融信用风险分析与大数据征信体系构建 摘要:互联网金融中的信用风险一方面表现为更为微型的客户对象导致的信用风险,一方面表现为互联网金融平台导致的信用风险。互联网金融中的信用风险产生原因包括缺乏完善的征信体系、缺乏严格的信息披露机制、缺乏全面的风险控制手段以及缺乏明确的法规监管。传统中央银行为主导的线下征信体系覆盖率低、成本高并且相对封闭,大数据征信依托多样化、高频率和高体量的非结构化数据,通过搜集和处理能够反映主题行为习惯的全方位、多维度信息,构建反映其性格特征、身份特质、履约能力等多维度的定量模型,利用各种算法推断其信用特征,并获得量化信用评估结果。大数据征信体系发展需要鼓励建立行业协会、规范产品标准和重视数据隐私保护。 关键词:互联网;风险征信体系;金融信用 一、互联网金融中信用风险的表现 互联网金融是以互联网为资源,大数据、云计算为基础,采用新金融模式运作的一种新兴行业。根据国际电信联盟(ITU)2014年11月24日发布的《2014年测量信息社会报告》,2014年全球网民共30亿,占居民总数的40.4%。中国作为最大的发展中国家拥有世界1/5的网民。根据中国互联网络信息中心(CNNIC)发布的第35次《中国互联网络发展状况统计报告》,截至 2014 年 12 月,中国有6.49 亿网民,12亿手机用户中有5.57 亿手机网民。3.04亿用户使用网上支付,网民中使用网上支付的比例为46.9%;手机支付用户规模为2.17亿,网民中手机支付的使用比例为39.0%。购买过互联网理财产品的网民规模达到7849万,在网民中使用率为12.1%。 谢平和邹传伟将互联网金融定义为以互联网为代表的现代信息科技,特别是移动支付、社交网络、搜索引擎和云计算与金融相结合的,既不同于商业银行间接融资、也不同于资本市场直接融资的第三种金融融资模式。2014年谢平、邹传伟和刘海二撰写的《互联网金融手册》中,互联网金融被定义为一个谱系概念,涵盖因为互联网技术和互联网精神的影响,从传统银行、证券、保险、交易所等金融中介和市场,到瓦尔拉斯一般均衡对应的无金融中介或市场情形之间的所有金融交易和组织形式。李耀东和李钧则认为,互联网金融并不简单是具有互联网技术的金融,而应该是基于互联网思想的金融,即服务长尾市场、普惠和去中心化的金融。主要特点为服务于长尾市场;具有海量用户;关注个性化需求;重视创新;正视风险;重视用户体验;重视开放性;重视社会化营销。

征信数据—征信大数据的挖掘与风控应用

互联网金融发展的关键是风险控制,“风险控制”已然成为诸多互联网金融企业能否长大的魔咒,这个不争的事实像一座大山摆在众多互联网金融大佬与创业者的面前。为什么阿里金融能够将它的网络小贷不良率控制在不到1%,有胆量再贷多点吗?大数据挖掘技术和互联网金融的风险控制到底是什么关系?互联网金融将怎样建立有效的风险控制生态体系?本文将带你揭开大数据挖掘与互联网金融风险控制的神秘面纱。 最近互联网金融圈不仅自己玩的很开心,而且还拉上了金融界甚至央行的大佬们一起玩的很开心。尽管让互联网金融企业头痛的问题——央行征信系统不对市场开放,仍然没有解决,但至少央行的态度明朗,支持互联网金融的发展,并认为互联网金融是传统金融的有益补充。 生命的神奇之处在于它总能找到一个出口。作为新生事物的互联网金融也不例外,在那扇门朝他们关闭的同时,他们却找到了另外一扇窗。在亦步亦趋的探索中,他们中的大企业通过自身力量,小企业通过联合的力量找到了适合自身发展的风险控制生态系统,正朝着良性和有序的方向发展,正如凯文凯利在他的《失控》中描述的群氓智慧那只无形的手。 互联网金融掌握了可以颠覆传统金融的风控技术 在不依赖央行征信系统的情况下,市场自发形成了各具特色的风险控制生态系统。大公司通过大数据挖掘,自建信用评级系统;小公司通过信息分享,借助第三方获得信用评级咨询服务。 互联网金融企业的风控大致分为两种模式,一种是类似于阿里的风控模式,他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型。另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构,再分享征信信息。

央行的征信系统是通过商业银行、其它社会机构上报的数据,结合身份认证中心的身份审核,提供给银行系统信用查询和提供给个人信用报告。但对于其它征信机构和互联金融公司目前不提供直接查询服务。2006年1月开通运行的央行征信系统,至2013年初,有大概8亿人在其中有档案。在这个8亿人当中,只有不到3亿人有过银行或其他金融机构发生过借贷的记录,其中存在大量没有信贷记录的个人。 而这些人却有可能在央行征信系统外的其它机构、互联网金融公司自己的数据系统中,存有相应的信贷记录。市场上一些线下小贷公司、网络信贷公司对于借贷人的信用评级信息需求非常旺盛,也因此催生了若干市场化征信公司,目前国内较大的具有代表性的市场化征信公司有几家:如北京安融惠众、上海资信、深圳鹏元等等。 从P2P网贷公司和一些线下小贷公司采集动态大数据,为互联网金融企业提供重复借贷查询、不良用户信息查询、信用等级查询等多样化服务是目前这些市场化的征信公司正在推进的工作。而随着加入这个游戏规则的企业越来越多,这个由大量动态数据勾勒的信用图谱也将越来越清晰。 互联网海量大数据中与风控相关的数据

大数据在金融行业的应用与发展展望...

大数据在金融行业的应用与发展展望 现如今,人们的生活中无不充斥着互联网的痕迹,越来越多的行为和事件被大数据记录又被大数据影响,金融行业因其安全性的重要更是与大数据技术息息相关。 金融业务对于数据应用的广泛性与质量要求 在互联网发展日新月异的时代背景下,人们的生活、工作、消费、活动的习惯与行为特点在被不断重塑,大量数据被留存记录,各行业对于数据的挖掘和使用有了适应时代发展的新特点,这在银行等金融机构的业务中尤为凸显。获客、信用风险控制、留存客户、触发客户消费是金融行业的几大痛点,而以集奥聚合(北京集奥聚合科技有限公司简称)为代表的大数据技术公司引领的大数据行业的发展正好满足了这些需求,有效克服了目前金融机构数据来源单一、覆盖率不足、数据挖掘程度不深等问题。 金融行业既涉及宏观国民经济的方方面面,又与微观社会主体的经济生活密切相关,中国是一个人口大国,也是社会活动多样性的代表性国家,金融机构为了在纷繁的条件下做出正确的商业判断越发需要依据海量的高质量数据进行分析,但这也与相关数据覆盖人群不足、信息孤岛尚未联通等社会大环境形成了相对矛盾。例如,在个人信用风险控制方面,过去金融机构主要依托从各金融机构上报的信贷类数据的集中管理者——人民银行征信中心调取相关数据对于个人

进行信用评价,但人民银行征信中心的数据并未对中国全部人口有实质性的广泛覆盖,甚至可以说只覆盖了偏少一部分有信贷、信用卡消费记录的人群,加之考虑到因互联网金融日益发展等因素而对金融产品需求愈发多样的人群,仅基于信贷类数据评价这些人群可能会误伤很多暂时还没有信贷纪录的中低收入人群,利用不同来源的“大数据”及相关技术(以下统称大数据)解决个人客户信用评价的全面性与客 观性问题的重要作用凸显出来。 有价值大数据汇聚具备的特点 有价值的大数据的汇聚具备以下特点,这也是金融业应用大数据时要考虑的关键: 一、数据的联通性。由于很多数据是基于不同渠道、场景和主键进行的汇聚,要把这些碎片化数据进行准确整合,需要有很强的ID MAPPING能力,数据的联通解决不同数据是否归属于同一主体的能力。问题举例,10条行为信息,究竟是10个不同主体产生的,还是1个人在10个不同渠道留下的,不同的判断会直接影响数据分析的结果。 二、数据的连续性。数据汇聚需要在“约定“的频率下持续不断、全面地进行才能产生集合价值。首先,数据连续性要求数据源本身具备稳定提供数据的能力、数据全面和质量可靠的能力。就完整和可靠而言,金融机构是公认的最完整和可靠的数据来源。就稳定性而言,

大数据时代的金融征信

大数据时代的金融征信 先从征信的概念说起吧,放贷机构之“征信”是放贷机构基于内部信息的风险管理过程,而征信行业之“征信”是为放贷机构的风险管理提供外部信息支持的活动,包括来自征信系统的通用化征信报告和来自资信调查机构的定制化资信调查报告两大类。 征信系统通过放贷人之间的信息共享机制,为放贷人提供了仅以自身永远无法获得的信息,服务于放贷活动和信贷市场。征信系统坚持两大原则:第一是互惠原则,只有首先报数据才能查数据。第二是全面共享原则,同质信息的共享是全面(正面信息和负面信息都有)对等的。此外,通过征信系统业已建立的信息共享渠道,集中采集、使用公共信息,可满足放贷机构“虽能获得、但成本高”的那部分信息需求,也是征信系统的潜在作用。征信系统主要有以下几个特点。 资信调查是由授信机构发起的、针对被调查对象的信用调查、信息采集和加工的活动,其主要产品也由标准化的信用报告演化为量身定制的资信调查报告等,服务的对象也由信贷市场中的放贷机构,逐步延伸到社会经济生活的其他方面。 2013年,世界银行国际征信业委员会制定的《征信国际通用原则》指出,征信系统促成放贷机构共享其客户的借贷信息,有效降低了单个放贷成本和整个社会融资信息的成本。《原则》也为各国征信系统建设制定了指引,具体包括:征信数据要准确、及时和充分,信息来源制度化、系统化,数据保存足够长的时间;二是数据处理要安全、可靠、高效;三是在法律和监管环境上要确保清晰、可预测、非

歧视性、恰当并支持数据主体权利;四是在征信机构的治理上要确保机构治理科学有效等;五是在条件允许时促进数据的跨境流动。 《原则》也为评价一个征信体系的发展状况制定了相应的指标。一个完善的征信系统,应该包括:在信息覆盖面上,尽可能地对放贷机构、借款人群和地域上的全覆盖;在数据采集、挖掘中满足放贷机构、信息主体、监管部门等征信系统参与各方对信息的需求;征信系统要尽可能在保障信息主体的知情权、使用权、异议权等征信权益和促进公平信贷之间的平衡,在促进信贷市场发展、保障公平信贷权利、促进信贷市场有效竞争等方面发挥积极的作用。这为各国征信业的发展提供了有效的指导性纲领。 再说说我国征信系统的基本情况。 我国的企业征信系统1992年起源于深圳的企业贷款证,个人征信1999年在上海试点,人民银行历时20多年,建成了世界最大、全国统一的企业和个人征信系统。 目前,全国集中的数据库,通过与公安部身份联网核查和质检总局组织机构代码联网核查,与金融机构一点接入,达到秒级响应的高效率访问,实现全国范围内统一的制度、标准、授权和管理。 目前,我国征信系统主要采集身份信息、信贷信息、非金融负债信息三大块,涵盖了贷款、贸易融资、保理、票据贴现等各类企业授信产品,以及个人消费贷、住房抵押贷款、信用卡、个人经营性贷款等个人信贷产品。 从借款人来看,征信系统收录的企业和自然人数已居全球前列。

大数据征信

大数据征信互联网金融的罗生门 2015-02-19徐富记 从央行个人征信牌照开闸,到首家互联网银行微众银行给卡车司机发放第一笔贷款,互联网金融的浪潮俨然已从P2P网贷汹涌到众筹,又波涛到大数据征信。 史铁生曾说过:“历史在发生时未被发现,在发现时已被重组”,正如当下之大数据征信,尽管已悄然发生,但未被发现,而再发现时,却已被改写,局内人的自说自话,局外人的不明觉厉,大数据征信,似乎已成互联网金融的罗生门。 四级征信机构百花齐放 2015年新年伊始,央行下发《关于做好个人征信业务准备工作的通知》,正式开启个人征信市场化闸门,民营征信迎来元年,以阿里巴巴芝麻信用为代表的基于消费大数据的征信机构、以鹏元征信为代表的基于公共大数据的征信机构和以社交数据作为征信模式的玖富旗下的闪银(we cash)等征信机构纷纷登台亮相。 以目前国内的信用体系,信用数据大致分为国家级、电商级、互联网金融企业级、社交金融级,其中,国家级的信用数据为央行的征信中心和银行等金融机构的信贷数据、各部委的具有公共属性的比如通信、水、电、煤气等公共数据。 电商级的即包括以阿里、京东为代表的消费数据;互联网金融企业级的则如安融惠众、上海资信;社交金融则如闪银等开启的新型征信模式。 毫无疑问,征信产业的发展不仅有效防范金融的风险,改善个人贷款质量,提高了银行的净收益,同时,随着国内信贷行业及消费行业的提速,也再次催生了征信业的巨大需求,据《中国征信业发展报告(2003-2013)》显示,截止 2012 年我国征信机构达到140 家左右,总规模达 20 亿,相较于美国近 800 亿市场和日本 40 亿市场仍有较大的差距。 为此,方正证券研究认为,如果我国采取市场化模式,按照现有价格、企业及个人总数的体量,在发展成熟后我国征信行业仅个人征信市场总空间将在 1000 亿左右,相较目前不到 20 亿的体量有 50 倍的成长,是名符其实的蓝海。 我的“痛”,有谁知?

C16003大数据在征信中的应用课后测验(满分)

C6003大数据在征信中的应用课后测验(满分) 试题 一、单项选择题 1. 根据Chuck数据观,有针对性、与我们直接相关的信息称为()。 A. 数据 B. 情报 C. 智慧 D. 知识 描述:Chuck数据观的主要内容 您的答案:B 题目分数:10 此题得分:10.0 2. 从海量的数据中挖掘出目标客户主要属于大数据在()方面的应用。 A. 客户服务 B. 精准营销 C. 行为分析 D. 产品优化 描述:大数据的应用 您的答案:B 题目分数:10 此题得分:10.0 3. 在互联网技术中,CT是()的简称。 A. 信息技术 B. 云计算技术 C. 移动技术 D. 大数据 描述:互联网技术发展历程 您的答案:B 题目分数:10 此题得分:10.0 4. 在互联网技术中,()提高了互联网的智能水平。 A. 信息技术

B. 云计算技术 C. 移动技术 D. 大数据 描述:互联网技术发展历程 您的答案:D 题目分数:10 此题得分:10.0 二、多项选择题 5. 当前我国P2P平台恶性竞争可能会带来的问题有哪些? A. 金融诈骗 B. 非法集资 C. 高利贷 D. 融资困难 描述:我国P2P平台恶性竞争的影响 您的答案:C,B,A 题目分数:10 此题得分:10.0 6. 下列属于互联网征信数据来源的有()? A. 政府机构信息 B. 人力招聘广告 C. 电商交易评级 D. 公共事业缴费 E. 网上浏览数据 描述:互联网征信数据的来源 您的答案:E,A,D,C,B 题目分数:10 此题得分:10.0 7. 大数据应用平台可以提供哪些服务? A. 精准营销 B. 客户服务 C. 信用报告 D. 风险防控 E. 产品优化

大数据征信深度报告

大数据征信深度报告(附PPT) 大数据应用是当今互联网时代最伟大的技术;征信是有着悠久历史的传统金融业务。当象征着未来的大数据与象征着传统的征信业务结合在一起,它们便产生了惊人的化学反应。 在FICO中国区总裁陈建看来,征信的本质就是采集和记录信用信息并在 整理加工后提供给决策者,而如今,得益于大数据、云计算、人脸识别、深度算法等技术的进步,征信有了更广泛的意义和用途。 随着大数据征信行业的崛起,越来越多的玩家开始进入市场,其中就包括拿到第一批个人征信牌照的腾讯和阿里爸爸。那么大数据征信究竟会对整个征信市场造成什么影响?又会为这个行业创造出哪些新的机会?让我们用下面这份深度报告回答你: (注:本报告中的观点均为我们根据市场调研和访谈所做的合理推测,并不代表准确商业信息。)

在如今的互联网时代,传统的借贷历史数据已经不能很好地反映个人或者企业的信用评级,大数据征信采用了社交、电商、运营商以及搜索数据等数据源,并根据自身的业务模式建立相应的信用评级模型。目前市场上主要信用评级模型是侧重电商、侧重社交、侧重运营商和侧重信用卡这四类。

目前我国的征信市场分为企业征信市场和个人征信市场两类,主要还是由政府主导,但是市场化的趋势已经十分明显。包括腾讯征信和芝麻信用在内的 八家企业已经拿到了第一批个人征信牌照、政府也在2015年发布了一系列鼓励大数据征信行业的政策,预示着大数据征信市场正逐渐走向成熟。

目前我国征信市场存在的问题就在于以央行为主导的单一市场格局的覆盖率较低,个人征信市场覆盖人数比率仅有62.6%,企业征信覆盖率更是仅有28.4%,并且数据源仍以信贷信息为主,缺少多维度的信息。面对爆发式增长的消费信贷需求,这样的市场格局明显不能满足。大数据征信能够利用自身的

大数据征信

大数据征信 传统个人征信的分析维度包括: 1.个人基本数据,如年龄、性别、职业、收入、婚姻状况、工作年限、工作状况等; 2.信贷情况,主要是信贷和信用卡相关数据; 3.公共数据,包括税务、工商、法院、电信、水电煤气等部门的数据; 4.个人信用报告查询记录。 如今随着大数据时代的到来和发展,可用于评估人们的数据越来越丰富,如电商的交易数据、社交类数据(强社交关系如何转化为信用资产)、网络行为数据等,来自互联网的数据将帮助金融机构更充分地了解客户。

(一)侧重电商:芝麻信用 以芝麻信用所构建的信用体系来看,芝麻信用分根据当前采集的个人用户信息进行加工、整理、计算后得出的信用评分,分值范围是350 到 950,分值越高代表信用水平越好,较高的芝麻分可以帮助个人获得更高效、更优质的服务。芝麻分综合考虑了个人用户的信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度的信息,其中来自淘宝、支付宝等“阿里系”的数据占 30-40%。 1.信用历史:过往信用账户还款记录及信用账户历史。目前这一块内容大多来自支付宝,特别是支付宝转账和用支付宝还信用卡的历史。 2.行为偏好:在购物、缴费、转账、理财等活动中的偏好及稳定性。比如一个人每天打游戏 10 小时,那么就会被认为是无所事事;

如果一个人经常买纸尿裤,那这个人便被认为已为人父母,相对更有责任心。 3.履约能力:包括享用各类信用服务并确保及时履约,例如租车是否按时归还,水电煤气是否按时交费等。 4.身份特质:在使用相关服务过程中留下的足够丰富和可靠的个人基本信息。包括从公安、学历学籍、工商、法院等公共部门获得的个人资料,未来甚至可能包括根据开车习惯、敲击键盘速度等推测出的个人性格。 5.人脉关系:好友的身份特征以及跟好友互动的程度。根据“物以类聚人以群分”的理论,通过转账关系、校友关系等作为评判个人信用的依据之一。其采用的人脉关系、性格特征等新型变量能否客观反映个人信用,但目前还没有将社交聊天内容、点赞等纳入参考。

浅谈大数据征信与隐私

浅谈大数据征信与隐私 大数据征信是指运用大数据技术构建征信模型及算法,通过对海量数据进行采集、分析、整合和挖掘,多维度刻画信用主体的违约率和信用状况,形成对信用主体的信用评价。大数据征信的核心是将大数据技术应用到征信活动中,强调处理数据的数量大、刻画信用的维度广、信用状况的动态呈现、交互性等特点。从运行机制上看,大数据征信主要是对征信信息进行自动采集、存储、分析和结果输出,对信用风险进行实时、动态的跟踪和管理,注重对弱相关、非结构化和多维度的海量数据进行深入挖掘和相关分析,力图客观、准确、全面、动态地呈现信息主体的信用状况。与传统征信相比,大数据征信覆盖了更为广泛的人群,数据收集和处理效率有较大提升,在一定程度上避免了人为因素的干扰,防范了可能发生的道德风险,为普惠金融开辟了一条新路径。 大数据征信挑战个人隐私边界 第一,隐私边界模糊。受大数据追求全数据、混杂性、相关关系和数据化的趋势影响,大数据征信大大地拓宽了个人信息的范围,除了传统的信用信息数据外,个人的互联网大数据、传感数据、行为数据、地理位置数据等,都在被纳入考察维度之中,都可通过算法模型转换成对个人的信用评价,个人信息、信用信息与隐私的边界被进一步模糊。基于技术实现难度、市场需求、成本和效率的综合考量,征信机构在个人信息收集处理过程中,并没有动力对个人信息、信用信息与隐私信息予以区别对待,信息主体享有的知情同意权、异议权、更正权、删除权等,往往得不到充分尊重和保障。实践中,复杂而充满陷阱的隐私政策、为接受相关服务而被迫“让渡”的个人信息控制权,以及个人隐私被侵犯后调查取证的复杂流程、高技术壁垒、高成本等,往往成为阻碍信息主体寻求司法救济的主要障碍。在大数据征信行业迈向自动化和智能化的道路上,个人信息和个人隐私正面临着被无限制、无差别收集和使用的风险。 第二,立法相对滞后。当前,涉及个人信息与隐私保护的法律主要有《刑法》《侵权责任法》《网络安全法》(2017年6月实施)、《消费者权益保护法》《征信业管理条例》《征信机构管理办法》《电信和互联网用户个人信息保护规定》《个人信用信息基础数据库管理暂行办法》《征信机构监管指引》《征信机构信息安全规范》《信息安全技术公共及商用服务信息系统个人信息保护指南》,等等。总的来看,现行立法多是间接的、碎片化的、框架性的规定,存在执法部门权限职责不清,个人信息的收集处理规则不科学、不合理,企业守法成本高,司法救济渠道不畅,个人维权成本高昂且效率低下等诸多问题。特别是大数据背景下如何规范收集、处理个人信息,如何保障信息主体的合法权益,提供何种司法救济手段,等等,都缺乏相应的具体规定,个人隐私保护面临无法可依的窘境。 第三,行业自律不足。由于征信信息种类繁多,来源渠道复杂,涉及公安、工商、电信、金融等多个监管部门,监管协同难度较大,监管机构尚未建立起科学有效的手段来实时判别征信机构的信息采集行为是否合法合规。在此背景之下,行业自律作为隐私保护最重要的一道防火墙就显得尤为重要。但从征信业的总体情况

C16003大数据在征信中的应用课后测验 100分

一、单项选择题 1. 根据Chuck数据观,有针对性、与我们直接相关的信息称为()。 A. 数据 B. 情报 C. 智慧 D. 知识 描述:Chuck数据观的主要内容 您的答案:B 题目分数:10 此题得分:10.0 2. 在互联网技术中,CT是()的简称。 A. 信息技术 B. 云计算技术 C. 移动技术 D. 大数据 描述:互联网技术发展历程 您的答案:B 题目分数:10 此题得分:10.0 3. 根据FICO的信用评分体系,如果消费者的信用分数为680,则其处于()的等级。 A. FAIR B. OK C. GOOD D. GREAT 描述:FICO个人消费信用评估体系 您的答案:C 题目分数:10 此题得分:10.0 二、多项选择题 4. 下列属于互联网征信数据来源的有()? A. 政府机构信息 B. 人力招聘广告 C. 电商交易评级 D. 公共事业缴费 E. 网上浏览数据 描述:互联网征信数据的来源

您的答案:B,C,E,A,D 题目分数:10 此题得分:10.0 5. 大数据应用平台可以提供哪些服务? A. 精准营销 B. 客户服务 C. 信用报告 D. 风险防控 E. 产品优化 描述:大数据的应用 您的答案:C,B,D,A,E 题目分数:10 此题得分:10.0 三、判断题 6. 云计算技术带来的不仅是资源使用的集约化,同时也推动了技术的民主化过程。 描述:云计算技术的作用 您的答案:正确 题目分数:10 此题得分:10.0 7. 大数据就是对海量数据进行分析处理并提取有价值的模式/规律的相关技术。 描述:大数据 您的答案:正确 题目分数:10 此题得分:10.0 8. 根据Chuck数据观,数据从无序到有序的过程为信号—数据—信息—情报—知识—智慧。 描述:Chuck数据观的主要内容 您的答案:正确 题目分数:10 此题得分:10.0 9. 传统征信方式和互联网征信方式的差别之一是互联网征信数据来源广、频度高。 描述:传统征信与互联网征信的区别 您的答案:正确 题目分数:10 此题得分:10.0

大数据在金融行业的应用与挑战

大数据在金融行业的应用与挑战 作者:盛瀚北京银行,长期从事信息化安全建设和IT服务管理的研究。 摘要:本文对大数据在金融行业的应用发展进行分析,阐述大数据的特征和发展趋势,结合金融行业特性介绍数据类型、技术实现和相关应用及场景案例,同时从数据增长、数据保障、数据标准和数据人才四个方面描述了大数据金融存在的挑战。 关键词:大数据,金融 1.大数据概述 1.1.什么是大数据 大数据(Big Data)是一个宽泛的概念,业界没有统一的定义,大数据概念的兴起可以追溯到2000年前后,最初理解为一类海量数据的集合。2011年,美国麦肯锡在研究报告《大数据的下一个前沿:创新、竞争和生产力》中给出了大数据的定义:大数据是指大小超出典型数据库软件工具收集、存储、管理和分析能力的数据集。根据Gartner的定义,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据在通信、金融、教育等各个领域存在已有时日,近年来随着互联网和信息行业的发展进入了快速推广阶段。 1.2.大数据的特征 大数据不仅有传统数据定义的“三个V”,即数量(Volume)、速度(Velocity)和种类(Variety),还包含了更重要的第四个V,价

值(Value)。 阿姆斯特丹大学提出了大数据体系架构框架的5V特征,在原有4V基础上增加了真实性(Veracity)特征,包括数据可信性、真伪性、来源和信誉、有效性和可审计性等特性,如图1所示。 图1大数据体系架构框架5V特征 1.3.大数据的发展趋势 随着大数据产业的不断发展,各行业的应用解决方案不断成熟,大数据产业迎来了井喷式发展。Wikibon 数据显示,2014年全球大数据市场规模达到285亿美元,同比增长53.2%。大数据成为全球IT 支出新的增长点,如图2所示。Gartner数据显示,2014年数据中心系统支出达1430亿美元,比2013 年增长2.3%。大数据对全球IT 开支的直接或间接推动将达2320亿美元,预计到2018年这一数据将增长三倍。

由互联网大数据引发征信监管的思考

由互联网大数据引发征信监管的思考 近年来,借助互联网,大数据的概念浮现出来,人们在互联网大数据的基础上,尝试开展征 信活动,但从目前实际情况来看,将互联网大数据应用于征信的实践尚处于探索之中,对这 种探索的效果,除了从业人士的一些概念化的预期外,目前缺乏理论和实证的评估。 ?互联网大数据现状 从大数据来源渠道看,目前,一些互联网企业的所谓大数据,大体来自四个方面。一是信用 交易数据,个别银行机构和人人贷(P2P)等类金融机构,在管理上实行数据服务外包,将 所渭“脱敏”后的客户信用数据,如信用卡和个人零售信贷业务,外包给自身认定的IT企业, 以帮助其针对特定人群开发特定产品。二是商品和服务交易数据以及行为数据,包括一些电商、金融、娱乐、旅游等企业,以及水、电、气、电话、教育、医疗等公用服务机构,利用 自有的工作机制和网络平台,收集本机构留存的客户买卖商品和享受服务中的身份信息、业 务信息和社交行为信息,并对这些数据进行有序加工整理,形成数据库。三是收集公开信息。主要是政府公开信息和公共服务信息,特别是有关企业和个人的注册登记信息,一些政府部 门及其直属机构,将企业和个人的注册登记信息(大多电子化)统一汇集后,对外提供查询 服务。四是通过技术手段爬取数据。对于一些互联网企业来讲,彼此之间通过爬虫技术爬取 数据,似乎己成常规,彼此心照不宣,互不言偷,另有一些不法分子内外勾结倒卖盗买数据,当前坊间谈论的数据黑色产业链,大体属于这种情况。 二、大数据征信存在的问题 (一)大数据的范畴和内涵突破“金融属性”。传统征信数据主要来源于金融机构和公共服务 部门,为银行信贷信息为核心,包括社保、公积金、环保、欠税、民事裁决与执行等公共信息,数据相对完整且权威性高。大数据征信采集的范畴突破“金融属性”,数据主要来源于电 商平台、社交类平台以及生活服务类平台等,涵盖网上交易数据、社交信息及互联网服务过 程中生成的行为数据,这些数据一部分与信贷行为有关,一部分与信贷行为关系不大,但可 以反映信息主体的行为习惯、消费偏好等。 (二)大数据采集和使用,没有遵循“独立第三方原则”。传统征信坚持“独立第三方”原则, 征信机构是“市场中立”的——既不与信息提供者或信息使用者有直接商业竞争关系,也不介 入或影响信息提供者或信息使用者在各自细分市场的竞争,而大数据征信突破“独立第三方” 边界,大数据的采集和使用多源于并应用于自身机构开展业务活动。而且如果信息提供者或 信息使用者控制征信机构,也很难约束其不滥用征信数据,或损害个人征信权益,另外征信 机构无形中会获取一定的市场影响力,可能扭曲信息提供者和信息使用者,并对收费有操控力。 (三)大数据涉及隐私保护形势日趋严峻。由于互联网企业数据的形成渠道非常复杂,大量 信息采集未经当事人同意授权,所以在目前互联网大数据的形成上,普遍存在信息来源不可 追溯、不可异议、不可纠错,当事人在无意识下信息“被采集”,这严重侵害信息主体的隐私 和财产权益,隐私保护形势日趋严峻。大数据时代,数据挖掘和抓取技术广泛应用,信用主 体全方位信息数据得以全盘收录,海量信息数据的收录给信用主体隐私带来巨大挑战,隐私 防护更加困难。 (四)大数据没有实现标准化和信息共享。我国目前的互联网大数据企业众多,许多都以大 数据为目标,数据规模无论多大,都分属不同的互联网公司,数据不能实现聚合,基本上是 各居“山头”,各自为战,数据的标准化远未提上管理日程。信息共享的前提是数据标准化, 集合不同渠道不同性质的数据,若不以标准化为规则,数据的可加性和可比性就得不到保障。 ?对大数据征信加强征信监管的思考

企业大数据之大数据征信及风控应用_光环大数据培训

https://www.360docs.net/doc/c93573520.html, 企业大数据之大数据征信及风控应用_光环大数据培训 互联网人口红利区已经过去,获客成本增大,用户对产品的要求也越发提高,高价值和低成本服务是当前的一种趋势。其中,企业服务致力于为企业在生产,销售和沟通等环节提高效率,降低成本,受到越来越多的资本青睐。 随着人工智能对行业的渗透,以及数据量的剧增,越来越多的企业服务产品正利用人工智能,大数据等相关技术提供更智能服务,大数据作为人工智能模型中的训练"粮食",占据重要位置,如何挖掘和利用企业数据,是做好企业服务的一个重要途径,企业大数据来源主要有以下几个方面: a.企业内部数据化档案,例如人事资料,纸质化资料等; b.企业自产数据,例如企业内部OA,ERP和CRM系统所沉淀下来的客户数据,办公数据,生产经营数据,社交数据,电商数据,支付数据,供应链数据等; c.企业信用数据 政府公开数据-比如工商的企业信用信息公示数据,失信被执行,被执行数据,裁判文书,开庭公告,法院公告,税务数据,动产融资数据,招投标,司法拍卖数据等,专利商标,行政处罚等数据。互联网公开数据-比如新闻数据,招聘网站数据,上市披露数据。 征信概述 1.征信定义

https://www.360docs.net/doc/c93573520.html, 征信一词源于《左传·昭公八年》中的“君子之言,信而有征,故怨远于其身”。其中,“信而有征”即为可验证其言为信实,或征求、验证信用。现代征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。 2.政策/技术/市场环境分析 政策 中国社会由熟人社会慢慢转变为陌生人社会,信用风险和信用危机也随之产生,加快信用体系建设迫在眉睫,然而,行政过程中尚未全面建立起“守信激励、失信惩戒”的机制,《政府信息公开条例》虽然已对政务信息公开作出了具体规定,但执行过程中,政务信息的公开尚不全面,部分信用信息的缺失,削弱了信用信息的完整性,不利于形成准确的信用状况判断. 技术 其次,互联网时代早已成为大家共识,企业和个人在网络上留下的大量数据,为征信带来了数据基础,且随着大数据,云计算,人工智能的发展,为智能化征信提供了技术支撑。 市场 另外,我国市场经济体制建立的时间不长,全社会信用意识和社会信用环境还比较薄弱。为争取经济利益而失信的行为时有发生。这既有信用意识淡薄的原因,也有失信成本过低的原因。征信作为金融的一个重要组成部分,是风险控制的核

大数据征信难题以及征信机构存在问题#(精选.)

大数据征信难题以及征信机构存在问题 综述:互联网金融发展对大数据征信的需求越来越大。征信系统建设已经成为我国重要的金融基础设施之一。我国的征信市场目前还不太健全,信用数据呈碎片化,这在很大程度上影响了消费金融行业的可持续发展。 1大数据征信的难题 1.1 征信法律是大数据征信的第一个难题 2014年3月,美国国家消费者法律中心对主要的大数据征信公司进行了调查并发表了一篇重要的调查报告,题目是《大数据,个人信用评分的大失望》。文章指出大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。文章对这些公司的合法性提出质疑,建议政府加强监管。 大数据征信在中国问题更大。“征信管理条例”明确规定“采集个人信息应当经信息主体本人同意,未经本人同意不得采集。”。这比美国《公平信用报告法案》对信息采集的要求更严格。如何按照条例要求,让信息主体本人同意用没人能说得清的大数据对其进行征信,这不是个容易事。 1.2 坏账的“不可预测性”是大数据征信的第二个难题

征信的目的是预测借款人是否会守信还贷。那么人为什么会借钱不还?这里面有两个原因,一是有钱就是不还;二是想还就是没钱。第一种情况在美国很少。原因是信用报告和就业、住房相关,对中产阶级价值很高。有工作、有钱的人不会为几万美元债务毁掉自己的信用,这是赔本买卖。但是 2008年房贷危机后产生了一个比较特殊的现象叫做策略性欠债不还——借房贷的房主在房价下跌到比贷款额 低很多的时候,再去买一栋房子,然后不付以前买房子欠的贷款,把以前的房子还给银行。这一策略可以“套利”几十万美元。银行只能把房子收回,损失几十万美元。虽然这些人的信用记录上会有一个污点,但是这对信用报告的影响有限,因为其他的债务照付不误。这种坏账历史上没出现过。造成这一现象的原因一部分是经济和房价波动,但更主要的原因是政府政策失误。大数据对这种坏账的预测(征信)能力非常有限。 至于没钱还债又可分成两个原因。一个原因是借款人花钱花得多了,入不敷出。美国的一些研究调查显示大概有三分之一的美国人是”月光族“ -- 每个月把挣的钱基本上花光。这部分人很多是低收入,一旦发生意外,比如车祸、生病,或者别的一些紧急用钱的情况,他们就只能把能借到的钱都用上。这些借款的利息都很高,利滚利,时间久了,还不了债,就成了坏账。有了坏账信用评分就比较低。这部分人有一个不雅的统称叫“次贷借款人” (subprime borrower),在个人信用信息局的档案里占20%-25%。银行根据信用报告和信用评

未来征信(大数据征信):三大数据体系

未来中国征信:三大数据体系 征信体系建设改善了我国社会与经济的发展环境,为经济发展提供了必要的保障,为社会主义市场经济的运行建立了新规则。征信体系建设是我国社会与经济发展的必然要求,是我国市场经济的最新组成部分,是我国创新社会管理的重要内容之一。 一、我国未来三大征信体系 所谓征信体系,主要是指在相关牵头部门的推动和组织下,按照一定的数据采集标准,对信用主体的信用信息进行采集、加工、核实和更新,以实现信用信息在体系内互联互通的一种信用管理运行机制。中国的征信体系建设历经十几年的探索,已经初见成效,在政府部门、行业组织和地方政府层面均以不同形式建设着、存在着,发挥着不同程度的作用。在不远的将来,我国征信将形成三大数据体系:金融征信体系、行政管理征信体系和商业征信体系。 (一)金融征信体系 金融征信体系是以金融业主管部门为主导进行建设,以金融机构为主要用户,以授信申请人为主要征信对象,以信用信息在金融业内互通互联、共同防范信用交易风险为主要目的的金融业征信系统及信用管理运行机制的总称。 我国金融征信体系有两个基本特点:行业征信和准公共征信。我国金融征信体系主要采集的是金融机构传递的信用信息,主要的服务对象也是金融机构。这样的情况就是行业征信,即征信是在行业内部进行的,征信的结果也主要是为本行业服务。作为一个行业信用体系,金融征信体系首先要在金融业内进行信息的共享,其次才是有选择地以有偿或者无偿的方式对外公开一些数据与信息,而公开这些信息的前提是不影响金融行业的安全。目前,我国金融体系主要以银行业为主导,而银行业主要以国有控股为主导。整个金融征信涉及银行、证券、保险、信托等,表现出多层次与多元化的复杂性,集国有经济与市场化之大全,使得金融征信体系具有了准公共征信的特点,一方面要秉承银行为广大社会公众服务的公共性,保护投资者的利益,保护国家金融安全;另一方面也要考虑到股东的利益以及信用信息的市场需求与价值。 金融征信中心是这个体系的核心,是信用信息采集、加工、传播的专业机构,主要以金融机构为采集对象,获取企业和个人的正面与负面授信信息,用于金融机构的授信信用风险管理,并在金融体系内信息共享,以降低交易风险,促进金融业的健康发展,保障金融安全。 目前我国金融征信体系初具规模,尚待完善。中国人民银行征信中心是我国金融征信体系的数据核心。中国人民银行征信中心设立的目的之一是建设、运行和管理全国统一的企业和个人信用信息基础数据库和动产融资登记系统,但目前实际上只是以金融信贷的信用信息为主,未来应扩展到证券、保险、信托等各种金融信用交易信息,甚至还应包括金融机构与上市公司高管人员的个人信用信息、上市公司信息披露与诚信监管信息、企业与个人骗保诈保等信用信息。 (二)行政管理征信体系 行政管理征信体系是以政府及其主要职能部门为主导进行建设,以政府及其各职能部门为主要用户,以企业和个人为征信对象,以信用信息在政府及其各部门间互通互联、实现统一的信用惩戒与预警监管为主要目的的政府行政管理征信系统及运行机制的总称。 行政管理征信体系的最大特点是公共性,为政府综合信用监管服务。行政管理征信体系事实上是以电子政务为基础,以信用信息整合为切入点,实现政府及其职能部门之间信用信息共享,形成反映企业和个人综合信用状况的基础数据,实现综合的、有针对性的、预先的监督与管理,以促进社会成员遵纪守法、诚信经营。 行政管理征信体系中的信用信息系统建设,是政府的内部工作,只要符合有关行政管理

大数据征信应用与启示_以美国互联网金融公司ZestFinance为例_刘新海

INTERNET FINANCE INTERNET FINANCE 互联网金融 P2P行业的全球发展 近期,美国互联网金融公司ZestFinance受到国 内互联网金融专业人士的热捧,其基于大数据的信用评估模型也越来越受到关注和效仿。本文结合美国的金融环境,对ZestFinance进行简要介绍,分析大数据征信产生的背景,剖析大数据征信技术,并全面客观地阐述了大数据征信技术对于中国互联网金融和征信业未来发展的借鉴意义。 文/刘新海 丁伟 本文编辑/贾红宇 大数据征信应用与启示 ——以美国互联网金融公司 ZestFinance为例 jiahy@https://www.360docs.net/doc/c93573520.html, 栏目编辑 贾红宇

ZestFinance简介 Z e s t F i n a n c e ,原名Z e s t C a s h ,是美国一家新兴的互联网金融公司,2009年9月成立于洛杉矶,由互联网巨头谷歌(Google)的前信息总监道格拉斯?梅瑞尔(Douglas Merrill)和金融机构Capital One的信贷部高级主管肖恩?卜德(Shawn Budde)(曾管理过收益超过10亿美元的次级信贷业务)联合创办。ZestFinance的研发团队主要由数学家和计算机科学家组成,前期的业务主要通过ZestCash平台提供放贷服务,后来专注于提供信用评估服务,旨在利用大数据技术重塑审贷过程,为难以获得传统金融服务(Underbanked)的个人创造可用的信用,降低他们的借贷成本。 ZestFinance起初是为传统的发薪日贷款(Payday Loans) 提供在线替代的产品。发薪日贷款因借款人承诺在发薪日还款而得名。由于美国传统的信用风险评估体系无法覆盖全部的人群,大约15%的人因没有信用评分而被银行排斥在外,无法获得基本的信贷需求。除了解决传统信用评估体系无法解决的无信用评分借贷问题,ZestFinance还主要面向传统信用评估解决不好的领域,将信用分数低而借贷成本高的人群视为服务对象,利用大数据技术降低他们的信贷成本。与传统信贷管理业务比较,ZestFinance的处理效率提高了将近90%,风险控制方面,ZestFinance的模型相比于传统信用评估模型性能提高了40%。 Z e s t F i n a n c e 目前也正在向信用风险管理的其他领域纵深扩展,2014年2月ZestFinance宣布推出基于大数据分析的收债评分(Collection Score),旨在为汽车金融、学生贷款、医疗贷款提供一种新的评分系统。ZestFinance 的未来发展方向是希望把其在这种发款日的贷款上的优势继续拓展到其他贷款领域,包括信用卡、汽车的贷款,甚至包括房屋的贷款,在未来的10~15年,这一方法将取代现行指标,成为申请信贷的唯一评估标准。 ZestFinance引起国内的关注始于2013年7月,当时全球第三方支付平台PayPal联合创始人、美国知名投资人彼得?泰尔(Peter Thiel)领投了ZestFinance的2000万美元融资。 为什么要进行大数据评估传统的信用评估服务无法覆盖全体人群,特别是弱势群体 图1展示了美国F I C O 评分与其对应的人口分布情况,初始每个 人的分值基数为850分,信用评分模型利用征信数据从多个评分因素考察消费者的信用风险,从850分中减分。大致来看,美国个人消费者信用评分人群分布状况呈现两头小中间大的形态,信用分数处于750~850的人群有40%之多,其中信用分数在800~850大约占总人数的13%,在750~799超过总人数的25%,这是整个信用社会的中间阶层,对应于美国的中产阶级。其中,美国个人消费者的平均FICO 评分为678。从图1可以看出,还有大量的人群远低于平均的678分, 如FICO评分在550~549的占8%,在500~549的占5%,小于499分的占2%。根据FICO的标准,如果人们未能如期还款,或者缺乏借贷经历,他们就会自动被视为风险人士,他们的贷款也就会被惩罚性地给以更高的利率。还有一种可能,那就是他们的贷款申请会被拒,无论是否事出有因。比如,遇到了医疗紧急事故,或者最近刚刚移民美国。表1根据FICO评分将服务人群

大数据征信的发展背景及与传统征信的比较

大数据征信的发展背景及与传统征信的比较 传统征信在方便个人信贷、辅助金融授信决策、防范信用风险和提升金融获得性等方面发挥 着关键作用,但其在互联网金融领域的局限性也不容忽视。一是全国还有 5 亿左右人口没有在持牌金融机构的信用活动,从而不被其所覆盖。二是随着“互联网+ ”的发展,互联网上产生、沉淀了大量与个人征信相关的数据,目前还难以被其采用[1] 。大数据征信的出现有助于解决上 述问题,并在一定程度上取得了快速发展。据我们研究,大数据征信得以发展的基本条件有以下 三点:一是我国政策扶持和部署所释放的良好信号;二是以金融线上化”为代表的互联网金融 更巨大的长尾需求;三是大数据技术的强力支撑。 一、政策扶持 自2013 年起,我国陆续颁布了一系列法律法规,为征信业的健康发展构建了法律制度框架。 2013 年3 月国务院发布《征信业管理条例》以下简称《条例》),成为我国首部征信业法规, 也是我国征信法制建设的基石。2013 年12 月为配合《条例》的实施,中国人民银行出台《征 信机构管理办法》,贯彻建立健全社会征信体系的要求,确立征信经营活动遵循的制度规范和监 管依据。 此外,为提高个人征信服务水平,引入市场竞争,我国为逐步开放征信市场做好立法准备。 2015 年1 月中国人民银行印发《关于做好个人征信业务准备工作的通知》,批准8 家机构做好开展个人征信业务的相关准备工作。2015 年7 月中国人民银行等十部门发布《关于促进互联网 金融健康发展的指导意见》(以下简称《指导意见》),指导意见》提出推动信用基础设施建 设,培育互联网金融配套服务体系,鼓励有条件的机构依法申请征信业务许可。监管的改革措施为大数据征信的发展创造了良好的外部环境。 值得注意的是,为加快大数据部署,深化大数据应用,推进落实“互联网+ ”国家战略,2015 年7月国务院印发《促进大数据发展行动纲要》和2015 年9月国务院办公厅印发《关于运用大

相关文档
最新文档