基于中国联通大数据的个人征信评估方法
基于大数据分析的征信评价模型构建与应用

基于大数据分析的征信评价模型构建与应用征信评价是一个衡量个人或机构信用状况的重要指标,对于金融机构和其他行业来说具有重要的决策意义。
而随着大数据技术的快速发展,基于大数据分析的征信评价模型成为了理想的解决方案。
本文将探讨如何构建和应用基于大数据分析的征信评价模型。
首先,构建基于大数据分析的征信评价模型需要包括以下几个关键步骤:数据收集、数据准备、模型构建和模型评估。
数据收集是构建模型的第一步,主要通过获取借款人的历史征信数据、消费行为数据、社交媒体数据等进行分析。
数据准备则涉及数据清洗、数据转换和数据整合等工作,以确保数据质量和一致性。
模型构建是利用机器学习算法和统计模型来分析数据,并生成征信评价模型。
最后,模型评估是通过验证模型的准确性和稳定性,以确保模型的可靠性。
其次,基于大数据分析的征信评价模型可以应用于多个领域。
首先,在金融领域中,银行和其他金融机构可以利用征信评价模型来判断借款人的信用状况,并根据评估结果决定是否批准贷款申请。
此外,保险公司也可以使用征信评价模型来决定保险合同的签订和保险费率的制定。
其次,在电子商务领域,征信评价模型可以用于评估消费者的购买能力和购买倾向,并为电商平台提供个性化的推荐服务。
此外,在社交媒体领域,征信评价模型不仅可以用于筛选广告目标受众,还可以用于发现和预测用户的兴趣和需求,从而为企业提供精准营销的策略。
在应用基于大数据分析的征信评价模型时,需要注意以下几个问题。
首先,数据隐私与安全问题是需要考虑的重要方面。
个人的征信数据包含敏感信息,因此在收集和处理数据时必须符合相关的法律法规,并采取相应的安全措施保护数据不被滥用。
其次,模型的准确性和可解释性是需要权衡的关键因素。
虽然基于大数据分析的模型可以提供更准确的预测结果,但其黑盒特性使得难以解释模型的决策过程。
因此,在实际应用中,需要选择合适的模型以平衡准确性和可解释性之间的关系。
此外,模型的稳定性和鲁棒性也是需要考虑的重要问题。
基于大数据的个人征信评级模型

一、引言在当今的大数据时代,个人征信评级的数据来源于人们的生活细节,最终也将用到人们的生活点滴中去。
我们日常贷款需要进行信用评级来让金融机构判断是否可以为你办理贷款业务、该以怎样的利率贷款给你、贷款的额度是多少,贷款期限是多长等等,这一系列涉及双方利益的问题都是从信用数据中找到的答案。
而在信用评级制度不健全的时候,这些数据都处于缺失状态,需要金融机构通过电话访问的方式是一项一项地了解与核实,这就大大增加了金融机构的工作量,同时信息的准确性也难以保证。
然而目前为止,我国在大数据个人征信评级实用性模型方面的探讨还不多,由此可见,建立一个短期内可行的基于大数据的个人征信评级模型具有必要性和迫切性。
二、个人征信评级模型的建立1.原始信息选择在大数据时代,获取信息的方式五花八门,几乎每个人都生产了海量的数据,这些数据可能是你的消费记录,也可能是位置信息,甚至是通话记录等等。
为选择出满足个人征信要求的信息,我们分别对识别欺诈和确定还款能力这两个方向进行探究。
2.信息筛选为了将原始信息处理成可用的征信信息,我们需要采用分布式爬虫技术进行所需有效信息的提取。
基本原理是:从数据仓库中取出URL,利用HttpClient 进行下载,对下载后的页面内容使用HtmlCleaner 和xPath 等工具进行页面解析,这时,我们解析的页面可能是列表页面,也有可能是详细页面。
如果是列表页面,则需要解析出页面中详细页面的URL,并放入Redis 数据仓库,进行后期解析;如果是详细页面,则存入我们的MySQL数据。
3.信息处理如何将我们筛选出的信息转换为最终的信用分或者信用评级呢?这就需要我们用到大数据分析的方法。
本团队在这里借鉴阿里京东等企业的风控模型,给出一个互联网金融风控的一般方法。
(1)防欺诈风控系统①根据以往的业务系统数据可以建立黑名单、白名单白名单:通过建立数据模型进行数据挖掘,并利用机器学习相关算法进行优质用户的挖掘。
基于大数据分析的个人信用评价模型研究

基于大数据分析的个人信用评价模型研究随着社会经济的发展和信息技术的不断进步,个人信用评价成为商业活动、金融服务和社会信任构建的重要基础。
在过去,传统的个人信用评价主要依赖于个人信用报告、征信系统和人工调查等手段,但这种方式在大规模高效评估个体信用能力时存在诸多不足。
然而,大数据分析作为一种新兴技术工具,为我们提供了有效并且高效的手段来评估个体的信用。
本文将从大数据分析的角度出发,探讨基于大数据分析的个人信用评价模型,并讨论其应用场景和潜在问题。
首先,基于大数据分析的个人信用评价模型可以基于个人的行为、消费记录以及其他各种数据,对个人信用进行评估和预测。
通过对个体的数据进行聚类分析、关联规则挖掘和机器学习等技术手段的应用,可以建立个人信用评价模型,并为金融机构、企业和个人提供信用决策的依据。
例如,在金融领域,基于大数据分析的个人信用评价模型可以帮助银行和其他金融机构更准确地评估个人的还款能力,从而更好地管理风险和提供贷款服务。
在社交网络领域,该模型可用于预测个人的社交互动行为,为个人提供更好的社交关系建立和资源匹配建议。
其次,基于大数据分析的个人信用评价模型具有许多优势。
首先,相比传统的个人信用评价方式,该模型可以更全面、全天候地收集和分析个人数据,从而提供更准确的个人信用评估。
其次,大数据分析可以处理海量数据,从而揭示隐藏在海量数据中的模式、规律和趋势,为信用评估提供更深入的分析和更精确的预测。
例如,通过对个人的大数据进行分析,可以发现其消费行为规律、还款意愿和还款能力等信息,从而更好地评估个人信用。
此外,大数据分析具有高效性和实时性的特点,可以快速响应信用需求,提供及时的信用评估结果。
然而,基于大数据分析的个人信用评价模型也存在一些潜在问题和挑战。
首先,由于大数据的使用涉及个人隐私和个人数据安全问题,个人信息泄露和滥用可能会对个人信用评价造成负面影响。
因此,在使用大数据进行个人信用评价时,需要建立合适的隐私保护和数据安全机制,确保个人信息的合法使用并保护个人隐私。
基于大数据技术的个人信用风险评估

基于大数据技术的个人信用风险评估一、引言随着互联网金融时代的到来,个人信用评估变得越来越重要。
传统的个人信用评估方法主要基于银行授信记录、贷款记录、信用卡账单等多种数据来源,通过人工管理员工手动管理数据进行信用评估,在一定程度上降低了风险,但也存在着数据准确度低、效率低下等问题。
本文将着重探讨基于大数据技术的个人信用风险评估的应用,解析大数据技术在该领域中的具体应用场景。
二、大数据技术在个人信用风险评估中的应用1.数据收集和加工与传统个人信用评估方法相比,基于大数据技术的个人信用风险评估具备更广泛的数据来源。
大数据技术可以整合来自不同领域的数据,例如消费记录、社交网络数据、移动端行为数据等,同时,大数据技术可以对海量数据进行自动化的处理和清洗。
2.数据挖掘和分析在大数据领域中,最重要的一环是数据挖掘和分析。
数据挖掘和分析可以帮助我们更加全面地了解贷款用户的行为习惯、信用记录等情况,通过对这些数据进行分析和建模,可以找出和识别用户的信用风险。
传统手工式的数据分析方法难以完成这些任务,而基于大数据技术的数据挖掘和分析方法可以很好地解决这些问题。
3.人工智能决策模型大数据技术不仅可以挖掘出贷款用户的行为习惯、信用记录等情况,还可以通过“人工智能”对数据进行计算和模型训练。
这里的“人工智能”是指一类计算机程序,它可以根据一定的算法和模型,对数据进行处理、计算和分析,最终形成决策模型,对用户进行评分和评估。
4.数据可视化基于大数据技术的个人信用风险评估的另一个优点是,可以进行数据可视化。
通过数据可视化,决策者可以可视化掌握并理解数据的情况,进而更好地调整策略和决策。
基于大数据技术的数据可视化工具让数据分析人员能够更加高效地分析数据并获取数据中的关键洞察。
三、前景基于大数据技术的个人信用风险评估开发现已引发了很多金融科技公司的兴趣。
目前,国内和国际的金融科技公司已经开始使用这种方法进行信用评估,不少大型的银行和金融机构也已经开始开拓这一领域。
基于大数据分析的个人信用评估模型研究与优化

基于大数据分析的个人信用评估模型研究与优化个人信用评估是现代社会金融领域的一个重要问题。
随着金融科技的发展和数据技术的成熟,基于大数据分析的个人信用评估模型变得越来越重要。
本文将研究和优化基于大数据分析的个人信用评估模型,探讨其在金融领域中的应用和优化方法。
首先,我们需要明确大数据在个人信用评估中的作用。
大数据是指规模庞大、形式多样的数据,这些数据可以通过计算机进行快速处理和分析,从而揭示隐藏在数据背后的规律和关系。
对于个人信用评估而言,大数据能够提供丰富、全面的信息来判断一个人的信用水平。
通过分析个人的消费行为、还款记录、社交网络数据等,可以建立起一个全面、客观的个人信用评估模型。
其次,我们需要研究和构建基于大数据分析的个人信用评估模型。
首先,我们需要收集和整理大量的个人信用相关数据,包括个人的身份信息、借贷记录、消费行为、社交网络数据等。
这些数据可以通过金融机构、第三方数据提供商等渠道获得。
然后,我们需要使用数据挖掘和机器学习的方法来分析和建模,以确定个人信用评估模型中的关键因素。
最后,我们需要评估和验证模型的准确性和稳定性,以确保它能够在实际应用中发挥有效的作用。
为了优化基于大数据分析的个人信用评估模型,我们需要解决以下几个问题。
首先,数据质量是影响模型准确性的关键因素之一。
我们需要对数据进行清洗和校验,排除无效、重复或错误的数据。
其次,特征工程是模型构建中的一个重要环节。
我们需要选择和提取与个人信用相关的特征,以帮助模型更好地理解和判断个人信用水平。
同时,我们还需要注意特征之间的相关性和共线性问题,避免引入冗余信息或产生偏差。
最后,模型评估和优化是一个持续的过程。
我们需要通过交叉验证、模型调参等方法来评估模型的准确性和稳定性,并根据评估结果进行相应的优化和改进。
在实际应用中,基于大数据分析的个人信用评估模型可以发挥重要的作用。
首先,它可以帮助金融机构评估个人的信用风险,从而更好地制定信贷政策和利率。
基于大数据的个人信用评估模型开发与应用

基于大数据的个人信用评估模型开发与应用随着互联网的发展以及移动设备的普及,人们生活中的各个方面都在产生越来越多的数据。
这些海量的数据交织在一起,构成了一个庞大的数据生态系统。
然而,如何从这些数据中提取有效的信息,对于各个领域都是一个亟待解决的问题。
其中一个应用领域就是信用评估。
本文将介绍一种基于大数据的个人信用评估模型开发与应用。
一、市场需求随着金融、信贷等领域的快速发展,信用评估成为了一个热门的话题。
然而,传统的信用评估方法面临着很多问题。
首先,传统的信用评估方法仅仅局限于申请人的“硬件”条件,如信用历史、资产负债状况、工作年限等,难以全面地评估申请人的信用状况。
其次,传统的信用评估方法通常需要人工处理大量的数据,效率低下,且存在人为主观评判的问题。
针对这些问题,基于大数据的个人信用评估模型应运而生。
二、大数据的优势相比传统的信用评估方法,基于大数据的个人信用评估模型具有很多优势。
首先,大数据是一种涵盖面广、信息量大的数据。
通过对大数据进行处理和分析,可以更加全面和准确地评估申请人的信用状况。
其次,借助机器学习和人工智能技术,大数据可以自动化地进行处理和分析,使评估速度更快、准确度更高、成本更低。
三、基于大数据的个人信用评估模型开发流程1. 数据采集和预处理数据是基于大数据的个人信用评估模型的基础。
在模型开发阶段,需要从各个数据源中采集个人的各种信息,如基本信息、财务状况、社交活动等。
这些数据来源包括社交网络、银行信贷、电商消费、公共服务平台等。
在进行数据采集时,需要注意保护用户的隐私和数据安全。
为了保证数据的质量和准确度,还需要进行数据预处理,包括缺失值处理、异常值剔除、标准化等。
2. 特征工程特征工程是基于大数据的个人信用评估模型开发的核心环节。
在特征工程阶段,需要根据业务需求和实际情况选择合适的特征,对原始数据进行特征提取、特征选择和特征转化等处理。
特征提取包括单一特征提取和组合特征提取两种方式。
大数据场景下的个人信用评估

大数据场景下的个人信用评估随着智能化的日益普及,大数据在各行各业中的应用也越来越广泛,其中之一就是个人信用评估。
在大数据场景下,个人信用评估的标准已经不再是简单的征信分数,而是更加全面和精准的评估方式。
一、数据源在大数据场景下,个人信用评估的数据源越来越广泛和多样。
除了传统的银行征信系统外,现在的数据源还包括社交媒体、聊天记录、电话通话记录、消费记录等各种数据。
这些数据源的扩展使得评估模型更接近个体生活的方方面面,也使得个人信用评估更加公平、全面和准确。
二、数据处理大量的数据源需要进行有效的处理和筛选,以确保数据的准确性和可靠性。
在数据处理中,常用的方法包括数据清洗、数据去重、数据标准化、数据转化等等。
这些方法可以有效地处理原始数据,使得数据更加具有代表性和可用性。
三、数据分析大数据场景下的个人信用评估需要综合多个指标进行综合分析,从而得出全面、准确的评估结果。
在数据分析中,需要应用各种数据挖掘和机器学习算法,并将得到的分析结果进行有效的可视化,以方便决策人员更好地理解分析结果。
四、算法模型大数据场景下的个人信用评估需要基于多源数据进行建模,使得预测结果更加准确。
在算法模型中,常用的模型包括逻辑回归、决策树、神经网络、支持向量机等。
这些模型应用的场景不同,但都能够有效地预测结果,并为决策人员提供更加具有参考性的评估结论。
同时,基于深度学习算法的人工智能也将得到广泛应用,使得评估模型更趋向一种智能化和个性化。
五、评估应用个人信用评估的应用场景也越来越广泛,在金融、医疗、社交等各种行业中都得到了广泛运用。
在金融行业,个人信用评估模型将被用于信贷、保险、投资等方面。
在医疗领域,个人信用评估可以用于评估个体健康状况和医疗服务需求。
在社交行业,个人信用评估则可以用于筛选合适的合作伙伴和朋友,从而提升社交效益和人际关系。
六、安全保障在大数据场景下,个人信息的安全和隐私问题也备受关注。
在个人信用评估中,必须严格遵守数据安全和隐私保护的规定,并采取各种有效的安全措施,保障个人隐私和信息安全。
基于大数据的个人信用评估模型研究

基于大数据的个人信用评估模型研究个人信用评估模型是一种通过收集、整理和分析大量个人数据来评估个人信用状况的工具。
它基于大数据技术,利用数据挖掘和机器学习算法来预测一个人在未来的信用表现。
本文将介绍基于大数据的个人信用评估模型的研究方法和应用。
基于大数据的个人信用评估模型需要收集大量的个人数据。
这些数据可以包括个人基本信息、金融交易记录、社交媒体活动、消费行为等。
通过收集和整理这些数据,可以建立一个全面而准确的个人信用画像。
研究人员需要利用数据挖掘技术对个人数据进行分析和挖掘。
数据挖掘是一种从大量数据中发现模式、关联和趋势的方法。
通过数据挖掘,可以识别出与个人信用相关的关键因素,并建立相应的信用评估模型。
在数据挖掘的过程中,可以采用多种机器学习算法来构建个人信用评估模型。
机器学习是一种通过训练数据来预测和决策的方法。
通过将历史数据输入到机器学习算法中,可以训练模型来预测一个人的未来信用表现。
常用的机器学习算法包括决策树、支持向量机、随机森林等。
这些算法能够通过分析个人数据中的模式和趋势,给出一个客观的信用评估结果。
除了数据挖掘和机器学习算法,个人信用评估模型还可以引入其他的信息源来提高预测的准确性。
例如,可以使用社交媒体数据和公共记录来获取更全面的个人信息。
同时,还可以利用行为经济学的理论和实证研究来解释个人的信用行为。
基于大数据的个人信用评估模型在很多领域都有着广泛的应用。
在金融领域,个人信用评估模型可以帮助银行和信用机构进行风险评估和贷款决策。
通过对个人信用的准确评估,银行可以更好地控制风险,同时提供更好的金融服务。
在电子商务领域,个人信用评估模型可以帮助电商平台筛选合适的卖家和买家,并构建可靠的交易环境。
个人信用评估模型还可以在保险、租赁、就业等领域发挥重要作用。
然而,基于大数据的个人信用评估模型也面临着一些挑战和问题。
数据隐私和安全是一个重要的考虑因素。
在收集和使用个人数据时,需要遵守相关法律法规,并保证数据的安全和隐私。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 贷中审核
贷中审核是贷前评估之后又一个重要的风险控制环 节。传统的风控方法中,贷中审核人员会对贷款中贷款 个体的还款状态、近期行为状态进行监控,并进行相应 的信息更新。通常采取与贷款个体定期人工沟通的方式 保持畅通联系,避免与贷款个体失去联系及贷款个体状 态发生变化而导致的风险。该类传统方式缺乏实时性, 同时也难以规避贷款个体蓄意作假的风险。中国联通作 为移动运营商积累了丰富的数据宝藏,基于这座数据宝 藏,中国联通结合自身数据特点,为构建程序化、实时
引言
随着大数据时代的到来和快速发展,各种各样的用 户数据都可以用于转化、评估、体现个人信用。除现有 银行系统拥有的传统基础信息和金融数据外,互联网公 司拥有的个人上网行为数据(如社交行为、电商消费行 为等)、电信运营商拥有的通信行为数据、位置及全网 移动互联网数据,以及公共事业单位拥有的日常支付消 费数据等都具有很大的参考价值。
中国联通这次的实践创新主要通过分析贷款个体 在放贷之后的通信行为、位置行为、网络行为的异常变 化,来发现贷款个体的资金风险状况,为放贷机构提供 预警,结合金融机构原有的甄别机制,规避资金的潜在 风险。 3.1 通信行为
经过长期数据分析和观察,我们发现多数稳定性较 好、信用值较高的社会个体的通信行为,通常会保持相对
关系圈的识别及亲密联系人的标记有效地反映了贷 款个体在现实中的真实社会关系,为行为状态变化的监 控提供了有力便捷的程序化工具。在此基础上,更进一 步的亲密联系人身份审核及信用评估,可以更全面地为 贷款个体信用评估提供参考。
3 贷后风控
放款之后的风险控制,一直以来都是放贷机构在整 个贷款流程中的薄弱环节。传统的监管方法很难有效地 反映出资金的真实流向,同时贷款个体的刻意“伪装” 行为也增加了贷后风险控制的难度。伴随着社会群体在 移动互联网行为上的普及,作为移动互联网的管道服务 提供商,中国联通结合互联网+的思维方式,利用收集 的用户行为数据,为金融征信的贷后风控提供了创新驱 动力,开拓了新的思路。
基于以上多个指标,我们最终采用多指标聚类系数 化的方法把上述不同数据的系数模型进行整合,最终形 成贷款个体的信用评分。
运营商的数据不依赖于用户上传,而是IT系统实时 采集记录到数据仓库中,因此具有很高的可信度。很 多集中建设的IT系统,基本上可以做到数个时内的延 迟,因此运营商的信用评分拥有很强的时效性。随着 用户数据的不断更新,用户的信用评分也会进行更新。 用户自己可以随时查询,也可以授权相应的机构查询信 用评分,并依据此信用评分来评估自己的信用水平。来 自运营商的信用评分也可以为传统的贷款机构提供“增 信”服务,通过查询用户在运营商的信用评分来简化流 程,控制风险。
电信业的数据优势主要表现在全面、及时、形式多 样、可信度高等方面,但如何在保证用户数据及企业数 据安全性的基础上实现数据开放,将运营商征信相关数 据提供给征信数据使用方,充分有效地使用这部分数据 对贷款个体进行信用评估,这是增信数据开放管理研究 和关注的热点问题之一。通过调查研究市场中的常见方 法,并对比各种方法之间的优缺点,我们提出了自己的 解决方案:从贷前、贷中和贷后三个维度建立模型,通 过数据指标的系数化,实现隐私数据脱敏,防止贷款个 体明细数据泄露,同时,保证数据可开放性和灵活性前 提下构建个人征信评估方法。
ᵁਁാ
ੂӁാ
ᇬӰാ 图2 贷中审核关系圈识别
38
Systems & Solutions 系统与方案
关系圈识别以通话详单、短信详单及位置数据为主 要数据源。对原始数据进行清洗,如剔除广告电话(如 400、800等)及固定电话,保留移动电话号码及银行相 关服务号码,由此构成复杂的通信社交网络。在该网络 中,贷款个体的现实社会关系便可以实现一定程度的真 实体现。在此基础上,根据贷款个体通话行为的时空特 点判断其关系圈组成。如与同事的通话行为呈现通话多 在工作时间,常驻位置区域重合,通话时长较短等。程 序化地对原始数据进行特征抽取,生成多维指标,并通 过数学建模及图分析,得到标记过的贷款个体关系圈及 亲密关系人。
䗮ֵ䆄ᔩ
⓿␌⢊ᗕ
⫼᠋ᴀֵᙃ
⫼᠋䋺ऩ
⫼᠋ᴀֵᙃ ⫼᠋䋺ऩ ⓿␌⢊ᗕ 䗮ֵ䆄ᔩ
图1 贷前评估贷款个体信用评分参考要素
在我们的征信模型中,不同来源的数据可以从不同 方面反映用户价值。长期跟踪记录用户的这些数据,可 以反映用户价值的稳定性。运用该模型衡量用户价值和 用户稳定性,最终得出贷款个体的信用评分。
的持续性,不会因为贷款行为的发生而出现明显变化,因 此,通过对比分析贷款个体放贷前后的通信行为数据,可 以在一定程度上洞察到贷款个体将资金用于非正常消费途 径的行为。用于分析的数据主要包括通话和短信的关系 圈、时长、频次等指标,具体分析思路参见表1。
表1 通信行为指标及分析思路
指标 通信习惯 异常通话 关系圈 待机状态
的贷中审核手段进行了有效探索。主要方式为:1)分 析贷款个体的通话行为特点;2)识别贷款个体关系圈 标记亲密联系人,达到对其进行身份审核及近期行为状 态变化监控的目的。
2.1 通话行为特点分析 通过贷款个体的通话行为特点可以对其进行身份审
核,有效避免资料蓄意隐瞒或者作假行为,另一方面还 可以对其近期行为变化进行监控。如从事中介、销售等 职业的贷款个体,其拨出电话数远高于接听电话数,且 通话时长较短,时间及地点都呈现规律性。另一方面将 贷款个体的拨出电话方及接听电话方与机构电话数据库 进行对比,可发掘贷款个体是否接到过法院电话或者拨 打过赌场电话等有可能危及还款的行为变化。
1 贷前评估
我国现有个人征信体系围绕银行构建而成,央行征 信基础数据库以信贷信息为核心(信用卡、银行贷款和 其他信用贷款记录),同时,也包含公共记录和查询记 录。个人和相关机构可以随时查询自己的信用记录,了 解自己的信用状况。据央行数据统计显示,截至2012 年12月底,央行征信中心的金融信用信息基础数据库 已为8.2亿社会个体和1 859.6万户企业建立了信用档 案[3-4]。该数据库记录覆盖了我国约一半的人口, 然而 在这8.2亿的社会个体中,仅有不到40%与银行真正存
36
Systems & Solutions 系统与方案
在信贷关系,而其余的社会个体仅有经济活动记录在 档。之所以出现这样的情况是因为我国居民与欧美发达 国家居民的消费习惯不同。我国居民更多习惯先储蓄后 消费,并且信用卡的普及率和使用率都远低于欧美发达 国家。这样,仅仅依靠金融系统内的信用记录来评估贷 款个体的信用情况在很多情况下会有失偏颇[5]。
分析思路
通话时长降低 通话范围减少
澳门赌场电话 高利贷电话
家人圈通话量降低 朋友圈通话量降低 同事圈通话量降低
用户账单数据反应了用户每月的消费情况。用户每 月在语音、流量以及增值业务上的账单金额能够反映用 户的生活和消费习惯;而用户每月的总账单额、缴费情 况等信息能够反映用户的消费能力。利用先进的建模方 法将这些信息汇总形成消费系数模型,可以综合反映用 户在消费能力和消费习惯方面的价值。 1.3 漫游状态
得益于中国联通遍布全国的几十万台基站,我们可 以随时掌握用户的位置信息。用户的漫游状态数据不仅 包含用户在不同省市之间的出行情况,还同时记录了用 户在同一城市中的不同位置,甚至可以详细到不同建筑 的不同楼层。根据漫游状态数据,我们可以提取出用户 的家庭住址、工作位置等信息,同样也可以提取出用户 的出差、旅行等信息,将这些信息汇总建模,形成用户 的漫游系数模型,反映用户在地理位置方面的价值。 1.4 通信记录
2.2 关系圈识别 现代社会中移动通信成为人们日常生活、工作进
行有效沟通和交流的重要方式。除了对通话时长、通话 频次等指标的常规统计分析外,对应网络空间中的用户 群体关系与行为在很大程度上能够反映出用户的真实 社会群体关系与行为。我们将贷款个体的关系圈分为家 人圈、朋友圈、同事圈(见图2)。运用数学建模、图分 析等方式识别这三类关系圈,并标记亲密联系人。通过 对贷款个体关系圈的了解及监控,可以有效预警贷款 个体的行为动态变化,如家人圈通话频次突然降低或 者高频,以及同事圈及朋友圈的大面积变动都预示着 风险。
运营商自身可以比较详实地勾勒出一个用户的信用 画像。依托于庞大的用户群体以及全面、及时、形式多 样的用户数据,运营商可以建立基于用户通信行为数据 的征信记录,并将其提供给个人和机构查询、使用。
事实上,中国联通已经在这方面做出了研究和探 索。依托通信行为数据、位置及全网移动互联网数据, 我们已经开发完成了一套个人征信评估模型,用于评估 联通用户的信用状况。为了保护用户隐私,同时保证信 用记录在不同机构和个人之见的高可用性和拓展性,我 们团队和中国人民银行合作,创新性地提出多指标聚类 系数化的方法,将所用基本指标分类(如财务类、通信 类、漫游类等),将多个同类指标数据通过建模的方式 进行数据处理,各类别以系数化的结果输出,最终汇总 成为用户信用评分。图1为中国联通个人征信评估模型 中不同数据来源在最终用户评分中所占的比重。
1.1 用户基本信息 用户基本数据包括用户的姓名、年龄、性别、终端
型号等基本信息。确认用户的真实身份信息对于开展征 信业务具有最根本最重要的意义。如果无法确认用户的 真实身份信息,仅仅依靠用户的互联网行为对贷款个体 信用情况进行评估,甚至有可能发生把信用评分打给一 个15岁的初中生这样的事。得益于实名制政策,运营 商的绝大多数用户数据能够直接匹配到用户的真实身份 信息。这使得我们的征信模型不仅仅应用于互联网电商 等对用户身份要求不严格的新行业,同时,能够支持对 用户身份要求非常严格的银行、小贷公司为主体的传统 金融行业。 1.2 用户账单
用户的通话、短信以及上网记录是用户通信行为 的重要组成。用户的通话、短信和上网记录反映了用户 的通信习惯、内容偏好等特征,我们将这些特征提取建 模形成用户通信系数模型。利用先进的图分析算法,我 们还从用户的通话和短信记录中分析出用户的朋友、家