基于Logistic模型的中小企业信用风险的度量分析

合集下载

基于Logistic回归模型的个人小额贷款信用风险评估及应用

基于Logistic回归模型的个人小额贷款信用风险评估及应用

基于Logistic回归模型的个人小额贷款信用风险评估及应用作者:罗方科陈晓红来源:《财经理论与实践》2017年第01期摘要:根据光大银行某分行的实际样本数据,构建二分类Logistics信用风险评估模型,对互联网金融个人小额贷款信用风险评估问题进行实证研究。

实证表明:年龄、性别、收入、职业、学历、是否持有信用卡、存贷比以及客户所属地对个人小额贷款信用风险影响非常显著;其中年龄越大、收入越稳定、学历越高、持有信用卡、存贷比越低的客户其信用等级越高;女性信用风险显著低于男性;一、二线城市客户的履约率普遍高于县地级市客户的履约率,商业银行应有针对性地对其进行有效规避和分散。

关键词:Logistic模型;互联网金融;小额贷款;信用风险;一、引言20世纪末以来,随着以互联网、大数据为代表的信息技术快速发展,金融与互联网从逐渐融合到全面渗透,“互联网金融”概念应运而生。

互联网金融凭借成本低廉、高效便捷、受众广泛的特征使其在满足客户个性化需求、服务长尾客群方面具有先天性优势,因此传统商业银行可以通过发展互联网金融模式,加快个人信贷领域产品和服务创新,达到业务处理的便捷性,提升客户体验,增加客户黏性,拓展普惠金融服务范围。

传统的小额贷款主要面向中低收入个人客户、中小企业主等群体,涉及面广、个性化需求强烈,由于缺乏统一的规范化管理,风险管理难度较大,这也是商业银行小额贷款业务发展缓慢的一个主要原因,但随着“互联网+金融”模式的兴起,大数据、云计算、社交网络、搜索引擎等互联网技术不断突破与运用,商业银行大力发展个人小额贷款业务已成为可能,但同时也应看到随之而来的欺诈风险、准入风险等,商业银行信用风险管理所考量的因素不断细化。

所以,传统商业银行如何运用互联网金融的优势来创新发展个人小额信贷业务、抢占个人信贷业务市场、高效的解决信息不对称的问题,有效的管理风险将会成为传统商业银行未来不得不考虑的问题。

信贷的核心是风险管理,而对于个人小额贷款业务而言,风险管理的核心是客户信用管理,包括客户准入管理、存量客户管理及逾期客户管理。

小微企业贷款信用风险评估模型

小微企业贷款信用风险评估模型
ቤተ መጻሕፍቲ ባይዱ
THANKS
谢谢您的观看
模型应用步骤
模型应用
将建立的模型应用于实际贷款审批流程中 ,对申请贷款的小微企业进行信用风险评 估。
数据收集
收集小微企业历史贷款数据、经营状况、 征信信息等数据,为建立评估模型提供数 据基础。
特征提取
从收集的数据中提取与信用风险相关的特 征,如企业财务状况、经营状况、征信记 录等。
模型验证与优化
通过历史数据对模型进行验证,并根据验 证结果对模型进行优化调整,提高模型的 准确性和稳定性。
模型建立
利用提取的特征,采用适当的机器学习算 法建立信用风险评估模型。
模型应用案例
案例一
某银行利用小微企业贷款信用风险评 估模型对申请贷款的小微企业进行信 用风险评估,成功筛选出高风险客户 ,避免了潜在损失。
案例二
某金融机构利用建立的信用风险评估 模型优化了信贷资源配置,提高了贷 款审批效率和风险控制水平。
研究意义
推动小微企业融资服务创新
通过研究小微企业贷款信用风险评估模型,有助于为金融机构提供更为科学、准确的信用风险评估依据,推动小 微企业融资服务的创新与发展。
提升金融风险管理水平
准确评估小微企业贷款信用风险有助于降低金融机构的信贷风险,提升金融风险管理水平,保障金融系统的稳定 运行。
02
小微企业贷款信用风险概述
05
小微企业贷款信用风险评估模 型效果分析
模型效果评价指标
准确率
衡量模型预测准确性的指标,值越高表示预 测越准确。
精确率
衡量模型预测坏账的精确度,值越高表示预 测越精确。
召回率
衡量模型找出坏账的能力,值越高表示模型 能找出更多的坏账。

商业银行对中小企业贷款的信用风险控制_基于博弈模型分析

商业银行对中小企业贷款的信用风险控制_基于博弈模型分析

一、我国中小企业融资现状分析据有关资料显示,截止2008年末我国中小企业数量已超过4200万户,占全国企业总数的99.8%。

其中在工商部门注册的中小企业430多万户、个体经营户3800多万户。

其创造的最终产品和服务的价值占国内生产总值的近60%,上缴税收占50%以上,并且在调整经济结构、建立市场体制、构建和谐社会等方面发挥着越来越重要的作用。

但随着中小企业的进一步发展,其发展过程中面临的矛盾和制约因素也日益突现出来,其中融资难就是制约其健康发展的困难之一。

针对“企业想贷款,银行紧放款”的现象,我们试运用博弈分析的方法,研究其放贷风险,进而建立实用的信用评级模型,提出针对性强的控制措施,真正实现银企的双赢,维护国家的金融安全。

二、博弈视角下商业银行对中小企业贷款的信用风险分析根据企业融资的非对称信息理论,在金融市场上,资金的使用者在企业经营方面比资金的提供者掌握更多的信息。

因此,他们就有可能利用这种信息优势在事先谈判、合同签订和事后资金的使用过程中损害资金提供者的利益,使资金的提供者承担过多的风险,即存在逆向选择和道德风险问题。

在现实经济生活中,中小企业可能通过弄虚作假,如编制虚假会计报表、伪造企业良好业绩等行为来骗取银行贷款。

而银行只能根据融资企业传递的信息来判断该中小企业属于“好企业”(概率为P)还是“差企业”(概率为1-P),然后根据判断结果决定是否向企业发放贷款。

如果判断失误,即拒绝好企业的贷款申请或接受差企业的申请,则银行的潜在不良资产将会上升,从而承担由此产生的机会成本。

银行接受的效用分析如下:银行接受贷款申请的净收益为P×1+(1-P)×(-1)=2P-1;银行拒绝贷款申请的净收益为P×(-1)+(1-P)×0=-P。

当2P-1> -P 时,则银行选择接受贷款申请,此博弈达到精炼贝叶斯均衡(1,商业银行对中小企业贷款的信用风险控制——基于博弈模型分析■卢艳玲之道观察经济集体经济中国ZHONGGUOJITIJINGJI1);当2P-1<-P时,则银行选择拒绝贷款申请,此博弈达到纳什均衡(0,0)。

基于logistic回归模型对中小微企业信贷风险研究

基于logistic回归模型对中小微企业信贷风险研究

基于logistic回归模型对中小微企业信贷风险研究作者:陈大睿李颖李泽坤来源:《商场现代化》2022年第22期基金項目:2021年度山东省级大学生创新创业训练计划项目“基于logistic回归模型的中小微企业信贷风险研究”(S202113320130)摘要:文章主要是针对中小微企业信贷风险方面进行研究,建立金融信用风险评价指标体系,构建 logistic 回归模型对企业风险进行预测,以违约概率 P=0.5 为临界值,模型的预测准确率为 81.25%,针对剩余可贷款企业进行定性和定量分析,建立非线性规划函数。

求解该函数得到银行对六大类供应链金融体系中各个企业的信贷策略,如贷款额度高的企业,银行会适当降低贷款的年利率。

关键词:信贷风险;信贷策略;logistic 回归模型;非线性回归引言:在当前经济蓬勃发展的大环境下,中小微企业的规模占比已达到全部企业数量的98%,中小企业很好地满足了我国的民生需求,促进国内消费,推动产品出口销售,在我国经济结构布局中扮演越来越重要的地位。

不过小微企业却因为他们规模相对较小,又没有抵押资产等因素,所以一直面临着融资难的问题。

商业银行一般是根据信贷政策、企业的贸易票据信息以及上中下游企业的影响力,向能力强大、供求关系稳定的企业进行放贷,并可能对信用高、信贷风险小的企业予以利息优惠。

因此,我们主要从商业银行信贷风险视角出发探究中小微企业在银行贷款方面的投资问题。

一、数据的处理1.数据来源本文所采用的数据来源为2020全国大学生数学建模C题提供的123 家有信贷记录企业的相关数据。

2.数据预处理由于数据庞大且复杂,因此对数据进行预处理,剔除无效信息,利用 Python 软件进行数据归总:信誉评级为 D 的企业,银行不予考虑贷款资格,利用Excel软件直接剔除信誉评级为D 企业的相关数据;显示作废发票在本次交易中无实质意义,因此在进销项发票数据中将作废发票进行筛除;利用 Python 软件对筛选过后的进销项价税数据按照不同企业不同年度进行归总。

信用风险评估的常见模型分析

信用风险评估的常见模型分析

信用风险评估的常见模型分析随着社会的进步和经济的发展,信用风险评估越来越受到金融机构和企业的重视。

信用风险评估是指对借款人或者投资者的信用状况进行评估,以确定其还款能力和借款偿付能力的一种方法。

而信用风险评估主要就是通过对借款人的信用记录、借款人的经济状况、行业环境、政策法规等的综合分析,对借款人的信用情况进行评估。

信用风险评估有多种方法和模型,常见的有以下几种:一、德文-肯德尔模型德文-肯德尔模型(Duffie-Singleton-Kendall Model, DSK)是一种基于股票价格模型的信用风险评估方法。

它的核心思想是通过计算公司财务数据与市场指数之间的差别,从而测量其财务风险和信用风险。

在德文-肯德尔模型中,借款人的违约概率是基于公司股票的波动率来确定的,如果波动性越高,那么违约风险就越高。

二、评分卡模型评分卡模型是一种应用非常广泛的信用风险评估方法。

它是通过对大量客户历史数据进行细致的分析和模型建立,通过将客户的多个维度信息进行权重评估并变成得分卡的形式,进而对未来客户的风险程度进行精准过滤,从而为金融机构和企业提供可靠信用风险评估的依据。

一般来说,评分卡模型中会有多个变量作为考察维度,比如说客户的年龄、性别、职业、信用纪录、社会评价、资产、暴露于风险的程度等等。

三、基于机器学习的模型基于机器学习的模型是一种新兴的信用风险评估方法。

它是基于大数据和机器学习技术,利用人工神经网络、逻辑回归、支持向量机等算法进行建模,并将模型应用于信用评估中。

当然,这种模型的建立需要考虑到多个维度的因素,如特征选择、数据预处理、模型选择、交叉验证等等。

综上所述,信用评估是贷款和投资等金融和商业活动中最为关键的环节之一。

而要对借款人或投资者的信用状况进行评估,我们需要使用一些有效的模型方法。

当前常见的信用风险评估模型包括德文-肯德尔模型、评分卡模型、基于机器学习的模型等等,每种方法都有其优点和局限性,对于不同的金融机构或企业而言,选择合适的模型方法非常重要。

我国上市公司信用风险评价和度量——基于面板数据Logit模型的实证分析

我国上市公司信用风险评价和度量——基于面板数据Logit模型的实证分析

The Credit Risk Evaluate for China Listed Companies: Based on Panel Data Logit Model 作者: 唐亮[1,2];张北阳[2];陈守东[2]
作者机构: [1]东北师范大学,长春130117;[2]吉林大学,长春130012
出版物刊名: 工业技术经济
页码: 140-147页
年卷期: 2011年 第2期
主题词: 信用风险;Logit模型;面板数据
摘要:上市公司的信用风险识别有很多的方法,本文选择构建面板数据的Logit模型进行上市公司的信用风险评价,选择财务指标、市场指标和上市公司的存续时间作为解释变量,实证结果表明,该模型的评价结果具有较高的准确率,有趣的是,上市公司的存续时间和信用风险同向变动,这意味着上市公司的存续时间越长,越需要适当的监管。

中小型企业的LOGISTIC回归信用风险预测模型

中小型企业的LOGISTIC回归信用风险预测模型

摘要:文章以中小型企业为研究对象,筛选了甘肃省的120家中小型企业作为研究样本,构建了基于20个常用的财务指标的logistic回归预警模型,进而对中小型企业的信用风险进行预测分析. 研究结果表明模型具有良好的预测效果,预测准确率达到92.5%,可以较好的为企业内部进行风险预警,并为银行系统提供企业信用风险状况和信贷决策依据.关键词:中小型企业;信用风险;logistic回归模型1.引言信用风险评估是定性和定量的方法对可能引起信用风险的因素进行分析,将评估对象分为正常类和违约类,或直接计算出借款人的违约概率,为担保机构是否承保和银行贷款提供依据.近几年,我国中小型企业占规模以上企业99%,由于银行贷款为其主要的融资方式,这无疑为商业银行提供了很大的业务市场.然而由于中小企业规模小、抗风险能力弱、生命周期短、信息透明度差等特点,银行对其的借贷条件较为苛刻,为中小型企业获得银行间接融资带来一定障碍.综上所述情况,使得建立能够准确预测中小型企业信用风险模型势在必行.本文的研究主要是沿着两个方向进行:基于中小型企业在我国经济中的重要地位以及研究数据的可取得性,选取中小型企业作为研究对象;同时,在充分借鉴前人研究成果的基础上,在确定了科学的样本和指标选择方法之后,采用logistic回归模型对企业信用风险进行研究,使模型建立在可信的数理基础之上,预警效果更为理想.2.实证研究2.1 研究样本和指标选取本文以甘肃省120家中小型企业2011年的财务数据为研究样本,数据来源于联合信用管理有限责任公司甘肃分公司,并根据其评级级别分为风险组以及正常组.本文在财务指标的选取上,主要倚重盈利能力、现金流量、偿债能力、营运能力、成长能力五个方面,初始选取被使用最频繁的20个指标作为研究变量:流动比率、速动比率、资产负债率、总资产收益率、销售净利润、主营业务利润率、净资产收益率、应收账款周转率、总资产周转率、流动资产周转率、存货增长率、销售现金比率、现金收入比、总资产、主营业务收入增长率、净资产增长率、流动负债率、固定资产比率.2.2模型指标的筛选根据上表可以看出,用分析样本数据的预测准确率为93.8%.从预测结果来看,以上模型作为一个信用风险的预警模型无论从历史数据的拟合优度,还是对未来预测来说,均较为理想.4. 结论本文所使用的数据均是真实有效的,所建模型具有较强的预测能力,辨别能力高达92.5%,结果较为理想.并且在预测指标的选择过程中可以发现盈利能力、现金流量、偿债能力和成长能力四类财务指标对判别企业信用风险效果显著.然而本文亦存在很多不足之处,首先所使用数据全部为甘肃省的中小型企业,在对其他地区中小型企业进行分析时,模型或许会有一定的局限性;其次本文仅研究了20个预警指标,并未包括所有的财务指标和非财务指标,而且由于搜集资料途径限制,对于很多有可能影响企业信用状况的指标没有纳入研究.对于以上问题,待以后的工作中会继续研究.参考文献:[2] altman e.financial ratios,discriminant analysis and the prediction of corporate bankruptcy[j].the journal of finance.1968,(23):589-609.[4]hamer m. failure prediction:sensitivity of classification accuracy to alternative statistical methods and variable sets[j], journal of accounting and public policy, 1983,(2): 289-307.[5]吴世农,卢贤义.我国上市公司财务困境的预测模型研究[j].经济研究,2001,6:46-55.[6]张玲.财务危机预警分析判别模型[j].数量经济技术经济研究,2000,(3):51-53.[7]张尧庭等. 定性资料的统计分析[m].广西师范大学出版社, 1991.作者简介:高金玲(1988-),女,内蒙古赤峰,硕士,研究方向:应用统计与精算学。

小微企业信用评级模型及比较研究

小微企业信用评级模型及比较研究

小微企业信用评级模型及比较研究肖斌卿;杨旸;余哲;沈才胜【摘要】在调查和文献基础上,进行信用风险来源识别、评级指标分类和评级方法选择,构建商业银行内部信用评级模型,以期在授信审批环节提高信用风险管理水平。

基于某商业银行2008—2013年小微企业实际信贷数据,运用线性判别分析、二项逻辑回归和十种基于不同学习算法的BP神经网络模型构建内部信用评级模型,并在评级指标体系中加入宏观经济变量,使度量风险的稳健性进一步得到提升。

最后通过四种方法对不同模型的结果和评级有效性进行了对比分析,认为基于Levenbery-Marquardt学习算法的NN10模型具有最优的评级有效性。

%On the basis of investigation and literature research, conducting risk source identification, rating indicators classification and rating methods assessment, the paper constructs commercial bank’s internal credit rating models to improve the credit risk management in the credit approval procedures. Based on the credit data of small and micro enterprises in a commercial bank from 2008 to 2013, using the linear discriminant analysis, logistic regression and 10 types of BP neural network relying on different learning algorithms, internal credit rating models are constructed with macroeconomic variables, which may further improve the robustness of risk measurement. Finally, results and rating effectiveness of different models are analyzed and compared, and show that the NN10 model based on Levenbery-Marquardt learning algorithm performs optimal rating effectiveness.【期刊名称】《系统工程学报》【年(卷),期】2016(031)006【总页数】11页(P798-807,830)【关键词】信用评级;小微企业;模型比较;学习算法【作者】肖斌卿;杨旸;余哲;沈才胜【作者单位】南京大学工程管理学院,江苏南京210093;南京大学商学院,江苏南京210093;郑州商品交易所,河南郑州450008;南京大学工程管理学院,江苏南京210093; 紫金农商银行,江苏南京210019【正文语种】中文【中图分类】F832.59我国当前正处在经济发展“提质换挡”的“新常态”发展阶段,经济结构和产业结构正在进行深度调整和优化.在“新常态”的经济氛围下,新兴科技、新兴产业和新兴市场的发展和壮大,为小微企业的发展和壮大提供了难得的历史机遇.也正是在这一阶段,经济内生增长要求更多的人力资本和技术创新参与社会经济分工,并最终转化为经济增长产出.覆盖广、种类多的小微企业在国家经济结构调整和升级中起到的促进作用,在今后将会更加凸显.小微企业的经营发展和技术创新离不开资金的支持,特别是在当前信贷资本紧缩投放的时期,小微企业融资难的问题日益凸显.Schreiner[1]在研究中认为,企业处在初创和成长阶段更加依赖从传统金融机构那里获取资金支持.然而,小微企业在通过银行进行信贷融资的过程中,会遇到诸多的问题.一方面,小微企业受其经营时间、经营业绩、公司治理等因素的制约,普遍不能提供类似大型企业财务报表的详细业务信息、财务信息以及其他融资担保证明;另一方面,商业银行经营强调贷款的风险控制,在开展小微企业贷款业务时,银行对小微企业的资信审查和授信工作正逐步趋于严格和规范,与此相悖的是上市银行内部控制缺陷认定存在查找范围不统一、认定标准不完善、认定数量和严重程度明显不足等问题[2].上述这种银企之间存在的信息不对称问题[3],是制约小微企业从商业银行获取信贷融资的主要因素.针对小微企业当前面临的融资困境,商业银行所采用的信用评级却暴露出诸多问题,例如专家判断法比重大于模型法比重、评级方法与实际需求存在出入以及小微企业信用评级体系缺乏针对性.随着贷款业务的不断精细化,各家商业银行均推出各自的小微企业贷款方案,更加注重开展专业化的小微企业贷前审查工作,同时也对信用评级方法以及评级方法的有效性提出了更高要求.在理论界,学者们依实务操作的需要,针对小微企业贷款业务的信贷模式、评级指标、评级方法以及违约概率估计开展了广泛的研究和讨论,汇总出丰富的研究成果.其中,对评级指标和评级方法的讨论尤为突出.在研究指标方面,郭小波等[4]在小微企业信用风险的识别因子研究中,引入企业财务指标、企业定性指标以及与企业主有关的指标作为研究变量.谢平等[5]认为信用评级需考虑的因素包括借款企业经营环境、所有制与经营权、管理水平、营运价值、盈利能力、风险程度等因素.徐超等[6]基于多智能体仿真方法,从中小企业组成的联保贷款入手,重点考察了联保的组织规模和组织成员初始信用水平对信用风险演化的影响.陈其安等[7]认为在一定条件下,投融资平台和银行之间的均衡贷款数量将随着政府信用担保履约率增加而增加.同时,李毅等[8]也认为小微企业在融资过程中若能够拥有信用担保,将有益于其获取贷款. Hajek等[9]对企业信用评级预测中的财务状况、经营状况等建模指标进行了研究.Doumpos等[10]在其研究中构建了一个包含财务数据和结构化模型的信用评级预测系统.同时,现有文献亦强调加入定性指标对研究小微企业信贷业务的重要性.Vassiliou[11]在对印度小微企业贷款案例分析的基础上,认为信用风险影响因素包括贷款人经营理念、贷款人经营水平、贷款人有无违法记录、贷款人经营思路、贷款利率、用途等; Malhotra等[12]通过对首发小微信贷的孟加拉国发放小微企业信贷的风险情况进行研究分析,了解到影响小微企业信用风险的因素有贷款数量、贷款人抵押品价值、其所拥有的耐用商品的价值、贷款期限的长短等. Meyer[13]指出银行可以通过“软信息”对小企业信用状况进行评估,这些软信息包括银行对借款企业资信的初步判断等.Lussier[14]在其模型中加入了企业管理水平、所处经济周期、产品生命周期等因素.此外,张良贵等[15]基于DSGE模型研究表明宏观流动性及其状态变化、基准利率状态变化对企业杠杆有重要影响.由此可见,小微企业信用评级指标需要同时包含企业内部定量指标和定性指标与企业外部信息.在研究方法方面,张大斌等[16]用差分进化算法(DE)优化违约点系数,提出一种中国上市公司信用风险测度的不确定性DE-KMV模型,来提高上市公司信用风险测度的准确性.于立勇等[17]在其研究中开展基于Logistic回归分析的违约概率研究,利用正向逐步选择法建立了信用风险评估指标体系.黄苒等[18]重点关注了含跳跃风险的公司贷款违约率测度问题,并探索了基于首达时模型的理论扩展,给出了违约概率参数估计的方法.庞素琳等[19]在银行个人信用评级中建立C5.0分类算法,在该算法内嵌入Boosting算法技术,并构造了成本矩阵和参数调整后的决策树.肖进等[20]提出了面向缺失数据的动态分类器集成选择模型DCESM,并认为该模型能够取得更好的客户信用评估性能.Che等[21]运用层次分析法(AHP)和包络分析法(DEA)对台湾地区商业银行小微企业信贷决策进行研究,并得到有效的建模结果.Angilella等[22]在研究中建立了小微企业SMMAA-TRI多准则信用评级模型,并对模型有效性进行了验证.同时,非参数统计的研究方法也逐步应用于信用评级建模.然而,随着银行业可训练数据量的大幅提升和数据维度的不断提高,机器学习方法开始崭露头角.统计学和机器学习最本质的区别在于根本目标不同,统计学家更关心模型的可解释性,而机器学习专家更关心模型的预测能力.由于银行业对预测准确度要求的越来越高,统计学方法的不适应性开始显现,很多问题不能构建出严谨的统计模型,而机器学习理论已被证明是此类研究有效的建模方法.王春峰等[23]在其研究中对人工神经网络在银行信用风险评价中的应用展开对比讨论,结果表明,与传统统计方法相比,神经网络技术具有较高的稳定性和判别准确度.Lee等[24]认为非参数统计的方法在信用评级的研究中优于经典统计模型.Yu等[25]运用基于多层神经网络的机器学习方法研究信用评分模型,并对效果良好的建模结果进行叙述.Zhong等[26]在企业信用评级中,对BP、ELM、I-ELM和SVM的学习训练效果进行对比分析,其中ELM和BP 神经网络的建模效果较优.商业银行在信贷审批操作中运用信用评级模型对申请借款企业提供的信息进行判断,对企业在未来是否会出现违约进行估计,已经是普遍存在的贷前审批流程,因此评级模型的有效性是各家商业银行共同关注的问题.结合现有文献中的信用评级方法,本文构建包含线性判别分析(linear discriminant analysis, LDA)、二项逻辑回归(binary logistic regression,BLR)、基于多种学习算法的BP神经网络(BP neural network, BPNN)的评分模型,运用建模样本训练模型,并用测试样本检验模型有效性和稳健性,挑选出较优的信用评级模型.LDA是在分类确定的条件下,根据某一研究对象的各个特征值判别其类型归属问题的一种多变量统计分析方法.BLR模型主要是用来对多因素影响的事件进行概率预测,是普通多元线性回归模型向非线性模型的扩展.基于多种学习算法的BPNN模型是前馈型神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上,通过训练与测试将对象进行分类.本节就LDA、BLR、基于多种学习算法的BPNN模型以及模型有效性的衡量方法进行简要介绍.2.1 线性判别分析(LDA)对于k个组别的分类问题,假设k个组别构成的总体分别为G1,G2,...,Gk,于是若要判断样本x各来自于哪一个总体,首先必须计算样本x到每个总体Gi(i=1,2,...,k)的距离d(x,Gi),然后再比较这些距离,其中样本x到总体Gi的距离d(x,Gi)采用Mahalanobis距离,即其中µi和Σi分别为Gi的均值和协方差矩阵,为协方差矩阵Σi的逆矩阵.如果x距某个Gj(j= 1,2,...,k)最近,则认为x∈Gj.其判别规则为对于本文组别分类的问题,可通过建立判别分析模型进行判别.2.2 二项逻辑回归(BLR)对于一个二项分类和n个定量预测变量x1,x2,...,xn(包含虚拟赋值变量),BLR模型假设目标响应的概率为其中β0为常数项,称β1,β2,...,βn为模型回归系数,解释变量可以是连续变量,也可以是分类变量或哑变量(dummy variable).正式的决策框架中通常包含多种评判模型,在多种模型有效性对比过程中,BLR模型可以作为一个判断依据.BLR与LDA一样,在多元正态分布和相同协方差矩阵的假设条件下具有最优判别能力.BLR要求较大的输入样本量以取得较为稳定的计算结果,同时应对自变量与因变量的复杂非线性关系进行适当处理.2.3 基于多种学习算法的BPNNBPNN的构成包括一个输入层,一个或多个隐含层和一个输出层.各层由若干个神经元构成,每一个节点的输出值由输入值、作用函数和阈值决定.神经网络的学习过程包含两个方面:信息正向传播和误差反向传播.在正向传播过程中,输入信息从输入层经隐含层传到输出层,经作用函数运算后得到输出值与期望值进行比较,若有误差,则误差反向传播,沿原先的连接通路返回,通过逐层修改各层神经元的权值,减少误差,如此循环直到输出的结果符合精度要求为止.具体步骤如下:步骤1BPNN的初始化,确定隐含层节点的个数.将各个权值和阈值的初始值设为比较小的随机数;步骤2输入样本和相应的输出进行网络训练,即对每一个样本数据进行步骤3到步骤5的过程;步骤3依据输入样本计算实际输出及其隐含层神经元的输出;步骤4计算期望输出与实际输出之间的差值,求输出层和隐含层的误差;步骤5根据步骤4得出的误差更新输入层到隐含层节点之间以及隐含层到输出层节点和之间的连接权值;步骤6求出误差函数e,判断e是否收敛到给定的学习精度以内,即e≤ε,其中ε为拟定误差,如果满足则训练结束,否则转向步骤2.运用不同的学习算法对BPNN进行训练,将会得到不同的建模效果[27].MATLAB R2012a软件中的神经网络工具箱(neural network toolbox)中包括多种适用于BPNN建模的学习算法.本文考虑运用10种学习算法对BPNN进行训练,具体如表1所示.2.4 模型有效性的衡量方法ROC曲线面积(AUC值)是常用的用于评价分类模型有效性的方法.ROC曲线是根据一系列不同的二分类方式,以真阳性率(敏感度,不良贷款样本被判正确)为纵坐标,假阳性率(1–特异性,良性贷款被判错误)为横坐标绘制的曲线.传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析.本文运用SPSS 软件对12种模型的检验结果绘制ROC曲线,并比较AUC值,AUC值越大,表明模型判别水平越高.均方误差(mean squared error,MSE)是指参数估计值与参数真值之差平方的期望值.在此,MSE是预测值与期望值之差平方的期望值,即其中yt是期望值,t是预测值.MSE的值越小,说明预测模型描述实验数据具有更好的精确度.在对模型有效性进行衡量时,需要考虑不同错误类型的成本,本文依据Blanco等[27]的两种错误分类构造误判成本.I类错误指良性贷款错评为不良贷款的比率;II类错误指不良贷款错评为良性贷款的比率,相比于I类错误,II类错误的发生将会对银行带来更大的损失.因此本文将II类错误的成本设为I类错误成本的5倍.并在此基础上计算误判成本其中C21和C12分别表示发生I类错误和II类错误的成本,π21和π12分别表示发生I类错误和II类错误的概率,p1和p2分别表示样本在到期时是良性贷款和不良贷款的先验概率.识别率包括不良识别率和总识别率.不良识别率表示检测样本中的不良贷款被模型识别出的比例,该指标可以反映模型对I类错误的规避能力;总识别率表示全部检测样本的二级分类属性被识别正确的比例,该指标可以反映模型的整体判别能力.本文采集江苏某商业银行2008–2013针对小微企业信贷的过往数据,与公开数据库中的宏观数据合并后,总数据内容主要包括:1)财务信息(资产总额,经营收入等);2)本期贷款基本信息(发放额度,发放利率,贷款方式,支付方式等);3)当前客户非财务信息(客户信用等级,客户资信等级,行业分类,担保情况等); 4)与宏观经济有关的变量(用电量,GDP,CPI等);5)信贷的二级分类情况.经过剔除缺失和不正常的数据,得到2 115组有效数据,其中,良性与不良贷款比例约为9∶1.为了对评分模型进行科学对比,我们把数据集随机分成两个互补的子数据集:80%数据作为建模集,20%数据作为测试集.各模型的变量结构都是通过10次交叉验证法进行筛选,交叉验证法的一个优势就是这样的信用评分模型是基于较大比例的有效数据(80%)开发.有关信用评级指标的文献中,由“硬”信息到“软”信息的选择是信用评级指标选择的一个显著性变化,从最早标准化的财务指标到如今各类非财务指标的不断加入更新,信用评级系统也因此能够从规范化的大公司推广到小微企业及个人类客户.然而,这些指标多为微观指标,宏观指标鲜有涉及.近年来,有学者对宏观经济变量的研究提出了自己的看法,认为借款人的违约与一般经济状况密切相关,与宏观经济环境变量也应当被考虑作为输入变量[27,28].颜新秀[29]认为,不同宏观经济环境下各指标变量与个人住房抵押贷款违约率之间存在一定的影响关系.Kim等[30]指出宏观经济环境是一个关键因素,直接关系到借款者的偿付行为.因此,本文认为贷款期间内的宏观经济变动对贷款主体的还款意愿具有一定影响,应当作为重要变量参与信用评级研究.因此,本文选取的指标类别包括财务类指标,非财务指标和宏观环境指标. 建模自变量和因变量(输入变量和输出变量)如表2和表3所示.本文在考虑现有文献贷款对象财务信息、非财务信息、本期贷款基本信息的基础上,还加入与宏观经济有关的变量作为自变量或输入变量,主要基于以下考虑:传统模型的因变量和自变量存在不同期的问题,传统信用评级模型将贷款期初的相关变量指标作为自变量,将贷款期末的五级分类情况作为因变量来进行建模,即自变量和因变量不是同一时间点上的面板数据,因此不能直接看作面板数据处理,需加入时间因素才能解决矛盾,同时,宏观经济变量是时间因素的合理体现,因为宏观经济变量并非某一时间点上的宏观经济变量,而是贷款期间相关宏观经济变量变化趋势的反映,因此不是一个时间点的概念而是某一时间段的变化趋势的概念,所以能够反映出时间因素.在实证分析部分,本文将分别运用包含宏观变量和不包含宏观变量的指标体系进行建模,并比较模型的有效性.同时,本文借鉴Blanco等[27]的做法,在指标体系中加入“客户经理主观评价”和“客户资信状况调查结果”两个指标,以囊括银行自有的贷款初期审核信息.本文引入贷款期限内经济周期信息的变量,Kim等[30]指出宏观经济环境是一个关键因素,直接关系到借款者的偿付行为.该做法的优点还在于考虑到还贷期限内省内宏观经济变化对小微企业的影响,由于各家商业银行在计划财务部进行财务预算的编制过程中均拥有未来至少三年的宏观经济变化预测数值,因此在实务操作中,该宏观变量数据采用商业银行预测数值.本文借鉴Blanco等[27]在设计信用评分模型所使用的宏观经济变量的表达式其中ΔVMi,j是宏观经济变量的变化率,VM是宏观经济变量,i表示放款的时间,j表示贷款的时限.本文在对宏观济变量进行筛选之后选取用电量、GDP和CPI的季度数据作为建模的三个自变量.在实践中发现,除CPI外用电量和GDP均有很强的周期性,经过分析和比较之后,本文决定采用GDP、用电量的同比增量的变化率和CPI增长率来作为自变量,其中CPI增长率为(计算期CPI数值-基期CPI数值)×100%/基期CPI数值,GDP、用电量的同比增量的变化率为其中Δ2VMi,j是宏观经济变量增量的变化率,i表示放款的时间,j表示贷款的时限. 综合数据可获取性、数据可靠性因素的影响,样本选取2008–2013年贷款数据,其中宏观变量数据均进行季节性调整,并对离散变量进行赋值.神经网络建模时为加快训练网络的收敛性的需要,对样本数据中各个指标下的数据分别进行归一化处理.如第3节所述,将样本分为两部分,其中1 687组数据作为训练样本,428组数据作为检验样本,训练样本与检验样本比例约为4∶1.运用SPSS 21软件,以表2中15个变量为判别变量,以表3中B1变量为分组变量,选择Fisher函数系数,建立LDA模型,得到分类函数系数.根据分类函数系数,对检验样本中各指标进行加权求和,选取得数较大的类别作为判别结果.运用PASW Statistics 18统计分析软件建立二项逻辑回归(BLR)通过描述性统计,根据相关性、正态性检验和t检验,本文最终在Logistic回归中保留9项指标,分别为年利率、贷款方式、用途、支付方式、客户信用等级、客户资信等级、营业收入/人、GDP增量增长率和CPI增量增长率,具体分析过程介绍从略.运用MATLAB R2012a建立BP神经网络(BPNN),表2中15个变量作为输入神经元,表3中B2变量各分别作为输出神经元.分别运用表2中10种学习算法进行模型训练,各个训练函数即表1中MATLAB调用函数.神经网络参数设定:隐含层节点范围[7,13];最大迭代次数=1 000;训练误差=0.001.运用训练后的模型对检验样本进行测试,即分别将检验样本中的自变量与LDA分类函数系数加权求和取大值,代入BLR模型预测因变量值,代入训练好的BPNN模型得出预测输出变量值.当输出值小于并等于0.5时,判定该组样本为正常贷款;当输出值大于0.5时,判定该组样本为不正常贷款.首先,运用不包含宏观变量的指标体系建立模型,根据前文模型有效性的衡量方法,计算衡量各个模型有效性的指标数值,如表4所示,优化的ROC曲线如图1所示.在ROC曲线图中,纵坐标δ代表真阳性率,横坐标1-η代表假阳性率,其中η为特异性,下同.由表4可知,12种模型中,75%的模型的AUC值大于0.8;有11个模型的总识别率超过80%,其中六个模型的总识别率超过90%.但在关键指标中,有11个模型的不良识别率低于80%,有11个模型的误判成本大于0.2.从整体识别效果来看,所构建的模型对不良贷款缺乏识别能力是一个共性,因此本文认为有必要尝试通过加入宏观变量对指标体系进行改进并开展建模.在指标体系中加入宏观变量后,判断各个模型有效性的指标数值如表5所示,优化的ROC曲线如图2所示.1)AUC方面,共有6个模型的AUC值超过0.9,其中,NN6与NN10模型的AUC值超过0.95,分别为0.952和0.959,预测能力较强;2)均方误差方面,共有8个模型的均方误差小于0.1,其中BLR的均方误差为0.071,NN3的均方误差为0.072,NN6的均方误差为0.075;3)误判成本方面,共有5个模型的误判成本低于0.2,其中NN6误判成本为0.117,NN7误判成本为0.110,NN10误判成本为0.098,误判成本较低.I类错误率方面,NN6、NN7、NN10的II类错误率小于0.1,判别效果较优;4)不良识别率方面,共有4个模型的不良识别率超过0.8,其中NN6的不良识别率为0.915,NN7的不良识别率为1.000,NN10的不良识别率为0.979,说明该三个模型对潜在不良贷款的判别能力较强.总识别率方面,共有5个模型的总识别率超过0.9,即表明这5个模型的总体判别正确率超过九成,具有较好的整体判别能力.根据以上分析,可见LDA和BLR模型在四类模型有效性衡量方法中表现一般,其中BLR模型在AUC和总识别率方面优于LDA模型,LDA模型在II类错误率方面优于BLR模型,但该两个模型劣于或等于NN6和NN10在AUC、II类错误率、误判成本、不良识别率和总识别率方面的表现.当将NN6与NN10在模型有效性方面进行比较时,NN10在AUC、均方误差、II类错误率、误判成本和不良识别率的表现均优于NN6,而NN6仅在总识别率方面优于NN10,因此认为NN10具有最优的模型有效性,其次为NN6.由上述分析结果可知,1)在整体模型有效性方面,NN10(基于Levenbery-Marquardt学习算法)模型表现最优,NN6(基于Polak-Ribiere共轭梯度学习算法)模型表现次优.2)在各模型有效性衡量方法方面, NN10具有最大的AUC值,BLR具有最小的均方误差,NN7具有最小的II类错误率,NN10具有最小的误判成本,NN7具有最高的不良识别率,NN3具有最高的总识别率,这些结果表明在进行具体信用评级水平衡量时,需要重视上述模型在信用评级中的应用.3)在观察各个模型检测结果中出现两类错误的样本数据时,本文发现样本数据中的客户信用等级、客户资信等级、营业收入/人指标易出现区别于普通的数值,因此此类样本需要在人工贷前审查时给予关注.本研究选择合适的指标体系和研究方法,构建线性判别分析、二项逻辑回归和基于多种学习算法的BP神经网络模型对小微企业进行信用评级,并通过四种衡量方法分析模型的有效性,提高研究结论的可信度.研究结果表明机器学习方法能够为商业银行授信审批和贷前审查工作提供参考依据,并且在指标体系中加入宏观变量能够有效地提高模型识别不良贷款的能力,提升模型的稳健性.因BP神经网络具有容易陷入局部极值、“过拟合”等问题,其预测精度有待优化,今后研究中尝试使用遗传算法优化BP神经网络强化全局搜索能力.取得更大的数据样本,并尝试根据小微企业资产总量大小对样本进行分层,提高模型对于贷款主体的评级能力.肖斌卿(1979―),男,福建南靖人,博士,副教授,研究方向:金融工程与金融管理,Email:****************.cn;杨旸(1990―),男,江苏南京人,博士生,研究方向:金融工。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于Logistic模型的中小企业信用风险的度量分析摘要:本文以反映中小企业偿还负债能力和盈利能力两个方面的财务指标,构建logistic模型,对中小企业的信用风险进行测算。

研究结果表明:中小企业的保守速动比率和净资产收益率对企业的违约概率有重要的影响,所以中小企业的短期偿债能力和盈利能力对企业的违约概率有着很强的解释能力。

关键词:信用风险logistic模型;偿债能力;盈利能力
在影响企业的信用风险的众多财务指标中,本文认为最重要的因素是偿债能力和盈利能力。

因此,选择的变量有衡量企业短期负债偿还能力的保守速动比率(x1),衡量企业长期负债能力的有形资产净值债务率(x2)和利息保障倍数(x3),同时选择了综合反映企业盈利能力的净资产收益率(x4)。

各指标的计算公式如下:保守速动比率=(现金+交易性金融资产+应收账款+应收票据)/流动负债,
有形资产净值债务率=负债总额/(股东权益-无形资产净值),利息保障倍数=息税前利润/利息费用,
净资产收益率=净利润/净资产。

由于很难得到中小企业违约数据,所以参照经常性做法,将上市公司中被st(退市风险警示)的公司近似视为违约企业,没被特别处理的企业则视为经营状况良好,不存在违约风险的企业。

上市公司的财务比率数据来源于ressert数据库,共选取了90家上市
公司,其中st的公司30家,非st的公司60家,以其数据来估计模型的参数。

然后随机抽取st公司和非st公司各10家,用其数据来进行预测,检验模型的预测效果。

在企业违约风险的度量中,存在违约(y=0)与不违约(y=1)两种情况。

因此,二元选择模型比较适用于企业违约风险的度量。

本文选用二元选择模型中logistic模型,来模拟与评估企业的违约风险。

模型的具体形式为:pi=11+exp(-x′iβ)
其中:pi为事件yi发生的概率,x′i为影响事件发生的自变量的转置向量,β为各自变量的系数。

经过比较后发现,含变量净资产收益率(x4)模型的各项指标最优。

常数项(c)和x4的z统计量在5%显著性水平下显著,得到如下模型(1):
p′i=11+exp(-3.0105-0.2191*x4)
对模型进行拟合优度检验,h-l statistic=1.2077,p=0.9966,在5%的显著性水平下,接受原假设,即认为模型拟合完全充分。

经过试算对比,发现含保守速动比率(x1)和净资产收益率(x4)的模型的各项指标最优。

x1和x4各系数的z统计量在5%显著性水平下显著,得到如下模型(2):
pi=11+exp(-6.7100*x1-0.2150*x4)
对模型进行拟合优度检验,h-l statistic=1.0987,p=0.9975,在5%的显著性水平下,接受原假设,即认为模型拟合完全充分。

双变量模型(2)与单变量模型(1)相比,拟合优度有所提高,包含了两个解释变量——保守速动比率(x1)和净资产收益率(x4),偿债能力和盈利能力对违约的影响都在模型中得到体现,能对现实情况进行更好的反映。

因此,选用双变量模型(2)。

实证结果分析:
1、不违约的概率(pi)与保守速动比率(x1)成正相关关系,即保守速动比率(x1)越大,不违约的概率(pi)越大,反之亦然。

2、不违约的概率(pi)与净资产收益率(x4)成正相关关系,即净资产收益率(x4)越大,不违约的概率(pi)越大,反之亦然。

3、保守速动比率(x1)的系数为6.7100,净资产收益率(x4)的系数为0.2150,说明相对于净资产收益率(x4),保守速动比率(x1)对企业不违约的概率的影响更大一些。

4、反映长期偿债能力的财务比率有形资产净值债务率(x2)和利息保障倍数(x3)在模型中并没有体现出来。

其原因可能是上市公司被st所依据的是经营业绩,而非其是否有足够的能力来偿还长期债务。

但作者认为净资产收益率(x4)衡量的是企业的盈利能力,净资产收益率(x4)高,表示企业的盈利能力强,经营状况越好。

一般而言,企业的经营状况好,说明企业偿还长期负债的能力
较强,企业违约的风险就相对较低。

作者选取能反映企业偿债能力和盈利能力的财务指标,来构建logistic模型,对中小企业的违约概率进行测算。

实证结果表明:企业的保守速动比率和净资产收益率对企业的违约概率有重要的
影响。

所以,在衡量企业的违约风险大小方面,企业的短期偿债能力和盈利能力显得尤为重要。

中小企业违约概率的测算,对金融机构信用风险管理有着非常重要的现实意义。

基于以上研究结论,本文提出以下建议供参考:
1、金融机构在评估企业的违约风险时,不仅应该考虑该企业偿还负债的能力,更应该关注该企业的综合盈利能力。

反映偿债能力的指标比较差,说明企业的违约风险较高。

但这并不说明,反映偿债能力的指标比较好,意味着企业的违约风险就比较低。

同时还应该考虑该企业的净资产收益率,以便对违约风险作出更全面的估计。

2、中小企业应该平衡好自身的资本结构,使负债和自有资本之间的比例维持在相对比较安全的范围内,在扩张负债和追求盈利稳定增长之间,找到一个比较好的平衡。

(作者单位:江西财经大学)参考文献
[1] 沈红丽,金善女,丁建新,金浩,2006,《基于因子分析的我国商业银行信用风险的实证研究》,《河北工业大学学报》第5期56~60。

[2] 田秋丽,2010,《logistic模型在中小企业信用风险度量中的应用分析》,《中国商贸》第10期64~65。

相关文档
最新文档