Statistical and Application 统计学与应用, 2014, 3, 159-166
159
An Empirical Credit Risk Study of SEMs in
Small Loan Companies
—Based on Logistic Model and Probit Model
Jiamin Zhang, Jianjun Zhou
Department of Statistics, College of Mathematics and Statistics, Yunnan University, Kunming
Received: Sep. 20th, 2014; revised: Oct. 25th, 2014; accepted: Nov. 7th, 2014
Copyright © 2014 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
Abstract
SMEs (small and medium-sized enterprises) as small loan companies’ main customer groups are
objects of study in this paper. Based on the companies’ day-to-day credit loan business, Logistic
model and Probit model are applied to this empirical analysis of credit risk assessment. Adopt
brainstorming to get eight required indicators with the help of experts on microcredit industry.
These eight indicators as independent variables in the model can be divided into two parts ac-
cording to content. One part is used to describe borrower’s personal circumstances and another
part is used to measure companies’ business conditions. Data from Kunming KC small loan com-
pany are fitted with these two models. In the face of a specific loan, calculate the corresponding
credit risk score and then make the decision. Upon examination, results of this study are feasible
and effective.
Keywords
Small Loan Companies, SMEs, Credit Risk, Logistic Model, Probit Model
小额贷款公司中小企业信用贷款风险实证研究
—基于Logistic和Probit模型
张佳敏,周建军
云南大学,数学与统计学院统计系,昆明
小额贷款公司中小企业信用贷款风险实证研究
160
收稿日期:2014年9月22日;修回日期:2014年10月25日;录用日期:2014年11月7日
摘 要
本文以小额贷款公司主要的客户群体中小企业作为研究对象,立足于公司日常的信用贷款业务,基于
Logistic与Probit模型进行风险评估实证分析。在小额贷款行业专家的帮助下,采取头脑风暴法获得建立
模型所需的八项指标。这八项指标作为模型的自变量,从内容上可分为两部分,一部分描述借款人个人
情况,另一部分衡量企业经营状况。在昆明高新科创小额贷款公司数据支持下获得模型结果。在面对具
体的贷款业务时,可以通过相应模型计算客户信用风险得分,最终做出是否予以贷款的决策。经检验,
研究成果可行、有效。
关键词
小额贷款公司,中小企业,信用风险,Logistic模型,Probit模型
1. 引言
在我国经济发展方式转变、结构调整的大局中,中小企业的发展具有举足轻重的作用。据统计,我
国中小企业占企业总数的 99%,占工业产值的 60%,占就业安排的 75%。但相对于其作用与数量而言,
中小企业在融资上的困难已经成为制约其生存和发展的不争事实。在我国的银行融资格局中,大银行高
度垄断制约了中小金融机构获得金融资源的能力,同时也限制了它们为中小企业服务的能力。而大银行
追求贷款规模效益和风险平衡又不愿为中小企业提供贷款。这使得众多中小企业无法从银行获得贷款,
因此在国家“鼓励引导和规范民间资本进入金融服务领域”的政策支持下,小额贷款公司像雨后春笋般
地涌现[1]。
自 2005年国家启动“商业性小额贷款公司试点”以来,短短几年时间,我国小额贷款公司从无到有,
发展可以用突飞猛进来形容。据中国人民银行发布的数据,截止到 2014年 3月底,全国已经有小额贷款
公司 8127家,从业人数达到 98,888人,实收资本金 亿元,贷款余额 8444亿元[2]。具有扶贫性
质的小额贷款公司根据市场需求主要以中小企业为贷款对象,具有放贷门槛低、机制灵活、手续简易、
放贷速度快、贷款期限灵活等优势,恰恰迎合了中小型企业的需求,为当地中小企业拓宽融资渠道提供
了更多的选择,成为金融体制改革的一项重大创新与突破。
然而,由于向小额贷款公司寻求贷款的中小企业大多处在创立初期或者扩大生产规模的阶段,各方
面条件均不完善,有的甚至连详细的财务记录都没有,使得获取中小企业信息的难度和成本都有所增加,
从而给小额贷款公司正确评估信用贷款风险带来很大的挑战。同时,国内外关于小额贷款公司中小企业
贷款信用风险评估模型的量化模型几乎没有。因此,本文提出了基于 logistic模型和 Probit模型的中小企
业贷款风险的信用评估模型。
2. 指标选择和模型
. 指标选择
要对中小企业建立信用贷款评分模型就必须找到评价借款人各项相关条件的若干指标,这些指标在
原则上应当与借款人的信用状况有较强相关性。同时,考虑到小额贷款公司在日常工作中一般均通过实
小额贷款公司中小企业信用贷款风险实证研究
161
地调查获得指标信息,因此在指标选择时,还应充分考虑到操作的可行性,尽量选择相关性强且容易获
得的指标。
在小微金融领域专家的帮助下,采取头脑风暴法,得到了建立中小企业信用贷款风险评估模型的八
项指标,见表 1。这八项指标分为两部分,一部分是描述借款人个人情况的指标,包括:借款人年龄、
学历、人行逾期记录、婚姻状况及居住状况;第二部分是关于企业经营状况的指标,包括:反映长期偿
债能力的资产负债率,反映短期偿债能力的流动比率,反映企业获利能力的销售毛利率。当然,除此之
外还有一些指标也与信用状况具有较强相关性,例如:借款者是否拥有不良嗜好。因为在实际贷款业务
中,如果借款人有诸如赌博等不良嗜好,其还款状况就难以保证。可是这类指标在实际操作中很难获得,
或者获得需要消耗大量的人力、物力、财力,因此未将这类指标选入模型内。
1) 年龄。国外学者的研究表明,年龄与信用风险之间存在曲线关系。虽然这一曲线关系可能并不具
有普遍适用性,但至少表明年龄是信用风险的影响因素之一。
2) 学历。一般认为较高的学历伴随着较高的受教育程度和较多的工作机会,因而违约的可能性也较
小。该指标与信用风险成负相关关系。
3) 人民银行逾期记录。贷款记录反映了一个人过去贷款的还款情况,以往逾期记录不良表明借款者
的还款意愿或者还款能力存在问题,贷款风险增大。
4) 婚姻状况。一般认为拥有良好家庭状况的人追求稳定生活的意愿更为强烈,对于家庭的责任也使
他们努力工作赚钱,因此信用情况更加良好。
5) 居住状况。一个人的居住状况与其资产情况有一定关系,而资产与违约概率负相关。
6) 资产负债率。资产负债率是一项反映企业长期偿债能力的指标,它是企业负债总额占企业资产总
额的百分比。计算公式为:资产负债率 = (负债总额/资产总额) × 100%。该指标值越大,信用风险也就越
大。
7) 流动比率。流动比率是指企业流动资产与流动负债的比率,她反映企业的短期偿债能力。计算公
式为:流动比率 = 流动资产/流动负债 × 100%。该指标值越大,信用风险越小。
8) 销售毛利率。销售毛利率是毛利占销售收入的百分比,计算公式为:销售毛利率 = (销售收入 − 销
售成本)/销售收入 × 100%。销售毛利率能反映企业的竞争力和获利潜力。该指标值越大,信用风险越小。
. 模型选择
对于风险的研究主要有两种量化模型:Logistic模型和 Probit模型。基于这两类模型,我们对中小企
业贷款风险的信用风险进行量化评估。
Table 1. Model indicators
表 1. 模型指标
指标类型 指标 指标原始值
借款人个人情况
年龄 实际值
学历 小学及以下;初中;高中;技校;大专;本科及以上
人民银行逾期记录 逾期次数实际值
婚姻状况 未婚;已婚;离异;丧偶
居住状况 自有;按揭/抵押;租住;借住亲戚朋友家
企业经营情况
资产负债率 实际值
流动比率 实际值
销售毛利率 实际值
小额贷款公司中小企业信用贷款风险实证研究
162
Logistic回归(Logistic Regression)被广泛用于对因变量为二分类变量进行回归建模。该模型对数据的
需求量相对较少且不要求数据服从正态分布,Ohison(1980)将 Logistic模型用于信用风险评估领域并获得
92%以上的判别正确率[3]。
设 p个自变量分别为 1, , pX X ,Y 表示借款人的违约倾向。若 1Y = ,表示借款人未按时还款,发
生违约;若 0Y = ,表示借款人按时还款。如果令二分类因变量 1Y = 的概率为π ,则对违约概率π 和自
变量 1, , pX X 可以建立如下模型:
( ) ( )0 1 1ln logit1 p p
X Xπ π β β β π
π
= = + +
−
, (1)
其中 ( )logit π 代表将π 变换为 ln
1
π
π−
, logit变换使得在 [ ]0,1 范围取值的π 变换到 ( ),−∞ ∞ ,当π 趋
向于 0 时, ( )logit π 趋向于 −∞;当π 趋向于 1 时, ( )logit π 趋向于 +∞。这种违约概率π 与自变量之间
的回归关系就是 Logistic回归模型:
( )
( )
0 1 1
0 1 1
exp
1 exp
p p
p p
X X
X X
β β β
π
β β β
+ + +
=
+ + + +
(2)
当有一组样本 ( )1, , ,i ip iX X Y 时,可以通过极大似然估计得到未知参数的估计,从而可以得到第 j个
借款人是否违约概率的估计 ˆ jπ ,如果 ˆ π > ,则认为该借款人会违约;否则会按时还款。
Probit模型也被广泛用于对因变量为二分类变量进行分析。它主要假设违约事件发生的条件概率服从
累计正态分布函数,该模型在信用评估中有着广泛应用。该模型的优势在于模型用的是点估计,即使随
机变量的分布不能满足正态条件,仍能得到无偏的估计值[4]。
设每一个样本 i都存在一组变量 ( )T1, ,i i ipX X X= ,这些变量的线性组合可以使每一个样本得到一
个分数 iY
∗:
T
1
p
i j ij ijY X Xβ β
∗
=
= =∑ (3)
iY
∗代表某个内在变量或是隐藏变量,在中小企业信用贷款风险评估研究中,代表的是借款人发生违
约的倾向。当 0iY
∗ > 时,因变量 iY 取 1(借款人未按时还款,发生违约);当 0iY ∗ ≤ ,则 0iY = (借款人按时
还款),用概率模型表示如下:
( ) ( ) ( )T1 0i i i i iP E Y X P Y F X β∗= = = > = , (4)
其中 ( )F ⋅ 表示标准正态分布的累积分布函数—— ( ) ( )
T
T di
X
iF X f z z
β
β
−∞
= ∫ 。取上述分布函数的逆函数
得到 Probit模型:
( )1 Ti i iY F P X β∗ −= = , (5)
利用最大似然法估计上式中的参数[5]。
3. 实证分析
. 样本来源
本文的样本来自于昆明高新科创小额贷款公司,该公司是经云南省人民政府金融办公室批准,在工
商行政管理部门依法登记的专业小额贷款服务机构,同时也是昆明市具有相当规模和影响力的小额贷款
公司之一。本文的数据主要来自该公司创建的客户管理信息系统,共 150个样本,其中 14个样本存在缺
小额贷款公司中小企业信用贷款风险实证研究
163
失值,予以剔除,剩余的 136个样本用于模型的建立。根据一般的研究惯例,推导一个参数至少需要 10
个样本,本文共需要推导 9 个参数,故满足条件。同时用于建模的 136 个样本中,有 36 个违约案例和
100个未违约案例。
. 指标预处理
由于指标中既有定性指标,又有定量指标,不能直接用收集到的数据建立模型,必须对指标进行预
处理。对于定性指标,邀请专家结合行业背景及领域相关知识将其指标值按照与信用风险的关系进行量
化,详见表 2。
. Logistic模型
使用 SPSS 软件对样本数据进行初次拟合,由于参数的显著性检验结果显示在所有八个自变量中,
1 6,X X 没有通过显著性检验,因此,剔除变量 1 6,X X ,用剩余 6个变量 2X , 3X , 4X , 5X , 7X , 8X 重新建立
Logistic模型,称为修正 Logistic模型,其参数估计结果见表 3。
从表 3 可以发现,所有的未知参数都通过了显著性检验,因而可得到最终的信用风险评估 Logistic
模型:
Table 2. Definition of variables
表 2. 变量的定义
变量 指标 定义
1X 年龄
小于 30岁,取 2;30 ≤ 年龄 < 40,取 3;
40 ≤ 年龄 < 50,取 4;50及以上,取 5
2X 学历 小学及以下 1;初中 2;高中 3;技校 4;大专 5;本科及以上 6
3X 人民银行逾期记录 逾期次数实际值
4X 婚姻状况 已婚 1;未婚 2;离异 3;丧偶 4
5X 居住状况 自有 1;按揭/抵押 2;借住亲戚朋友家 3;租住 4
6X 资产负债率 实际值
7X 流动比率 实际值
8X 销售毛利率 实际值
Y 违约倾向 违约,未按时还款 1;未违约,按时还款 0
Table 3. Estimate of unknown parameters in Logistic model
表 3. Logistic模型参数估计
B . Wald df Siq. Exp(B)
2X − 1
3X 1
4X 1
5X 1
7X − 1
8X − 1
Constant − 1
a. Variable(s) entered on step 1: X2, X3, X4, X5, X7, X8.
小额贷款公司中小企业信用贷款风险实证研究
164
( )
( )
2 3 4 5 7 8
2 3 4 5 7 8
exp
1 exp
X X X X X X
X X X X X X
π
− − + + + − −
=
+ − − + + + − −
(6)
. Probit模型
使用 STATA 软件对样本数据进行初次拟合,结果同样显示在八个自变量中, 1 6,X X 没有通过显著性
检验,因此剔除 1 6,X X ,用剩余 6 个变量 2X , 3X , 4X , 5X , 7X , 8X 重新建立 Probit 模型,称为修正 Probit
模型,拟合结果如下:
根据表 4的结果,用 2X , 3X , 4X , 5X , 7X , 8X 六个自变量建立的 Probit模型中各个自变量均通过了显
著性检验。该信用风险评估 Probit模型为:
2 3 4 5 7 X X X X X X
∗ = − − + + + − − (7)
. Logistic模型与 Probit模型预测比较
为了比较 Logistic 模型和 Probit 模型在中小企业信用风险评估的预测效果,我们从公司的客户管理
信息系统中再随机抽取 50个客户资料,分别用两个模型对其进行信用风险的评估,并与实际结果相比较。
检验结果如表 5所示。
从表 5的结果可以看出,Logistic模型与 Probit模型预测的正确率总体上相差不大,其中 Logistic模
Table 4. Estimate of unknown parameters in Probit model
表 4. 修正 Probit模型参数估计
B . Wald df Siq. Exp(B)
2X − − − −
3X
4X
5X
7X − − − −
8X − − − −
_cons − − −
Table 5. Contrast of prediction of Logistic and Probit model
表 5. 模型预测比较
模型 分类预测
观察值
预测正确数
1 0
Logistic
预测值
1 28 3 28
0 7 12 12
预测正确率 80% 80% 80%
预测错误率 20% 20% 20%
Probit
预测值
1 26 2 26
0 9 13 13
预测正确率 % % 78%
预测错误率 % % 22%
小额贷款公司中小企业信用贷款风险实证研究
165
型在预测违约事件发生时准确率更高,而 Probit 模型在预测无违约风险发生时的准确率更高。因此在实
际应用中,可以将二者结合起来,如果两个模型判断的结果都认为会违约,则不予贷款;如果两个模型
判断的结果都认为不会违约,则做出贷款的决策意见;如果两者判断结果不一致时,则需要针对具体问
题进一步分析。
4. 结论与展望
. 研究结论
本文利用 Logistic 模型与 Probit 模型对小额贷款公司中小企业信用贷款风险进行了定量分析,得到
了如下结论:
第一, 1 6,X X 在两个模型中均没有通过参数的显著性检验。这说明,在中小企业的小额贷款中,贷
款者的年龄和企业的资产负债率对信用贷款风险的影响不显著。虽然前文提到有国外学者研究表明年龄
与信用风险之间存在一定关系,但是在小额贷款中借款客户的年龄对其贷款风险的影响并不大。这也印
证了由于不同贷款机构信用风险特征和形成机理的差异,关于信用风险的结论很难达成高度的一致性的
结论,因此在研究时应该结合机构自身特征、信用风险特殊性和实际运作特征进行具体分析。
资产负债率作为企业长期偿债能力的重要指标对贷款风险的影响也不显著,分析原因在于由于小额
贷款“高利率、高风险”的特征,因此借贷双方出于自身利益的考虑都更倾向于一年内的短期贷款,而
实际情况也确实如此,因此反映短期偿债能力的经济指标流动比率通过了显著性检验而资产负债率没有。
第二,在通过参数显著性检验的六个自变量 2X , 3X , 4X , 5X , 7X , 8X 中, 2X , 7X , 8X 之前的系数符号
均为负,而 3X , 4X , 5X 的系数均为正。这说明学历、流动比率、销售毛利率越高,信用风险越小;人民
银行逾期记录、婚姻状况、居住状况越差,信用风险越高。这与之前的分析结果相一致,说明模型参数
能很好体现自变量与因变量之间的关系。
. 研究展望
虽然本文针对小额贷款公司不同发展阶段的实际情况建立不同的信用风险模型,致力于为公司决策
者提供量化的数据参考,但是信用风险模型的建立并不是一劳永逸的,还有很多方面需要改进。
第一,考虑到样本量的限制,本文在指标预处理时对定性指标值的量化采取的是专家意见。事实上
这种处理方法具有一定的主观性。伴随着小额贷款公司的发展,业务的扩大,信息管理的规范,可被利
用的有效数据越来越多,在以后的研究中可以考虑在模型中引入虚拟变量,让数据说话,以便更客观、
更精确的评估各定性指标与信用风险之间的关系。
第二,本文只选取了 Logistic 和 Probit 两个操作性较强的模型来评估信用贷款风险。事实上,信用
风险的评估方法非常多,不仅有单一的模型,通过有机组合还有众多的组合模型,在以后的研究中可以
尝试用其他更多的模型来做信用风险的评估,从而提高预测的准确性。
第三,本文对于客户的信用状况只分为两类:违约和未违约,在以后的研究中,可以考虑将客户的
信用状况做更加详细的分级,提高判断的精度。
客户的信用状况受很多因素的影响,大到社会风气,小到个人心理,因此没有一个信用风险评估模
型是永久适用的,必须要根据实际情况的发展变化不断调整。每隔一段时间,应该对模型的适用性进行
检验,如果发现模型在预测上存在规模上的较大偏差,应当重新进行数据拟合,甚至改进现有模型。
致 谢
感谢编辑和审稿人对本论文提出的宝贵意见,感谢国家自然科学基金委和云南省教育厅对本研究的
小额贷款公司中小企业信用贷款风险实证研究
166
支持。
基金项目
该研究得到了国家青年自然科学基金项目(11301464)和云南省教育厅科学研究基金(2013Y360)的资
助。
参考文献 (References)
[1] 陈赛 (2012) 完善小额贷款公司信用管理机制研究——以 A 小额贷款公司信用管理机制为例. 硕士论文, 华东
师范大学, 上海.
[2] (2014) 2014年一季度小额贷款公司数据统计报告.
ml
[3] Ohlson, J. (1980) Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research, 18,
1.
[4] 刘琪 (2011) 小额贷款公司个人贷款信用风险评估研究——Logistic 和 Probit 组合模型运用. 硕士论文, 扬州大
学, 扬州.
[5] 郑昱 (2009) 基于 Probit模型的个人信用风险实证研究. 上海金融, 10, 85-86.
An Empirical Credit Risk Study of SEMs in Small Loan Companies
Abstract
Keywords
小额贷款公司中小企业信用贷款风险实证研究
摘 要
关键词
1. 引言
2. 指标选择和模型
. 指标选择
. 模型选择
3. 实证分析
. 样本来源
. 指标预处理
. Logistic模型
. Probit模型
. Logistic模型与Probit模型预测比较
4. 结论与展望
. 研究结论
. 研究展望
致 谢
基金项目
参考文献 (References)