- 1 -
SVM 在制造业上市公司退市危机预警中的
应用
梁德阳,牛明飞**
(兰州大学数学统计学院,兰州 730000) 5
摘要:本文首先对深沪 A 股上市公司的财务风险预警模型研究进行回顾,并分析了制造业
上市公司的财务风险影响因素。其次,选取上市公司的相关财务指标作为分析指标,及进行
数据预处理和显著性检验,提取分析指标的主成分对其进行降维处理。然后采用支持向量机
模型对制造业上市公司的退市风险进行预测;最后结合退市风险预测结果,提出了研究结论 10
关键词:支持向量机;退市危机预警;制造业
中图分类号:F293
Application of SVM on Delisting Distress Prediction in
China's Listing Manufactural Companies 15
Liang Deyang, Niu Mingfei
(Mathematics and Statistics School,Lanzhou University,Lanzhou 730000)
Abstract: Firstly,The studies of the financial risk early warning model on the Shanghai and
Shenzhen A shares of listing Corporation are reviewed, and analyzed the influence factors of
financial risk in manufacturing industry listing , select the relevant financial 20
indicators of listed companies as an analytical indicators and data preprocessing and significant
test, principal component analysis to extract its targets to reduce the dimension. Then use support
vector machine model for manufacturing listed companies delisting risk prediction; finally, getting
delisting risk prediction results, proposes the research conclusion.
Key words: SVM;Delistig Distress Prediction;Manufactural Companies. 25
0 引言
我国的证券市场经过十几年的发展,已经在经济社会中发挥着越来越重要的作用。为进
一步保护投资者权益,提高退市制度的完备性和可操作性,2012 年我国相继推出了创业板
退市新规和主板与中小板退市新规。新的退市制度新增了一系列退市指标,完善了退市条件,30
对深沪 A 股上市公司提出了更加严格的退市要求。而退市风险的存在,使得一个可行的退
市风险预警系统的建立更加迫在眉睫,因此, 上市公司财务预警是摆在金融风险管理研究者
面前亟需研究的课题,目的是创新财务预警模型, 提高预警质量, 增强预警研究的实用价值,
为上市公司利益相关者提供准确的预警信号。
最早的与财务危机预警相关的研究可以追溯到 20 世纪 30 年代初。美国学者 Altman35
在 1968 年引入多元线性判别模型, 并得出了著名的 Z-Score 模型.但是这些线性模型均存在
假设上的局限性。因此,多元 Logistic 回归、人工神经网络等方法得到研究者的重视。如 1993
年 Fletcher 和 Cross 运用神经网络分析方法对企业破产进行了分析,这些研究与以往的线性
分析模型相比都取得了较好的结果。在国内的研究中,杨淑娥采用主成分分析法, 通过对上
市公司财务状况的实证研究, 建立了上市公司财务预警 Y 分数模型[1]。吴世农、卢贤义对比40
采用 Fisher 线性回归、多元线性回归和 Logistic 回归模型进行上市公司风险预警研究[2]。实
- 2 -
证表明,BP 神经网络在变量高度相关时预测效果仍较理想。
支持向量机(SVM)是数据挖掘的新技术,基于结构风险最小化原理去解决机器学习问
题,采用结构风险最小化方法相较于 BP 神经网络等方法可以较好保证泛化性能,同时能够
较好的处理小样本问题。对于上市公司财务预警这样一个非线性问题, 支持向量机方法不仅45
能够有效解决模型中存在的小样本、高维度和局部极小点问题,而且预测精度上高于 Logistic
回归,BP 神经网络等方法。本文使用支持向量机方法对我国制造业上市公司构建退市风险
预警模型,发现该模型达到了较高的准确度,适合在财务预警研究中推广。
1 方法介绍
统计学习理论 50
支持向量机的理论基础是统计学习理论。统计学习理论使用统计学方法,从有限的样
本出发,得到不能通过原理分析得到的规律,并用这些规律分析其他样本数据。传统的统计
方法使用经验风险最小化原则,使用经验风险代替期望风险,然而对于样本有限的问题,会
产生样本内拟合度较高,而样本外预测效果较差的过学习现象[3]。
针对传统理论的不足,很多学者提出了改进的方法。其中最有指导意义的理论结果是55
VC 维理论和结构风险最小化原则。
对于一个函数集,若存在 k 个样本能够被函数集中的函数按所有可能的共 k2 种形式分
开,我们就称该函数集能够把所有样本区分;该函数集的 VC 维就是它能够区分的最大样本
集的样本数目 k。VC 维用于描述函数集学习能力,VC 维越大则机器学习模型越复杂,相应
的算法也会越复杂。对于两分类问题,经验风险 )(exp wR 与实际风险 )(wR 之间有如下结论:60
对函数集中的所有函数,经验风险与实际风险之间至少以的 1 概率满足(1)式
n
hnh
wRwR
)4/ln()1/2ln(
)()( exp
(1)
其中 h 为函数集的 VC 维,n 为样本数目。上式说明实际风险由两部分组成,一部分是经验
风险,另一部分是和学习机器的 VC 维集及训练样本数目有关的置信范围。我们可以发现,65
在有限样本下,VC 维越高则置信范围越大,实际风险与经验风险的差别越大,这就是出现
过学习现象的原因。
对于这一问题,统计学习理论提出了一种新的方法:把函数集构造函数子集序列,使得
各个子集按照 VC 维的大小排列,在每个子集中寻找最小的经验风险;在子集之间折中考虑
经验风险和置信范围,以取得实际风险的最小。这种思想即为结构风险最小化(SRM)原则。70
实现 SRM 原则,可以考虑设计函数集的结构使得每个子集中都能取到最小的经验风险,然
后选择适当的子集使得置信范围最小,则这个子集中的使经验风险最小的函数就是所需的最
优函数。支持向量机方法就是这种思路的具体实现。
支持向量机方法
支持向量机是从线性可分时的最优分类面发展而来。在线性可分的两类样本形成的高75
维空间中,最优分类面不仅能将两类正确分开,而且使得分类间隔最大[4-5]。设分类面方程
为 0 bxwT .对它归一化,使线性可分样本集满足(2)式:
nibxwy ii ,...,1,01])*[( (2)
- 3 -
中国科技论文在线
此时分类间隔即为 2/||w||,若要使间隔最大即要使||w||最小。现在可以定义最优分类面为
满足(2)式且使 2||||
2
1
w 最小的分类面,确定分类间隔的样本点为支持向量。而统计学习理论80
指出,在 N 维空间中设样本分布在半径为 R 的超球内,则满足条件 Aw 2|||| 的正则超平面
构成的函数集的 VC 维 k 存在上界 1}],min{[ 22 NARk ,因此使分类间隔最大就是要使
VC 维最小,从而实现 SRM 原则的要求。
上述最优问题可以利用拉格朗日优化方法转化为对偶问题,即在 0
1
n
i
iiy 和 0i
的条件下对 i 求解下列函数最大值 85
n
i
n
ji
jijijii xxyyQ
1 1,
)(
2
1
)( (3)
i 为每个样本对应的拉格朗日乘子。这样就转化为了不等式约束下的二次函数最优化问题。
可以证明,上述问题存在唯一解,解中只有一部分 i 不为零,对应的样本点即为支持向量。
解得最优分类函数为下式,式中的求和实际上只对支持向量进行, *b 为分类阈值。
})*(sgn{})*sgn{()(
*
1
* bxxybxwxf ii
n
i
i
(4) 90
在线性不可分情况下,引入松弛变量 0i ,使得条件(2)成为
nibxwy iii ,...,1,01])*[( (5)
当 10 i 时样本点 ix 仍被正确分类,而当 1i 时被错分,因此目标函数改为下式
n
i
iCww
1
2||||
2
1
),( (6)
其中 C 为大于 0 的常数惩罚因子,控制对错分样本惩罚程度。求解即得广义最优分类面。95
此时对偶问题转化为
n
i
ii
i
n
i
n
ji
j
T
ijijii
y
niCts
xxyy
1
1 1,
0
,...,1,0..
)(
2
1
max
(7)
这种变换通常比较复杂, 因此这种思路一般不易实现。但是在高维空间上实际只需进行
内积运算, 而这种内积运算可以用原空间中的函数实现,甚至没有必要知道变换的形式。根
据泛函的有关理论, 只要一种核函数满足 Mercer 条件, 它就对应某一变换空间的内积。因此100
在最优分类面中采用适当的内积核函数 ),( ji xxK ,就可以实现某一非线性变换后的线性分
类, 而计算复杂度却没有增加。
支持向量机中不同的内积核函数将形成不同的算法,不同的核函数及设定不同核参数的
方法,能够获得高维空间的不同分类方式,这为不同的复杂预警问题提供了有针对性的解决
方法。目前研究最多的核函数主要有 3 类:多项式核函数、径向基函数、Sigmoid 函数,具体105
核函数的选择模型的确立,需要根据数据特点去确定。
- 4 -
中国科技论文在线
2 样本选择与指标筛选
样本数据来源
本文选择证监会行业中制造业 A 股上市公司的财务数据作为分析样本,把沪深两地证券
市场中的有退市风险的制造业上市公司定为负类样本公司,无退市风险的制造业上市公司定110
为正类样本公司。假定公司 T 年被交易所宣布存在退市风险,本文样本数据选择公司 T-2
年财政年度的财务指标数据。这样可以控制信息获取的事件对模型预测能力的影响。根据制
造业上市公司的实际情况,采用非配对抽样,抽取相对较少的存在退市风险企业与相对较多
的正常企业。
按照以上原则,本文选取 2012 年和 2013 年被宣布实施退市风险警示(ST)的制造业上115
市公司共 31 家(2012 年 15 家,2013 年 16 家),另外以 3:1 的比例匹配选取同行业
的非 ST 公司样本 93 家(2012 年 45 家,2013 年 48 家),具体样本数量如表 1 所示。样
本公司数共 124 家。这 124 家样本公司数据分为训练样本集和测试样本集。本文中训练样
本集包括 84 家公司(占样本总数的 %),其中 ST 样本 21 家,非 ST 样本 63 家;
测试样本集包括 40 家公司(占样本总数的 %),其中 ST 样本 10 家,非 ST 样本 30 120
家。数据来源:锐思金融研究数据库()。
表 1 样本选取一览表
实施警示年份 2012 年 2013 年 合计
退市风险公司 15 16 31
无退市风险公司 45 48 93
合计 60 64 124
分析指标选择
参考相关文献,确定区分两类公司所需的各项财务比率应该遵循全面性、可比性、可行性125
原则[6]。本文结合制造业上市公司的实际情况,并基于可量化的原则,选择企业偿债能力、
盈利能力、营运能力、成长能力、资本结构和每股指标等方面的财务指标共 26 个。见表 2。
表 2 分析指标一览表
偿债能力 流动比率 总资产周转率
速动比率 成长能力 营业收入增长率
股东权益/负债合计 营业利润增长率
现金流动负债比 净利润增长率
盈利能力 净资产收益率(摊薄) 每股经营活动现金流量增长率
资产净利率 净资产增长率
投入资本回报率 总资产增长率
销售净利率 资本结构 资产负债率
息税前利润/营业总收入 固定资产比率
营运能力 存货周转率 股东权益比率
应收账款周转率 每股指标 每股收益(期末股本摊薄)
流动资产周转率 每股息税前利润
固定资产周转率 每股净现金流量
- 5 -
中国科技论文在线
表 2 中的指标能比较全面地衡量制造业上市公司各方面的情况。然而财务预警指标过
多,会使模型的复杂度过高,泛化能力减弱,同时指标之间的相互关联反而会导致预警判别130
结果出现偏差。因此在对数据进行分析前,必须先对这些财务预警指标进一步筛选,去掉冗
余信息,并提取各变量的主要信息。
3 数据预处理
显著性检验 135
对财务预警指标变量,本文采用两独立样本 T 检验。通过 SPSS 软件检验后,每股收益(期
末股本摊薄) 、每股息税前利润、净资产收益率(摊薄)、资产净利率、投入资本回报率、销
售净利率、息税前利润/营业总收入、流动比率、速动比率、股东权益/负债合计、现金流动
负债比、净利润增长率、净资产增长率、总资产增长率、存货周转率、应收账款周转率、资
产负债率、股东权益比率这 18 个指标在显著性水平 下通过显著性检验;其余指标在140
两种样本中没有显著性差异。因此本文选取这 18 个财务预警指标作为下一步分析对象
因子分析
上面确定的 18 个退市危机预警指标具有显著性,这些指标从不同方面反映了公司的财务
状况。但退市危机预警指标之间存在多元共线性,且指标过多会导致模型的过分拟合,反而
影响结果的正确性。本文考虑用因子分析的方法对退市危机预警指标进行降维处理。 145
把样本数据导入 SPSS 软件,采用因子分析方法,并取累计贡献率为 %,则主成
份为 8 个,即用这 8 个主成份来代替原来的 18 个财务指标。本文采用正交旋转法中的方
差最大法进行转换。因子旋转矩阵如表 3 所示。
表 3 因子旋转成分矩阵
1 2 3 4 5 6 7 8
每股收益(股本摊薄) .187 .909 .162 .146 .063 .043 .111 .008
每股息税前利润 .908 .181 .144 .140 .052
净资产收益率(摊薄 .103 .149 .077 .128 .853 .056
资产净利率 .379 .794 .303 .147 .181 .084 .016
投入资本回报率 .209 .870 .265 .114 .175
销售净利率 .142 .384 .859 .093 .101 .033 .193
息税前利润/营业总收入 .127 .373 .882 .107 .042 .168
流动比率 .869 .139 .178 .237
速动比率 .861 .127 .145 .276
股东权益/负债合计 .910 .085 .042 .100 .045
现金流动负债比 .623 .276 .373 .098 .105
净利润增长率 .178 .247 .065 .035 .910 .025
净资产增长率 .187 .389 .089 .655 .456 .052 .014
总资产增长率 .065 .191 .090 .914 .039 .066 .045
存货周转率 .012 .018 .980 .030 .083
应收账款周转率 .029 .026 .040 .082 .021 .983
资产负债率 .025 .090
股东权益比率 .872 .130 .009 .366 .060 .126
- 6 -
中国科技论文在线
观察表 3 可以发现,旋转后的因子 1 在流动比率、现金流动负债比、资产负债率上有较150
大权重,体现了上市公司的偿债能力,可定义为偿债能力因子。其余因子可类推分析。确定
分析因子后,样本的因子得分即为构建 SVM.模型的输入数据。
4 建立预测模型
支持向量机方法中,对分类效果有重要影响的参数是:惩罚参数 C,核函数参数 g,所
选择的核函数 t。SVM 模型的应用效果取决于一组好的参数。统计学习理论目前还没有对155
SVM 参数选择给出最优的理论方案,本文在参考相关研究文献的基础上,经过比较,选择
多项式核函数作为内积核函数进行建模,这样可以保证较好的全局性和泛化能力[7]。多项式
核函数的形式为
d
ii xxxxK )1*(),( (8)
内积核函数采用多项式核函数的退市预警模型等价于求解 160
n
i
ii
i
n
ji
d
ijiji
n
i
i
y
niCts
xxyy
1
1,1
0
,...,1,0..
)1*(
2
1
max
(9)
对应的判别函数为
})1*(sgn{)(
1
**
n
i
d
iii bxxyxf (10)
对于核参数的选择,根据文献,本文采用交叉验证算法进行参数寻优,最终求得的 SVM 最
优参数是 C=,核函数参数 g=. 165
用选定的核函数和模型参数在 MATLAB 2010b 下构造支持向量机,对样本进行分类,
运行结果如下及图 1 和图 2 所示
Accuracy = % (83/84) (classification)
Accuracy = 95% (38/40) (classification)
170
图 1 SVM 模型对训练集的分类结果
- 7 -
中国科技论文在线
图 2 SVM 模型对测试集的分类结果
SVM 模型的预测效果如表 4 所示
表 4 SVM 模型的预测结果 175
训练集 测试集
退市风险公司 无退市风险公司 退市风险公司 无退市风险公司
实际分类 31 63 10 30
预测正确 31 62 9 29
准确率 100% % 90% %
总准确率 % 95%
5 结论
2012 年新颁布的上市公司退市新规使得上市公司退市制度进一步健全,对上市公司运
营提出了更高的要求,经营压力更大。因此研究退市风险预警具有理论和实际两方面意义。
制造业作为我国工业体系中的基础,在国民经济中尤为重要。本文构建支持向量机分类预测
模型,引入到制造业上市公司退市危机预警中。从分析过程来看,与传统的财务预警模型相180
比,SVM 模型突破了单元和多元线性模型方法的限制,克服了 BP 神经网络需要大量样本
进行训练且泛化能力不足的弱点,使用非线性函数更好的拟合了数据。从模型的预测效果上
看,达到了较高的准确率,预测精度高于其他方法。由于 SVM 模型具有效率高,易于训练
的特点,运用 SVM 模型进行财务危机预警,是值得探讨和推广的选择。
[参考文献] (References)185
[1] 杨淑娥,黄礼. 基于神经网络的上市公司财务预警模型[J].
系统工程理论与实践,2004,6:18-20
[2] 吴世农,卢贤义. 我国上市公司财务困境的预测模型研究[J]. 经济研究,2001,6:46-55+96
[3] 张学工. 关于统计学习理论与支持向量机[J]. 自动化学报,2000,26(1):32-42
[4] 邓乃扬,田英杰. 数据挖掘中的新方法:支持向量机[M]. 科学出版社,2004 190
[5] 王定成. 支持向量机建模预测与控制[M]. 气象出版社,2009
[6] 雷杰辉 中国服务业上市公司财务困境预警研究[D] 暨南大学硕士学位论文,2007
[7] 史峰,王小川,郁磊. MATLAB 神经网络 30 个案例分析[M]. 2010