第35卷第1期武汉理工大学学报(信息与管理工程版)Vol. 35 No. 1 2013年2月 JOURNAL OF WUT( INFORMATION &M ANAGEMENT ENGINEERING) 文章编号:2095-3852(2013)01 -0111 -04 文献标志码:A股票网络的基尼系数聂春笑,刘微(合肥工业大学管理学院,安徽合肥230009)摘要:基于复杂网络理论研究了股票网络,使用股票的距离概念建立了带有边权的股票网络。基于网络理论中的基尼系数概念,计算了不同阂值下对应的基尼系数,发现基尼系数与阂值之间近似为线性关系,且对中国与美国市场的数据分析表明,对应修正后的线性关系斜率相差不大。基于几何布朗运动建立了网络模型并计算了对应的基尼系数,对比模型网络与现实网络的差异,给出了基尼系数在股票网络中的含义以及对应计算结果的解释。关键词:股票网络;基尼系数;股票距离;几何布朗运动中图分类号:F830. 9; N949 DOI: 10. 3963/j. issn. 2095 -3852. 2013. 01. 028 自小世界网络模型与元标度网络模型提出以等以2002-2004年上海证券交易所持续交易的来[1-2]许多学者们对现实中的网络以及相关的股票为节点,股票价格波动的相关性作为边权,在理论问题进行了研究。很多实际问题可以用网络不同的阔值下计算了度分布署指数,指出证券市描述,如人与人之间的社会关系、生态学中的食物场网络的度分布不具有适当的幕律指数[6]0 KIM 网、计算机网络、流行病的传播、计算机病毒的传等定义了股票网络中节点的影响力,发现影响力播、科学合作和国际贸易等。人们也对金融市场分布是罪律分布,其中的指数约为[7]O中的网络进行了研究,研究的节点以及边与边权 基尼系数及股票的距离的构造方式有所不同,笔者以股票作为节点,股票为了研究网络的异质性,王林和戴冠中引人的距离作为边权构建股票网络并进行研究O基尼系数的概念,并具体地研究了其与度分布指数之间的关系[8]。下面的概念与计算方法引自1 股票网络与网络的基尼系数于王林和戴冠中的专著,对应的详细论证和说明可以参看他们的专著[9] 股票网络将不同的股票作为节点,对应股票之间的某设一个网络具有N个节点,将这N个节点的种关联作为边或者边权就构成了一个股票网络,度值按照从小到大的顺序排列为叭,饨,…,町,对常用的构建边权的方法是基于股票价格序列的相应的度值设为矶,d,…,d,于是有d:::三d运…运2N12N 关系数。目前对股票网络进行了不少的研究,如1d。对于运i运N,记W= d/三4。如图1所NiBOGINSKI等以时间序列的相关系数作为边权,示,OED称为洛伦兹曲线,对应的基尼系数为面然后取阔值进行约化形成无权图,最后计算度分积比值A/(A+B) 0 οED的下方面积本质上为N布与集聚系数[3]0 CHEOIJUN等基于套利定价个小梯形的面积之和,如式(1)所示,因而基尼系模型结合网络模型获知少数具有较多连接的节点数的计算公式可以表示为式(2)。与共同因子具有更高的相关性[4]O兰旺森等以相关系数为边权,发现股票网络在某些阔值下为B =三(L W+ L W) X (11 (2N)) (1) k k元尺度网络,度分布军指数小于1,而网络中存在核心节点,且网络可以划分为两个分区,抽取部分G = 1 -(川)×Z(2Z风-叹)(2) 关键节点对整体网络有较大的影响[5]O庄新田收稿日期:2012-09 -04. 作者简介:聂春笑(1986-) ,男,安徽六安人,合肥工业大学管理学院硕士研究生.
112 武汉理工大学学报(信息与管理工程版)2013年2月 能会存在一些问题,如较大阔值的选取可能会导 致约化后的网络中存在孤立节点,为了合理地计-I!rJj i 算整体的不同阔值下的基尼系数,确定阔值选取汩~ A 孟范围的方法,首先将不同的边权进行从小到大排1监序,设在依次顺序为5%处的边权为矶,而在859毛士踩02B 处的边权为矶,则阔值的选取范围即为[0,O] , 12 。l事实上可以变动不同的百分比以做合理的研究。o 由于不同的阔值有不同的基尼系数,因此选择一累计îi点数/总节点数部分合适的数字作为阔值,可以做出一个阔值与图1复杂网络的洛伦兹曲线基尼系数之间的近似关系图,后面的分析将发现进一步分析可知网络节点的度值之间差异越这些关系呈现为近似的线性关系,拟合出对应的大对应的基尼系数越大,因而,基尼系数刻画了复直线求得直线的斜率可以分析基尼系数对阔值的杂网络的异质性O敏感性,在相同的区间上斜率越大且最初值一致MANTEGNA首先基于时间序列的相关系数时对应的基尼系数变化就越大,由于不同网络的给出了距离的定义,然后从数学中引人超度量空θ1与民的选择可能不一样,对应的(()2-θ1 )也不间的概念,考察了金融市场的层级结构,计算了一一样,因此合理的方式是将[0, O]伸缩为长度一1 2 些股票集合的最小生成树[叫O设有两支股票(分样的区间,通常的办法是将原区间伸缩变换为一别记为i与j),jYi(t)t为股票i在t时间的日收个长度为1的区间,因此只需将原始拟合的斜率盘价,将收盘价对数化,然后进行差分得到对数收乘以(0-0) ,新的斜率值称为修正后的斜率。21益率的序列j5t,如式(3)所示。 计算结果5= ln Y;( t) -ln Y(t -1) (3 ) 笔者选取沪深300指数与S&P500指数中的i i 在形成的序列j5t基础上进一步考虑相关i股票在2006-2009年4年间的每日收盘价数据性,计算j5t与|附的相关系数如式(4)所示,i进行计算,由于不同的年份,指数内的股票有所变"< >"表示对所考察时期的数据取平均值。化,因而整体的数目也可能有所变化,但由于这里ρq=(<Sz岛>-< 5> <乓>)/考虑的是整体的异质性,因此较小的变化对结果i (<Sf-<SZ〉2><Sf-<鸟>2>)ν2 (4) 的影响可以忽略。其中沪深300指数的每支股票相关系数的取值范围在-1-1之间,若冉=的每日收盘价数据来自于Wind数据库,S&P5001,则表明股票价格完全正相关,向=-1表明股指数中的股票收盘价数据来自于雅虎财经。票价格完全负相关'Pij=0表明股票价格不相关。计算基尼系数与阔值之间的关系,图2与图而股票的距离则由式(3)进行定义,进一步分析3分别为两个市场在2009年的计算结果,所有计表明其满足度量的3个基本性质[口o算结果如表1与表2所示,计算使用的软件为dij = (2(1 -ρij))1/2 (5) Matlab7. 10 笔者计算了不同年份对应的网络基尼系数与2 股票网络基尼系数的计算方法阔值之间的关系,下面以每个月的数据进行计算,2. 1 计算方法已知在较小的时间段里数据计算出的相关系数矩首先选取一组股票,将该组股票进行编码阵可能带有更多的"噪音因此可以直观地认识(编码的顺序无关紧要),这样可以做出一个抽象 的点集,将该点集作为节点集,而不同股票之间的 股票距离作为边权,因此就构建了一个股票网辙。4络问o由于股票之间一般都存在相关性,于是其览。3阐一般为完全边权网络。然后选取不同的阔值,将。1大于等于阔值的边保留,而小于阔值的边约去,这o~一一一…样可以将原边权网络约化为元权网络,进一步计0,85 θ 算对应阔值的基尼系数。图22009年沪深300指数对应的基尼系数在现实的计算中,当阔值取值较为特殊时可
第35卷第1期聂春笑,等:股票网络的基尼系数113 AVfhAHVAυ 口,、 基于几何布朗运动模型的网络基尼系数J /’ JA. . . 1973年BLACK和SCHOLES应用几何布朗斗运动来描述股票价格的运动并最终导出了欧式期慧。3. 、. " .. 权的定价公式。依据几何布朗运动模拟股票价格. 碍。2. . . • . hvl 布. 序列,并按照模拟的数据构建一个网络,进行对应的网络基尼系数的计算 0,&0 MO LO() LlO U5 L20 图4为一个模拟网络对应的基尼系数,假设θ 最初的价格S。满足[1O,20J上的均匀分布,收益图32009年S&P500指数对应的基尼系数率满足期望为,标准差为的正态分表1沪深300指数在2006-2009年对应的拟合结果布,而标准差满足期望为,标准差为 年份残差向()2尺度修正的正态分布。这些最初的假设并非是确定的,可斜率常数项。1/年量范数之差斜率以任意设置,在不同的参数设置下对应的基尼系2006 1. 838 1 6 1. 34 1 数变化规律差别不大。可以明显地看到,基于几2007 1. 458 6 -1. 357 6 2 1. 26 3 何布朗运动的网络基尼系数整体上要远小于现实2008 1. 258 0 6 8 1. 14 2 网络,这意味着在整体上对应的异质性要小于基于2009 1. 561 4 -1. 357 0 3 1. 19 3 现实数据的网络。图4中对应的拟合直线为G=均值 9 xθ (残差范数为O.但065),修表2S&P500指数在2006-2009年对应的拟合结果正后的斜率为 9 x ( 1. 46 -1. 34) = O. 048 6。年份残差向()2尺度修正斜率常数项。1可以看到修正后的斜率也比基于现实数据的网络/年量范数之差斜率要小很多O2006 1. 718 1 -1. 907 9 6 1. 10 1. 35 5 2007 1. 637 5 -1. 590 1 O. 117 0 1. 26 3 2008 1. 567 4 -1. 247 4 7 1. 09 9 2009 1. 291 0 -1. 068 0 3 1. 20 6 辛苦 均值 益。03到对应的网络的异质性要更小。由于此时节点在闹。02. . . 白nυ . l’Ei . 确定阔值的取值下,度的差异比长期数据计算的U. 结果要小,因而对应的基尼系数也会较小,下面的0 1J4 1J8 计算验证了这一点。这里取S&P500指数中的股。票在2009年12个月的数据进行计算,计算的结图4基于几何布朗运动的网络基尼系数果如表3所示。将表3与表1及表2进行对比,3 结论可以发现修正后的斜率均值较表1与表2要小一些,这表明在较小的时间段序列中,网络的异质性计算了股票网络的基尼系数以及基于几何布对阔值的敏感性要低一些O朗运动模型下的网络模型对应的基尼系数,发现表32009年S&P500指数每个月对应的拟合结果二者有很大的差异,基于现实数据的网络整体具月份尺度尺度尺度修正斜率常数项残差和有较大的基尼系数,而模拟的网络则只有较小的之差斜率基尼系数,在对数据进行修正后,发现基尼系数与 36 13 O.。中9ω 84 2 组 38 阔值之间近似具有线性关系,而现实网络对应的3 95 82 O.σ7456 白55斜率要比模型网络对应的斜率大得多,由于最初4 O.翩 16 O. Q’i5 59 84 5 38 16 O.α)2 91 72 的较小阔值选取时的基尼系数差异较小,表明了6 O.仅{)43 83 55 1. 30 现实网络的异质性要远高于模型网络。而以单个7 19 82 O.侃324 O. 71 1. 30 o. 59 94 月的较短时间序列进行计算发现,对应网络的修8 O.仅Ð22-0.筑B56O.部 o.充8079 O.创主 24 耳93正拟合斜率要小于以年度为跨度的时间序列的网10 59 49 O.α到)85 1.组 85 络修正拟合斜率,这也表明了在短期中网络的异11 50 20 O.侃 12 后48质性要小一些。 50 1. 38 O.药470均值 传统的金融理论认为存在少数因素对股票波
114 武汉理工大学学报(信息与管理工程版)2013年2月and Its ApplicatiollS, 2即7,383(1): 139 -146. 动具有影响,特别是广为熟知的金融时间序列的[5J 兰旺森,赵国浩.应用复杂网络研究板块内股票的相关阵存在占优的特征值,这表明现实数据存在强相关性[1].中山大学学报:自然科学版,2010,49少数的经济因子。基于几何布朗运动模型的基尼(增刊):65 -69. 系数较小表明了若不同股票之间的相关性独立,[6J 庄新田,闵志峰,陈师阳.上海证券市场的复杂网络则对应的异质性较小;而与此不同,现实的网络表特性分析[1].东北大学学报:自然科学版,2007,28现了一定的异质性,笔者认为股票网络异质性的(7) :1053 -1056. 来源是少数经济因子以及大量偶然因素对不同股[7J KIM H J, LEE Y, KIM 1 M, et al. Scale -free net›票的影响具有异质性,也即有一定的不一致性,这work in stock markets [J J . Joumal of the Korean Physi›种不一致性可以认为是市场复杂性的一部分。cal Society ,2002 ,40( 6) : 1105 -1108. [8J 王林,戴冠中.Scale -free网络的一个新的拓扑参数[川JJ.系统工程理论与实践,却200俑6,却26(6创):棉49-5刃3.参考文献:[引9]王林,戴冠中取.复杂网络的S阮ca曲le一f丘r回性、S玩ca曲le一f四re现象及其控制[MJ.北京:科学出版社,2∞9:43-45.[1 J WATIS D J ,S1ROGATZ S H. Collective dynamics of small [10 J MANTEGNA R N. Hierarchial structure in financial world’s networks[J]. Nature ,1鳞(393): 440 -442. m町ke恒[ European Physical Joumal B, 1999 [2J ALBERT L R. Emergence of scaling in random net›(11) :193 -197. works[JJ. Science,1999( 15) :509 -512. [11 J 罗萨里奥.N.曼特尼亚,尤金.H.斯坦利.经[3 J BOGINSKI V, BUTENKO S, PARDALOS P M. Statis›济物理学导论[MJ.封建强,匡宏波,译.北京:中tical analysis of financial networks [ J J. Computational 国人民大学出版社,2006:114 -122. Statistics & Data Analysis, 2∞1,48(2) :431 -443. [12 J 刘晓霞,王卫华.上海证券市场股票网络的复杂网[4 J CHEOUUN E,GABJIN O,SEUNGHWAN K. Determinis›络特性研究[1].武汉理工大学学报:信息与管理tic factors of stock networks based on cross -correlation 工程版,2012,34(5):642 -645. in financial market [J]. Physica A: Statistical Mechanics Gini Coefficient of Stock Networks NIE Chunxiao, LIU Wei Abstract: Based on the complex networks theory, stock networks were investigated. The stock networks were set up by the notion of the distance of stocks. Based on the notion of gini coefficient in the networks theo巧,different values were calculated un›der the corresponding threshold values. It was found that the relationship between the gini coefficient and the thr回holdvalue was approximately linear, and the data analysis of China and the United States market shows that the difference of corresponding re›vised slope is not big. The network model was established based on the geometric Brownian motion and the gini coefficient of the corresponding network was calculated. The model was compared with real network. The meaning of the gini coefficient in stock network was given and the corresponding calculation results were explained. Key words: stock networks; Gini coefficient; distance of stocks; geometric Brownian motion NIE Chunxiao: Postgraduate; School of Management, Hefei University of Technology, Hefei 230009, China. [编辑:周延美]