- 1 -
中国科技论文在线
Alpha 稳定分布参数评估及应用研究#
陈海龙,刘春丽,由承姬*
基金项目:高等学校博士学科点专项科研基金资助课题(20122303120005);第 51 批中国博士后科学基金
面上资助(2012M510926);黑龙江省政府博士后资助经费(LBH-Z12069)
作者简介:陈海龙,(1975-),男,博士,副教授,硕士研究生导师,知识工程、时间序列及其应用研究、
信息与信号处理。
(哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080)
摘要:随着信号处理技术的发展,非高斯信号处理是近年来发展起来的一个信号处理的新领5
域。基于广义中心极限定理的 Alpha稳定分布是一种广义的高斯分布,它能够很好的描述信
号统计分布的非高斯性和重拖尾性。本文首先讨论 Alpha稳定分布的定义和基本理论;然后
求解出该分布的概率密度函数以便于样本分位数法和基于分数低阶矩法的实现;最终,把研
究结果应用于上证指数和道琼斯工业指数,求解出其服从的分布模型。
关键词:Alpha稳定分布;参数估计;非高斯;样本分位数法;分数低阶矩法 10
中图分类号:TP399
Research on Parameters Estimation and Application of
Alpha-Stable Distributions
CHEN Hailong, LIU Chunli, YOU Chengji 15
(School of Computer Science and Technology, Harbin University of Science and Technology,
Harbin 150080)
Abstract: Non-Gaussian signal processing is a new signal processing field with the development
of signal processing techniques in recent years. The Alpha stable distribution, which is a kind of
generalized Gaussian distribution, has the statistical characteristics of non-Gaussian and heavy 20
tailed. Firstly, the definitions and basic theories of the Alpha stable distribution are discussed.
Secondly, compute the probability density function value to implement Fractional Lower Order
Moment method and the Sample Quintiles’ method easily. Finally, the Alpha stable distribution
is used in Shanghai composite Index and Dow Jones Industrial Average, and the related
parameters are estimated. 25
Keywords: Alpha stable distribution; Parameter estimation; Non-Gaussian; Sample quantiles
method; Fractional Lower Order Moment method
0 引言
非高斯信号处理是近年来迅速发展起来的一个信号处理的新领域。作为满足广义中心极30
限定理的唯一的一类分布,Alpha 稳定分布[1]自 1993 年开始应用于信号处理中以后,引起了
国内外大量专家学者的注意。作为一种广义化的高斯分布,Alpha 稳定分布能够很好的描述
信号统计分布的非高斯性和重拖尾性。
本文重点研究了 Alpha 稳定分布的仿真和参数估计。首先讨论 Alpha 稳定分布的定义
及其基本理论,作为本文研究的理论基础;然后介绍了 Alpha 稳定分布的 4 种常用参数系和35
相关的参数转换关系,给出了标准参数系下 Alpha 稳定分布的仿真算法。由于该分布在标准
参数系下的概率密度无闭式表达,本文采用在 1S 参数系下该分布的概率密度函数和相关的
参数转换关系来求解标准参数系下概率密度函数值。最后,基于样本分位数法和基于分数低
阶矩法,对服从 Alpha 稳定分布的随机序列的参数进行估计,并将其应用到实际生活中,求
解出上证指数和道琼斯工业指数所服从的分布。 40
- 2 -
中国科技论文在线
1 Alpha 稳定分布基本理论
稳定的随机分布是指随机变量的概率密度函数按平均率衰减。在现有理论中,稳定分布
有多种定义方式,在此介绍基于特征函数的定义方式,即若参数0 2α< ≤ , 1 1β− ≤ ≤ , 0γ ≥ ,
δ 为实数满足
exp{ [1 sgn( )tan( )] }, 1
2( )
2exp{ [1 sgn( ) ln ] }, 1
t i t i t
t
t i t t i t
αα παγ β δ α
ϕ
γ β δ απ
⎧ − − + ≠⎪⎪=⎨⎪ − + + =⎪⎩
45
其中
1, 0
sgn( ) 0, 0
1, 0
t
t t
t
>⎧⎪= =⎨⎪− <⎩
则称随机变量 X 服从 alpha 稳定分布,记为 ( , , , )X S α β γ δ∼ [2]。
α 是特征指数,可用来度量分布函数拖尾的厚度,其值越小,所对应的分布图像的拖尾
特性越严重,脉冲特性越显著,其中其值越大越趋于高斯过程, 2α = 特征函数式与均值为α50
方差为 22σ 的高斯分布相同,即高斯分布是α 稳定分布的一个特例。当 1, 0α β= = 时表示为
柯西分布。
β 是对称参数,用于确定分布的斜度,当 0β = 时,随机变量服从对称α 稳定分布,记
为 S Sα ; 0 1β< ≤ 对应于右偏斜, 1 0β− ≤ < 对应于左偏斜分布。高斯分布和柯西分布都属
于 S Sα 分布。 55
γ 是分散系数,又称为尺度系数,其意义与高斯分布中的方差类似,用于度量样本相对
于均值的分散程度。γ 取值越大,随机序列相对于均值的分散程度越大。
δ 是位置参数,对于 S Sα 分布,当 0 1α< ≤ 时,δ 表示中值,当1 2α< ≤ 时,δ 表示均
值。满足 0, 1δ γ= = 时,Alpha 稳定分布称为标准 Alpha 稳定分布。
2 Alpha 稳定分布随机变量的产生 60
本次论文着重于求解实际生活中一些随机序列所符合的分布模型,在此先结合已知参数
模型求解其生成随机序列,明确各个参数对于生成的随机序列的影响。
Alpha 稳定分布的多种参数系的表征
从现有理论中可知,Alpha 稳定分布涉及多种参数系[3],如 Zolotarev 提出了五种不同的
参数系:M 系、A 系、B 系、C 系、E 系[4],分别对应于不同的研究目的;同样 Nolan 针对65
参数系不同的用处提出了 0S 参数系和 S ∗ 参数系[2]。本文介绍常用的四种参数系,即标准参
数系 S , 0S 参数系,Zolotarev(M)参数系(记为 1S )[4]和 Zolotarev(B)参数系(记为 2S )[5]。
针对于标准参数系下 Alpha 稳定分布的概率密度函数,注意到该特征函数图形是非连续
的。
不同的参数系下特征函数是不同的,各参数表示的含义也存在差别,然而各参数之间也70
存在着转换关系。例如 1S 参数系下,Alpha 稳定分布的特征函数表达形式为
- 3 -
中国科技论文在线
1
1
1
exp{ [ ( 1)(tan )] }, 1
2( )
2exp{ [1 (sgn( )) ln ] }, 1
t it t i t
t
t i t t i t
α αα παγ β δ α
ϕ
γ β δ απ
−⎧ − − − + ≠⎪⎪=⎨⎪ − + + =⎪⎩
其中涉及的参数与标准参数系下参数的转换关系为
1
tan , 1
2
, 1
α παδ βγ αδ
δ α
⎧ + ≠⎪= ⎨⎪ =⎩
由于在 1S 参数系下的特征函数中, ( )1
1
2lim 1 tan ln
2
t tαα
πα
π
−
→
⎛ ⎞− =⎜ ⎟⎝ ⎠ ,可知此时的特征函数75
是连续的,但是 1δ 的表示含义已发生了变化。
同理,可知在 2S 参数系下各个参数与标准参数系下的各个参数之间的转换关系:
当 1α ≠ 时
2
( )tan( ) tan
2 2
Kπ α παβ β=
12 2 2
2 (1 tan )2
απαγ γ β= + 80
当 1α = 时
2β β= , 2 2γ γπ=
其中
, 1
( ) 1 sgn(1 )
2, 1
K
α αα α α α α
<⎧= − + − = ⎨ − >⎩
在 0S 参数系下,参数之间的转换关系如下: 85
0
tan , 1
2
2 ln , 1
παγβ δ α
δ
βγ γ δ απ
⎧ + ≠⎪⎪= ⎨⎪ + =⎪⎩
可知此时仅有 0δ 的表示含义发生了变化。
随机变量的生成
关于服从 Alpha 稳定分布的随机变量的生成在此借助了均匀分布和指数分布,以下给出
在标准参数系下,随机序列的生成过程: 90
首先产生两个独立的随机变量V 和W ,其中V 均匀分布在区间 ( , )
2 2
π π− 之间,W 是满
足均值为 1 的指数分布的随机变量,可直接使用 MATLAB 编程中的函数 random()。
当 1α ≠ 时
1
2
2 21 tan
2
M
απαβ⎡ ⎤= +⎢ ⎥⎣ ⎦ ,
arctan( tan )
2N
παβ
α= − ,
1
1
sin( ( )) cos( ( ))( )
(cos )
V N V V NX M
WV
αα
α
α α −− − −=
95
当 1α = 时
- 4 -
中国科技论文在线
2
M π= ,
cos2 2( ) tan log( )
2
2
W V
X V V
V
π
π β β ππ β
⎡ ⎤⎢ ⎥= + −⎢ ⎥⎢ ⎥+⎣ ⎦
其中X 是服从 ( , ,1, 0)S α β 的随机变量,然后根据 alpha 稳定分布随机变量的性质可知,当
, 1
2 log , 1
X
Y
X
γ δ α
γ βγ γ δ απ
+ ≠⎧⎪= ⎨ + + =⎪⎩
100
Y 是服从 ( , , , )S α β γ δ 的随机变量。若想得到在其他参数系下的随机变量的产生,可以利
用参数之间的转换。
使用定量分析法,观察参数的取值对于随机序列的影响。随着α 值的由小变大直到
时,尖峰脉冲性逐渐减弱,可从纵坐标上的取值体现出来。当 0β < 时,序列的脉冲值均为
负向的;当 0β > 时,序列的脉冲值均为正向的。 105
在标准参数系下,产生 , 0,α β= = 1, 5γ δ= = 的服从 Alpha 稳定分布的随机序列,取
1000 个样本点。如图 1 所示:
图 1 (,0,1,5)S 的仿真
Fig. 1 stable random variables in , 0,α β= = 1, 5γ δ= = 110
3 Alpha 稳定分布的参数估计
Alpha 稳定分布下参数估计是本文的重点章节,参数估计也就是对于随机序列所服从的
分布模型的求解,在此使用两种方法进行参数估计,分别是基于样本分位数法和基于分数低
阶矩[6]的方法。在这两种方法实现的过程中都涉及到概率密度函数,所以在此先介绍概率密115
度函数的求解。
Alpha 稳定分布概率密度函数的计算
Alpha 稳定分布随机变量的概率密度函数,除了三个特殊的稳定分布(高斯分布、柯西分
布和列维分布)以外,都没有封闭的表达式,在此对于概率密度函数的计算采用近似估计。
而 Alpha 稳定分布概率密度函数的计算有直接数据积分法,快速傅立叶变换的数值计算方法120
(FFT)[7]等方法,由于直接数据积分法需要大量子积分计算,运算量较大,计算时间的开销
大;这里使用快速傅立叶变换的数值计算方法,这种算法计算有效,易于实现,且具有和直
- 5 -
中国科技论文在线
接数值积分法相似的精度。首先给出特征函数与概率密度函数之间的关系表达式
1( , , , , ) ( )
2
ixtf x t e dtα β γ δ ϕπ
∞ −
−∞= ∫
接着进行时域和频域的分别均匀采样,有如下 PDF 值的近似计算式 125
( ) ( )1 /2 2 1 /2
1
( ) ( )
N
i k N L n N
k n
n
f x t e πττ ϕ − − − − −⎡ ⎤⎡ ⎤⎣ ⎦⎣ ⎦
−
≈ ∑
设定 1L
N
τ = ,得到
( ) ( ) ( )( )1 2 1 2 1 1
1
( ) 1 1 ( )
N
k N n i n k N
k n
n
f x t e πτ ϕ− − − − − −
−
≈ − −∑
服从 ( , , , )S α β γ δ 分布的变量的 PDF 与标准α 稳定分布 ( , ,1, 0)S α β 的标准化 PDF 满足一定关
系式,然后先计算出 ( , , ,1, 0)f x α β ,再利用变换关系,计算出 ( , , , , )f x α β γ δ 。 130
图 2 ( , 0,1, 0)S α 的概率密度函数
Fig. 2 α -stable densities in 0, 1, 0β γ δ= = =
Alpha 稳定分布的参数估计 135
根据给出的 Alpha 稳定分布的特征函数,我们知道确定分布拖尾特性的参数
(0 2)α α< ≤ ,对称特性的参数 ( 1 1)β β− ≤ ≤ ,分散系数 (γ γ ≥0)和位置参数 Rδ δ∈( )四个参数一起决
定了 Alpha 稳定分布的特点。对于对称 Alpha 稳定分布 S Sα 来说,对称参数限定为 =0β ,因
此其特性完全由 , ,α γ δ来决定。由于 Alpha 稳定分布的概率密度函数形式不是闭合的,因此常
规的基于显示的密度函数的数学统计方法将不再适用。尽管如此,我们仍然可以采用数值计140
算的方法来估计稳定分布的参数。
基于样本分位数法
基于样本分位数法的实现是建立在分位数法和分位数表查找的基础上,在此使用
MATLAB 实现由 McCulloch[8]提出的方法。首先定义了独立于γ 和δ 的变量 vα , vβ 且
ˆ ˆ
ˆ
ˆ ˆ
x x
v
x xα
−= − 145
ˆ ˆ ˆ2ˆ
ˆ ˆ
x x x
v
x xβ
+ −= −
- 6 -
中国科技论文在线
vˆα 、 vˆβ 为 vα 、 vβ 的一致估计。
vα 和 vβ 是α 和 β 的函数,α 和 β 的估计值可通过查找分位数表得到。为了便于问题的
求解,在此引入一个新参数 c,且
1
c αγ= 150
利用 ˆ ˆˆc
x xv
c
−= ,通过查表可求解出γ 的估计值。
在此利用前面介绍的生成随机序列的方法,生成一组特定参数值的随机序列,再利用基
于样本分位数法,对于该组序列求解出参数估计值。通过前后的概率密度函数图像可以很好
的说明该种参数估计方法的准确性。
基于分数低阶矩的方法 155
1)基于负阶矩的方法
Ma 和 Nikias 提出了一种基于负阶矩理论的新的估计方法[9]。设 X 是一个 S Sα 随机变
量,则
( ) ( )- 2tan( 2)E E = , , ,0 min( ,1)
sin( )
P P pX X C p C p p
p
πα α αα πα− = < <
其中 ( , )C p α 在 Zolotarev 定理中定义。整理得到 160
sin( ) 2tan( 2) ,0 min( ,1)p p
p
p p
p p E X E X
π
πα απ π
α
−= < <
因此,α 通过 sinc函数值和 p阶, p− 阶矩的采样估计来求得,而γ 可根据 Zolotarev 定
理,通过 ( , )C p α 的表达式来求得。
2) LOG 方法
Ma 和 Nikias 还提出了一种基于分数低阶矩的对数估计方法,称为 LOG 方法。如果是165
一个 S Sα 随机变量,它的 p 阶矩满足 1E( ) ( , )p pX C p αα γ= 。我们定义一个新的随机变量
Y=ln X ,那么X 的 p阶矩 lnE( ) E( ) E( )p p X pYX e e= = ,化简得到Y 的一阶矩和二阶矩为
[ ] 1 1E Y ( 1) lneC γα α= − +
[ ] 22 21 1Y E (Y E(Y)) ( )6 2Var
π
α⎡ ⎤= − = +⎣ ⎦
然后利用一阶矩的方程式可以得到α 的估计值。将α 的估计值代入二阶矩的方程式,可以得170
到γ 的估计值。与sinc函数法相比,基于分数低阶矩的 LOG 方法具有闭合形式的计算公式,
因此较以前的几种方法性能上更为优越。与最大似然估计不同,稳定假设下,它们具有较好
的韧性;非稳定条件下,也能够正确估计分布的拖尾情况。
4 Alpha 稳定分布的应用研究
金融序列是一种典型的非高斯分布,查找出近 8 年内的上证指数和道琼斯工业指数的收175
盘价格,首先对于实际数据进行规格化处理,通常数据的处理存在四种方式:
1i i iy X X+= −
i iy X X= −
- 7 -
中国科技论文在线
1i i
i
i
X X
y
X
+ −=
1ln ii
i
X
y
X
+= 180
其中 1 2, , , nX X X" , Nn∈ 为实际数据, 1, 2, ,i n= " 。
鉴于数据的格式化处理的目的和 Alpha 稳定分布模型所对应的随机序列的分布情况,确
定使用方法四对上证指数(SZ)和道琼斯工业指数(DJI)的实际收盘价进行规格化处理,分别得
到一组金融时间序列。然后再分别利用基于样本分位数法和基于分数低阶矩法进行参数估
计,该组序列对于 Alpha 稳定分布模型所涉及的参数结果,如表 1 所示。图 3 显示出通过两185
种参数估计方法,对 SZ 的收盘价的时间序列分布进行的建模,两种方式产生的结果较一致。
便得到这两种指数的分布模型。
然后,同求解上证指数收盘价服从的模型的过程一样,求解道琼斯工业指数收盘价所服
从的模型,表 2 为 DJI 参数估计结果,图 4 表示了 DJI 所服从分布的概率密度函数图。
190
表 1 SZ 的参数估计值
Tab. 1 parameters estimation of SZ
Method alpha beta gamma delta
Percentile
FLOM
表 2 DJI的参数估计值
Tab. 2 parameters estimation of DJI 195
Method alpha beta gamma delta
Percentile
FLOM
图 3 SZ 所服从分布的 PDF
Fig. 3 Probability Distribution Function of SZ
- 8 -
中国科技论文在线
200
图 4 DJI所服从分布的 PDF
Fig. 4 Probability Distribution Function of DJI
5 结论
1)本文阐明了易于混淆的常见四种参数系之间的关系,以标准参数系为基准,给出了205
各参数系的统一描述。Alpha 稳定分布概率密度没有闭式的表达式,而在许多应用中又需要
用到概率密度的值,本文中实现了相比于直接数值积分法计算更有效,更易于实现的基于
FFT 计算理论概率密度的方法,并对分布中所涉及的参数使用基于样本分位数法和基于分
数低阶矩法进行估计。本文最后结合以上知识,对于包含稳定分布扰动的金融时间序列进行
分析,估计出每个序列所服从的分布。 210
2)估计 Alpha 稳定分布的四个参数时,无法满足在整个α 参数空间上获取满意估计的
问题。所给出的估计方法都不是动态的参数估计方法,在参数适用范围和估计精度方面还是
有局限的。
3)模型的 PDF 无闭式表达,且特征函数在 1, 0α β= ≠ 处间断,给实际的应用造成极
大的不便,因此仍有许多领域值得进一步探索。 215
[参考文献] (References)
[1] . BELOV. On the computation of the probability density function of alpha-stable distributions Mathematical
Modelling and Analysis[A]. of the 10th International Conference [C]. 2005: 333-341.
[2] . Parameterizations and modes of stable distributions[J]. Statistics&ProbabilityLetters, 1998, 38: 220
187-195.
[3] R. Weron. Performance of the estimators of stable law parameters[R]. Wroclaw University of Technology,
1991: 1-17.
[4] . One-dimensional Stable Distributions[M]. Providence: , 1983.
[5] . On the Chambers-Mallows-Stuck method for simulating skewed stable random variables[J]. 225
Statistics & Probability Letters. 1996, 28: 165-171.
[6] 贾丹,邱天爽,郝建军. 非高斯 Alpha 稳定分布环境下自适应算法研究[J]. 北京邮电大学, 2007: 11-53.
[7] , . Computing the Probability Density Function of the Stable Paretian Distribution[J].
Mathematical and Computer Modelling, 1999, 29: 235-240.
[8] . McCulloCh. Simple consistent estimators of stable distribution parameter[J]. Statist Simula, 230
1986, 15: 1109-1136.
[9] , , Parameter estimation and blind channel identification in impulsive signal environments[J].
IEEE Trans. Signal Processing, 1995, 12: 2884-2897.