- 1 -
中国科技论文在线
一种基于方差加权信息熵和马尔可夫随机
场的红外目标分割算法#
李映,毛星锦,胡杰*
基金项目:国家自然科学基金(60873086);教育部博士点基金(20070699013);西北工业大学基础研究
基金(JC200942);航天支撑技术基金
作者简介:李映(1969年——),女,教授,主要研究方向:图像处理和模式识别
(西北工业大学计算机学院,西安 710129)
摘要:本文提出了一种快速准确的红外目标分割算法。该算法首先基于方差加权信息熵对红
外图像进行包含目标在内的感兴趣区域提取,然后在感兴趣区域内利用高斯马尔可夫随机场
进行建模,把图像分割问题表示为能量函数最小化问题,并采用利用迭代条件模型进行优化
得到(准)最优的分割结果。这种由粗到精的分割方法,由于在很大程度上减少了背景和噪
声的干扰以及大大缩小了搜索空间,因此对低信噪比和复杂背景下的红外目标不但分割速度
快,而且分割精度高。实验结果验证了该方法的有效性和鲁棒性。
关键词: 计算机应用技术;分割;方差加权信息熵;高斯马尔可夫随机场
中图分类号:TP391
A Segmentation Approach for Infrared Target Based on
Variance Weighted Information Entropy and Markov
Random Field
LI Ying, MAO Xingjin, HU Jie
(School of Computer Science, Northwestern Polytechnical University, Xi’an 710129)
Abstract: A fast and accurate segmentation approach for infrared targets is proposed in this paper. The
region of interests (ROIs) which contains the entire target is firstly detected based on the variance
weighted information entropy. Then the image in the ROI is modeled by the Gaussian Markov random
field. Thus the segmentation problem is expressed by the energy function minimization, and the
iterative conditional model is used to find the near optimal segmented result. This coarse-to-fine
segmentation method can reduce the interference of the background and the noise in a large degree, and
decrease the search space greatly. So for the infrared images under complex background and low
signal-to-noise, the proposed method not only has fast segmentation speed, but also obtains the
accurate segmentation results. The experiments demonstrate its effectiveness and robustness.
Key words: Computer Application Technology; Infrared target segmentation; Variance weighted
information entropy; Gaussian Markov random field
0 引言
图像目标分割是图像分析以及模式识别的关键技术,也是目标识别、跟踪以及其它计算
机视觉相关应用的基础,其最终目的是为后续的处理和场景描述提供基础。红外图像反映目
标及周围背景的温度分布情况,但是由于探测器本身的固有的特性及外界成像环境的影响,
导致红外图像 SNR(信噪比)较低,呈现出目标与背景对比度较差、目标的边缘模糊、噪
声较大等特点。基于阈值的分割方法在红外图像分割中被广泛应用,例如:一维 Otsu[1]、二
维 Otsu[2]、二维最大熵法[3]等。但阈值分割方法对于低信噪比和复杂背景下的红外目标分割
精度较差。
- 2 -
中国科技论文在线
在过去二十多年间,马尔可夫随机场(Markov Random Field, MRF)逐渐发展成为图像分割
的有力工具,它可以捕获图像中像素间的相互作用和约束,并能将上下文信息引入到图像的
分割过程,对噪声具有较强的抑制能力,但其具有分割速度慢等缺点。
为了能尽量减少背景和噪声的干扰,缩小解空间,提高分割的准确性和快速性,本文提出
了一种基于方差加权信息熵[4] (variance weighted information entropy)和高斯马尔可夫随机场
(Gaussian MRF, GMRF) [5]的红外目标分割算法,首先利用方差加权信息熵进行粗分割,得到
包含目标在内的感兴趣区域(region of interest, ROI),然后在 ROI内利用 GMRF进行建模,
即进行精分割以得到最终的分割结果。与在整幅图像利用 GMRF 相比,本文方法克服了其
分割速度慢的缺点,同时减少了噪声和背景干扰,准确性也得到了提高。
1 基于方差加权信息熵的 ROI提取
方差加权信息熵是一种简单而有效的红外背景复杂程度的定量描述指标[4]。设 s表示灰
度值, [0,255]s∈ , sp 表示为灰度值 s出现的频率,s表示红外图像的整体像素灰度平均值,
则红外图像的方差加权信息熵可定义为[4]:
255
2
0
( ) - ( - ) * *log( )
0 , *log( ) 0
s s
S
s s s
H s s s p p
p p p
=
=
= =
∑
当 时 令
(1)
根据公式可知,目标边界区域的熵值一定大于背景区域。基于这点,我们可以把图像分
成一定区域大小的块,然后根据熵值的大小来判断种子块,最后在熵图像上利用区域增长获
取 ROI,其具体步骤如下:
(1) 图像分块。把尺寸为M N× 的红外图像 I 平分为大小为m n× 的若干子图像
( , )F u v ,其中 0 ( / 1)u M m≤ ≤ − , 0 ( / 1)v N n≤ ≤ − , 2 , 2k lm n= = ,
, 1, 2,3,...k l = 。
(2) 计算熵值。对每幅子图像 ( , )F u v ,利用公式 (1)计算方差加权信息熵值
( , )H u v ,得到大小为 /( 1) /( 1)M m N n− × − 的熵图像,并计算熵图像的均值
µ和方差σ 。
(3) 获取种子。假设熵图像上最大的熵值为 ( , )H u v ,如果 ( , ) TH u v H≥ ,其中
*TH µ α σ= + (这里α 取 6),则 ( , )F u v 即为种子。如果 ( , ) TH u v H< ,则
取 / 2m m= , / 2n n= ,重复步骤 (1)、 (2),直到熵图像的最大值满足
( , ) TH u v H≥ 或 2m = 或 2n = 。
(4) 提取 ROI。在熵图像上,结合种子子图像利用四邻域进行区域增长,增长结果
是包含目标的矩形区域。
图 1是利用上述算法得到的 ROI提取结果,可以看到目标都完整地包含在 ROI内,
从而得到红外目标的粗分割。
- 3 -
中国科技论文在线
图 1 原始红外图像和 ROI提取结果
2 基于 GMRF的红外目标分割
MAP-MRF分割框架
假设 S代表二维网格,即 { ( , ) |1 ,1 }S s i j i M j N= = ≤ ≤ ≤ ≤ ,其中 ,M N 分别是图像 I 的高
和宽。X 和Y 是定义在 S上关于邻域系统η的马尔可夫随机场,它们具有正定性和马尔可夫
性。假设观测图像为 y,它可以看成是随机场 Y 的一个实现,将理想图像建模为马尔可夫
随机场 X ,它的实现 x代表一种分割配置。图像分割任务可以看成是通过观测场 Y的一个
实现 y估计理想场 X的一个实现,即得到一个分割场 x。在 Bayes框架下该后验概率可以表
示为,
( | ) ( )( | )
( )
P Y y X x P X xP X x Y y
P Y y
= = ∗ == = = = (2)
在给定观测图像的条件下, ( )P Y y= 是常数, ( | )P Y y X x= = 是条件概率,它体现了分割
过程中的特征模型成分; ( )P X x= 描述了分割结果标记的分布,它体现了分割过程中的区域
标记成分。
对于马尔可夫场 X ,在 Hammersley-Clifford定理[6]的保证下,可以通过定义 Gibbs分布
中势能函数来确定其分布 ( )P X x= ,大多数基于 MRF 的分割模型都利用多层逻辑模型
(multi-level logistic, MLL)来定义势能函数,对于一般的分割任务来说,仅定义二阶双点基团
的势能[7]而将其余二阶基团的势能都定义为 0:
( ) [ ( , )]
s
R s t
s t N
E x x xβ δ
∈
= ∑ ∑ (3)
上式中,如果 s tx x= ,则 ( , ) 1s tx xδ = − ;如果 s tx x≠ ,则 ( , ) 1s tx xδ = ; β是预定义的常量。于是
Gibbs分布函数表示为:
1 1( ) exp( ( ))
Z R
P X x E x
T
= = − (4)
其中 1exp[ ( )]RxZ E xT∈Ω= −∑ 是划分函数,T 是温度参数。
GMRF模型假设图像中各点特征服从独立的高斯分布[5],其条件分布表示为,
2
2
( )1( | ) exp[ ]
22
s m
s mm
yP Y y X x µσπσ
−= = = −∏ (5)
其中 mµ , mσ 分别代表第m类的均值和标准差,可通过 EM算法估计如下[8]:
- 4 -
中国科技论文在线
1
1
1
1 *
t
mN
t
m it
im
y
N
µ + +
=
= ∑ (6)
1 1 2
1
1
1 * ( )
t
mN
t t
m i mt
im
y
N
σ µ+ ++
=
= −∑ (7)
对公式(5)取对数,表示成能量形式:
2
2
( )[ ln( 2 )]
2
s m
mF
s m
yE µ πσσ
−= +∑
(8)
对公式(2),其能量形式可表示为:
*R FE E W E= + (9)
其中 FE 表示能量中的特征成分,而 RE 表示能量中的区域标记成分,W 可以决定 rE 和 fE 在
后验能量上的权重。
由前述可知,分割的目标函数是后验概率,则在最大后验概率(MAP)准则下,最优
的分割结果可以通过最大化后验概率来取得,可以表示为:
� arg max( ( | ))
arg min
x P X x Y y
E
= = =
∝ (10)
文献[5]分析了能量函数中加权系数对分割结果的影响:区域标记成分对分割过程施加
同质限制,而特征模型成分则使得分割结果和观测数据保持一致。当能量函数中双成分间的
加权系数过大时,最终的分割结果将会忽略一些空间约束信息;当加权系数过小时,最终的
分割将偏离实际的观测数据;即使在某一迭代时刻加权系数是合适的,随着迭代的进行,这
个系数也将变得不再合适,所有这些情况都会导致分割结果的不精确。为了解决这个问题,
Deng等人[5]提出了一种新的权值参数形式:
1* 2tW c cα= + (11)
其中 t表示迭代步数,α表示下降系数。从公式(11)可以看出,在迭代的初始阶段特征成分
占据主导以获取图像中的特征信息,而随着迭代步数的增加区域标记成分将和特征成分相互
作用以改进分割结果。
基于 GMRF的红外目标快速提取和算法流程
在得到 ROI以后,我们直接在 ROI内利用 GMRF进行建模。由公式(10)可知,图像
分割问题已经被转化为求解能量函数最小的问题,即表示为一个组合优化问题,因此经 ROI
提取后,其搜索空间被大大减少。解决此类组合优化问题的常用算法有模拟退火(Simulated
Annealing, SA)算法[9]和迭代条件模型 (Iterated Condition Mode, ICM)法[10]。模拟退火算法是
一种随机松弛算法,在理论上可以达到全局最优解,然而该算法收敛速度较慢,限制了其在
实际中的应用。本文中提出的快速分割算法则采用了在实际中常用的 ICM 法,该方法能较
快地收敛到准最优解。
在利用 ICM迭代优化的时候,采用如下的权值修正方案:
800* 1tW = + (12)
其中 t表示迭代步数。由式 (12)得出,随着迭代步数的增加,特征成分的方差加权逐渐减小,
在已经充分利用像素特征信息的基础上,空间约束信息越来越占主导,从而可以充分考虑上
- 5 -
中国科技论文在线
下文信息。
综上,本文提出的基于方差加权信息熵和 GMRF的红外目标分割算法的主要步骤如下,
图 2给出了相应的流程图:
1) 对红外图像进行基于方差加权信息熵的 ROI提取,获取包含目标的矩形区域;
2) 在 ROI内部,利用 GMRF对红外图像进行建模;
3) 在随机初始分割的基础上利用 ICM算法对分割结果进行更新,在迭代过程中利用公
式(12)进行权值更新;
4) 如果达到收敛条件则输出最终的分割图像,否则继续第(3)步迭代。
图 2 红外目标分割的流程图
3 实验结果及分析
为了验证本文方法(简称为 ROI-GMRF)的有效性,我们对多幅红外图像进行了实验,
并与二维 Otsu和整幅图使用 GMRF的分割方法进行比较。为了公平起见,在应用二维 Otsu
对图像进行分割的时候,同样采取在 ROI内部进行。所有的实验都在 Pentium4 ,512M
RAM和 编程环境的 PC机上运行。
图 3给出了几种方法的分割结果,表 1给出了 GMRF和 ROI-GMRF在分割时间上的比
较。由表 1和图 3可以看出,本文方法不但分割速度大大提高,而且在分割效果上也较前几
种方法较好,特别是在低信噪比和低对比度以及复杂背景的情况下仍能对红外目标进行准确
的分割。
a1 a2 a3 a4
- 6 -
中国科技论文在线
b1 b2 b3 b4
c1 c2 c3 c4
d1 d2 d3 d4
图 3 不同方法对红外图像方法的分割结果
a1、a2、a3、a4表示原始的红外图像和 ROI结果图;b1、b2、b3、b4表示二维 Otsu分割结果图;c1、c2、
c3、c4表示 GMRF分割结果图;d1、d2、d3、d4表示 ROI-GMRF分割结果图。
表 1 GMRF和 ROI-GMRF的分割时间对比(时间:s)
方法 红外图像 a1 a2 a3 a4
GMRF
ROI-GMRF
4 结论
本文基于方差加权信息熵和高斯马尔科夫随机场,提出了一种由粗到精的红外目标分割
算法。该算法首先利用方差加权信息熵提取包含目标在内的感兴趣区域,然后在感兴趣区域
内利用高斯马尔科夫随机场对红外图像建模来捕捉上下文信息,并利用迭代条件模型进行迭
代优化,使得搜索空间大大减小,从而使迭代优化的步数减少,故分割速度大大提高,同时
在很大程度上也降低了背景和噪声的干扰,使分割精度有明显的改善。
- 7 -
中国科技论文在线
[参考文献] (References)
[1] SHEN jian-hua,LIU shang-qian,MA yan-xuan. Fast infrared image segmentation algorithm[J]. Journal of
Infrared and Millimeter Waves (申建华,刘上乾,麻彦轩. 快速的红外图像分割算法[J]. 红外与毫米波学
报), 2005, 24(3): 224~226.
[2] CHEN Xiu-Qiao , HU Yi-Hua, HUANG You-Rui. Image thresholding segmentation based on
two-dimensional MCC[J] . J. Infrared Millim. Waves (陈修桥,胡以华,黄友锐. 基于二维最大相关
准则的图像阈值分割. 红外与毫米波学报, 2005, 24(5): 397—400.
[3] DU Feng,SHI Wen-Kang,DENG Yong,et al. Fast infrared image segmentation method[J] . Journal of
Infrared and Millimeter Waves(杜峰,施文康,邓勇,等. 一种快速红外图像分割方法. 红外与毫米波
学报),2005, 24(5):370—373.
[4] Yang, L., Zhou, Y., Yang, J., et al. Variance WIE based infrared images processing[J]. Electron. Lett., 2006,
42, (15): 857–859.
[5] Deng ., Clausi . Unsupervised image segmentation using a simple MRF model with a new
implementation scheme[J]. Pattern Recognition, 2004, 37(12): 2323-2335.
[6] Li . Markov random field modeling in computer vision[M].Tokyo,Japan: Springer-Verlag, 1995.
[7] S. Geman and D. Geman. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of
images[J].IEEE Trans. Pattern Anal. Machine Intell., 1984, 6(6):721–741.
[8] A. P. Dempster, N. M. Laird, D. B. Rubin. Maximumlikelihood from incomplete data via the EM
algorithm[J]. Journal of the Royal Statistical Society. 1977, Soc., B-1:1–38.
[9] Metopolis N. Equations of state calculations by fast computational machine[J]. Journal of Chemical
Phusics,1953,21:1087-1097.
[10] Besag J. On the statistical analysis of dirty pictures[J]. Journal of the Royal Statistical Society,1986, series
B,48:259-302.