ISSN 1OO9—3044
Computer Knowledge and Technology电脑知识与技术
Vo1.9,No.16,June 2013.
E-mail:eduf@dnzs.net.cn
http://www.dnzs.net.cn
Tel:+86—55 1—65690963 65690964
基于零树编码的票据图像压缩编码算法
赵法林,李飞,鲍旭东
(~N3v@ 影像科学与技术实验室,江苏 南京 210096)
摘要:票据图像是一种广泛应用于人们生活及工作的图像 ,由于票据 图像 中主要包含文字、数字及线条等信息,其细节和
边缘信息极其重要。一般的压缩方法,如JPEG压缩,已经不适用于票据图像的压缩,会造成边缘细节信息的损失。因此
针对票据图像的特殊性,经过颜色聚类和多分辨率分解后,应用改进的零树编码进行压缩编码。实验结果表明,该文方法
比IPEG压缩标准具有更高的压缩比和更好的图像阅读质量。
关键词:票据图像;多分辨率分解;零树编码;JPEG压缩标准;边缘细节信息
中图分类号:TP18 文献标识码:A 文章编号:1009—3044(2O13)16—3856—03
A Compression Coding Algorithm Based on Zerotrees Coding for Bill Image
ZHAO Fa—lin,LI Fei,BAO Xu—dong
(Lab ofImage Science and Technology,Southeast University,Nanjing 210096,China)
Abstract:The bill image is an image that is widely used in human life and work.Because there is important information in bill
image such as words,numbers,and lines,the detail and edge information is extremely important for bill image.General compres—
sion methods,such as JPEG compression standard,don’t apply to compress bill image,which can cause loss of detail and edge in—
formation.According to the particularity of bill image,the proposed method applies to compress bill image.Firstly,the color clus-
tering method and multiresolution decomposition classify bill image to the pyramid structure.And the improved zerotrees coding
is used to compress the pyramid structure.The results demonstrated much higher compression rates and better reading quality of
the proposed method than ofJPEG compression standard.
Key words:bill image;multiresolution decomposition;zerotrees coding;JPEG compression standard;edge and retail information
票据图像作为人们生活和工作中广泛应用的图像,在许多多媒体系统中都需要存储和传输的,例如医院信息系统和电子金融
管理系统。长期以来,数字图像压缩编码技术主要采用JPEG压缩标准m来进行压缩。对于一般的自然图像来说,JPEG压缩标准在
保证图像质量的前提下具有较高的压缩比。但是对于JPEG压缩标准中主要利用离散余弦变换DCT(Discrete Cosine Transform,
DCT)技术完成图像的变换编码,然而经过DCT处理的图像编码在大的压缩比下存在着严重的块状效应,这非常不利于票据图像的
压缩及存储。因为票据图像中包含了丰富的边缘细节仁 急,这些都是票据图像中的重要信息,需要完整的保留下来。所以出现了
一 些基于二值化分割算法来获得高的压缩比 ,但是这些方法不仅要面对图像分割的挑战,而且有时对图像重要的信息在压缩以
后 已经丢失了。
为此,该文通过对Shapiro提出的嵌入式零树小波编码算法EZW(Embedded Zerotree Wavelet,EZW) 分析的基础上,实现了针对
票据图像的零树编码,并进行了仿真试验,仿真结果与JPEG压缩标准作了比较,在大的压缩比下,票据图像的边缘细节信息得以
保留,保证了阅读质量。
1算法设计
本文方法是是针对票据图像进行压缩编码,票据图像与普通自然图像有着明显的区别,因此首先要了解票据图像有如下特
点 :
1)票据图像颜色单一,从视觉效果上,一幅票据图像有4—5种颜色就可以显示整幅图像的信息。
2)票据图像在一个小区域内像素颜色一致(不包括背景颜色)。
3)票据图像存在着大面积的背景区域。
根据票据图像特点(1)和(2),可以将票据图像进行颜色聚类,得到调色板和颜色位图。每幅颜色位图代表调色板中的一种颜
色,而颜色位图可以用一幅二值图像来表示,黑色代表背景,白色代表前景,即前景信息就是原始图像中代表该颜色的信息。根据
特点(3),可以判断出每幅位图中都包含大面积的背景区域,对每幅颜色位图进行二值图像的多分辨率分解得到金字塔结构图,在
收稿 日期 :2013—04—25
作者简介:赵法林(1987~),男,河南焦作人,硕士,主要研究方向图像压缩编码。
3856一 人工智能及识别技术 * 本栏目责任编辑:唐一东
第9卷第16D] (2013年O6月) Computer Knowledge and Technology电脑知识与技术
分析EZW算法的基础上对每幅位图的金字塔结构图进行改进的零树编码。在解码端,根据解码得到的金字塔结构图,重构颜色位
图,根据对应调色板的颜色得到解压缩的图像。
1.1颜色位图的多分辨率分解
对于原始的颜色位图,它是一幅二值图像,将图像中的像素点分为2x2像素的方块,并按图1所示规则 进行分解,得到原始二
值图像的低频子图。
j 竣 0力搜 混台乃 块
母 一 母~ 匮卜。
图1 二值图像多分辨率分解规则
其中。 (f=1,2 4)不全为0或者不全为 l。将得到的低频子图按图2所示规则映射到原图尺寸大小。
匈 。
图2 低频子图映射到原图大小规则
将映射得到图像与原始位图相减得到残差图,即高频子图。此时低频子图与高频子图就构成r一个金字塔结构图。对于低
频子图再进行几次上述算法处理 ,便得到了原始位图的金字塔结构图。
1.2改进的零树编码
EZW方法是基于小波变换之后进行编码的,经过小波变换后的图像具有多分辨特性,EZW算法就是利用不同分辨率子带中同
一 空间位置的数据构成一棵树,利用树中的低频数据的幅度值大、高频数据的幅度值小的特点,生成零树,从而达到压缩的目的。
原始位图经过多分辨率分解后的金字塔结构图,在不同分辨率层级中同一空间位置的数据具有相关性。以图3所示的金字塔
结构图为例,将金字塔结构中最低分辨率层级中的每个像素点作为“父亲”,那么该分辨率层级上每个像素点都有4个“儿子”存在
于下一分辨率层级,在最高分辨率层级中有16个“孙子”。根据原始位图多分辨分解算法,可以得知其金字塔结构图中不同分辨率
层级中同一空间位置的数据有如下特点 :
1)每个分辨率层级中的⋯1’,其子孙后代全为0;
2)每个分辨率层级中的⋯0’,其子孙后代中可能全为0或者含有 1。
图3 金字塔结构图像素点之间的关系
EZW算法中从最低分辨率的系数开始扫描,判断扫描到的系数是否为“正显著系数”、“负显著系数”、“零树跟”和“孤立零点”,
然后进行编码输出。因此,根据EZW的编码思想及上述特点,改进的零树编码算法如下:
1)扫描整个金字塔结构图,按照自上至下,自左至右的顺序扫描 ;
2)若扫描到⋯l’,则认为该点为正的零树跟,标记其子孙节点都无需扫描编码,将该点编码为⋯P’;
3)若扫描到⋯0’,判断其子孙节点是否全为0。
①若其子孙节点全为0,则认为该点为负的零树跟,标记其子孙节点都无需扫描编码,将该点编码为⋯t’;
②若其子孙节点有1,则认为该点为孤立零点,编码为⋯z’。
2实验验证
为了检验本文对于票据图像的压缩编码算法,本小节对票据图像分别进行了本文的压缩编码算法和JPEG压缩编码,并给出
实验结果对比。为了验证本文算法的有效性,同日寸给出了二者之间峰值信噪比、视觉效果和细节保留的对比。
图4为原始票据图像,图5为JPEG压缩后的图像,图6为本文方法压缩后的图像。实验表明,JPEG压缩标准的压缩比已经达
不到本文方法的压缩比了。如表1所示,JPEG压缩能够达到的最大压缩比为113:1,而本文的方法已经达到了137:1,而且在峰值信
噪比上本文方法也要高于JPEG压缩。从阅读质量上来看,经过本文压缩方法后的解码图像能够更好有利于从图像中获取信息,
JPEG压缩后的图像已经产生了明显的块状效应,造成图像模糊。图7中自上而下为原图像细节、JPEG压缩后细节和本文方法压
缩后细节,可以看到本文方法保留了更多的票据图像的边缘细节信息,保证了票据图像的信息传达。
本栏目责任编辑:唐一东 人工留能及识别技术 一 3857