摘 要: 在提升小波的基础上,对感兴趣区域(ROI)进行Huffman无损压缩,对背景区域(BG)进行嵌入式零树(EZW)图像压缩编码。实验证明,在感兴趣区域占整幅图像大小10%左右时,该方法能够解决图像压缩比和重构图像质量之间的矛盾。
关键词: 视频监控;感兴趣区域;提升小波变换;图像编码;无损编码
社会治安视频监控系统是一个覆盖整个城市的多功能、集成式、综合性大型监控报警系统,在犯罪预防和案件侦破方面发挥了巨大作用。基于此,社会治安视频监控系统更关注敏感目标和敏感区域,对人脸、车牌、重点保护对象和区域、禁区、运动目标、可疑目标等的清晰度要求更高。这要求视频编解码算法能够区分前景和背景,或者可以区分重点区域和非重点区域,可以进行动态码率调整,从而获得敏感区域和目标的高清晰度和高辨识率。可以把关注目标和敏感区域统称为感兴趣区域ROI(Region Of Interest)或者前景,如监控场景中的人、车、重要目标等,研究ROI和背景区域不同的图像编码控制,可以在网络带宽有限的情况下对监控关注目标对象的ROI进行无损压缩、对不敏感对象(即背景图像)进行有损压缩分配相对少的码流[1],从而实现优先保证ROI图像质量和清晰度,提供更符合监控需要的高质量视频编码图像,提高监控系统整体性能。
1 嵌入式零树图像编码
嵌入式零树小波编码(EZW)算法很好地利用了小波系数的特性,使得输出的码流具有嵌入特性[2],其本质是对原图像的小波域的小波系数进行量化和编码,该算法在既保证高压缩比的同时又保证了重建图像质量。EZW编码方法是对整幅图像进行同一级别编码的方法,图像中的ROI与背景区域具有同样的编码级数。要实现ROI图像高清晰度和高辨识率,可以通过提升 ROI部分的小波系数或者阈值,使得ROI部分和背景区域有着不同的编码级别。对于敏感度低的背景图像可以只保留大的小波系数实现高压缩比。
对于ROI,通常采用无损压缩算法进行编码。传统的小波变换会将像素的整数值变为实数值[3],在存储时再将实数值取整[4],因此会导致图像失真。基于提升方案的第二代小波变换通过剖分、预测和更新,可以实现ROI无损图像压缩编码。基于ROI的图像近无损压缩编码的具体过程如下。
(1)ROI生成:通过自动或人工的方法找出ROI(如人脸、车辆等),生成空间域ROI模板。
(2)RIO模板的生成:对图像进行整数5/3小波变换得到ROI模板。
(3)无损压缩编码:利用小波域ROI模板的形状和位置信息,对ROI模板的变换系数进行无损编码,具体可以采用Haffuman等无损编码方法。
(4)背景区域有损压缩:对剩下的背景图像采用EZW进行编码压缩。
(5)合成解码:将两部分压缩码流合成后解码,得到完整的解压图像。编码基本原理如图1所示。
2 ROI无损压缩编码
典型的无损压缩编码方法有基于统计概率的方法和基于字典的技术[5]。Huffman编码和算术编码(Arithmetic Coding)是统计编码方法中最常用的两种编码。Huffman编码根据字符出现概率来构造异字头的平均长度[6],通常被评为最佳编码。本文对ROI采用Huffman无损编码,实验证明此算法解码的图像清晰度极好。
3 实验结果和结论
对上述算法在MATLAB 7.8.0(R2009a)上进行测试,测试程序采用VC++和MATLAB结合编程,主框架程序采用MATLAB实现[7],改进EZW编码部分采用VC++实现,采用像素为512×512的Elizabeth Taylor(gray).bmp图像作为实验图像。
首先选取人物右眼作为ROI,即保持人物右眼区域完全不失真进行Haffuman无损图像压缩[8],分别选取0.125 b/s、0.25 b/s和0.5 b/s不同的码率,实验结果如图2所示,压缩结果数据比较如表1所示。
从表1的实验数据可以看出,压缩比的大小取决于背景图像,而ROI是基于无损压缩编码,得到的图像质量与原始图像基本一样。
在Elizabeth Taylor(gray).bmp图像上分别选取不同的ROI:从1%、3%、7%、11%、35%、70%到100%,码率分别从0.1 b/s~1.0 b/s进行压缩和解压,其中,水平坐标表示压缩比,垂直坐标表示信噪比,ROI(x%)表示感兴趣区域的面积和整幅图像的比值,得到的实验结果如图3所示。
从图3可以看出,当ROI的面积小于图像面积35%时,解压图像的PSNR值的动态范围基本相等,而ROI的面积越大,得到压缩比的动态范围越小。同时经过大量实验数据可得:当ROI占整幅图像面积不超过10%时,上述编码方法较为实用,在获得高质量解压图像的同时,也可以实现较大的图像压缩比。
4 视频监控图像压缩编码实例分析
视频监控图像的重点在于流动的车辆以及活动人员的监控,其中流动车辆监控要能实现事后从现场视频监控图像中提取有价值的信息,比如车辆外形的识别,车辆牌照的准确读取等;而活动人员的监控重点应在人员体貌特征的识别以及进而对面部特征的辨认上。下面就结合实际公安工作中的要求对本文所研究的视频监控图像压缩编码算法进行实例分析。
选取3幅典型社会治安视频监控图像:车牌照识别图像、车辆外形识别图像和可疑人员面部识别图像。分别对3幅原始bmp图像进行压缩,其中全视频图像采用有损压缩编码算法,视频图像ROI采用无损压缩编码算法,背景区域采用有损压缩编码算法。原始图像、解压图像分别如图4所示。
从图4可以看出,本文研究的视频监控图像压缩编码算法可以保证对实例中图像ROI,即图中圈出的汽车牌照区域、黑色轿车区域、人员面部区域进行无损压缩,对背景区域进行有损压缩,从而达到了在保证视频图像较高压缩比和传输效率的同时,准确读取解压图像中车辆牌照信息、识别车辆外形、识别可疑人员面部信息的目的。
针对以上3个实例, 分别就每幅原始视频图像采用不同码率(分别为0.125 b/s、0.25 b/s、0.5 b/s)进行有损压缩,并对采用该压缩编码算法的视频图像背景区域采用相同码率进行有损压缩对比,实验数据如表2所示。
由表2可知,同一实例中随着视频图像压缩码率的减小,图像压缩比的差距会增大;针对同一码率,不同实例中图像压缩比的差距会随着原始图像像素的减少而增大,但是在正常视频图像的要求范围内,图像压缩比的差距均能控制在合理范围内。
通过列举典型视频监控图像的压缩编码,针对视频监控图像中不同重点区域分别进行了对比压缩和图像解压分析可知,视频监控图像ROI压缩编码算法可以准确提取监控图像中ROI的关键信息。
针对不同场合的视频监控图像,在保证其关键信息所在的ROI采用不失真的无损压缩的前提下,可以对其背景区域选择压缩比进行不同程度的压缩,进而实现整幅图像的较大压缩比和较高的传输效率,进而有效地解决视频监控图像中获取清晰图像的同时节约存储空间、实现高效传输的矛盾[9]。
参考文献
[1] 肖德琴,冯健昭,张焕国.基于椭圆曲线的JPEG2000图像信息隐藏方案研究与设计[J].计算机工程与应用,2005,41(20):142-145.
[2] 李振伟,何继善,刘兵全,等.小波图像压缩进展[J].微机发展,2004,14(6):29-32.
[3] 陈晓雷,马义德.一种感兴趣区图像压缩编码算法[J]. 计算机工程与应用,2007,43(32):69-71.
[4] 唐良瑞,蔡安妮,孙景鳌.一种基于整数小波变换的图像无损压缩方法[J].计算机工程与应用,2002,38(23):54-56.
[5] 魏琳.基于感兴趣区域(ROI)图像的压缩编码研究[D].重庆:重庆大学,2007.
[6] 许冰. 数字图像处理在电厂火焰检测中的应用[D].北京:华北电力大学,2003.
[7] 闫红梅, 李科,吴冬梅.SPIHT的超光谱图像无损压缩算法[J].西安科技大学学报,2009,29(5):598-602.
[8] 杨先花,黎粤华.基于Matlab图像边缘检测算法效果对比[J].机电产品开发与创新, 2010,23(2):129-131.
[9] 徐震寰, 林茂松, 张红英.基于小波域学习的单幅图像超分辨率复原[J].微型机与应用,2013,32(18):41-46.