文献标识码: A
文章编号: 0258-7998(2014)11-0120-03
0 引言
传统的昆虫识别主要是通过专家观察昆虫的外部特征并与标准的样本进行鉴别,工作量大。为科学准确地识别害虫与预防虫害,利用计算机模式识别可有效地管理昆虫图像数据库。基于内容的图像检索自动提取昆虫的底层与高层特征,匹配视觉特征,将相似性较大的图像反馈给用户,不仅较少了工作量,且提高了检索精度。
颜色特征作为重要的图像视觉特征之一,其不受图像的尺寸、平移、旋转的影响。提取颜色特征的方法相对容易,研究者提出了基于颜色特征的诸多算法[1],如颜色直方图、颜色矩、颜色熵、颜色聚合向量、颜色相关图等。颜色特征检索方法只是基于内容图像检索的一种方法, 在实际应用中应与其他特征检索方法相结合, 检索效果会更佳[2]。纹理特征是图像另一个重要特征,不仅体现了灰度值间的相互关系,而且反映出纹理变化规律的周期性,成为分析图像特征的重要方法。单一特征片面地描述图像信息,丢失了图像的部分信息,检索通用性差,检索效果不好[3]。采用综合特征提取图像视觉特征,可有效地改善检索效果,更加符合人的视觉要求。本文首先实现了颜色特征和纹理特征的SVM图像检索仿真,在此基础上结合图像分块,实现三者结合的SVM图像检索仿真。
1 算法描述
1.1 颜色矩
颜色矩于1995年被Stricker和Orengo提出,是一种简单且有效的图像颜色特征描述方法。图像的颜色分布信息主要集中在低阶矩中,采用颜色直方图的一阶矩、二阶中心矩和三阶中心矩就可以表达图像的颜色特征[4]。
其中,hij表示第i个颜色通道分量中灰度为j的像素出现的概率,n表示灰度级。
1.2 灰度共生矩阵
灰度共生矩阵方法是公认的有效方法,具有较强的适应能力和鲁棒性[5]。
假设f(x,y)为一幅灰度图像,对图像中任一区域R,定义S为区域中具有特定空间联系的像素对的集合,则灰度共生矩阵可表示为:
其中,为图像任意一点与其他相邻点的偏离方向,d为偏离距离。在实际应用中,为减小计算量,需对式(4)进行归一化,即式(5)所示:
为减少θ的方向数,通常计算4个方向的灰度共生矩阵,即θ取值为0°、45°、90°、135°。根据在共生矩阵基础上提取的数字统计量,取主要5种描述纹理统计量,分别为能量、相关性、熵、对比度和逆差矩。
1.3 SVM
SVM(支持向量机)建立在统计学习和VC维理论的基础上[6],在解决小样本问题中存在特有的优势,其主要思想是构造一个使分类间隔最大的超平面,使得离分类超平面最近的样本点间的间隔最大,从而控制VC维大小,降低了机器学习的复杂度。在训练小样本情况下,不需要特定问题的先验知识,可以很好地控制学习机器的推广能力,因而在图像检索中可以有效地改善检索结果[7]。
SVM解决分类问题,使得一些在低维特征空间不可分问题在高维空间变得可分。SVM分类器主要受两个关键因素的影响:其一,误差惩罚参数C;其二,核函数形式及其参数设置[8]。选择不同的核函数以及相同核函数设置不同参数对其分类性能均有影响。这里借用MATLAB自带的Libsvm软件包,构造训练模型,实现图像样本预测。LIBSVM中最重要的是核函数及其相关参数的选取。常用的核函数有线性核、多项式核和RBF核。一般选择RBF核及径向基核函数,它只有一个待定参数,其值越大,收敛速度越快[9]。
本实验分别从正、负类图像中选取前N张用于训练集,其余的1 000-N用于测试集。选取SVM类型为e-SVR,核函数选用RBF(径向基函数)核,又称高斯核函数,SVM分类器优化问题就转化式(6)的最小化问题:
其中,ai为拉格朗日乘子,C为惩罚参数。式(6)的最小值取决于参数(C,?酌)的设置,合适的参数可使得SVM分类器的性能最佳,其推广能力最好。经过多次试验,C取100,?酌取1/k,k为类数。用训练数据训练SVM分类器,预测测试样本,同时,为了避免数值计算困难问题,采用尺度因子压缩数据,用ROC曲线与AUC值作为评价分类器性能的指标。
2 改进算法
2.1 图像分块
图像分块通过综合利用图像全局特征和综合特征,更好地描述了图像内容。由于颜色空间分布存在差异性,故将图像分成若干个子块[10]。分块图像特征检索方法具有良好的旋转、平移和尺度不变性,得到的检索结果能够很好地满足人的视觉感受[11]。图像的空间分布信息对图像相似性判断的影响极大,图像分块注重了图像的空间分布信息,实现了基于均匀分块的图像检索算法[12],三者结合更加全面地描述了图像信息,使得检索结果更加准确。
2.2 Bag of Words算法描述
Bag of Words算法也称为词袋算法,是一种有效的基于语义特征提取与描述的物体识别算法。其基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看作是一些词汇的集合,而文本中的每个词汇都是独立的[13]。Bag of Words算法首先要提取图像的特征点,通过描述方式转化为特征描述符,利用K-Means对描述符进行聚类,得到每个类的聚类中心,所有的聚类中心的集合成为视觉词汇,最后利用机器学习的方法对多个类别的描述符进行训练。
2.3 Bag of Words模型
Bag of Words模型应用于图像表示,为了能表示一幅图像,需将图像视为文档。K-Means算法是基于样本间相似度测量的间接聚类算法,其特点:理论可靠、算法简单、收敛速度快[14]。
实验将图像库里的图像大小分成50×50,采用重叠的分块方式,并提取每块的颜色纹理特征,由于图像大小不同,故分块的数量也不同。为了能用标准的SVM学习与检索,借鉴Bag of Words模型,则步骤如下:
(1)用K-Means对所有训练图像的所有分块的颜色与纹理特征进行聚类,找到聚类中心点,构造视觉词汇;
(2)将每幅图像的分块特征向量在聚类中心点映射,得到图像的映射向量;
(3)以图像的映射向量作为图像的特征向量,从而利用SVM学习与检索。
用K-Means算法将训练类的所有图像示例聚成100类,并产生每一类的投影特征,建立每小类的视觉字,分别计算训练与测试类的投影特征。
3 实验分析
实验选取蝴蝶、蜻蜓、蜜蜂、蟋蟀、蝗虫、螳螂、天牛、棉铃虫(幼虫)、瓢虫与蚜虫10类各100张图片构建昆虫图像数据库。分别采用颜色矩小波纹理综合特征与图像分块结合颜色矩小波纹理综合特征的方法,进行SVM图像检索。实验结果如表1所示。
根据每类图像的AUC值绘制PR曲线,如图1所示。
实验表明,图像分块特征结合颜色纹理综合特征检索效果比颜色纹理综合特征SVM图像检索结果精度高,同时也表明了全面的综合特征描述了图像的完整信息。
4 结论
利用计算机模式识别可有效地识别昆虫,通过提取综合特征描述昆虫图像信息,构建训练模型,使用SVM训练样本,并预测测试样本。图像分块弥补了图像空间分布信息,更加全面描述了图像内容,SVM在图像检索中的应用提高了检索精度。
参考文献
[1] 李勃,章毓晋.基于特征元素和关联规则的图像分类方法[J].电子学报,2002,30(9):1262-1265.
[2] 李向阳,庄越挺,潘云鹤.基于内容的图像检索技术与系统[J].计算机研究与发展,2001,38(3):344-348.
[3] 肖秦琨,刘米娜,高嵩.基于颜色和纹理特征的遥感图像检索[J].计算机技术与发展,2013,23(4):107-110.
[4] 孙君顶,赵珊.图像低层特征提取与检索技术[M].北京:电子工业出版社,2009.
[5] 侯群群,王飞,严丽.基于灰度共生矩阵的彩色遥感图像纹理特征提取[J].国土资源遥感,2013,25(12):26-32.
[6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,2001,23(8):800-810.
[7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):126-127.
[9] 罗成石.基于LIBSVM 的粮食水分数据融合研究[J].科学技术与工程,2012,12(2):292-294.
[10] 陈雅芳,薛清福,陈方芳,等.基于图像全局和局部颜色特征的图像检索[J].长春教育学院学报,2013,29(24):50-51.
[11] 郭丽,黄元元,杨静宇.用分块图像特征进行商标图像检索[J].计算机辅助设计与图形学报,2004,16(7):968-972.
[12] 张磊,林福宗,张钹.基于支持向量机的相关反馈图像索算法[J].清华大学学报,2002,42(1):80-83.
[13] 孙孟柯,张红梅.基于Bag of words模型的图像检索系统的设计与实现[J].电脑知识与技术,2012,8(5):1139-1141.
[14] 曾接贤,王军婷,符祥.K均值聚类分割的多特征图像检索方法[J].计算机工程与应用,2013,49(2):226-227.