摘 要: 为进一步提高牛肉大理石纹评级的正确率,提出了基于完整局部二值模式(Completed Local Binary Pattern,CLBP)、改进核主成分分析(Kernel Principal Component Analysis,KPCA)和随机森林(Random Forests,RF)的牛肉大理石纹评级方法。首先,利用CLBP提取牛肉大理石纹图像的纹理特征;其次,采用混沌蜂群算法对KPCA的核参数进行优化,使KPCA的降维效果和特征提取达到最优,获得表征牛肉大理石纹样本图像的特征向量;最后,使用随机森林完成牛肉大理石纹样本的分级识别,获得最终评级结果。大量实验结果表明,与基于分形维和图像特征的方法、基于灰度共生矩阵和BP(Back Propagation)神经网络法相比,本文方法所得识别率最高。
关键词: 牛肉大理石纹评级;图像处理;完整局部二值模式;混沌蜂群优化;核主成分分析;随机森林
0 引言
牛肉大理石纹的丰富程度与牛肉的口感、质地、多汁性及风味有着直接关系,它直接影响着牛肉的定价与消费,被国内外普遍作为牛肉评级的主要指标之一。人工的评级结果容易受到个人差异性和主观性的影响,存在评级准确率低和速度慢的问题,研究实现牛肉大理石纹的自动化评级,对提高牛肉质量评定的准确率和速度有着重要的现实意义[1-2]。
近年来,将图像处理技术应用于牛肉大理石纹的自动评级成为国内外人们的研究热点[3-5]。参考文献[6-7]大多仅考虑肌内脂肪的面积比例和颗粒数量,没有深入考虑大理石花纹的纹理特征。参考文献[8-9]采用图像灰度共生矩阵的统计量描述牛肉大理石纹特征,再分别结合BP(Back Propagation)神经网络或线性回归模型进行评级,该类方法还需要引入其他的纹理特征和评价指标来进一步提升方法的评级正确率。参考文献[10]提出了完整局部二值模式(Completed LBP,CLBP),在纹理图像的分类应用中发挥了显著作用。采用CLBP计算牛肉大理石纹图像的特征参数,可以更好地表征大理石纹的分布性状特点,有助于提高最终的评级正确率。由于所得特征参数维数较大,需进行降维处理。本文采用混沌蜂群优化的核主成分分析(Kernel Principal Component Analysis,KPCA)方法来实现降维过程。KPCA[11]被人们广泛应用于非线性特征提取,但由于其核参数选择大多依据经验,导致特征提取和降维的效果受到了不同程度的影响。采用结构简单且可有效避免局部极值的混沌蜂群算法对核参数进行优化,可以更好地减少时间花费,参数优化后的KPCA具备最优的特征提取和降维性能。
随机森林(Random Forests,RF)[12-13]是一种较新的分类器,它具有适应高维小样本数据、可以自动地进行功能选择、对无关特征不敏感、同等适用于二类分类和多类分类问题等优点,且不需要进行复杂的参数选择,分类正确率和识别效率都优于多元线性回归模型、BP神经网络方法。结合RF实现牛肉大理石纹的评级可望获得更高的评级正确率和效率。
基于上述分析,本文提出基于CLBP、混沌蜂群优化KPCA和RF的牛肉大理石纹评级方法。首先利用CLBP提取表征牛肉大理石纹图像的特征参数;其次,采用混沌蜂群优化的KPCA对CLBP编码信息进行降维,得到样本图像的特征向量;最后利用RF完成评级。
1 牛肉大理石纹图像的特征提取和降维
1.1 CLBP特征提取
牛肉大理石纹图像的LBP编码是按照式(1)计算得出的。
式中,gc是中心像素点的灰度值,gp是邻域像素点的灰度值,P是邻域像素点数,R是邻域半径。
通过对图像进行局部差值符号与大小的转换(Local Difference Sign-Magnitude Transform,LDSMT)分析,可以得到中心描述子(CLBP-Center,CLBP_C)、符号描述子(CLBP-Sign,CLBP_S)和大小描述子(CLBP-Magnitude,CLBP_M)。参照局部二值模式方法,计算中心像素灰度值与邻域像素灰度值之差:dp=gp-gc,dp又可以分解为:
dp=sp×mp,sp=sgn(dp),mp=|dp|(2)
式中,,表示dp的符号,mp表示dp的大小。
CLBP_M编码和CLBP_C编码的计算公式分别如式(3)和式(4)所示:
式中,c是局部图像中mp的均值。
FCLBP_CP,R=s(gc,cI),s(x,cI)=1,x≥cI0,x<cI(4)
式中,cI是局部图像的灰度均值。
建立融合CLBP_S、CLBP_M和CLBP_C的3维联合直方图,记为“CLBP_S/M/C”,以此表征纹理图像的特征。
1.2 混沌蜂群优化KPCA
设xi(i=1,2,…,N)是牛肉大理石纹图像的N个训练样本,被函数映射到高维空间中成为(xi)。假设,利用式(5)计算训练样本在高维特征空间的协方差矩阵C。
那么,式(8)变为:
)
求解式(9)可以得到特征值λk、参数向量?琢k和特征向量νk,那么任意样本在高维特征空间的投影是:
以主成分贡献率大于或等于90%为标准,则综合评价函数为:
式中,p是主成分个数,是各主成分的贡献率。
采用多项式K(x,xi)=[a(x,xi)+b]q作为核函数,核参数a,b和q将直接影响KPCA特征提取和降维的效果。通常确定上述核参数大多依靠经验,使得KPCA特征提取和降维效果很难达到最优。选用混沌蜂群优化算法对核参数进行选择,有望使KPCA具备最优的特征提取和降维性能。
混沌蜂群优化KPCA具体步骤如下:
(1)初始化食物源,种群大小ns为30,维数D为3,a∈[0,1],b∈[2,3],q∈[1,2],引领蜂与观察蜂的数目为ns/2,局部搜索最大循环次数nMC为20,跳出局部极值的界限nL为3,当前循环次数CT为1,最大循环次数CM为20。
(2)将KPCA的综合评价函数式(12)作为混沌蜂群算法的目标函数,引领蜂产生候选食物源,并在原食物源和候选食物源之间产生新的食物源。
(3)观察蜂依据每个食物源的选择概率,选择一个食物源,并执行与该位置引领蜂相同的操作,进一步局部搜索。
(4)引领蜂进入侦查阶段,依据nL判定食物源是否陷入局部极值,对陷入局部极值的食物源利用式(13)产生的Tent映射混沌序列进行扰动,得到新的食物源。并更新陷入局部极值的食物源。
式中,i=1,2,…,k且cHi≠0.25,0.5和0.75,k是混沌序列的长度大小。
(5)若CT达到最大循环次数CM,则循环结束,输出最优参数a、b和q,否则CT=CT+1。
2 牛肉大理石纹图像的等级评定
RF是以统计学习为理论基础,通过对测试样本的重复抽样随机产生多棵决策树,再构成森林,最后用简单的多数投票法来确定分类的结果。RF具体包含学习和分类2个过程[14-15]。
(1)学习过程。设决策树的数量是M,训练样本集为T={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},其中xi∈Rn,yi∈R,i=1,2,…,l,xi表示样本特征向量,yi为样本类别,l为样本数量。首先采用具备无权重、有放回特点的Bagging方法,利用原训练集生成M个有差异的子集;然后,采用CART(Classification And Regression Trees)算法进行节点分裂,再利用随机选择输入变量(Forest-RI)的方式实现随机特征变量的选取,计算出节点属性指标,分裂终止即构建出一颗二叉决策树;最后,由所有的决策树构成RF。
(2)分类过程。将待分类样本集输入到RF,用简单多数投票的方式作为RF的输出结果,实现最终分类。
综上所述,本文方法的实现流程如图1所示。
3 实验结果与分析
本文所使用的样本图像是由专业评级师将牛肉划分为五级之后,再使用CCD相机在流水线上获取的,共250张图像,每级50张,其中训练样本50张、待评级样本200张。采用本文提出的基于CLBP、混沌蜂群优化KPCA和RF的牛肉大理石纹等级评定方法进行实验,并将所得评级结果与参考文献[7]方法、参考文献[8]方法进行了对比。实验是在Intel(R)Core(TM)Duo CPU T5550 1.83 GHz、4 GB RAM、MATLAB7.8环境中进行的。图2为我国NY/T676-2010牛肉大理石纹图谱实例,为该等级的最低标准;图3为背最长肌最大内接矩形区域的灰度图像,用以牛肉大理石纹图像的CLBP特征提取和混沌蜂群优化的KPCA降维。
采用CLBP提取50张训练样本牛肉大理石纹图像特征参数,用于混沌蜂群的KPCA参数优化训练,经过多次实验,结果表明降维后前4维主成分的累积贡献率已达到98.05%,因此选用降维后的前4维主成分组成特征向量就可以有效体现原始的特征向量,同时也达到了预期的降维目的。表1列举说明了经混沌蜂群优化的KPCA降维后,前4维主成分的单独贡献率和累积贡献率。
表2给出了利用本文所涉及的3种方法得到的牛肉大理石纹图像待评级样本单级识别率和总体识别率。可以看出,与参考文献[7]方法和参考文献[8]方法相比,本文方法得到的单级识别率和总体识别率均更高。参考文献[7]方法中构造多元多项式模型的三个特征变量是:基于计盒维数、脂肪面积比率、脂肪颗粒总数,这三个特征变量主要反映的是牛肉大理石纹图像中脂肪和肌肉数量上的统计信息,并不能够完整地反映出由肌内脂肪颗粒的分布情况所呈现的纹理信息;加之,多元线性回归模型属于线性估计解决方法,它容易因受到样本特征空间数据间的相互作用影响,出现对称效应、丛聚效应和屏蔽效应,因此,由构造成的多元线性回归模型所获得的牛肉大理石纹图像单级识别率和总体识别率还不够高。参考文献[8]方法中通过计算牛肉大理石纹图像的灰度共生矩阵统计量作为特征值,能够较好地反映图像的纹理特征,但由于选用的特征量数量有限,还不能够反映出牛肉大理石纹图像中所有的纹理信息;另外,所用的分类器是BP神经网络分类器,它的构造原则是依据经验风险最小化,对样本数量的依赖程度高,容易出现过学习现象,同时还存在易陷入局部最优问题,最后所得的牛肉大理石纹图像单级识别率和总体识别率还不太高。本文方法中,采用CLBP计算牛肉大理石纹图像的特征参数,利用混沌蜂群优化的KPCA对特征参数进行降维,最终用前4维主成分表征牛肉大理石纹图像,可以避免不能完全反映图像纹理信息的问题;结合RF进行分类识别,可以有效地提高分类精度和稳定性。实验结果表明,本文方法所得单级识别率和总体识别率均最高,是一种行之有效的牛肉大理石纹评级方法。
4 结论
本文提出基于CLBP、混沌蜂群优化KPCA和RF的牛肉大理石纹等级评定方法。首先采用CLBP编码方式来提取表征牛肉大理石纹图像的特征参数;然后,利用混沌蜂群优化的KPCA方法对表征牛肉大理石纹图像的参数进行降维,降低冗余度,选取累积贡献率达到 98.05%的前4维主成分构造特征向量;最后,使用RF完成分类识别。通过大量的实验,结果表明评级正确率分别达到100%(一级)、95%(二级)、95%(三级)、 97.5%(四级)、100%(五级)。相比文献[7]方法、文献[8]方法,采用本文方法所得的评级正确率最高,可有助于提高牛肉大理石纹评级的准确率和速度。
参考文献
[1] 汤晓艳,王敏,钱永忠,等.牛肉分级标准及分级技术发展概况综述[J].食品科学,2011,32(19):288-293.
[2] 周彤,彭彦昆.牛肉大理石花纹图像特征信息提取及自动分级方法[J].农业工程学报,2013,29(15):286-293.
[3] 陈坤杰,姬长英.牛肉自动分级技术研究进展分析[J].农业机械学报,2006,37(3):153-156.
[4] TAN J. Meat quality evaluation by computer vision[J]. Journal of Food Engineering, 2004, 61(1): 27-35.
[5] FUKUDA O, NABEOKA N, MIYAJIMA T. Estimation of marbling score in live cattle based on ICA and a neural network[C]. IEEE 2013 International Conference on Systems Man and Cybernetics, Manchester, 2013: 1622-1627.
[6] 陈坤杰,姬长英.基于图像运算的牛肉大理石花纹分割方法[J].农业机械学报,2007,38(5):195-196.
[7] 陈坤杰,吴贵茹,於海明,等.基于分形维和图像特征的牛肉大理石花纹等级判定模型[J].农业机械学报,2012,43(5):147-151.
[8] 谢元澄,徐焕良,谢庄.基于牛肉大理石花纹标准(BMS)图像的纹理特征分析[J].中国农业科学,2010,43(24):5121-5128.
[9] 张建勋,李涛,孙权,等.猪眼肌B超图像纹理特征提取与分类[J].重庆理工大学学报:自然科学版,2013(2):74-78.
[10] Guo Zhenhua, Zhang Lei, ZHANG D. A completed modeling of local binary pattern operator for texture classification[J]. IEEE Transactions on Image Processing, 2010,19(6):1657-1663.
[11] Zhang Yi, Han Jing, Yue Jiang, et al. Weighted KPCA degree of homogeneity amended non-classical receptive field inhibition model for salient contour extraction in low-light-level image[J]. IEEE Transactions on Image Processing, 2014,23(6): 2732-2743.
[12] CHOI J H, SONG G Y, LEE J W. Road identification in monocular color images using random forest and color correlogram[J]. International Journal of Automotive Technology, 2012,13(6):941-948.
[13] 杨帆,林琛,周绮凤,等.基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J].系统工程理论与实践,2012,32(4):815-825.
[14] 陈超,李文藻.一种基于随机森林与颜色特征的岩屑识别算法[J].四川大学学报(自然科学版),2012,49(3):587-592.
[15] 曹正凤.随机森林算法优化研究[D].北京:首都经济贸易大学,2014.