《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 基于欧氏距离的交通警告标志识别方法研究
基于欧氏距离的交通警告标志识别方法研究
2014年微型机与应用第22期
李涪帆,田 浩,巨永锋
(长安大学 电子与控制工程学院,陕西 西安 710064)
摘要: 提出了一种对含字符的交通警告标志进行检测和识别的方法。根据交通标志颜色的分布范围,以颜色分量为基础进行阈值分割,将图像中大部分不满足颜色要求的区域去掉,借助连通域标记、形状因子来进行交通标志的定位。将定位后的交通标志,通过预处理、字符的旋转矫正和分割,得到人眼可以识别的字符。通过欧氏距离匹配法进行字符的计算机识别,最终可使计算机识别率达到75%左右。
Abstract:
Key words :

  摘  要: 提出了一种对含字符的交通警告标志进行检测和识别的方法。根据交通标志颜色的分布范围,以颜色分量为基础进行阈值分割,将图像中大部分不满足颜色要求的区域去掉,借助连通域标记形状因子来进行交通标志的定位。将定位后的交通标志,通过预处理、字符的旋转矫正和分割,得到人眼可以识别的字符。通过欧氏距离匹配法进行字符的计算机识别,最终可使计算机识别率达到75%左右。

  关键词: 欧氏距离;交通警告标志;阈值分割;连通域标记;形状因子;匹配法;计算机识别

0 引言

  交通标志本身数量众多,形态复杂,而自然场景下存在着光照变化、褪色污损、扭曲变形等情况对交通标志表观的影响,为自动识别带来了很大的挑战。何耀平等人在分析交通标志特征的基础上,将Adaboost算法与SVM算法融合用于自然场景下的交通标志识别。该方法具有较高的识别率和较快的识别速度,在智能汽车系统中具有较高的应用价值[1]。在实际采集中,图像不免会发生几何变化或目标被部分遮挡,这会对识别带来许多困难。史延彦等人研究了基于不变矩和角点特征的目标识别算法,这两种都具有平移、旋转、尺度不变形的特征。经过分析表明,在一般情况下不变矩可以获得较高的识别率,而当目标被部分遮挡时,角点是一种有效的识别方法[2]。同样,交通标志会受自然环境和时间的影响,出现许多退化的现象,为解决这一问题,丁淑艳等人提出了采用模糊-仿射不变矩直接提取图像的特征而不需要图像的清晰化处理的一种新的分类算法,在利用模糊-仿射不变矩提取图像特征的基础上,采用递归正交最小二乘法设计了一种新的径向基概率神经网络分类器,这种方法不仅具有精简的结果,而且具有较好的分类和推广性能[3]。在2014年,Andrzej、Ruta等人介绍了一种关于图像表示和辨别局部特征选择的新方法,给出了在一种离散颜色图像表之上的基于CDT的距离度量,这是一种前向特征选择技术,高质量的辨别标志描述符,从基于一对多相异极大化原则的理想模板中建立。采用这些描述符,使传统分类器可以与最先进的方法相竞争,处理输入视频序列接近于实时[4]。

  尽管国内外学者已取得了较多的成果,但是具体针对含有字符这种警告标志进行检测和计算机识别的研究较少,因而,研究适合此类交通标志的识别算法是有价值的。

1 交通标志的检测

  本文研究的是对含有字符这种警告标志进行检测和计算机识别,此类交通标志的颜色有鲜明的特证:圆形红色外框,内为白色,中间是黑色字符。典型交通标志如图1所示,可以先根据颜色找到图像中感兴趣的区域。

001.jpg

  不妨假设所提取的像素中红绿蓝的每个灰度值分别为Ur、Ug、Ub,再求出各个分量所占颜色的百分比Kr=Ur/(Ur+Ug+Ub),Kg=Ug/(Ur+Ug+Ub),Kb=Ub/(Ur+Ug+Ub)

  例如判断是否为红色,再根据如下方法进行判断:

  (1)若Ur+Ug+Ub>T,则进入下一步,否则将像素点设为黑色。

  (2)若Kr<Tr,则进入下一步,否则将像素点设为白色。

  (3)求出红色分量百分比到蓝色分量百分比和绿色分量百分比的距离H1=|Kr-Kb|,H2=|Kr-Kg|,再根据H1与T1、H2与T2的关系来判定(也可以根据需要再对Kb和Kg设定阈值进行分析)。如满足关系则将像素点设为白色,否则将像素点设为黑色[5]。

  其中,T、Tr都是设置的阈值,选择的方法可以根据不同需求和反复实验的经验试定。

  下面对图1中的限速标志按照上述的方法进行红色分量的阈值划分。(1)设置阈值T为75,保证像素的亮度达到一定的要求。(2)分别求出R、G、B三个分量的百分比Kr、Kb、Kg,不妨设阈值Tr为0.5,如果大于这个阈值,则表明像素满足要求,设为白色,如果不满足要求,即可能是红色也可能不是,就需要进入步骤(3)进行讨论。(3)首先要求R分量的百分比不能太小,这里设为0.4,其次G和B分量的比重差距也不能太大,否则颜色看上去会偏重于黄色或者紫色,所以通常会使用Kb<2×Kg,Kg<2×Kb;另外根据反复实验又增加了一个附加条件Kr-Kg>0.1。综上所述,步骤(3)的整体条件是Kr>0.4&&2×Kg>Kb&&2×Kb>Kg&&(Kr-Kg)>0.1若满足,则符合要求置为白色,否则为黑色。

  对图1不同条件处理的效果如图2所示。

002.jpg

  通过图2(a)可以看到,仅仅通过比较高的红色分量判别会除去许多符合条件的红色像素;图2(b)可以达到较好的效果。

  通过图2(b)可以看到,图像中存在很多噪声点,通过图像形态学腐蚀、膨胀处理,可以将噪声点除掉,处理效果如图3所示。

003.jpg

  经过上面几步处理之后,可以得到交通标志的区域,而将其余的部分除掉,实现了交通标志的检测。

2 交通标志的定位

  交通标志的轮廓形状是交通标志的重要信息,对于交通标志的识别起着决定性作用。交通标志的定位过程即检测圆形的过程,进一步寻找感兴趣区域。在进行检测之前需要先对图3所得的二值图像进行填充处理,以得到圆形区域[6]。

  二值图像的连通域标记处理操作就是从白色像素和黑色像素组成的一幅点阵图像中,将互相邻接的具有像素值“1”或“0”的像素集合提取出来,并为图像中不同的连通域填入不等的数字标记,同时统计连通域的数目,每一个数字标记都代表了一个区域[7]。有几个连通域就有几个白色部分,再通过形状因子来判断连通域的形状,记录圆形部分的标记数就可以确定交通标志所在的连通域,因而可以确定交通标志所在的位置。

  将形状因子定义为:

  C=P2/(4πA)

  其中,P表示周长,A表示面积。

  在相同面积的条件下,在各种形状当中具有光滑周界的圆形的周长最短,可称为是最密集的形状,圆形的密集度C=1。随着周界凹凸变化程度的增加,周长P相应增加,C随之加大。

  对于在几何上相似的两个形状,虽然它们的大小不同、取向不同或位置不同,但它们有相同的C值。因此C是一个仅与形状有关的特征,常被称为形状因子。

  另定义:4W@@%Q]NA%3Y1JI1QMD03NA.png为与第i个连通域具有相同标准二阶中心矩的椭圆的长轴长度(像素意义下);′S(i)MinorAxisLength′为与第i个连通域具有相同标准二阶中心矩的椭圆的短轴长度(像素意义下);′S(i)Area′为图像第i个连通域中像素总个数。

  当满足条件:

  K<1.5&&C>0.8&&C<1.2&&M>150时,可以得到满足此条件的第i个连通域即为交通标志所在的位置。根据上述方法可以将图1中的交通标志进行定位,如图4所示。

004.jpg

3 交通标志的字符分割

  3.1 交通标志的预处理

  找到交通标志的位置以及提取相应位置后,需要对字符进行处理。主要目的是把图像中红色的外框和多余的噪声去掉[8]。图4中就有树荫的影响,处理后得到的二值图像如图5所示。

005.jpg

  3.2 字符的矫正

  由于拍摄角度或者一些其他原因,有可能导致所取得的图像中的交通标志倾斜[9],如图6(a)倾斜较为严重,图6(b)倾斜较为轻微,如果直接对字符进行分割会出现一些不愿发生的事情,比如图像的字符是横向的,或者带有原图一样的倾斜,而且可能会包含一些其他字符的信息,这都会给处理带来麻烦。

006.jpg

  为避免这些情况的发生,需要进行校正处理,而现在其倾斜多少角度并不知道,需要借助一些方法来判断其是否选择到了合适的位置。在这里,提供一种垂直方向像素累加的直方图映射的方法,图7(a)、(b)分别是图6(a)、(b)在垂直方向上的直方图。

  再对比一张本身不需要校正的交通标志的直方图如图8所示。

  从图8可以发现,在直方图的中间有明显的空隙,这是因为图像已经处理为二值图像,只有在有字符的地方才为白色,而其余地方为黑色,像素在垂直方向的直方图累加就是将垂直方向上的像素值进行累加,将和值表现出来的直方图。

  根据这个特点,每次将为满足校正条件的图片进行5°的旋转,直到其直方图在中间位置满足一定的阈值条件;如果旋转一周后都没有满意的结果,这说明图像不含有两个字符的标准,或者前面的预处理做得并不好,有太多的噪声。由此可以得到图6(a)、(b)校正后的图像,如图9所示。

009.jpg

  3.3 字符的切割与归一化

  当图像经过校正后就可以分割图中的字符,以便进行字符的识别。具体的方法是:根据连通域的知识,先找到图中较大的连通域并做好记录,找到每个连通域的最左、最右、最上和最下的像素位置,再根据4个范围值分别将标记好的连通域按矩形分割下来就可以了,切割后的字符图像如图10所示。

010.jpg

  为方便在字符识别阶段的处理,需要将分割下来的字符图像进行格式上的归一化,这里将图像缩小为10×15的像素格式,宽为10,高为15。

4 交通标志字符的识别

  各种模式在特征空间的分布状态是模式识别成功与否的重要因素。只有对这一分布状态进行分析,才能断定模式的特征空间描述是否有利于分类,才能决定哪些特征起到主导作用,哪些特征可以忽略,从而进行特征的选取。本文采用欧氏距离描述模式在特征空间分布状态的测度[10]。

  在n维特征空间中,一个模式表征为一个点,点a=(a1,a2,…,an)T和点b=(b1,b2,…,bn)T之间的欧氏距离表示为:

  I`2VW@]L9UI%1HV5{ZXYNNU.jpg

  统计归一化格式后的字符在横向和纵向共25个方向上所占像素的个数,这样求得4的特征值为[3 4 6 5 5 6 14 15 3 2 1 2 2 3 10 10 5 4 4 5 5 4 3 3 2],向量中共有25个数值,其中前10个为纵向的统计数值(从左向右,如3表示在第1列上有3个点像素值为255),后15个为横向的统计数值(从下到上,如向量中的第11个值1表示最下列中有1个点像素的值为255)。如此,对于每一个要识别的字符都能得到一组特征向量。为了能够识别字符是什么,选择字体为交通标志专用的一组数来作为标准,如图11所示。

  分别求出他们的特征向量作为标准,0~9特征向量为:

011.jpg

  对于每个输入的字符,分别求出其到0~9的欧氏距离,取距离最小的最为相匹配的字符。

  5 算法的测试

  上面介绍了具体的实施方法,现在对字符识别的算法做如下测试:收集实际生活中带有限速标志的图像,然后提取交通标志,再对其中的字符进行分割,最后对每一个字符进行识别,连续测试40幅图片。图12为40幅图片中3幅的识别结果示例,识别情况如表1所示。

012.jpg

  通过测试可以知道,有些字符的识别并不正确,分析有几点原因:

  (1)由于设定的标准字符与实际交通标志上的字符有差异,因此所匹配的字符特征并不一定最准确。

  (2)在进行旋转校正和字符大小归一化时,图像要使用插值算法,这样会导致一些误差,而影响到最后的特征提取。

  (3)图片中交通标志的位置不一定是正面取景,有可能图像是偏斜的,这样分割下来的字符也存在形变。

6 结论

  对于交通标志识别这个课题,本文借鉴了许多已有的技术,主体步骤和大多数的研究相一致,主要是颜色预处理、形态学滤波、图像分割、特征提取与识别。但这里也有一些经过反复对比和改进而使用的方法。首先,颜色预处理上,阈值的寻找,由于交通标志的颜色有限地分布在一定范围内,这样通过在模型上的划分就可以找到。还有,在圆的检测上没有使用比较一般化的方法,而是受到一些边界标记的启发,进行了检测。本文所研究的某一类特定的交通标志,基本达到了要求。

参考文献

  [1] 何耀平,徐丽珍.自然场景下交通标志的自动识别算法[J].微计算机信息,2010(4):161-163.

  [2] 史廷彦,赵书斌.基于不变矩和角点特征的目标识别[J].指挥控制与仿真,2008,30(2):32-34.

  [3] 丁淑艳,宋婀娜,李伦波.退化交通标志图像的RBPNN分类算法研究[J].计算机仿真,2010,27(1):281-284.

  [4] 罗冰洁.基于颜色与形状特征的圆形交通标志识别[D].西安:长安大学,2013.

  [5] 齐飞.交通标志识别技术研究[D].北京:北京交通大学,2013.

  [6] 关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010(1):143.

  [7] 张恒,胡文龙,丁赤飙.基于快速连通域分析的目标特征提取算法[J].计算机工程与应用,2009(29):230-232.

  [8] 严筱永,阎浩,沈维燕,等.基于改进的Hough变换的圆检测[J].金陵科技学院学报,2009(1):1462-1465.

  [9] 高俊钗,韩冰,王泽民,等.向量空间彩色图像的Canny边缘检测[J].科学技术与工程,2008(3):686-689.

  [10] 饶永全,周珩.基于标记矫正的目标特征提取算法[J].航空兵器,2006(6):37-40.


此内容为AET网站原创,未经授权禁止转载。