摘 要: 将D-S证据理论引入车牌字符识别,结合神经网络容错能力强、能够自适应学习等优点,对待识别字符进行统计和结构等多方面的特征提取后,分别经过神经网络分类器得到相应的结果,并应用D-S证据理论对各种结果进行数据融合,从而实现了字符各方面特征的优势互补,进一步提高了字符识别的成功率。
关键词: 字符识别;特征提取;D-S证据理论;数据融合
字符识别是模式识别的一个重要分支,是LPR系统中最后一个环节,同时也是一个典型的大类别数模式识别问题。在车牌字符识别的过程中需要处理大量字符信息,传统的字符识别流程如图1所示。
通常提取的特征主要有纹理特征、颜色特征、形状特征和空间关系特征等[1]。本文将待识别字符的统计特征和结构特征都提取出来,扬长避短,发挥各自优点。分别使用神经网络的分类器得到相应的结果,再将各种结果通过D-S证据理论进行数据融合,充分利用字符各方面特征,从而达到进一步提高字符识别成功率的目的。
1 字符识别
1.1 预处理
对输入的数字图像先进行定位、二值化、去噪和大小规格化等预处理工作,这一环节是字符识别的重要步骤。二值化主要把原始图像转换成识别器所能接收的形式,尺寸和位置的规格化主要是消除一些与类别无关的因素。
1.2 特征提取
本文主要从待识别字符中提取基于网格特征和基于方向线素特征两组统计特征,后者主要是对数字图像分别在水平方向和垂直方向三等分的地方作水平线和垂直线穿过字符看其与字符边缘交叉的次数,以此作为特征进行提取。虽然这两组特征已然包含了较多的信息,具备一定的识别成功率,但是仅从这两个特征入手还存在明显的不足:(1)它们都是在尺寸归一化以后进行的,宽高比信息并没有体现出来,这样常导致“1”与其他的数字混淆;(2)由于是统计特征,对字形结构的描述不足,使得一些在统计特征上差别很小但结构完全不同的字符发生混淆,如“3”和“8”。鉴于此,本文又引入了宽高比和孔洞数两个结构特征。诚然,仅凭这两个结构特征并不能完成彻底的分类效果,但与前面的统计特征有很好的独立性,通过合适的集成方式,能够进一步提高系统的识别成功率。
1.3 BP神经网络分类器
BP神经网络的核心目的是通过梯度下降法让网络的实际输出和期望的均方差最小。BP神经网络学习训练的过程由信息的正向传播和误差的反向传播两个过程组成。当实际输出与期望输出不符时,进入误差的反向传播阶段。神经网络学习训练的过程就是周而复始的信息正向传播和误差反向传播过程,同时也是各层权值不断调整的过程。该过程一直持续到网络实际输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
虽然BP神经网络具有一定的先进性,但也存在着一定的缺陷:
(1)BP算法根据梯度下降学习法进行学习时,可以使权值收敛到某个值,但无法保证该值为误差平面的全局最小值。可以采用附加动量法来解决该问题。
(2)隐层和隐层节点的数目尚无理论上的指导,只能通过经验或反复实验确定。
(3)由于学习的速率是固定不变的,因此BP神经网络收敛的速度比较慢,训练时间较长。
(4)网络的学习和记忆具有不稳定性。
因此,在字符识别的过程中,如果应用BP神经网络的方法,还需要根据具体的情况做相应的修改,使其发挥应有的优势。
本文采用3组BP神经网络作为分类器,输入向量分别为以上提取的统计和结构特征向量,统计特征向量包括粗网格特征和方向线素特征两组,结构特征向量为宽高比和孔洞数。输出向量为3组向量,第1组为42维向量,其中每个分量分别与32个省市区汉字的简称和10个部队、军区等特殊机关部门的简称相对应;第2组为26维向量,其中每个分量分别与英文字母A~Z相对应;第3组为10维向量,其中每个分量分别与数字0~9相对应。传递函数采用Sigmoid函数。训练时,对应每个输入的数字图像,输出向量中相应位置分量赋值1;测试时,为了得到下一步证据理论所需的基本概率数,还需对输出向量的分量按式(1)进行处理:
(3)不确定性区间长度必须小于某一阈值r;
(4)目标类别的信任度值必须大于不确定性区间长度。
关于阈值的选取并没有一个统一的标准,只能根据实际情况加以确定,阈值过大或过小都会直接影响到识别成功率,本文选取ε=0.1,r=0.3。
2 实验结果分析
本文所设计的车牌识别系统Vision1.0采用VisualC++6.0开发工具,并在具有Core(TM)2Duo CPU、2 GB内存的计算机上实验得到数据,支持像素100×100以上BMP和JPG格式图像文件,具有一定的识别精度。
部分车牌识别实验的结果如图2~图7所示,实验结果分析如表1所示。
实验结果表明,该方法实现了普通车牌的字符识别功能,并能应用于不同环境、不同颜色车牌的识别当中。通过大量实验不难发现,车牌字符识别的关键取决于汉字字符的识别成功与否,如果能够成功识别出汉字字符,则在理想状态下基本能够准确识别车牌中其余的英文字符和数字字符。如表1所示,有6个车牌是在汉字识别成功后未能成功识别其他字符的情况,主要是由于字符受损严重或受污染,导致无法正常匹配识别。对于识别过程中暴露的不足,在今后的工作中还有待完善。此外,由于识别汉字字符过程中对资源消耗较大,导致识别速度指标不甚理想,在后续的研究中还需改进。
参考文献
[1] 周培德.计算几何-算法分析与设计[M].北京:清华大学出版社,2008.
[2] 宁坤,刘翌南,杨洁,等.基于数据融合的识别方法研究[J].无线电工程,2004,34(12):56-57.
[3] 王奉涛,马孝江,朱泓,等.基于Dempster-Shafer证据理论的信息融合在设备故障诊断中应用[J].大连理工大学学报,2003,43(4).
[4] 何友,王国宏,彭应宁.多传感器信息融合及应用[M].北京:电子工业出版社,2001.
[5] 焦准,王伟平,张蓉.基于证据理论的多传感器信息融合目标识别方法[J].弹箭与制导学报,2006,26(4):276-278.
[6] 庞圣波,王力宏,王培进.证据理论合成公式的讨论及一些修正[J].计算机工程与应用,2007,43(20):56-59.
[7] 李弼程,王波,魏俊,等.一种有效的证据理论合成公式[J].数据采集与处理,2002,17(1):34-36.
[8] 何冰,胡红丽.一种修正的D2S证据融合策略[J].航空学报,2003,24(6):559-561.