摘 要: 针对手机等手持终端的客观题自动阅卷系统,提出了一种基于区域生长的表格定位算法,该算法对表格外框的确定有较好的适应性,并且对表格外噪声数据有较强的抗干扰能力。测试表明,该算法提高了表格定位精度和阅卷准确率。
关键词: 表格识别; 模板匹配; OpenCV; Android
传统的人工阅卷方式往往花费大量的人力物力和时间,效率低下,却不能得到一个很好的效果。因此,采用一种高效准确的阅卷方式显得尤为重要。参考文献[1]提出了一种基于图像识别的阅卷系统,这种阅卷系统需要对现有的常用答题卷格式进行改造,并且需要用扫描仪对学生的答题卷进行扫描,这势必会增加考试阅卷的复杂度。近年来,带有照相机功能的智能手机等移动终端快速增长且广泛使用,为高效地自动智能阅卷提供了很好的解决方案。
本文利用带有照相机功能的智能手机设计实现自动阅卷,教师只需将标准答案输入Android智能手机中,然后对学生答题卷进行拍照,如图1所示,通过手机阅卷软件便可以轻松得到学生客观题的考试成绩。这种阅卷方式可以降低人工评卷误差,减少教师阅卷工作量。
1 智能手机自动阅卷系统设计
各类考试的试卷中一般都会包括客观题部分,大多数考试答题卷的客观题部分都是由表格设计构成的。本文重点介绍系统在Android平台下识别表格图像,实现智能手机自动阅卷功能,具体流程如图2所示。
1.1 图像采集
与扫描仪获取图像资源相比,采用智能手机中的照相机获取图片的方式具有方便、快捷、应用一体化等特点。通过Android操作系统自带的照相机进行图像采集,并将采集到的图像存储到SD卡中等待后台应用程序进行处理。
1.2 图像预处理
照相机获取的图片携带了颜色特征,所以首先需要对图像进行二值化操作。除此之外,为了取得更好的字符定位效果和字符识别精度,还需要对图像进行倾斜校正等操作。
1.2.1图像二值化
由于文档图片的颜色特征比较单一,因此本文采用参考文献[2]提出的基于简单阈值的Ridler和Calvard的聚类算法,取得了较好的二值化效果。
1.2.2 图像的倾斜校正
答题卷在被照相机拍照的过程中,或多或少都会存在一定的倾斜。倾斜会给字符的分割和识别带来很大的影响,所以处理表格图像很关键的一步是图像的倾斜校正。
由参考文献[3]可知,传统的校正方法可通过Hough变化求出水平线的角度后,采用仿射变换调节图像的角度。该方法因为采用了Hough变化,需要耗费大量的时间。参考文献[4]提出了一种基于纵坐标投影峰值的表格图像倾斜调整算法,通过计算峰值之间的距离来度量表格的倾斜度。本文采用这种方法来进行倾斜矫正,该方法适用于带有表格信息的二值图像,其算法计算量较小,在实际中有一定的使用价值。
1.3 表格数据定位与拆分
往往一张答题卷分为多个部分,而客观题部分只是其中一个模块,所以表格数据定位拆分模块主要负责表格边框的定位,并且有效地对表格中的数据进行拆分。
1.4 表格数据识别
答题卷的客观题部分一般主要由答题序号(也就是印刷体数字)和答案(手写体A、B、C、D)构成。在进行数字和字符识别之前,通过参考文献[4]提供的方法可以使每个字符边缘没有空白区域,如图3所示。
1.4.1 手写字符特征提取算法
字符特征提取的好坏直接影响着最终的识别效果。参考文献[5]提供了一些字符的特征提取应遵循的规则。参考文献[6]提出了一种针对手写数字适应性较强的模板法——13点特征提取法,该方法具有实时、快速和准确等特点,但是该方法遇到大小不一的图片时就会难以识别。在此基础上,本文采用此方法归一化的结果来提取特征以适用于手写英文字符的识别。
1.4.2 手写体字符的识别
本文采用模板匹配进行字符识别,将标准的书写方式作为模板录入模板库中,利用图像之间的最短距离作为判别函数。对于一个待测试的样本X=(a1,a2,…,an)T,计算X和训练集中的某个样本Xj(0<j<N, N为训练集中样本的个数)之间的距离循环求出待测样本和。训练集中各个已知样本之间的距离为dj,比较所有的dj值,找出最小的d作为X所属的训练集类别。
2.3 算法描述
本文针对横线集和竖线集中包含非目标区域的表格线的问题以及横线集与竖线集断线的问题,改进了表格框线检测提取算法中的Hough变换算法和交叉点特征法[8],提出了一种基于区域生长的表格定位算法。算法具体流程如下。
(1)对倾斜校正过后的图像表格线进行检测,将检测到的线条进行归类,得到横线集与竖线集。设横线集为U1,竖线集为U2,通过与操作可以粗略得到交点集C,而最终需要得到的表格线外区域由4点集B构成。同时假设C中包含孤立交点为e。
(2)从C中选取4个相邻交点作为R的起始节点或叫种子节点,如图5(a)所示,区域应尽量小,且不包含其他交点,并且a与d和b与c形成横线关系,a与b和c与d形成竖线关系。
(3)生长区域选定,扩充区域R进行生长,这样可以填充掉断线区域。选定阈值T,将R区域向4个方向扩充T个像素,如图5(b)所示(T的选择应该适中,选择过大,会导致区域错误生长;选择过小,区域不能正常生长)。
(4)迭代横线集U1与竖线集U2中的线段,若线段L与生长区域相交,则R区域向线段L扩充直至L末端为止,形成新的R区域,返回步骤(3)进行新生长区域的选定;若不存在L与生长区域相交,则跳转至步骤(5)。图5(c)、图5(d)、图5(e)所示为表格生长区域的生长过程。
(3)由于算法假设中整个表格不可能出现完全断裂(这里完全断裂是指小模块与表格其他线段的最小距离大于T),因此通过线段连通性可以证明区域多次扩展后,最后的生长区域R在包含所有的表格区域后停止生长。
(4)由于假设中表格数据与表格外的数据之间存在一定的距离(假设距离大于T),则最终的生长区域不包含表格外数据。
3 测试结果及分析
本文采用三星i9300作为测试平台,Android 4.0.4的系统版本。本文采用OpenCV2(版本号为2.4.5)作为图像处理的库。
3.1 几种常见定位算法的对比
对带有表格外噪声数据的考试试卷(如图6所示)运用不同表格框线检测算法进行表格数据定位。分别通过Hough变换表格框线检测算法[8]、交点特征提取算法[9]、由郑秀清等人提出的一种改进的自动表格框线检测算法[10]和本文提出的基于区域生长的表格定位算法得到的结果如图7所示。
Hough变换检查直线算法输入原始图片后,可以检测到图像中的所有直线。将这些直线中的横线与竖线选择出来,可以构成检测结果,如图7(a)所示。由结果可以看出,Hough算法得到的线段除表格框线外,还存在表格外的直线,利用算法得到的直线集很难区分出哪些是表格线,哪些是非表格线,因此很难对表格区域进行有效的定位。
交点特征提取算法将横线与竖线的交点作为特征,通过交点可以大体描绘出表格区域。然而由于图像采集中光线不均匀与图像预处理的误差,容易出现漏检短框线的问题,从而会直接影响到交点的检测,如图7(b)中出现部分交点漏检的情况。
郑秀清等人提出的改进的自动表格框线检测算法主要应用数学形态学来对表格框线进行处理,对表格线进行了断点补偿,很好地去除噪声带来的困扰,但是同样不能过滤掉表格外的孤立交点,如图7(c)所示。
通过区域定位算法则可以很好地进行断线补偿并且过滤掉表格区域以外的孤立交点,如图7(d)所示,采用该方法可以得到表格数据的交点集,对表格数据进行有效的定位。
随机选取20种常见的不同类型的表格型试卷,通过图像采集得到80张图片作为图像库,分别用不同方法进行答题区域的分割,结果如表1所示。对比结果表明,基于区域生长的表格定位算法在图片较清晰、满足算法假设条件的情况下有较高的定位准确率。
传统的考试答题卷客观题部分主要存在于表格中,针对这种答题卷,本文针对Android移动终端设计了一种高效易用的自动阅卷方案,包括图像的采集、预处理、表格图像的识别和字符识别等。针对表格图像定位与手写字符识别算法进行了优化,实验结果表明,该自动阅卷方案具有高效、简单易用、便于推广的优点。
参考文献
[1] 张站,刘政怡.基于图像识别的阅卷系统的设计与实现[J]. 微型机与应用, 2011,30(4):44-47.
[2] RIDLER T W, CALVARD S. Picture thresholding using an iterative threshold selection method[J]. IEEE Transactions on Systems, Man and Cybernetics, 1978,8(8):630-632.
[3] 谢亮. 表格识别预处理技术与表格字符提取算法的研究[D].广州:中山大学, 2005.
[4] 巨志勇, 郑应平. 二值表格图像倾斜校正算法[C]. 第一届中国高校通信类院系学术研讨会论文集, 2007.
[5] 许雁飞, 陈春玲, 陈夏梅. 基于 OpenCV 的脱机手写字符识别技术[J]. 信息与电脑(理论版), 2011
(8):39.
[6] 钟乐海, 胡伟. 手写体数字识别系统中一种 新的特征提取方法[J]. 四川大学学报 (自然科学版), 2007(5):15.
[7] KIRYATI N, ELDAR Y, BRUCKSTEIN A M. A probabilistic Hough transform[J]. Pattern Recognition,1991, 24(4):303-316.
[8] ILLINGWORTH J, KITTLER J. A survey of the Hough transform[J].Computer Vision, Graphics,and Image Processing, 1988,44(1):87-116.
[9] WENYIN L, DORI D. From raster to vectors: extracting visual information from line drawings[J]. Pattern
Analysis & Applications, 1999,2(1):10-21.
[10] 郑秀清,付茂名.一种改进的自动表格框线检测方法[J].中国民航飞行学院学报, 2004,15(4): 30-32.