文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2021.08.014
引用格式: 张辰,陈阳. 基于模板匹配OCR的报告自动归档系统研究[J].信息技术与网络安全,2021,40(8):84-89.
0 引言
光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。其在文档归档应用背景下具有广阔的市场前景。OCR字符识别技术经过多年发展,已有LeNet[1]、RRPN[2]、DMPNet[3]、CTPN[4]等OCR网络结构被提出。其中,CTPN是目前应用最广的文本检测模型之一。其基本假设是单个字符相较于异质化程度更高的文本行更容易被检测,因此先对单个字符进行类似R-CNN的检测,并在检测网络中加入双向LSTM[5],使检测结果形成序列提供了文本的上下文特征,便可以将多个字符进行合并得到文本行。LeNet网络提出时间较早,在银行票据手写体字符识别方面有着长期的应用。上述网络结构可以在通用背景下有效识别场景中的字符,对于非垂直文本也能进行检测。对于大多数OCR的应用场景,并不需要对图片中的所有字符进行识别,往往只需要对部分ROI区域的字符进行检测,但OCR技术对ROI区域的位移与旋转适应性较差,需要训练单独的网络来对ROI区域进行定位。机器视觉技术在制造业领域有着广泛的应用,特别是在工件定位、视觉测量等方面有大量成熟的算法,其中,模板匹配算法则针对工业定位[6-7]的应用背景,提出了基于灰度[8]、边缘[9]、变换域[10]的模板匹配算法,能适应各种工业定位需求[11-15]。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003731
作者信息:
张 辰1,陈 阳2
(1.广东省建设工程质量安全检测总站有限公司,广东 广州510500;
2.广东省建筑科学研究院集团股份有限公司,广东 广州510500)