《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 一种基于卷积神经网络的立体匹配算法设计
一种基于卷积神经网络的立体匹配算法设计
《信息技术与网络安全》2020年第5期
鲁志敏,袁勋,陈松
中国科学技术大学 信息科学技术学院
摘要: 为了解决传统立体匹配算法对立体图像在低纹理以及遮挡区域匹配效果较差的问题,设计了一种端到端的基于卷积神经网络(Convolutional Neural Network,CNN)的立体匹配算法。该算法采取了残差卷积神经网络对图像特征进行提取,之后利用空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块来获取图像的上下文信息,并结合多尺度的三维卷积神经网络对代价空间进行规整,最终实现了高精度的立体匹配算法。所获取的视差图在KITTI2015测试平台上的误匹配率为2.42%,与几何上下文(Geometry and Context,GC)网络相比较,视差图的精度提高了0.45%,且运行时间缩短了一半。
中图分类号:TN47 文献标识码:A DOI: 10.19358/j.issn.2096-5133.2020.05.001
引用格式:鲁志敏,袁勋,陈松.一种基于卷积神经网络的立体匹配算法设计[J].信息技术与网络安全,2020,39(5):1-5,21.
Abstract:
Key words :

立体视觉作为计算机视觉最为热门的研究领域,广泛应用于车辆的自动驾驶、机器人导航、三维重建、物体检测和识别等方面。立体匹配作为立体视觉系统中的核心技术,其匹配的精确度决定着整个系统的性能。由于拍摄的立体图像大多存在噪声干扰、重复纹理、低纹理和遮挡区域等问题,并且受到光照条件的影响,如何高效快速地获取精准的视差图仍存在着诸多挑战。

立体匹配算法的典型流程包含匹配代价计算、代价聚合、视差计算和视差优化四个步骤[1],其又分为全局算法和局部算法。局部算法通常使用固定大小的窗口或可变的窗口来计算初始代价,例如Census算法等,实现都比较简便,但是在视差突变区域存在诸多弊端,对低纹理和遮挡区域匹配效果差。全局匹配算法通过建立全局能量函数,利用最小化全局能量函数来获取最优的视差值[2]。常用的全局匹配算法包含动态规划、图割法、置信传播法、遗传算法等。全局匹配算法随着计算复杂度的提升,匹配效果较局部算法有所提升,但数据依赖性大导致运行速度慢,需要花费很长的时间进行计算。

为了解决传统立体匹配算法在低纹理、遮挡区域的匹配效果差的问题,本文研究了一种端到端的基于卷积神经网络的立体匹配算法,并利用了空洞空间金字塔池化(ASPP)[3]网络获取图像的上下文信息和多尺度的三维卷积网络来扩大图像的感受野。最终获得的视差图的精度远高于传统匹配算法,对图像的边缘、遮挡区域的匹配效果都非常优异。




本文详细内容请下载http://www.chinaaet.com/resource/share/2000003083


作者信息:

鲁志敏,袁勋,陈松(中国科学技术大学 信息科学技术学院,安徽 合肥 230026)

此内容为AET网站原创,未经授权禁止转载。