基于混合注意力机制的表情识别研究
2020-12-15
作者:高健,林志贤,郭太良
来源:2020年信息技术与网络安全第1期
0 引言
人脸表情识别作为人机交互的重要组成部分,一直是计算机视觉的研究热点,被广泛应用于公共安全、在线教育、医疗等领域。目前,表情识别的研究工作主要分为传统的人工特征提取和基于深度学习两个方向。人工特征常被用于提取图像的外观特征,包括Gabor、HOG以及局部二进制LBP等。但由于人工特征受限于算法的设计,计算复杂,在表情识别中效果不佳,正逐渐被基于深度学习的卷积神经网络所取代。
利用深度学习进行图像识别任务时,通常选择增加卷积神经网络的深度、宽度以及丰富网络感受野的方式来提升网络性能和容量。而在网络中引入注意力机制相比以上三种方式可以使网络重点关注图像细节特征,将原先的平均分配资源变成根据关注对象的重要程度进行重新分配,对模型中不同部分赋予权重,从中提取关键特征信息。文献[4]提出SENet网络结构,采用压缩和激励模块(SqueezeandExcitation block,SE),对重要通道特征进行强化从而提升识别率。文献[5]提出瓶颈注意力模块,可与任何前向传播神经网络结合。文献[6]提出一种卷积注意力模块(Convolutional Block Attention Module,CBAM),结合了空间注意力和通道注意力,相比SENet[4]只包含通道注意力识别效果更佳。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003115
作者信息:
高健,林志贤,郭太良
(福州大学 物理与信息工程学院,福建 福州 350116)
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。