基于多重注意力引导的人群计数算法
网络安全与数据治理 2022年 第1期
杨倩倩,何 晴,彭思凡,殷保群
(中国科学技术大学 信息科学技术学院,安徽 合肥 230026)
摘要: 针对实际场景中存在的人群非均匀分布问题,提出了一种基于多重注意力引导的人群计数算法。首先,基于轻量级金字塔切分注意力机制构建了自顶向下的特征融合路径,旨在促进高层语义信息和低层空间细节的融合,生成高级语义和空间细节兼备的高质量特征图;然后,提取并融合多尺度上下文信息,以此生成关注于不同密度分布模式的注意力权重图;最后,通过注意力权重图指导密度回归网络识别不同分布状态下的行人目标,增强模型对密度变化的适应性,生成高质量人群密度图。在ShanghaiTech、UCF_QNRF和JHU-CROWD++三个数据集上进行了大量的实验来说明所提算法的先进性。
中图分类号: TP309
文献标识码: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.017
引用格式: 杨倩倩,何晴,彭思凡,等. 基于多重注意力引导的人群计数算法[J].网络安全与数据治理,2022,41(1):108-116.
文献标识码: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.017
引用格式: 杨倩倩,何晴,彭思凡,等. 基于多重注意力引导的人群计数算法[J].网络安全与数据治理,2022,41(1):108-116.
Multi-attention convolutional network for crowd counting
Yang Qianqian,He Qing,Peng Sifan,Yin Baoqun
(School of Information Science and Technology,University of Science and Technology of China,Hefei 230026,China)
Abstract: Aiming at the problem of non-uniform crowd distribution in practical scenes, this paper proposes a crowd counting algorithm based on multi-attention mechanism. A top-down feature fusion path is constructed based on the lightweight pyramid split attention mechanism, which aims to promote the fusion of high-level semantic features and low-level spatial details, resulting in high-quality feature maps with both semantics and spatial details. Then multi-scale context information is extracted and fused to generate attention weight maps that focus on different density distribution patterns. At last, the density regression network is guided by the attention weight maps to identify pedestrian targets in different distributions, enhancing the model′s adaptability to density variation, so as to generate high-quality crowd density maps. Abundant experiments on three datasets including ShanghaiTech, UCF_QNRF and JHU-CROWD++ were conducted to prove the effectiveness of the proposed network.
Key words : crowd counting;density map estimation;attention mechanism;feature pyramid network
0 引言
由于人群所在的位置和行动轨迹具有主观性强、自由度高的特点,监控视频采集的图像包含大量杂乱分布的人群,不同局部区域的人群密度差异巨大,增大了人群计数算法的估计难度。如图1所示,在同一人群场景中,多个局部区域表现为人口极度聚集,而部分区域人口稀疏甚至是孤立的个体,难以预测的行人位置将导致密度图中不同位置的密度值之间存在巨大差异,对算法感知不同密度分布模式的能力提出了更高的要求。为解决上述问题,本文提出基于多重注意力引导的人群计数算法,将特征金字塔机制和注意力机制相结合,促进语义信息和空间细节的融合,并通过注意力图引导模型生成对应不同分布状态的密度图。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004620
作者信息:
杨倩倩,何 晴,彭思凡,殷保群
(中国科学技术大学 信息科学技术学院,安徽 合肥 230026)
此内容为AET网站原创,未经授权禁止转载。