基于上下文感知网络的场景图生成方法
所属分类:技术论文
上传者:wwei
文档大小:2561 K
标签: 场景图生成 消息传递 门控循环单元
所需积分:0分积分不够怎么办?
文档介绍:场景图生成的核心任务是从图像中挖掘多目标间的结构化关系,其本质是对视觉数据要素的语义化组织与关联。现有方法在数据流通过程中未能充分筛选和利用目标上下文信息,导致关系预测的鲁棒性与精度受限。为此,提出消息上下文感知网络(MCAN),通过构建从粗到细的数据要素融合机制,提升场景图生成中上下文信息的质量与利用率。该模型利用门控循环单元(GRU)捕获目标间长程依赖关系,通过多头注意力机制实现上下文数据要素的细粒度筛选,并结合残差融合策略增强视觉表示的稳定性。在Visual Genome数据集上的实验表明,MCAN在三个子任务上平均性能提升2.1%,有效验证了其在多模态数据流通中的噪声抑制与信息增强能力。消融实验进一步揭示了各模块在数据要素融合中的贡献。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。