中文引用格式: 丁鋆,徐爱俊,吴小芬,等. 基于多特征融合和知识蒸馏的亚热带常见乔木识别方法[J]. 电子技术应用,2024,50(8):1-9.
英文引用格式: Ding Yun,Xu Aijun,Wu Xiaofen,et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique,2024,50(8):1-9.
引言
亚热带地区处于热带和温带之间,气候和地理特征独特,为乔木、灌木、草本植物以及湿地植被等多种植物提供了适宜的生存条件,形成了复杂多样的植被环境[1-3]。乔木作为生态系统中的关键组成部分,其信息的准确获取对于珍稀濒危树木的保护和管理、木材资源的高效生产利用、亚热带地区生态系统健康的监测和分析都至关重要。因此,如何在复杂环境下准确识别乔木种类成为一项具有挑战性的任务。
传统的树种识别主要依靠相关领域专家观察树木部分器官的形状、颜色、纹理等特征来完成,该方法主观性强且效率较低,不适于大量树木的识别。随着计算机视觉和机器学习的发展,树种分类和识别方法取得了很大的进展,部分研究者利用图像处理提取树木颜色、纹理、边缘、形状等信息进而完成树种识别[4-6],尽管分类效果较好,但该方法需要人工选择特征,复杂的预处理过程增加了时间成本,降低了实用性。
近年来,深度学习技术在农林领域的应用日益增多,不少国内外学者将卷积神经网络(Convolutional Neural Network, CNN)用于树种识别[7-10]。朱良宽等[11]利用深度卷积生成式对抗网络(Deep Convolutional Generative Adversarial Networks, DCGAN)扩充15种叶片图像,通过迁移学习训练Inception V3网络后识别准确率为0.965 7,但图片选取局限于简单背景,无法评估模型在复杂背景下的识别性能。刘嘉政等[12]设计3路并列CNN,融合RGB、H通道和局部二值模式(Local Binary Pattern, LBP)特征后,对6种常见树种的树皮纹理图像识别准确率为0.935 0,高于单一特征识别率,但树皮图像特征较为明显易于区分。Cui等[13]使用ConvNeXt网络的3种规格(ConvNeXt-Small、Base和Tiny)识别BarkNetV2数据集中的33种树皮图像,准确率较高,分别为0.976 1、0.975 8和0.972 9,但参数量较大,其中参数量最小的Tiny网络达到了28.59 M。上述研究证实了深度学习在树种识别上的可行性,也取得了较好的效果,但普遍存在选取的树木种类较少、部分数据集背景单一特征明显以及改进的网络模型参数量较大等问题。
为准确识别复杂背景下特征不明显的远距离乔木,本文提出了一种多特征融合的亚热带常见乔木识别模型MFFMN-KD-TA(Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention),模型将3个MobileNetV3_Small主干网络融合为MFFMN模型,分别提取树叶、树干和树木整体特征;再引入知识蒸馏策略,以3个ResNet50构建的3-ResNet50融合模型作为教师网络指导MFFMN训练,最终将蒸馏得到的MFFMN-KD模型与Triplet Attention注意力机制相结合,实现了自然环境下远距离乔木的准确识别。
本文详细内容请下载:
http://www.chinaaet.com/resource/share/2000006113
作者信息:
丁鋆1,2,3,徐爱俊1,2,3,吴小芬4,周素茵1,2,3
(1.浙江农林大学 数学与计算机科学学院,浙江 杭州 311300;
2.浙江农林大学 浙江省林业智能监测与信息技术研究重点实验室,浙江 杭州 311300;
3.浙江农林大学 林业感知技术与智能装备国家林业与草原局重点实验室,浙江 杭州 311300;
4.杭州市临安区农村水务资产经营有限公司,浙江 杭州 311300)