《电子技术应用》
您所在的位置:首页 > 模拟设计 > 设计应用 > 智慧农业下基于联邦学习的水稻病虫害分类研究
智慧农业下基于联邦学习的水稻病虫害分类研究
电子技术应用
黄炯炯
浙江农林大学 数学与计算机科学学院
摘要: 在农业发展过程中,农作物的健康问题一直是一个重要的研究课题。面向这一课题探讨智能化农业种植过程中的水稻病虫害分类问题。在智能化农业种植场景下,为了提高设备对病虫害的分类准确性,同时保护各设备的数据隐私,提出使用联邦学习来解决各设备间的数据孤岛问题。实验选取了七个预训练模型来提取特征,使用四个指标(准确率、召回率、损失函数和F1分数)来评估不同模型上的性能。实验结果表明,在独立同分布(IID)和非独立同分布(Non-IID)数据下模型VGG19的准确率分别为99.05%和98.48%,表现出较高的鲁棒性和准确率。通过几种实验和指标对比发现,联邦学习的应用提升了设备4.36%的准确率,图像分类模型的收敛时间受到联邦学习轮数round和每轮联邦学习中训练集的训练epoch数的共同影响,并且模型的稳定性随着参与联邦学习的设备数量增加而提高。
中图分类号:S435 文献标志码:A DOI: 10.16157/j.issn.0258-7998.245131
中文引用格式: 黄炯炯. 智慧农业下基于联邦学习的水稻病虫害分类研究[J]. 电子技术应用,2024,50(11):89-98.
英文引用格式: Huang Jiongjiong. Research on rice pest and disease classification based on federated learning under smart agriculture[J]. Application of Electronic Technique,2024,50(11):89-98.
Research on rice pest and disease classification based on federated learning under smart agriculture
Huang Jiongjiong
School of Mathematics and Computer Science, Zhejiang A&F University
Abstract: In the ongoing process of agricultural development, the health of crops continues to be a pivotal research area. Addressing this issue, this paper endeavors to delve into the classification of rice diseases within the framework of intelligent agricultural planting. Within the context of intelligent agricultural planting, this paper advocates the adoption of federated learning as a means to enhance the accuracy of disease classification equipment while safeguarding the data privacy of individual devices, thereby addressing the data silo problem among these devices. For the experimental phase, seven pre-trained models are meticulously selected to extract pertinent features, and four evaluation metrics—accuracy, recall, loss function, and F1-score—are employed to assess the performance of these models. The experimental outcomes reveal that the VGG19 model achieved remarkable accuracy levels of 99.05% and 98.48% on Independent and Identically Distributed (IID) and Non-Independent and Identically Distributed (Non-IID) data sets, respectively, showcasing its robustness and precision. Through a series of experiments and comparative analyses of various indicators, it is conclusively established that the integration of federated learning has enhanced the accuracy of the equipment by a noteworthy margin of 4.36%. Furthermore, the convergence time of the image classification model is influenced by a combination of factors, including the number of federated learning rounds and the training epochs per round within the training set. Notably, the stability of the model improves as the number of devices participating in federated learning increases.
Key words : smart agriculture;federated learning;image classification;pre-trained models

引言

水稻是全世界重要的食物来源,在亚洲更是占据了不可代替的地位。中国60以上的人口以米饭为主食,水稻种植面积在3 000万公顷左右,占我国总播种面积的五分之一以上[1]。在传统的农业生产模式中,人力资源的消耗通常十分显著。在水稻的种植过程中,细菌、真菌和其他微生物的侵害对水稻的健康状况和产量构成了严重威胁,导致了巨大的损失。农业生产中为了应对病虫害问题,需要投入大量劳动力,这不仅增加了农业成本,也加大了劳动力的工作负担。

物联网技术[2]和计算机视觉[3]等科技的引入、科技与农业的深度融合推动了农业智慧化方向的快速发展,实现智慧农业[4]的全新格局。在智慧农业下,农业通过智能农业设备进行水稻病虫害的自动化治理,不仅显著提升了农业种植的效率,更在减少农业损失方面发挥了至关重要的作用。这种智能化的治理模式不仅代表了农业现代化的重要方向,也为提高农业生产效益、促进农业可持续发展注入了新的动力与意义。

近年来,深度学习技术在各个领域都取得了巨大进展,特别是植物病虫害分类方面。随着农业智能化发展,人们对于智能治理植物病虫害提出了更高要求。在智慧农场中,由于分散于不同地区且归属于不同组织机构的农业设备在运行中产生了数据孤岛问题,给数据整合与分析带来较大困扰。为了解决该问题,本文在研究中加入了联邦学习框架(FL),联邦学习在设备进行深度学习任务时对数据隐私保护和提高模型性有很大帮助。联邦学习在2016年由谷歌研究院提出[5],它是一种分布式机器学习方法,允许在多个设备或计算节点上进行模型训练,而无需将原始数据传输到中央服务器。这种学习方法的核心思想是在保护数据隐私的同时,允许多个参与方共同学习一个全局模型,联邦学习有效地解决了数据孤岛[6]这个难题。

在以往的研究中,不少学者通过改进深度学习的卷积神经网络(CNN)来提高水稻病虫害的识别分类性能。比如Latif等学者[7]对预训练模型VGG19进行改进,在非归一化增强数据上拥有96.08的准确率,高于相同或类似数据集在其他研究中的表现。Bhimavarapu[8]在卷积神经网络中改进了激活和优化函数,减少了损失并明显地提高了预测性能和分类准确性。预训练能够加速训练过程并提高训练效果,在研究中使用预训练模型进行迁移学习也是不错的方法[9]。Ahad等学者[10]对六种CNN预训练模型进行了水稻病虫害分类比较,对五种预训练模型进行迁移学习,通过比较得到不同模型的效果及优缺点。

传统的集中式机器学习要面对数据安全隐私和数据中心化的挑战[11],医疗和金融领域饱受这些问题的困扰[12]。谷歌团队设计了联邦学习应用在这些领域来解决以上矛盾。在医疗领域,Sheller等研究者[13]发现,对十个医疗机构的数据进行联邦学习的结果已经达到了集中数据模型质量的99%。他们又进一步研究了合作机构间的数据分布对模型质量和学习模式的影响,通过与其他多种协作方法相比证明了联邦学习的优越性,联邦学习在医院数据上的应用将进一步推动个性化精准医疗的发展。Adnan等人[14]则是利用联邦学习分析医学上的组织病理学图像,与传统训练相比他们所使用的差分私有联邦学习是医学图像分析中机器学习模型协作开发的可行且可靠的框架。Li等人[15]提出一种联邦学习用于金融信用风险管理领域的应用方案,联邦学习在具有异构特征的Non-IID银行小样本数据下的金融信贷风险管理中的性能提高了14%。联邦学习在近期开始应用到了农业领域中。Sharma等学者[16]利用联邦学习下的CNN模型对马铃薯作物病虫害进行准确分类;Kaur等人[17]则是利用该技术对辣椒叶的疾病进行了分类;Tripathy等人[18]在联邦学习框架下,利用LeNet模型提取特征,对水稻病虫害进行了分类优化。联邦学习在这些农业场景下都有不错的表现。

尽管病虫害识别技术已相当成熟,但随着智慧农业的崛起,对该场景的需求也呈现出新的趋势和变化。本文在智慧农业场景下,使用联邦学习解决了不同机构和地区设备的数据孤岛问题。不同的数据分布对联邦学习产生影响,本文将水稻病虫害图像分为IID和Non-IID数据[19],并把预训练模型作为初模型进行特征提取以获得更高的效率和准确率。

针对以上几点,本文做了相应的研究和实验加以验证,证实了该场景下应用联邦学习和使用预训练模型的方案可行性并探索了适合该方案和实验环境下的预训练模型和条件。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006216


作者信息:

黄炯炯

(浙江农林大学 数学与计算机科学学院,浙江 杭州 311300)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。