【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型

图片[1] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本

这篇论文发表在 《Expert Systems With Applications》 期刊,该期刊主要涉及专家系统、人工智能及其在不同领域的应用。

  • 作者:Ishak Pacal
  • 作者单位:土耳其伊迪尔大学计算机工程系

研究动机

玉米叶病的及时检测对提高作物生产力、减少农药使用及保障粮食安全至关重要。现有研究多依赖小规模数据集(如PlantVillage),且CNN和Vision Transformer模型在准确率与推理速度上存在局限。本文旨在通过整合多源数据集、改进模型结构,提出一种轻量高效的MaxViT变体,以提升农业场景下的实际应用价值。

核心方法

  1. 模型改进
    • MaxViT轻量化调整:针对4分类任务缩减模型层数(Block数)和通道数(Channel),减少参数量的同时提升推理速度。
    • SE模块集成:在MaxViT的Stem模块中引入Squeeze-and-Excitation(SE)模块,增强通道特征表达能力。
    • GRN-based MLP替换:采用ConvNeXtV2的全局响应归一化(GRN)技术替代原MLP层,提升模型泛化性。
  2. 数据集构建
    整合PlantVillage(4类)、PlantDoc(3类)和CD&S(3类)数据集,形成包含4类(灰斑病、健康叶、叶枯病、锈病)的5234张图像新数据集,按70:15:15划分为训练、验证和测试集,确保数据多样性(不同背景、分辨率、拍摄条件)。
图片[2] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本
图片[3] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本
图片[4] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本

实验结果

  • 准确率:改进后的MaxViT模型在测试集上达到99.24%的准确率,超越所有对比模型(包括28种CNN和36种ViT)。
  • 效率:推理速度达0.007毫秒/图像,GPU内存占用仅29%(7GB),参数量为19.07M,优于MaxViT-Tiny(30.41M)和大型ViT模型。
  • 混淆矩阵分析:健康叶分类完美(F1=1.0),灰斑病误判率最低(F1=0.988),叶枯病和锈病的召回率分别为98.01%和99.49%。

对比算法

  • CNN模型:DenseNet-121(98.09%)、EfficientNetV2-Large(97.83%)、Xception(97.84%)表现较优,但均低于本文模型。
  • Vision Transformer模型:MaxViT-Tiny(98.35%)、ViT-Small-Patch16(98.22%)、SwinV2-Small(98.09%)表现突出,但参数量和速度不及改进模型。
  • 轻量化模型对比:优于MobileViT(97.96%)、EfficientFormer(97.71%)等,证明结构优化的有效性。
图片[5] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本
注意:表二标题错误,应为PlantDoc数据集
图片[6] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本
图片[7] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本

数据集

  • PlantVillage:3839张(4类),包含Cercospora叶斑病、普通锈病等。
  • PlantDoc:375张(3类),背景复杂,包含自然场景。
  • CD&S:1571张(2类,灰斑病和叶枯病),高分辨率田间图像。
  • 合并后数据集:平衡各类样本量,灰斑病(1104)、健康叶(1162)、叶枯病(1666)、锈病(1302),增强模型泛化能力。

改进空间

  1. 数据多样性:需纳入更多环境因素(如光照变化、不同生长阶段)和罕见病害样本。
  2. 实时部署:进一步压缩模型以适应移动端设备,探索量化或蒸馏技术。
  3. 多任务扩展:结合病害严重度评估和定位任务,提升农业决策支持能力。
  4. 解释性增强:引入可视化技术(如Grad-CAM)帮助农民理解模型决策依据。

总结

本文通过结构优化与数据整合,提出高性能的轻量化MaxViT模型,显著提升玉米叶病检测的准确率和效率,为农业智能化提供了实用解决方案。未来工作可围绕多模态数据融合和边缘计算部署展开。

手写笔记

图片[8] - AI科研 编程 读书笔记 - 【人工智能】通过玉米叶片病害识别提高作物生产力与可持续性:利用大型数据集与先进视觉Transformer模型 - AI科研 编程 读书笔记 - 小竹の笔记本
© 版权声明
THE END
点赞13 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片快捷回复

    暂无评论内容