精准农业中提升作物产量预测精度的核心技术：深度学习、机器学习和遥感技术- 大数跨境

AgriPheno平台

2025-09-05

137

导读：本文聚焦精准农业（PA）如何通过技术创新提升作物产量预测精度这一核心议题，系统梳理了遥感技术、机器学习等相关技术应用现状、实践案例、现存挑战与未来方向，为精准农业领域的研究与实践提供了全面参考。

全球农业正面临气候变化与人口增长的双重挑战，粮食安全问题日益严峻。世界卫生组织（WHO，2023）估算，2030年起，高温、饥饿、疾病等气候相关因素每年将导致25万人死亡，凸显气候变化对人类生存的直接威胁；联合国报告（UN Report，2024）预测，2050年全球人口将增至96亿，粮食需求大幅攀升，而当前全球营养不良问题已较为突出，气候变化进一步加剧了粮食生产压力。

同时，农业生产本身对气候存在显著影响且高度依赖稳定气候条件。氮肥使用、农场废弃物管理、燃料消耗及牲畜肠道发酵是农业温室气体排放的主要来源；传统农业资源利用效率低，难以应对气候波动带来的产量波动，亟需创新管理模式。

在此背景下，#精准农业（Precision agriculture，PA）作为数据驱动、技术赋能的新型农业管理策略，成为平衡“产量提升”与“环境可持续”的核心方案。它跳出传统农业“大水漫灌”的模式，通过传感器、无人机、GPS导航系统及机器学习算法，实时监测并量化特定作物、农田的需求（Linaza et al.，2021），既能优化肥料、水、除草剂等投入，降低运营成本，又能减少环境影响，推动农业可持续发展（Gawande et al., 2023）。

图1 基于深度学习和遥感技术的作物模型预测因子相关影响因素

作物产量预测是精准农业的“核心中枢”。提前预判产量，不仅能帮粮食种植者规避虫害、干旱等风险，指导施肥量调整与收获规划，还能为全球粮食安全决策提供依据。近期，印度GLA大学和俄罗斯人民友谊大学学者聚焦这一核心，在Frontiers in Agronomy发表了题为“Precision agriculture for improving crop yield predictions: a literature review”的综述，系统梳理了遥感技术与机器学习在产量预测中的应用现状、实践案例、现存挑战与未来方向，为精准农业领域的研究与实践提供了全面参考。

核心技术：深度学习、机器学习与遥感技术

深度学习是农业领域处理复杂时空数据、提升产量预测精度的核心技术，无需人工特征工程，可自动从数据中提取关键信息（Tian et al., 2021），其模型通常包含输入层、输出层与隐藏/激活层（Yang et al., 2019），数据经多层神经网络处理后生成预测结果，各层从不同粒度提取特征并组合为抽象特征（Nguyen et al., 2019）。

经典作物模拟模型：APSIM、CERES、WOFOST、DSSAT、AquaCrop等模型（Jones, 2003; Capa-Morocho et al., 2016）为深度学习提供基础参考，这些模型可模拟作物与环境、资源的交互过程。研究证实（Lecerf et al., 2019），其“作物模型预测因子”解释产量变异性的效果优于单纯气象变量。

深度神经网络（DNN）：突破浅层网络局限，能揭示输入变量与产量的非线性关系，省去人工特征构建（LeCun et al., 2015）。Khaki and Wang (2019) 基于环境与基因型数据，用DNN预测杂交玉米产量，均方根误差（RMSE）12.81 kg/1000m²，验证相关系数0.814，性能优于回归树（RT）、浅层神经网络（SNN）等模型；Sobhana et al. (2022) 结合地理数据与DNN开发“CROPUP”系统，集成XGBoost技术，全季节产量预测准确率达99.3%。但DNN存在“梯度消失/膨胀”问题，可能导致网络难以收敛（He et al., 2016）。

卷积神经网络（CNN）：擅长处理空间数据（如影像），分多类变体。1D-CNN沿时间或光谱维度应用，Zhong et al. (2019) 用多时相Landsat增强植被指数（EVI）数据，通过1D-CNN分类夏季作物，准确率与F1分数优于随机森林（RF）、支持向量机（SVM）；2D-CNN聚焦空间特征，Yang et al. (2021) 用其构建玉米产量预测模型，特征提取优势显著；3D-CNN融合时空数据，Nevavuori et al. (2020) 用其预测田间产量，精度高于其他模型；Nevavuori et al. (2019) 还基于无人机RGB与归一化差异植被指数（NDVI）数据，用CNN精准预测芬兰亚北极地区小麦、大麦产量。

循环神经网络（RNN）与长短期记忆网络（LSTM）：RNN因“梯度消失/膨胀”难捕捉长期时序关系，LSTM则解决这一问题。de Freitas Cunha and Silva (2020) 用气象与土壤数据构建LSTM，提升早期产量预测适用性；Wang et al. (2023) 用双向LSTM（Bi-LSTM）预测水稻产量，平均误差25 kg/m²；Sharma et al. (2020) 融合CNN与LSTM，用CNN提取空间特征、LSTM处理时序数据，小麦产量预测准确率达74%，优于单一卷积技术（50%）。

输入特征优化：植被指数（VIs）与环境因子的组合是提升模型精度的关键。Fernandes et al. (2017) 发现，NDVIre（红边归一化差异植被指数）、NDVI、GNDVI（绿光归一化差异植被指数）在玉米田间变异性监测中表现优异；Haghverdi et al. (2018) 证实，NDVIre预测作物生产力效果优于NDVI与GNDVI；Wang et al. (2020) 结合NDVI、APAR（吸收光合有效辐射）（植被指数）与冠层表面温度、水分胁迫指数（环境因子），提升玉米产量预测精度。表1列出了NDVI、RVI（比值植被指数）等9类用于产量预测的植被指数及对应参考文献。

表1 用于产量预测和田间制图的不同植被指数列表

机器学习可自主利用多源数据集解决非线性问题，利用多源数据集提取规律，是深度学习的重要补充。在产量预测中，主流模型包括：贝叶斯神经网络（BNN）、混合策略模型、反向传播神经网络（BPNN）等。

贝叶斯神经网络（BNN）：Ma et al. (2021) 构建县级BNN玉米产量预测模型，既能准确预测常规年份产量，也能精准估算极端天气导致的异常年份产量，平均决定系数（R²）0.77。

混合策略模型：Ren et al. (2023) 结合深度学习与WOFOST模型，针对不同作物生长阶段定制特征组合，预测结果平均相对误差（MRE）1.5、RMSE 102.65 kg/ha、R² 0.98，为农业规划提供可靠数据。

反向传播神经网络（BPNN）：Chu and Yu (2020) 将BPNN与独立循环神经网络（IndRNN）结合，构建水稻产量预测模型，提升预测适应性。

工具与数据增强：常用深度学习框架包括PyTorch（Paszke et al., 2019）、CNTK（Seide and Agarwal, 2016）、MatConvNet（Vedaldi and Lenc, 2015），依托GPU后端可训练大规模参数网络；Scikit-learn（2022）库也集成了深度神经网络。数据增强方面，Du et al. (2019) 采用旋转、翻转等技术扩大数据集；Wang et al. (2020) 用弱监督学习与域适应技术解决训练数据不足问题。

遥感技术提供及时、稳定、低成本的特征数据（Justice et al., 2002），是产量预测的重要数据支撑，主要包括三类数据来源：田间传感器、卫星影像、航拍。

田间传感器：利用特定波长（绿色520-550nm、蓝色440nm、红色690nm等）进行荧光成像（Coops et al., 2003），Lenk et al. (2007) 用多光谱数据区分果实质量、光合活动与植物病害症状；高光谱数据通过小波变换等方法，可精准检测叶片生化成分或病虫害导致的光谱异常（Knyazikhin et al., 2013）。

卫星影像/航拍：Landsat、SPOT、Sentinel-2等卫星提供10-100米中等分辨率数据，用于区域层面农业生产评估。Noureldin et al. (2013) 用Landsat 5 TM、SPOT 4影像评估作物产量与生物量；Yang et al. (2009) 借助Quickbird、SPOT5、Landsat影像解决小面积监测问题，提升预测精度；Rebouh et al. (2023b) 用10米分辨率Sentinel-2卫星监测不同管理措施下小麦生长，发现绿色叶绿素指数预测产量效果最佳；Shirsath et al. (2020) 基于MODIS增强植被指数制作区域作物产量地图。

机载多光谱传感器生成高分辨率图像，Torresan et al. (2016)、Manfreda et al. (2018) 证实其在植被与生态系统监测中的价值。地面光谱仪可采集350-2500nm光谱波段数据（Numata et al., 2008）作为地面 “真值” 参考，为星载高光谱数据估算草地生物物理属性提供基础数据与验证支撑；多时相光学与微波合成孔径雷达（SAR）卫星数据也被用于小麦等作物监测（Defourny et al., 2019），SAR时间序列可识别作物残茬与间作作物。

产量预测性能评估指标

模型输出与实际数据的对比是产量预测的关键环节，需采用科学评估指标区分模型性能（Elavarasan et al., 2020）。回归模型核心评估指标包括：

决定系数（R²）：衡量模型对数据的拟合度，越接近1越好，比如某模型R²=0.98，说明它能解释98%的产量变化；

平均绝对误差（MAE）：算的是预测值与实际值的平均绝对偏差，值越小越准，适合直观判断误差大小；

均方误差（MSE）：会放大较大误差，能凸显模型对极端值的处理能力，比如预测异常年份产量时，MSE小的模型更可靠；

均方根误差（RMSE）：MSE开平方，和产量数据同量纲，比如RMSE=12.81 kg/1000m²，能直接对应到实际减产或增产的重量；

平均绝对百分比误差（MAPE）：算的是误差占实际值的百分比，方便跨作物、跨区域对比，比如MAPE=5%，说明预测值和实际值的差距平均在5%以内。

分类问题则以分类准确率为主要评估指标。

挑战与未来方向

地理局限性：不同区域作物类型、气候、耕作方式差异大，导致模型泛化能力弱；土壤、气候数据易存在噪声或缺失，影响预测精度；作物生长受土壤养分、病虫害、气候等多因素交互影响，关系复杂，增加预测难度。

技术可扩展性：深度学习模型训练耗时久，依赖高算力（如GPU），且复杂模型未必带来最佳用户体验；多传感器数据（光谱、空间、时间分辨率不同）融合难度大，可能降低监测可靠性（Joshi et al., 2023）；不同来源遥感数据的质量与一致性受传感器校准、大气条件等影响，增加数据处理难度（Omia et al., 2023）。

数据隐私与安全：农户与农业技术提供商（ATPs）的数据权利划分不清晰，需建立合理的利益分配、权利保护与审计机制（Yu et al., 2025）；数据所有权、共享及访问权限问题需解决，以保障敏感数据安全、建立信任并符合数据保护法规（Shawe and McAndrew, 2023）。

能源效率：大数据处理依赖高能耗数据中心，尽管单位功率性能提升，但整体能耗仍居高不下（Al-Fares et al., 2008），导致温室气体排放增加，与可持续农业目标矛盾。

模型普适性：难以构建适用于所有作物或特定作物类型的通用预测策略，模型适用性受限。

图2 作物产量预测中人工智能（AI）与机器学习（ML）的数据收集与分析步骤流程图

技术融合：结合空间数据（田间实测）、历史数据（作物轮作）与多源遥感数据，构建混合模型；整合卫星衍生作物物候与种植实践信息，提升模型精度（Adrian et al., 2021; Xu et al., 2021）。

模型优化：发展迁移学习技术，减少对原位数据的依赖，结合作物物候与农业实践知识提升模型适应性；优化深度学习模型架构（如增加层数、调整参数），增强对复杂数据关系的捕捉能力。

服务化与标准化：构建云服务实现全球精准作物制图与面积估算（Kussul et al., 2017）；制定多源数据融合与处理标准，提升数据兼容性；采用无偏估计器调整实际作物面积，解决分辨率偏差问题（Olofsson et al., 2014）。

可持续发展：设计低能耗数据中心，优化服务器、存储及网络基础设施的能源利用效率，平衡技术应用与环境影响。

结论

优化气候条件、土壤特性、作物养分管理、冠层与生物量，同时保障水分含量、防控病虫害、选择适宜作物品种，可显著提升作物产量与农业产出。综述表明，深度学习模型的产量预测精度通常优于传统机器学习模型，但需通过测试不同特征数量与模型复杂度筛选最优模型。遥感技术是快速、低成本、高效的作物活力监测与产量估算工具，基于少量输入的直接统计与经验模型，结合遥感传感器数据及反映作物生化、生物物理特性的实测因子，可提升预测精度与效率。

尽管卫星数据与处理能力已较先进，许多机构仍采用卫星衍生作物监测方法支持政策制定，但当前技术尚未实现作物近实时、精准的定量监测。未来需关注预测不确定性建模，提升预测结果的可解释性与可靠性。精准农业技术的持续发展，将推动农业可持续性提升，为全球粮食安全挑战提供解决方案，助力农业预测领域创新。

原文

Saha S., et al. Precision agriculture for improving crop yield predictions: a literature review[J]. Frontiers in Agronomy, 2025, 7: 1566201.