全球农业正面临气候变化与人口增长的双重挑战,粮食安全问题日益严峻。世界卫生组织(WHO,2023)估算,2030年起,高温、饥饿、疾病等气候相关因素每年将导致25万人死亡,凸显气候变化对人类生存的直接威胁;联合国报告(UN Report,2024)预测,2050年全球人口将增至96亿,粮食需求大幅攀升,而当前全球营养不良问题已较为突出,气候变化进一步加剧了粮食生产压力。
同时,农业生产本身对气候存在显著影响且高度依赖稳定气候条件。氮肥使用、农场废弃物管理、燃料消耗及牲畜肠道发酵是农业温室气体排放的主要来源;传统农业资源利用效率低,难以应对气候波动带来的产量波动,亟需创新管理模式。
在此背景下,#精准农业(Precision agriculture,PA)作为数据驱动、技术赋能的新型农业管理策略,成为平衡“产量提升”与“环境可持续”的核心方案。它跳出传统农业“大水漫灌”的模式,通过传感器、无人机、GPS导航系统及机器学习算法,实时监测并量化特定作物、农田的需求(Linaza et al.,2021),既能优化肥料、水、除草剂等投入,降低运营成本,又能减少环境影响,推动农业可持续发展(Gawande et al., 2023)。
图1 基于深度学习和遥感技术的作物模型预测因子相关影响因素
作物产量预测是精准农业的“核心中枢”。提前预判产量,不仅能帮粮食种植者规避虫害、干旱等风险,指导施肥量调整与收获规划,还能为全球粮食安全决策提供依据。近期,印度GLA大学和俄罗斯人民友谊大学学者聚焦这一核心,在Frontiers in Agronomy发表了题为“Precision agriculture for improving crop yield predictions: a literature review”的综述,系统梳理了遥感技术与机器学习在产量预测中的应用现状、实践案例、现存挑战与未来方向,为精准农业领域的研究与实践提供了全面参考。
经典作物模拟模型:APSIM、CERES、WOFOST、DSSAT、AquaCrop等模型(Jones, 2003; Capa-Morocho et al., 2016)为深度学习提供基础参考,这些模型可模拟作物与环境、资源的交互过程。研究证实(Lecerf et al., 2019),其“作物模型预测因子”解释产量变异性的效果优于单纯气象变量。
深度神经网络(DNN):突破浅层网络局限,能揭示输入变量与产量的非线性关系,省去人工特征构建(LeCun et al., 2015)。Khaki and Wang (2019) 基于环境与基因型数据,用DNN预测杂交玉米产量,均方根误差(RMSE)12.81 kg/1000m²,验证相关系数0.814,性能优于回归树(RT)、浅层神经网络(SNN)等模型;Sobhana et al. (2022) 结合地理数据与DNN开发“CROPUP”系统,集成XGBoost技术,全季节产量预测准确率达99.3%。但DNN存在“梯度消失/膨胀”问题,可能导致网络难以收敛(He et al., 2016)。
卷积神经网络(CNN):擅长处理空间数据(如影像),分多类变体。1D-CNN沿时间或光谱维度应用,Zhong et al. (2019) 用多时相Landsat增强植被指数(EVI)数据,通过1D-CNN分类夏季作物,准确率与F1分数优于随机森林(RF)、支持向量机(SVM);2D-CNN聚焦空间特征,Yang et al. (2021) 用其构建玉米产量预测模型,特征提取优势显著;3D-CNN融合时空数据,Nevavuori et al. (2020) 用其预测田间产量,精度高于其他模型;Nevavuori et al. (2019) 还基于无人机RGB与归一化差异植被指数(NDVI)数据,用CNN精准预测芬兰亚北极地区小麦、大麦产量。
循环神经网络(RNN)与长短期记忆网络(LSTM):RNN因“梯度消失/膨胀”难捕捉长期时序关系,LSTM则解决这一问题。de Freitas Cunha and Silva (2020) 用气象与土壤数据构建LSTM,提升早期产量预测适用性;Wang et al. (2023) 用双向LSTM(Bi-LSTM)预测水稻产量,平均误差25 kg/m²;Sharma et al. (2020) 融合CNN与LSTM,用CNN提取空间特征、LSTM处理时序数据,小麦产量预测准确率达74%,优于单一卷积技术(50%)。
输入特征优化:植被指数(VIs)与环境因子的组合是提升模型精度的关键。Fernandes et al. (2017) 发现,NDVIre(红边归一化差异植被指数)、NDVI、GNDVI(绿光归一化差异植被指数)在玉米田间变异性监测中表现优异;Haghverdi et al. (2018) 证实,NDVIre预测作物生产力效果优于NDVI与GNDVI;Wang et al. (2020) 结合NDVI、APAR(吸收光合有效辐射)(植被指数)与冠层表面温度、水分胁迫指数(环境因子),提升玉米产量预测精度。表1列出了NDVI、RVI(比值植被指数)等9类用于产量预测的植被指数及对应参考文献。
表1 用于产量预测和田间制图的不同植被指数列表
机器学习可自主利用多源数据集解决非线性问题,利用多源数据集提取规律,是深度学习的重要补充。在产量预测中,主流模型包括:贝叶斯神经网络(BNN)、混合策略模型、反向传播神经网络(BPNN)等。
贝叶斯神经网络(BNN):Ma et al. (2021) 构建县级BNN玉米产量预测模型,既能准确预测常规年份产量,也能精准估算极端天气导致的异常年份产量,平均决定系数(R²)0.77。
混合策略模型:Ren et al. (2023) 结合深度学习与WOFOST模型,针对不同作物生长阶段定制特征组合,预测结果平均相对误差(MRE)1.5、RMSE 102.65 kg/ha、R² 0.98,为农业规划提供可靠数据。
反向传播神经网络(BPNN):Chu and Yu (2020) 将BPNN与独立循环神经网络(IndRNN)结合,构建水稻产量预测模型,提升预测适应性。
工具与数据增强:常用深度学习框架包括PyTorch(Paszke et al., 2019)、CNTK(Seide and Agarwal, 2016)、MatConvNet(Vedaldi and Lenc, 2015),依托GPU后端可训练大规模参数网络;Scikit-learn(2022)库也集成了深度神经网络。数据增强方面,Du et al. (2019) 采用旋转、翻转等技术扩大数据集;Wang et al. (2020) 用弱监督学习与域适应技术解决训练数据不足问题。
遥感技术提供及时、稳定、低成本的特征数据(Justice et al., 2002),是产量预测的重要数据支撑,主要包括三类数据来源:田间传感器、卫星影像、航拍。
田间传感器:利用特定波长(绿色520-550nm、蓝色440nm、红色690nm等)进行荧光成像(Coops et al., 2003),Lenk et al. (2007) 用多光谱数据区分果实质量、光合活动与植物病害症状;高光谱数据通过小波变换等方法,可精准检测叶片生化成分或病虫害导致的光谱异常(Knyazikhin et al., 2013)。
卫星影像/航拍:Landsat、SPOT、Sentinel-2等卫星提供10-100米中等分辨率数据,用于区域层面农业生产评估。Noureldin et al. (2013) 用Landsat 5 TM、SPOT 4影像评估作物产量与生物量;Yang et al. (2009) 借助Quickbird、SPOT5、Landsat影像解决小面积监测问题,提升预测精度;Rebouh et al. (2023b) 用10米分辨率Sentinel-2卫星监测不同管理措施下小麦生长,发现绿色叶绿素指数预测产量效果最佳;Shirsath et al. (2020) 基于MODIS增强植被指数制作区域作物产量地图。
机载多光谱传感器生成高分辨率图像,Torresan et al. (2016)、Manfreda et al. (2018) 证实其在植被与生态系统监测中的价值。地面光谱仪可采集350-2500nm光谱波段数据(Numata et al., 2008)作为地面 “真值” 参考,为星载高光谱数据估算草地生物物理属性提供基础数据与验证支撑;多时相光学与微波合成孔径雷达(SAR)卫星数据也被用于小麦等作物监测(Defourny et al., 2019),SAR时间序列可识别作物残茬与间作作物。
产量预测性能评估指标
模型输出与实际数据的对比是产量预测的关键环节,需采用科学评估指标区分模型性能(Elavarasan et al., 2020)。回归模型核心评估指标包括:
决定系数(R²):衡量模型对数据的拟合度,越接近1越好,比如某模型R²=0.98,说明它能解释98%的产量变化;
平均绝对误差(MAE):算的是预测值与实际值的平均绝对偏差,值越小越准,适合直观判断误差大小;
均方误差(MSE):会放大较大误差,能凸显模型对极端值的处理能力,比如预测异常年份产量时,MSE小的模型更可靠;
均方根误差(RMSE):MSE开平方,和产量数据同量纲,比如RMSE=12.81 kg/1000m²,能直接对应到实际减产或增产的重量;
平均绝对百分比误差(MAPE):算的是误差占实际值的百分比,方便跨作物、跨区域对比,比如MAPE=5%,说明预测值和实际值的差距平均在5%以内。
分类问题则以分类准确率为主要评估指标。
技术可扩展性:深度学习模型训练耗时久,依赖高算力(如GPU),且复杂模型未必带来最佳用户体验;多传感器数据(光谱、空间、时间分辨率不同)融合难度大,可能降低监测可靠性(Joshi et al., 2023);不同来源遥感数据的质量与一致性受传感器校准、大气条件等影响,增加数据处理难度(Omia et al., 2023)。
数据隐私与安全:农户与农业技术提供商(ATPs)的数据权利划分不清晰,需建立合理的利益分配、权利保护与审计机制(Yu et al., 2025);数据所有权、共享及访问权限问题需解决,以保障敏感数据安全、建立信任并符合数据保护法规(Shawe and McAndrew, 2023)。
能源效率:大数据处理依赖高能耗数据中心,尽管单位功率性能提升,但整体能耗仍居高不下(Al-Fares et al., 2008),导致温室气体排放增加,与可持续农业目标矛盾。
模型普适性:难以构建适用于所有作物或特定作物类型的通用预测策略,模型适用性受限。
图2 作物产量预测中人工智能(AI)与机器学习(ML)的数据收集与分析步骤流程图
技术融合:结合空间数据(田间实测)、历史数据(作物轮作)与多源遥感数据,构建混合模型;整合卫星衍生作物物候与种植实践信息,提升模型精度(Adrian et al., 2021; Xu et al., 2021)。
模型优化:发展迁移学习技术,减少对原位数据的依赖,结合作物物候与农业实践知识提升模型适应性;优化深度学习模型架构(如增加层数、调整参数),增强对复杂数据关系的捕捉能力。
服务化与标准化:构建云服务实现全球精准作物制图与面积估算(Kussul et al., 2017);制定多源数据融合与处理标准,提升数据兼容性;采用无偏估计器调整实际作物面积,解决分辨率偏差问题(Olofsson et al., 2014)。
可持续发展:设计低能耗数据中心,优化服务器、存储及网络基础设施的能源利用效率,平衡技术应用与环境影响。
尽管卫星数据与处理能力已较先进,许多机构仍采用卫星衍生作物监测方法支持政策制定,但当前技术尚未实现作物近实时、精准的定量监测。未来需关注预测不确定性建模,提升预测结果的可解释性与可靠性。精准农业技术的持续发展,将推动农业可持续性提升,为全球粮食安全挑战提供解决方案,助力农业预测领域创新。

白露秋分夜,一夜凉一夜。

