大数跨境
0
0

FuXi-Nowcast: 应对临近预报中长期存在的对流初生挑战

FuXi-Nowcast: 应对临近预报中长期存在的对流初生挑战 气象学家
2025-12-14
0
导读:(加EarthAi微信交流群+商务合作,请备注:姓名-行业-单位) FuXi-Nowcast: 应对临近预报
加EarthAi微信交流群+商务合作,请备注:姓名-行业-单位)


 

FuXi-Nowcast: 应对临近预报中长期存在的对流初生挑战

https://arxiv.org/abs/2512.08974

一、研究背景与科学问题

(一)对流初生预报的挑战

对流初生(Convective Initiation, CI)的准确预报一直是气象业务部门和技术攻关中的"硬骨头"。从大气科学基本原理来看,CI过程涉及从边界层热动力不稳定累积到对流云突破抑制层结的全过程,这个过程在时空尺度上极其狭窄——通常只在几公里到十几公里的空间范围和数十分钟的时间窗口内发生。传统雷达观测往往要在回波强度达到35-40 dBZ后才能确认对流发生,但此时对流已经进入发展阶段,预警时效大打折扣。更棘手的是,CI的发生依赖于复杂的三维大气环境条件,包括低层水汽辐合、抬升触发机制(如边界层辐合线、阵风锋、地形抬升等)、不稳定能量垂直分布等,而这些关键信息在单纯的二维雷达回波图中根本无法体现。这就是为什么过去几十年,无论是基于TITAN这类传统外推算法,还是基于光流法的跟踪技术,在CI预报上都基本束手无策。

(二)现有临近预报技术的局限性

当前业务体系中的临近预报技术存在三个根本性问题:

第一,外推时效瓶颈。纯雷达回波外推方法在2小时以后的预报技巧断崖式下降,根本原因在于雷达资料仅代表大气中水凝物的分布,无法捕捉驱动天气系统演变的大尺度环流背景。当对流风暴的演变由环境风切变、干冷空气侵入等三维动力过程主导时,单纯基于回波平流的外推必然失效。

第二,强度衰减顽疾。这几乎是所有深度学习临近预报模型的通病。无论是PredRNN系列还是DGMR这类生成模型,在预报强对流时都会出现"心有余而力不足"的现象——模式能大概报出强对流的位置,但强度往往在几个时次内迅速衰减。这背后是模型损失函数对极端值不敏感、样本分布严重偏态导致的训练偏差问题。简单说,模型"没见过"足够多的强天气样本,也缺乏维持强度的物理约束。

第三,单一变量局限。传统方法大多只关注降水量预报,但业务预报需要的是多灾种协同监测。一次强飑线过程往往伴随狂风、短时强降水和冰雹,单变量预报无法满足防灾减灾的实际需求。MetNet-3虽然实现了多变量输出,但其依赖NWP分析场的架构在实时性上存在硬伤。

(三)本研究的切入点

本文作者团队敏锐地抓住了两个突破口:一是利用机器学习天气预测模型FuXi-2.0提供的三维大气场作为"大尺度驱动场",既规避了传统NWP的时效延迟问题,又为深度学习模型补充了关键的环境场信息;二是设计了针对性的对流信号增强模块和分布感知损失函数,从技术层面缓解强度衰减问题。这种"全球-区域耦合、动力-学习融合"的思路,本质上是在数据驱动框架中注入物理过程的合理表征,是当前大气科学交叉研究的前沿方向。


二、FuXi-Nowcast系统架构与技术突破

(一)整体框架设计

FuXi-Nowcast本质上是一个多任务自回归预报系统,其核心创新在于将低分辨率三维大气场与高分辨率地面观测在统一框架下进行端到端训练。从信息流角度看,系统实现了三大突破:

1. 多源数据融合策略

模型输入不是简单的"图像堆叠",而是经过精心设计的五维张量(B×T×C×H×W),其中时间维度T=3代表t-2、t-1、t三个历史时次,变量维度C=78融合了8个高分辨率局部变量(雷达回波、地面观测、HRCLDAS分析)和70个大尺度三维变量。这种设计的关键在于:大尺度场(0.25°)通过插值到1km分辨率后,并不直接作为预报对象,而是作为"环境场"约束条件,引导高分辨率细节的生成。类似数值模式中的"谱逼近"思路,但完全在深度学习的可微分框架下实现。

2. 多任务学习框架

主预报分支同时输出8个变量(2米温度、10米风速/阵风、雷达组合反射率、降水等),辅助分支专门处理降水分类任务(11类降水强度等级)。这种设计的好处是:分类任务通过focal loss和dice loss强制模型学习降水的空间结构特征,这些特征通过共享编码器反哺给主预报分支,使回归预报的空间一致性显著提升。从大气科学角度看,这相当于在损失函数层面引入了降水系统的形态学约束——飑线必须是线状的,单体必须是块状的,不能出现"碎片化"的虚假回波。

(二)对流信号增强模块

这是解决强度衰减问题的核心创新。该模块在特征提取前对输入进行阈值化池化操作,本质上是一个自适应的"强对流放大器"。技术实现上,它通过学习一个动态权重矩阵,对超过特定阈值的强对流区域(如反射率>30 dBZ)进行特征增强,同时保持弱回波区的空间结构不变。从物理意义上讲,这相当于在数据预处理阶段就告诉模型:"这些区域是重点关注的对象,不要在学习过程中丢失"。这种显式的特征增强比单纯在损失函数中加权更有效,因为它直接作用于梯度传播路径,避免了深层网络中的梯度弥散问题。

(三)分布感知混合损失函数

作者针对气象变量的偏态分布特性,构建了一个六分量混合损失函数,这是本研究在技术上最扎实的部分:

Charbonnier损失:对所有变量施加L1-L2混合范数约束,在误差较大时表现为L1鲁棒性,误差较小时表现为L2光滑性。ε=1e-6的设置保证了数值稳定性。

Balanced L1损失:专门针对降水量的长尾分布。关键创新在于将降水值域在对数空间划分为11个不均匀区间(0.1, 0.77, 1.86, ..., 100 mm),根据区间样本频率倒数加权。这实际上是在训练过程中动态重采样,强迫模型"记住"罕见强降水事件。从统计学角度看,这是重要性采样(importance sampling)在深度学习中的巧妙应用。

LPIPS和SSIM损失:这两个感知损失函数的引入,标志着气象预报评估从"像素级精度"向"形态学逼真度"的跃升。LPIPS使用预训练的VGG网络提取高层特征,本质上是在匹配强对流系统的"云图纹理";SSIM则保证预报场的空间结构相似性。这对业务预报尤为重要——预报员不仅关心降水量值,更关心雨带的走向、范围和强度梯度。

Focal和Dice损失:针对降水分类任务,解决样本极度不平衡问题。Focal loss通过(1-pt)^γ降低易分类样本权重,γ=1.5的设置经验上平衡了难易样本;Dice loss则直接优化空间重叠度,减少了"报出有雨但位置偏差"这类业务上最头疼的问题。


三、数据基础与模型训练

(一)训练数据构成

1. 三维大气场数据

训练期(2019-2023年4-9月)使用ERA5再分析数据,推理期使用FuXi-2.0预报场。这种"再分析训练-预报推理"的策略是业务化落地的关键。ERA5的5天延迟使其无法用于实时预报,但其历史一致性和质量远高于业务预报场。FuXi-2.0作为机器学习全球预报模型,提供连续逐时预报,规避了传统NWP的6-8小时延迟问题。值得注意的是,作者使用了13层标准等压面层(50-1000 hPa)的五个基本场(位势、温度、U/V风、比湿),这涵盖了从对流层顶到低层大气的完整垂直结构,为CI预报提供了必要的稳定度、水汽和动力条件信息。

2. 高分辨率观测数据

  • • 雷达资料:1km分辨率的组合反射率,6分钟原始数据抽取整点值。这里有个细节值得商榷:整点抽取可能引入时间采样误差,强对流系统的演变往往在分钟级,未来可考虑时间插值或概率匹配。
  • • 地面站资料:江苏1326个站的风速/阵风观测,通过反距离权重插值到网格。阵风定义为小时最大瞬时风速,这在业务上是标准定义,但插值过程会平滑掉极端值,可能是高阈值(>17.2 m/s)预报性能下降的原因之一。
  • • HRCLDAS:作为多变量"真值"场,其质量直接影响模型性能。作者指出HRCLDAS融合了地面观测、卫星和NWP产品,但其本身在高影响天气中的质量需要进一步验证,特别是降水的观测-分析一致性。

3. 静态地表信息

包括海陆分布和地形高度。1km分辨率下,江苏沿海的滩涂、长江下游水系等复杂下垫面对对流触发有重要影响。静态场的引入使模型能够学习"陆面-大气"的统计关系,这是纯雷达方法无法实现的。

(二)数据预处理与质量控制

作者采用了一个非常明智的数据过滤策略:训练阶段只保留"有天气"的样本,即满足"降水>1mm的格点数>10个"或"阵风>10.8 m/s的格点数>10个"。这相当于从海量晴空样本中筛选出约10-15%的对流样本进行"强化训练"。从机器学习理论看,这是主动学习(active learning)的体现,让模型在有限算力下专注于困难样本。但这也带来潜在风险:模型可能对晴空误报率偏高。测试集未过滤的设计保证了评估的客观性。

(三)训练策略与优化方法

  • • 优化器:AdamW(β1=0.9, β2=0.95)是Transformer模型的标准配置,权重衰减有效防止过拟合。
  • • 学习率调度:先线性warm-up到2.5×10⁻⁴,再余弦衰减到5×10⁻⁶。这种调度适合大模型训练,避免了早期训练震荡和后期收敛停滞。
  • • 批次与迭代:虽然原文未明确批次大小,但从模型规模(24个Swin Transformer块)和768×768的输入尺寸看,训练成本相当高,估计需要A100级别显卡并行训练数周。

四、验证评估与性能分析

(一)检验方法与评估指标

1. 临界成功指数(CSI)

CSI是二分类预报的核心指标,对高影响天气尤为敏感。作者选择的阈值体现了业务需求:

  • • 降水阈值:1, 5, 10, 20, 30, 40, 50 mm/h,涵盖了从弱对流到极端暴雨的全谱段
  • • 阵风阈值:10.8, 13.9, 17.2 m/s,分别对应6级、7级、8级大风

CSI的计算公式中,分母包含命中、空报、漏报三项,对空报和漏报同等惩罚。在业务中,空报可能导致不必要的防御成本,漏报则可能引发灾害,因此CSI比单纯的POD或FAR更全面。

2. 其他评估手段

除了CSI,文中虽未明确提及,但从损失函数设计可推断,模型在训练中同时优化了结构相似性(SSIM)和感知相似性(LPIPS)。建议作者在后续工作中补充这些指标的独立评估,特别是对对流形态(如线状飑线、弓形回波)的结构评分。

(二)整体统计性能

图1的CSI曲线揭示了三个关键事实:

首先,FuXi-Nowcast在所有变量、所有阈值、所有时效上全面优于CMA-MESO。这不是简单的"略有提升",而是在12小时预报期内持续保持优势。特别值得注意的是,CR在>50 dBZ强回波段,2小时后FuXi-Nowcast的CSI是CMA-MESO的2-3倍,这直接证明了强度衰减问题的缓解。

其次,降水预报的优势最显著。对于>20 mm/h的强降水,CMA-MESO在6小时后CSI基本归零,而FuXi-Nowcast在12小时仍保持约0.02的CSI。虽然绝对值不高,但相对提升巨大。这反映了一个现实:强降水预报本身就是世界性难题,2%的CSI可能意味着几次成功的极端暴雨预警。

第三,阵风预报的稳定性。在17.2 m/s阈值下,FuXi-Nowcast在6小时后技巧下降,这可能与两个因素有关:一是地面观测插值平滑了极端阵风;二是阵风与对流下沉气流、微下击暴流等小尺度过程相关,1km分辨率仍显不足。

(三)对流事件预报能力评估

从统计评估转向对流尺度分析,FuXi-Nowcast展现了三个能力层次:

  1. 1. 初生识别:能提前3-6小时识别出对流发生潜势区
  2. 2. 强度维持:预报的对流核心强度衰减速率明显慢于对比系统
  3. 3. 结构演化:能模拟对流从离散单体到组织化线状系统的形态转变

这与损失函数中的LPIPS和SSIM直接相关——模型不仅要报准数值,还要报得像雷达观测。


五、个例分析

(一)2025年6月16日对流过程

这是一次典型的干锋触发对流过程,发生在江淮梅雨期前的转换季节。从预报员视角看,这个案例极具代表性:

观测特征:09UTC干锋过境,11-12UTC江苏中部出现离散对流单体,13-14UTC组织成准线状中尺度对流系统(MCS),最强回波>50 dBZ,伴随地面8-10级雷雨大风。

FuXi-Nowcast表现

  • • 时效性:09UTC初始化后,T+3h(12UTC)预报出35-40 dBZ对流核,与观测的CI时间一致
  • • 结构:预报的线状对流走向(东北-西南)与观测高度吻合
  • • 强度:预报回波略弱于观测(约低5-10 dBZ),但衰减速度可控

CMA-MESO表现

  • • 空报:T+1h就报出>35 dBZ强回波,明显过早
  • • 漏报:T+3h后回波迅速减弱,未能报出13-14UTC的持续强天气
  • • 结构:对流形态过于零散,未呈现观测中的组织化线状特征

这个案例清晰地展示了数据驱动模型与传统物理模式在"初次冲击"和"持续记忆"上的差异。NWP模式由于初始场误差和模式物理的阻尼效应,往往"报得早但报不长";而FuXi-Nowcast通过学习历史数据中的统计规律,能更好地把握对流的"生命周期"特征。


六、讨论与系统局限性

(一)对流初生定位精度问题

作者坦诚指出,尽管能把握CI的大致时间,但空间定位精度仍需提升。这涉及到深度学习中的一个根本矛盾:大尺度环境场(0.25°)向高分辨率(1km)的降尺度过程必然带有不确定性。从大气科学角度看,CI的触发往往发生在边界层辐合线、地形抬升点、热岛边界等尺度为1-3km的"关键点"上。当前系统缺乏对这些触发机制的显式表征,未来可考虑引入边界层高度、对流有效位能(CAPE)梯度等更具有物理意义的诊断量作为辅助输入。

(二)小尺度特征捕捉能力

文中提到CMA-MESO偶尔在局地细节上优于FuXi-Nowcast,这个现象值得深思。它揭示了一个基本事实:机器学习模型在统计平均意义上更优,但数值模式基于物理守恒定律,在某些特定的小尺度结构上可能更合理。这提示了一个混合架构的潜力:用NWP提供"物理锚点",用深度学习进行偏差订正和多尺度融合。类似ECMWF的机器学习后处理思路,但需要在更高分辨率上实现。

(三)区域适用性与可移植性

目前模型仅在华东地区训练和验证,其泛化能力存疑。从气候学角度看,华东的强对流以梅雨锋、台风前部、江淮气旋为主要模态,而华北、华南、西南的对流触发机制和生命史特征差异巨大。直接迁移模型可能导致性能下降。作者提出的"区域模型生成高分辨率真值"是一条可行路径——用区域公里尺度模式(如WRF-LES)模拟不同气候区的对流过程,构建覆盖全国的训练集。


七、未来发展方向

(一)数据源的扩展与融合

卫星资料,特别是静止卫星的全圆盘红外、水汽通道和闪电观测,是提升CI预报的关键。FY-4B的16通道扫描辐射计和闪电成像仪能提供对流云顶冷却速率和闪电活动先兆信息,比雷达提前30-60分钟。多源数据融合需要解决时空匹配和不确定性量化问题,可考虑使用注意力机制动态权重不同源数据。

(二)模型架构的改进

当前Swin Transformer的窗口注意力机制适合捕捉局部相关,但对流系统的大尺度组织过程需要全局感受野。未来可探索:

  • • 层次化架构:类似HRNet的多分辨率并行处理,保留不同尺度的特征
  • • 物理信息神经网络(PINN):将热力学方程作为软约束嵌入损失函数
  • • 概率预报:生成未来多成员集合,提供不确定性估计

(三)业务化应用前景

距离业务部署还有三个门槛:

  1. 1. 实时性:FuXi-2.0虽然快,但端到端12小时预报的延迟需<15分钟才能满足业务更新频率
  2. 2. 健壮性:对数据缺失(雷达故障、站网稀疏)的容错能力需加强
  3. 3. 可解释性:预报员需要理解模型"为什么报出这块强对流",可结合梯度加权类激活映射(Grad-CAM)等技术可视化关键输入特征

八、总结

FuXi-Nowcast代表了临近预报从"观测外推"向"动力-学习融合"的范式转变。它成功将机器学习全球预报的大尺度信息与高分辨率观测结合,通过创新的对流增强模块和分布感知损失,在CI预报和强度维持上取得实质性突破。12小时的预报时效已超越传统临近预报范畴,进入"短临-短期"过渡期,为无缝隙预报体系构建提供了技术原型。

然而,必须清醒认识到,数据驱动模型目前仍是"高级统计工具",离真正理解对流发生发展的物理机制还有距离。其优势建立在训练数据的丰富性和代表性上,一旦遇到超出样本分布的极端事件(如超级单体、龙卷),泛化能力将面临严峻考验。因此,未来的发展方向必然是"物理引导的机器学习",即在大气边界层理论、云微物理参数化等先验知识指导下,构建具有因果推理能力的混合预报系统。


以上是对文章的详细解读,如有不当之处欢迎批评指出!也可以私信小编(Earth_Ai)。

 

END


声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编(微信:qxxjgzh)处理。



气象学家
微信公众号|小红书|微信视频号


【声明】内容源于网络
0
0
气象学家
把握最新AI4S、解读最新气象科研进展、分享气象实用编程技巧、追踪气象即时资讯。致力于提升我国天气和气候预报、预测水平。欢迎加入气象AI和气象行业交流群以及气象博士群!与13W+专业人士一起交流互动!
内容 8359
粉丝 0
气象学家 把握最新AI4S、解读最新气象科研进展、分享气象实用编程技巧、追踪气象即时资讯。致力于提升我国天气和气候预报、预测水平。欢迎加入气象AI和气象行业交流群以及气象博士群!与13W+专业人士一起交流互动!
总阅读4.0k
粉丝0
内容8.4k