想象一下,你正坐在飞速行驶的高铁上,试图用手机拍摄窗外转瞬即逝的风景。由于列车太快,有些照片模糊了,有些照片因为云影遮挡漆黑一片。为了还原那段旅程最真实、最清晰的画面,你不仅需要把拍下的碎片拼凑起来,可能还得通过“脑补”来填补那些漏掉的瞬间。
在遥感领域,科学家们正在做一件非常类似的事情,这被称为“遥感影像同化”。近期,数慧时空的研发团队在这一方向上经历了一场从“走弯路”到“见曙光”的深度探索。今天,我们就用小白也能听懂的语言,聊聊这场让卫星影像“穿越时空”的技术革新。
首先,我们要搞清楚两个核心概念:时间超分与数据同化。
1.时间超分(Time Super-Resolution):通常卫星(比如哨兵卫星)每隔几天才会飞过同一个地方拍一张照。如果我想看中间那几天发生了什么怎么办?AI会通过前后的影像,去“预测”中间过程。这就像你只有周一和周五的照片,AI帮你画出了周二到周四的“模拟图”。这张图在专业上被称为“背景场”。
用于生成背景场的视频超分模型VFIMamba模型结构
2.数据同化(DataAssimilation):Al画的模拟图(背景场)毕竟是猜的,可能不准。这时候,如果有其他卫星(比如Landsat卫星)正好在周三拍到了一点碎片信息,我们就可以用这些真实信息去订正那个猜出来的“背景场”。这个将“模拟预测”与“真实观测”结合,得出最接近真值的过程,就是同化。

用于同化改进背景场的全卷积时空预测模型SimVP模型结构
数慧时空的目标是建立一个统一的数字化底座,让每一寸土地都有时空连续、质量统一的数字化表达。
在研发初期,我们尝试了一个看似完美的逻辑:先找一段时间内的2帧哨兵卫星(Sentinel-2)数据进行“时间超分”,生成一个背景场,然后再把这段时间内所有能找到的哨兵数据都拿来做同化。
遥感界有一个永恒的敌人——云。如果输入的两帧原始影像里有云,AI在做时间超分时就会“抓瞎”,生成的背景场质量很差。虽然我们拥有先进的自动化质量检查技术,可以识别薄云、厚云和阴影,但如果“原材料”本身被云封印了,AI也难为无米之炊。

有云影像
经过大量测试,我们发现目前的同化模型表现得非常“保守”。它对背景场的调整极其微弱:
当背景场质量差(比如有云遮挡)时,同化模型订正后的结果依然不尽如人意。
当背景场本身质量很高(晴空万里)时,同化模型的订正效果由于太细微,肉眼甚至很难分辨出差别。
这让我们反思:模型是不是只是在做简单的“打补丁”,而不是深度的“信息融合”?
最重要的一点是,我们之前只用了哨兵卫星的数据。自己预测自己,再用自己来订正自己,数据信息的高度重叠导致了系统陷入了“循环论证”。就像你用同一本字典查同一个词,很难得到更深层的解释。
虽然前期遇到了瓶颈,但实验中发现了一个令人振奋的规律:参与同化的哨兵数据越多,最终结果相对于背景场的改进就越明显。
这一发现验证了方向的可行性。在遥感云脑DIEY的强力算子支撑下(2P算力,单日可处理200万平方公里),我们具备了处理海量多源数据的底气。于是,我们果断决定转变路线。
现在的研发路线已经发生了质的变化,核心策略可以概括为:“全量超分,跨界同化”。
目前在无云和少量云覆盖的情况下生成的背景场可视化结果已经非常惊艳,地物细节得到了极大程度的还原,但是在云覆盖面积较大的情况下,背景场质量不够高。后续我们不再只用2帧数据,而是把时间窗口内所有可用的哨兵数据全部塞进模型,尽可能生成一个纹理清晰、光谱准确的高质量背景场。
同化模型样本
为了打破数据重叠的魔咒,我们引入了Landsat 卫星作为观测数据。不同卫星之间的特征互补,就像请了一位不同的老师来纠正作业,能有效提升光谱信息的可靠性。以及再使用性能更强大的各类Fusion模型进行多源观测数据的同化。
这一升级逻辑实际上是在向AlphaEarth Foundations等全球统一地球基础模型看齐。通过统一的Embedding(嵌入式向量)表达,将像素转化为机器可读的连续变量,从而真正理解地表万物的演变趋势。
在评估模型性能时,我们又遇到了一个典型的坑:跨源数据评估的偏差。之前我们尝试用中国自有的高分(GF)系列卫星影像来评估基于哨兵卫星训练的模型。结果发现性能数据“不对劲"。
这是因为不同卫星的传感器、成像角度、光谱响应函数都不一样。我们的模型是完全基于哨兵数据训练的,去处理高分数据时会产生“水土不服”。这就像让一个只考过雅思的人去参加托福考试,虽然都是英语,但题型完全不同。
为了解决这个问题,我们接下来的评估将回归本质,寻找全新的、高质量的哨兵卫星影像作为“金标准”,进行公平的统计评估。但是高分辨率的高分GF系列数据仍然是很好的数据,可以后续用于其他用途,例如超分、作为多源观测数据进行同化。
目前的遥感影像同化进度虽然还在攻坚期,但通过“全要素感知”和“长城”大模型的亿级参数训练,我们正逐步攻克这些技术顽疾。
未来的DIEY2.0甚至3.0系统,将不仅仅是提取几个图斑,而是将建筑物、农田、水体转化为随时间演变的动态变量档案。通过地理空间思维链(Geo-CoT),系统能自动甄别哪些是季节性伪变化,哪些是真正的违法违规行为。
正如我们转变路线所验证的那样:数据同化的路虽然曲折,但只要我们不断汇聚更多源、更精准的信息,地球的每一处细微脉动都将在数字世界里清晰可见!







