大数跨境

TRE 2025.11|从静态图到动态流:AIS大数据驱动的多融合时空网络海上交通流预测

TRE 2025.11|从静态图到动态流:AIS大数据驱动的多融合时空网络海上交通流预测 Chris说出海
2025-10-24
65
导读:本篇论文基于五年AIS大数据,构建可分解多融合时空网络(DMFSTN),融合静态与动态图卷积及趋势-季节性分解,实现海上交通流的高精度预测与可解释时空建模。
原文链接见文末,或下方交流群二维码群内实时更新推文及原文 pdf,方便专家学者随时获取(若二维码失效,请翻阅扫描最新文章的二维码)。

从静态图到动态流:AIS大数据驱动的多融合时空网络海上交通流预测

一、研究背景与问题提出

海运承担了全球贸易超过 80% 的货运量,成为国际供应链的基石。随着贸易增长,港口需要通过预测海上交通流(Marine Traffic Flow,简称 MTF)来优化航线、分配泊位、减少航行时间并提高供应链效率。MTF 预测还可以用于风险管理和航运调度,帮助企业应对突发事件和天气影响。

当前 MTF 研究面临两方面困难:

  • 如何从海量 AIS 轨迹中稳定地提取海上交通网络。海上没有明确的路网,船舶在不同停泊区和航路点之间移动,提取节点及其邻接关系是基础性问题。
  • 如何融合时空特征并同时建模动态与静态特性。传统方法往往串联提取空间和时间特征,忽略了两者之间的微妙依赖关系,无法准确处理动态交通关系和船舶类型差异所带来的周期性变化。

为解决上述问题,作者提出了一个以 AIS 数据 为基础的端到端 MTF 预测框架。框架包含三大步骤:数据预处理、海上交通网络提取以及 MTF 预测。核心算法是 可分解多融合时空网络(DMFSTN),它在空间与时间、动态与静态之间建立多重融合机制,并将流量信号分解为趋势、季节性和残差,以提升预测精度和可解释性。

下图展示了研究区域的 AIS 密度分布以及四个典型节点的流量序列,深色部分代表船舶密度高。不同港口的时序特征差异明显,这进一步说明需要针对性地构建海上交通网络和模型。

图1 研究区域航运密度与主要节点流量(取自Fig.1)
图1 研究区域航运密度与主要节点流量(取自Fig.1)

二、数据与特征工程

2.1 AIS数据预处理

AIS(Automatic Identification System)能够实时提供船舶身份、位置、速度、航向等信息,是 MTF 研究的基础。作者使用丹麦海事局提供的北海和波罗的海地区五年 AIS 数据,覆盖 2019‑01‑01 至 2023‑12‑31,包含约 5 × 10⁹ 条记录和近 2 万艘船舶。

数据处理包括:

  • 数据合并与清洗:根据 MMSI 号合并多源数据,去除重复条目和异常记录;仅保留 MMSI 以 2–7 开头的船舶。
  • 轨迹分段与漂移点清理:按导航状态将 AIS 数据划分为“使用发动机航行”和“停泊”等状态,结合速度、航向变化与空间距离等阈值筛除异常点,并使用 DBSCAN 进一步过滤漂移点。

2.2 MTF定义与数学表示

作者定义了 MTF 预测任务:给定历史   个时间步的流量张量  ,预测未来   个时间步的流量  。交通网络表示为图  ,节点表示停泊区和航路点,邻接矩阵为 

船舶轨迹数据定义为按时间顺序的一系列观测:

其中每个观测点的特征向量为:

其中,  表示船舶标识,  和   分别为对地速度与航向角,  和   为经纬度,  为船舶类型,  为导航状态。

2.3 框架总体结构

为实现从原始 AIS 数据到海上交通流(MTF)的端到端预测,论文提出了可分解多融合时空网络(DMFSTN) 的整体流程,包含三大组件:数据预处理(Data Preprocess) 、海上交通网络提取(Marine Traffic Network Extraction) 、海上交通流预测(Marine Traffic Flow Prediction) 。该总体框架如下图所示。

  • Data Preprocess:合并与清洗 AIS 数据、轨迹分段、阈值与 DBSCAN 过滤异常点等,提高数据质量。
  • Marine Traffic Network Extraction:区分并聚类系泊点航路点,以凸包表示节点区域;基于历史航次顺序构建可达性边与其属性。
  • Marine Traffic Flow Prediction:在提取的海事图上进行多融合时空学习与可分解预测,包括静态/动态图卷积、时序建模与趋势-季节-残差分解。
图2 海上交通流预测框架(取自 Fig.2)
图2 海上交通流预测框架(取自 Fig.2)

三、海上交通网络提取方法

作者采用面向 向量型特征 的网络构建方法。主要步骤如下:

3.1 节点提取

  • 系泊点提取:先基于船舶轨迹中的“Moored”状态聚集停泊点,但由于状态标注不准确,作者对每艘船的连续停泊点计算平均经纬度作为该船的唯一系泊特征点,然后用 DBSCAN 聚类并计算凸包得到系泊区域。
  • 航路点提取:对每条轨迹的起止点采用 Ramer‑Douglas‑Peucker (RDP) 算法简化多段线,识别航向和速度变化明显的转弯点作为候选航路点,再用 DBSCAN 聚类得到航路区域。

在聚类后,作者使用 geohash 将研究区域划分为精度不同的网格(系泊区精度 0.1°×0.2°,航路区精度稍低),并在网格中统计点的类别占比,最终通过计算凸包得到各类节点的多边形表示。每个节点   包含类别  、质心经纬度   和凸包  。下图展示了提取的系泊区(蓝色)和航路区(绿色):

图3 提取的系泊点与航路点区域(取自Fig.4(a))
图3 提取的系泊点与航路点区域(取自Fig.4(a))

此外,为了更直观地展示系泊区域通过凸包计算后形成的多边形,下面给出凸包示例图:

图4 系泊点区域的凸包表示(取自Fig.3(b))
图4 系泊点区域的凸包表示(取自Fig.3(b))

3.2 边构建

遍历每艘船的航次,按船舶经过节点的顺序建立节点之间的有向边;同时记录船舶在该边上的通过次数、最大宽度、最大长度和最大吃水深度等属性,用于表示航道容量。汇总所有航次后,可按 4 小时粒度统计每个节点的流入流出量,从而形成 MTF 数据集。

四、可分解多融合时空网络模型(DMFSTN)

在构建海上交通流预测模型(DMFSTN)前,作者首先定义了输入与预测窗口的对应关系。模型以历史   个时间步的流量张量作为输入,用于预测未来   个时间步的流量输出,从而实现滑动窗口式的时序建模。

下图展示了输入(左)与输出(右)的时间窗结构:左半部分为历史窗口  ,右半部分为预测窗口  ,每个节点代表交通网络中的港口或航路段。

图5 历史与预测时间窗口示意图(取自 Fig.5)
图5 历史与预测时间窗口示意图(取自 Fig.5)

该结构清晰表明模型在时间维度上的输入输出关系,是 DMFSTN 进行多步预测与时空依赖建模的基础。

4.1 数据嵌入层

模型首先将输入的 MTF 序列   与时间特征(如小时、星期)嵌入到同一维度   的向量空间。令   为流量特征,  为时间特征,嵌入后的表示为:

其中 

4.2 静态图卷积模块(SGCN)

为了捕获长期稳定的空间邻接关系,SGCN 采用常规图卷积对静态邻接矩阵   进行归一化并对节点特征   进行传播:

其中   为 ReLU,  为可学习权重矩阵,  为卷积层数,  为时间步。

4.3 动态图卷积模块(DGCN)

为了动态建模不同时间步的航道关系,作者利用 自注意力机制 构建动态邻接矩阵。对特征矩阵   使用线性映射得到查询、键、值矩阵  ,计算注意力权重矩阵:

然后进行卷积更新:

残差连接使模型更稳定。

4.4 多图融合与时空联合

在得到静态特征   和动态特征   之后,作者采用门控机制控制不同特征的保留比例:

随后利用 LSTM 对每个时间步的图结构进行串联,实现空间与时间的一体化学习。给定时间   的图  、前一时刻隐藏状态   和记忆单元  ,更新公式为

所有时间步的隐藏向量串联得到时空特征 

4.5 流量分解模块

海上交通数据具有长周期和短周期的特征。作者借鉴 N‑BEATS 的思想,将时空特征分解为趋势、季节性和残差三个部分。模型包含 双支路残差堆叠,每层都有 “Look‑back” 和 “Look‑forward” 两个支路:

其中   为回溯(backcast)预测,  为前向(forecast)预测。每个支路都经过线性投影:

再分别进入 趋势感知栈 和 季节性感知栈。趋势部分通过多项式基函数建模慢变化趋势:

其中   为   的幂次项。季节性部分采用傅里叶基函数表示周期性:

并为无法分解部分增加一个全连接层作为残差栈。每层输出之和即为最终预测:

通过这种分解,模型不仅能提高预测精度,还能揭示航运流量的季节性和趋势信息,便于管理者理解长期和短期变化。

4.6 训练与损失函数

模型使用平均绝对误差(MAE) 作为损失函数:

同时采用 RMSE 和   指标评估不同模型的预测性能。

五、实验与结果分析

5.1 数据集与实验设置

实验选取北海和波罗的海的 AIS 数据,区域范围北纬 54°–58°30′,东经 7°18′–16°。作者将数据按 7:1:2 划分为训练、验证和测试集,历史时间步   取 12、24、48,预测步   取 12、24、48,四小时为一个时间片。模型在 Linux + PyTorch 环境下运行,采用 Adam 优化器,embedding 维度  ,SGCN/DGCN 层数均为 2,趋势和季节性堆叠层数分别为 3。

对比方法包括:历史平均(HA)、向量自回归(VAR)、LSTM、DCRNN、GWNet、GMAN、AGCRN、STPGCN 和 MultiSPANS 等,其中多种模型通过注意力机制或图卷积捕捉时空关系。

5.2 性能比较

实验结果显示,DMFSTN 在所有时间跨度上均取得最优或次优 MAE、RMSE 和  。在 48→48 长序列预测任务中,DMFSTN 的平均 MAE 为 1.924,明显低于基于注意力的 MultiSPANS(2.001),表明分解与多融合机制对于长期预测尤为有效。此外,作者对嵌入维度、卷积层数和分解层数进行了敏感性分析,发现模型对超参数不敏感,易于部署。

5.3 个案分析与可解释性

为了展示分解模块的作用,作者选取丹麦奥胡斯港(节点 23)和瑞典哥德堡港(节点 40)进行案例分析。下图为输入 48 步预测 48 步的结果,包括总预测曲线及三栈分解的趋势、季节性和残差。

图6 分解后的趋势、季节性与残差预测示例(取自Fig.7)
图6 分解后的趋势、季节性与残差预测示例(取自Fig.7)

从图中可以看到:

  • 每层趋势栈捕捉到不同的长期变化。节点 23 的趋势呈先降后升,与丹麦港口流量的复苏相符。
  • 季节性栈提取到周期约 50 个时间窗的波动,说明该港口可能存在周或月度航运周期。
  • 残差栈捕捉到噪声或异常波动,节点 40 的残差更明显,说明该港口的流量受突发因素影响较大。

这些分解结果有助于港口管理者判断流量变化的原因,安排泊位和调度计划。

5.4 模型优势总结

  • 网络构建可靠:通过区分系泊点和航路点、利用 DBSCAN 和凸包,网络节点更准确稳定。
  • 动态-静态融合:静态图卷积描述长期稳定关系,动态图卷积利用注意力捕获航路随时间变化的依赖。
  • 时空一体化:LSTM 对序列化图结构进行传播,避免传统先空间后时间的 “夹心结构” 所造成的信息丢失。
  • 可解释性强:趋势与季节性分解揭示长期趋势和周期变化,使预测结果更易于解释。
  • 适用范围广:模型在长序列预测任务中表现突出,证明适用于复杂周期的海上交通场景。

六、结论与启示

本文解析了《A decomposable multi‑fusion spatio‑temporal marine traffic flow forecasting algorithm》一文,针对北海和波罗的海地区提出了一套端到端的海上交通流预测框架。该框架通过数据清洗和精细的交通网络构建,实现了从 AIS 数据出发自动提取节点和航道;基于多融合的图神经网络模型,既捕获动态与静态空间关系,又融合时间依赖;通过趋势‑季节性分解提升预测精度和可解释性。实验证明,该方法在短期和长期预测任务上均优于现有基线模型。

对港口管理与航运领域的启示:

  • 精确网络建模 能够揭示关键航线和节点,为航道规划和港口扩建提供依据。
  • 动态‑静态融合的预测模型 可以提高调度决策的及时性,尤其适用于受天气和作业影响较大的航运场景。
  • 趋势与季节性分析 有助于识别长期增长或衰退信号,监测周/月周期波动,以及识别异常事件。

未来研究可以进一步融入气象、潮汐等外部因素,探索更大范围海域的应用,或与自动化调度系统结合,实现实时的航运优化。

文章须知 

推文编辑:单子叶 

责任编辑:弓仪长

原文链接:https://doi.org/10.1016/j.tre.2025.104340


【声明】内容源于网络
0
0
Chris说出海
跨境分享角 | 每日更新跨境思考
内容 0
粉丝 3
Chris说出海 跨境分享角 | 每日更新跨境思考
总阅读0
粉丝3
内容0