大数跨境

想发中科院一区,那就要把Transformer与卡尔曼滤波融合在一起!

想发中科院一区,那就要把Transformer与卡尔曼滤波融合在一起! AI前沿速递
2026-03-18
5
导读:想发中科院一区,那就要把Transformer与卡尔曼滤波融合在一起!

Transformer+卡尔曼滤波正处在学术产出的黄金窗口期。这一方向“问题够老、方法够新、应用够广”,尤其适合对状态估计有高要求的领域。

从学术视角看,其痛点明确、基线清晰,叠加热门的交叉属性,受众广泛。更关键的是,该领域并不内卷,创新路径多元:既可设计轻量级专用注意力模块,也可在热门场景中实现应用型创新。

本文整理了16篇前沿论文(含代码,高区)。无论选择哪个切入点,都请从复现开始。希望这些成果能助你快速找到思路。



扫码添加小助手,发送关键词【C883】
免费领取《Transformer+卡尔曼滤波 论文合集》
图片



论文标题:Adaptive Kalman-Informed Transformer

关键词: Inertial sensing, Sensor fusion, Set transformer, Extended Kalman filter, Autonomous underwater vehicle

研究方法:

在水下导航的INS(惯性导航)与DVL(多普勒计程仪)传感器融合中,传统的EKF通常假设过程噪声协方差是恒定的,这在复杂多变的水下环境中极易导致导航发散。针对这一【动态非线性环境下的过程噪声协方差在线估计问题】,本文提出了一种名为【A-KIT(自适应卡尔曼信息Transformer)】的混合解决方案。其核心工作原理是截取一段包含惯性传感器和EKF状态估计的时间序列数据,利用1D卷积进行分块嵌入后,输入到对排列不敏感的Set Transformer网络中。该网络通过多头注意力机制捕捉数据的非线性特征和隐含相关性,实时输出当前最优的自适应过程噪声协方差缩放因子,从而反馈给卡尔曼滤波器的预测与更新步骤,实现误差的自适应抑制。

论文创新点:

  1. 提出/构建了A-KIT混合算法框架,实现了深度学习降噪能力与传统扩展卡尔曼滤波(EKF)严密数学理论的完美融合。
  2. 创新地设计了卡尔曼信息损失函数(Kalman-informed loss),解决了传统数据驱动方法脱离物理模型,导致过程噪声协方差估计不符合最优状态要求的核心难题。
  3. 通过引入Set Transformer的池化多头注意力(PMA)方法,将长序列惯性数据的注意力计算复杂度从O( )降低到O( )( 为可学习聚集向量数,远小于输入长度 )。
  4. 首次将集合Transformer架构与水下自主航行器(AUV)的INS/DVL非线性传感器融合结合,验证了其在真实海试数据中位置精度较传统EKF提升高达49.5%。

论文链接: https://arxiv.org/abs/2401.09987


扫码添加小助手,发送关键词【C883】
免费领取《Transformer+卡尔曼滤波 论文合集》
图片



论文标题:HiLO: High-Level Object Fusion for Autonomous Driving using Transformers

关键词: Autonomous Driving, High-Level Fusion, Transformers, Cross-Domain Evaluation, Object Detection

研究方法:

在自动驾驶的环境感知中,特征级融合虽然精度高但计算过于庞大且极易受单个传感器失效影响,而传统的高层目标级融合(将各传感器输出的独立目标列表进行合并)又高度依赖卡尔曼滤波的手动调参。针对这一【兼顾算力限制与高鲁棒性目标级关联融合问题】,作者提出了名为【HiLO(High-Level Object Fusion)】的解决方案。HiLO基于著名的DETR架构进行了轻量化改造,其核心工作原理是将相机、雷达等不同传感器产生的目标框坐标及属性,通过正弦位置编码后输入到Transformer的编码器中。编码器通过多模态自注意力计算目标间的相关性,随后解码器利用固定数量的查询向量(Queries)提取特征,直接端到端地输出去重、融合后的全局统一目标列表。

论文创新点:

  1. 构建了基于DETR架构的HiLO高层目标融合网络,实现了端到端的多模态传感器(相机、雷达)层面的目标状态级联融合与去重。
  2. 创新地引入了包含无对象类(no-object class)的二分图匹配损失机制,解决了跨传感器目标在复杂遮挡或虚警情况下的最优匹配与分配难题。
  3. 通过设计仅包含186k参数量的轻量级编码器-解码器方法,将多传感器目标关联匹配的耗时复杂度从O(繁琐迭代追踪算法)降低到O(极速的单次前向传播开销,仅需约3.4毫秒)。
  4. 首次将Transformer高层融合模型与自动驾驶跨域评估(高速公路与城市道路)结合,验证了其在两百万帧真实世界数据中F1分数较传统滤波基线最高提升了25.9个百分点。

论文链接: https://arxiv.org/abs/2506.02554




扫码添加小助手,发送关键词【C883】
免费领取《Transformer+卡尔曼滤波 论文合集》
图片

【声明】内容源于网络
0
0
AI前沿速递
AI前沿速递 聚焦人工智能最新科研成果与技术动态,专注前沿论文解读、行业资讯分享与高校招生信息推送,助力AI爱好者和从业者把握学界风向标。每日更新技术干货与深度内容,让全球优秀研究被更多人看见。关注我们,探索AI无限可能!
内容 1887
粉丝 0
AI前沿速递 AI前沿速递 聚焦人工智能最新科研成果与技术动态,专注前沿论文解读、行业资讯分享与高校招生信息推送,助力AI爱好者和从业者把握学界风向标。每日更新技术干货与深度内容,让全球优秀研究被更多人看见。关注我们,探索AI无限可能!
总阅读3.0k
粉丝0
内容1.9k