大数跨境
0
0

扔掉 Re-ID,也能实时追车!FastTracker:从“识人”到“识万物”,一个更通用的多目标跟踪框架

扔掉 Re-ID,也能实时追车!FastTracker:从“识人”到“识万物”,一个更通用的多目标跟踪框架 极市平台
2025-08-22
2
↑ 点击蓝字 关注极市平台
作者丨我爱计算机视觉
来源丨我爱计算机视觉
编辑丨极市平台

极市导读

 

FastTracker 打破行人跟踪“偏科”,用轻量级遮挡-与道路-感知策略让车辆也能被实时精准锁定,并奉上全新车辆跟踪基准,一举推动多目标跟踪走向真正“万物通用”。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

多目标跟踪(Multi-Object Tracking, MOT)是计算机视觉领域的一项核心技术,它旨在实时地追踪视频中所有感兴趣的目标。然而,一个长期存在的问题是,现有的MOT系统大多是“偏科生”,它们在行人跟踪任务上表现优异,这得益于MOT17、MOT20等主流基准测试集都以行人为主。但当把这些模型直接应用到其他场景,如复杂的交通监控中,去跟踪汽车、卡车、公交车时,它们的性能往往会“水土不服”,泛化能力有限。

为了解决这一问题,来自Pintel Co. Ltd.的研究者们提出了一个名为 FastTracker 的通用多目标跟踪框架。它不仅能处理多种类型的目标,更在车辆跟踪这一重要场景上进行了特别优化。通过引入“遮挡感知”和“道路结构感知”两大策略,FastTracker在不依赖复杂外观特征(Re-ID)的情况下,实现了对多类别目标,尤其是车辆的鲁棒、实时、准确的跟踪。

  • 标题: FastTracker: Real-Time and Accurate Visual Tracking

  • 作者: Hamidreza Hashempoor, Yu Dong Hwang

  • 机构: Pintel Co. Ltd.

  • 论文地址: https://arxiv.org/abs/2508.14370

  • 项目地址:

    • 代码: github.com/Hamidreza-Hashempoor/FastTracker
    • 数据集: huggingface.co/datasets/Hamidreza-Hashemp/FastTracker-Benchmark

背景:超越行人,走向通用目标跟踪

自动驾驶、智能交通、城市安防等现实世界应用,要求MOT系统不能仅仅是一个“行人跟踪器”。系统必须能够同时、准确地跟踪场景中所有重要的动态目标,包括各种形态、速度、运动模式各不相同的车辆。然而,车辆跟踪相比行人跟踪,面临着更独特的挑战:

  • 更严重的遮挡: 车辆体积大,相互遮挡频繁且持续时间长。
  • 更快的速度与更复杂的运动: 车辆速度快,运动模式受道路结构强约束。
  • 缺乏专用基准: 缺乏一个能够全面评估多类别、尤其以车辆为中心的跟踪算法的公开基准。

FastTracker正是为了应对这些挑战而设计的,它不仅提出了新的跟踪策略,还贡献了一个全新的车辆跟踪基准数据集。

FastTracker框架:两大策略提升跟踪鲁棒性

FastTracker遵循主流的“检测后跟踪”(Tracking-by-Detection)范式,其核心创新在于关联和更新阶段,引入了两个轻量级但极其有效的策略。

遮挡感知的Re-ID机制

在拥挤的交通场景中,一个目标(如一辆小轿车)被大卡车完全遮挡后再次出现,如何确认它还是原来的那辆车(即Re-ID),是MOT的一大难题。传统方法通常依赖计算成本高昂的深度学习外观特征(Re-ID网络)来解决。FastTracker则巧妙地采用了一系列基于运动和几何的启发式策略来处理遮挡,无需额外的Re-ID网络。

  • 速度抑制(Dampen Velocity): 当一个目标被判断为遮挡状态时,系统会抑制其卡尔曼滤波器中的速度更新,防止其因错误的预测而“飘”得太远。
  • 检测框放大(Enlarge Box): 同时,被遮挡目标的预测框会被适度放大。这增加了当它重新出现时,与新的检测框产生交并比(IoU)重叠的概率,从而更容易被重新关联上。

这些简单的策略组合在一起,极大地提升了在严重遮挡情况下保持ID的稳定性,有效减少了ID切换(ID Switch)的错误。

道路结构感知的轨迹细化

与行人的相对自由移动不同,车辆的运动轨迹受到道路结构的强力约束。FastTracker创新地将这种 语义场景先验 融入到跟踪过程中,以修正不切实际的轨迹。

  • 区域限制(ClampToROI): 利用预先定义的道路区域(ROI),防止目标轨迹漂移到路外等不可能出现的区域。
  • 方向约束(ProjectToCone): 根据车道线方向定义一个合理的“运动锥”,如果目标的预测运动方向超出了这个锥形范围,就将其投影回合理的方向内。

通过利用这些免费的场景上下文信息,FastTracker能够有效过滤掉由检测噪声或短暂遮挡引起的错误轨迹预测,使跟踪结果更平滑、更合理。

FastTracker基准数据集

为了促进车辆跟踪的研究,作者还发布了一个全新的 FastTracker Benchmark。该数据集包含12个视频,超过80万个标注框,涵盖了9个交通相关类别。其场景多样,包括了十字路口、隧道、高速公路等,具有高目标密度和频繁遮挡的特点,为评估通用MOT算法提供了更真实、更具挑战性的平台。

实验与结果

FastTracker不仅在其自建的数据集上表现出色,在主流的行人跟踪基准上也取得了极具竞争力的结果,证明了其通用性。在经典的MOT17和MOT20测试集上,FastTracker的HOTA分数分别达到了 66.4 和 65.7,超越了包括ByteTrack、StrongSORT在内的许多知名跟踪器。

消融实验也充分验证了其提出的遮挡处理和道路结构约束策略的有效性。

论文贡献与价值

CV君认为,FastTracker这项工作为多目标跟踪领域带来了重要的贡献:

  1. 推动MOT的通用化: 它将研究重点从饱和的行人跟踪领域,拓展到了更具挑战性、也更具应用价值的多类别(尤其是车辆)跟踪,并取得了SOTA性能。
  2. 提供了轻量高效的策略: 其提出的遮挡感知和道路结构感知策略,不依赖于沉重的深度网络,计算开销小,易于实现,为在资源受限设备上部署高性能跟踪器提供了范本。
  3. 贡献了新的基准数据集: FastTracker Benchmark填补了现有数据集中车辆跟踪场景复杂度和多样性不足的空白,将推动社区开发更鲁棒的通用跟踪算法。

总而言之,FastTracker通过一系列精巧而实用的设计,成功打造了一个更通用、更鲁棒的多目标跟踪框架,为MOT技术的实际落地应用铺平了道路。


公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读919
粉丝0
内容8.2k