一、介绍
Sparse Laneformer 是 AMD AEAI 发表的一篇自动驾驶领域车道线的论文,论文是基于 transformer 架构和新颖的稀疏 anchor 的新方案,兼具效率和精度。
2D 车道线检测是辅助驾驶中重要的感知模块,用于感知车道线的信息,为智驾提供重要的环境感知系统。传统的 2D 车道线检测方案可以粗分为 1)segmentation-based 的方法,2)parameter-based 的方法和 3)anchor-based 的方法,其中anchor-based 的方法一般精度高速度快,但其一个特点需要设计比较稠密合理的 anchor,一般有几种常见的 anchor设计方法:1)从图片底边发射anchor,2)从消失点发射 anchor,3)基于行的 anchor等方法。anchor-based 方法通常需要分析数据集车道线分布来调整anchor设计来获取高精度。
文章基于 transformer-based 设计一种可学习的稀疏anchor 来解决anchor-based 存在的问题,其包括稠密anchor 和数据集依赖问题。基于 transformer 设计一个新颖的高效的车道线检测方法。

二、方法介绍
车道线表示方法:通过固定点数(x,y)如72点来描述车道线,所有车道线线的 y 都是 0-71,所以只需要通过72个 x 值即可以描述一条车道线。
Sparse anchor 设计:通过预设 k(20)个 anchor,每个 anchor 由一对 lane query 和 angle query 组成,如图 Fig 2,k 个 anchor 初始化为均匀的垂线,通过 angle query 预测 angle 来调整 anchor 设计,同时 lane query 预测 lane 相对对应 anchor的偏移量,最终达到精确预测车道线的目标。车道线 GT 通过 label assign 策略来匹配对应合适的(附近的)anchor 完成模型整体的优化。

方法的整体架构:2 阶段方案,第二阶段基于第一阶段的结果 refine 预测。

核心模块:要完成 query 和 feature 的交互,传统的 cross-attention 效率不高,文章设计了新的 cross-attention 模块,效率和精度均佳。
Horizontal Perceptual Attention (HPA)

Lane Perceptual Attention (LPA)

三、实验结果
SOTA 方法对比:精度在 CULane 和 Tusimple 数据集取得 SOTA 效果,验证方法的有效性。

-
消融实验:证明了稀疏 anchor 和 two-stage 机制的有效性。


四、一些思考
完成 transformer-based 方法,并取得不错的效果,工作量确实较大而难得。
Sparse anchor 设计很合理且有效,设计的 cross-attention 模块也很有效果。
可惜一点的精度并没有相对 CNN 的 anchor-based 方法有明显提升。

