本次分享两篇轨迹预测相关 CVPR 2020poster 论文:
基于候选轨迹的轨迹预测方法(TPNet: Trajectory Proposal Network for Motion Prediction)
TPNet 论文地址:https://arxiv.org/pdf/2004.12255.pdf
基于递归目标关系图的轨迹预测方法(Recursive Social Behavior Graph for Trajectory Prediction)
RSBG 论文地址:https://arxiv.org/pdf/2004.10402.pdf
论文作者来自商汤自动驾驶分析与预测组、港中文 MM Lab 实验室以及上海交通大学卢策吾老师团队。
随着自动驾驶的快速发展,如何理解自动驾驶周围目标的行为成为自动驾驶系统中的重要一环。轨迹预测任务旨在根据目标(如行人、车辆等交通参与者)当前或者历史轨迹与环境信息,对该目标未来的行驶轨迹进行预测。轨迹预测结果是自动驾驶系统进行提前决策的重要信息之一。
轨迹预测任务有以下几个难点:
-
预测结果多模态(multimodal)特性:对于同一条历史轨迹,不同目标可能有不同的未来轨迹。例如在十字路口,A 车可能左转, B 车可能直行。如何对不同意图进行建模,使预测方法能够生成较为完善的预测结果是轨迹预测任务较为关注的一点。 -
预测结果可解释、可靠: 交通参与者一般会受到各种交通规则的约束,如何利用这些规则输出安全可靠的预测结果对于自动驾驶系统而言至关重要。 -
目标间交互关系建模: 在自动驾驶场景中,目标间的行为不仅受到其自身的意图影响,还会受到周围其他目标行为的影响。
早先的做法,例如 pooling 和 attention,都是基于行人之间的欧式距离来判断交互关系的强弱。这种基于欧氏距离的判断方法,不能很好的处理现实生活中复杂的情况。例如下图中所示,上图两人虽然相隔整个场景,但是表现出了很强的相遇的行为倾向。而下图的三组行人,红色两组虽然距离较远,但是表现出了跟随的行为,而红蓝两组虽然距离较近,但是没有产生很强的相互作用。
方法介绍
基础特征提取模块结合目标的历史轨迹、环境信息(道路结构),使用基于 CNN Encoder-Decoder 的结构提取特征。并基于该特征对目标未来的终点进行初步预测。
候选轨迹生成模块基于预测得到的终点,生成一系列候选轨迹。为了生成多模态特性的候选轨迹集,我们提出两种候选轨迹生成方法:基于单个终点的候选轨迹生成、基于多个意图的候选轨迹生成。为了减小轨迹的搜多空间,我们将轨迹建模为三次曲线,通过生成曲线簇来生成候选轨迹集合。基于单个终点的候选轨迹生成方法以预测得到的终点为中心生成一个固定大小的网格,通过遍历网格的中心生成 M 个可能的终点。为了生成不同弯曲程度的候选轨迹,基于每个可能的终点,生成 N 个控制点。最终将 M 个可能终点与 N 个控制点两两组合,并结合历史轨迹点,通过三次曲线拟合的方法,我们可以得到 MxN 个候选轨迹,如下左图示(橙色实线为候选轨迹)。基于多个意图的候选轨迹生成则针对目标的不同意图,生成不同的终点,然后利用基于单个终点的候选轨迹生成生成不同的候选轨迹集合。以车辆预测为例,Argoverse 数据集提供了车辆不同的可能行驶路线(参考线),我们针对每条参考线预测出不同终点并生成对应候选轨迹,如下右图示(绿色虚线为参考线)。

对于所有正样本及部分随机采样的负样本,轨迹修正模块对候选轨迹的终点及控制点进行修正,修正公式定义为:
最后对于不在可行驶区域的候选轨迹与预测轨迹,我们提出使用如下高斯衰减对其分类置信度进行衰减:
RSBG
1. 个体表征模块是用来对每个人的历史行为和周围环境进行分析编码。考虑到人类行为具有前后关联的性质,我们使用双向 LSTM 来提取行为特征;使用 CNN 来提取环境特征。最后将两个拼接以得到个体表征向量。
2. 群体表征模块用来提取行人之间的关系。主要可以分为构建行为关系图和递归抽取两部分。首先,我们将整个场景中的所有行人的历史轨迹信息输入到一个由 MLP 组成的关系生成器中,来分析每个人两两之间的关系,关系强弱使用 0-1 来表示。在训练过程中,我们使用标注好的行人组来对其进行监督,当两人处于同一组时,GT 为 1,反之为 0。在得到两两行人之间的关系之后,我们将其看做边,并把行人的历史轨迹看做节点,构建行为关系图。随后,GCN 网络被用来递归地对该图进行分析整合,为每一个行人得到其群体表征向量。
3. 最后,我们将个体表征向量和群体表征向量进行融合,使用 LSTM 解码器来生成预测结果。
考虑到使用常见的 L2 Loss 对性能分析指标之一的 FDE 优化有限,我们提出了 Exponential L2 Loss 来作为损失函数,该函数可以表示为:
轨迹预测任务常用评价指标为终点预测误差(FDE)、平均轨迹预测点预测误差(ADE)。我们还使用了以下评估指标:
minFDE: 对于 N 个预测轨迹,选择终点预测误差最小的作为评估结果
minADE:对于 N 个预测轨迹,选择平均轨迹预测点预测误差最小的作为评估结果
DAC: 预测满足可行驶区域程度



参考资料:
[1] Ming-Fang Chang, John W Lambert, Patsorn Sangkloy, Jagjeet Singh, Slawomir Bak, Andrew Hartnett, De Wang, Peter Carr, Simon Lucey, Deva Ramanan, and James Hays. Argoverse: 3d tracking and forecasting with rich maps. In Conference on Computer Vision and Pattern Recognition (CVPR), 2019.
[2] Stefano Pellegrini, Andreas Ess, Konrad Schindler, and Luc Van Gool. You’ll never walk alone: Modeling social behavior for multi-target tracking. In 2009 IEEE 12th International Conference on Computer Vision, pages 261–268. IEEE, 2009.
[3] Alon Lerner, Yiorgos Chrysanthou, and Dani Lischinski.Crowds by example. In Computer graphics forum, volume 26, pages 655–664. Wiley Online Library, 2007.
[4] Yuexin Ma, Xinge Zhu, Sibo Zhang, Ruigang Yang, Wenping Wang, and Dinesh Manocha. Trafficpredict: Trajectory prediction for heterogeneous traffic-agents. arXiv preprint arXiv:1811.02146, 2018.
近期精彩集锦(点击蓝色字体跳转阅读):
点击阅读原文,查看更多精彩!

