>

技术详解 | 面向征程5平台的自动驾驶感知算法研发和实践（附下期直播预告）

>

0

0

技术详解 | 面向征程5平台的自动驾驶感知算法研发和实践（附下期直播预告）

技术详解 | 面向征程5平台的自动驾驶感知算法研发和实践（附下期直播预告）

鉴智机器人 PhiGent Robotics

2023-07-10

0

导读：鉴智机器人PhiGent Sharing技术公开课第一期分享。

PhiGent Sharing：

6月底，鉴智机器人正式推出基于单颗地平线征程®5芯片的标准视觉感知产品PhiVision。

7月4日，鉴智机器人联合《汽车之心》推出的「基于地平线征程5的开发实践」系列直播分享上线。第一期聚焦于感知部署，鉴智机器人感知产品研发部负责人叶云分享「面向征程 5 的自动驾驶感知算法研发和实践」。

感知是自动驾驶实现精准控制和高效决策的前提，具有更高性能上限和成本优势的视觉感知成为主流感知方案。视觉感知历经单目到BEV为主的多目方案演变，在城市NOA落地在即的关键时间点，BEV感知已成行业关注焦点。

鉴智机器人自成立之初便坚持走视觉路线，通过基于AI算法与视觉传感器的软硬协同优化，构建以视觉3D理解为核心的双目立体视觉智驾系统。

01

高性能上限的BEV感知

BEV方案从第一性原理出发，通过特征级前融合实现感知，具有信息利用率高、模型拓展性强和算法复杂度低等优势：

信息利用率高：相对于单目算法，BEV感知能够有效利用环视相机提供的多视角信息；

模型拓展性强：在输入模态上支持点云，在输出任务上并行支持目标检测、语义地图、运动预测等关键任务；

算法复杂度低：算法能够并行处理多张环视图像、端到端输出三维空间下的检测结果，无需复杂的后融合。

为实现BEV算法在主流芯片平台的高效部署，鉴智机器人于2021 年提出3D感知新范式BEVDet，多次刷新自动驾驶权威数据集nuScenes最新纪录。

BEVDet，智驾感知新范式

BEVDet可实现在芯片上的高效部署。遵循模块化设计理念，包含图像编码、视角变换、鸟瞰视角编码、3D目标预测四大模块。四大模块均无需做特殊代码处理，极大简化算法在芯片平台的部署效率。在相同的推理精度下，BEVDet算法推理速度达到同类算法的4到15倍，显存占用比同类算法少两个数量级。

BEVerse，面向视觉中心化的大感知统一框架

感知有三大任务，为实现三大任务一套方案同时部署，我们提出了面向视觉中心化的自动驾驶大感知统一框架BEVerse。

BEVerse通过一个模型高效实现4D感知、实时局部地图、运动预测等自动驾驶关键模块，在nuScenes上同时取得三个任务上的最优性能。

面向征程5的BEV算法优化

面向征程5，我们对BEV算法进行了针对性优化：

针对Image-view Encoder的优化，参考地平线VargNet模型结构做优化，实现计算量压缩；
针对View Transformer的优化，利用BEVPoolV2方式对计算流程和显存占用进行优化；同时考虑相机畸变，节省资源占用；
图像空间辅助loss，提升 BEV 空间的感知效果。

02

面向征程5的高效部署

征程5支持 QAT 量化训练和 PTQ 后量化两种方式，鉴智机器人主要采用 QAT 方式。具体部署流程包括浮点模型训练、量化模型训练、编译和部署四步。浮点模型训练中，因鉴智机器人BEV算法无太多特殊计算单元，部署中无需做算子替换，极大提升了部署效率。

在征程5，我们基于FX Graph Mode实现QAT训练，通过这种方式可以节省如算子融合、插入量化节点等诸多工作，整体流程无需大量代码开发，通过模型转换即可实现部署成果。

为了提升模型在征程5的感知效果和性能，我们针对模型的预处理、模型结构、模型后处理也分别做了一些尝试，以下是我们的一些经验：

预处理：输入归一化，尽可能使用mean=128,std=1/128这样的参数；
backbone：参考EfficientNet，VargNet的结构；
head：针对难度不同的任务，自动调整loss weight，确保任务稳定性；
后处理：能放在bpu算的算子尽可能放在bpu上；模型最后的sigmoid算子可以去除；调整后处理顺序，避免对稠密的输出做后处理等。

了解感知技术细节，请关注「面向征程 5 的自动驾驶感知算法研发和实践」直播实录：

PhiGent Sharing

技术公开课第二期直播预告：

7月11日 20:00-21:00，鉴智机器人合伙人、技术副总裁、智驾产品线负责人潘屹峰，将在汽车之心视频号分享《如何打造极致性价比的NOA规控系统方案》。敬请扫码关注！

【声明】内容源于网络

0

0

鉴智机器人 PhiGent Robotics

鉴智机器人 PhiGent Robotics——以视觉3D理解为核心的下一代自动驾驶系统提供商。

内容 42

粉丝 0

鉴智机器人 PhiGent Robotics 鉴智机器人 PhiGent Robotics——以视觉3D理解为核心的下一代自动驾驶系统提供商。

总阅读0

粉丝0

内容42