空间活动 | AI Talk—Holger Caeser：构建无需人工标注的自动驾驶系统

上海模速空间大模型创新生态社区

2024-06-04

导读：提高自动驾驶数据集的扩展性、经济性

近期，上海人工智能大讲堂AI TALK · Youth Voice第一期暨星河TALK在模速空间一楼路演厅成功举办。本期TALK荣幸邀请到代尔夫特理工大学智能车辆团队助理教授Holger Caesar，他以《构建无需人工标注的自动驾驶系统》为题带来了一场精彩的知识分享。活动吸引了近60位来自人工智能领域的专业人士现场参与，包括高校教师、青年科学家及AI企业代表等。同时还有近1500名观众通过线上直播的方式收看了此次活动。

自动驾驶技术正在改变我们的出行方式，它可以减少因困倦和分心引发的事故，提升乘客舒适度，减少生态足迹，并提高公共交通便利性。不过，目前的人工智能训练依赖大量人工标注数据，既繁琐又耗时，尤其是当传感器、城市或天气条件变化时，需要重复标注，进一步限制了其扩展性。

Holger教授现场分享

在报告中Holger教授提到，自动驾驶数据集已经历三个世代的发展：

第一代：完全依赖人工标注。

如一个包含140万个边界框的数据集用于自动驾驶车辆感知。虽然精准，但需要大量人力和时间，缺乏可扩展性。

第二代：采用半自动标注。

数据先由人工标注，然后训练模型自动标注新数据。Lyft的数据集就是个例子，虽然数据量增加带来了更好的结果，但仍需要大量初始的人工标注。

第三代：以自监督学习、主动学习和基础模型减少对人工标注的依赖。

自监督学习可以在减少标注工作量的同时保持高性能，如用于激光雷达场景流估算的ICP-Flow；主动学习是通过选择性标注数据来提高效率，如数据集尺寸平衡的暖启动主动学习（Size Balanced Warm Start Active Learning）；基础模型则利用物体外观进行多模态检测，如用于3D物体检测的UNION，场景图生成VLPrompt，以及识别新物体和关系的OpenPSG。

另外，Holger教授也提及团队未来的发展方向，包括关注骑行者行为和非语言交流（non-verbal communication）的新数据集BikeScenes，使用4D Radar等先进传感器改进检测和规划，以及通过基于Nerf构建的仿真工具进行碰撞模拟和安全测试。

总体来看，自动驾驶数据集正从完全依赖人工标注的第一代，向半自动标注的第二代，再向第三代的自监督学习和主动学习转变，重点在于提高扩展性、经济性，并使人工智能更加普及，以适应新的自动驾驶及机器人应用场景。

在随后的问答环节中，Holger教授与AI观察团成员和现场观众讨论了数据集在不同传感器设置和集中化方面的差异，路边传感器提供的不同于车载传感器的视角，以及大型语言模型在自动驾驶系统中的应用，特别是如何整合时空理解进行规划。

此次活动不仅为参与者提供了宝贵的知识分享，还为自动驾驶技术的未来发展提供了深刻洞见。AI TALK · Youth Voice和星河TALK将继续为全球AI青年学者搭建技术分享和交流的平台，推动人工智能领域的进步与发展。

大合影

【声明】内容源于网络

上海模速空间大模型创新生态社区

“模速空间”是全国首个大模型专业孵化和加速载体，立足徐汇滨江，基于“十百千万”目标，打造数据、算力、评测、金融、综合等功能平台，赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。

内容 597

粉丝 0

上海模速空间大模型创新生态社区 “模速空间”是全国首个大模型专业孵化和加速载体，立足徐汇滨江，基于“十百千万”目标，打造数据、算力、评测、金融、综合等功能平台，赋能各通用大模型、垂类大模型、大模型应用创新初创企业汇聚上海、引领全国、扬帆世界。

总阅读531

粉丝0

内容597