近期,上海人工智能大讲堂AI TALK · Youth Voice第一期暨星河TALK在模速空间一楼路演厅成功举办。本期TALK荣幸邀请到代尔夫特理工大学智能车辆团队助理教授Holger Caesar,他以《构建无需人工标注的自动驾驶系统》为题带来了一场精彩的知识分享。活动吸引了近60位来自人工智能领域的专业人士现场参与,包括高校教师、青年科学家及AI企业代表等。同时还有近1500名观众通过线上直播的方式收看了此次活动。
Holger教授现场分享
第一代:完全依赖人工标注。
第二代:采用半自动标注。
数据先由人工标注,然后训练模型自动标注新数据。Lyft的数据集就是个例子,虽然数据量增加带来了更好的结果,但仍需要大量初始的人工标注。
第三代:以自监督学习、主动学习和基础模型减少对人工标注的依赖。
自监督学习可以在减少标注工作量的同时保持高性能,如用于激光雷达场景流估算的ICP-Flow;主动学习是通过选择性标注数据来提高效率,如数据集尺寸平衡的暖启动主动学习(Size Balanced Warm Start Active Learning);基础模型则利用物体外观进行多模态检测,如用于3D物体检测的UNION,场景图生成VLPrompt,以及识别新物体和关系的OpenPSG。
另外,Holger教授也提及团队未来的发展方向,包括关注骑行者行为和非语言交流(non-verbal communication)的新数据集BikeScenes,使用4D Radar等先进传感器改进检测和规划,以及通过基于Nerf构建的仿真工具进行碰撞模拟和安全测试。
总体来看,自动驾驶数据集正从完全依赖人工标注的第一代,向半自动标注的第二代,再向第三代的自监督学习和主动学习转变,重点在于提高扩展性、经济性,并使人工智能更加普及,以适应新的自动驾驶及机器人应用场景。
在随后的问答环节中,Holger教授与AI观察团成员和现场观众讨论了数据集在不同传感器设置和集中化方面的差异,路边传感器提供的不同于车载传感器的视角,以及大型语言模型在自动驾驶系统中的应用,特别是如何整合时空理解进行规划。
此次活动不仅为参与者提供了宝贵的知识分享,还为自动驾驶技术的未来发展提供了深刻洞见。AI TALK · Youth Voice和星河TALK将继续为全球AI青年学者搭建技术分享和交流的平台,推动人工智能领域的进步与发展。
大合影

