大数跨境
0
0

学术前沿丨李德毅院士和马楠教授联合发文——无人驾驶具身交互智能 Engineering

学术前沿丨李德毅院士和马楠教授联合发文——无人驾驶具身交互智能 Engineering 中国人工智能学会
2025-12-18
4

无人驾驶具身交互智能研究取得突破性进展

近日,中国人工智能学会名誉理事长、清华大学李德毅院士与北京工业大学人工智能学院院长马楠教授作为通讯作者,在中国工程院院刊《Engineering》发表题为《无人驾驶具身交互智能》的研究论文,首次提出“无人驾驶具身交互智能”(EIIAD)理论框架。

该框架融合跨媒体感知、机器学习、认知计算与生成式人工智能技术,构建与物理世界统一的智能表达与学习方法,创新性地建立端到端“感知–认知–行为”闭环反馈范式,推动无人车从功能执行向类人理解与自主进化跃升。

核心挑战与研究定位

当前车道跟踪、变道辅助等技术已成熟应用,但人车双向认知协同仍为关键瓶颈:无人车能否准确理解人类行为?人类能否及时信任车辆决策?真实驾驶场景高度动态、碎片化且难以穷尽,如何实现持续学习与终生进化,是无人驾驶迈向真正智能化的核心挑战。

研究内容

具身交互智能三大类型

本研究定义无人驾驶具身交互智能为:无人车通过跨模态感知识别物理空间关键要素,主动与环境交互获取反馈,持续优化物理空间与认知空间映射关系,最终实现类人决策与行为控制。根据交互对象差异,划分为车–人、车–车、车–环境三类交互。

差异化交互认知模型

针对车–人交互,提出基于多视时空特征的超图神经网络(HGNN-MSTF),融合多视角跨模态感知信息,建模行人动作与位置联合概率分布,精准解析肢体语言意图;针对车–车交互,构建基于联合轨迹预测的世界模型深度强化学习网络(DRL-JTPWM),在狭路会车、无保护左转等复杂工况中显著提升策略鲁棒性;进一步集成上述模型与环境约束,提出统一约束的车–环境交互模型(UniCVE):采用鸟瞰图统一编码多源感知信息,利用超图神经网络学习环境高阶关系,并将大语言模型中的驾驶知识蒸馏至实时模型,实现对人–车–路复杂交互的统一表征。

图1 无人驾驶的具身交互智能。(a)无人车与环境交互:应对动态路况、罕见危险场景及多样化地形气候;(b)车–人肢体语言交互:基于时空超图的跨模态动作识别;(c)车–车语言交互:涵盖狭路会车、超车并道、无保护路口多车协同等典型工况。

研究验证与意义

UniCVE模型已在东风无人巴士实车部署,于雄安新区完成22,000公里测试里程、45,000项运营导航任务,在视觉遮挡交叉路口等高风险场景中展现出基于经验记忆的自适应决策能力。

本研究首次建立人–车–路协同的统一认知模型,将异构交互主体的理解转化为统一价值函数与软约束表达,形成“有限样本→无限智能”的演化路径,为无人驾驶实现社会化融入——即真正“懂人情世故”——提供理论支撑与技术路径,标志着该领域由功能实现迈向认知智能的重大跨越。

论文信息

Nan Ma*, Jia Pan, Yongjin Liu, Yajue Yang, Yiheng Han, Jiacheng Guo, Zhixuan Wu, Zecheng Yang, Zhiwei Yang, Deyi Li*. Embodied Interactive Intelligence Towards Autonomous Driving[J]. Engineering, 2025.

开放获取:https://doi.org/10.1016/j.eng.2025.09.032

作者简介

马楠,北京工业大学人工智能学院院长、教授、博士生导师,2024年教育部长江学者奖励计划入选者、青年北京学者,国家重点研发计划项目首席科学家,智能感知与自主控制教育部工程研究中心副主任,中国人工智能学会副秘书长。研究方向聚焦交互认知、具身智能、无人驾驶与智能机器人;以第一完成人获中国图象图形学学会科技进步一等奖、中国电子学会技术发明二等奖;在IEEE TPAMI、TRO、ACM MM、AAAI、ICRA等期刊会议发表论文百余篇。

李德毅,中国工程院院士、国际欧亚科学院院士,中国人工智能学会名誉理事长,军事科学院研究员,清华大学博士生导师;获国家科技进步二等奖1项、三等奖2项,部级一等奖3项、二等奖4项,2020年获吴文俊人工智能最高成就奖,主编技术丛书7部。

来源:Engineering

【声明】内容源于网络
0
0
中国人工智能学会
中国人工智能学会官方订阅号,为广大智能科技工作者提供前沿资讯,学术分享,科普信息的的多媒体平管
内容 8111
粉丝 0
中国人工智能学会 中国人工智能学会官方订阅号,为广大智能科技工作者提供前沿资讯,学术分享,科普信息的的多媒体平管
总阅读39.6k
粉丝0
内容8.1k