智猩猩公开课出品
策划:华严
具身智能被公认为实现通用人工智能的核心突破口,随着其与机器人技术的深度融合,一个全新的具身智能机器人产业已应运而生。
智猩猩全新企划推出「具身智能机器人系列公开课」,将邀请产业界的技术决策者与专家,以及高校机构的青年科研人员作为主讲人,对具身智能机器人从前沿研究、技术产品与场景探索等多个维度进行实时视频讲解与答疑互动。
在开放世界中构建感知、推理并行动的具身智能系统,依然是一项宏大的挑战。这要求系统能够在高度动态、不确定的真实环境下,实现从多模态感知到结构化认知、再到可泛化行动的精准映射与实时协同。
「智猩猩具身智能机器人系列公开课」第1期邀请到新加坡科技研究局研究科学家李仕杰,于12月19日晚7点进行实时视频讲解与答疑互动,主题为《开放世界中具身智能的主动感知与推理》。内容涵盖从统一的2D视觉-语言理解,到结构化的3D推理,再到更高层次的前瞻性预测。
李仕杰博士首先从2D感知出发,重新思考多模态模型中的视觉分词方式与认知推理机制,使模型从单纯的识别走向可解释的理解。其次,会深入探讨在3D领域,智能体如何在真实物理世界中感知并推理空间结构,将语言与几何进行对齐,并通过自主驱动的好奇心不断学习。最后,李仕杰博士将进一步扩展到高层次的想象与前瞻,使模型具备推断未见结构、预测未来事件、以及在动态环境中进行因果推理的能力。
整体来看,这些研究正在打通感知、推理与想象三者之间的鸿沟,为能够理解并与复杂、不断变化的真实世界互动的具身智能体奠定基础。
第1期信息
主 题
《开放世界中具身智能的主动感知与推理》
提 纲
1、2D感知让模型从单纯的识别走向可解释理解
2、智能体在真实世界中的感知与空间结构推理
3、多模态大模型与世界模型中前瞻性预测
4、长时域规划:开放词汇下的3D视觉定位与主动感知
5、总结与未来展望
主 讲 人
李仕杰, 新加坡科技研究局研究科学家。于2024年在德国波恩大学取得博士学位。曾在阿里巴巴达摩研究院,英特尔研究院和高通研究院实习。研究兴趣是自动驾驶以及机器人视觉,在TPAMI、TNNLS、ICCV、ICRA等会议和期刊上发表文章。
开 讲 时 间
12月19日晚7点
如何观看和学习
主讲人将于本周五晚7点进行实时视频讲解和答疑互动,扫描或长按下方二维码,即可进入学习交流室,观看和学习本次公开课。
🎁邀请有礼:进入公开课学习交流室点击参加【邀请有礼活动】,可获得【精美礼品一份】。数量有限,先到先得!参与方式👇👇👇

