近日,上海科技大学YesAI Lab团队在石野博士的带领下,于人工智能与机器人领域取得重要研究进展。团队两项成果均被人工智能与机器学习领域的国际顶级会议NeurIPS 2025录用。
其中,开放世界手物交互合成算法OpenHOI荣获大会Oral报告资格(录用率仅0.3%),彰显了其突出的创新性与学术价值;另一项成果——扩散策略在线强化学习框架GenPO,成为全球首个基于扩散模型的On-Policy强化学习算法,开辟了强化学习研究的新路径。
石野博士特别致谢FCloud OmniBot所提供的强大算力支持,尤其是在高效利用NVIDIA仿真环境进行大规模训练过程中所发挥的关键作用。

两项研究成果亮点速览
▍Open HOI:开放世界手物交互生成(NeurIPS 2025 Oral)
OpenHOI是首个能够实现开放世界环境下手-物体交互合成的算法框架,成功将3D多模态大语言模型与可控扩散生成技术融合,实现"看得见也做得到"的智能交互。

核心技术突破
多模态Affordance分割:训练3D多模态大语言模型,同时处理语言指令与3D点云数据,实现高精度可交互区域识别与任务语义分解;
高级任务分解与规划:利用3D MLLM将开放式指令拆解为有序原子子任务,支持跨对象、跨场景的高层次动作规划与动态调整;
无训练物理精炼模块:在扩散采样过程中融入物理约束,通过球面高斯可控扩散技术,确保生成动作精确贴合交互点、避免穿模、运动平滑自然。
▍GenPO: 生成式扩散模型遇见On-Policy强化学习(NeurIPS 2025)
GenPO是全球首个将扩散生成模型与On-Policy强化学习相结合的方法,充分发挥GPU并行仿真的训练优势,在多项任务中显著超越经典PPO算法。
核心技术突破
可逆扩散模型结构设计:重构扩散策略的神经网络架构,实现对动作似然的精准估计与训练稳定性提升;
GPU并行训练加速:专为NVIDIA Isaac Lab仿真环境优化,大幅缩短收敛时间,提升样本效率与策略性能。
方法地位:
GenPO的推出标志着策略优化方法的一个重要转折点,预计将逐步替代PPO成为连续控制与机器人学习中的新基线方法。
▍FCloud OmniBot:赋能高水平具身智能研究的算力底座
YeaAI Lab的两项研究成果均依托FCloud OmniBot平台完成训练与实验。该平台充分发挥NVIDIA GPU的并行计算能力,支持:
Isaac Lab仿真环境的高效并行运行
大规模扩散模型和3D MLLM的训练与推理
物理约束的可控生成与实时渲染验证
OmniBot不仅提供了稳定的算力资源,更在底层系统优化、任务调度与分布式训练方面做出深度支持,使得如OpenHOI、GenPO这样计算密集型的创新模型得以快速迭代与验证。
上海科技大学YES AI Lab连续在NeurIPS等顶级会议上发表多项创新成果,体现了其在3D视觉、机器人学习、生成模型等交叉领域的深厚积累。FCloud OmniBot作为底层计算架构的关键支持方,将继续为高水平科研提供稳定、高效、开放的智能算力环境,助力更多"看得见且做得到"的人工智能技术走向现实。









