专注 AIGC 技术的专业社区,聚焦大语言模型(LLM)发展与应用落地,深度解析 LLM 及 AI 技术的市场研究与开发者生态。
2026 年 6 月 12 日,第八届“北京智源大会”在中关村国际创新中心正式开幕。
开幕式由智源研究院理事长黄铁军主持。
智源研究院院长王仲远作 2026 年研究进展报告,发布基座大模型、智能体及基础软硬件生态等领域的最新探索成果与开源动态。
自 2018 年成立以来,智源研究院先后发布“悟道”与“悟界”系列大模型,构建全栈开源技术体系。截至目前,智源开源模型超 200 个,全球累计下载量突破 10 亿次,并孵化了多家大模型与具身智能领域的代表性企业。继 2024 年预判 AI 从多模态向世界模型演进后,过去一年智源在基座大模型、智能体及基础软硬件生态三大领域取得显著进展,系统梳理世界模型发展脉络,并正式发布研发中的“悟界·Physis"。
基座大模型:迈向物理世界的关键一步
2024 年发布的“悟界”系列旨在构建面向物理世界的 AI 基座模型。2025 年 10 月正式发布的悟界·Emu3.5仅基于“预测下一个词元(Next-Token Prediction)”,实现了文本、图像和视频的统一学习与多模态理解生成。该原创成果于 2026 年 1 月刊发于《Nature》正刊,创下国产多模态大模型多项纪录。
本届大会发布多项创新成果:
- 悟界·Brainμ1.0:全球首个理解与生成统一的多模态神经科学大模型,将 Next-Token Prediction 范式扩展至脑科学领域。相关成果已刊发于《Science》。同期发布全球最大的 AI-Ready 神经科学数据集及数据平台 BrainToken。
- 悟界·OpenComplex2.5:可泛化、物理真实的下一代 AI 驱动药物发现模型,能精确解析固有无序蛋白(IDP)灵活构象,单一模型覆盖制药四大关键步骤。
- 悟界·Physis-v0.1:全球首个通用世界基座模型,通过统一物理状态学习,实现物理正确、动作因果可溯、长程一致及通用泛化,适用于全垂类场景。
智能体:构建全栈具身智能技术体系
针对具身智能面临的硬件、数据、模型及落地挑战,智源构建了自底向上的全栈技术体系,先后发布悟界·RoboBrain和悟界·RoboOS。正在研发的悟界·RoboBrain Orca以“预测下一个物理状态”为核心构建具身大脑,融合大量第一人称视角(Ego-centric)交互数据,显著提升少样本与跨场景泛化能力。此外,智源推出了四款自主研发智能体,分别应用于心脏辅助诊断、科学发现、个人专属助理及生物安全防护领域。
基础软硬件生态:FlagOS 全面升级
智源与开源社区共建的众智FlagOS,将"M 款模型与 N 款芯片”的适配难题简化为统一接入方案。FlagOS 2.1 支持 18 家芯片厂商的 32 款芯片,是全球覆盖芯片数量最多的计算系统软件栈。其算子总数超 600 个,支持统一编译器与通信库。目前生态成员超 80 家,全球下载量超 37.5 万次,触及开发者 5.6 万人。
悟界系列大模型:重构人工智能基座
随着多模态研究深入,AI 正从“预测下一个词元”演进至“预测下一个物理状态”,这是世界模型的核心本质。
智源是国内最早开展世界模型研究的机构。从 2023 年 Yann LeCun 阐述概念,到 2024 年明确技术路线,再到 Emu3 与 Emu3.5 的发布,智源始终引领前沿。2026 年推出的悟界·Physis-v0.1标志着 AI 正式进入世界模型时代。
智源将现有世界模型技术路线分为四类:以语言为中心(如 VLM、VLA)、以像素为中心(如 Sora)、以三维结构为中心(如 World Labs Marble)以及以视觉表征为中心(如 JEPA)。智源认为,真正的世界模型应以“预测下一物理状态”为核心,具备感知、理解、推理真实物理世界规律的能力,涵盖全模态数据并支持主动交互。
1. 智源“悟界”系列基座大模型:推动数字与物理世界融合
悟界·Emu
悟界·Emu 是智源从“悟道”迈向“悟界”的里程碑。Emu3 于 2026 年 1 月登上《Nature》正刊,是我国科研机构主导的大模型成果首次在该刊发表。升级版 Emu3.5 从“预测下一个词元”扩展至跨视觉与语言序列的“下一状态预测”,以纯自回归框架原生实现文本、图像、视频的统一理解与生成,打破模态孤岛,兼具顶级学术价值与产业支撑价值。
悟界·Brainμ
悟界·Brainμ1.0是全球首个理解与生成统一的多模态神经科学大模型。它将跨物种、全模态脑信号统一编码为标准 Token,实现数据格式归一与多模态对齐。配套的全球最大的 AI-Ready 神经科学数据平台悟界·BrainToken,汇聚全球开源数据并完成万亿级 Token 化,有效解决数据孤岛问题,辅助阿尔兹海默症等疾病诊断。相关成果已支撑“记忆 - 睡眠”调控机制研究登刊《Science》。
悟界·OpenComplex
悟界·OpenComplex2.5是下一代 AI 驱动药物发现模型,重点解决固有无序蛋白(IDP)动态构象解析难题。该模型通过端到端全原子分布建模,突破传统静态结构分析局限,统一覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤,为神经退行性疾病等难成药靶点研究提供新路径。
悟界·Physis
悟界·Physis-v0.1是全球首款通用世界基座模型,构筑真实物理世界 AI 底层核心引擎。它以物理隐空间表征替代传统像素预测,搭载专属物理状态编码器,统一转化全模态信息为标准化隐空间物理状态。模型支持 50+ 复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性及通用泛化性四大核心能力,广泛应用于严肃工业、具身智能及科学研究。
悟界·RoboBrain Orca
悟界·RoboBrain Orca是以“下一个物理状态预测”为核心的具身大脑,构建“统一表征—建模—预测—交互”完整闭环。它实现从 Next Token/Frame/Action Prediction 升级为 Next Physical State Prediction,融合大量 Ego-centric 交互数据,强化具身表征。具备统一表征、因果推演、模态解码三大核心能力,实现“想、看、动”三位一体,支撑机器人在物流、酒店服务等真实环境中的长期自主作业。
2. 智能体蓬勃发展:智源形成多层次布局
自 2024 年起,智源大会持续关注智能体方向,推动 Agent 从“模型应用”走向“智能系统”。2026 年,大会重点关注 AI 如何安全、稳定地与现实环境交互。智源基于深厚技术底蕴,推出覆盖心脏辅助诊断、科学发现、个人专属助理及生物安全防护的智能体矩阵。
BAAI Cardiac Agent
全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院三千余例患者数据,构建一站式“结构分割 - 功能评估 - 疾病诊断 - 智能化报告”流程。其 Agent-Expert 系统复刻专家团队协作诊疗,心脏疾病诊断精确度达到顶尖医生水平,AUC 超 0.93。
AREX
面向科学发现的自主研究智能体,致力于推动 AI 从模仿学习向自主学习跨越。AREX 全面降低科研全流程对人类参与的依赖,服务于文献调研、思路拓展、实验设计及论文撰写等环节,赋能基础学科前沿问题的自主探索。
SoulAgent
面向个人用户的专属智能体,采用全新自研架构,节省 30% Token 成本,降低 80% 资源占用。SoulAgent 基于用户画像和技能自进化,满足个性化服务、长期记忆及安全隐私需求。在大会期间,它帮助参会者实时听会、提炼观点,打造随时“在场”的智能分身。
面向有害蛋白获取的风险发现智能体
智源推出该智能体,首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环。系统通过主动模拟攻击者行为,验证 AI 智能体绕过生物安全筛查的可能性,将风险防控从“事后补救”转为“事前演练”,提前识别生物知识获取环节的脆弱性。
3. 全面升级至 FlagOS 2.1:打造普适高效智算基座
众智FlagOS是智源牵头打造的统一智算系统软件栈,彻底破解“多模型×多芯片”适配难题。作为全球支持芯片种类最多的智算系统,FlagOS 统一适配 18 家品牌的 32 款芯片,覆盖 NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM 等多种架构。通过通用算子库、统一编译器及 vLLM 多芯片插件等组件,支持 90% 以上主流开源大模型的多芯片部署,实现 DeepSeek、Qwen、MiniCPM 等模型的“发布即多芯适配”。
FlagOS 构建了从底层算子到上层框架的完整技术体系。在性能优化方面,拓展 Triton-TLE 语言能力,支持多款芯片极致优化;八大算子库总数超 600 个,核心组件已进入 PyTorch 基金会生态。FlagCX 通信库统一连通 10 款芯片,并实现 AI 芯片通信的 ITU 国际标准与国家标准“双立项”。
4. 图灵奖得主与中国 AI 领军者共话未来
Whitfield Diffie 以Security For AI Agents, Security Against AI Agents为题,指出当前“控制论”式修复方法的局限,呼吁开发形式化方法以提升程序可靠性。他强调,面对规模庞大的智能体程序,现有的访问限制(Confinement)措施仍显不足,需大幅增强其按预期运行的可靠性。
Andrew Barto 以Rediscovering Reinforcement Learning为题,将强化学习本质归结为“控制、搜索与联想记忆”的三位一体。他指出,机器学习最初即为强化学习,深度强化学习与大脑奖励系统的结合指明了未来方向。同时,他警示需警惕奖励信号设计中的“反常实例化”风险。
智源研究院理事长黄铁军与之江实验室主任、阿里云创始人王坚展开播客对话,围绕“总有人比时代早十年”,探讨中国大模型从追赶验证到范式创新的跃迁,以及 Agent 时代海量智能体对现实世界的影响与风险。
在“重构世界——中国大模型巅峰对话”圆桌环节,王仲远与朱军、罗福莉、刘知远、安波等行业领军者,围绕超级模型能力演进、AI 自进化、多模态与世界模型等议题深入交流。嘉宾们认为,超级模型与智能体系统将释放更大势能,自进化有望成为驱动智能跃迁的新引擎,推动 AI 真正从数字空间走向物理世界。
5. 智源 AI 科研体验区:启未来之智,溯创新之源
2026 年智源大会期间,AI 科研体验区集中呈现 SoulAgent、具身智能、众智 FlagOS、AI for Life Science 四大板块前沿成果,让观众近距离感受 AI 落地真实场景。
SoulAgent 体验区:观众可领取专属智能体,体验跨会场同步听会与学者 AI 分身对话,感受其随使用不断成长的个性化服务能力。
具身智能体验区:包含乒乓球人机对战与酒店全场景清洁展示。SpikePingPong 系统使人形机器人实现高频视觉感知与实时策略决策;基于 RoboBrainX 等模型的清洁方案展示了端侧部署在复杂任务中的优势。
众智 FlagOS 体验区:以“可视化、可互动、可带走”为理念,观众通过一键启动、知识闯关及自动生成算子等互动,直观感受 FlagOS 跨芯片、跨场景的适配能力。
AI for Life Science 体验区:分为安贞—智源心脏 AI 医院、神经科学及 AI 药物发现三个区域。观众可体验 AI 心电图分析、透明心脏病灶分析、BrainToken 数据平台及 OpenComplex2.5 药物发现模型,感受 AI 在医疗与科研领域的深度赋能。
从开启中国大模型探索,到定义面向真实物理世界的基座模型,智源以顶尖学术突破、产业生态孵化和全栈开源布局,持续为中国 AI 筑牢创新根基。面向下一代技术范式变革,智源将继续引领技术创新,构建通往物理 AGI 的破局路径。
END

