2026北京智源大会开幕 | 从“悟道”到“悟界”，智源研究院推动人工智能、物理世界和生命科学“三体互动”- 大数跨境

首页

2026北京智源大会开幕 | 从“悟道”到“悟界”，智源研究院推动人工智能、物理世界和生命科学“三体互动”

AIGC开放社区

2026-06-12

导读：2026年6月12日，第八届“北京智源大会”在中关村国际创新中心开幕。

专注 AIGC 技术的专业社区，聚焦大语言模型（LLM）发展与应用落地，深度解析 LLM 及 AI 技术的市场研究与开发者生态。

2026 年 6 月 12 日，第八届“北京智源大会”在中关村国际创新中心正式开幕。

作为智源研究院主办的"AI 内行学术盛会”，本届大会以“技术前沿、国际视野、青年人才”为特色。现代数字安全体系奠基者 Whitfield Diffie 与强化学习奠基人 Andrew Barto 线下参会，分别聚焦 Agent 时代的安全挑战与交互驱动智能的意义。30 余位 30 岁以下青年科学家、40 余位 AI 企业领袖及 200 余位顶尖学者齐聚一堂，中国 AI 产业在世界模型与 Agent 领域的创新力量首次集中展示。Meta、英伟达、哈佛、MIT 等全球顶尖机构与阿里、腾讯、小米、生数科技、面壁智能及清华北大等国内核心力量同台交流，围绕世界模型、通用智能体、具身智能、AI 安全、Token 经济及智能计算底层架构等前沿方向展开深度对话。

开幕式由智源研究院理事长黄铁军主持。

智源研究院院长王仲远作 2026 年研究进展报告，发布基座大模型、智能体及基础软硬件生态等领域的最新探索成果与开源动态。

自 2018 年成立以来，智源研究院先后发布“悟道”与“悟界”系列大模型，构建全栈开源技术体系。截至目前，智源开源模型超 200 个，全球累计下载量突破 10 亿次，并孵化了多家大模型与具身智能领域的代表性企业。继 2024 年预判 AI 从多模态向世界模型演进后，过去一年智源在基座大模型、智能体及基础软硬件生态三大领域取得显著进展，系统梳理世界模型发展脉络，并正式发布研发中的“悟界·Physis"。

基座大模型：迈向物理世界的关键一步

2024 年发布的“悟界”系列旨在构建面向物理世界的 AI 基座模型。2025 年 10 月正式发布的悟界·Emu3.5仅基于“预测下一个词元（Next-Token Prediction）”，实现了文本、图像和视频的统一学习与多模态理解生成。该原创成果于 2026 年 1 月刊发于《Nature》正刊，创下国产多模态大模型多项纪录。

本届大会发布多项创新成果：

悟界·Brainμ1.0：全球首个理解与生成统一的多模态神经科学大模型，将 Next-Token Prediction 范式扩展至脑科学领域。相关成果已刊发于《Science》。同期发布全球最大的 AI-Ready 神经科学数据集及数据平台 BrainToken。
悟界·OpenComplex2.5：可泛化、物理真实的下一代 AI 驱动药物发现模型，能精确解析固有无序蛋白（IDP）灵活构象，单一模型覆盖制药四大关键步骤。
悟界·Physis-v0.1：全球首个通用世界基座模型，通过统一物理状态学习，实现物理正确、动作因果可溯、长程一致及通用泛化，适用于全垂类场景。

智能体：构建全栈具身智能技术体系

针对具身智能面临的硬件、数据、模型及落地挑战，智源构建了自底向上的全栈技术体系，先后发布悟界·RoboBrain和悟界·RoboOS。正在研发的悟界·RoboBrain Orca以“预测下一个物理状态”为核心构建具身大脑，融合大量第一人称视角（Ego-centric）交互数据，显著提升少样本与跨场景泛化能力。此外，智源推出了四款自主研发智能体，分别应用于心脏辅助诊断、科学发现、个人专属助理及生物安全防护领域。

基础软硬件生态：FlagOS 全面升级

智源与开源社区共建的众智FlagOS，将"M 款模型与 N 款芯片”的适配难题简化为统一接入方案。FlagOS 2.1 支持 18 家芯片厂商的 32 款芯片，是全球覆盖芯片数量最多的计算系统软件栈。其算子总数超 600 个，支持统一编译器与通信库。目前生态成员超 80 家，全球下载量超 37.5 万次，触及开发者 5.6 万人。

悟界系列大模型：重构人工智能基座

随着多模态研究深入，AI 正从“预测下一个词元”演进至“预测下一个物理状态”，这是世界模型的核心本质。

智源是国内最早开展世界模型研究的机构。从 2023 年 Yann LeCun 阐述概念，到 2024 年明确技术路线，再到 Emu3 与 Emu3.5 的发布，智源始终引领前沿。2026 年推出的悟界·Physis-v0.1标志着 AI 正式进入世界模型时代。

智源将现有世界模型技术路线分为四类：以语言为中心（如 VLM、VLA）、以像素为中心（如 Sora）、以三维结构为中心（如 World Labs Marble）以及以视觉表征为中心（如 JEPA）。智源认为，真正的世界模型应以“预测下一物理状态”为核心，具备感知、理解、推理真实物理世界规律的能力，涵盖全模态数据并支持主动交互。

在智源看来，世界模型作为面向真实物理世界的下一代基座模型，以“预测下一物理状态”为核心，代表着人工智能的下一个重要范式跃迁。它不仅能感知、理解、推理真实物理世界的时间、空间、物理规律和常识，涵盖全模态数据，还具备主动交互能力，支撑各类物理世界下游应用。

1. 智源“悟界”系列基座大模型：推动数字与物理世界融合

悟界·Emu

悟界·Emu 是智源从“悟道”迈向“悟界”的里程碑。Emu3 于 2026 年 1 月登上《Nature》正刊，是我国科研机构主导的大模型成果首次在该刊发表。升级版 Emu3.5 从“预测下一个词元”扩展至跨视觉与语言序列的“下一状态预测”，以纯自回归框架原生实现文本、图像、视频的统一理解与生成，打破模态孤岛，兼具顶级学术价值与产业支撑价值。

悟界·Brainμ

悟界·Brainμ1.0是全球首个理解与生成统一的多模态神经科学大模型。它将跨物种、全模态脑信号统一编码为标准 Token，实现数据格式归一与多模态对齐。配套的全球最大的 AI-Ready 神经科学数据平台悟界·BrainToken，汇聚全球开源数据并完成万亿级 Token 化，有效解决数据孤岛问题，辅助阿尔兹海默症等疾病诊断。相关成果已支撑“记忆 - 睡眠”调控机制研究登刊《Science》。

悟界·OpenComplex

悟界·OpenComplex2.5是下一代 AI 驱动药物发现模型，重点解决固有无序蛋白（IDP）动态构象解析难题。该模型通过端到端全原子分布建模，突破传统静态结构分析局限，统一覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤，为神经退行性疾病等难成药靶点研究提供新路径。

悟界·Physis

悟界·Physis-v0.1是全球首款通用世界基座模型，构筑真实物理世界 AI 底层核心引擎。它以物理隐空间表征替代传统像素预测，搭载专属物理状态编码器，统一转化全模态信息为标准化隐空间物理状态。模型支持 50+ 复杂物理场景长程推理，具备物理一致性、动作因果性、长程可推演性及通用泛化性四大核心能力，广泛应用于严肃工业、具身智能及科学研究。

悟界·RoboBrain Orca

悟界·RoboBrain Orca是以“下一个物理状态预测”为核心的具身大脑，构建“统一表征—建模—预测—交互”完整闭环。它实现从 Next Token/Frame/Action Prediction 升级为 Next Physical State Prediction，融合大量 Ego-centric 交互数据，强化具身表征。具备统一表征、因果推演、模态解码三大核心能力，实现“想、看、动”三位一体，支撑机器人在物流、酒店服务等真实环境中的长期自主作业。

2. 智能体蓬勃发展：智源形成多层次布局

自 2024 年起，智源大会持续关注智能体方向，推动 Agent 从“模型应用”走向“智能系统”。2026 年，大会重点关注 AI 如何安全、稳定地与现实环境交互。智源基于深厚技术底蕴，推出覆盖心脏辅助诊断、科学发现、个人专属助理及生物安全防护的智能体矩阵。

BAAI Cardiac Agent

全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院三千余例患者数据，构建一站式“结构分割 - 功能评估 - 疾病诊断 - 智能化报告”流程。其 Agent-Expert 系统复刻专家团队协作诊疗，心脏疾病诊断精确度达到顶尖医生水平，AUC 超 0.93。

AREX

面向科学发现的自主研究智能体，致力于推动 AI 从模仿学习向自主学习跨越。AREX 全面降低科研全流程对人类参与的依赖，服务于文献调研、思路拓展、实验设计及论文撰写等环节，赋能基础学科前沿问题的自主探索。

SoulAgent

面向个人用户的专属智能体，采用全新自研架构，节省 30% Token 成本，降低 80% 资源占用。SoulAgent 基于用户画像和技能自进化，满足个性化服务、长期记忆及安全隐私需求。在大会期间，它帮助参会者实时听会、提炼观点，打造随时“在场”的智能分身。

面向有害蛋白获取的风险发现智能体

智源推出该智能体，首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环。系统通过主动模拟攻击者行为，验证 AI 智能体绕过生物安全筛查的可能性，将风险防控从“事后补救”转为“事前演练”，提前识别生物知识获取环节的脆弱性。

3. 全面升级至 FlagOS 2.1：打造普适高效智算基座

众智FlagOS是智源牵头打造的统一智算系统软件栈，彻底破解“多模型×多芯片”适配难题。作为全球支持芯片种类最多的智算系统，FlagOS 统一适配 18 家品牌的 32 款芯片，覆盖 NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM 等多种架构。通过通用算子库、统一编译器及 vLLM 多芯片插件等组件，支持 90% 以上主流开源大模型的多芯片部署，实现 DeepSeek、Qwen、MiniCPM 等模型的“发布即多芯适配”。

FlagOS 构建了从底层算子到上层框架的完整技术体系。在性能优化方面，拓展 Triton-TLE 语言能力，支持多款芯片极致优化；八大算子库总数超 600 个，核心组件已进入 PyTorch 基金会生态。FlagCX 通信库统一连通 10 款芯片，并实现 AI 芯片通信的 ITU 国际标准与国家标准“双立项”。

此外，FlagRelease 发布 Express“高速”镜像版本，实现一键安装与端到端高速推理；FlagCICD 成为首个 AI 多芯片开源集成测试发版平台；FlagQuantum 作为高性能量子电路模拟框架，迈出“量智融合”的第一步。

4. 图灵奖得主与中国 AI 领军者共话未来

开幕式上，图灵奖得主 Whitfield Diffie 与 Andrew Barto 分别作主题报告。

Whitfield Diffie 以Security For AI Agents, Security Against AI Agents为题，指出当前“控制论”式修复方法的局限，呼吁开发形式化方法以提升程序可靠性。他强调，面对规模庞大的智能体程序，现有的访问限制（Confinement）措施仍显不足，需大幅增强其按预期运行的可靠性。

Andrew Barto 以Rediscovering Reinforcement Learning为题，将强化学习本质归结为“控制、搜索与联想记忆”的三位一体。他指出，机器学习最初即为强化学习，深度强化学习与大脑奖励系统的结合指明了未来方向。同时，他警示需警惕奖励信号设计中的“反常实例化”风险。

智源研究院理事长黄铁军与之江实验室主任、阿里云创始人王坚展开播客对话，围绕“总有人比时代早十年”，探讨中国大模型从追赶验证到范式创新的跃迁，以及 Agent 时代海量智能体对现实世界的影响与风险。

在“重构世界——中国大模型巅峰对话”圆桌环节，王仲远与朱军、罗福莉、刘知远、安波等行业领军者，围绕超级模型能力演进、AI 自进化、多模态与世界模型等议题深入交流。嘉宾们认为，超级模型与智能体系统将释放更大势能，自进化有望成为驱动智能跃迁的新引擎，推动 AI 真正从数字空间走向物理世界。

5. 智源 AI 科研体验区：启未来之智，溯创新之源

2026 年智源大会期间，AI 科研体验区集中呈现 SoulAgent、具身智能、众智 FlagOS、AI for Life Science 四大板块前沿成果，让观众近距离感受 AI 落地真实场景。

SoulAgent 体验区：观众可领取专属智能体，体验跨会场同步听会与学者 AI 分身对话，感受其随使用不断成长的个性化服务能力。

具身智能体验区：包含乒乓球人机对战与酒店全场景清洁展示。SpikePingPong 系统使人形机器人实现高频视觉感知与实时策略决策；基于 RoboBrainX 等模型的清洁方案展示了端侧部署在复杂任务中的优势。

众智 FlagOS 体验区：以“可视化、可互动、可带走”为理念，观众通过一键启动、知识闯关及自动生成算子等互动，直观感受 FlagOS 跨芯片、跨场景的适配能力。

AI for Life Science 体验区：分为安贞—智源心脏 AI 医院、神经科学及 AI 药物发现三个区域。观众可体验 AI 心电图分析、透明心脏病灶分析、BrainToken 数据平台及 OpenComplex2.5 药物发现模型，感受 AI 在医疗与科研领域的深度赋能。

从开启中国大模型探索，到定义面向真实物理世界的基座模型，智源以顶尖学术突破、产业生态孵化和全栈开源布局，持续为中国 AI 筑牢创新根基。面向下一代技术范式变革，智源将继续引领技术创新，构建通往物理 AGI 的破局路径。

END

【声明】内容源于网络

AIGC开放社区

1234

内容 1891

粉丝 0

AIGC开放社区 1234

总阅读31.5k

粉丝0

内容1.9k