大数跨境

2026北京智源大会开幕 | 从“悟道”到“悟界”,智源研究院推动人工智能、物理世界和生命科学“三体互动”

2026北京智源大会开幕 | 从“悟道”到“悟界”,智源研究院推动人工智能、物理世界和生命科学“三体互动” AIGC开放社区
2026-06-12
9
导读:2026年6月12日,第八届“北京智源大会”在中关村国际创新中心开幕。

专注 AIGC 技术的专业社区,聚焦大语言模型(LLM)发展与应用落地,深度解析 LLM 及 AI 技术的市场研究与开发者生态。

2026 年 6 月 12 日,第八届“北京智源大会”在中关村国际创新中心正式开幕。

作为智源研究院主办的"AI 内行学术盛会”,本届大会以“技术前沿、国际视野、青年人才”为特色。现代数字安全体系奠基者 Whitfield Diffie 与强化学习奠基人 Andrew Barto 线下参会,分别聚焦 Agent 时代的安全挑战与交互驱动智能的意义。30 余位 30 岁以下青年科学家、40 余位 AI 企业领袖及 200 余位顶尖学者齐聚一堂,中国 AI 产业在世界模型与 Agent 领域的创新力量首次集中展示。Meta、英伟达、哈佛、MIT 等全球顶尖机构与阿里、腾讯、小米、生数科技、面壁智能及清华北大等国内核心力量同台交流,围绕世界模型、通用智能体、具身智能、AI 安全、Token 经济及智能计算底层架构等前沿方向展开深度对话。

开幕式由智源研究院理事长黄铁军主持。

智源研究院院长王仲远作 2026 年研究进展报告,发布基座大模型、智能体及基础软硬件生态等领域的最新探索成果与开源动态。

自 2018 年成立以来,智源研究院先后发布“悟道”与“悟界”系列大模型,构建全栈开源技术体系。截至目前,智源开源模型超 200 个,全球累计下载量突破 10 亿次,并孵化了多家大模型与具身智能领域的代表性企业。继 2024 年预判 AI 从多模态向世界模型演进后,过去一年智源在基座大模型、智能体及基础软硬件生态三大领域取得显著进展,系统梳理世界模型发展脉络,并正式发布研发中的“悟界·Physis"。

基座大模型:迈向物理世界的关键一步

2024 年发布的“悟界”系列旨在构建面向物理世界的 AI 基座模型。2025 年 10 月正式发布的悟界·Emu3.5仅基于“预测下一个词元(Next-Token Prediction)”,实现了文本、图像和视频的统一学习与多模态理解生成。该原创成果于 2026 年 1 月刊发于《Nature》正刊,创下国产多模态大模型多项纪录。

本届大会发布多项创新成果:

  • 悟界·Brainμ1.0:全球首个理解与生成统一的多模态神经科学大模型,将 Next-Token Prediction 范式扩展至脑科学领域。相关成果已刊发于《Science》。同期发布全球最大的 AI-Ready 神经科学数据集及数据平台 BrainToken。
  • 悟界·OpenComplex2.5:可泛化、物理真实的下一代 AI 驱动药物发现模型,能精确解析固有无序蛋白(IDP)灵活构象,单一模型覆盖制药四大关键步骤。
  • 悟界·Physis-v0.1:全球首个通用世界基座模型,通过统一物理状态学习,实现物理正确、动作因果可溯、长程一致及通用泛化,适用于全垂类场景。

智能体:构建全栈具身智能技术体系

针对具身智能面临的硬件、数据、模型及落地挑战,智源构建了自底向上的全栈技术体系,先后发布悟界·RoboBrain悟界·RoboOS。正在研发的悟界·RoboBrain Orca以“预测下一个物理状态”为核心构建具身大脑,融合大量第一人称视角(Ego-centric)交互数据,显著提升少样本与跨场景泛化能力。此外,智源推出了四款自主研发智能体,分别应用于心脏辅助诊断、科学发现、个人专属助理及生物安全防护领域。

基础软硬件生态:FlagOS 全面升级

智源与开源社区共建的众智FlagOS,将"M 款模型与 N 款芯片”的适配难题简化为统一接入方案。FlagOS 2.1 支持 18 家芯片厂商的 32 款芯片,是全球覆盖芯片数量最多的计算系统软件栈。其算子总数超 600 个,支持统一编译器与通信库。目前生态成员超 80 家,全球下载量超 37.5 万次,触及开发者 5.6 万人。

悟界系列大模型:重构人工智能基座

随着多模态研究深入,AI 正从“预测下一个词元”演进至“预测下一个物理状态”,这是世界模型的核心本质。

智源是国内最早开展世界模型研究的机构。从 2023 年 Yann LeCun 阐述概念,到 2024 年明确技术路线,再到 Emu3 与 Emu3.5 的发布,智源始终引领前沿。2026 年推出的悟界·Physis-v0.1标志着 AI 正式进入世界模型时代。

智源将现有世界模型技术路线分为四类:以语言为中心(如 VLM、VLA)、以像素为中心(如 Sora)、以三维结构为中心(如 World Labs Marble)以及以视觉表征为中心(如 JEPA)。智源认为,真正的世界模型应以“预测下一物理状态”为核心,具备感知、理解、推理真实物理世界规律的能力,涵盖全模态数据并支持主动交互。

在智源看来,世界模型作为面向真实物理世界的下一代基座模型,以“预测下一物理状态”为核心,代表着人工智能的下一个重要范式跃迁。它不仅能感知、理解、推理真实物理世界的时间、空间、物理规律和常识,涵盖全模态数据,还具备主动交互能力,支撑各类物理世界下游应用。

1. 智源“悟界”系列基座大模型:推动数字与物理世界融合

悟界·Emu

悟界·Emu 是智源从“悟道”迈向“悟界”的里程碑。Emu3 于 2026 年 1 月登上《Nature》正刊,是我国科研机构主导的大模型成果首次在该刊发表。升级版 Emu3.5 从“预测下一个词元”扩展至跨视觉与语言序列的“下一状态预测”,以纯自回归框架原生实现文本、图像、视频的统一理解与生成,打破模态孤岛,兼具顶级学术价值与产业支撑价值。

悟界·Brainμ

悟界·Brainμ1.0是全球首个理解与生成统一的多模态神经科学大模型。它将跨物种、全模态脑信号统一编码为标准 Token,实现数据格式归一与多模态对齐。配套的全球最大的 AI-Ready 神经科学数据平台悟界·BrainToken,汇聚全球开源数据并完成万亿级 Token 化,有效解决数据孤岛问题,辅助阿尔兹海默症等疾病诊断。相关成果已支撑“记忆 - 睡眠”调控机制研究登刊《Science》。

悟界·OpenComplex

悟界·OpenComplex2.5是下一代 AI 驱动药物发现模型,重点解决固有无序蛋白(IDP)动态构象解析难题。该模型通过端到端全原子分布建模,突破传统静态结构分析局限,统一覆盖口袋识别、反向筛选、结构预测和亲和力预测四大关键步骤,为神经退行性疾病等难成药靶点研究提供新路径。

悟界·Physis

悟界·Physis-v0.1是全球首款通用世界基座模型,构筑真实物理世界 AI 底层核心引擎。它以物理隐空间表征替代传统像素预测,搭载专属物理状态编码器,统一转化全模态信息为标准化隐空间物理状态。模型支持 50+ 复杂物理场景长程推理,具备物理一致性、动作因果性、长程可推演性及通用泛化性四大核心能力,广泛应用于严肃工业、具身智能及科学研究。

悟界·RoboBrain Orca

悟界·RoboBrain Orca是以“下一个物理状态预测”为核心的具身大脑,构建“统一表征—建模—预测—交互”完整闭环。它实现从 Next Token/Frame/Action Prediction 升级为 Next Physical State Prediction,融合大量 Ego-centric 交互数据,强化具身表征。具备统一表征、因果推演、模态解码三大核心能力,实现“想、看、动”三位一体,支撑机器人在物流、酒店服务等真实环境中的长期自主作业。

2. 智能体蓬勃发展:智源形成多层次布局

自 2024 年起,智源大会持续关注智能体方向,推动 Agent 从“模型应用”走向“智能系统”。2026 年,大会重点关注 AI 如何安全、稳定地与现实环境交互。智源基于深厚技术底蕴,推出覆盖心脏辅助诊断、科学发现、个人专属助理及生物安全防护的智能体矩阵。

BAAI Cardiac Agent

全球首个面向心脏磁共振的辅助诊断智能体。依托安贞医院三千余例患者数据,构建一站式“结构分割 - 功能评估 - 疾病诊断 - 智能化报告”流程。其 Agent-Expert 系统复刻专家团队协作诊疗,心脏疾病诊断精确度达到顶尖医生水平,AUC 超 0.93。

AREX

面向科学发现的自主研究智能体,致力于推动 AI 从模仿学习向自主学习跨越。AREX 全面降低科研全流程对人类参与的依赖,服务于文献调研、思路拓展、实验设计及论文撰写等环节,赋能基础学科前沿问题的自主探索。

SoulAgent

面向个人用户的专属智能体,采用全新自研架构,节省 30% Token 成本,降低 80% 资源占用。SoulAgent 基于用户画像和技能自进化,满足个性化服务、长期记忆及安全隐私需求。在大会期间,它帮助参会者实时听会、提炼观点,打造随时“在场”的智能分身。

面向有害蛋白获取的风险发现智能体

智源推出该智能体,首次打通“计算机模拟推演”与“真实实验验证”的干湿实验闭环。系统通过主动模拟攻击者行为,验证 AI 智能体绕过生物安全筛查的可能性,将风险防控从“事后补救”转为“事前演练”,提前识别生物知识获取环节的脆弱性。

3. 全面升级至 FlagOS 2.1:打造普适高效智算基座

众智FlagOS是智源牵头打造的统一智算系统软件栈,彻底破解“多模型×多芯片”适配难题。作为全球支持芯片种类最多的智算系统,FlagOS 统一适配 18 家品牌的 32 款芯片,覆盖 NVIDIA、NPU、GPGPU、DSA、RISC-V AI、ARM 等多种架构。通过通用算子库、统一编译器及 vLLM 多芯片插件等组件,支持 90% 以上主流开源大模型的多芯片部署,实现 DeepSeek、Qwen、MiniCPM 等模型的“发布即多芯适配”。

FlagOS 构建了从底层算子到上层框架的完整技术体系。在性能优化方面,拓展 Triton-TLE 语言能力,支持多款芯片极致优化;八大算子库总数超 600 个,核心组件已进入 PyTorch 基金会生态。FlagCX 通信库统一连通 10 款芯片,并实现 AI 芯片通信的 ITU 国际标准与国家标准“双立项”。

此外,FlagRelease 发布 Express“高速”镜像版本,实现一键安装与端到端高速推理;FlagCICD 成为首个 AI 多芯片开源集成测试发版平台;FlagQuantum 作为高性能量子电路模拟框架,迈出“量智融合”的第一步。

4. 图灵奖得主与中国 AI 领军者共话未来

开幕式上,图灵奖得主 Whitfield Diffie 与 Andrew Barto 分别作主题报告。

Whitfield Diffie 以Security For AI Agents, Security Against AI Agents为题,指出当前“控制论”式修复方法的局限,呼吁开发形式化方法以提升程序可靠性。他强调,面对规模庞大的智能体程序,现有的访问限制(Confinement)措施仍显不足,需大幅增强其按预期运行的可靠性。

Andrew Barto 以Rediscovering Reinforcement Learning为题,将强化学习本质归结为“控制、搜索与联想记忆”的三位一体。他指出,机器学习最初即为强化学习,深度强化学习与大脑奖励系统的结合指明了未来方向。同时,他警示需警惕奖励信号设计中的“反常实例化”风险。

智源研究院理事长黄铁军与之江实验室主任、阿里云创始人王坚展开播客对话,围绕“总有人比时代早十年”,探讨中国大模型从追赶验证到范式创新的跃迁,以及 Agent 时代海量智能体对现实世界的影响与风险。

在“重构世界——中国大模型巅峰对话”圆桌环节,王仲远与朱军、罗福莉、刘知远、安波等行业领军者,围绕超级模型能力演进、AI 自进化、多模态与世界模型等议题深入交流。嘉宾们认为,超级模型与智能体系统将释放更大势能,自进化有望成为驱动智能跃迁的新引擎,推动 AI 真正从数字空间走向物理世界。

5. 智源 AI 科研体验区:启未来之智,溯创新之源

2026 年智源大会期间,AI 科研体验区集中呈现 SoulAgent、具身智能、众智 FlagOS、AI for Life Science 四大板块前沿成果,让观众近距离感受 AI 落地真实场景。

SoulAgent 体验区:观众可领取专属智能体,体验跨会场同步听会与学者 AI 分身对话,感受其随使用不断成长的个性化服务能力。

具身智能体验区:包含乒乓球人机对战与酒店全场景清洁展示。SpikePingPong 系统使人形机器人实现高频视觉感知与实时策略决策;基于 RoboBrainX 等模型的清洁方案展示了端侧部署在复杂任务中的优势。

众智 FlagOS 体验区:以“可视化、可互动、可带走”为理念,观众通过一键启动、知识闯关及自动生成算子等互动,直观感受 FlagOS 跨芯片、跨场景的适配能力。

AI for Life Science 体验区:分为安贞—智源心脏 AI 医院、神经科学及 AI 药物发现三个区域。观众可体验 AI 心电图分析、透明心脏病灶分析、BrainToken 数据平台及 OpenComplex2.5 药物发现模型,感受 AI 在医疗与科研领域的深度赋能。

从开启中国大模型探索,到定义面向真实物理世界的基座模型,智源以顶尖学术突破、产业生态孵化和全栈开源布局,持续为中国 AI 筑牢创新根基。面向下一代技术范式变革,智源将继续引领技术创新,构建通往物理 AGI 的破局路径。

END

【声明】内容源于网络
0
0
AIGC开放社区
1234
内容 1891
粉丝 0
AIGC开放社区 1234
总阅读31.5k
粉丝0
内容1.9k