大数跨境

【灵思分享】诺奖得主实验室出身的中方团队,正以世界模型重塑生命分子设计

【灵思分享】诺奖得主实验室出身的中方团队,正以世界模型重塑生命分子设计 灵思极智
2026-05-14
3

过去数年间,AI4Bio领域最耀眼的突破来自Google DeepMind的AlphaFold。

它让AI能以接近实验精度大规模“看清”蛋白质结构。到了AlphaFold 3,AI更开始理解由蛋白、核酸、小分子、离子构成的多组分复合体。

但生命工程的真正目标,不止于看清。

而是设计。设计一个分子,使其在正确位置以正确方式与目标作用,从而调控通路、改变病理过程,乃至重构某些生命功能。

以核糖体为例,它既是蛋白、RNA与小分子药物共存的分子机器,也是众多小分子药物的作用靶点。

这正是当前AI分子设计面临的关键瓶颈。

过往的AI分子设计确有突破,但许多能力仍被困在“模态孤岛”:蛋白设计、小分子生成与对接、核酸结构建模长期彼此割裂。

注:此处的“模态”并非文本/图像/音频,而是蛋白质、小分子、核酸等生命分子的不同类别,可视作不同类型的“Token”。

问题不在模型数量,而在于表征方式、训练数据与任务目标被拆分后,AI难以在同一框架中连续理解并设计跨模态的相互作用。

然而真实生命系统从不按这些边界运行。一个靶点中多模态共存是常态,疾病机制也常取决于分子间如何识别、结合、调控与失衡。

既然生命问题天然跨模态,分子设计模型为何还要受限于模态边界?

从全模态分子设计走向分子世界模型


“物理学有四大基本力。在此框架下,生物分子间的作用本质上都是电磁相互作用的不同阶展开。”

也就是说,蛋白、核酸、小分子等标签,是人类为理解生命系统而设的分类;但在更底层的原子尺度,分子间遵循统一的物理相互作用规律。

既然底层物理一致,学习分子互作的AI也不应被模态标签限定。

这一穿透性见解来自一位“很不单模态”的青年科学家。

张昊天 本科同时修读浙江大学物理学与药学,后获浙大医学硕士,并进入华盛顿大学攻读计算机。从物理底层规律、医学生命表象到计算机建模,他的学术轨迹本身就是“打破边界”的生动案例。

这一跨学科背景,使他既能从原子尺度理解分子作用,也能从模型视角重构分子设计问题。

此前,由张昊天担任一作兼共同通讯作者,临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT等力量推进的 ODesign 开源项目,定位为全球首个面向全模态的分子设计基座模型。

ODesign 将蛋白质、DNA、RNA、小分子与离子等多模态实体纳入同一生成框架,学习它们之间的相互作用,并在分子整体、功能基序、提示原子三个粒度上,实现任意两类分子间的可控设计。

张昊天认为,该项目要证明的不是“一个模型多完成几类任务”,而是更底层的问题:若生命分子相互作用本就跨模态,模型也必须具备跨模态学习与生成能力。否则,任何单一模态建模都只是用截断的世界近似真实系统,最终只能靠大规模筛选弥补不足。因此,基于团队在分子设计模型上的积累,ODesign 尝试在同一生成框架下统一表示蛋白、DNA、RNA、小分子与离子等模态,使模型能学习其相互作用,并支持跨模态联合建模与设计。

ODesign 全模态生成框架示意。ODesign 将蛋白、DNA、RNA、小分子与离子纳入同一生成框架,支持不同分子类型间的 all-to-all 设计,并可在刚性或柔性靶标条件下生成目标结合分子。来源:《ODesign: A World Model for Biomolecular Interaction Design》

支撑这一愿景的,是一支“从2024诺贝尔化学奖实验室走出”的青年科学家团队。

2024年,David Baker 因“计算蛋白设计”获诺贝尔化学奖。ODesign 项目三位核心成员 张昊天、应可钧、王佳淇 均来自 Baker Lab。团队兼具前沿AI建模、计算蛋白设计训练背景及干湿闭环理解,是国内少数真正处于AI4Science与生命分子设计交叉点的团队。

统一表征与涌现:世界模型雏形


理念上的跨模态,需在工程上落地为统一表征。

ODesign 的首个难题是:蛋白、小分子、核酸结构差异巨大,如何让同一模型真正“读懂”不同分子?

团队思路是寻找模态间可共享的“最小化学生成单元(MCGU)”。模型不再将蛋白、小分子、核酸视为割裂对象,而是先拆解到统一化学基元层面,再通过 Modality Token 和 Unit Token 表征。推理时,模型先围绕共享基元生成,再补全各模态特有的原子信息。

ODesign 的统一表征架构。模型将不同分子类型的最小化学生成单元抽象为统一 token,通过 Pairformer 学习其与目标结构的相互作用,再由全原子扩散模块生成满足空间约束的三维结构。

这不只是工程技巧,更是跨模态迁移的前提:唯有打通表征层,模型才能学到超越单一分子类型的通用互作规律,找到统一的“分子语言”。

在此基础上,ODesign 还构建了基于结构预测的生成式架构。先训练结构预测框架,再重构信息流与目标函数,让模型从“预测这些分子会形成何种结构”转向“生成一个能按预期作用的新分子”。

前者是理解结构,后者是设计关系。

那么,统一表征是否真带来了新能力?

现有验证显示,ODesign 的价值不止是“一个模型做更多任务”,更在于其跨模态的迁移能力。

蛋白设计上,ODesign 表现过硬。其计算通量较 RFDiffusion 提升约10倍,在 RFDiffusion2 的 AME 测试集中,ODesign-Flex 实现相较 RFDiffusion2 提升20倍的设计候选通量。

更关键的验证在低数据模态——核酸。相比蛋白,核酸数据更少,成熟模型也更少。ODesign 在RNA单体设计成功率上约为 RNAFrameFlow 的两倍;在训练集外的蛋白-RNA复合体零样本设计中,平均成功率达77.9%。说明它并非“披着全模态外衣的蛋白模型”,而是真正将蛋白场景学到的互作规律迁移到了RNA、DNA等低数据模态。

ODesign 在核酸设计任务中的跨模态迁移验证。在RNA/DNA单体生成及蛋白结合aptamer设计中,ODesign 展现出向低数据核酸模态迁移互作规律的能力,其中protein-binding RNA任务体现了其零样本设计潜力。

小分子方面更贴近药物研发场景。ODesign 在蛋白结合小分子任务上较 SurfGen 提升超40倍,并覆盖DNA/RNA结合小分子设计。这不再是旧任务刷分,而是触及了传统小分子模型无法处理的盲区。

ODesign 在小分子设计任务中的表现。在蛋白、DNA、RNA结合小分子设计中,ODesign 展现出跨靶标类型生成小分子的能力,开始覆盖传统专家模型更难处理的跨模态设计组合。

计算指标之外,最终要看湿实验——即在真实生物实验体系中检测、筛选与确认。

据张昊天介绍,ODesign 已在8个靶点上获得nM至pM级亲和力的候选分子。与 RFDiffusion、BindCraft、BoltzGen、PXDesign 等方法相比,ODesign 在protein design上使binding affinity提升数倍至数百倍。这标志着 ODesign 正真正进入生物实验体系。

统一生成、跨模态迁移与实验验证的贯通,正是“分子世界模型雏形”的价值所在。它证明模型终于跨越模态边界,开始学习分子世界更底层的相互作用规律。

从基座到闭环:重构科学发现基础设施


但ODesign作为开源科研项目,对团队而言并非终点。作为原型机,它验证了统一生成与跨模态迁移的可行性,却离完整的微观分子世界模型尚有距离。此外,它尚未封装为可规模化、可验证、可容错的产业工具。真正挑战在于:如何从一个能生成分子的模型,进化为一个能参与真实药物研发全流程的系统。

为此,张昊天决定独立,联合应可钧、王佳淇等伙伴共同创立 英灵殿科技,并完成由五源资本领投的首轮融资

张昊天团队从技术路径出发,将道路拆解为三个清晰台阶:AI4Bio、AI4AI 与 AI4Phy

短期,AI4Bio是商业化入口,从真实生物分子设计任务切入,服务药企与科研机构。真实药物研发中,模型不能只看结合力,还需面对毒性、渗透性、免疫原性、可合成性等多重约束。

中期,AI4AI指向自我迭代的科学智能框架。

当前AI4Science的困境是:许多模型能刷新Benchmark,却难真正说服客户。问题不止在结果不够好,也在于模型输出仍是黑盒:为何这样设计?依据何在?失败如何修改?

AI4AI要解决的正是这点。它将非结构化文献、实验数据和模型输出整理为可导航的知识拓扑,让模型不仅给出答案,还能围绕假设提出、归因评估和结果优化进行推理。

更长远则是AI4Phy,即自驱动实验室。

模型生成候选,实验系统完成合成、纯化、测试,结果再反馈模型,驱动下一轮设计。此循环一旦运转,模型便不再只吃历史数据,而是在真实反馈中持续校正自身。

这才是分子世界模型与普通生成模型真正拉开差距之处。

普通生成模型可给出候选。世界模型需理解:一个分子设计进入真实物理世界后会怎样,失败在哪里,又如何修正。

做到这一步,考验的不仅是模型能力,更是团队能否同时理解科学问题、实验反馈与产业流程。

这也是英灵殿团队结构值得关注的原因。张昊天横跨物理、药学、医学与计算机;CTO 应可钧拥有哈佛生物医学与计算机背景,及斯坦福医学院和Baker Lab博士后经历;联合创始人王佳淇长期从事大模型与计算生物学交叉研究。

这种交叉结构,正对应AI Biotech最难的环节:模型生成之物,必须被生物学问题定义、被化学规则约束、被实验体系验证、最终被产业流程承接。

这支从Baker Lab走出的团队,也让五源资本敢于早期下注。投资人表示,团队兼具算法能力、生命科学理解、干湿闭环能力与企业家精神,是值得长期陪伴的科学创业力量。

当分子间相互作用开始被模型统一学习、生成与验证,AI4Bio的叙事逻辑正在改变。它不再是更快地发现候选分子,而是让科学家能以更可编程的方式提出假设、生成设计、进入实验,再用真实结果反哺模型。

AlphaFold让AI4Bio的首场革命发生在“看清结构”,而英灵殿科技想挑战的,是下一步:让AI不仅理解生命分子如何相互作用,更能模拟与设计微观世界的动态过程,最终走向对生命功能本身的模拟与重构。


————  END  ————


灵思极智旗下“极智系列”三款AI智能应用

图片




灵思极智让AI为各行业赋能
打造[超级企业]+[超级个体]
“让人回归人的价值”!
用灵思,创极智!点击关注“灵思极智”
图片


关注后,两步置顶服务号,可第一时间收到灵思极智推文!


图片

【声明】内容源于网络
0
0
灵思极智
AI领域超级创造工厂,用灵思,创极智!
内容 176
粉丝 0
灵思极智 AI领域超级创造工厂,用灵思,创极智!
总阅读135
粉丝0
内容176