大数跨境
0
0

两篇Nature,一个趋势:AI重塑酶工程范式

两篇Nature,一个趋势:AI重塑酶工程范式 X-MOL资讯
2025-12-05
2
导读:华盛顿大学David Baker教授与格拉茨技术大学Gustav Oberdorfer教授团队,分别推出了名为“RFdiffusion2”和“Riff-Diff”的AI驱动酶设计新方法,成功实现了对多


酶能在温和条件下高效、高选择性地完成反应,在工厂和实验室中被广泛用作生物催化剂。然而,依赖从自然中发现具有特定功能的酶,如同大海捞针,耗时耗力且充满不确定性。于是,“计算酶设计(computational enzyme design)”这一领域应运而生——科学家在计算机的帮助下尝试凭借理性“从头设计”,创造出具有定制化功能的酶作为催化剂。早先的计算酶设计策略中,科学家基于对化学反应过渡态的理解,构建出由关键氨基酸侧链组成的理想活性位点模型(即“理论酶”),然后将其“嫁接”到已知的天然蛋白质骨架的空腔中。这一思路成功诞生了第一批人工设计的酶,证明了概念的可行性,但其催化效率往往极低,通常需要经过多轮定向进化实验优化及实验筛选才能达到实用水平。设计成功率低、严重依赖后续实验迭代,成为制约该领域发展的主要瓶颈。近年来,人工智能(AI),特别是深度学习和生成式模型,为蛋白质结构预测与设计带来了革命性突破。2024年诺贝尔化学奖表彰的就是在这些领域做出卓越贡献的三位科学家——华盛顿大学David Baker教授因计算蛋白质设计领域的贡献获得一半奖金,而Google DeepMind的Demis Hassabis博士和John M. Jumper博士因人工智能模型AlphaFold2用于蛋白质结构预测而分享另外一半奖金。AlphaFold2等工具能以前所未有的准确度预测蛋白质结构,而Baker教授等提出的RFdiffusion等生成模型则能根据特定约束凭空创造出全新的、可折叠的蛋白质骨架。但这可能还不够,我们能否直接告诉AI一个理想的化学反应中心应该长什么样,然后让它为我们设计出包裹这个中心、并能稳定存在的整个蛋白质?


近日,同期发表于Nature 杂志的两篇论文正是这一前沿方向上的里程碑式成果。美国华盛顿大学David Baker教授与合作者研究团队和奥地利格拉茨技术大学Gustav Oberdorfer教授团队的研究者们,分别推出了名为“RFdiffusion2[1] 和“Riff-Diff[2] AI驱动酶设计新方法,成功实现了对多种非天然或高难度反应的高效酶设计。这两项工作标志着计算酶设计正从依赖大量试错的“半理性设计+定向进化”模式,迈向基于AI的“精准设计”新范式,为按需创造高性能生物催化剂打开了全新局面。

RFdiffusion2设计方法。图片来源:Nature [1]


David Baker团队此前开发的RFdiffusion模型已在蛋白质生成方面取得巨大成功 [3]然而,将其应用于酶设计时,一个关键限制浮现出来:模型需要用户不仅预先指定催化残基(如结合锌离子的组氨酸)在三维空间中的位置,还要指定它们在蛋白质序列中的具体位置(第几个氨基酸)以及侧链旋转异构体(rotamer)的构象。对于包含多个残基的活性位点,可能的序列位置和构象组合是一个天文数字,无法进行穷举采样。之前的做法是随机选择一种组合输入模型,这极大地限制了找到最优设计的能力。该团队意识到,一个理想的酶设计工具应该只关心催化所必需的功能原子(如组氨酸的N原子、天冬氨酸的O原子)在过渡态周围的空间排布,而将“这些功能基团应该属于哪个氨基酸、这个氨基酸在序列的什么位置、它的侧链如何扭动才能到达那个位置”等问题,交给AI模型在生成蛋白质骨架的过程中自行探索和解决。为此,他们开发了RFdiffusion2。与旧方法(需预先采样所有可能)相比,RFdiffusion2只需输入过渡态复合物和催化侧链功能基团的坐标。在模型的生成轨迹中,这些功能原子的位置是固定的,而蛋白质主链从噪声中逐渐成形,最终“抓住”这些固定的基团,将其连接到模型自主选定的骨架Cα原子上,从而确定其序列位置。

第二轮设计的表征。图片来源:Nature [1]


他们以设计水解荧光底物4MU-PA的锌金属水解酶作为测试案例。首先,利用密度泛函理论(DFT)计算了锌离子激活的水分子亲核攻击酯键的过渡态几何结构,得到了包含三个组氨酸(结合Zn)、一个潜在通用碱基以及底物过渡态的“理论酶”模型。利用RFdiffusion2,他们生成了5120个蛋白质骨架,并通过ProteinMPNN为其设计序列,再经过AlphaFold2结构验证和PLACER活性位点预组织程度评估,最终筛选出96个设计进行实验测试。第一轮设计即获得重大成功:设计A1(后称ZETA_1)的催化效率(kcat/KM)高达16,000 M-1 s-1比此前未经优化的从头设计金属水解酶高出3个数量级。更重要的是,该酶是一次性从计算机设计而来,未经任何实验优化。PLACER分析表明,活性设计的底物和侧链在活性位点中高度固定(预组织),而非活性设计则表现出较大的波动,这验证了预组织评估的有效性。对ZETA_1的深入表征证实了其锌离子依赖性、合理的催化残基贡献以及良好的稳定性。在第二轮设计中,该团队改进了“理论酶”模型,明确包含了催化碱基,并使用更大数据集训练的新版RFdiffusion2进行设计。结果成功率显著提升:在96个设计中,有11个表现出高活性,其中最优设计ZETA_2的kcat/KM达到53,000 M-1s-1催化速率常数(kcat)为1.5 s-1活性进一步逼近天然酶水平。最终的晶体结构为设计准确性提供了有力证据。ZETA_2的apo状态晶体结构与设计模型高度吻合,Cα RMSD仅为1.1 Å,催化残基也按设计意图预组织在活性位点中。这令人信服地表明,RFdiffusion2能够精确地将量子化学蓝图转化为真实存在的、具有预定功能的高效酶。


值得一提的是,近期David Baker团队还推出了全新的RFdiffusion3 [4-5]在设计中实现了从氨基酸级别到原子精度的跨越式突破。有兴趣的读者可以关注。

Riff-Diff从催化阵列开始从头设计酶。图片来源:Nature [2]


Gustav Oberdorfer团队面对的是酶设计中的另一个经典问题:如何将一个已知有效的催化残基阵列(例如,提取自一个经过定向进化优化的高效人工酶)精确地嵌入到一个全新的、稳定的蛋白质骨架中,并形成合适的底物结合口袋。他们希望开发一个半自动化的流程,能够高成功率地实现这一目标。他们提出的Riff-Diff方法中,催化残基阵列的侧链构象旋转异构体被系统性地翻转,并与刚性的螺旋片段骨架结合,生成大量在空间上兼容的人工基序库,作为RFdiffusion的输入。为了解决RFdiffusion在生成时对底物包埋深度控制不足的问题,他们在人工基序中引入一个占位螺旋作为口袋入口的标记。在扩散过程中,通过自定义的辅助势能引导蛋白质骨架围绕此中心生成,从而确保形成包埋足够深、类似天然酶的结合口袋。生成初步骨架后,采用迭代循环(结合LigandMPNN序列设计、ESMFold/AlphaFold2结构预测等)对骨架和活性位点几何结构进行精细优化。

Riff-Diff设计MBH酶的活性与结构。图片来源:Nature [2]


研究团队用两个截然不同的反应体系验证了Riff-Diff的普适性。(1)逆醛缩反应。他们从一个已知的高效人工逆醛缩酶RA95.5-8F中提取了其催化四残基阵列。通过Riff-Diff,他们设计了36个序列。实验结果显示,高达91%的设计具有可检测的活性。其中,RAD29和RAD35尤为突出,其kcat值分别达到3.1×10-2 s-13.6×10-2 s-1比此前所有一次性设计的逆醛缩酶活性高出多个数量级,甚至超越了某些经过进化的催化。突变实验证实了催化四残基的贡献。此外,这些设计表现出高度的热稳定性和出色的立体选择性。(2)Morita-Baylis-Hillman (MBH) 反应。他们选取了两个经定向进化获得的MBH酶(BH32.14和BH1.8)的活性位点阵列作为输入。针对这两个阵列,Riff-Diff分别设计了18个和45个序列。令人印象深刻的是,分别有94%和93.3%的设计表现出高于小分子催化剂(如咪唑)的背景活性。最优设计MBH48的kcat达到0.025 min-1其活性超过了经过8轮定向进化、筛选了上万克隆所得的变体BH32.8。研究团队还解析了四个逆醛缩酶和两个MBH酶的晶体结构。所有结构均与设计模型高度一致,催化残基的排布也基本重现了设计意图。这明确证明了Riff-Diff能够实现原子精度的活性位点设计。


总结


这两篇发表于Nature的背靠背论文,分别开发并验证了能够从零开始、高效设计出具有高催化活性酶的人工智能方法,突破了传统酶设计需要预先、精确固定催化残基所有自由度(序列位置、构象)的桎梏,无需依赖传统的“设计-筛选-定向进化”多重循环,仅通过计算机设计,便能快速、直接获得催化效率媲美甚至超越早期进化阶段人工酶的高性能催化剂。这些成果标志着计算酶设计领域迈入了一个崭新的AI驱动时代。


参考文献:

[1] Kim, D., et al. Computational design of metallohydrolases. Nature2025, DOI: 10.1038/s41586-025-09746-w

[2] Braun, M., et al. Computational enzyme design by catalytic motif scaffolding. Nature2025, DOI: 10.1038/s41586-025-09747-9

[3] Watson, J. L. et al. De novo design of protein structure and function with RFdiffusion. Nature2023620, 1089–1100. DOI: 10.1038/s41586-023-06415-8

[4] Butcher, J., et al. De novo Design of All-atom Biomolecular Interactions with RFdiffusion3. bioRxiv2025, DOI: 10.1101/2025.09.18.676967

[5] RFdiffusion3 now available

https://www.ipd.uw.edu/2025/12/rfdiffusion3-now-available/ 


(本文由甘棠供稿)



点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊

【声明】内容源于网络
0
0
X-MOL资讯
“X-MOL资讯”隶属于X-MOL学术平台(官网x-mol.com),关注化学、材料、生命科学、医学等领域的学术进展与科研前沿,提供专业与深度的内容。公众号菜单还提供“期刊浏览”等强大功能,覆盖各领域上万种期刊的新近论文,支持个性化浏览。
内容 19833
粉丝 0
X-MOL资讯 “X-MOL资讯”隶属于X-MOL学术平台(官网x-mol.com),关注化学、材料、生命科学、医学等领域的学术进展与科研前沿,提供专业与深度的内容。公众号菜单还提供“期刊浏览”等强大功能,覆盖各领域上万种期刊的新近论文,支持个性化浏览。
总阅读1.6k
粉丝0
内容19.8k