核心亮点
文章创新性地将优化Kcat的酶突变预测重新表述为蛋白质逆折叠任务,从而在结构预测和功能优化之间建立了直接联系。模型的输入包括了一个已知酶促反应的底物、酶的序列信息和酶的三维结构信息。模型通过参照底物和酶序列的信息,对现有酶的三维结构进行逆折叠得到一个可能的氨基酸序列。扩散模型的加入使得酶可以同时预测得到多个随机位置点位突变所产生的影响,解决传统模型预测只能对单点突变的影响进行预测的问题。
其次,文章设计了一个名为KcatDiffuser的回归引导图扩散模型,旨在提高周转数(Kcat)。模型结构如图所示,主要分为两大部分,Diffusion model和Kcat regressor。

Diffusion model:依据现有的图神经网络GraDe-IF。GraDe-IF已成为一种强大的反向蛋白质折叠模型,其在维持给定的蛋白质主链,同时生成新的氨基酸序列。模型采用了和GraDe-IF相同的等效图神经网络(equivalent graph neural network,EGNN),使用DDIM的高效采样方案相结合,从而实现更大的步长和更快的酶变体生成。
Kcat regressor:回归器由Transformer和GCN组成,用于从蛋白质1D序列和3D结构中提取特征。它通过嵌入层和Transformer编码器处理重叠的n gram氨基酸,而GCN处理蛋白质图和底物的3D结构输入。然后,回归器融合这些表示形式以预测Kcat值。回归器将对比旧有氨基酸序列和新生成氨基酸序列在三维结构和底物结构的条件下Kcat值的变化情况,从而对Diffusion的采样过程进行规约。
卓越性能
相较于其他模型的效果,kcatDiffuser在酶周转数方面实现了最高的提升。这比ProteinMPNN(0.117)和PiFold(0.087)有所增强,而GraDe-IF则略有下降(-0.057),证明了我回归引导扩散方法在优化酶活性方面的有效性。其余地,KcatDiffuser在回收率和3D重建方面也均达到了不错的效果。
文章链接:https://arxiv.org/abs/2411.01745
代码地址:https://github.com/xz32yu/KcatDiffuser
分享人:朱炜荣

