大数跨境
0
0

用「完形填空」的思维生成蛋白-分子复合物,西湖大学等发布CBGBench助力药物设计

用「完形填空」的思维生成蛋白-分子复合物,西湖大学等发布CBGBench助力药物设计 ScienceAl
2025-02-27
7
导读:西湖大学、深势科技、华盛顿大学的研究人员发布新工具。

CBGBench:构建结构基药物设计的标准化评估基准

基于结构的药物设计(SBDD)在生成式AI技术的推动下快速发展,但因实验设置多样、实现复杂、结果难复现及任务单一等问题,领域内仍缺乏系统性理解[k]

为此,西湖大学、深势科技与华盛顿大学等机构的研究团队提出CBGBench——一个针对SBDD任务的综合基准框架,该研究已被ICLR 2025接收为spotlight论文[k]

CBGBench将SBDD统一建模为“生成式图补全”任务,类比于3D蛋白-配体复合物的“完形填空”,通过模块化、可扩展的设计支持多种生成方法,实现公平比较与系统评估[k]

涵盖五大核心药物设计任务

为突破传统de novo分子生成的局限,CBGBench将以下五类关键任务统一纳入图填充框架,均以蛋白结合口袋结构为条件输入[k]

  • 从头分子生成(De novo Generation)
  • 连接原子设计(Linker Design)
  • 分子片段补全(Fragment Growing)
  • 分子骨架生成(Scaffold Hopping)
  • 分子侧链装饰(Sidechain Decoration)

多维度评估体系确保全面性

评估涵盖四个核心维度,综合衡量模型性能[k]

  • 蛋白-配体相互作用分析
  • 化学合理性(如可合成性、药物相似性)
  • 几何真实性(键长、键角、分子构象稳定性)
  • 子结构有效性(药效团保留情况)

关键研究发现

基于全面实验分析,研究揭示以下趋势与挑战[k]

  • 基于密度图的卷积神经网络(CNN)方法仍具竞争力,反映图神经网络(GNN)在3D点云建模中存在瓶颈,优化GNN架构是重要方向。
  • 基于Diffusion的生成模型整体表现最优,成为当前主流研究路径。
  • 自回归方法需在训练中显式建模原子键的几何关系,否则难以生成化学有效的分子;POCKET2MOL的成功归因于其对化学键模式的建模与对比学习机制。
  • 现有方法对物理化学先验知识整合不足,导致原子冲突等问题频发,如何有效融合领域知识仍是关键挑战。
  • 多数方法可直接用于先导化合物优化,但性能差异不显著,提升空间广阔。

推动领域发展的开源生态

为降低研究门槛,团队提供统一代码库CBGBench,集成数据预处理、模型训练、采样与评估全流程,助力SBDD模型的高效开发与验证[k]

CBGBench旨在建立标准化、可扩展的评估体系,促进结构基药物设计领域更系统、公平且可复现的研究,为未来AI驱动药物发现奠定坚实基础[k]

代码开源与未来展望:推动AI辅助药物设计发展

CBGBench有望成为SBDD领域标准基准,促进行业技术迭代与创新

尽管现有优化方法效果理想,但在多数情况下生成分子的结合亲和力等关键指标未显著提升,仍有较大改进空间。采用DPO、ITA等前沿技术可增强优化分子在模型中的监督学习比重,进一步提升性能[k]
为降低研究门槛,项目提供统一开源代码库,涵盖预处理数据集、训练与评估脚本,以及SBDD相关生成模型[k]
未来计划将扩展任务类型,集成更多AI驱动的SBDD方法,并优化计算效率策略,全面提升平台能力[k]
研究团队期望CBGBench能成为基于结构的药物设计(SBDD)领域的标准评估基准,加速AI在药物研发中的深度应用与技术突破[k]
【声明】内容源于网络
0
0
ScienceAl
机器之心旗下媒体,关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
内容 1918
粉丝 0
ScienceAl 机器之心旗下媒体,关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
总阅读13.0k
粉丝0
内容1.9k