CBGBench:构建结构基药物设计的标准化评估基准
基于结构的药物设计(SBDD)在生成式AI技术的推动下快速发展,但因实验设置多样、实现复杂、结果难复现及任务单一等问题,领域内仍缺乏系统性理解[k]。
为此,西湖大学、深势科技与华盛顿大学等机构的研究团队提出CBGBench——一个针对SBDD任务的综合基准框架,该研究已被ICLR 2025接收为spotlight论文[k]。
CBGBench将SBDD统一建模为“生成式图补全”任务,类比于3D蛋白-配体复合物的“完形填空”,通过模块化、可扩展的设计支持多种生成方法,实现公平比较与系统评估[k]。
涵盖五大核心药物设计任务
为突破传统de novo分子生成的局限,CBGBench将以下五类关键任务统一纳入图填充框架,均以蛋白结合口袋结构为条件输入[k]:
- 从头分子生成(De novo Generation)
- 连接原子设计(Linker Design)
- 分子片段补全(Fragment Growing)
- 分子骨架生成(Scaffold Hopping)
- 分子侧链装饰(Sidechain Decoration)
多维度评估体系确保全面性
评估涵盖四个核心维度,综合衡量模型性能[k]:
- 蛋白-配体相互作用分析
- 化学合理性(如可合成性、药物相似性)
- 几何真实性(键长、键角、分子构象稳定性)
- 子结构有效性(药效团保留情况)
关键研究发现
基于全面实验分析,研究揭示以下趋势与挑战[k]:
- 基于密度图的卷积神经网络(CNN)方法仍具竞争力,反映图神经网络(GNN)在3D点云建模中存在瓶颈,优化GNN架构是重要方向。
- 基于Diffusion的生成模型整体表现最优,成为当前主流研究路径。
- 自回归方法需在训练中显式建模原子键的几何关系,否则难以生成化学有效的分子;POCKET2MOL的成功归因于其对化学键模式的建模与对比学习机制。
- 现有方法对物理化学先验知识整合不足,导致原子冲突等问题频发,如何有效融合领域知识仍是关键挑战。
- 多数方法可直接用于先导化合物优化,但性能差异不显著,提升空间广阔。
推动领域发展的开源生态
为降低研究门槛,团队提供统一代码库CBGBench,集成数据预处理、模型训练、采样与评估全流程,助力SBDD模型的高效开发与验证[k]。
CBGBench旨在建立标准化、可扩展的评估体系,促进结构基药物设计领域更系统、公平且可复现的研究,为未来AI驱动药物发现奠定坚实基础[k]。

