大数跨境
0
0

构象生成性能评测的失败案例分析1例

构象生成性能评测的失败案例分析1例 墨灵格信息科技
2025-11-17
6
导读:在构象生成性能评测的文章中,传统计算方法不能重现分子内具有强相互作用的生物活性构象。本文以其中一个代表性化合物A10为例,进行了理论解释,选择标准的力场参数并重新进行计算,用传统方法重现了A10的生物
Wang等人(2023)在评估传统方法与AI方法的小分子构象生成性能时发现:在数据集I(包含3354个高质量配体生物活性构象)的评估中,传统方法(如ConfGenX、OMEGA、Conformator和RDKit ETKDG)对128个分子完全无法复现其生物活性构象。
A10分子(图1,原文图4-B)是其中最具代表性的案例。A10分子的晶体构象显示,其两个苯环通过π-π共轭相互作精确定位,这种构象在蛋白结合状态下稳定存在。然而,传统方法生成的构象未能捕捉这一特征。传统方法生成的构象中,苯环取向偏离实验确定的晶体构象,导致RMSD(均方根偏差)显著超标(通常>2.00 Å)。

文章通过图1(原文图4-B)直观对比了A10分子的晶体构象与传统方法生成构象的差异:

图1. 代表性分子A10的生成构象与晶体构象对比。生成构象中的碳原子和晶体构象中的碳原子分别用绿色和灰色表示,所有氢原子均未显示。 
如图1所示,传统方法生成的构象(绿色)与晶体构象(灰色)在苯环取向上存在明显偏差,而AI模型生成的构象更接近真实状态。更准确的说,传统方法生成的都是舒展型的构象,而不是折叠型的结合构象。

文章从方法学解释了传统方法的失败的原因:

  1. 规则库的局限性:传统方法(如OMEGA、ConfGenX)依赖从晶体数据库(如CSD或PDB)推导的构象偏好(如扭转角、环几何),但A1O分子的π-π相互作用不属于常见规则范畴,导致预测偏差。

  2. 能量最小化偏向:传统方法倾向于生成热力学最稳定的构象(能量最低),而生物活性构象可能因蛋白环境而处于亚稳态。A1O分子的结合构象涉及熵效应对不利的取向,传统方法的力场优化无法模拟这种蛋白诱导的构象变化。

  3. 采样策略不足:传统方法基于距离几何或随机采样,对于柔性分子的构象空间覆盖不全面。A10分子需精确的扭转角组合,传统方法在有限采样下易错过关键构象。


基于上述比较,作者推测对于具有强分子内相互作用的生物活性构象预测,使用AI模型可能是更好的选择:

Based on the above comparison, we speculate that for predicting bioactive conformations with strong intramolecular interactions using AI models might be a better choice.

https://pubs.acs.org/doi/10.1021/acs.jcim.3c01519

对此,我有不同的意见:传统方法的失败是因为使用了默认参数,尤其是力场——变体力场忽略了分子内长程相互作用——这使得分子内强的相互作用被忽略。

以omega的searchFF选项为例:

-searchFF : Forcefield to be used for torsion driving

omega的力场参数有几个选项:

Contents of parameter -searchFF    Aliases : -srchff    Type : omegaff    Allow list : false    Default : mmff94smod_noestat    Simple : false    Required : false    Legal values : mmff mmff_noestat mmff_trunc mmff_sheff mmff94s mmff94s_noestat mmff94s_trunc mmff94s_sheff mmff94smod mmff94smod_noestat mmff94smod_trunc mmff94smod_sheff sage sage_noestat sage_sheff    Brief : Forcefield to be used for torsion driving

注意到:mmff94smod_noestat是searchFF选项的默认参数根据说明书对mmff94smod_noestat的描述,该力场变体包含除库仑相互作用之外的所有 MMFF94s-Mod 项。也就是说,在默认情况下,omega为了平衡计算速度与精度,并不考虑分子内静电相互作用项,这可以解释为什么Wang等人的文章使用传统方法不能重现A10的生物活性构象。

Flare的XedeX是另一个采用类似策略的构象搜索方法,在默认条件下忽略分子内长程相互作用,如下图所示:

请注意,在默认情况下”Turn off Coulombic and attractive vdW forces“选项是被选中的,这意味着:如果设置此选项,用于最小化构象的力场将关闭吸引性范德华力和所有库仑力。这会导致更大、更柔性分子的构象更好(特别是更扩展的构象),但代价是失去由于内部氢键等引起的构象限制。如果您知道您的构象受分子内氢键限制影响很大,请关闭此选项,否则建议保持开启。

在实践中,除了分子内经典的氢键之外,该选项还对其它分子内相互作用产生影响,比如O/N孤对电子···S相互作用、C-H···O=C等非经典氢键相互作用、卤键等。在之前的一个构象搜索案例中(用FieldTemplater预测ROS1抑制剂的生物活性构象),涉及分子内N···S相互作用,我强调一定要关闭”Turn off Coulombic and attractive vdW forces“项以确保得到正确的生物活性构象。

以Flare XedeX构象搜索为例,在关闭”Turn off Coulombic and attractive vdW forces“选项之后,就正确地找到A10的生物活性构象,RMSD = 0.96 Å。

图2. A10生物活性构象(黄色)与Flare XedeX生成构象(绿色)的比较 
如上图2所示,黄色分子为PDB 4LA7共晶配体A10的结合构象,绿色分子为Flare XedeX搜索到的一个低能构象,两者之间的重原子RMSD = 0.96 Å,这优于所有的AI的方法(图1)。Omega在使用标准力场的情况下,也重现了A10的结合构象(这里没有给出图片)。
总的来说,传统方法构象搜索的”失败“,主要是因为力场参数选择的原因,而非方法学本身的问题。
文献
  1. Wang, Z. et al. (2023) “Small-Molecule Conformer Generators: Evaluation of Traditional Methods and AI Models on High-Quality Data Sets,” Journal of Chemical Information and Modeling, 63(21). Available at: https://doi.org/10.1021/acs.jcim.3c01519.


【声明】内容源于网络
0
0
墨灵格信息科技
1234
内容 359
粉丝 0
墨灵格信息科技 1234
总阅读555
粉丝0
内容359