大数跨境
0
0

JACS Au封面:AI精准设计有机荧光材料——自适应β-VAE打开分子逆向设计新格局

JACS Au封面:AI精准设计有机荧光材料——自适应β-VAE打开分子逆向设计新格局 X-MOL资讯
2025-08-01
3
导读:纽约大学徐聿智联合多家科研机构团队提出了一种基于自适应 β 变分自编码器的智能分子设计策略,实现了有机荧光分子的精准优化设计。


注:文末有本文科研思路分析


有机荧光分子因其优异的发光特性,在生物成像、材料科学等领域发挥着越来越重要的作用。然而,如何精准设计具备特定光学性质的荧光分子,一直是科学界的重大挑战。长期以来,分子设计主要依赖研究人员的经验与反复试错,不仅耗时耗力,还难以精准实现目标性能。近年来,随着人工智能的发展,统计模型和逆向设计方法为分子设计开辟了新路径。然而,现有多数方法仍停留在任意分子生成或理论性质预测阶段,距离满足实际需求仍有差距。


近日,纽约大学徐聿智(Yuzhi Xu)联合多家科研机构团队在该团队前期有机材料光学性质预测研究积累的基础上(JCIM2021, 1053–1065),于JACS Au 发表了突破性研究,提出了一种基于自适应 β 变分自编码器(adaptive β-VAE)的智能分子设计策略,实现了有机荧光分子的精准优化设计。凭借其创新性,该成果被选为 JACS Au 封面论文(Front Cover)。


有机荧光材料的设计长期面临一个核心难题——复杂的结构-性质关系。虽然第一性原理计算在一定程度上能帮助研究人员理解分子性质,但它往往难以在计算速度与精度之间取得最佳平衡,而且可预测的性质范围有限。近几年,机器学习在有机材料光学性质预测中展现出巨大潜力。然而,现有反向设计方法依然存在明显局限:(1)多数预测模型依赖分子描述符,而描述符到分子的转换是单向的,无法直接重构分子结构;(2)现有的分子生成器要么局限在小分子范围,要么只适用于理论性质,难以直接对应实验性质。


为解决这些问题,纽约大学徐聿智团队提出了自适应 β 变分自编码器(adaptive β-VAE),并结合基于潜在向量的性质预测模型,形成了新的智能分子设计策略。这套方法的核心创新在于动态调节 KL 散度的缩放因子 β:训练初期使用较高 β 值,构建全局多样化的潜在空间;训练后期逐步降低 β 值,使模型聚焦局部重构精度。这种策略有点像生物进化:前期“广泛变异”,探索更多可能性;后期“精细选择”,收敛到精准解。


此外,该团队还通过融合多样化的分子数据,显著扩展了模型可覆盖的分子骨架类型,大幅提高了生成分子的结构多样性与性质精准性。这一研究不仅解决了有机荧光材料设计中长期存在的瓶颈,也展示了AI驱动的逆向分子设计在材料科学中的强大潜力。

图1. 自适应 β VAE 相比标准 VAE 和普通 AE 在分子生成中取得的显著进展。


图 1A 首先给出 VAE 与 β VAE 的结构对比示意,而图 1B 则显示了三种模型训练过程中 β 值的动态变化轨迹。图 1C表明:当 β 设置较大时,模型偏向全局探索;当 β 接近 0 时,模型更关注精确重构;而自适应 β VAE 则实现了从全局探索到局部精炼的平衡,通过逐步降低 β,引导训练路径先寻找潜在最优区间,再回归高精度解,同时显示了不同设置下的重构误差热图和训练轨迹。图 1D 比较了包括标准 VAE、优化型 AE 和自适应 β VAE 在各数据集上的重构精度,后者普遍表现最好。最后,图 1E 的箱型图进一步说明,自适应 β VAE 在固定初始潜向量基础上进行插值扰动时,生成的可行分子数量远超其他模型,证明其在保持结构多样性的前提下,大幅提升了有效分子生成能力


研究表明,来自自适应 β-VAE的潜在向量不仅能高效生成分子结构,还能作为下游预测模型的优质输入,用于预测荧光能量和量子产率等实验性质。 在QM9 数据集上,三种 VAE 变体均实现了超过 98% 的分子重构率。而在更具挑战性的 ChemFluor30 数据集(包含 30 个重原子以下的荧光分子)中,自适应 β-VAE 将重构率从 59% 提升至 67%,相对提高约 13%。 更值得关注的是,在分子多样性方面,自适应 β-VAE 的表现尤为亮眼:通过扰动潜在向量子集,该方法生成的不同分子数量平均是原始 VAE 的 8.2 倍,且化学骨架和性质更为丰富。

图2. 高维潜在空间分析与合成验证。


其性质预测模型在预测荧光发射能量时的平均绝对误差仅 0.128 eV,已接近 TD-DFT(约 0.20 eV) 的精度。这一高精度预测使得研究团队能够精准重建潜在空间(latent space)与分子化学性质之间的映射关系,为分子性能的定向优化提供了可靠依据。


在分子优化与编辑方面,研究团队利用潜在空间中的梯度引导和高维最优区域采样,设计并合成了新的荧光分子。通过对高维潜在空间进行可视化,他们成功在性质调控中实现精准导航。以咪唑并吡啶衍生物为例,研究人员在其潜在空间邻域探索中设计并合成了具有扩展 π 体系的新化合物。其中合成的化合物 显示出明亮的蓝色荧光,CIE 坐标为 (0.16, 0.09),展示了其作为蓝光 OLED 发光材料的潜力。这一成果不仅验证了方法的可行性,也凸显了其在新型有机材料发现中的应用前景。


原文(扫描或长按二维码,识别后直达原文页面):

Exploring Optimized Organic Fluorophore Search through Experimental Data-Driven Adaptive β-VAE

Yuzhi Xu, Yongrui Luo, Bo Li, Weikang Jiang, Jinyu Zhang, Jiangbo Wei, Hanzhi Bai, Zhiqiang Wang, Jiankai Ge, Ruiming Lin, Zehan Mi, Haozhe Zhang. Yifeng Tang, Michael S. Jones, Xiaotian Li, John Z.H. Zhang, Cheng-Wei Ju*

JACS Au 20255, 7, 3082–3091,DOI: 10.1021/jacsau.5c00052


科研思路分析


我们一直在关注一个核心问题,有机荧光分子的结构–性质关系极其复杂。在职业生涯早期,我们在多项研究中就深刻体会到,有机材料的光物理性质不仅复杂,而且往往具有高度特异性。 在理论计算中,TD-DFT 是最常用也最可及的方法。然而,它的精度距离真正的“设计”还相差甚远,在很多时候,它更多被用来做光物理现象的解释与机理分析,而不是精确的性质预测与分子筛选。 


正因如此,我们开始探索一种不同的路径:机器学习这种 top-down 的数据驱动方法。在前期工作中(JCIM2021, 1053–1065),我们发现这种策略在预测有机分子的光学性质时,精度可以显著优于 TD-DFT,并且可以实现量子产率这种TD-DFT无法轻易得到的性质的预测。


在前期的光学性质预测研究中,我们积累了不少数据和模型经验。这让我们开始思考:能不能用机器学习这种数据驱动的方法,做真正能落地到实验的逆向设计?虽然生成模型已经很多,但要把待优化的潜在空间精确映射到实验性质,依然是个不小的挑战。尤其在有机材料领域,不同于药物分子,材料分子往往有多重共轭体系和更大的骨架,使得药物化学里成熟的模型很难直接套用。因此,我们这次的目标很明确:证明这种策略不仅仅停留在算法层面,而是可以真正落地到实验中,成为可用的逆向设计工具


为什么要开发自适应 β-VAE?在我们看来,VAE 最大的问题就是潜在空间收缩得太快,导致生成分子很单一。我们借鉴了“生物进化”的思路:训练初期把 β 拉高,让模型大胆探索潜在空间;到了后期再逐步降低 β,把注意力收回到精确重构。这让模型既能保持多样性,又能生成稳定高质量的分子。


有了方法,还需要验证。我们先在 QM9 和 ChemFluor30 上测试,发现 ChemFluor30 的重构率从 59% 提到 67%,性质预测精度能逼近 TD-DFT(误差 0.128 eV)。更重要的是,通过扰动潜在空间,我们生成了比传统模型多 8 倍以上的有效分子。


最后,我们挑了一个具体案例:咪唑并吡啶衍生物,在潜在空间里优化它的性质,然后合成并测试。结果化合物 7 的蓝光发射和预测高度吻合,CIE 坐标(0.16, 0.09)显示它很有 OLED 潜力。这一步让我们很兴奋,因为它证明了模型不是停留在算法层面,而是真正能推动材料发现。


对我们来说,这次工作的最大收获,并不仅仅是得到一个更好的 β-VAE,而是再次确认了我们的科研思路:模型不是目的,而是工具,我们希望它能真正与实验结合,找到可合成、性能优的分子;潜在空间并非黑箱,通过动态调节 β 并进行可视化,我们能够对分子性质进行更精准的导航;更重要的是,闭环才是关键,从 AI 设计到实验合成再到性质验证,只有真正打通这一流程,AI 才能改变材料发现的效率。未来,我们计划将这一方法推广到 OLED 材料,有机太阳能电池,光催化分子等更多有机光功能材料中,并探索更高维度的性质优化和多目标协同设计。



点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊

【声明】内容源于网络
0
0
X-MOL资讯
“X-MOL资讯”隶属于X-MOL学术平台(官网x-mol.com),关注化学、材料、生命科学、医学等领域的学术进展与科研前沿,提供专业与深度的内容。公众号菜单还提供“期刊浏览”等强大功能,覆盖各领域上万种期刊的新近论文,支持个性化浏览。
内容 19833
粉丝 0
X-MOL资讯 “X-MOL资讯”隶属于X-MOL学术平台(官网x-mol.com),关注化学、材料、生命科学、医学等领域的学术进展与科研前沿,提供专业与深度的内容。公众号菜单还提供“期刊浏览”等强大功能,覆盖各领域上万种期刊的新近论文,支持个性化浏览。
总阅读8.1k
粉丝0
内容19.8k