大数跨境
0
0

Nature 子刊 | 文本也能引导生成新材料!对齐文本与晶体后批量生成化合物,代码与数据开源

Nature 子刊 | 文本也能引导生成新材料!对齐文本与晶体后批量生成化合物,代码与数据开源 TAG-HUB
2025-11-14
0
导读:想做自己的垂直领域大数据研究(电池、陶瓷、金属、医药、蛋白、环境、生态、材料、农学、地质等),可使用类似方式完成定制化数据集搜集搭建,TAG-HUB也可提供定制化科研数据集挖掘服务。

    Exploration of crystal chemical space using text-guided generative artificial intelligence

    使用文本引导生成式人工智能探索晶体化学空间

    📑 基本信息

    • 期刊
      : Nature Communications
    • 时间
      : 2025-01-06
    • DOI
      : https://doi.org/10.1038/s41467-025-59636-y
    • 作者
      : Hyunsoo Park*, Anthony Onwuli, Aron Walsh*
    • 机构
      : Department of Materials, Imperial College London, London, UK

    🔍 导读

    该研究开发了名为Chemeleon的文本引导生成式人工智能模型,通过学习文本描述和三维结构数据来生成化学组成和晶体结构。该模型采用去噪扩散技术和跨模态对比学习,实现了从文本输入到晶体结构的高效生成,在多组分化合物生成方面展现出巨大潜力,为材料发现提供了新的计算工具

    🧩 引言

    背景与意义

    化学空间的广阔性为探索具有预定性质的新化合物带来了长期挑战。在材料科学中,晶体结构预测已成为基于全局优化技术从组成映射到结构的成熟工具。生成式人工智能现在提供了高效导航更大晶体化学空间区域的手段,这些区域由材料的结构-性质数据集提供信息指导。


    图表解读:该图展示了Chemeleon模型的整体架构,包括Crystal CLIP对比学习组件和分类器自由扩散模型,说明了文本嵌入与图神经网络嵌入如何通过对比学习进行对齐,以实现文本引导的晶体结构生成。

    现有不足

    传统的计算材料探索方法包括深入研究个别系统和高通量筛选方法,虽然高通量方法显著扩大了材料发现的范围,但随着搜索空间的增长,识别化学组成、晶体结构和物理性质相结合创造理想特性材料的相关区域变得越来越复杂。现有的生成对抗网络和变分自编码器等早期模型正被生成扩散模型所取代。

    问题与动机

    导航大量可能的化学组成和分子/晶体结构的挑战类似于探索多维表面。虽然已知结构和性质的数据库提供了宝贵的基础,但搜索空间过于广阔,仅使用传统方法无法进行详尽探索。需要开发能够从现有数据集和理论模型中学习的生成式AI工具。

    目标与创新

    本研究引入了基于去噪扩散的生成材料模型Chemeleon,该模型从文本描述和三维结构数据中学习,以采样化学组成和晶体结构。通过在训练过程中融入文本描述,模型能更好地理解组成与结构之间的关系。这种方法通过引入跨模态对比学习实现,其中文本编码器的嵌入向量与晶体图神经网络的嵌入向量对齐。

    📊 方法

    数据来源与类型

    数据集来自Materials Project数据库(版本2023.11.01),筛选包含40个原子或更少的单元胞。通过Materials Project API获得总计32,525个结构,确保所有选定结构都是实验观察到的,且凸包上方能量小于0.25 eV/原子。采用时间分割策略,2018年8月2日之前注册的条目分配给训练和验证集。


    图表解读:该图展示了对比学习的结果,包括文本嵌入与图嵌入之间余弦相似性的热图,以及元素嵌入的t-SNE可视化,说明了Crystal CLIP相比基线BERT模型在区分正负样本对方面的优越性能。

    核心方法与技术

    模型采用两个关键组件:Crystal CLIP(对比语言-图像预训练)文本编码器和分类器自由引导去噪扩散模型。Crystal CLIP通过对比学习训练,将文本嵌入向量与从等变图神经网络派生的图嵌入向量对齐。扩散模型迭代预测噪声的时间演化,同时整合从预训练文本编码器获得的文本嵌入。


    图表解读:该图展示了文本引导化合物生成的评估结果,包括组成匹配比率随原子数的变化,以及不同文本描述类型的性能比较,证明了Crystal CLIP模型在文本引导生成方面的有效性。

    研究流程

    扩散模型包含前向和后向过程。前向过程涉及在一系列步骤中逐渐向晶体结构的个别表示添加随机噪声,将晶体结构从原始状态转换为完全随机状态。基于等变图神经网络的去噪模型预测每步添加的噪声并迭代移除,从纯噪声重构原始数据。采用分类器自由引导方法,将Crystal CLIP的文本嵌入向量作为条件数据。

    📈 结果

    结构指标评估

    在包含708个2018年8月以来注册结构的测试集上,模型在四个结构指标上表现优异。有效性指标衡量结构有效样本的比例,两个模型都达到了98-99%的近乎完美有效率。独特性指标评估生成结构的多样性,基线BERT模型表现略高于Crystal CLIP。结构匹配指标评估20个采样结构是否包含测试集中的真实结构,Crystal CLIP显著优于基线BERT。


    图表解读:该图展示了三元Zn-Ti-O体系的相图和代表性生成结构,说明了模型在已知材料体系中发现新的亚稳态结构的能力,包括一个稳定的Ti₃Zn₂结构和多个亚稳态化合物。

    文本引导生成评估

    核心目标是基于文本描述作为条件数据生成化合物。Crystal CLIP模型在各种原子数范围内显著优于BERT模型,组成匹配比率高出3倍。这一结果突出了Crystal CLIP中对比学习方法的有效性,其中文本嵌入向量与使用等变图神经网络捕获三维结构空间配置的图嵌入对齐。


    图表解读:该图展示了四元Li-P-S-Cl体系的相图和代表性结构,包括新发现的17个稳定结构和435个亚稳态结构,证明了模型在稀疏填充的复杂四元空间中的探索能力。

    应用案例验证

    模型在TiO₂多晶型、Ti-Zn-O三元体系和Li-P-S-Cl四元体系中的应用验证了其能力。在TiO₂体系中,生成了549个不同于已知结构的潜在多晶型,其中122个经DFT计算确认为亚稳态结构。在Ti-Zn-O体系中,预测了1个稳定结构和58个亚稳态结构。在Li-P-S-Cl体系中,提出了17个新的稳定结构和435个亚稳态结构。

    💡 结论

    主要贡献

    1. 创新模型架构:开发了Chemeleon文本引导去噪扩散模型,通过跨模态对比学习实现文本描述与晶体结构的有效对齐,显著提升了文本引导生成的准确性,为材料发现提供了新的AI工具。

    2. 多化学空间验证:成功在TiO₂多晶型、Ti-Zn-O三元体系和Li-P-S-Cl四元体系中验证了模型性能,发现了多个新的稳定和亚稳态结构,证明了模型在不同复杂度化学空间中的通用性和有效性。

    局限性与展望

    当前模型在数值属性(如带隙)的生成方面存在挑战,基于Transformer的文本编码器在区分数值方面存在困难。由于生成过程的随机性质,当单元胞中原子数量较多时,引导模型匹配组成具有挑战性。未来研究应扩展到更复杂的应用特定场景,包括对高级材料性质的约束,并利用更广泛的文本输入范围来增强文本引导晶体结构生成的潜力。



    想做自己的垂直领域大数据研究(电池、陶瓷、金属、医药、蛋白、环境、生态、材料、农学、地质等),可使用类似方式完成定制化数据集搜集搭建,TAG-HUB也可提供定制化科研数据集挖掘服务



    【声明】内容源于网络
    0
    0
    TAG-HUB
    Tag-Hub是智能科研大数据的范式引领者,正以AI推动科研大数据平权,已积累2.5亿条文献信息和20万条专业术语库,支持文献数据溯源与AI验伪,希望与科研工作者共建科研智能新生态。
    内容 54
    粉丝 0
    TAG-HUB Tag-Hub是智能科研大数据的范式引领者,正以AI推动科研大数据平权,已积累2.5亿条文献信息和20万条专业术语库,支持文献数据溯源与AI验伪,希望与科研工作者共建科研智能新生态。
    总阅读9
    粉丝0
    内容54