北京科学智能研究院/北京大学陈默涵课题组及其合作者在《科学通报》发表评述文章,介绍了国产开源密度泛函理论软件ABACUS如何支持开源大原子模型(OpenLAM)的建设与发展。文章还探讨了ABACUS在AI辅助的电子结构算法、赝势轨道库建设及跨平台兼容性方面的创新,展现了ABACUS在“AI for Science”时代作为基础设施推动材料模拟范式变革的重要潜力。
在材料科学的微观世界里,原子间的相互作用和排列方式决定了材料的性质与功能。理解和预测这些性质一直以来是第一性原理模拟的重要议题。近年来,随着人工智能技术的发展,机器学习在材料科学中的应用越来越广泛,为更好地解决这一难题带来了新的机遇。
ABACUS:国产开源密度泛函理论软件的崛起
ABACUS(Atomic-Orbital BasedAb-initio Computation at USTC,https://abacus.ustc.edu.cn/main.htm)是一款由国内多个团队共同开发的开源密度泛函理论(DFT)软件,正在持续助力国产开放大原子模型的发展。ABACUS同时支持平面波和数值原子轨道基组,构建了方便用户使用的赝势和数值原子轨道库,已在不同硬件平台上成功移植,为OpenLAM项目高效生产了大量密度泛函理论计算数据,应用领域覆盖了合金、半导体、钙钛矿等多种材料体系。
OpenLAM项目:构建通用大原子模型
OpenLAM项目旨在构建适用于复杂材料体系的高精度和高效率预训练大模型,并通过进一步的下游微调和知识蒸馏来获得高效准确的原子间势函数模型。这一项目的关键在于需要第一性原理软件计算出海量的训练数据,而ABACUS正为大规模的数据生产提供了重要基础设施。
ABACUS的优势与应用
ABACUS的优势在于其开放性、易用性和高性能。它同时支持平面波和数值原子轨道基组,适应不同类型材料体系的计算需求。此外,ABACUS还实现了与多种原子尺度机器学习算法的深度结合,显著改善了传统密度泛函理论在计算精度、计算体系尺寸以及计算效率方面的瓶颈问题。
在应用方面,ABACUS已经在多个领域取得了重要进展。例如,它为DPA-1和DPA-2原子间势函数大模型提供了训练数据,这些模型可以适用于多种元素体系,并通过预训练结合微调的方式来适用实际的应用场景。此外,ABACUS还在半导体和合金等材料体系中得到了广泛应用,为材料科学的研究和应用提供了有力支持。
ABACUS与异构并行
随着深度学习的快速发展,异构计算已成为新的发展趋势。ABACUS也紧跟这一趋势,建立了统一的异构编程计算框架,支持在不同硬件平台上的高效运行。通过异构并行,ABACUS大幅提升了计算效率,使得大原子模型的第一性原理训练数据可以通过在不同硬件上进行高效计算获得。
图1 使用 ABACUS在CPU与DCU平台上,对不同大小的95个体系的平均自洽场迭代(SCF)计算耗时对比。CPU上的计算使用Davidson(DAV)和共轭梯度法(CG)对角化方法。DCU的计算使用CG对角化方法。图(a)展示了分别使用CPU平台上CG/DAV方法和DCU平台上CG方法计算的平均每SCF电子步的耗时;图(b)展示了CPU上CG和DAV方法与DCU上CG方法的耗时比值。横轴表示测试体系的价层电子数量。
未来展望
在AI for Science快速发展的今天,ABACUS作为一款开源的密度泛函理论软件,将持续作为基础设施发挥重要作用。它不仅为OpenLAM项目提供了重要的数据支持,还将继续推动材料科学的发展。未来,ABACUS将继续优化和升级,以适应不断变化的科研需求,为材料科学的研究和应用提供更强大的工具。
文章信息
彭星亮, 周巍青, 郑大也, 等. 开源密度泛函理论软件ABACUS:助力大原子模型发展. 科学通报, 2025, 70(24): 4027–4043
doi: 10.1360/TB-2024-1243
https://www.sciengine.com/CSB/doi/10.1360/TB-2024-1243

