大数跨境

前沿| Ceder课题组最新工作:利用图神经网络构造通用势能函数加速能源材料模拟研发

前沿| Ceder课题组最新工作:利用图神经网络构造通用势能函数加速能源材料模拟研发 两江科技评论
2023-09-16
3
导读:包含复杂电子相互作用的大尺度原子模拟一直是原子建模最大的挑战之一。经典力场往往无法描述电子态和离子空间排布之


包含复杂电子相互作用的大尺度原子模拟一直是原子建模最大的挑战之一。经典力场往往无法描述电子态和离子空间排布之间的耦合,而更准确的第一性原理分子动力学由于计算复杂性也无法适用于长时间和大规模的模拟。将电子的微观尺度准确性延伸到宏观尺度是对科学和工业技术发展极其重要却又难以实现的难题。

Ceder课题组最新提出了一种基于图神经网络机器学习原子势能(MLIP)的预训练通用原子力场:晶体哈密顿图神经网络(CHGNet)。CHGNet预训练于Materials Project材料数据库中积累超过十年的第一性原理计算, 超过150万种无机晶体结构的密度泛函理论轨迹数据集。CHGNet使用磁矩信息正则化原子上的电荷自由度,从而能够学习并准确地表示电子的轨道占据,并且增强图神经网络对原子和电子自由度的描述。该工作于近日发表在Nature Machine Intelligence, 文章展示了CHGNet在固体材料,特别是锂电池储能材料研究中的应用。

CHGNet的基本框架是一个图神经网络 (GNN),通过在节点图中使用图卷积层来传播原子间的空间和化学信息,保证了平移、旋转和排列的不变性。CHGNet的工作流程中,一个晶体结构首先会被转化成原子图(Atom Graph)和化学键图(Bond Graph)。在原子图中,原子作为节点,键长作为边,在化学键图中,化学键作为节点,两键之间的夹角作为边。在这样的特征表示下CHGNet可以直接学习原子系统中的二体和三体作用。通过叠加原子图卷积层,化学键图卷积层,以及键角更新层来组成原子作用层(Interaction Block),CHGNet可以模拟高达20A原子间的多体相互作用。在倒数第二个原子作用层时,CHGNet将原子的隐空间向量线性投影到原子磁矩上,使得原子的磁矩成为一个模型输出值。在最后一个原子作用层后,CHGNet会通过原子向量的非线性投影计算晶体的能量,以及通过对原子坐标和晶胞的自动微分来求出原子受力及应力。

原文图2展示了CHGNet预训练使用的Materials Project trajectory (MPtrj) 数据库。该数据库包含超过十年积累的158万个密度泛函理论计算,包含超过14万种材料以及89种元素的能量,原子磁矩,原子受力,以及应力信息。图2展示了每种元素以及其所包含的电荷信息出现的频次。该数据集是目前最大的开源无机晶体势能数据库。

在机器学习势能的基准测试(benchmark)中,预训练的CHGNet在Matbench Discovery新材料研发任务上以0.58的F1 score超过之前的所有模型取得了最好的成绩,是迄今为止最好的预训练深度势能函数。作者也欢迎和鼓励该领域的工作者提交正在开发的预训练势能到Matbench Discovery平台通过基准测试,以共同推进机器学习势能函数的发展。作者同时在补充材料里展示了CHGNet分子动力学的可靠性,以及复现了第一性原理分子动力学模拟找到的固态锂电池电解质。

除了展示CHGNet作为原子势能的可靠性,本文重点强调了离子价态在化学反应中的重要性,以及在机器学习势能中对离子价态的表示的必须性。举例说,对于同一种过渡金属元素,不同价态的离子在离子系统中的互相作用差别很大,几乎相当于不同的元素。但在传统的势能场以及机器学习势能中,他们被考虑成同一种类别并且被同样参数化。这不仅导致我们对多价态的离子缺乏完备的表示,也让我们无法学习离子系统中的价态变化以及电荷跃迁。

原子的磁矩,也就是电子自旋密度的积分,由电子轨道的占据数决定。因此不同价态的元素往往在密度泛函理论中拥有不同的原子磁矩。用该方法来区分不同价态的离子在大量的研究中已经被证明可以用来学习离子价态的分布和电子的转移。本文作者发现,将原子磁矩引入机器学习势能,不仅可以使CHGNet拥有对电荷自由度的描述,也加强了对不同价态离子描述符的约束。

图3(a) 展示了V3+,V4+的原子磁矩分布以及CHGNet原子隐空间向量分布(b)。作者通过主成分分析,发现原子隐空间向量的分布和磁矩(价态)分布高度耦合。并且展示了对V3+,V4+原子磁矩的约束,在隐空间中表示为对不同价态描述符的离散化。由于不同价态的离子在被约束后拥有了不同的表示符,导致CHGNet对不同价态离子可以表示不同的相互作用逻辑,这使得能量和原子受力的计算更加具有物理性。

作者展示了CHGNet在锰酸锂(LiMnO2)正极材料中的应用。早在90年代,学者们就发现锰酸锂正极材料在电化学循环后会从正交晶系相变到尖晶石晶系,导致电池容量下降。对于该现象的解释一直存有争论,其中一个被广为接受的假说是由Mn3+的电荷歧化生成的Mn2+Mn4+导致了该相变反应的产生。由于缺乏高精度,长时间模拟的手段,之前的研究报告中认为Mn2+具有更低的跃迁能垒,而四面体位Mn2+的跃迁标志了尖晶石相的转变。本文作者使用CHGNet直接模拟了带电荷信息的长时间分子动力学模拟,观测到了和实验X射线衍射谱(XRD)相符的相变过程。而令人吃惊的是,CHGNet分子动力学模拟显示Mn2+的歧化生成并不和Mn跃迁关联,而是和长程的尖晶石对称性关联。作者使用第一性原理计算验证了该发现,并由此提出了锰酸锂电化学相变的新理论。该发现标志了由CHGNet长时间电荷模拟带来的理论材料学新机遇。

除此以外,图5展示了CHGNet对于磷酸铁锂正极材料的相图模拟。依靠于CHGNet对于二价及三价铁的表示,作者发现CHGNet可以复现实验中发现的在Li0.5FePO4 处电子熵引起的亚稳定相(图5(a))。而缺乏电荷及价态表示的机器学习势能只能获得错误的单一的互溶间隙(图5(b))。该案例强调了电荷表示在原子模拟中的重要性。

图六中作者展示了预训练CHGNet对复杂原子作用的高精度分子动力学模拟。对于Li3La3Te2O12固态电解质,先前的研究发现掺杂额外微量的的锂离子可以使锂扩散率获得几个数量级的提升,该现象被称为锂扩散网络激活。本案例在CHGNet模拟中复现了惨杂额外微量的锂离子引起的扩散率明显提升和活化能的明显下降的现象。表明预训练CHGNet抓取并学习到了动力学表现对于化学成分变化的剧烈非线性响应。

综上所述,大尺度计算在材料科学、医学和分子生物学等领域发挥着关键作用。本文展示预训练CHGNet为模拟复杂离子体系中的电荷相互作用提供了有力工具,拓展了计算科学在各领域,特别是能源材料领域的应用前景。

免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间后台联系,我们将协调进行处理,所有来稿文责自负,两江仅作分享平台。转载请注明出处,如原创内容转载需授权,请联系下方微信号。

【声明】内容源于网络
0
0
两江科技评论
聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
内容 6001
粉丝 0
两江科技评论 聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
总阅读9.2k
粉丝0
内容6.0k