大数跨境

苏大尹万健教授课题组NC:符号回归机器学习发现简易催化描述子

苏大尹万健教授课题组NC:符号回归机器学习发现简易催化描述子 科学材料站
2020-07-22
1
导读:本文用符号回归得到氧化物钙钛矿催化剂析氧反应(OER)催化活性的描述子μ/t,其中μ(rB/rO) 和t()分别是八面体因子和容忍因子。该描述子只是离子半径的函数,简易明了,不需要密度泛函理论(DFT


点击科学材料站,关注我们



符号回归得到的简单描述子加速钙钛矿催化剂的发现

作者:翁百成1,宋志龙1,朱日龙,颜青玉, 孙庆德,Corey G. Grice, Yanfa Yan* ,尹万健*

单位:The University of Toledo,苏州大学,中南大学,湖南大学

研究背景

符号回归 —一种具有可解释性的机器学习方法

机器学习当前已经广泛地应用于材料领域,用于构效关系的发现,加速材料设计,缩短材料研发周期。然而,通常其”黑箱”模型被认为不能发现新的"物理规律",而只是对数据采用一种未知方式的统计拟合,限制了其广泛应用。

特别是对大多数不熟悉机器学习算法的实验工作者,机器学习指导实验存在事实上的困难。符号回归是一种可解释的机器学习方法,能够提供目标函数和自变量特征参数之间具体的数学表达式,变机器学习“黑箱”模型为“白箱”(glass-box),为材料设计提供直接指导。尽管潜力巨大,但在材料科学领域的应用目前却很少。该工作提供了符号回归在材料领域的一个应用实例。


氧化物钙钛矿OER催化活性描述子

描述子在催化剂的研究中扮演着重要角色。谈到催化,无法避开火山图,d带中心,描述子等与催化机理与催化活性息息相关的基本概念。

过去10年来,人们针对氧化物钙钛矿的析氧反应活性,提出了诸多描述子,主要有过渡金属离子(TM) eg轨道占据数 (Science 2011, 334,1383);催化反应自由能(ChemCatChem 2011, 3, 1159);O p带位置 (Nat. Comm. 2013, 4,2439),以及TM和O的共价相互作用 (Nat. Comm. 2020, 11,652)等(如图1所示)。

这些传统描述子基于人类物理和化学知识的总结,取得一定的成功,但都需要密度泛函理论的计算。而密度泛函理论计算不仅耗时耗力,对诸如d带中心,eg轨道占据数等描述子的计算值还依赖于计算设置(表面自旋态、3d轨道on-site Coulomb U值等),从而不可避免地在结果中引入了人为因素。因此,传统的描述子并不利于大规模材料设计与筛选。


图1. 

氧化物钙钛矿析氧反应描述子发展简介

文章简介

使用符号回归(Symbolic Regression)得到氧化物钙钛矿催化剂析氧反应(OER)催化活性的描述子μ/t,其中μ(rB/rO) 和t()分别是八面体因子和容忍因子。该描述子只是离子半径的函数,简易明了,不需要密度泛函理论(DFT)计算,却可以定量描述OER催化活性。作者进一步根据新描述子μ/t设计和筛选催化性能更高的氧化物钙钛矿材料,成功合成5种氧化物钙钛矿材料,其中4种Cs0.4La0.6Mn0.25Co0.75O3, Cs0.3La0.7NiO3, SrNi0.75Co0.25O3和Sr0.25Ba0.75NiO3表现出高OER催化活性。

该文章共同第一作者为托莱多大学翁百成博士和苏州大学宋志龙

Yanfa Yan教授 和 尹万健教授为本文共同通讯作者。


要点解析

要点一:理论指导实验,合成新材料

图2. 工作流程图

它包含四个主要部分:数据集生成(蓝色)、符号回归(红色)、材料设计与筛选(绿色)和实验验证(棕色)。

图2是本研究的工作流程图。我们首先合成了18种已知的氧化物钙钛矿催化剂,以产生具有一致性和可比较的OER活性数据集。基于该数据集,采用符号回归方法寻找构效表达式。然后在这些表达式中选择一个简易且准确性高的描述子。该描述子进一步被其他研究组的独立实验数据证实。

因此,我们相信该描述子具有普适性。进一步,我们基于该描述子,进行材料设计与筛选,从3000多种可能的新材料中选择了13种活性较高的(同时考虑元素与组分的多样性)进行实验合成,成功合成了5种,并对其进行OER表征。


要点二:符号回归机器学习确定简易描述子

图3. 

(a):描述子产生示意图
(b): 符号回归算法流程图

图3a描述了本工作通过符号回归筛选描述子(数学表达式)的流程。在这项工作中,符号回归最初组合这些材料特征以及常用的运算符,如加、减、乘、除、开根号,来建立一个随机数学表达式群。然后,这些数学表达式通过遗传算法进行繁殖、变异、进化,形成新的数学表达式(图3b)。这些数学表达式通过预测的和实验得到的VRHE之间的平均绝对误差(MAE)来评估优劣。

在获取了实验数据后,采用符号回归来构建材料特征和OER过电位(VRHE)的数学表达式。为了确保符号回归得到的数学表达式有用,选择合适的材料特征至关重要的。我们选择了电子参数,如过渡金属离子的d电子数(Nd)、电负性参数χA和χB、价态QA和结构参数,如离子半径RA、容忍因子t和八面体因子μ,其中A和B分别指A位和B位阳离子。


要点3:根据描述子设计与筛选新材料,指导实验成功合成

图4. 

(a):SR得到的4320万个数学表达式,
(b):μ/t与5mA/cm2电流密度下的VRHE,
(c)、(d):利用eg轨道占有描述子的工作的数据验证μ/t。

好的描述子需要准确而简单。因此,我们分别用平均绝对误差(MAE)和复杂度(complexity)来描述准确度与复杂度。该工作中,符号回归共得到了4320万个数学表达式,其中μ/t是复杂度和准确度之间的最佳折中方案(图4a中的C点)。

图4b中以μ/t为描述符展示了5mA/cm2电流密度下的VRHE。有趣的是,它显示了一个线性单调的关系,而不是传统的火山曲线图。为了进一步验证该描述子的通用性,我们使用最初报告eg轨道占据数作为描述子的工作源数据(图4c)(Science 2011, 334,1383),发现μ/t也与他们实验得到的VRHE单调线性相关(图4d)。我们也搜集了过去60年其他文献的一些实验数据,发现这样的线性相关性也都大致存在。

然后,我们采用μ/t对3545种钙钛矿进行筛选,得到13种候选材料,其中5种被实验成功合成。成功合成的材料中,4种的OER活性和稳定性超过了Ba0.5Sr0.5Co0.8Fe0.2O3(BSCF)。


结论

我们利用符号回归确定了一个简易的描述子μ/t,用于描述氧化物钙钛矿催化剂的催化活性。这个简易描述子使我们快速发现了一系列新型、高催化活性的氧化物钙钛矿催化剂。作为验证,我们成功地合成了5种氧化物钙钛矿,其中4种催化活性超过了典型的氧化物钙钛矿催化剂BSCF。我们预计,根据这一描述子,更多新的氧化物钙钛矿催化剂可以被合成。我们的研究结果表明,符号回归是一种强大的机器学习技术,可以发现具有物理意义的描述子。这为探索发现新型、高活性功能材料提出了一个新的方向。


文章链接:
Simple descriptor derived from symbolic regression accelerating the discovery of new perovskite catalysts
https://www.nature.com/articles/s41467-020-17263-9
 
更多工作,请参考
尹万健教授课题组网站 
http://www.comates.group

Yanfa Yan教授课题组网站 
http://astro1.panet.utoledo.edu/~yyan/


说明

🔹本文内容若存在版权问题,请联系我们及时处理。

🔹欢迎广大读者对本文进行转发宣传。

🔹《科学材料站》会不断提升自身水平,为读者分享更加优质的材料咨询,欢迎关注我们。

投稿请联系contact@scimaterials.cn

致谢

感谢本文作者对该报道的大力支持。

点击“在看”分享你的观点

【声明】内容源于网络
0
0
科学材料站
内容 0
粉丝 0
科学材料站
总阅读0
粉丝0
内容0