点击科学材料站,关注我们
符号回归得到的简单描述子加速钙钛矿催化剂的发现
作者:翁百成1,宋志龙1,朱日龙,颜青玉, 孙庆德,Corey G. Grice, Yanfa Yan* ,尹万健*
研究背景
机器学习当前已经广泛地应用于材料领域,用于构效关系的发现,加速材料设计,缩短材料研发周期。然而,通常其”黑箱”模型被认为不能发现新的"物理规律",而只是对数据采用一种未知方式的统计拟合,限制了其广泛应用。
特别是对大多数不熟悉机器学习算法的实验工作者,机器学习指导实验存在事实上的困难。符号回归是一种可解释的机器学习方法,能够提供目标函数和自变量特征参数之间具体的数学表达式,变机器学习“黑箱”模型为“白箱”(glass-box),为材料设计提供直接指导。尽管潜力巨大,但在材料科学领域的应用目前却很少。该工作提供了符号回归在材料领域的一个应用实例。
描述子在催化剂的研究中扮演着重要角色。谈到催化,无法避开火山图,d带中心,描述子等与催化机理与催化活性息息相关的基本概念。
过去10年来,人们针对氧化物钙钛矿的析氧反应活性,提出了诸多描述子,主要有过渡金属离子(TM) eg轨道占据数 (Science 2011, 334,1383);催化反应自由能(ChemCatChem 2011, 3, 1159);O p带位置 (Nat. Comm. 2013, 4,2439),以及TM和O的共价相互作用 (Nat. Comm. 2020, 11,652)等(如图1所示)。
这些传统描述子基于人类物理和化学知识的总结,取得一定的成功,但都需要密度泛函理论的计算。而密度泛函理论计算不仅耗时耗力,对诸如d带中心,eg轨道占据数等描述子的计算值还依赖于计算设置(表面自旋态、3d轨道on-site Coulomb U值等),从而不可避免地在结果中引入了人为因素。因此,传统的描述子并不利于大规模材料设计与筛选。
图1.
文章简介
使用符号回归(Symbolic Regression)得到氧化物钙钛矿催化剂析氧反应(OER)催化活性的描述子μ/t,其中μ(rB/rO) 和t()分别是八面体因子和容忍因子。该描述子只是离子半径的函数,简易明了,不需要密度泛函理论(DFT)计算,却可以定量描述OER催化活性。作者进一步根据新描述子μ/t设计和筛选催化性能更高的氧化物钙钛矿材料,成功合成5种氧化物钙钛矿材料,其中4种Cs0.4La0.6Mn0.25Co0.75O3, Cs0.3La0.7NiO3, SrNi0.75Co0.25O3和Sr0.25Ba0.75NiO3表现出高OER催化活性。
该文章共同第一作者为托莱多大学翁百成博士和苏州大学宋志龙
Yanfa Yan教授 和 尹万健教授为本文共同通讯作者。
要点解析
图2. 工作流程图
图2是本研究的工作流程图。我们首先合成了18种已知的氧化物钙钛矿催化剂,以产生具有一致性和可比较的OER活性数据集。基于该数据集,采用符号回归方法寻找构效表达式。然后在这些表达式中选择一个简易且准确性高的描述子。该描述子进一步被其他研究组的独立实验数据证实。
因此,我们相信该描述子具有普适性。进一步,我们基于该描述子,进行材料设计与筛选,从3000多种可能的新材料中选择了13种活性较高的(同时考虑元素与组分的多样性)进行实验合成,成功合成了5种,并对其进行OER表征。
图3.
图3a描述了本工作通过符号回归筛选描述子(数学表达式)的流程。在这项工作中,符号回归最初组合这些材料特征以及常用的运算符,如加、减、乘、除、开根号,来建立一个随机数学表达式群。然后,这些数学表达式通过遗传算法进行繁殖、变异、进化,形成新的数学表达式(图3b)。这些数学表达式通过预测的和实验得到的VRHE之间的平均绝对误差(MAE)来评估优劣。
在获取了实验数据后,采用符号回归来构建材料特征和OER过电位(VRHE)的数学表达式。为了确保符号回归得到的数学表达式有用,选择合适的材料特征至关重要的。我们选择了电子参数,如过渡金属离子的d电子数(Nd)、电负性参数χA和χB、价态QA和结构参数,如离子半径RA、容忍因子t和八面体因子μ,其中A和B分别指A位和B位阳离子。
图4.
好的描述子需要准确而简单。因此,我们分别用平均绝对误差(MAE)和复杂度(complexity)来描述准确度与复杂度。该工作中,符号回归共得到了4320万个数学表达式,其中μ/t是复杂度和准确度之间的最佳折中方案(图4a中的C点)。
图4b中以μ/t为描述符展示了5mA/cm2电流密度下的VRHE。有趣的是,它显示了一个线性单调的关系,而不是传统的火山曲线图。为了进一步验证该描述子的通用性,我们使用最初报告eg轨道占据数作为描述子的工作源数据(图4c)(Science 2011, 334,1383),发现μ/t也与他们实验得到的VRHE单调线性相关(图4d)。我们也搜集了过去60年其他文献的一些实验数据,发现这样的线性相关性也都大致存在。
然后,我们采用μ/t对3545种钙钛矿进行筛选,得到13种候选材料,其中5种被实验成功合成。成功合成的材料中,4种的OER活性和稳定性超过了Ba0.5Sr0.5Co0.8Fe0.2O3(BSCF)。
结论
我们利用符号回归确定了一个简易的描述子μ/t,用于描述氧化物钙钛矿催化剂的催化活性。这个简易描述子使我们快速发现了一系列新型、高催化活性的氧化物钙钛矿催化剂。作为验证,我们成功地合成了5种氧化物钙钛矿,其中4种催化活性超过了典型的氧化物钙钛矿催化剂BSCF。我们预计,根据这一描述子,更多新的氧化物钙钛矿催化剂可以被合成。我们的研究结果表明,符号回归是一种强大的机器学习技术,可以发现具有物理意义的描述子。这为探索发现新型、高活性功能材料提出了一个新的方向。
投稿请联系contact@scimaterials.cn
点击“在看”分享你的观点![]()

