大数跨境

北大潘锋AFM:基于锂离子电池正极材料知识图谱的材料探索

北大潘锋AFM:基于锂离子电池正极材料知识图谱的材料探索 科学材料站
2022-04-02
0
导读:该研究提出了一种基于多源信息融合的语义表示框架,通过该框架可针对性生成特定领域的材料实体表示,显著提升材料实体的表示质量

文 章 信 息

基于锂离子电池正极材料知识图谱的材料探索
第一作者:聂志伟
通讯作者:李舜宁*,雷凯*,潘锋*
单位:北京大学深圳研究生院新材料学院,深圳市内容中心网络与区块链重点实验室

研 究 背 景

经过长时间的发展,海量的材料科学文献中积累了越来越多文本形式的科学信息与知识,想要通过传统手动收集、分析的方法准确高效获取信息十分困难,首先,材料科学子领域众多,领域知识各不相同,另外,大量的材料科学信息是非结构化、高度异构的,因此亟需一个整合材料特性和应用信息的数据管理平台以实现数据驱动的材料创新。
知识图谱是一种揭示实体之间关系的语义网络,在生物医药、金融、社交网络等领域已经取得了显著的应用成果,其作为一种高效的信息管理载体,十分适合于海量材料科学信息的高效管理以及潜在知识发现。该研究以锂离子电池正极材料为研究对象构建材料知识图谱并实现了潜在正极材料的推理预测,促进数据驱动的材料研究新范式的建立。

文 章 简 介

本文中,北京大学深圳研究生院新材料学院潘锋教授课题组深圳市内容中心网络与区块链重点实验室(ICNLab)雷凯副研究员合作,在国际知名期刊Advanced Functional Materials上发表题为“Automating materials exploration with a semantic knowledge graph for Li-ion battery cathodes”的研究论文。
该研究提出了一种基于多源信息融合的语义表示框架,通过该框架可针对性生成特定领域的材料实体表示,显著提升材料实体的表示质量,进行锂离子电池正极材料实体的精准挖掘,并进一步实现了正极材料知识图谱的构建和潜在正极材料的推理预测。
材料知识图谱的构建流程展示

本 文 要 点

要点一:基于多源信息融合的材料科学知识嵌入框架
研究团队结合BiLSTM(Bi-directional Long Short-Term Memory)和双重注意力机制提出了一种语义表示框架,通过多源信息融合将特定领域的先验知识注入模型,显著提升目标材料实体的表示质量和模型的可解释性,从而可以实现对目标材料的深层次关联,挖掘隐藏在文本中的潜在材料关联。

要点二:语义驱动材料知识图谱的构建流程
对语料库进行预处理后将材料科学文本信息向量化,并对相应的语料库进行词嵌入训练,不同的词嵌入被输入DATWEM框架进行多源信息融合,以实现先验知识的引入,丰富目标材料实体的分布式表示信息,增强其表示质量。在获得目标材料实体的高质量表示后,以余弦相似度衡量两个材料实体间的关联关系和关联程度,并最终完成材料知识图谱的构建。

要点三:模型表现
为了展现DATWEM框架相对于传统词嵌入模型的优越性,首先从模型性能的角度进行评估,在6个指标(Accuracy、Precision、Recall、F1-score、AUPR、AUROC)上对模型进行全面评估,发现DATWEM在6个指标上全面优于传统模型。然后通过材料关联的实际案例进行对比,发现从DATWEM框架获得的正极材料关系更加符合现有领域知识,表现出更好的准确性和可解释性,有利于材料科学信息的精准挖掘。

要点四:潜在正极材料的推理预测
基于正极材料知识图谱可实现潜在正极材料的推理预测。可先通过无监督聚类可视化正极材料之间的语义相似性,四种典型正极材料(LiCoO2、LiFePO4、LiMn2O4、Li2MnO3)相关的较大聚类簇被可视化,Li2TiMn3O8通过与LiCoO2形成直接和间接的关联被自动识别,通过对比筛选后,发现该材料可作为潜在的正极材料。

要点五:前瞻
在该工作中,研究团队基于提出的材料科学知识嵌入框架DATWEM构建了锂离子电池正极材料的语义知识图谱,该框架可实现领域知识的引入,生成富含目标领域先验知识的语义表示,适用于复杂材料系统的实体精准挖掘。同时,该框架具有良好的可迁移性,适用于各种应用领域,能够探索材料之间的可解释关系,有助于打破学科界限并为多功能材料设计提供机会。团队相信这项工作将为材料科学与人工智能的交叉融合铺平道路,以数据驱动的角度加速材料设计与发现。

文 章 链 接

Automating materials exploration with a semantic knowledge graph for Li-ion battery cathodes
https://onlinelibrary.wiley.com/doi/10.1002/adfm.202201437

通 讯 作 者 简 介

潘锋教授
潘锋是北京大学讲席教授,北大深圳研究生院副院长和新材料学院创院院长,致力于结构化学和材料基因的探索、电池和催化材料结构与性能及应用研究,发表了包括Nature,Nature Energy、Nature Nanotech、Joule、JACS等SCI代表性论文300余篇。2020年任《结构化学》杂志的执行主编,2021年获“中国电化学贡献奖”,2018年美国电化学学会电池科技奖与2016年国际电动车锂电池协会杰出研究奖。
课题组主页http://www.pkusam.cn

雷凯 研究员
雷凯博士,深圳市内容中心网络与区块链重点实验室(ICNLab)主任。中国计算机学会(CCF)杰出会员、区块链专委会常务委员,广东省计算机学会区块链专委会副主任。中国科学技术发展战略研究院, 金融科技咨询专家。发表论文180余篇,专利申请42项、授权20项(含美国专利授权2项),软件著作权21项。研究方向:未来网络、区块链、大数据分析。

李舜宁 副研究员
李舜宁博士,分别于2013年和2018年在清华大学材料学院获得学士和博士学位,现为北京大学深圳研究生院新材料学院副研究员,主要研究方向为电化学过程的第一性原理计算模拟,和基于图论、机器学习、文本挖掘等大数据工具的材料学研究。共发表SCI论文60余篇,其中以通讯或第一作者身份在Nat. Commun., Angew. Chem., Adv. Energy Mater., Natl. Sci. Rev.等国际著名期刊上发表论文20余篇。


添加官方微信 进群交流

SCI二氧化碳互助群

SCI催化材料交流群

SCI钠离子电池交流群

SCI离子交换膜经验交流群

SCI燃料电池交流群

SCI超级电容器交流群

SCI水系锌电池交流群

SCI水电解互助群

SCI气体扩散层经验交流群

备注【姓名-机构-研究方向】

说明

🔹本文内容若存在版权问题,请联系我们及时处理。

🔹欢迎广大读者对本文进行转发宣传。

🔹《科学材料站》会不断提升自身水平,为读者分享更加优质的材料咨询,欢迎关注我们。

投稿请联系contact@scimaterials.cn

致谢

感谢本文作者对该报道的大力支持。

点分享

点赞支持

点在看


【声明】内容源于网络
0
0
科学材料站
内容 0
粉丝 0
科学材料站
总阅读0
粉丝0
内容0