大数跨境

全中文署名!一篇Nature震惊世界!锂电池领域最年轻院士候选人登场!

全中文署名!一篇Nature震惊世界!锂电池领域最年轻院士候选人登场! 科学材料站
2026-03-25
0
导读:2026科研热点当前机器学习在锂离子电池领域的应用已从单一的数据驱动预测,演进为融合物理机理与人工智能的深度协
2026科研热点
图片

当前机器学习在锂离子电池领域的应用已从单一的数据驱动预测,演进为融合物理机理与人工智能的深度协同范式。其核心任务聚焦于通过先进神经网络(如物理信息网络、Transformer及大语言模型)实现对电池健康状态和剩余使用寿命的高精度、可解释性预测 。前沿研究一方面致力于将电化学知识嵌入模型,如通过物理信息神经网络解耦退化机制,在少量样本下仍保持高泛化能力 ;另一方面则探索"发现学习"等新范式,仅凭初期测试数据即可快速预估寿命,大幅压缩验证周期与成本 。此外,结合边缘计算与数字孪生的智能管理系统,正推动电池从被动储能单元向具备自主决策能力的智慧主体演进,为实现全生命周期安全运维和材料高效迭代提供了关键支撑 。


面向“十五五”规划对新型电池与储能产业的战略部署,本课程旨在构建一个深度融合前沿技术与产业需求的专业培训体系。课程紧密围绕固态电解质研发、锂电工艺优化、模组及PACK装配等产业核心环节,并前瞻性地引入“新型安全高能锌基储能电池系统设计与构建”等创新方向。体系将重点攻关固态电池界面演变、电-热-力多场耦合机制等前沿课题,同时融入多物理场仿真、多尺度建模及AI辅助设计等先进方法论,旨在培养学员掌握数据驱动的智能研发范式,突破传统试错法局限,为抢占固态电池等下一代技术的科技制高点、实现科研成果向新质生产力的高效转化提供坚实支撑
参会对象
高校师生:电化学、材料科学与工程、新能源科学与工程、物理化学等相关专业的教师、博硕研究生及高年级本科生。
科研人员:从事锂离子电池、固态电池、钠离子电池、电池材料、电化学储能等领域研究人员。
企业工程师:新能源汽车、储能系统、消费电子、电池制造、电池材料等行业从事电池研发、电芯设计、PACK集成、电池管理系统(BMS)开发的工程师。

如果你是正在寻求学术突破的硕士/博士研究生,正面临SCI选题迷茫、传统实验试错法效率低下、电池材料构效关系难以解析的困境——那么,本课程正是为你量身定制的通关密钥!机器学习加速电池材料研发已成为Nature Energy、Joule、Energy & Environmental Science等顶刊高频收录的热点方向(近五年关于固态电解质筛选、电池寿命预测、电极配方优化的论文呈爆发式增长)。掌握机器学习与电化学融合的研究范式,不仅能帮你快速从海量实验数据中挖掘高价值规律、构建高精度预测模型,更能大幅提升论文创新性与录用率,为毕业、申博、进入顶尖储能期刊与头部电池企业(如宁德时代、比亚迪、远景能源)增添硬核竞争力。
2026四大热门专题


专题一:机器学习固态电池专题

专题二:机器学习锂离子电池专题

专题三:机器学习催化剂设计专题

专题四:深度学习第一性原理专题



图片
图片
图片

专题一:机器学习固态电池专题




学习目标

1. 掌握固态电池(SSB)的发展使命,基本构成、固态电解质分类,工作原理、关键挑战与性能评估。
2. 了解利用第一性原理(DFT)和分子动力学(MD)及其相关工具(如VASP, CP2K, LAMMPS, Gromacs)计算固态电池关键材料(电极、电解质)及界面性质的基本方法。
3. 掌握机器学习的基本概念、常用算法及其在材料科学,特别是固态电池领域的应用流程。
4. 学习如何为固态电池体系(包括电极、电解质、界面)构建有效的特征描述符以及如何利用VASP等DFT工具对该类描述符进行计算。
5. 熟练运用Python及其相关库(Numpy, Pandas, Scikit-learn, Pytorch/TensorFlow, Pymatgen, ASE)处理固态电池相关数据并构建机器学习模型。
6. 掌握利用机器学习、深度学习等模型预测固态电池关键性能(如界面稳定性、离子电导率、循环寿命等)的方法。
7. 学习使用机器学习加速新型固态电池材料体系(特别是稳定的界面组合)的发现和设计,如利用Matminer工具结合Material Project数据库进行高通量筛选。
8. 掌握使用机器学习与传统计算模拟(DFT/MD)结合,进行多尺度研究的策略,利用先进的神经网络模型如Deepmd-kit, MACE等加速材料的研发。
讲师介绍
来自全国重点大学、国家“985工程”、“211工程"重点高校,长期从事固态电解质材料的第一性原理、分子动力学模拟研究,特别是在利用计算模拟方法和机器学习相结合来加速材料筛选,性能预测等方面有深入研究。他的授课方式浅显易懂,特别擅长从简单角度出发,逐渐深入讲解复杂的理论知识和计算方法!目前共发表论文(Nature Catalysis, Nature Communications, Energy & Environmental Science, Advanced Energy Materials等)共四十余篇。曾任Joule, Journal of Materials Chemstry A等期刊审稿人。


专题二:机器学习锂离子电池专题




学习目标

1. 使学员了解锂离子电池的基本原理和特性,以及机器学习在电池技术中的应用背景。通过学习Python编程语言,使学员能够熟练使用基础语法、函数、模块、包和面向对象编程,让学员熟悉并掌握机器学习库。
2. 使学员理解神经网络的基础知识,包括激活函数、损失函数、梯度下降与反向传播,并能够使用Pytorch构建全连接神经网络,掌握深度学习中的正则化技术、优化算法和超参数调优方法,了解并能够应用循环神经网络、卷积神经网络、图神经网络、注意力机制、Transformer架构、生成对抗网络和变分自编码器。
3. 培养学员在锂离子电池正极材料特性工程方面的实战能力。通过实战项目,使学员能够使用机器学习技术预测锂离子电池性能、稳定性,并进行电池性能分类。理解如何将机器学习与分子动力学模拟、第一性原理计算以及实验数据结合,以加速新材料的发现和电池性能的优化。
4. 电池管理系统(BMS)的智能化学习:使学员了解BMS的功能与组成,并能够应用机器学习技术进行电池充放电策略的优化。培养学员使用机器学习技术进行锂离子电池的实时充电状态(SOC)和健康状态(SOH)估计。
5. 拓宽学员的国际视野,让他们接触和学习国际上的先进研究成果。培养具备跨学科整合能力的学员,使他们能够在锂离子电池、深度学习、数据科学等领域之间架起桥梁,开展创新性研究。
讲师介绍
来自全国重点大学、国家“985工程”、“211工程”重点高校,长期从事锂离子电池研究,特别是在利用计算模拟方法和机器学习技术解决锂离子电池领域的关键问题。在多个国际高水平期刊上发表 SCI检索论文30余篇。他的授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂。



专题三:机器学习催化剂设计专题




学习目标

1.课程将系统引导学员深入理解电催化、热催化、光催化的核心原理,同时全面剖析机器学习、深度学习及图深度学习在催化领域的应用背景与适用范畴。通过 Python 语言基础与机器学习算法的专项学习,学员不仅能够清晰梳理机器学习从萌芽到蓬勃发展的历史脉络,洞悉其在信息时代于不同领域的多样化表现形式,更将通过实践操作,切实掌握将机器学习技术应用于科学研究的关键技能,为催化领域的前沿探索奠定坚实基础。
2.课程助力学员精准把握传统机器学习算法与深度学习算法的本质差异,熟练掌握 sklearn、torch 等主流第三方库的核心功能与应用技巧。通过系统学习与实践,学员将能够灵活运用树模型、深度神经网络、卷积神经网络、循环神经网络等算法模型,深度融入科学研究场景。同时,借助机器学习的可解释性分析方法,深入挖掘数据背后的科学规律,精准阐释催化反应机制,实现数据驱动与理论解析的深度融合,为科学研究提供创新分析视角与可靠技术支撑。
3.通过培养学员将机器学习应用在催化领域的研究思维,加速研究范式转变。将机器学习与第一性原理或者实验结合,以实现快速发现催化材料。这种结合能够充分发挥不同方法的优势,机器学习强大的数据处理和模式识别能力,可挖掘催化过程中的隐藏规律,第一性原理则能从量子力学层面揭示催化反应的本质,实验数据为模型提供真实可靠的验证基础。同时,引导学员运用迁移学习等技术,将在某一催化体系中训练得到的模型,快速应用到相似体系,实现知识的高效复用。此外,借助机器学习的可解释性研究,还能帮助学员深入理解催化反应机制,为进一步优化催化材料性能、设计新型催化体系提供理论支撑,推动催化领域朝着智能化、精准化方向迈进。
4.图拓扑结构和图神经网络在催化领域有着广泛的应用。由于催化过程中存在大量繁杂的中间体,这为图拓扑结构的构建提供了丰富的数据来源,从而更有利于发现新的催化路径。将晶体结构从欧式空间转化为非欧空间的图结构,相较于传统描述符,能够更有效地捕捉晶体结构与目标属性之间的映射关系。通过培养学员跨学科、跨领域、跨范式的科学思维,有望为新材料发现开辟新的研究范式。
讲师介绍
来自全国重点大学、国家“985工程”、“211工程”重点高校,长期从事机器学习辅助的催化剂设计与预测研究,在机器学习深度学习辅助的催化剂设计研究领域深耕多年,具有丰富的经验和扎实的基础。在多个国际高水平期刊上发表 SCI检索论文30余篇。他的授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂!




专题四:深度学习第一性原理专题




学习目标

1.本课程以“深度学习+ 大语言模型双引擎协同”为主线,系统讲解从传统第一性原理计算与分子动力学模拟,到机器学习、图神经网络、通用深度势能模型,再到 LLM 驱动的智能材料研究工作流的完整技术体系。
2.课程注重理论与实践深度结合,通过大量上机实操与真实案例,帮助学员全面掌握AI 驱动材料模拟、性质预测与材料发现的核心方法。
3..采用“理论讲解+ 实践操作 + 案例驱动”的教学模式,覆盖计算环境搭建、材料数据库、机器学习建模、图神经网络、通用势能模型(CHGNet / Mattersim / DeepMD)、动力学与扩散模拟,以及大语言模型在材料科研中的协同应用。学员将亲手构建从“数据 → 模型 → 模拟 → 优化 → 发现”的完整智能材料研究流程。
讲师介绍
主讲老师来自全国重点大学、“211工程”重点高校,长期从事人工智能驱动材料设计与计算模拟研究,兼具深度学习算法研发、通用势能模型构建与大语言模型科研应用的交叉背景。通过理论结合实操与案例训练,帮助学员快速掌握AI驱动材料设计与智能发现的关键技术与跨学科能力。


专题大纲

专题一:机器学习固态电池

第一天:固态电池基础与计算模拟实践

上午:固态电池基础与机器学习应用概览
1.1 固态电池核心知识
基本构成:正极、负极、固态电解质、界面。
固态电解质分类(聚合物、氧化物、硫化物)与关键性能指标。
核心挑战:界面稳定性、离子电导率、循环寿命。
案例:商业化固态电池实例与性能瓶颈。
1.2 机器学习在固态电池研发中的作用
传统研发流程vs. 机器学习加速研发流程。
机器学习在固态电池领域的典型应用场景。
成功案例:机器学习发现新型电解质材料、预测界面稳定性。
1.3 软件环境配置与验证
实操:Python环境配置(Anaconda, Jupyter Notebook)。
实操:安装并测试关键库(Numpy, Pandas, Scikit-learn, Pymatgen, ASE, Matplotlib)。
实操:VASP/LAMMPS环境检查与示例运行。
实操:下载课程数据集与示例代码。
下午:DFT与MD计算实践
1.4 DFT计算固态电解质性质
快速回顾:DFT基本原理。
实操:VASP输入文件结构解析(INCAR, POSCAR, KPOINTS, POTCAR)。
实操:运行VASP计算LLZO固态电解质的晶格常数和形成能。
实操:使用Pymatgen/ASE读取VASP输出文件(OUTCAR, vasprun.xml)。
实操:使用VESTA可视化晶体结构和电荷密度。
练习:计算不同固态电解质材料的形成能并比较。
1.5 MD模拟离子扩散行为
快速回顾:MD基本原理。
实操:LAMMPS输入文件结构解析(数据文件、势函数、模拟参数)。
实操:运行LAMMPS模拟LLZO中Li离子的扩散。
实操:使用Python分析MD轨迹:计算均方位移(MSD)和扩散系数。
实操:使用VMD/Ovito可视化离子扩散轨迹。
练习:改变温度参数,观察对离子扩散系数的影响。
第二天:Python数据处理与特征工程实战
上午:Python科学计算与数据处理
2.1 2.1 Numpy与Pandas实战
快速回顾:Numpy数组操作基础。
实操:使用Numpy处理DFT计算的能量数据(数组创建、索引、运算)。
实操:使用Pandas读取固态电解质性能数据集(CSV/Excel)。
实操:数据清洗:处理缺失值、异常值、重复值。
实操:数据筛选、分组、统计分析(groupby, describe)。
练习:分析不同类型固态电解质的离子电导率分布。
2.2 数据可视化实战
实操:Matplotlib绘制散点图、折线图、柱状图。
实操:Seaborn绘制相关性热力图、分布图、箱线图。
实操:可视化固态电解质性能数据:离子电导率vs. 温度、成分。
实操:多子图布局与图表美化。
练习:创建固态电池材料性能对比图表。
2.3 机器学习基础概念
监督学习vs. 无监督学习:回归、分类、聚类。
训练集、验证集、测试集划分。
模型评估指标:R2, MAE, MSE, RMSE, 准确率, F1-score。
过拟合与欠拟合:如何识别与避免。
下午:固态电池特征工程实战
2.4 材料结构信息提取
快速回顾:为什么需要特征描述符?
实操:使用Pymatgen从CIF文件读取晶体结构。
实操:提取基本结构信息:晶格参数、空间群、密度、体积
实操:使用ASE从POSCAR文件读取结构并进行操作。
实操:计算元素组成特征:元素比例、平均原子质量
练习:批量处理多个固态电解质结构文件并提取特征。
2.5 元素与化学特征构建
实操:使用Pymatgen获取元素属性(电负性、原子半径、价态)。
实操:构建组成特征:加权平均、标准差、最大值、最小值。
实操:构建化学式特征:氧化态、配位数。
实操:使用Matminer自动生成材料特征(composition-based features)。
练习:为给定的固态电解质材料构建完整的特征向量。
2.6 从DFT结果提取特征
实操:使用Pymatgen从vasprun.xml提取能量、应力、力。
实操:提取电子结构信息:带隙、态密度、费米能级。
实操:构建DFT衍生特征:形成能、分解能、电化学窗口。
练习:整合结构特征和DFT特征,构建机器学习数据集。
第三天:机器学习模型构建与性能预测实战
上午:传统机器学习模型实战
3.1 回归模型预测离子电导率
任务说明:基于固态电解质特征预测离子电导率。
实操:加载并探索数据集(数据分布、相关性分析)。
实操:数据预处理:特征标准化/归一化(StandardScaler, MinMaxScaler)。
实操:划分训练集、验证集、测试集。
实操:使用Scikit-learn构建线性回归模型并训练。
实操:使用随机森林回归模型并对比性能。
实操:模型评估:计算MAE, MSE, RMSE, R²。
实操:可视化预测结果:真实值vs. 预测值散点图、残差图。
实操:特征重要性分析:哪些特征对离子电导率影响最大?
练习:尝试支持向量机回归(SVR)并比较三种模型性能。
3.2 分类模型预测界面稳定性
任务说明:预测电极/电解质界面是否稳定(10分钟)。
实操:加载界面稳定性数据集(标签:稳定/不稳定)。
实操:数据预处理与类别分布检查。
实操:使用Scikit-learn构建逻辑回归分类模型。
实操:使用随机森林分类模型并对比。
实操:模型评估:准确率、精确率、召回率、F1-score。
实操:绘制混淆矩阵和ROC曲线。
实操:处理类别不平衡:SMOTE过采样技术。
练习:尝试决策树和梯度提升模型(XGBoost)。
下午:深度学习模型实战
3.3 神经网络基础与PyTorch/TensorFlow入门
快速回顾:神经网络基本结构。
实操:PyTorch/TensorFlow张量操作基础。
实操:构建简单的全连接神经网络(定义层、激活函数)。
实操:定义损失函数(MSE, CrossEntropy)和优化器(Adam, SGD)。
实操:训练循环:前向传播、反向传播、参数更新。
实操:可视化训练过程:损失曲线、准确率曲线。
3.4 深度学习预测固态电池性能
任务:使用多层感知机(MLP)预测固态电池循环寿命。
实操:数据准备:加载数据并转换为PyTorch/TensorFlow格式。
实操:设计MLP架构:输入层、隐藏层(2-3层)、输出层。
实操:训练模型并监控验证集性能。
实操:超参数调优:学习率、批次大小、隐藏层神经元数量。
实操:使用早停(Early Stopping)防止过拟合。
实操:模型评估与可视化预测结果。
练习:尝试不同的网络架构和激活函数(ReLU, Tanh, LeakyReLU)。
3.5 模型对比与选择
实操:对比传统机器学习与深度学习模型的性能。
讨论:何时使用传统机器学习?何时使用深度学习?
实操:模型保存与加载(joblib, pickle, PyTorch save/load)。
练习:为自己的固态电池数据选择最佳模型。
第四天:材料数据库应用与高通量筛选实战
上午:Material Project数据库与Matminer实战
4.1 Material Project数据库应用
快速介绍:Material Project数据库的价值与应用。
实操:注册并获取MP API密钥。
实操:使用MP API查询固态电解质材料(按化学式、空间群)。
实操:提取材料的结构、能量、带隙、形成能等信息。
实操:批量下载特定类型材料的数据(如含Li的氧化物)。
实操:将MP数据转换为Pandas DataFrame格式。
练习:查询并下载所有LLZO类固态电解质的数据。
4.2 Matminer特征生成实战
实操:Matminer库介绍与安装验证。
实操:使用Matminer从化学式生成组成特征(ElementProperty)。
实操:使用Matminer从结构生成结构特征(SiteStatsFingerprint, StructuralHeterogeneity)。
实操:使用Matminer生成电子结构特征(BandCenter, Cohesive Energy)。
实操:批量为MP数据集生成特征矩阵。
实操:特征选择:去除低方差特征、相关性分析。
练习:为下载的固态电解质数据生成完整的特征集。
下午:机器学习加速材料筛选实战
4.3 高通量筛选固态电解质
任务:从MP数据库中筛选高性能固态电解质候选材料。
实操:定义筛选标准(高离子电导率、宽电化学窗口、低成本)。
实操:使用前面训练的机器学习模型预测MP数据库材料的性能。
实操:根据预测结果筛选候选材料(Top 50)。
实操:可视化筛选结果:性能分布、成分分布。
实操:对候选材料进行排序和优先级评估。
实操:导出候选材料列表及其结构文件(CIF)。
练习:调整筛选标准,探索不同的候选材料集。
4.4 界面稳定性预测与组合筛选
快速回顾:界面反应机制与影响因素(10分钟)。
实操:构建电极-电解质界面特征描述符。
实操:使用机器学习模型预测界面形成能。
任务:发现稳定的电极-电解质界面组合。
实操:构造电极-电解质组合矩阵(如10种电极 × 20种电解质)。
实操:批量预测所有组合的界面稳定性。
实操:筛选稳定界面组合(Top 20)。
实操:可视化界面稳定性矩阵(热力图)。
实操:案例分析:选择一个稳定组合,分析其结构和化学特性。
练习:结合DFT验证筛选出的界面组合。
第五天:神经网络势函数与多尺度模拟实战
上午:机器学习势函数实战
5.1 神经网络势函数基础
快速回顾:传统势函数的局限性(10分钟)。
神经网络势函数(NNP)的基本原理与优势。
Deepmd-kit与MACE工具介绍。
NNP在固态电池研究中的应用案例。
5.2 Deepmd-kit训练数据准备
实操:理解NNP训练数据格式(能量、力、应力、坐标)。
实操:从VASP DFT计算结果提取训练数据。
实操:使用dpdata库转换VASP输出为Deepmd-kit格式。
实操:数据集划分:训练集、验证集、测试集。
实操:数据集质量检查:能量分布、力分布、结构多样性。
练习:为LLZO固态电解质准备完整的训练数据集。
5.3 Deepmd-kit模型训练
实操:理解Deepmd-kit配置文件结构(input.json)。
实操:设置模型参数:网络架构、训练参数、截断半径。
实操:启动模型训练并监控训练过程。
实操:评估模型准确性:能量误差、力误差与DFT对比。
实操:模型优化:调整超参数提高精度。
练习:训练不同配置的NNP模型并比较性能。
下午:NNP加速MD模拟与综合应用
5.4 基于NNP的大规模MD模拟
实操:将训练好的Deepmd-kit模型集成到LAMMPS。
实操:设置基于NNP的LAMMPS输入文件。
实操:运行大规模MD模拟(更大体系、更长时间)。
实操:分析MD模拟结果:离子扩散系数、径向分布函数。
实操:可视化离子扩散轨迹和结构演化。
实操:对比传统势函数MD与NNP-MD的结果差异。
练习:使用NNP-MD研究不同温度下的离子输运行为。
5.5 多尺度研究策略综合实践
案例:完整的固态电池材料研发流程演示。
实操:DFT计算 → 特征提取 → 机器学习预测 → 高通量筛选。
实操:NNP训练 → 大规模MD模拟 → 性能评估。
实操:整合多种方法的结果,形成材料设计建议。
讨论:如何将计算预测结果与实验验证结合。
5.6 课程总结与未来展望
回顾:五天课程核心内容与技能总结。
固态电池材料研发的前沿趋势:
自动化工作流(AiiDA, FireWorks)。
主动学习(Active Learning)加速材料发现。
AI驱动的实验设计与机器人实验室。
大语言模型在材料科学中的应用。
学员项目讨论:如何将所学应用到实际研究中。
Q&A与课程反馈。

部分案例图片:

图片
图片
图片
图片
图片

专题二:机器学习锂离子电池

第一天上午:锂离子电池与机器学习基础

锂离子电池与机器学习背景:了解锂离子电池的基本原理、发展历程、应用领域以及当前面临的挑战;介绍机器学习的定义、发展历程、主要应用领域以及与锂离子电池研究的结合点,探讨机器学习如何助力锂离子电池性能提升和新材料研发。
Python基础语法、函数、模块和包、面向对象编程
机器学习库介绍:Numpy、Pandas、Matpliotlib、Seaborn、Scikit-learn
第一天下午:监督学习与非监督学习入门
监督学习与非监督学习
K-近邻、支持向量机、决策树、线性回归、逻辑回归
实战一:使用机器学习预测锂离子电池性能:特征工程描述包括电池的充放电循环数据、温度、电流、电压、电池的制造参数、材料特性等,选择不同的机器学习模型,例如决策树、随机森林、支持向量机,最后进行性能评估。
图片
第二天上午:聚类分析与集成学习
K-均值聚类、层次聚类、PCA、t-SNE
集成学习:随机森林、Boosting
交叉验证、性能指标、模型评估与选择、网格搜索
实战二: 特征选择与聚类算法选择:根据锂离子电池的性能特征(如容量、能量密度、内阻、循环稳定性等),选择合适的聚类算法(如K-均值聚类、层次聚类等),通过特征工程对数据进行预处理,将数据转换为适合聚类分析的格式。
聚类结果分析与降维验证:对聚类结果进行分析,观察不同聚类类别中电池的性能特点和分布规律,通过降维技术(如PCA、t-SNE)对聚类结果进行可视化验证,判断聚类结果的有效性和合理性,为锂离子电池的性能分类和优化提供依据。图片
第二天下午:神经网络基础与深度学习技术
神经网络基础、激活函数、损失函数、梯度下降与反向传播
Pytorch构建全连接神经网络
深度学习中的正则化技术:L1、L2、Dropout
优化算法:SGD、Adam、RMSprop
超参数调优:网格搜索、随机搜索、贝叶斯优化
实战三:基于深度学习的高熵材料的虚拟高通量筛选: 收集和整理用于训练的数据集,包括高熵材料的化学组成、晶体结构、物理化学性质等,使用准备好的数据集对深度学习模型进行训练,并采用交叉验证等方法来评估模型的泛化能力。
第三天上午:高级深度学习架构与应用
循环神经网络
卷积神经网络
图神经网络
注意力机制
Transformer架构
生成对抗网络
变分自编码器
实战四:基于图神经网络的锂离子电池性能预测:构建图神经网络模型,选择合适的架构,如GCN、GAT等,来学习材料图特征节点和边的表示,用于预测锂离子电池性能。
图片
第三天下午:锂离子电池材料的机器学习应用
锂离子正极材料的特征工程
实战五:基于机器学习的锂金属正极材料的稳定性预测:选择合适的机器学习模型,如支持向量机、随机森林、集成学习、神经网络,使用适当的评估指标,如准确率、召回率、F1分数等,来衡量模型预测锂金属正极材料稳定性的性能。
实战六:实验引导的高通量机器学习分析:讲解将机器学习模型集成到实验流程中,优化实验过程,实现从实验设计到数据分析的自动化和智能化。
图片
第四天上午:机器学习与多尺度模拟的结合
基于锂离子电池的机器学习与多尺度模拟
机器学习、分子动力学模拟与第一性原理计算
机器学习与实验结合
实战七:介绍Materials Project数据库的基本情况和功能,说明如何从该数据库中提取与锂离子电池相关的电数据,包括材料的晶体结构、电子结构、电化学性能等信息。
从Materials Project数据库中提取电池电数据,利用深度学习技术来预测多价金属离子电池的电极电压,并开发了一个可解释的深度学习模型,以加速多价金属离子电池材料的设计和优化。
图片
实战八:收集液态电解质添加剂电池系统中的性能数据,包括最终面积比阻抗、阻抗增量和比容量,基于分子结构信息,生成特征向量,通过数据收集、特征工程、模型训练与验证等机器学习流程,成功预测出最佳液态电解质添加剂组合。
图片
第四天下午:机器学习在电池管理系统中的应用
机器学习在电池管理系统中的应用介绍
电池管理系统(BMS)的功能与组成
电池充放电管理
电池安全与保护
电池健康状态的指标
电池老化分析
实战九:探讨如何将物理模型(如电池的电化学模型、热模型等)与机器学习模型相结合,利用物理模型的先验知识和机器学习模型的数据驱动能力,提高对电池状态的预测精度和可靠性,例如通过物理模型提供电池状态的初始估计,再利用机器学习模型对实际数据进行拟合和修正,实现对电池长期性能和寿命的准确预测。
图片
第五天上午:机器学习在电池寿命预测中的应用
实战十:收集锂离子电池在不同充放电条件下的运行数据,包括电压、电流、温度、充放电时间等,这些数据是SOC和SOH估计的基础,通过数据预处理、特征提取等步骤,将数据转换为适合机器学习模型输入的格式,提高模型的估计精度。
选择合适的机器学习模型(如线性回归、支持向量机、神经网络等),根据处理后的数据对模型进行训练,通过交叉验证等方法对模型的准确性和泛化能力进行评估,选择最优的模型用于锂离子电池的SOC和SOH实时估计,通过实例代码展示模型训练和评估的过程,分析模型的性能指标和估计结果。
将训练好的机器学习模型集成到BMS中,实现对锂离子电池SOC和SOH的实时估计,通过实时监测电池的状态参数,利用模型进行快速准确的估计,为电池的充放电管理、安全保护和健康状态评估提供实时数据支持,提高BMS的智能化水平和电池的使用效率。
图片
第五天下午
实战十一: 基于大语言模型(LLM)的文献v数据自动化提取与应用。重点讲解如何利用大语言模型(LLM)与检索增强生成(RAG)技术,构建自动化信息提取框架,解决科学数据提取耗时耗力的瓶颈。从电池文献中自动提取关键参数(如材料成分、晶体结构、工作电压等),构建小型材料数据库。
图片
实例十二: 基于大语言模型搭建电池健康状态(SOH)智能预测系统。利用大语言模型自动化机器学习算法的实施与优化,以实现对锂电池健康状态(SOH)的智能预测,通过结构化的提示工程(Prompt Engineering)引导LLM完成自动化机器学习预测过程。基于公开电池数据集对比LLM驱动的模型与传统方法的性能差异。

专题三:机器学习催化剂设计

第一天:

第一天上午
理论内容:
1.机器学习概述
2.材料与化学中的常见机器学习方法
3.应用前沿
实操内容:
1.Python基础:变量和数据类型,列表,字典,if语句,循环,函数
2.Python科学数据处理:NumPy,Pandas,Matplotlib
案例一:随着AI For Science时代的到来,机器学习以优异的速度迅速扩展到各个领域。本次培训详细讲解从下载到安装,再到环境配置全流程。无论是数据科学新手还是进阶学习者,都能借此掌握 Anaconda 操作要点,轻松搭建编程环境,为后续 Python 开发、数据分析等工作筑牢基础。
第一天下午  
理论内容:
1.sklearn基础介绍
2.线性回归原理和正则化
实操内容:
1. 线性回归方法的实现与初步应用
2. L1和L2正则项的使用方法
3. 线性回归用于HER催化剂的筛选
4. 符号回归用于发现金属催化氧化载体中金属-载体相互作用
图片
案例二:金属-载体相互作用是多相催化中最重要的支柱之一,但由于其复杂的界面,建立一个基本的理论一直具有挑战性。基于实验数据、可解释的机器学习、理论推导和第一性原理模拟,以建立了基于金属-金属和金属-氧相互作用的金属-氧化物相互作用的一般理论(符号回归)。
———————————————————————————————
第二天上午
理论内容:
1.  逻辑回归
1.1原理
1.2 使用方法
2. K近邻方法(KNN)
2.1  KNN分类原理
2.2  KNN分类应用
3. 神经网络方法的原理
3.1 神经网络原理
3.2神经网络分类
3.3神经网络回归
实操内容:
1.逻辑回归的实现与初步应用
2.KNN方法的实现与初步应用
3.神经网络实现
图片
案例三:铜基合金催化剂因其良好的选择性和过电位低等特点,在二氧化碳还原反应(CO2RR)领域得到了广泛的应用。为了实现对CO2RR合金催化剂的高效探索,通过实施严格的特征选择过程,将特征空间的维数从13维降至5维,ML模型成功快速预测了CO2RR过程中关键中间体(HCOO、CO和COOH)的吸附能。
第二天下午
项目实操:
1.基于少特征模型的机器学习预测二氧化碳还原电催化剂
2.基于文本数据信息预测甲醇转化率
这两个实操项目同时穿插讲解如下内容
A1 机器学习材料与化学应用的典型步骤
A1.1 数据采集和清洗
A1.2 特征选择和模型选择
A1.3 模型训练和测试
A1.4 模型性能评估和优化
图片
案例四:结构化材料合成路线对于化学家进行实验和现代应用(如机器学习材料设计)至关重要。近年来,化学文献呈指数级增长,人工提取已发表文献耗时耗力。本研究的重点是开发一种从化学文献中提取pd基催化剂合成路线的自动化方法。并利用合成路线的结构化数据来训练机器学习模型并预测甲烷转化率的性能。
———————————————————————————————
第三天上午
理论内容:
1.决策树
1.1决策树的原理
1.2决策树分类
2. 集成学习方法
2.1集成学习原理
2.2随机森林
2.3Bosting方法
3.朴素贝叶斯概率
3.1原理解析
3.2 模型应用
4.  支持向量机
4.1分类原理
4.2核函数
实操内容
1.决策树的实现和应用
2.随机森林的实现和应用
3.朴素贝叶斯的实现和应用
4.支持向量机的实现和应用
图片
案例五:集成学习通过多层模型组合与融合,在提升模型性能方面极具优势。在数据挖掘中,面对海量且复杂的数据,单一模型往往难以全面捕捉数据特征。集成学习将弱学习器的性能结合,先由各基础模型从不同角度挖掘数据,再通过加权等方式融合结果,能更全面地剖析机器学习结果。
第三天下午
项目实操
1.机器学习加速设计ORR和OER双功能电催化剂
2.二元合金中双官能团氧电催化剂的有效机器学习模型设计
3.SHAP机器学习可解释性分析
这两个实操项目同时穿插讲解如下内容
A1 模型性能的评估方法
A1.1 交叉验证:评估估计器的性能
A1.2 分类性能评估
A1.3 回归性能评估
图片
案例六:氧还原反应(ORR)和析氧反应(OER)是清洁能源转化的关键。近年来,双金属位催化剂(DMSCs)因其原子利用率高、稳定性强、催化性能好而受到广泛关注。本研究采用密度泛函理论(DFT)和机器学习(ML)相结合的先进方法,研究吸附物在数百种潜在催化剂上的吸附自由能,来筛选对ORR和OER具有高活性的催化剂。
———————————————————————————————
第四天上午
理论内容:
1. 无监督学习
2.1 什么是无监督学习
2.2 无监督算法——聚类
2.3 无监督算法——降维
2. 材料与化学数据的特征工程
2.1分子结构表示
2.2 独热编码
实操内容:
鸢尾花数据集用于聚类实现和应用
T-SNE实现和应用
PCA的实现和应用
层次聚类的实现和应用
K-means聚类的实现和应用
图片
案例七:无监督学习是从无标签数据中挖掘模式与结构,t-SNE作为其重要降维工具,专注于保留高维数据点间局部结构。课程将深入讲解t-SNE核心原理,如通过概率分布衡量点间相似性,以优化KL散度实现降维,展示其在高维数据可视化中的强大作用。还会进行代码实操,涵盖数据加载、参数调优、降维及可视化等环节,让学员熟练掌握t-SNE在不同场景的应用,助力探索数据潜在结构与模式。
第四天下午
项目实操
理论内容:
1.深度学习理论基础
2.DNN、RNN、CNN、LSTM及Transformer基础框架介绍
实操内容
1. torch基础练习
2. 应用RNN、CNN、LSTM模型筛选光催化剂
图片
案例八:近年来,结合高通量(HT)和机器学习(ML)的策略以加速有前途的新材料的发现已经引起了人们的极大关注。因此,可以设计一种直观的方法,通过数据库并结合深度学习模型,并将它们与HT方法耦合,以寻找高效的2D水分解光催化剂。
———————————————————————————————
第五天上午
理论内容:
1.图深度学习理论基础
2.图深度学习应用实例OC20、OC22电催化剂开发挑战(ACS Catalysis)
实操内容:
1. 图结构构建及可视化
2. PyTorch Geometric基础介绍
图片
案例九:近年来,在晶体性能预测领域,图神经网络(graph neural network,GNN)模型取得了长足的发展。GNN模型可以有效地从晶体结构中捕捉高维晶体特征,从而在性能预测中获得最佳性能。指导学员搭建图深度学习开发环境,以顺利构建图结构,并进行机器学习训练。
第五天下午
项目实操
1.图神经网络模型基本概述及CGCNN代码深度解读应用
2.基于图论构建反应网络用于NO电还原反应研究
3.Transformer辅助水氧化制备过氧化氢(WOR)及可解释分析
图片
案例十:氮氧化物排放严重影响我们的环境和人类健康。光催化脱硝(deNOx)因其低成本、无污染而备受关注,但实际生产中产生的是不需要的亚硝酸盐和硝酸盐,而不是无害的氮气。揭示活性位点和光催化机理对改进工艺具有重要意义。本次课程以指导学员依据反应中间体,建立图反应网络结构以揭示反应机理。

专题四:深度学习第一性原理

第一天:计算环境+ Python 科学计算 + 材料建模基础

上午:计算环境基础与材料模拟理论
(1)第一性原理、分子动力学计算与Linux 环境搭建
系统介绍第一性原理计算与分子动力学模拟的基本思想、适用范围与典型应用场景,帮助学员建立对现代材料模拟方法体系的整体认识。讲解Linux 操作系统在科学计算中的基本使用方法,包括文件系统、常用命令、环境配置与软件部署方式,并介绍科学计算常用软件栈的组织方式与管理方法。
实践内容:
在Linux 环境下完成 Python 与材料模拟相关工具链的基础运行环境搭建。
(2)高通量计算与自动化脚本基础
讲解超算作业调度系统SLURM / PBS 的基本使用方式与作业提交流程,系统介绍 Bash 脚本中的循环结构、条件判断与函数封装等常用编程方法,并以材料模拟中的参数扫描与收敛性测试为例,讲解如何构建自动化批量计算流程,实现大规模计算任务的高效管理。
实践内容:
编写用于批量计算与参数扫描的自动化脚本,实现简单高通量计算流程。
下午:Python 科学计算与专业材料工具
(1)Python 科学计算生态系统
系统讲解NumPy、Pandas、Matplotlib、SciPy 在材料数据处理、数值计算与科学绘图中的典型用法,介绍晶体结构、原子坐标、晶格参数与物性数据的数组化表示方法,并讲解如何进行统计分析与可视化展示。同时介绍 Jupyter Notebook 在可复现计算流程、科研记录与结果展示中的应用方式。
实践内容:
使用Python 对材料结构与物性数据进行读取、处理、统计分析与可视化展示。
(2)专业材料分析工具:ASE 与 Pymatgen
系统讲解ASE 在原子结构构建、文件格式转换、几何优化与分子动力学模拟设置中的应用方法,讲解 Pymatgen 在晶体对称性分析、缺陷建模、热力学与电子结构数据处理等方面的核心功能,并介绍如何构建从结构生成、第一性原理计算到后处理分析的自动化材料模拟工作流。
实践内容:
使用ASE 与 Pymatgen 进行分子、晶体与界面模型的构建、分析与可视化。
(3)材料数据库入门与初步机器学习建模
讲解现代材料研究中材料数据库在数据驱动材料发现中的重要作用,介绍C2DB 二维材料数据库与 MOF 数据库的结构、分类方式与 API 使用方法。系统讲解面向机器学习的材料数据准备流程,包括数据清洗、缺失值处理、特征筛选与数据质量评估等关键步骤。
实践内容:
从材料数据库中获取数据,完成数据预处理,并基于DeepSeek 构建第一个材料性质回归模型。
图片
第二天:第一性原理计算实战+ 材料数据库与机器学习
上午:GPAW 第一性原理计算与材料性质模拟
(1)GPAW DFT 计算框架与材料性质计算实战
系统介绍GPAW 密度泛函理论计算框架的基本原理、数值实现方法及其在材料模拟中的典型应用场景。讲解材料结构优化的标准流程,包括截断能、k 点采样的收敛性测试方法。随后以典型半导体与金属体系为例,讲解能带结构计算的布里渊区路径设置方法、能带图的绘制方式与物理含义解读。同时介绍表面与界面体系的建模方法,并讲解分子在表面吸附构型搜索、吸附能与反应能的计算流程。
实践内容:
完成典型材料体系的结构优化、能带结构计算,以及简单表面吸附体系的构型优化与吸附能计算。
(2)多物性第一性原理计算方法
系统讲解基于第一性原理的多物性计算方法,包括扫描隧道显微镜(STM)模拟的理论基础与局域态密度分析方法,拉曼光谱计算中声子模式与拉曼活性选择定则的物理背景,以及材料光学性质(介电函数、吸收系数等)的计算流程。同时结合二维材料体系,介绍其电子结构与光学性质的计算特点,并以催化表面体系为例,讲解表面吸附与反应相关性质的计算策略。
实践内容:
完成STM 模拟、拉曼光谱计算、光学性质计算,并对催化表面吸附体系进行第一性原理计算;同时演示基于高精度一致性数据集的高通量自动化计算流程。
下午:材料数据库 + 机器学习建模
(1)材料数据库的获取、管理与智能查询
系统介绍MC2D、Materials Project 与 AFLOW 等主流材料数据库的数据结构、数据类型与典型应用场景,同时讲解 CSD、CoRE-MOF 与 QMOF 等结构数据库中的数据特点与结构可视化、格式转换方法。随后讲解材料数据在进入机器学习建模前的数据质量评估流程,包括数据完整性检查、异常值识别与基本筛选策略,并介绍大语言模型结合 MCP 协议进行自然语言数据库查询与智能检索的基本思路。
实践内容:
通过数据库API 从多个材料数据库中获取数据,完成数据整理、初步清洗与结构信息解析。
(2)机器学习在材料性质预测中的建模流程
系统讲解材料机器学习模型中常用的描述符构建方法,包括结构特征、电子特征与化学特征等多种信息的组合方式。随后以多个典型任务为例,讲解回归模型在材料形成能预测、弹性力学性质预测以及HER 催化吸附自由能预测中的建模流程。同时介绍模型评估方法,包括学习曲线、交叉验证与泛化误差分析等,用于判断模型的可靠性与适用范围。
实践内容:
使用matminer 构建多种材料性质预测模型,分别完成材料热力学稳定性、弹性力学性质与吸附自由能的回归预测,并对模型效果进行评估与对比分析。

图片
第三天:深度学习模型(GNN + 势能模型)
上午:图神经网络与 CGCNN
(1)图神经网络与CGCNN 在材料性能预测中的应用
系统回顾深度学习在材料科学中的发展历程与相较传统机器学习方法的核心优势,介绍图神经网络(Graph Neural Network, GNN)的基本思想,包括图表示学习与消息传递机制等核心概念。随后重点讲解 CGCNN(Crystal Graph Convolutional Neural Network)的模型原理与网络架构,包括晶体结构的图表示方法、卷积操作在晶体图中的实现方式,以及面向回归与分类任务的网络设计思路。同时对比深度学习方法与传统机器学习方法在预测精度、特征工程依赖程度与数据需求等方面的差异。
实践内容:
使用CGCNN 模型对典型材料数据集进行训练与测试,完成材料形成能、吸附能等性质的预测任务,并分析模型预测效果。
(2)深度学习模型在材料数据建模中的方法对比与应用分析
进一步结合具体案例,分析图神经网络模型在处理复杂晶体结构数据时相较传统描述符方法的优势与适用场景,讨论模型在不同数据规模与不同材料体系下的表现特点,并介绍模型训练过程中的基本调参与误差分析方法,为后续通用势能模型的学习打下基础。
【声明】内容源于网络
0
0
科学材料站
内容 0
粉丝 0
科学材料站
总阅读0
粉丝0
内容0