2024年诺贝尔物理奖和化学奖均颁发给与“AI for Science”相关领域,这一重大成就无疑为该领域的发展提供了强劲的动力。在这一科学研究的新范式——“AI for Science”时代,基于数据驱动的机器学习力场(ML-FFs)成功解决了第一性原理电子结构方法与传统经验力场在准确性和效率之间的矛盾。近年来,该领域取得了飞速进展,相关研究成果频繁发表于《Nature》、《Science》、以及《Cell》等国际顶尖学术期刊。
随着计算能力的快速提升,使用ML-FFs进行第一性原理级别精度的大规模分子模拟已逐步成为现实。此外,机器学习方法让我们重新审视了许多曾经熟知的现象,例如小分子的非对称电子效应等,研究人员通过这种方式能更好地理解实验数据。这表明,机器学习力场极有可能成为现代计算化学和分子模拟领域的重要组成部分。然而,作为一个新兴的跨学科领域,机器学习力场涉及量子化学、分子模拟、以及机器学习等多个学科。由于该领域的知识广泛且门槛较高,且学习平台和相关资料相对匮乏,专业培训显得尤为迫切。
近年来,随着人工智能技术的飞速发展,机器学习在科学研究中的应用逐渐成为跨学科研究的前沿热点。2024年诺贝尔物理奖与化学奖均授予“AI for Science”相关领域的突破性成果,这一事件标志着人工智能与基础科学的深度融合已进入新的发展阶段。在材料科学领域,第一性原理计算作为研究材料电子结构和性质的核心工具,为理解微观世界提供了坚实的理论基础。然而,其高昂的计算成本限制了其在大规模复杂体系中的应用。机器学习的引入,为这一问题提供了新的解决方案,通过构建高效的数据驱动模型,实现了从第一性原理精度到大规模模拟的无缝衔接。
机器学习在第一性原理领域的应用不仅加速了材料设计与发现的进程,还为传统理论计算提供了新的视角。例如,通过高通量计算与机器学习相结合,研究者能够快速筛选出具有特定性能的材料,从而显著提高研发效率。此外,机器学习模型还能够挖掘隐藏在数据中的物理规律,为实验研究提供理论支持。在这一背景下,掌握第一性原理与机器学习的交叉知识,已成为现代材料科学研究人员必备的技能。
机器学习分子动力学
本次课程内容全面,旨在帮助学员快速掌握量化软件的使用、深入理解机器学习原理、熟练运用LAMMPS模拟软件,并精通机器学习力场模型。课程将带领学员详细了解生态最完善的DeePMD系列软件的使用方法,并深入探讨机器学习力场领域的高数据效率等变模型(如NequIP、MACE、Allegro)。此外,还将介绍机器学习力场领域的开源大模型(MACE-OFF23、MACE-MP0、DPA等)的使用与微调技巧。
深入探讨“AI for Science”时代下,机器学习力场(ML-FFs)在分子动力学模拟中的应用。课程内容涵盖从基础理论到高级应用的全面知识,包括机器学习、深度学习、分子动力学模拟、量子化学计算等。通过理论与实践相结合的方式,学员将掌握如何使用先进的机器学习力场模型进行高精度分子模拟,并了解该领域的最新进展和未来趋势。
机器学习第一性原理
本课程旨在为学员提供第一性原理与机器学习交叉领域的系统性培训,并安排了较多的上机实验,提供大量相关代码与示例教程,帮助学员熟悉各种深度学习第一性原理计算方法的使用,快速掌握相关理论知识与实操技能。课程将从基础理论出发,逐步深入到高级应用,学员将具备独立开展第一性原理与机器学习交叉研究的能力,能够运用所学知识解决材料科学中的实际问题,并为未来的研究工作奠定坚实的基础。
机器学习分子动力学
Red jujube
第一天:AI与分子动力学的交叉与基础操作
课程说明
第一天的课程将从AI与科学的交叉点出发,介绍科学研究的四范式,特别是从大数据时代到AI4Science时代的转变。通过探讨Google DeepMind、微软研究院、Meta FAIR等知名团队的工作,学员将了解AI在科学领域的广泛应用。随后,课程将深入分子动力学模拟的基础知识,包括经验力场与第一性原理方法的对比,以及机器学习力场的兴起。实操部分将涵盖Linux系统操作、虚拟环境配置、Python开发环境的使用,以及LAMMPS和OpenMM等分子模拟软件的入门。
课程要点
1. 理论部分
o AI与科学的交叉:从大数据到AI4Science
o 科学研究的四范式
o 分子动力学模拟的基本方法与发展历史
o 经验力场与第一性原理方法的对比
o 机器学习力场的兴起与应用
2. 实操部分
o Linux系统与超算服务器的常规操作
o 虚拟环境(Anaconda/Mamba)的使用
o Python开发环境的配置与使用
o LAMMPS与OpenMM的入门与基本操作
o 量子化学计算软件的介绍与快速上手

第二天:机器学习力场模型设计与DeePMD应用
课程说明
第二天的课程将聚焦于机器学习力场的模型设计。理论部分将快速入门机器学习与深度学习,介绍神经网络的基本概念、发展历史及其在科学领域的应用。学员将了解AI模型在科学领域需要遵守的物理约束,以及高效描述局部环境的方法。实操部分将深入DeePMD系列软件的使用,包括安装、输入文件详解、常见功能与问题分析,以及如何结合LAMMPS进行高精度分子动力学模拟。
课程要点
1. 理论部分
o 机器学习与深度学习的快速入门
o 神经网络的基本概念与发展历史
o AI模型在科学领域的物理约束与对称性
o 基于描述符的机器学习力场模型(如HDNNPs、ANI模型)
o DeePMD系列模型的详解与应用
2. 实操部分
o DeePMD的安装与验证测试
o DeePMD输入文件的详解与超参数设定
o DeePMD的常见功能(训练、重启、冻结、压缩等)
o 综合使用LAMMPS与DeePMD进行分子动力学模拟
o 分子模拟数据的后处理与分析

第三天:等变模型与高阶机器学习力场
课程说明
第三天的课程将深入探讨等变模型及其在机器学习力场中的应用。理论部分将介绍等变模型的概念、分类与特点,特别是高阶等变模型在数据利用率和泛化能力方面的优势。学员将了解SO(3)群的基本概念及其在等变模型中的应用。实操部分将涵盖DeePMD的多GPU并行训练、LAMMPS的多GPU并行运行,以及如何使用Python代码可视化等变与不变设计的区别。此外,学员将学习如何使用NequIP模型复现高被引论文的结果。
课程要点
1. 理论部分
o 等变模型的概念、分类与特点
o 高阶等变模型的优势与应用
o SO(3)群的入门与张量积
o 欧式神经网络(E3NN)的介绍
o NequIP模型的详解与代码框架
2. 实操部分
o DeePMD的多GPU并行训练
o LAMMPS的多GPU并行运行
o 使用Python可视化等变与不变设计的区别
o NequIP模型的超参数设置与使用
o 复现Nat. Commun.文章结果

第四天:高效等变模型与通用大模型
课程说明
第四天的课程将聚焦于高效等变模型与通用大模型的应用。理论部分将介绍基于ACE的等变模型(如MACE模型)及其在多个领域的应用。学员将了解机器学习力场领域的“ChatGPT”模型,如MACE-OFF23和MACE-MP0,以及适用于大规模GPU并行的Allegro模型。实操部分将涵盖MACE与Allegro模型的超参数设置、DeePMD与MACE模型的对比,以及如何对通用大模型进行微调与分析。
课程要点
1. 理论部分
o 基于ACE的等变模型(MACE模型)
o 机器学习力场领域的通用大模型(MACE-OFF23、MACE-MP0)
o Allegro模型与SevenNet模型的介绍与比较
2. 实操部分
o MACE与Allegro模型的超参数设置与使用
o DeePMD与MACE模型的对比
o 通用大模型的微调与分析
o DPA-1与DPA-2模型的介绍与特点

第五天:综合应用与未来展望
课程说明
第五天的课程将综合前四天的内容,进行实际案例分析与未来展望。学员将通过实际案例,综合运用所学知识进行分子动力学模拟与数据分析。课程还将探讨机器学习力场领域的未来发展趋势,特别是如何通过AI技术推动科学研究的范式转变。最后,学员将进行课程总结与讨论,分享学习心得与未来研究方向。
课程要点
1. 综合应用
o 实际案例分析:结合LAMMPS与DeePMD进行复杂体系的分子动力学模拟
o 数据后处理与高质量科研绘图
o 机器学习力场在不同领域的应用案例
2. 未来展望
o AI for Science的未来发展趋势
o 机器学习力场在科学研究中的潜在应用
o 课程总结与讨论

本课程通过五天的密集学习,学员将全面掌握机器学习力场在分子动力学模拟中的应用,从基础理论到高级模型设计,再到实际应用与未来展望。课程内容丰富,理论与实践并重,旨在为学员提供该领域的前沿知识与实用技能,助力其在AI for Science时代的科学研究中取得突破。
机器学习第一性原理
Red jujube
第一天课程:理解第一性原理计算的基本理论框架,包括薛定谔方程、Hohenberg-Kohn定理、Kohn-Sham方程等核心概念。掌握机器学习在材料科学中的应用现状与发展趋势,了解当前领域内的前沿成果与挑战。
第一天上午
理论内容
介绍量子力学在材料科学中的应用及其重要性。
第一性原理计算的基本概念:从量子力学到材料性质的预测。
机器学习的兴起及其在科学研究中的应用。
机器学习在材料设计、性质预测和高通量计算中的应用案例。
当前机器学习技术在第一性原理领域的突破与挑战。
未来发展趋势:从数据驱动到智能设计。
典型案例分析:如催化剂设计、二维材料的高通量筛选等。
实操内容
Python环境搭建:Anaconda的安装与使用。
Jupyter Notebook的使用:代码编写、运行与调试的基本操作。
安装常用机器学习库:NumPy、Pandas、Matplotlib、Scikit-Learn等。
深度学习框架(PyTorch)的安装与环境配置。
安装第一性原理软件
第一天下午
实操内容
Python的基本语法:缩进、注释、变量命名规则。
数据类型详解:整数、浮点数、字符串、布尔值。
序列类型:列表、元组、集合的操作与区别。
映射类型:字典的创建、访问与修改。
条件语句:if-elif-else的使用场景与逻辑判断。
循环语句:for循环与while循环的语法与应用。
循环控制:break、continue、pass语句的作用与使用场景。
自定义函数:函数的定义、参数传递、返回值。
模块的导入与使用:标准库与第三方库的调用。
类与对象的基本概念:封装、继承、多态。
类的定义与实例化:属性与方法的使用。
面向对象的设计思想:如何通过类组织代码结构。
NumPy数组的创建与操作:数组的形状、索引、切片。
数学运算:矩阵运算、统计函数、随机数生成。
示例应用:数据标准化、矩阵变换等。
Pandas:数据分析利器
数据结构:Series与DataFrame的创建与操作。
数据处理:数据清洗、筛选、分组、聚合。
数据读写:CSV、Excel文件的读取与保存。
示例应用:材料数据的预处理与分析。
Matplotlib:数据可视化
基本绘图:折线图、柱状图、散点图的绘制。
第二天课程:熟练掌握第一性原理软件的使用方法,包括输入文件编写、任务提交、结果分析等。学会使用Python及其科学计算库(如NumPy、Pandas、Matplotlib)进行数据分析与处理。掌握机器学习库(如Scikit-Learn、PyTorch)的基本使用方法,能够搭建并训练简单的神经网络模型。
第二天上午
理论内容
讲解第一性原理计算:薛定谔方程、波函数与电子状态、Hohenberg-Kohn定理、Kohn-Sham方程、交换-相关泛函、晶格的周期性、平面波与平面波基组、
介绍VASP软件的基本操作和输入文件编写方法。
详细指导如何编写VASP的输入文件,包括INCAR、KPOINTS、POSCAR等。
演示如何提交VASP计算任务:命令行提交、作业调度系统提交、OSZICAR、OUTCAR
第二天下午
实操内容
使用Python实现批量计算任务的生成与提交。
高效计算流程:并行计算、分布式计算的优化。
结构优化结果分析:能量、晶格参数、原子位置的收敛性。
电子结构、力学性质、热学性质的计算与分析。
使用Matplotlib绘制能带图、态密度图等。
实战1:二氧化碳还原反应(CO₂RR)的催化剂设计、选择与催化剂性能相关的特征(如电子结构、表面性质等)、使用Scikit-Learn搭建线性回归、决策树等模型。通过交叉验证评估模型的预测性能。用机器学习预测二氧化碳还原催化剂的少特征模型
实战2:氧还原反应(ORR)和氧进化反应(OER)在能源存储中的重要性。从第一性原理计算结果中提取材料的电子性质和催化活性指标。基于物理直觉和机器学习算法选择关键特征。DFT和机器学习方法加速具有高ORR和OER催化活性的DMSCs的发现
第三天课程:学习高通量计算策略,掌握自动化脚本编写技巧,能够高效处理大规模计算任务。理解机器学习在材料性质预测中的应用,掌握特征工程、模型训练与验证的基本流程。
第三天上午
实操内容
pymatgen的功能与应用场景:从材料结构到计算文件的生成。
材料项目(Materials Project)数据库的访问与数据提取。
使用pymatgen获取晶体结构:通过材料ID或化学式查询。
批量下载结构数据:自动化脚本编写与数据管理。
批量生成计算文件:POSCAR、INCAR等。
自动化生成VASP输入文件。
编写Python脚本,从Materials Project下载一组材料的结构数据。
分析下载数据的格式与内容,提取关键信息(如晶格参数、原子位置等)。
使用pymatgen的API查询Materials Project数据库。
筛选特定条件下的材料数据:如元素组成、晶体结构类型等。
第三天下午
理论内容
介绍晶体结构与电子结构特点
晶体结构的基本概念:布拉维格子、空间群、对称性。
电子结构计算:能带计算流程、能带图的解读。
态密度分析:电子态密度的物理意义与计算方法。
电荷密度分析:电荷分布与材料性质的关系。
材料计算的特征工程
特征类型:空间特征(晶格参数、原子间距等)、拓扑特征(拓扑绝缘体的特征)、化学特征(元素组成、键合类型等)、物理特征(电子结构、力学性质等)。
统计特征与信息熵:如何从数据中提取统计信息。
领域特定特征的构建与优化:结合物理直觉与机器学习方法。
特征工程在材料计算中的重要性。
当前研究热点:如何通过特征工程提高机器学习模型的性能。
实操内容
实战3:VASP计算TiO2的电子能带结构和密度态、电荷密度、功函数
实战4:VASP和机器学习实现二维材料的高通量计算
第四天课程:掌握卷积神经网络、循环神经网络、图神经网络等深度学习模型的基本原理及其在材料科学中的应用。学会使用机器学习力场(如ML-FFs)结合分子动力学软件(如LAMMPS)进行复杂体系的模拟与分析。
第四天上午
理论内容
神经元的基本结构与功能。
常见激活函数:ReLU、Sigmoid、Tanh等。
前向传播与反向传播的基本原理。
网络结构设计:全连接层、卷积层、循环层。
CNN在图像识别中的应用。
RNN在序列数据处理中的优势。
GNN在材料科学中的应用:图结构数据的处理。
实操内容
PyTorch的基本功能与模块化设计。
构建简单的神经网络模型。
实战5:基于图神经网络的钠离子电池正极材料人工智能驱动设计
第四天下午
理论内容
讲解分子动力学模拟的基本原理
分子动力学的基本概念:牛顿运动方程的数值求解。
温度、压力与化学势的定义与计算:热力学量的统计计算方法。
微观状态与系综选择:NVT、NPT、NVE等系综的区别与应用场景。
时间步长与模拟精度的平衡:选择合适的模拟参数。
实操内容
实战6:如何通过机器学习力场提高分子动力学模拟的效率、力场的构建与训练:从第一性原理数据中训练机器学习力场模型、VASP-MD及机器学习力场计算:力场的构建与训练
实战7:AIMD在复杂体系中的应用与挑战、从头算分子动力学模拟AIMD后处理分析-轨迹分析:径向分布函数、扩散系数等。
第五天课程:通过实战案例,如催化剂设计、二维材料高通量计算等,巩固所学知识,提升解决实际问题的能力。学会使用开源工具(如pymatgen、matminer)获取材料数据,构建数据驱动的机器学习模型。
完成本课程后,学员将具备独立开展第一性原理与机器学习交叉研究的能力,能够运用所学知识解决材料科学中的实际问题,并为未来的研究工作奠定坚实的基础。
第五天上午
理论内容
LAMMPS输入文件的编写及任务提交
指导如何编写LAMMPS的输入脚本,并提交计算任务。
in文件基本语法:结合实例,讲解in文件常用命令
LAMMPS在材料科学中的应用现状与挑战。
当前研究热点:机器学习力场与LAMMPS的结合。
实操内容
实战8:如何通过机器学习势实现VASP与LAMMPS的无缝对接;PyXtal_FF的安装与配置:环境搭建与依赖安装;从VASP数据中训练机器学习势,并在LAMMPS中应用;通过LAMMPS模拟验证机器学习势的准确性。
第五天下午
实操内容
通过案例展示LAMMPS在模拟材料力学性能方面的应用-力学性能模拟:应力-应变曲线的计算:模拟材料的拉伸、压缩过程。弹性模量的计算:通过线性拟合应力-应变曲线得到弹性模量。断裂强度的模拟:分析材料在高应力下的断裂行为。
实战9:从第一性原理计算(如VASP)中提取数据:能量、力、应力等;数据清洗、归一化、划分训练集与测试集;使用机器学习框架(如Scikit-Learn、PyTorch)训练原子势模型;调整模型结构与超参数,提高模型的拟合能力和泛化能力;将训练好的模型导入LAMMPS,进行分子动力学模拟;比较模拟结果与第一性原理计算结果。
实战10:傅里叶定律与热扩散方程。分子动力学中的热导率计算:Green-Kubo公式与非平衡分子动力学方法;使用机器学习势(如MLIP)进行大规模分子动力学模拟;计算材料的热导率:通过模拟结果计算热流密度与温度梯度;编写LAMMPS输入脚本,使用机器学习势进行热导率计算。分析模拟结果,讨论材料的热导率与其微观结构的关系。
案例图片:




讲师介绍
机器学习分子动力学
主讲老师来自哈尔滨工业大学,拥有五年的讲学经验,主要擅长机器学习和分子动力学训练力场,对vasp,gromacs ,cp2k, qe,lammps,deepmd等软件有过多年的使用经验!
第一性原理
主讲老师来自国内高校,拥有扎实的理论知识和丰富的研究经验,参与多项国家自然科学基金面上项目。熟悉深度学习方法和第一性原理计算及相关软件的使用,具有丰富的编程经验,有深入的研究和优秀的成果。并在多个权威期刊上发表,至今他已经发表了40余篇SCI检索论文。授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂,受到学员们的一致认可和高度评价!
授课时间
机器学习分子动力学
2025.04.19——2025.04.20 (上午09:00-11:30 下午13:30-17:00)
2025.04.23——2025.04.24(晚上19:00--22:00)
2025.04.26——2025.04.27 (上午09:00-11:30 下午13:30-17:00)
机器学习第一性原理
2025.04.10——2025.04.11(晚上19:00--22:00)
2025.04.12——2025.04.13 (上午09:00-11:30 下午13:30-17:00)
2025.04.15——2025.04.18(晚上19:00--22:00)
培训费用
机器学习分子动力学 机器学习第一性原理
公费价:每人每个课程¥4980元 (含报名费、培训费、资料费)
自费价:每人每个课程¥4680元 (含报名费、培训费、资料费)
优惠福利:
福利一:同时报名两个课程¥9680元 报二赠一(含报名费、培训费、资料费)
参加一年课程价格:16680元 (含报名费、培训费、资料费)
福利二:现在报名一门赠送一门往期课程回放
报名两门赠送四门往期回放
优惠三:提前报名缴费学员可得300元优惠(仅限前15名)
报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销
1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿
2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握 3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答
授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!
学员对于培训给予高度评价

引用往期参会学员的一句话:



