精度、效率与泛化能力兼顾的Atomic Cluster Expansion机器学习势函数



精度、效率与泛化能力兼顾的Atomic Cluster Expansion机器学习势函数

源资科技VASP

2025-09-02

导读：钛，Atomic Cluster Expansion，原子团簇展开，机器学习势函数

☝点击图片查看培训详情，免费报名。

Part 1

背景介绍

MedeA中MLP&MLPG机器学习力场模块能结合第一性原理计算构建训练集，对局部化学环境描述，从而训练机器学习力场。经过训练的MLP力场能适用于基于训练集的较多构型，且计算精度与第一性原理计算精度保持一致。ACE势函数被认为是目前比较完整的、兼顾精度、效率、泛化能力的机器学习势函数之一，其在特殊情况下包含了多种其它方法如Gaussain Approximation Potential，SNPA，MTP。本算例中采用MedeA MLPG中Atomic Cluster Expansion（ACE）势函数训练生成Ti机器学习力场。

使用模块：

MedeA Environment
MedeA MLP&MLPG

Part 2

实操案例

给定的训练集

File → Fitting Data Manger → Ti-trainingset.fts（提供的） → Open

MLPG-Ti-力场训练

Jobs → New Job，显示流程图面板

点击右侧MLP Generator，流程图中加上MLP Generator组件

双击MLP Generator，设置相关参数：

• Training Set：XX/Desktop/Structure/ Ti-trainingset.fts（Ti-trainingset.fts具体位置）

• Type of machine-learned potential：ACE（选择ACE作为机器学习势函数）

• Global cutoff，近邻原子列表的载断距离，默认6 Å。注意：需要测试不同截断距离保证计算精度与速率的平衡

• Number of functions，每个元素采用多少个函数用来描述势场，用于微调训练精度与效率。

• Minimum relative change in loss for training set与Minimum relative change in loss for validation set，拟合收敛标准，达到两条收敛标准势函数拟合结束。

• Minimum number of iterations与Maximum number of iterations ，最大/最小训练次数。

• Relative weight of forces，训练过程中，力相对于能量的权重。默认是0.3，但是可以通过微调力的权重获得更好的拟合结果。

• Fraction of data to use as test set，测试集的比例，默认0.1，一般不需要调整、

• Run on，默认在CPU上训练，也可选择在GPU上训练

点击Advanced面板：

• Refine potential, 用于重新拟合已存在的势函数。已存在的势函数可以跟新的势函数是同一个训练集，也可以是新势函数训练集的子集。

• Batch size，用于评估损失函数的batch size，也能控制拟合过程使用的内存大小。如果拟合时存在内存不足的问题，可以将数值从10调整到6.

• Manually set inner cutoff，排斥项的截断距离，在距离过近的原子之间增加惩罚能量项

• L1-regularization coefficient，L2-regularization coefficient，正则化系数，防止过拟合的超参数，提升泛华能量，使势函数预测更平滑稳定。

• Manual seed for random numbers，随机种子

• Weighting scheme，权重机制，默认是Uniform。可选为Energy机制，此时，高能量结构的权重是降低，拟合过程将集中在平衡结构或接近平衡的结构。当训练集中高能量结构且需要考虑这些高能结构时，Uniform机制会更好，并且不会导致势函数训练的质量。

• Create active set inverted from training set，生成一个针对训练集的主动集反演文件（.asi）。该文件用于在拟合数据管理器中检查最优设计，或对创建的势函数使用LAMMPS进行外推分析。

点击Potential definition，可以对ACE势函数模型进行设置：

• Embedding，Bonds，修改ACE势函数定义。

点击OK，返回主流程图。

修改Job title，点击Run，设置队列及核数，提交作业计算

结果分析

3.1 Job.out分析

第一部分：重点计算参数

第二部分：拟合结果，包含能量、力、应力等

生成的力场文件为Stage目录下Ti-trainingset.frc

注意：如果需要使用该力场，下载.frc文件并放置在MD/data/Forcefields/custom路径下。计算时通过Forcefields→Open，选择保存的力场即可。

3.2 图形分析

点击对应Job序号，进入MLPG-Ti-training set作业中，点击Stage_1；图形文件在Other files in ./Stage_1中

Energy_DFT_vs_MLP.png，Forces_DFT_vs_MLP.png：DFT计算能量、受力与MLP预测能量、受力之间的相关性。在斜率为1的拟合线附近的值，表示误差较小，力场精度较高。

Energies_Difference_DFT_vs_MLP.png，Forces_Difference_DFT_vs_MLP.png：MLP与DFT计算能量、受力偏差。

Energy_Error_Distribution_TrainingSet.png，Forces_Error_Distribution_TrainingSet.png：MLP预测能量、受力的误差直方图。算例误差以0为中心分布。

在测试集上的能量、受力误差分布直方图如下：

-END-

源资科技VASP媒体平台

【声明】内容源于网络

源资科技VASP

1234

内容 1464

粉丝 0

源资科技VASP 1234

总阅读1.1k

粉丝0

内容1.5k