☝点击图片查看培训详情,免费报名。
Part 1
背景介绍
MedeA中MLP&MLPG机器学习力场模块能结合第一性原理计算构建训练集,对局部化学环境描述,从而训练机器学习力场。经过训练的MLP力场能适用于基于训练集的较多构型,且计算精度与第一性原理计算精度保持一致。ACE势函数被认为是目前比较完整的、兼顾精度、效率、泛化能力的机器学习势函数之一,其在特殊情况下包含了多种其它方法如Gaussain Approximation Potential,SNPA,MTP。本算例中采用MedeA MLPG中Atomic Cluster Expansion(ACE)势函数训练生成Ti机器学习力场。
使用模块:
MedeA Environment
MedeA MLP&MLPG
Part 2
实操案例
01
给定的训练集
File → Fitting Data Manger → Ti-trainingset.fts(提供的) → Open
02
MLPG-Ti-力场训练
Jobs → New Job,显示流程图面板
点击右侧MLP Generator,流程图中加上MLP Generator组件
双击MLP Generator,设置相关参数:
• Training Set:XX/Desktop/Structure/ Ti-trainingset.fts(Ti-trainingset.fts具体位置)
• Type of machine-learned potential:ACE(选择ACE作为机器学习势函数)
• Global cutoff,近邻原子列表的载断距离,默认6 Å。注意:需要测试不同截断距离保证计算精度与速率的平衡
• Number of functions,每个元素采用多少个函数用来描述势场,用于微调训练精度与效率。
• Minimum relative change in loss for training set与Minimum relative change in loss for validation set,拟合收敛标准,达到两条收敛标准势函数拟合结束。
• Minimum number of iterations与Maximum number of iterations ,最大/最小训练次数。
• Relative weight of forces,训练过程中,力相对于能量的权重。默认是0.3,但是可以通过微调力的权重获得更好的拟合结果。
• Fraction of data to use as test set,测试集的比例,默认0.1,一般不需要调整、
• Run on,默认在CPU上训练,也可选择在GPU上训练
点击Advanced面板:
• Refine potential, 用于重新拟合已存在的势函数。已存在的势函数可以跟新的势函数是同一个训练集,也可以是新势函数训练集的子集。
• Batch size,用于评估损失函数的batch size,也能控制拟合过程使用的内存大小。如果拟合时存在内存不足的问题,可以将数值从10调整到6.
• Manually set inner cutoff,排斥项的截断距离,在距离过近的原子之间增加惩罚能量项
• L1-regularization coefficient,L2-regularization coefficient,正则化系数,防止过拟合的超参数,提升泛华能量,使势函数预测更平滑稳定。
• Manual seed for random numbers,随机种子
• Weighting scheme,权重机制,默认是Uniform。可选为Energy机制,此时,高能量结构的权重是降低,拟合过程将集中在平衡结构或接近平衡的结构。当训练集中高能量结构且需要考虑这些高能结构时,Uniform机制会更好,并且不会导致势函数训练的质量。
• Create active set inverted from training set,生成一个针对训练集的主动集反演文件(.asi)。该文件用于在拟合数据管理器中检查最优设计,或对创建的势函数使用LAMMPS进行外推分析。
点击Potential definition,可以对ACE势函数模型进行设置:
• Embedding,Bonds,修改ACE势函数定义。
点击OK,返回主流程图。
修改Job title,点击Run,设置队列及核数,提交作业计算
03
结果分析
3.1 Job.out分析
第一部分:重点计算参数
第二部分:拟合结果,包含能量、力、应力等
生成的力场文件为Stage目录下Ti-trainingset.frc
注意:如果需要使用该力场,下载.frc文件并放置在MD/data/Forcefields/custom路径下。计算时通过Forcefields→Open,选择保存的力场即可。
3.2 图形分析
点击对应Job序号,进入MLPG-Ti-training set作业中,点击Stage_1;图形文件在Other files in ./Stage_1中
Energy_DFT_vs_MLP.png,Forces_DFT_vs_MLP.png:DFT计算能量、受力与MLP预测能量、受力之间的相关性。在斜率为1的拟合线附近的值,表示误差较小,力场精度较高。
Energies_Difference_DFT_vs_MLP.png,Forces_Difference_DFT_vs_MLP.png:MLP与DFT计算能量、受力偏差。
Energy_Error_Distribution_TrainingSet.png,Forces_Error_Distribution_TrainingSet.png:MLP预测能量、受力的误差直方图。算例误差以0为中心分布。
在测试集上的能量、受力误差分布直方图如下:
-END-
源资科技VASP媒体平台

