大数跨境
0
0

CMAME | 西安交通大学海春龙、梅立泉等:基于分层神经网络的在线多保真度数据融合

CMAME | 西安交通大学海春龙、梅立泉等:基于分层神经网络的在线多保真度数据融合 力学与人工智能
2025-12-15
0
基于分层神经网络的在线多保真度数据融合
Online multi-fidelity data aggregation via hierarchical neural network
海春龙1,王嘉珍1,郭士民1,钱炜祺2,梅立泉1,*
1.西安交通大学数学与统计学院
2.中国空气动力研究与发展中心
引用格式:
Hai C, Wang J, Guo S, Qian W, Mei L. Online multi-fidelity data aggregation via hierarchical neural network[J]. Computer Methods in Applied Mechanics and Engineering, 2025: 117795.

摘要

在许多需要计算建模的工业应用中,高保真数据的获取往往受到成本和技术限制,而低保真数据虽然获取成本较低且更容易获得,但其准确性不足。多保真度数据聚合技术通过结合两种类型的数据来构建代理模型,从而在建模准确性和数据成本之间取得平衡。优化高保真样本的布置与分布对于提升模型性能也至关重要。本研究提出一种基于分层神经网络的在线多保真度数据融合方法(OMA-HNN)。该方法包含两个关键组成部分:基于分层神经网络的多保真度数据融合(MA-HNN)以及在线渐进采样框架。MA-HNN在分层网络结构中整合不同保真度的数据,利用非线性组件捕捉多保真度层级间的差异。在线渐进采样框架通过两个阶段管理高保真数据的获取:初始采样和增量采样。针对这两个阶段,我们分别为初始阶段开发了低保真代理辅助采样(LAS)策略,为增量采样阶段开发了基于模型差异的主动学习(MDAL)策略。OMA-HNN在涵盖多种多保真度场景的15个数值算例中进行了严格测试,并通过三个实际应用案例进一步验证。结果表明该方法具有显著的有效性和实用性,凸显了OMA-HNN在工业场景中提升多保真度数据聚合可靠性与效率的潜力。

一、研究背景

在工业工程、空气动力学、能源系统等复杂场景中,获取高保真(High-Fidelity,HF)数据往往成本高昂,而低保真(Low-Fidelity,LF)数据虽然廉价,但准确性有限。如何在 有限 HF 数据成本下构建高精度代理模型(surrogate models) 已成为当前工程建模领域的重要难题。以飞机气动设计为例:HF数据如 Navier-Stokes精细网格仿真或实验风洞测试,准确但昂贵。LF数据粗网格、简化物理模型、快速计算,快但偏差大。因此,“如何融合多保真数据发挥各自优势”成为模型构建的关键。然而,传统多保真方法仍存在高保真样本过少导致模型精度难以提升、不同保真度间的差异复杂难以统一处理,高保真采样策略不合理,会浪费计算资源。针对以上问题,本文提出了OMA-HNN(Online Multi-Fidelity data Aggregation via Hierarchical Neural Network)框架,实现:多保真数据的高效融合,高保真样本的智能在线选择,代理模型精度与鲁棒性双提升。

二、研究方法

论文提出的 OMA-HNN 框架由两大核心部分组成:
2.1 MA-HNN:基于层级神经网络的多保真数据融合
MA-HNN 的核心思想是将高保真模型表示为低保真模型的线性部分 + 非线性残差部分:
模型网络结构如下图所示: 
图1.MAHNN结构示意图
在该网络中各低保真度数据集各自训练独立的NN,融合部分的线性网络负责捕捉LF到HF的线性映射,而线性映射未能拟合的HF输出残差则使用RBFNN进行训练。该模型结构通过先线性映射再残差建模的方式提高稳定性,并使用RBFNN的平滑建模来提升预测能力。
2.2 在线渐进采样:LAS+MDAL双策略
HF 样本贵,预算有限时,“采得好”比“采得多”更现实。
1)LAS:低保真代理辅助初始采样(Low-Fidelity Surrogate Assisted Sampling)
基于高低保真度间模型趋势具有相关性的假设,可以利用低保真度数据信息来指导高保真度样本的初始采样。图2展示了该思路的概念图。

图2.LAS概念图
具体而言,利用LF(代理)模型输出范围的“边界值”作为高价值样本判断依据,提高样本的代表性;并通过将设计空间划分为网格,在选中网格中以随机采样的方式来提高样本分布的多样性。所选初始高保真度样本兼顾信息效用和分布鲁棒性,为后续建模打好基础。
2)MDAL:基于模型差异的主动学习增量采样(Model-Divergence based Active Learning
引入仅对HF数据进行建模的GPR模型,假设高保真度样本可以不停增加,则MAHNNGPR都将收敛到HF模型。鉴于此,通过快速降低MAHNNGPR之间的误差作为主动学习的采样依据,并结合样本距离的度量来提高样本分布均匀性,从而强化都模型不确定、高非线性和稀疏样本区域的采样。从而实现HF数据的最优利用。
结合所有设计部件的完整方法框架如下:
3.OMA-HNN框架

三、结果与分析

首先该方法在15个数值算例上进行了对比实验测试,与多个对比方法对比后,OMA-HNN表现突出。在文章使用的NRMSEMAE指标上实现了显著的误差降低。随着HF样本数量的增加,OMA-HNN提升效果最优。并且通过消融实验证明了采样方法的作用,下图展示了其中一个算例上的典型可视化结果:
4.a) Six-hump camel函数 bMA-HNN模型对比c)OMA-HNN模型对比
可以看出,加入采样方法后的完整模型(图4.c)显著提升了拟合精度。
另外,在基于NACA0012翼型构建的多保真度数据集上进行了应用。其中设计变量为攻角与雷诺数,目标变量是翼型升阻比系数。
5.翼型升阻比数据及相关可视化
图5(a)和(b)展示了某相同攻角和雷诺数下的仿真翼型周向压力场,高保真度仿真结果更加细腻。图5(c)展示了所有70个采样点上的HF和LF升阻比数据,两个保真度间有趋势相关性,但数据差异较大,构成了典型的多保真度建模挑战。
6. OMA-HNN 应用于 NACA0012 升阻比数据集的典型建模结果
图6(a)和(b)分别展示了使用完整的方法和仅使用模型的建模可视化结果,与图5(c)进行对比可以看出,OMA-HNN展示出了更好的建模结果。
四、结论
本文提出的 OMA-HNN 框架由分层模型MAHNN和两个采样方法LAS和MDAL组合而成。MAHNN结构清晰,通过结合线性基础映射和残差补偿的方式来充分利用神经网络的拟合能力,提高建模可靠性。首次在多保真度代理建模中引入了低保真度辅助的初始采样LAS,并结合MDAL作为序贯采样来提高数据效率。并通过大量的数值和应用验证了方法在强非线性、稀疏高保真度场景中的有效性。该方法在未来的工程仿真、复杂系统建模、数值优化等领域具有广泛应用潜力。
原文下载:

Online multi-fidelity data aggregation via hierarchical neural network.pdf

注:文章由作者原创供稿,并获得作者授权发布。






力学与人工智能”开通了知乎CSDN,更多精彩内容放送,更灵活的评论区互动,敬请关注











END



编辑:赵书乐
审核:张伟伟













【声明】内容源于网络
0
0
力学与人工智能
本公众号由西北工业大学流体力学智能化国际联合研究所管理,旨在推动从事智能流体力学方向的专家学者之间的交流合作。实时推送力学与人工智能相关的科技、学术进展信息。欢迎关注交流!也欢迎各位同行投稿!(点击菜单栏投稿须知查看详细投稿要求和投稿方式
内容 575
粉丝 0
力学与人工智能 本公众号由西北工业大学流体力学智能化国际联合研究所管理,旨在推动从事智能流体力学方向的专家学者之间的交流合作。实时推送力学与人工智能相关的科技、学术进展信息。欢迎关注交流!也欢迎各位同行投稿!(点击菜单栏投稿须知查看详细投稿要求和投稿方式
总阅读13
粉丝0
内容575