本文选自期刊《机床与液压》2025
作者:王宏超,薛国庆,高艺源,孟凡念
来源:基于改进长短期记忆网络的AUV推进器故障诊断[J/OL].机床与液压,1-7[2025-12-01]
摘要
摘要:为解决由于水下环境复杂性、模糊性和随机性造成的水下自主航行器(AUV)推进器精准故障诊断难问题,基于长短期记忆网络并融合干扰抑制模块,提出一种称为卷积长短期记忆神经网络及干扰抑制注意力机制的混合诊断模型。该模型实现了长短期记忆网络与卷积神经网络的并行连接,从而实现同时捕获输入信号的时间相关、空间相故障特征信息;同时,在混合模型中引入一种新的线性整流函数以提高混合模型的抗干扰能力;最后,通过注意力机制在模型中的引入使其更好的关注关键融合特征,进一步提高混合模型的诊断性能。通过实验及对比研究证明所提出模型具有显著的抗干扰能力及优越性。
一、前言
AUV可以在没有人为干预的情况下自主完成各种任务,如海底地形测量、海洋生物调查、海底资源勘探和水下救援。由于存在海洋高压、腐蚀和复杂的环境干扰等极端条件,AUV的工作环境极其恶劣。一旦AUV推进器发生故障,由于恶劣的环境和维护难度,将给整个AUV带来无法估量的灾难。AUV推进器的安全性已成为AUV正常运行的最重要因素。对AUV推进器进行及时有效的故障诊断研究具有重要的安全和经济意义。
目前,AUV故障检测主要有两种方法:面向模型和基于数据驱动。前者通常依赖于人类经验和专家知识,另由于AUV现实操作环境的复杂性,为AUV开发准确的数学模型具有挑战性。相比之下,基于数据驱动的方法不需要预先建模可以通过学习和分析大量实际数据来提取故障特征,这对于AUV故障诊断的实际工程应用来说更加灵活可行。近年来,AUV出现了各种数据驱动的故障诊断方法。为了充分利用多源信息进行AUV故障诊断,Xia等提出一种有效基础编码-解码网络、注意力机制及多源数据融合的诊断方法:Yang等将宽卷积神经网络与极限学习机集成用于AUV故障诊断,其具有不依赖于域自适应算法或需要目标域信息的优点,Das等提出一种基于遗传算法与极限机器学习的AUV在线故障检测方法,Xia等将双向门控递归神经单元与多层感知网络结合,提出一种用于AUV推进器故障诊断的多尺度卷积神经网络模型,Chen等提出一种称为元自关注的多尺度卷积神经网络模型,其将振动信号的二维频谱作为模型输入成功用于AUV故障诊断,Gao等设计一种多头卷积自编码器,并利用估计扭矩作为模型的输入实现AUV推进器的无监督诊断:Chu等设计一种終端滑模观测器増强RNN的AUV推进器故障诊断方法:Gao等提出一种融合物理模型与生成对抗网络的AUV推进器故障诊断组合框架。
然而,上述方法大多是在稳定状态下进行测试的,没有充分考虑各种干扰因素和不同操作条件对诊断效果的影响。因为这些干扰和操作条件的变化可能会导致模型的适用性降低,从而大大降低诊断结果的准确性和可靠性。为了解决这个问题及受上述参考文献的启发,提出了一种基于混合深度神经网络学习模型(CLSTM-CNN-Attention)的AUV智能诊断技术。该模型巧妙地集成多个神经网络,可以同时提取输入信号的时间和空间特征,从而显著提高信号特征的利用率:此外,通过改进算法增强模型抑制相关干扰的能力,有效地解决了AUV在海洋环境中面临干扰造成的诊断效率低问题。本文基本贡献如下:
(1)在传统LSTM中串行引入卷积运算,提出卷积LSTM,即CLSTM。此外,在CLSTM的基础上,引入了一种新的线性校正函数,以进一步提高混合模型的抗噪能力。
(2)采用新的并行连接方式将CLSTM与CNN网络并行连接,以同时捕获输入信号的时间和空间故障特征。另引入了一种注意力机制,以更好地关注自主融合的关键特征,从而进一步提高诊断性能。
(3)该方法采用端到端策略,并通过实验和比较验证了其有效性及优越性。
二、基础理论
(一)集成模型子模块
混合模型由三个模块组成:CLSTM、CNN和Attention模块。LSTM是与循环神经网络(RNN)相关的增强版本,它有效地解决了RNN的梯度消失问题。LSTM可以捕获输入序列的演化时间模式和相关的距离依赖关系,增强序列之间的相关性,有效地提取输入序列的时间特征信息。在本研究中,使用了如图1所示的LSTM网络,其中门架构由三个不同的门组成:遗忘门、输入门和输出门。从图1可以看出,三个门产生的结果分别传输到乘法元件,以控制信息流的输入和输出的形式。本文在LSTM中预先应用卷积层来增强LSTM的抗干扰能力,并构建了CLSTM结构。CLSTM的相应数学表达式可以表示如下:
[Math Processing Error](1)
[Math Processing Error](2)
[Math Processing Error](3)
[Math Processing Error](4)
[Math Processing Error](5)
[Math Processing Error](6)
[Math Processing Error](7)
上式中,[Math Processing Error]代表卷积运算,[Math Processing Error]表示通过卷积输入数据获得的数据,[Math Processing Error]是时刻[Math Processing Error]存储单元的计算方法,[Math Processing Error]是时刻[Math Processing Error]存储设备系统单元的所有输出端,[Math Processing Error]和[Math Processing Error]分别表示权重值和偏置元素,[Math Processing Error]和[Math Processing Error]是激励函数,[Math Processing Error]、[Math Processing Error]和[Math Processing Error]分别是属于时刻[Math Processing Error]三个门的计算方法。
CNN模块是一种独特的深度前馈神经网络,可以有效避免全连接层引起的参数冗余。CNN模块主要由卷积层、池化层、激活层和密集层组成。这四层的功能是自动执行特征学习,而不依赖于任何先验知识。在所提出的方法的诊断过程中,一维振动数据被用作输入,因此使用了一维CNN。假设输入信号和滤波器分别由[Math Processing Error]和[MathProcessing Erron]表示,相应的卷积过程可以用以下方程表示:
[Math Processing Error](8)
式中[Math Processing Error]是偏置值,[Math Processing Error]是[Math Processing Error]层对应的线性激活后量,[Math Processing Error]是非线性激活函数,[Math Processing Error]是[Math Processing Error]层的输出特征。[Math Processing Error]表示卷积运算,[Math Processing Error]表示全零填充。[Math Processing Error]是指卷积处理后的特征向量,[Math Processing Error]是[Math Processing Error]层的输出特征,[Math Processing Error]是指[Math Processing Error]层核的大小,[Math Processing Error]表示卷积过程,[Math Processing Error]表示卷积处理[Math Processing Error]的计算过程,[Math Processing Error]表示层[Math Processing Error]的核,[Math Processing Error]是[Math Processing Error]层的信号。
在构建的混合模型中引入了一种名为ELU、具有正超参数的新线性校正函数,以提高其抗噪能力,ELU的函数表达式及其示意图分别如方程(9)和图2所示:图2所示的曲线图在负值区域具有较小的曲率,这使得模型更能适应负干扰的变化。因此,它可以提高模型对干扰的敏感性、提高在复杂海洋环境中的诊断准确性。
[Math Processing Error](9)
注意力模块是通过模仿人脑的机制构建的,在处理大量输入信息的同时,只选择一些关键的输入信息进行处理,从而提高了神经网络的效率。其计算可以表示如下
[Math Processing Error](10)
[Math Processing Error](11)
式中[Math Processing Error]是注意力得分函数,[Math Processing Error]、[Math Processing Error]及[Math Processing Error]代表网络内部的权重矩阵,[Math Processing Error]是注意力分布。
(二)融合深度学习模型及诊断流程
采用一种新的并联方法将上述三个子模块连接起来,构建混合模型,其结构如图3所示。这种连接方法不仅可以同时捕获输入信号的时间和空间故障数据,还可以更全面地提取特征。具体来说,受参考文献[12]的启发,设计的网络模型主要由两个独立的分支组成:图3的上部显示了构建的CLSTM(卷积长短期记忆网络)模型,而下部显示了CNN(卷积神经网络)模型。这两个分支可以独立运行而不会相互干扰,从而有效地同时提取输入信号的时间和空间故障特征信息。该设计方法大大提高了模型的运行效率,增强了网络的特征提取能力,为后续的故障诊断和预测提供了更丰富的信息基础。同时,它减少了特征损失,不需要对LSTM和CNN网络进行单独训练,从而节省了时间并简化了训练过程。此外,改进的[STM和CNN具有很强的表达能力,使模型能够更准确地描述输入信号中隐藏的故障特征,从而提高诊断性能:通过关注融合的时间和空间特征信息,可以为关键特征分配更高的权重,从而提高AUV推进器在干扰下的诊断精度。最后,使用SoftMax分类器对故障进行分类和诊断。
混合网络模型的构建及诊断具体流程如下:
步骤1:获取AUV推进器的振动信号,建立适合网络输入的数据集。
步骤2:通过在LSTM之前添加卷积层来构建CLSTM模块,以提高LSTM的抗干扰能力。
步骤3:ELU被内置到传统的CNN模块中,以提高混合模型对干扰的敏感性,并提高其在复杂海洋环境中的诊断准确性。
步骤4:根据图3,采用并联方法构建用于干扰抑制的混合模型,即CLSTM-CNN-Attention神经网络。
步骤5:将数据集随机划分为训练子集和测试子集,最后使用SoftMax实现诊断分类。
实验运行环境的具体配置如下:操作系统为Windows11,中央处理器为Intel Corei5-12500H,编程环境基于Python 3.6的Tensorflow框架。
三、实验验证
(一)实验描述
在放置在静态水箱中的AUV推进器上安装振动传感器进行信号采集,DH5902N型数据采集系统用于存储这些振动信号。数据采样参数设置如下:推进器转速为3000r/min,采样频率设置为12800Hz,采样长度设置为10s。模拟5种运行状态(不平衡-Unbalance、缠绕-Entangle、溜槽松动-Chute Loose、正常-Normal和双叶不平衡-futaba Unbalance),并收集了相应的信号。实验平台如图4所示,其中标签0-4分别对应不平衡、缠绕、溜槽松动、正常和双叶不平衡五种运行状态。需要注意的是,不平衡(图4中记为0)是通过在叶片上系一根绳子带来模拟的,双叶不平衡(在图4中标记为4)是通过分别在两个叶片上系两根绳子带来仿真的。
众所周知,复杂的海洋环境中有许多干扰因素,包括海洋声、生物噪声、地震噪声、降雨噪声等自然干扰。人为干扰包括来自导航、工业、钻井和其它来源噪声。在参考文献[13]中,对这两种类型的干扰进行了总结,发现绝大多数干扰的范围在0-150分贝(dB)之间,其中纹理噪声中的高斯噪声是模拟自然和人为干扰的最有效方法。在海洋环境中,来自各种来源的噪声(如波浪活动、风速变化等)通常表现出近似高斯分布的特征。因此,使用高斯噪声可以合理地模拟在特定条件下可能出现的海洋背景噪声。因此,我们通过2dB、10dB、50dB、100dB、150dB和None六种不同的信噪比进行相关实验验证。
(二)结果分析
抗干扰能力分析:将所提出的混合模型的分析结果分别与WDCNN、LSTM和CNN进行比较,以验证其优势。WDCNN是一种经典的深度卷积神经网络模型,其特点是使用宽核设计,可以有效地掌握输入信号的全局特征。此外,WDCNN还具有良好的噪声抑制能力,在处理噪声数据时可以保持高精度和鲁棒性。此外,将收集到的未处理的振动数据用作输入。训练数据集和测试数据集被随机划分,共获得1380个训练样本和590个测试样本。应该指出的是,对所有四种方法进行了10次实验,以消除偶然误差。图5显示了六种不同信噪比水平下每个模型的实验结果。通过比较,可以发现所提出的方法取得了最佳结果:在没有噪声影响或信噪比相对较高,即150dB时,所提出方法的诊断精度能够获得高分。当信噪比极小,即2dB时,所提出方法的诊断精度仍可达95.96%。在上述两种极端信噪比方面,所提出的方法的结果均优于其它三种方法,验证了所提出的办法具有良好的干扰抑制能力。
收敛速度分析:智能诊断模型的收敛速度是评估其质量的重要标准之一。对50dB信噪比下的精度曲线(ACC)和损耗曲线(loss)进行了可视化比较分析,以验证所提出模型的优越性。相关的实验结果可以参考图6和图7,在此基础上可以注意到,所提出的方法在60次选代后达到了最高的精度和最低的损失,其收敛速度也优于其它三种方法,即在60次重复后首先达到稳态。
稳定性性能分析:进行多次实验以确认所建模型的稳定性:图8显示了每种模型在50dB信噪比下的多次实验的稳定性雷达图。由此可知,所提出的方法在众多实验中取得了最稳定的结果,并且误差最小。具体来说,所述方法的平均准确率为99.66%,使平均准确率提高了20,29%。与WDCNN方法和CNN方法相比,准确率分别提高了20.69%和47.25%。这进一步意味着所提方法具有更强的抗干扰能力。
分类精度分析:图9显示了50dB信噪比下各种方法的三维混淆矩阵。通过混淆矩阵,可以清楚地看到每种故障的分类准确性和误分类准确性。其中,主矩阵对角线对应每种故障的分类精度,而主对角线的两侧对应每种故障的误分类精度,混淆矩阵中的颜色深度对应于图右侧的精确颜色条,可以更直观地反映分类精度。基于图9所示的结果,所提出的方法在分类准准确性和误分类方面都表现出了出色的有效性。
图10显示了四种方法的最终层输出的可视化结果。值得注意的是,所提出的方法能够有效地将目标样本聚集在一起,并具有良好的可分离性。这进一步验证了所提出的方法在提取和表示分类信息方面的有效性。
四、结论
本研究提出了一种称为CLSTM-CNN-Attention的干扰抑制故障诊断方法,以解决复杂海洋环境干扰引起的AUV推进器故障诊断效果不佳的问题。该方法利用一种新的并行连接策略,同时获得输入数据的时间和空间故障信息。同时,引入了一种新的线性校正函数来增强模型的抗干扰性。此外,通过Attention模块,可以更加关注融合信息中的重要特征,进一步提高诊断准确性。通过相关测试,证明所提出的方法在抑制复杂海洋环境的干扰方面取得了显著成果,在低信噪比(即2dB)的情况下,诊断准确率分别为95.96%和95.67%,优于其他比较方法。这为在复杂海洋环境干扰下诊断AUV故障提供了一种新方法。
然而,值得注意的是,尽管该方法取得了良好的效果,但通过纹理噪声中的高斯噪声进行模拟并不能完全模拟真实复杂海洋环境的干扰。因此,在未来的研究中,计划获得实际海洋环境中的相关信号,以更准确地模拟实际环境,从而提高所提出方法的实用性和可靠性。此外,样本量不足和标记数据稀缺往往限制了模型的性能。因此,可以引入半监督学习或无监督学习的相关思想来解决实际环境中数据标注成本高或难以获得的挑战。
五、参考文献
声明:本公众号相关内容均来自主流媒体及公众号,非商业用途,并不意味着赞同其观点或证实其内容的真实性。版权归原作者所有,如有发现侵犯您的权益,请后台联系编辑,我们会尽快删除相关侵权内容。

