大数跨境
0
0

IEEE Transactions on Cybernetics-2025年11月-最新在线出版论文12篇(2)

IEEE Transactions on Cybernetics-2025年11月-最新在线出版论文12篇(2) AI新文
2025-11-27
0

由于微信公众号开始试行乱序推送,为了让您在第一时间获取AI新文,请将"AI新文"设为星标。


事件触发联合强化广义学习在直升机群系统智能故障诊断中的应用

原标题:Event-Triggered Federated Reinforcement Broad Learning for Intelligent Fault Diagnosis in Uncrewed Helicopter Swarm Systems

作者:Li Guo; Juanjuan Chen; Runze Li; Bin Jiang

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:由于其固有的复杂性、动态操作环境和任务的高风险性,未包覆直升机群系统的智能故障诊断是一个关键挑战。为了解决这些挑战,本文提出了一种新的事件触发联邦强化广义学习(ET-FRBL)框架,旨在提高无缠绕直升机群系统故障诊断的可靠性、安全性和效率。该框架集成了联合学习(FL)以确保数据隐私和协作学习,强化学习(RL)以实现动态条件下的自适应决策,以及广泛学习系统(BLS)以实现快速知识扩展和故障模式识别。此外,引入了事件触发机制,通过在协作诊断之前在每个未穿衣服的直升机上实现局部故障诊断,来优化通信效率和计算资源利用率。为了验证所提出的方法,开发了一个用于无缠绕直升机群系统的硬件在环(HIL)故障仿真平台,能够模拟各种故障场景,包括执行器和传感器故障。大量实验结果表明,与最先进的方法相比,ET-FRBL框架在诊断准确性方面具有优越的性能。


原文链接



时变时滞非线性马尔可夫切换MAS的多速率采样模糊一致性控制:一种椭球吸引域约束方法

原标题:Multirate-Sampled Fuzzy Consensus Control for Nonlinear Markov-Switched MASs With Time-Varying Delays: An Ellipsoidal Attraction-Region-Constrained Method

作者:Pratap Anbalagan; Mohammad Jafar Mokarram; Zhan Shu; Tingwen Huang; Yukang Cui

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:研究了具有时变时滞的非线性马尔可夫切换多智能体系统(MAS)的均方可达集(RS)一致性,其中首次在一般不确定半马尔可夫变换(GUST)切换拓扑下设计了多速率采样数据一致性(MRSDC)控制方案。首先,通过应用Takagi–Sugeno(T–S)模糊建模技术,将非线性马尔可夫切换MAS转换为拟线性子系统,其中基于GUST的马尔可夫模型描述了所有代理之间通信网络拓扑的运行模式和突变。其次,开发了一种非周期MRSDC控制策略,通过自适应调整某些传感器的采样速率,将其采样频率降低到单个速率阈值以下,从而增强灵活性并提高一致性性能。此外,引入了一个新的自由加权积分不等式来处理具有时变时滞界的积分二次项。随后,利用非周期多速率采样和时变延迟特性,设计了适当的环边Lyapunov泛函。其次,通过将构造的Lyapunov泛函与所提出的积分不等式和改进的互凸组合不等式相结合,得到了线性矩阵不等式(LMI)形式的充分条件。这些条件不仅确保了所得到的MAS的均方无铅一致性,而且还保证了在MRSDC方案下,所有可达态都保持在椭球吸引相似区域内。最后,通过数值验证,验证了所提出的使用互连单连杆机器人臂系统(SLRAS)的MRSDC控制策略的有效性,而比较数值例子进一步说明了所提出方法的优越性。


原文链接



基于HSMS的多智能体系统追逃微分对策的事件触发自适应动态规划

原标题:HSMS-Based Event-Triggered Adaptive Dynamic Programming for Pursuit–Evasion Differential Games of Multiagent Systems

作者:Haoyan Zhang; Yingwei Zhang; Xudong Zhao; Chun-Yi Su

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:研究了多智能体系统(MAS)的追逃微分对策(PEDG)的分布式近似最优控制问题。最初,追赶者智能体和逃避者智能体之间的交互使用分治代数图方法来表示,其中所有智能体都希望与其队友保持一致性。随后,引入状态事件触发机制(ETM)来节省通信资源。同时,构造了包含局部邻域误差的聚合物递阶滑模面(HSMS),从而提高了系统响应速度。为了增强团队协作,设计了一种新的动态目标分配算法来执行追踪器之间的合理分配。此外,基于单关键神经网络(NN)结构的自适应动态规划(ADP),通过求解耦合的Hamilton–Jacobi–Bellman(HJB)方程,进一步设计了基于HSMS的事件触发最优控制策略。最后,在典型的两个追踪器-两个逃逸者场景中进行了仿真,以验证所提出的控制方案的有效性。


原文链接



软驱动连续机器人双闭环自适应位置控制方法

原标题:Double Closed-Loop Adaptive Position Control Method for Continuum Robot With Soft Drives

作者:Shiying Zhao; Qingxin Meng; Xuzhi Lai; Jinhua She; Edwardo F. Fukushima; Min Wu

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:连续机器人(CR)由于其良好的变形能力,在复杂环境中显示出巨大的潜力。对于实际应用,CR的位置控制是一个重要的研究领域。CR的常见驱动器是具有成熟控制方案的刚性电机。然而,刚性电机的驱动力通常是冲击性的,这可能会在相互作用期间引起安全问题。基于气动软致动器(PSA)的软驱动可以为CR机器人本体提供柔顺的驱动力来解决这一问题,但需要综合考虑软驱动和机器人本体的控制。本文以具有软驱动的CR为研究对象,提出了一种双闭环自适应位置控制方法来实现CR的终点位置控制。基于分段常曲率(PCC)方法建立了机器人本体的运动学模型,并从三元模型导出了软驱动的静态模型。基于这些模型,我们提出了一种双闭环自适应位置控制方法。内环用于控制软驱动的位移,外环结合端点位置控制和非奇异快速终端滑模函数,基于内环自适应控制端点位置。利用李雅普诺夫方法,证明了端点位置误差的收敛性。通过实验验证了该控制方法的有效性。


原文链接



Caformer:从因果关系的角度重新思考时间序列预测

原标题:Caformer: Rethinking Time-Series Forecasting From Causal Perspective

作者:Kexuan Zhang; Xiaobei Zou; Gary G. Yen; Yang Tang; Jürgen Kurths

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:时间序列预测被认为是一项关键任务,在各个领域都有广泛的应用。然而,有效地捕获非平稳时间序列中的跨维和跨时间相关性仍然是一个重大挑战,特别是由于环境因素的混杂效应。这些因素通常会引入虚假的相关性,从而掩盖有意义的时间特征的学习。本文提出了一种基于因果推理(识别因果关系的科学)的时间序列预测新框架Caformer(Caformal Transformer)。该框架由四个关键模块组成:动态学习器、环境学习器、时间学习器和分解学习器。动态学习者发现特征之间的动态交互来建模跨维依赖,而时间学习者在因果约束下推断跨时间依赖。环境学习器与分解学习器一起提取环境因素,并应用后门调整来减轻对时间序列的混淆影响。大量实验表明,Caformer在长期和短期预测方面都达到了最先进的性能。与PatchTST相比,它在交通数据集上实现了26.2%的均方误差(mse)减少,在电力数据集上达到了21.8%,在八个长期基准测试中获得了一致的收益。在M4数据集上,Caformer在所有15个短期预测类别中排名第一。除了强大的预测准确性外,Caformer还提供了对所学依赖性的可解释见解。


原文链接



智能电网攻击和故障少发分类的学习匹配原型

原标题:Learning to Match Prototype for Few-Shot Classification of Attacks and Faults in Smart Grids

作者:Kaiyao Miao; Meng Zhang; Kai Chen; Yuanzhi Li; Xiong Zhan; Xiaohong Guan

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/21

摘要:高级计量基础设施的快速部署有助于在智能电网中开发数据驱动的攻击检测方法,这些方法通常依赖于大量标记的数据进行训练。然而,当新类型的攻击或故障出现时,安全分析人员可能仅拦截有限的恶意样本。样本的稀缺性使得数据驱动方法很难学习有效的决策边界,从而导致检测性能下降。在这项工作中,我们通过从有限的样本中学习类原型表示,并学习将未标记的样本与相应的原型进行匹配,来弥合差距。具体来说,我们提出了一个基于元学习的框架,称为学习匹配原型(L2MP),该框架由原型网络(ProtoNet)组成,该原型网络通过聚合标记样本的特征来学习原型表示,以及一个匹配网络,该匹配网络评估未标记样本和用于分类的原型之间的匹配程度。通过设计用于模拟少数镜头设置的情节训练,L2MP学习适应新的攻击和故障类型,每个类只有几个样本。此外,我们利用双层优化策略来确保两个网络的有效训练。对智能电网数据集的大量案例研究表明,L2MP在苛刻的学习条件下实现了稳健的性能,并在实际场景中具有实用价值。


原文链接



扰动下单调博弈中基于规定时间分布积分滑模的最小范数纳什均衡搜索

原标题:Prescribed-Time Distributed Integral Sliding-Mode-Based Least-Norm Nash Equilibrium Seeking in Monotone Games Under Disturbances

作者:Jinyang Rui; Lei Ding; Maojiao Ye; Boda Ning

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/20

摘要:研究了受未知和时变扰动影响的单调对策的规定时间分布鲁棒纳什均衡搜索问题。首先,引入一个具有指定时间衰减参数的正则化项来补偿单单调博弈中强单调性的缺失。基于正则化技术,针对具有未知但有界扰动的单调博弈,提出了一种新的基于规定时间符号的分布式纳什均衡搜索算法,该算法结合了积分滑模方法、领导者跟随一致性协议和梯度算法。然后,为了处理扰动的未知界,设计了一种基于规定时间分布的自适应积分滑模纳什均衡搜索策略。在所提出的策略的基础上,得到了一些充分条件,以保证参与者的行为能够在规定的时间内收敛到单调对策的最小范数纳什均衡。最后,对玩家网络的最小距离编队控制进行了数值仿真,验证了所提出的搜索策略的性能。


原文链接



执行器故障的人在回路多智能体系统的最优定时控制

原标题:Optimal Fixed-Time Control for Human-in-the-Loop Multiagent Systems With Actuator Faults

作者:Liang Cao; Yushan Cen; Tieshan Li; Hongjing Liang; Yingnan Pan

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/19

摘要:针对执行器故障,研究了人在回路(HiTL)多智能体系统(MAS)的最优定时跟踪控制方案。为了适应各种复杂环境,在简化最优控制的基础上,提出了一种HiTL最优控制协议。此外,将包含前导输入的同步误差嵌入到代价函数中,使得能够实现最优控制目标,并确保在HiTL控制下跟踪控制的执行。通过增加指数项,提出了一种新的满足固定时间形式的强化学习(RL)算法,以获得最优的固定时间控制器,该算法在有效保证最小能耗的同时,提高了系统信号的收敛速度。同时,在控制器设计过程中考虑并补偿执行器故障,以获得优异的系统性能。因此,所提出的最优控制方案确保闭环系统的所有信号在固定时间内保持有界。仿真结果验证了该控制方法的可行性。


原文链接



基于自适应逆强化学习的对抗环境下线性系统人类行为识别

原标题:Human Behavior Identification for Linear Systems in Adversarial Environments by Adaptive Inverse Reinforcement Learning

作者:Mi Wang; Huai-Ning Wu; Jingbo Fu; Chen Liang

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/19

摘要:本文研究对抗环境中线性人在回路(HiTL)系统的人的行为识别问题。通过将人类建模为最小化其个人成本函数的最优控制器,将对抗环境建模为最大化成本函数的对手,将HiTL系统描述为由人类和对抗环境两个参与者组成的线性二次零和微分对策。然后,将人类行为识别转化为逆强化学习(IRL)问题。因此,本文所做的主要工作可以概括为:1)提出了一种积分并行学习(ICL)律来估计人类的反馈矩阵,2)基于估计的反馈矩阵通过最小化残差来检索人类成本函数中的权重矩阵。开发的人类行为识别方法的主要重点是消除现有在线学习方法普遍需要的持续激励约束和测量人类控制输入的需求。最后,对车辆的车道保持场景进行了仿真和实验,验证了所提出的基于IRL的自适应人类行为识别策略的有效性。


原文链接



基于软规定性能的PAM驱动康复外骨骼强化学习控制

原标题:Soft Prescribed Performance-Based Reinforcement Learning Control for a PAM-Actuated Rehabilitation Exoskeleton

作者:Haoqi Zhang; Ning Sun; Jia Han; Ying Qin

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/19

摘要:在康复外骨骼中,稳定和安全的操作是康复训练的核心。本文提出了一种基于软规定性能(SPP)的强化学习(RL)控制方法,以解决性能约束和系统退化之间的冲突,确保高精度和安全运行。首先,使用隧道型指定性能函数来实现更快的收敛和更小的超调。安全边界用于定义容许误差范围,中间系统连接安全边界和软边界。通过在性能下降期间暂时放松约束,动态调整软边界以确保安全操作。采用基于行动者-批评者(AC)结构的RL方法来处理未知集总扰动。理论分析证实了闭环系统的稳定性。此外,在自制的气动人工肌肉驱动上肢康复外骨骼机器人上进行了一系列实验,验证了该方法的有效性和鲁棒性。


原文链接



多目标优化AlphaMOEA的模拟学习

原标题:Imitation Learning for Multiobjective Optimization—AlphaMOEA

作者:Tianyang Li; Gary G. Yen; Ying Meng; Lixin Tang

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/18

摘要:在过去的十年中,已经开发了各种具有特定增强功能的多目标进化算法(MOEA)来解决多目标优化问题(MOP)。在本文中,与MOEA不同,我们提供了一种新的人工智能方法来解决MOP,该方法采用基于模拟学习的端到端方法,即AlphaMOEA。AlphaMOEA完全是一个由神经网络组成的模型,主要遵循多任务学习(MTL)的架构。它有两个训练阶段:监督学习(SL)阶段和强化学习(RL)阶段。在SL阶段,AlphaMOEA在许多选定的MOEA提供的决策空间中拟合解决方案。由于AlphaMOEA中的神经网络由高维参数组成,因此拟合过程可以被视为解从低维空间到高维空间的转换。这使得AlphaMOEA能够从高维度的角度获得不同的有价值的知识。然后,在RL阶段训练AlphaMOEA,以自驱动的方式获得具有各种问题特征的MOP的良好性能。RL阶段依赖于几个设计的组件,包括基于相似性的状态设计(用于测量解决方案之间的距离)、基于进化算子的操作集(用于提供探索行为)和指标引导的奖励(用于产生增量评估)。实验结果表明,AlphaMOEA可以在高维表示中学习关于决策空间的有价值信息,从而在探索和开发之间实现理想的平衡。AlphaMOEA可以进一步提高在合理时间内求解具有各种问题特征的MOP的性能。


原文链接



自主车辆和机器人行人群体活动识别:综述与展望

原标题:Pedestrian Group Activity Recognition for Autonomous Vehicles and Robots: A Survey and Perspectives

作者:Yuzhu Jiang; Chao Yang; Weida Wang; Zhijun Li; Dongpu Cao; Ying Li

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/18

摘要:在人机(自主车辆和机器人)交互场景中,行人通常成群出现。与个人相比,行人组提供了更丰富的信息,这有助于解决行人-机器交互中的遮挡问题。然而,行人活动的随机性和时空复杂性使得行人群体活动识别(PGAR)成为一项极具挑战性的任务。本文提供了对PGAR任务的详细描述。首次给出了自主车辆和机器人的行人群体和活动的定义。系统地总结了现有的数据集和方法。此外,还概述了自主车辆和机器人PGAR的独特挑战和趋势。尽管已经发布了一些相关的调查,但还没有一项调查专门关注自动驾驶和机器人场景中的PGAR。因此,本文的目的是缩小这一课题的差距,为该领域的研究人员提供全面的参考。


原文链接



【声明】内容源于网络
0
0
AI新文
AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
内容 223
粉丝 0
AI新文 AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
总阅读42
粉丝0
内容223