大数跨境
0
0

人工智能基础与综合-论文12篇(2025年11月)

人工智能基础与综合-论文12篇(2025年11月) AI新文
2025-12-03
2

由于微信公众号开始试行乱序推送,为了让您在第一时间获取AI新文,请将"AI新文"设为星标。


时间序列分类中的矩阵混合分析:关注标记化

原标题:Matrix mixer analysis for time series classification: attention on tokenization

作者:Mohammad Mahdi Azizi;Bagher Babaali

期刊:Information Fusion

出版时间:2025/11/30

摘要:基于Transformer的基础模型在自然语言处理和计算机视觉方面取得了最先进的成果,引发了将其应用于时间序列和生物信号的兴趣。然而,由于时间序列数据集固有的多样性,开发有效的时间序列分类基础模型面临重大挑战。这一领域中尚未解决的关键问题包括不同的标记化和时间融合策略以及架构设计对模型性能的影响。本研究将矩阵混合器框架重新定义为一种通用的建筑设计工具箱。我们分析矩阵混合结构和分词方法如何影响时间序列分类模型的效果。本研究的发现体现在标题”关注标记化“中,强调了两个关键点:首先,使用像自注意力这样的标记混合器比依赖没有标记级时间信息融合的策略更有优势;其次,特别注意标记化过程,特别是在选择最佳补丁嵌入配置方面,可以提高模型性能。本研究开发的模型在两个广泛使用的时间序列分类基准测试中取得了最先进的结果,在监督设置下实现了平均准确率73.1%,在自监督设置下实现了平均准确率86.0%,所有这些都采用了一种统一架构。


原文链接



生成人工智能与强化学习在机器人领域的二元性:综述

原标题:The Duality of Generative AI and Reinforcement Learning in Robotics: A Review

作者:Angelo Moroncelli;Vishal Soni;Marco Forgione;Dario Piga;Blerina Spahiu;Loris Roveda

期刊:Information Fusion

出版时间:2025/11/29

摘要:最近,生成式人工智能和强化学习(RL)正在重新定义能够以信息流作为输入并产生智能行为的人工智能代理的可能性。因此,我们在具身人工智能和机器人控制策略生成方面看到了类似的进展。我们的综述论文考察了生成式AI模型与RL的集成以推进机器人技术。我们的主要关注点在于生成式AI和RL在机器人下游任务之间的对偶性。具体来说,我们研究的是:(1) 重要的生成式AI工具在RL任务中作为多模态输入融合的模块化先验的作用。(2) 如何通过强化学习训练、微调和蒸馏策略生成模型,例如VLA模型,在大型语言模型中的RL应用类似地进行。然后我们提出了一种基于大量精选论文的新分类法。最后,我们确定了模型可扩展性、适应性和基础方面的开放挑战,并对未来研究方向提出了建议和见解。我们反思哪些生成式AI模型最适合RL任务以及原因。另一方面,我们反思增强型生成策略内在的重要问题,如安全顾虑和失败模式,以及当前方法的局限性。我们维护了一个经过整理的相关研究论文集合在我们的GitHub仓库中,作为此领域持续研究和开发的资源。


原文链接



星载合成孔径雷达:未来技术与任务构想

原标题:Spaceborne Synthetic Aperture Radar: Future Technologies and Mission Concepts

作者:Alberto Moreira; Gerhard Krieger; Michelangelo Villano; Marwan Younis; Pau Prats-Iraola; Manfred Zink

期刊:Proceedings of the IEEE

出版时间:2025/11/27

摘要:本文概述了星载合成孔径雷达(SAR)的最新进展和未来发展方向。如今,我们正经历着空间搭载合成孔径雷达(SAR)的黄金时代,轨道上的卫星数量正在迅速增加。本文介绍了与创新成像模式相关的新型技术和任务概念,这些技术与概念旨在满足用户对提高性能、全球覆盖范围、更快重访时间、增强空间分辨率以及增加合成孔径雷达(SAR)图像信息含量的严格要求。基于数字波束成形(DBF)、双基地和多基地合成孔径雷达(SAR)、分布式SAR以及多输入多输出SAR(MIMO-SAR)的关键技术和任务概念将提升未来空间borne SAR系统的性能和能力。此外,本文还讨论了满足特定用户需求所需的专用任务设计、技术和轨道概念。介绍了空间SAR发展的两大主要方向及其权衡分析:1) 新航天SAR,包括重量在85千克到250千克的小卫星,具有最高分辨率的图像和非常短的重访周期;2) 具备全球覆盖、高性能和增强能力的完整SAR卫星。研究表明,NewSpace和完整的合成孔径雷达(SAR)卫星在用户需求方面是互补的,并且结合这两种任务概念能够实现新的任务理念,例如多静态SAR,从而开启了大量新应用的大门。本文以对空间borne SAR的未来展望作为结束。


原文链接



生成式AI驱动的人体工程学:一种虚拟现实混合实验用于人因工程

原标题:Generative AI-Driven Ergonomics: A Virtual-Real Hybrid Experiment for Human Factors Engineering

作者:Peijun Ye; Yijia Li; Imre J. Rudas; Fei-Yue Wang

期刊:IEEE Transactions on Cybernetics

出版时间:2025/11/26

摘要:人机工程学或人为因素工程(HFE)主要通过人体实验来发现人的认知和行为机制。然而,这种范式存在受试者群体规模以及他们能否代表整个研究人群的局限性。此外,在实时人机任务中,由于实验无法灵活进行以更新认知模型,实验-建模-验证-应用路径可能不适用,导致在线系统控制和管理失败。为了解决这一困境,本文提出了由生成式人工智能(GAI)驱动的人机工程学以增强人因工程研究。通过引入GAI技术,虚拟-现实混合实验相结合,并补充更多异构样本,增强认知建模和行为学习的输入多样性。人机协作驾驶和航天机械臂操作的案例研究显示,这一创新范式能够有效高效地增强人类实验数据。它可以提高人类模型的通用性和鲁棒性。


原文链接



深度模型融合:综述

原标题:Deep Model Fusion: A Survey

作者:Weishi Li; Yong Peng; Miao Zhang; Liang Ding; Han Hu; Li Shen

期刊:IEEE Transactions on Neural Networks and Learning Systems

出版时间:2025/11/25

摘要:深度模型融合/合并是一种将来自多个深度学习(DL)模型的参数或预测整合到统一框架中的新兴技术。它结合了不同模型的能力来弥补单一模型的偏差和错误,提高整体性能。然而,深度模型融合,尤其是大规模深度学习模型(如大型语言模型(LLMs)和基础模型)面临着几个挑战,包括高昂的计算成本以及不同异构模型之间的干扰。为了更好地理解它,我们进行了一个全面的综述来总结近期的进展。我们将现有的模型融合方法分为四类:1)权重平均(WA)对多个模型的参数进行平均以获得更接近最优解的结果;2)鉴于直接对模型进行平均往往会导致次优结果,“模式连接性”在融合前通过权重空间中损失非增路径将网络连接起来。沿这些路径,初始模型被转化为具有一致功能和更好融合效果的形式;3) 同样地,对于直接融合结果较差的模型,“对齐”匹配相应的单元并将这些模型合并,从而充分利用模型之间的对应关系;以及4) 除了上述参数融合的方法之外,“集成学习”在推理阶段融合多个模型的输出,以提高网络的准确性和鲁棒性。此外,我们分析了深度模型融合的挑战,并阐明了未来可能的研究方向。


原文链接



揭秘高阶图神经网络

原标题:Demystifying Higher-Order Graph Neural Networks

作者:Maciej Besta; Florian Scheidl; Lukas Gianinazzi; Grzegorz Kwasniewski; Shachar Klaiman; Jürgen Müller

期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence

出版时间:2025/11/25

摘要:高阶图神经网络(HOGNNs)以及来自拓扑深度学习的相关架构是一类重要的GNN模型,能够利用顶点之间的多边关系,而不仅仅是简单的边。它们已被用于消除过度平滑或过度挤压等问题,显著提高GNN预测的准确性,增强GNN架构的表现力,并实现众多其他目标。大量HOGNN模型已被提出,并且它们具有不同的神经网络架构,甚至对于“高阶”的含义也有不同的理解。这种丰富性使其非常难以恰当地分析和比较HOGNN模型,并决定在什么场景下使用特定的模型。为了缓解这一问题,我们首先设计了一个深入的分类学和HOGNNs蓝图。这有助于设计性能最大化模型。然后,我们使用我们的分类学来分析和比较可用的HOGNN模型。我们的分析结果被综合成一系列见解,这些见解有助于在给定场景中选择最有益的GNN模型,并且列出了对进一步研究更强大的HOGNN所面临的挑战和机遇的全面清单。


原文链接



联合神经非参数点过程

原标题:Federated Neural Nonparametric Point Processes

作者:Hui Chen;Xuhui Fan;Hengyu Liu;Yaqiong Li;Zhilin Zhao;Feng Zhou;Christopher John Quinn;Longbing Cao

期刊:Artificial Intelligence

出版时间:2025/11/22

摘要:时间点过程(TPP)对于随时间变化的事件发生建模是有效的,但在联邦系统中与稀疏和不确定事件斗争,其中隐私是一个主要问题。为了解决这个问题,我们提出了联邦神经非参数点过程模型FedPP。FedPP在客户端将神经嵌入集成到S形高斯Cox过程(SGCPs)中。SGCP是一类灵活且富有表现力的TPP,允许FedPP生成高度灵活的强度函数,该函数捕获客户特定的事件动态和不确定性,同时有效地总结历史记录。对于全局聚合,FedPP引入了一种基于发散的机制来在服务器和客户端之间通信SGCP中内核超参数的分布,同时将特定于客户端的参数保持在本地,以确保隐私和个性化。FedPP有效地捕获事件不确定性和稀疏性。大量实验表明,它在联邦环境中具有优越的性能,显示了KL散度和Wasserstein距离的全局聚合。


原文链接



人工智能模型的用户判断受其描述的影响:一项工作面试培训背景下的研究

原标题:User judgment of an AI model is biased by its description: A study in a job interview training context

作者:Sharon Lynn Chu;Marcin Karcz;Amal Hashky;Neha Rani;Theodora Chaspari;Winfred Arthur Jr.;Eric D. Ragan

期刊:International Journal of Human-Computer Studies

出版时间:2025/11/19

摘要:人工智能(AI)的发展在日常生活的许多方面引入了新的人工智能驱动系统。尽管许多这样的系统可以嵌入到长期使用是合理的上下文中,但也有许多情况下,这样的系统的使用可以是短暂的,也可以在单个会话中使用。在这些情况下,提供给用户的关于人工智能模型的初始信息很重要,因为用户可能没有足够的参与系统,无法随着时间的推移通过使用开发心智模型。相反,用户可能只是依赖第一印象。然而,关于系统中人工智能模型的给定信息如何影响用户对系统的判断,我们知之甚少。本研究在工作面试培训的背景下调查了这个问题。我们进行了一项受控实验,其中操纵了模拟工作面试培训系统中人工智能模型的描述,以将该模型描述为基本或更高级。在人工智能模型被描述为更复杂和更先进的情况下,参与者报告了与模型输出的更高水平的一致性,更有利的评级,以及使用系统输出的更大意愿。


原文链接



通过自主学习知识提高数学推理能力

原标题:Enhancing Mathematical Reasoning Through Autonomously Learning Knowledge

作者:Jiayu Liu; Zhenya Huang; Enhong Chen; Qi Liu; Hongke Zhao; Xin Lin

期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence

出版时间:2025/11/19

摘要:使机器能够解决数学问题是开发模仿人类思维和推理的智能的一项重要努力。然而,现有的大多数方法侧重于重建人类对问题的理解,这远远不够,因为它们忽视了人类从经验中学习知识的基本能力。在本文中,我们专注于赋予具有认知能力的模型从数学问题解决中自主学习知识的能力。我们首先提出了一种认知求解器(CogSolver),它包含智能BRAIN-ARM框架作为认知结构,并在两种认知科学理论的启发下,在商店应用更新步骤中操作知识学习过程。BRAIN系统存储三种基本类型的数学知识,ARM系统将它们有机地应用于答案推理过程。在解决问题后,大脑根据ARM的反馈更新其存储的知识,使用知识过滤器来消除冗余,并培育更合理的知识库。我们的CogSolver迭代地执行上述三个步骤,模拟更像人类的行为。此外,为了克服学习过程中的知识遗忘,我们将CogSolver扩展到CogSolver+,方法是结合一种基本的知识召回机制,该机制受到另一个著名的认知理论的启发。我们首先讨论并融合了模拟人类记忆重放的三个关键因素。然后,我们提出了一种基于影响的方法来整合更新的知识,该方法在理论上保证了效率。在三个数学单词问题基准测试上的实验证明了我们的CogSolver和CogSolver+在答案推理方面的改进,并清楚地说明了它们如何获得知识,从而实现卓越的可解释性。


原文链接



视觉语言任务如何受益于大型预训练模型:一项调查

原标题:How Vision-Language Tasks Benefit from Large Pre-trained Models: A Survey

作者:Yayun Qi; Hongxi Li; Yiqi Song; Xinxiao Wu; Jiebo Luo

期刊:IEEE Transactions on Multimedia

出版时间:2025/11/14

摘要:对各种视觉语言任务的探索,如视觉字幕、视觉问答和视觉常识推理,是人工智能中的一个重要领域,一直受到研究界的关注。尽管整体表现有所改善,但视觉语言任务中仍然存在经典挑战,并阻碍了该领域的发展。近年来,预训练模型的兴起推动了视觉语言任务的研究。由于训练数据和模型参数的大规模,预训练模型在许多下游任务中表现出优异的性能。在预训练模型强大功能的启发下,出现了新的范例来解决经典挑战。随着越来越多的关注和迅速的进步,这种方法已经成为当前研究的主流。在本文中,我们全面概述了视觉语言任务如何从预先训练的模型中受益。首先,我们回顾了视觉语言任务中的几个主要挑战,并讨论了预训练时代之前的解决方案的局限性。接下来,我们总结了在结合预训练模型来解决视觉语言任务中的挑战方面的最新进展。最后,我们分析了与预训练模型的固有局限性相关的潜在风险,讨论了可能的解决方案,并试图提供未来的研究方向。


原文链接



神经形态硬件上稀疏有限元问题的求解

原标题:Solving sparse finite element problems on neuromorphic hardware

作者:Bradley H. Theilman;James B. Aimone

期刊:Nature Machine Intelligence

出版时间:2025/11/13

摘要:有限元法(FEM)是在科学和工程发现计算机上求解偏微分方程(PDE)的最重要和最普遍的数值方法之一。几十年来,将有限元法应用于更大和更详细的科学模型推动了高性能计算的发展。在这里,我们证明了可扩展的峰值神经形态硬件可以通过构建一个峰值神经网络来直接实现FEM,该网络求解FEM核心的大型稀疏线性方程组。我们表明,对于泊松方程(科学和工程中的基本PDE),我们的神经电路在现代、固有并行和节能的神经形态硬件(特别是英特尔的Loihi 2神经形态平台)上实现了有意义的数值精度水平和接近理想的缩放。我们说明了对二维和三维不规则网格几何以及其他PDE(如线性弹性)的扩展。我们的脉冲神经网络是根据大脑运动皮层的递归网络模型构建的,与基于黑盒深度人工神经网络的PDE方法相比,它直接将FEM的易于理解和可信的数学转换为本机脉冲神经形态算法。


原文链接



两个及多个设施容量受限设施选址问题的真机制设计

原标题:On the design of truthful mechanisms for the capacitated facility location problem with two and more facilities

作者:Gennaro Auricchio;Zihe Wang;Jie Zhang

期刊:Artificial Intelligence

出版时间:2025/11/01

摘要:在这篇论文中,我们探索了它们的机制设计方面的在线容量设施选址问题(m-CFLP),重点放在两个框架上。在第一个框架中,设施的数量是任意的,所有设施共享相同的容量,代理的数量与设施的总容量匹配。在第二个框架中,我们需要定位两个设施,每个设施的容量至少等于代理数量的一半。对于这两个框架,我们提出了在社会成本(SC)和最大成本(MC)方面具有有界逼近比的真实机制。当nm>2时,我们的结果与经典设施选址问题的不可能结果形成对比,其中没有容量约束。此外,在匿名机制中,所有提出的机制对于MC是最优的,对于SC是最优的或近似最优的。然后,我们为这两个框架的任何真实和确定性机制实现的关于SC和MC的近似比建立下限。最后,我们运行了几个数值实验,以实证评估我们的机制相对于SC或MC的性能。我们的实证分析表明,我们提出的机制优于以前提出的所有适用于该设置的机制。


原文链接



【声明】内容源于网络
0
0
AI新文
AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
内容 223
粉丝 0
AI新文 AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
总阅读36
粉丝0
内容223