由于微信公众号开始试行乱序推送,为了让您在第一时间获取AI新文,请将"AI新文"设为星标。
深度时间序列预测的选择性学习
原标题:Selective Learning for Deep Time Series Forecasting
作者:Yisong Fu;Zezhi Shao;Chengqing Yu;Yujie Li;Zhulin An;Qi Wang;Yongjun Xu;Fei Wang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/29
摘要:深度学习(DL)得益于捕获复杂时间模式的高容量,显著改进了时间序列预测(TSF)。然而,由于时间序列对噪声和异常的固有脆弱性,深度模型往往会遭受严重的过拟合。流行的DL范式通过MSE损失一致地优化所有时间步长,并学习那些不确定和异常的时间步长而没有差异,最终导致过拟合。为了解决这个问题,我们提出了一种新的深度TSF选择性学习策略。具体地,选择性学习筛选整个时间步长的子集以计算优化中的MSE损失,引导模型专注于可推广的时间步长,而忽略不可推广的。我们的框架引入了一种双掩模机制来定位时间步长:(1)利用剩余熵来过滤不确定时间步长的不确定性掩模,以及(2)使用剩余下限估计来排除异常时间步幅的异常掩模。在八个真实世界数据集上的广泛实验表明,选择性学习可以显著提高典型最先进深度模型的预测性能,包括Informer的MSE减少37.4%,TimesNet的MSE降低8.4%,以及iTransformer的6.5%。
原文链接
DBLoss:基于分解的时间序列预测损失函数
原标题:DBLoss: Decomposition-based Loss Function for Time Series Forecasting
作者:Xiangfei Qiu;Xingjian Wu;Hanyin Cheng;Xvyuan Liu;Chenjuan Guo;Jilin Hu;Bin Yang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/27
摘要:时间序列预测在经济、交通、能源和人工智能操作等各个领域具有重要价值,因为准确的预测有助于明智的决策。然而,即使在前向传播中使用分解模块来分别建模趋势和季节性时,现有的均方误差(MSE)损失函数有时也无法准确捕获预测范围内的季节性或趋势。为了解决这些挑战,我们提出了一种简单而有效的基于分解的损失函数,称为DBLoss。该方法使用指数移动平均数将时间序列分解为预测范围内的季节和趋势分量,然后分别计算每个分量的损失,然后对其进行加权。作为一般损失函数,DBLoss可以与任何深度学习预测模型相结合。大量实验表明,DBLoss显著提高了各种真实世界数据集上最先进模型的性能,并为时间序列损失函数的设计提供了新的视角。
原文链接
无增强学习:基于帧投影的无监督时间序列表示学习
原标题:Learning Without Augmenting: Unsupervised Time Series Representation Learning via Frame Projections
作者:Berken Utku Demirel;Christian Holz
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/26
摘要:自监督学习(SSL)已经成为一种强大的无标记数据学习表示的范例。大多数SSL方法依赖于强大的、成熟的、手工制作的数据增强,以生成用于表示学习的不同视图。然而,设计这样的增强需要领域特定的知识,并在模型上隐式施加表示不变性,这可能会限制泛化。在这项工作中,我们提出了一种无监督表示学习方法,该方法通过使用正交基和过完备框架生成视图来代替增强。我们证明,从正交和过完备空间学习的嵌入驻留在不同的流形上,由在不同空间中表示样本所引入的几何偏差形成。通过联合利用这些不同流形的互补几何,我们的方法在不通过强增强来人为增加数据多样性的情况下获得了优异的性能。我们在五个时间序列任务的九个数据集上验证了我们的方法的有效性,其中信号特定的特征使数据增强特别具有挑战性。在不依赖增强诱导分集的情况下,与现有的自监督方法相比,我们的方法实现了高达15-20%的性能增益。源代码:https://github.com/eth-siplab/Learning-with-FrameProjections。
原文链接
SyncSBench:重新思考时间序列深度学习模型中的时间模式学习
原标题:SynTSBench: Rethinking Temporal Pattern Learning in Deep Learning Models for Time Series
作者:Qitai Tan;Yiyun Chen;Mo Li;Ruiwen Gu;Yilin Su;Xiao-Ping Zhang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/23
摘要:深度学习的最新进展推动了时间序列预测的快速发展,然而,许多最先进的模型在现实世界的应用中仍然难以获得稳健的性能,即使它们在标准基准数据集上获得了强大的结果。这种持续的差距可以归因于深度学习架构的黑盒性质和当前评估框架的固有局限性,这些框架通常缺乏对不同模型的具体优势和弱点提供清晰、定量见解的能力,从而使为特定预测场景选择适当模型变得复杂。为了解决这些问题,我们提出了一种综合数据驱动评估范式SyncSBench,该范式通过可编程特征配置系统地评估时间序列预测模型的基本建模能力。我们的框架分离了混杂因素,并建立了一个具有三个核心分析维度的可解释评估系统:(1)时间特征分解和能力映射,这使得系统评估模型学习特定模式类型的能力;(2)数据不规则下的鲁棒性分析,量化噪声容限阈值和异常恢复能力;和(3)理论最优基准测试,它为每个模式类型建立性能边界,从而能够在模型预测和数学优化之间进行直接比较。我们的实验表明,当前的深度学习模型并不普遍地在所有类型的时间上接近最佳基线该。代码可在https://github.com/TanQitai/SynTSBench上获得。
原文链接
SEMPO:时间序列预测的轻量级基础模型
原标题:SEMPO: Lightweight Foundation Models for Time Series Forecasting
作者:Hui He;Kun Yi;Yuanchi Ma;Qi Zhang;Zhendong Niu;Guansong Pang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/22
摘要:最近大规模预训练模型的兴起见证了为时间序列预测开发基础模型(FM)的显著成功。尽管在各种下游预测任务中的性能令人印象深刻,但现有的时间序列FM具有大规模的网络架构,需要大规模数据集的大量预训练,这严重阻碍了它们在资源受限的环境中的部署。为了应对多功能性和可负担性之间日益增长的紧张关系,我们提出了SEMPO,这是一种新的轻量级基础模型,需要对相对较小的数据进行预处理,但显示出强大的通用时间序列预测。具体地,SEMPO包括两个关键模块:1)能量感知SpEctral分解模块,该模块通过不仅对高能频率信号建模,而且对当前方法忽略的低能但信息丰富的频率信号建模来显著提高预训练数据的利用率;和2)支持PrOmpts的Transformer的混合,该Transformer通过特定于小数据集的提示来学习异构时间模式,并自适应地将时间序列令牌路由到基于提示的专家,以跨不同的数据集和域进行参数高效的模型适配。配备这些模块后,SEMPO显著减少了训练前数据规模和模型大小,同时实现了强泛化。在覆盖16个数据集的两个大规模基准上的大量实验表明,与最先进的方法相比,SEMPO在零炮和少炮预测场景中的性能优越。代码和数据可在https://github.com/mala-lab/SEMPO上获得。
原文链接
可解释多变量时间序列异常检测的结构化时间因果关系
原标题:Structured Temporal Causality for Interpretable Multivariate Time Series Anomaly Detection
作者:Dongchan Cho;Jiho Han;Keumyeong Kang;Minsang Kim;Honggyu Ryu;Namsoon Jung
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/18
摘要:现实世界中的多变量时间序列异常是罕见的,并且通常是未标记的。此外,流行的方法依赖于调整为基准的日益复杂的架构,仅检测异常段的片段,并夸大性能。在本文中,我们介绍了OracleAD,这是一个用于多变量时间序列异常检测的简单且可解释的无监督框架。OracleAD将每个变量的过去序列编码为单个因果嵌入,以联合预测当前时间点并重建输入窗口,有效地建模时间动态。然后,这些嵌入经历自我注意机制,将它们投射到共享的潜在空间中,并捕获空间关系。这些关系不是静态的,因为它们由每个变量的时间动态中出现的属性进行建模。投影嵌入与表示正常状态关系的稳定潜在结构(SLS)对齐。使用基于预测误差和SLS偏差的双重评分机制来识别异常,从而在每个时间点和各个变量之间实现细粒度异常诊断。由于任何显著的SLS偏差都源于违反正常数据的学习时间因果关系的嵌入,OracleAD直接在嵌入级别定位根本原因变量。OracleAD在多个真实世界数据集和评估协议中实现了最先进的结果,同时通过SLS保持可解释性。
原文链接
时间序列基础模型的合成序列符号数据生成
原标题:Synthetic Series-Symbol Data Generation for Time Series Foundation Models
作者:Wenxuan Wang;Kai Wu;Yujian Betterest Li;Dan Wang;Xiaoyu Zhang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/09
摘要:时间序列分析(TSA)的基础模型已经引起了极大的关注。然而,培训数据匮乏和不平衡等挑战继续阻碍它们的发展。受复杂动态系统理论的启发,我们设计了一种序列符号数据生成机制,能够无限制地创建与相应符号表达式配对的高质量时间序列数据。为了利用具有强相关性的序列符号数据对,我们开发了SymTime,这是一个预先训练的基础模型,用于使用符号信息增强时间序列表示。当与下游任务进行微调时,SymTime在五个主要TSA任务中展示了具有竞争力的性能,可以与在真实世界数据集上预先训练的基础模型相媲美。该方法强调了序列符号数据生成和预训练机制在克服数据稀缺性和提高任务性能方面的潜力。该代码可在https://github.com/wwhenxuan/SymTime上获得。
原文链接
与过去有什么不同?基于自监督偏差学习的时空时间序列预测
原标题:How Different from the Past? Spatio-Temporal Time Series Forecasting with Self-Supervised Deviation Learning
作者:Haotian Gao;Zheng Dong;Jiawei Yong;Shintaro Fukushima;Kenjiro Taura;Renhe Jiang
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/10/06
摘要:时空预测对于交通管理和城市计算等实际应用至关重要。尽管最近的方法显示了更高的准确性,但它们通常无法解释当前输入和历史模式之间的动态偏差。这些偏差包含可以显著影响模型性能的关键信号。为了填补这一空白,我们提出了ST-SSDL,这是一种时空时间序列预测框架,它结合了自我监督偏差学习方案来捕获和利用这种偏差。ST-SSDL将每个输入锚定到其历史平均值,并使用表示典型时空模式的可学习原型来离散化潜在空间。提出了两个辅助目标来改进该结构:增强原型间可区分性的对比损失和正则化输入表示和相应原型之间的距离一致性以量化偏差的偏差损失。这些组件与预测目标联合优化,指导模型组织其隐藏空间,并改进在不同输入条件下的泛化。在六个基准数据集上的实验表明,ST-SSDL在多个度量上始终优于最先进的基线。可视化进一步证明了其在复杂时空场景中自适应响应不同水平偏差的能力。我们的代码和数据集可在https://github.com/Jimmy-7664/ST-SSDL上获得。
原文链接
ScatterAD:用于时间序列异常检测的时间拓扑散射机制
原标题:ScatterAD: Temporal-Topological Scattering Mechanism for Time Series Anomaly Detection
作者:Tao Yin;Xiaohong Zhang;Shaochen Fu;Zhibin Zhang;Li Huang;Yiyuan Yang;Kaixiang Yang;Meng Yan
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/09/29
摘要:工业物联网时间序列异常检测的一个主要挑战在于多变量数据中的复杂时空耦合。然而,传统的异常检测方法专注于独立地建模空间或时间相关性,导致次优表示学习,并且对高维空间中的异常色散的敏感性有限。在这项工作中,我们进行了一项经验分析,表明正常和异常样本都倾向于在高维空间中散射,特别是异常样本明显更分散。我们将这种色散现象形式化为散射,通过样本表示之间的平均成对距离进行量化,并将其用作感应信号来增强时空异常检测。在技术上,我们提出了ScatterAD来模拟跨时间和拓扑维的表示散射。ScatterAD包含用于捕获图结构散射的拓扑编码器和用于通过相邻时间步长之间的均方误差最小化来约束过散射的时间编码器。我们引入了一种对比融合机制,以确保所学习的时间和拓扑表示的互补性。此外,我们从理论上表明,最大化时间视图和拓扑视图之间的条件互信息可以提高交叉视图的一致性,并增强更具区分性的表示。在多个公共基准测试上的大量实验表明,ScatterAD在多变量时间序列异常检测方面实现了最先进的性能。代码在此存储库中可用:https://github.com/jk-sounds/ScatterAD。
原文链接
MIRA:适用于真实世界健康数据的医疗时间序列基础模型
原标题:MIRA: Medical Time Series Foundation Model for Real-World Health Data
作者:Hao Li;Bowen Deng;Chang Xu;Zhiyuan Feng;Viktor Schlegel;Yu-Hao Huang;Yizheng Sun;Jingyuan Sun;Kailai Yang;Yiyao Yu;Jiang Bian
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/06/09
摘要:医疗时间序列的统一基础模型——在开放存取和伦理委员会批准的医学语料库上预处理——提供了减少注释负担、最小化模型定制和支持跨临床机构、模式和任务的稳健传输的潜力,特别是在数据稀缺或隐私受限的环境中。然而,现有的通用时间序列基础模型由于其固有的挑战(包括不规则间隔、异构采样率和频繁丢失值)而难以处理医学时间序列数据。为了解决这些挑战,我们引入了MIRA,这是一种专门为医疗时间序列预测设计的统一基础模型。MIRA集成了连续时间旋转位置编码(Continuous Time Rotary Positional Encoding),该编码支持可变时间间隔的细粒度建模,特定于频率的专家层混合,该专家层跨潜在频率区域路由计算,以进一步促进时间专化,以及基于神经ODE的连续动态外推块(Continue Dynamics Extrapolation Block),该神经ODE对潜在状态的连续轨迹进行建模,从而实现在任意目标时间戳的准确预测。在一个由从公共可用数据集收集的超过4540亿个时间点组成的大规模和多样化医学语料库上预训练,与其他零炮和微调基线相比,MIRA在分布外和分布场景中的预测误差分别平均减少10%和7%。我们还介绍了一个跨越多个下游临床任务的综合基准测试,为医学时间序列建模的未来研究奠定了基础。
原文链接
少即是多:通过结构化修剪解锁时间序列基础模型的专业化
原标题:Less is More: Unlocking Specialization of Time Series Foundation Models via Structured Pruning
作者:Lifan Zhao;Yanyan Shen;Zhaoyang Liu;Xue Wang;Jiaji Deng
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/05/29
摘要:尺度律推动了时间序列基础模型(TSFM)的发展,该模型可以预先训练大量参数,并实现显著的零炮预测性能。令人惊讶的是,即使在微调后,TSFM也不能始终优于在全速下游数据上训练的较小的专用模型。如何实现TSFM对目标预测任务的有效自适应是一个关键问题。通过对各种TSFM的实证研究,预训练模型在计算中通常表现出固有的稀疏性和冗余性,这表明TSFM已经学会激活与任务相关的网络子结构,以适应不同的预测任务。为了保留这些有价值的先验知识,我们提出了一种结构化剪枝方法,通过将其集中在更相关和更紧凑的参数空间来正则化后续的微调过程。在七个TSFM和六个基准上的广泛实验表明,与微调原始模型相比,微调较小的修剪TSFM显著提高了预测性能。这种修剪然后微调的范例通常使TSFM能够实现最先进的性能,并超过强大的专用基线。源代码在https://github.com/SJTU-DMTai/Prune-then-Finetune上公开。
原文链接
Time-o1:时间序列预测需要转换标签对齐
原标题:Time-o1: Time-Series Forecasting Needs Transformed Label Alignment
作者:Hao Wang;Licheng Pan;Zhichao Chen;Xu Chen;Qingyang Dai;Lei Wang;Haoxuan Li;Zhouchen Lin
期刊:Conference and Workshop on Neural Information Processing Systems
出版时间:2025/05/23
摘要:训练时间序列预测模型在设计有效的学习目标方面提出了独特的挑战。现有的方法主要利用时间均方误差,这面临两个关键挑战:(1)标签自相关,这导致来自标签序列似然的偏差;(2)任务量过大,随着预测范围的增加而增加,使优化变得复杂。为了解决这些挑战,我们提出了Time-o1,这是一个为时间序列预测量身定制的转换增强学习目标。核心思想是将标签序列转换为具有可区分意义的去相关组件。然后训练模型以对齐最重要的组件,从而有效地减轻标签自相关并减少任务量。大量实验表明,Time-o1实现了最先进的性能,并与各种预测模型兼容。代码可在https://github.com/Master-PLC/Time-o1上获得。
原文链接

