点击蓝字,关注我们
导读:
在汉斯出版社《应用数学进展》期刊上,有研究提出了一种基于图卷积神经网络(GCN)的时间序列分类方法。
01
基本信息:
基于图卷积神经网络的时间序列分类研究
Research on Time Series Classification Based on Graph Convolutional Networks
作者:
陈依婷*, 刘 群:闽南师范大学数学与统计学院,福建 漳州
关键词:
图卷积神经网络;时间序列分类;网络特征提取;动态时间规整
项目基金:
国家自然科学基金青年项目(11901275)
福建省自然科学基金面上项目(2021J01982)
原文链接:
https://doi.org/10.12677/aam.2025.1410448
02
内容简介:
1
算法流程
本文提出了一种新颖的时间序列分类方法如图1,该方法首先通过引入余弦相似度和动态时间弯曲DTW计算方法,用于构建时间序列数据的相似度图,随后设计一种图网络特征增强算法用于提取复杂网络的拓扑结构,接着利用GCN对提取的特征做卷积并进行模型训练。本研究通过图卷积神经网络有效地提高时间序列数据的分类能力,并通过了模拟和实证实验部分,取得较好的结果。
2
模拟分析
1.算法介绍
模型采用两层图卷积网络架构。
第一图卷积层通过
学习节点嵌入表示,第二图卷积层输出节点的类别概率分布
,其中Aˆ 表示归一化邻接矩阵。实验的具体步骤如下:
1) 生成虚拟时间序列数据,将样本数据添加到data列表,簇标签添加到labels列表中。
2) 计算融合相似度,计算序列对之间的余弦相似度和DTW相似度,根据公式(4)生成融合相似度。
3) 构建邻接矩阵,设置阈值,若相似度大于阈值,则在邻接矩阵将对应元素设为1,否则设为0,最后返回邻接矩阵adj_matrix。
4) 提取网络特征,将邻接矩阵转换为图对象G,根据公式(9)、(10)、(11)计算度中心性、聚类系数和三角形数量,将计算得到的特征添加到features列表中。
5) 定义图卷积网络模型,应用两层图卷积,最终使用log_softmax激活函数得到节点的分类概率。
2.人工数据
为了对所提的方法进行评估,本研究中使用的人工数据集旨在评估时间序列分类算法的性能。该数据集由600个时间序列样本组成,每个样本长度为300个时间点。数据集被设计为包含三个不同的簇,每个簇具有不同的频率和幅值特征,以模拟真实世界中时间序列数据的多样性。每个簇的频率和幅值特征通过添加正态分布噪声来实现,模拟的数据集具体特征如表1,将每簇数据选取5个样本生成可视化图如图2。
3.参数设置
实验对图卷积网络(GCN)模型进行了参数优化,以提升时间序列分类的性能。隐藏层维度固定为16,旨在有效捕捉数据特征。学习率设置为0.01,确保了模型的稳定收敛。采用0.5的Dropout率以减轻过拟合现象,训练周期定为200个epoch,以实现模型在训练数据上的充分学习。
在模型评估方面,本文采用了准确率和混淆矩阵等不同指标来评估模型。准确率(Accuracy)该指标计算正确分类样本数与总样本数的比例,直接反映了模型的分类准确性。召回率(Recall)是评估分类模型性能的一个重要指标,召回率越高,表示模型识别正例的能力越强。F1分数(F1-score)则通过调和准确率和召回率,提供了全面评估分类模型的指标。而混淆矩阵可以详细分析模型预测结果的准确性,包括正确分类和错误分类的具体情况。
4.实验分析
对于融合权重β的选择,本实验采用对称加权(即β = 0.5)的策略来融合时间序列的局部与全局特征,并通过对比实验来验证此策略的有效性。实验的准确率为5次随机运行的平均值,结果证明了两种相似度度量之间存在强大的互补性。如表2所示,仅依赖DTW的模型(β = 0.0)准确率为78.2%;仅依赖余弦相似度的模型(β = 1.0)准确率仅为73.5%。而β = 0.5的融合模型准确率显著提升至85.1%,这一结果验证了融合策略的优越性。表明融合后的结构同时包含了更多的样本关联,从而为模型提供更丰富的信息表征。
阈值用于控制图结构的稀疏性,阈值越小,构建的图越稠密,阈值越大图越稀疏,节点的连接越少。当阈值小于0.5时,图过于稠密,会引入大量不显著的连接,使得图结构信息变得模糊。当阈值大于0.8时,图过于稀疏,许多本应存在的关联被忽略,阻碍了节点间有效的信息传递,性能同样下降。由图3可以看到,当阈值取0.7时模型不同的网络间的结构更明显,区分度越高。这表明在此阈值下构建的图能够有效捕捉样本间最相关的关系,同时避免噪声干扰,因此最终选择0.7用于本实验。
基于上述参数的设置,本节展示了所选择的图神经网络模型在时间序列分类任务上的性能。模型在600个样本上进行训练,每个样本长度为300,分为三个不同的簇。通过将邻接矩阵转换为图,并使用 from_networkx函数创建PyTorch Geometric数据对象pyg_data。将网络特征添加为节点特征,并将标签添加为节点标签。随机选择30%的节点作为测试集,其余作为训练集。对数据进行训练以及测试,其节点分类的准确率和召回率结果如表3所示。
5.可视化结果分析
图4展示了网络特征如三角形数量、分类系数、度中心性在不同分类中的分布情况。从特征的箱线图中可以清晰的观察到这些特征在不同分类之间的分布差异,不同类间的显著差异性可以使模型更好的区分不同的类别,有利于提高模型的准确率。
图5展示了模型在三个类别上的分类性能。这个混淆矩阵(Confusion Matrix)是一个3 × 3的矩阵,用于评估分类模型的性能。矩阵的行表示真实类别(True Labels),列表示模型预测的类别(Predicted Labels)。每个单元格中的数字表示模型对特定类别的预测数量。由图可以看到簇1有2个样本被错误分类为簇2,这可能是由于这两个类别之间存在某些相似性,导致模型难以区分。整体分类效果较好,这表明模型能够有效识别不同类别的样本。
03
期刊介绍:
所属期刊
-Advances in Applied Mathematics-
《应用数学进展》系“RCCSE中文OA核心学术期刊”,是开放获取期刊,主要刊登数学的各种计算方法研究,数学在统计学、计算机等方面应用的学术论文和成果评述。
检索:万方|维普
版面:月刊|最新12月版面
联系方式
电话:027-86758873
QQ:2194278918
微信:15802748706
投稿邮箱:2194278918@qq.com
合作联系:service@hanspub.org
长按识别二维码
联系小编投稿
声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本公众号观点或证实其内容的真实性;如其他媒体、网站或个人从本公众号转载使用,须保留本公众号注明的“来源”,并自负版权等法律责任。如本公众号内容不妥,或者有侵权之嫌,请先联系小编删除,万分感谢!
药物咨询|去泛素化酶OTUB1在肝癌索拉非尼耐药中的潜在作用及其靶向化合物筛选
点击“阅读原文”,免费下载论文

