>

破除水军机器人！北航团队发布全新对抗性框架SIAMD：用“结构信息”破译机器人伪装｜IEEE TPAMI

>

0

0

破除水军机器人！北航团队发布全新对抗性框架SIAMD：用“结构信息”破译机器人伪装｜IEEE TPAMI

破除水军机器人！北航团队发布全新对抗性框架SIAMD：用“结构信息”破译机器人伪装｜IEEE TPAMI

AI前线

2026-01-07

6

导读：本文介绍来自北京航空航天大学彭浩老师团队发表在 TPAMI 2025 上的一篇文章“Proactive Bot Detection Based on Structural Information Pr

北航彭浩团队提出SIAMD框架：基于结构信息原理的主动社交机器人检测方法

本文介绍北京航空航天大学彭浩老师团队发表于IEEE TPAMI 2025的论文《Proactive Bot Detection Based on Structural Information Principles》。

论文链接：https://ieeexplore.ieee.org/document/11311341

代码开源地址：https://github.com/SELGroup/SIAMD

研究背景与核心贡献

社交机器人持续进化，其模仿人类行为与规避检测的能力不断增强，对虚假信息治理与平台生态健康构成严峻挑战。针对该问题，研究团队提出基于结构信息原理的对抗性检测框架 SIAMD，首次将结构熵建模、多关系图演化与大语言模型（LLM）协同生成深度融合，实现对机器人行为的主动建模与鲁棒检测。

SIAMD的核心创新在于： • 构建统一异质图建模用户账户与社交消息的多类型交互； • 提出多关系结构熵量化账户社区内不确定性，并通过编码树优化揭示分层结构； • 联合驱动网络结构演化（社交活动判定+目标账户选择）与网络内容演化（LLM提示生成+消息节点注入）； • 实现图结构与语义内容的协同对抗演化，显著提升检测器在有效性、泛化性、鲁棒性与可解释性四方面的综合性能。

SIAMD架构解析

SIAMD包含四个递进阶段：

阶段 I：社交网络分析

从历史交互中提取用户账户（U）与社交消息（M）构建异质图Gₕ，边集Eₕ涵盖发布、转发、提及、回复、关注五类关系；
对账户描述与消息文本分别进行嵌入，获得结构-语义联合表征Xᵤ和Xₘ；
将异质图映射为多关系加权图Gₘ=(U, Xᵤ, {Eᵂᵣ}ᵣ∈R, W)，定义元路径集合R={f, p, m, rt, rp}，并归一化边权重。

阶段 II：网络结构演化

基于多关系结构熵建模机器人行为目标：①最小化被黑箱检测器识别的概率；②最大化消息传播影响力；
采用多智能体强化学习，在账户社区内模拟未来交互：高层策略πₕ决定机器人交互类型（如转发/提及），低层策略πₗ选择具体目标账户；
引入网络影响力ni(u)与行为相关性br(bⱼ,u)双指标，二者均源自结构熵推导，指导目标账户筛选。

阶段 III：网络内容演化

基于演化后的结构，为每组“机器人–目标账户–交互类型”三元组构建上下文提示词；
提示词融合三类背景：①账户元数据（关注数、描述等自然语言化）；②历史高相似度推文（余弦检索）；③社交关系图谱（关注/被关注列表）；
调用LLM生成拟真消息，作为新顶点注入异质图，并按交互类型建立连接，完成内容层面的协同演化。

阶段 IV：检测优化

在更新后的异质图上微调初始图神经网络检测器，以对抗方式最大化对建模机器人的识别概率；
将优化后模型作为下一轮演化的黑箱检测器，迭代提升主动检测能力。

实验验证

研究在Cresci-15、Cresci-17、TwiBot-20、TwiBot-22四大权威数据集上开展系统评估，对比特征型（BotHunter、SGBot）、内容型（BGSRD、RoBERTa）、图神经网络型（GraphHist、SATAR、BotRGCN、RGT）等前沿基线。

泛化能力

SIAMD在交叉验证各折叠中平均准确率达84.05%（标准差仅5.91），显著优于所有基线；在泛化最弱的Fold-1上仍保持75.1%准确率，证明其对分布偏移具有强适应性。

鲁棒性

面对LLaMA2-70B与ChatGPT驱动的对抗攻击（重写内容+篡改社交结构），SIAMD的准确率与F1分数下降幅度最小，远超其他方法，验证其对抗演化机制的有效性。

可解释性

可视化子社区内三类机器人行为模式：红色机器人高频转发但少原创，易被误判为人；黄色机器人高频表达观点，被稳定识别为机器人；绿色机器人低频交互、双向模仿，体现高隐蔽性。三者目标账户重叠，反映协同操纵意图，印证模型对复杂行为逻辑的可追溯性。

消融实验与敏感性分析

完整SIAMD显著优于仅含结构演化（SIAMD-SE）或内容演化（SIAMD-CE）的变体，证实二者协同的必要性；而SIAMD-CE表现优于SIAMD-SE，凸显结构信息原理在行为建模中的基础作用。此外，更换不同LLM（如LLaMA2、ChatGPT）对性能影响微小，表明框架设计不依赖特定大模型。

【声明】内容源于网络

0

0

AI前线

面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

内容 8040

粉丝 0

AI前线面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。

总阅读60.7k

粉丝0

内容8.0k