论文秀#25IJCAI｜Mixture-of-QueriesTransformer如何破解伪装难题

蚂蚁技术AntTech

2025-08-21

国际人工智能联合会议（International Joint Conference on Artificial Intelligence，简称IJCAI）是人工智能领域最具影响力和权威性的国际学术会议之一。IJCAI 2025将于2025年8月16日至22日在加拿大蒙特利尔（Montreal, Canada）召开，本届会议共收到5404篇有效投稿，接收率为19.3%。本期论文秀Live聚焦伪装目标检测与分割的前沿研究，深度解读一项突破性成果——Mixture-of-Queries Transformer（MoQT），揭示其如何通过“查询间的合作”与“频域增强”破解伪装难题。

Mixture-of-Queries Transformer: Camouflaged Instance Segmentation via Queries Cooperation and Frequency Enhancement / Mixture-of-Queries Transformer：利用查询间的合作和频域增强进行伪装目标实例分割

由于伪装实例与周围环境的高度相似性，伪装实例分割以及广泛的类伪装场景（如伪造检测等）是一项具有挑战性的相关任务。以前的方法忽略了伪装对象的颜色和轮廓性质，然后本能地决定每个候选对象。在本文中，我们基于两个关键设计（频率增强特征提取器和混合查询解码器），以端到端的方式为伪装实例分割贡献了一个Mixture-of-Queries Transformer。首先，频率增强特征提取器负责捕获频域中伪装的线索。为了暴露伪装的实例，提取器增强了轮廓的有效性，消除了干扰颜色，同时获得了增强的特征。其次，混合查询解码器利用每一层中的多个新初始化的查询专家(被认为是专家的一组查询)，用于协作地发现伪装的特征。这些专家协作使用混合查询机制生成输出，并按层次细化到细粒度级别，以获得更准确的实例掩码。耦合这两个组件使MoQT能够使用多个专家在空间和频率域整合伪装物体的有效线索。广泛的实验结果表明，我们的MoQT在COD10K和NC4K数据集上都优于19种最先进的伪装实例分割方法。