国际人工智能联合会议(International Joint Conference on Artificial Intelligence,简称IJCAI)是人工智能领域最具影响力和权威性的国际学术会议之一。IJCAI 2025将于2025年8月16日至22日在加拿大蒙特利尔(Montreal, Canada)召开,本届会议共收到5404篇有效投稿,接收率为19.3%。本期论文秀Live聚焦伪装目标检测与分割的前沿研究,深度解读一项突破性成果——Mixture-of-Queries Transformer(MoQT),揭示其如何通过“查询间的合作”与“频域增强”破解伪装难题。
Mixture-of-Queries Transformer: Camouflaged Instance Segmentation via Queries Cooperation and Frequency Enhancement / Mixture-of-Queries Transformer:利用查询间的合作和频域增强进行伪装目标实例分割
由于伪装实例与周围环境的高度相似性,伪装实例分割以及广泛的类伪装场景(如伪造检测等)是一项具有挑战性的相关任务。以前的方法忽略了伪装对象的颜色和轮廓性质,然后本能地决定每个候选对象。在本文中,我们基于两个关键设计(频率增强特征提取器和混合查询解码器),以端到端的方式为伪装实例分割贡献了一个Mixture-of-Queries Transformer。首先,频率增强特征提取器负责捕获频域中伪装的线索。为了暴露伪装的实例,提取器增强了轮廓的有效性,消除了干扰颜色,同时获得了增强的特征。其次,混合查询解码器利用每一层中的多个新初始化的查询专家(被认为是专家的一组查询),用于协作地发现伪装的特征。这些专家协作使用混合查询机制生成输出,并按层次细化到细粒度级别,以获得更准确的实例掩码。耦合这两个组件使MoQT能够使用多个专家在空间和频率域整合伪装物体的有效线索。广泛的实验结果表明,我们的MoQT在COD10K和NC4K数据集上都优于19种最先进的伪装实例分割方法。
论文亮点聚焦
频域魔法:首创频域-空间双域特征融合框架,破解伪装目标“隐形衣”。
协作解码:多查询专家动态协作,实现像素级精准分割与边界优化。
通用潜力:技术可扩展至深度伪造检测、医学影像分析等类伪装场景。
本期论文秀Live邀请到论文第一作者分享该技术的设计思路与验证过程。他们将深入解析频域增强与查询协作机制的核心原理,并展示模型在实际应用场景中的卓越性能。
冯巍巍:蚂蚁集团大安全机器智能高级算法工程师
【直播观看指南】直播速约,锁定前沿!
⏰ 观看时间:2025年8月21日 18:00-19:00
👀 观看平台:微信视频号【蚂蚁技术AntTech】、【蚂蚁技术研究院】 B站【蚂蚁技术研究院】同步直播,敬请预约关注!

