钱超/陈红胜团队Light丨超表面探索者MetaSeeker: 远程绘制隐身空间- 大数跨境

首页

钱超/陈红胜团队Light丨超表面探索者MetaSeeker: 远程绘制隐身空间

两江科技评论

2025-06-13

导读：近日，浙江大学钱超研究员与陈红胜教授团队报道最新成果MetaSeeker (Metasurfaces Seeker)，通过自博弈强化学习驱动集群超表面，首次在动态无序环境中构建开放的电磁隐身空间。

撰稿 | 课题组撰稿‍‍‍‍‍

导读

近日，浙江大学钱超研究员与陈红胜教授团队报道最新成果MetaSeeker (Metasurfaces Seeker)，通过自博弈强化学习驱动集群超表面，首次在动态无序环境中构建开放的电磁隐身空间。这项成果有望使车辆、行人等在三维空间中像“幽灵”般自由穿行，为电磁防护带来新的实现途径。

该成果以“MetaSeeker: sketching an open invisible space with self-play reinforcement learning”为题发表在《Light: Science & Applications》。浙江大学吴贝博士为本文的第一作者，钱超研究员和陈红胜教授为本文的通讯作者。

研究背景

传统隐身技术依赖“量身定制”的超材料外衣，制造工艺复杂，机动性差；如同给目标缝制一件固定尺寸的外衣，一旦目标改变，外衣需重新裁制。浙江大学研究团队另辟蹊径，提出集群超表面，在无序环境中随机排布，采用自博弈强化学习驱动，远程构建电磁隐身空间。如图1所示，系统引入分布式协同理念，即使部分组件损坏，剩余超表面仍能自主重组网络，实现“断臂再生”的智能修复。

图1. 超表面集群MetaSeeker构建电磁隐身空间

智能协同进化：从围棋游戏到智能隐身的跃迁

MetaSeeker的核心在于构建物理世界的“数字孪生镜像系统”，使强化学习智能体能够快速洞察混沌物理系统的运行规律。如图2所示，该算法采用双层优化框架，巧妙地融合了深度强化学习与群体优化策略。其中，群体优化策略采用达尔文式进化机制，通过将变异后性能优异的智能体替代低效的个体，从而动态优化强化学习的核心超参数，包括Dirichlet探索噪声、正则化参数和学习率。与此同时，强化学习智能体负责优化集群超表面的相位分布，借鉴MuZero在棋类博弈中的思维过程，将超表面抽象为“电磁棋局”，每个超原子作为“棋盘位点”，通过精准调控超原子“开/关”状态实现空间隐身。

MetaSeeker配备了“感知-决策-执行”一体化的硬件模块，使智能体能够与现实世界进行自主交互，并基于远场反馈信号进行现场学习。相当于为强化学习智能体富有智慧的“机械大脑”配备了灵活的“四肢”，使之随意操纵集群超表面以调控空间电磁波，并敏锐地嗅到每次决策对应的电磁波变化，从而不间断地学习复杂环境蕴含的底层物理，并改变决策以最大化隐身性能。这种自学习机制使MetaSeeker轻松处理分布式超表面的复杂优化问题，灵活适应千变万化的场景。

图2. MetaSeeker算法架构。（a）自主进化的强化学习策略；（b）微波实验场景；（c）每个强化学习智能体在训练过程中的隐形表现；（d）智能体的内部模型架构；（e）用于指导智能体实际决策行为的蒙特卡洛树搜索策略。

视频S1：隐身空间的动态实验验证。

智能隐身：从单体隐身到空间隐身的跃迁

实验展示了MetaSeeker的认知水平与响应时间随着训练的变化过程，随着训练的推进，MetaSeeker的认知水平逐步从表层认知向深度理解跃迁，从初期的预测单个超原子相位改变对远场强度的影响，深化到预判超表面对电磁波的全局调控能力。隐身效率同步提升的同时，响应延时也从初始阶段的分钟级显著缩短至毫秒量级，最终系统在89 ms的极速响应周期内达成99.5%的隐身性能，其决策延迟对实际应用场景的影响可忽略不计。经过反复的实验验证，当小车驶过隐身空间或实验员在隐身空间内自由行走时，喇叭天线探测到的远场强度始终保持稳定。

视频S2：强化学习的知识表征能力与响应时间的进化过程。

研究团队进一步通过事后可解释性算法SHAP对MetaSeeker的决策行为进行了深度解析，如图3所示，其中红色与蓝色像素分别表征干扰源或超表面增强与抑制远场强度的作用区域。实验证实，干扰源与超表面对远场强度的作用呈现动态抗衡关系——前者引发的异常散射场可被后者产生的反向散射场精确抵消，这种精妙的散射相消机制，正是系统实现电磁隐形的物理本质。

图3. 动态实验演示与可解释性分析。（a）三种动态实验演示的示意图；（b）实验隐身效果；（c）MetaSeeker表现能力随训练过程的进化；（d）MetaSeeker的可解释性分析。

总结与展望

该研究的“动态消隐”能力源于两大突破：（1）超表面群体智能：通过融合可重构超表面阵列与电磁散射相消理论，建立自组织电磁拓扑网络，其核心突破在于将传统个体调控升级为分布式群体调控；（2）智能计算革命：在MuZero算法基础上进行改进，突破传统的逆向设计架构。该成果在卫星通信抗干扰、城市电磁污染治理甚至量子领域具有广阔应用前景。

论文信息

Wu, B., Qian, C., Wang, Z. et al. MetaSeeker: sketching an open invisible space with self-play reinforcement learning. Light Sci Appl 14, 211 (2025).

https://doi.org/10.1038/s41377-025-01876-0

免责声明：本文旨在传递更多科研资讯及分享，所有其他媒、网来源均注明出处，如涉及版权问题，请作者第一时间后台联系，我们将协调进行处理，所有来稿文责自负，两江仅作分享平台。转载请注明出处，如原创内容转载需授权，请联系下方微信号。

【声明】内容源于网络

两江科技评论

聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域，打造科研人便捷的交流平台，发布优质新鲜的科研资讯。

内容 6001

粉丝 0

两江科技评论聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域，打造科研人便捷的交流平台，发布优质新鲜的科研资讯。

总阅读13.9k

粉丝0

内容6.0k