近日,东南大学毫米波全国重点实验室崔铁军院士、马骞副教授团队提出了一种基于Pancharatnam-Berry(PB)相位超表面的机械可编程衍射神经网络。该网络通过机械调控PB相位单元旋转角度,精确重构PB相位分布,从而赋予其灵活的可编程性以适配多种任务。系统融合了无源网络的低功耗与可编程网络的灵活性。相关研究成果以“Mechanically Programmable Diffractive Neural Networks Based on Pancharatnam-Berry Phase”为题,于2025年10月26日发表于《Advanced Functional Materials》。东南大学崔铁军院士、马骞副教授为论文共同通讯作者,东南大学信息科学与工程学院博士生宁玉鸣和马骞副教授为共同第一作者,合作者包括东南大学博士肖强、博士生李睿思、吴倩文、顾泽、陈龙以及游检卫教授。
近年来,光计算凭借其低功耗、高度并行和光速运算等优势发展迅速。然而,基于无源衍射的神经网络因功能固化,在多任务适应性与实际应用中存在明显不足,从而推动了可编程衍射神经网络架构成为当前研究热点。目前已有多种可编程方案被提出,包括基于有源器件的可编程超表面、空间光调制器(SLM)、数字微镜器件(DMD)以及马赫-曾德尔干涉仪(MZI)等。尽管如此,现有可重构方案仍普遍面临高功耗、系统结构复杂及单元间串扰等关键挑战,限制了神经网络性能的充分发挥。
在此背景下,研究团队提出了一种基于Pancharatnam-Berry(PB)相位超表面的机械可编程衍射神经网络(MP-DNN),其结构如图1所示。该网络以可旋转的PB相位超表面为基本单元,通过机械调控各单元的旋转角度,灵活操纵其相位分布,从而赋予整个系统可编程特性与多任务适应能力。实验结果表明,该系统在手写数字识别与星座符号分类等多任务场景中,均展现出良好的机械可编程性与高精度分类性能。
图1 面向多任务处理的机械可编程衍射神经网络。a) 多任务分类原理示意图。携带输入信息的圆偏振波依次通过三层可编程PB相位超表面,在输出平面上形成能量分布;根据预设区域内能量最大位置实现分类任务。通过旋转PB相位单元实现网络可编程性,动态调控不同任务所需的相位分布。b) 可旋转PB相位单元结构示意图。单元结构由可旋转的顶层与固定的薄背板通过中心轴连接构成,外部驱动可实现顶层旋转。c) PB相位单元电磁响应特性。交叉极化透射相位与旋转角度呈线性关系,从而实现精确的相位调制。
可编程PB相位超原子的结构包含两个主要部分:顶部是可旋转的惠更斯单元,底部为固定的薄背板(图2a)。在圆偏振入射波作用下,大部分透射能量发生交叉极化转换,生成交叉极化圆偏振波。该交叉极化通道的透射相位与单元旋转角θ之间呈二倍角线性关系。由于PB相位具有自旋相关性,其对左旋与右旋圆偏振入射波会施加方向相反的相位调制,具体如图2d、e、f所示。
图2 可旋转PB相位单元的结构与特性。a) 单元结构示意图,显示可旋转圆柱单元与固定背板;b) 单元层状结构示意;c) 顶层结构示意图;d) 左旋圆偏振入射下,交叉极化通道(右旋圆偏振分量)的相位随旋转角θ呈二倍线性变化(0°至180°旋转对应0°至360°相位覆盖);e) 庞加莱球示意图:左旋入射时偏振态沿经线由南极向北极演化,右旋入射时则反向演化;f) 右旋圆偏振入射下,交叉极化通道(左旋圆偏振分量)的相位随θ呈负二倍线性依赖(0°至180°旋转对应360°至0°相位递减)。
图3 MP-DNN的训练。a) 网络训练过程:超表面各单元的PB相位作为可独立优化的权重(0~2π范围),通过反向传播进行更新。b) 第1、3层超表面的权重-旋转关系:权重(相位)从0°增至360°,单元旋转角沿逆时针由0°增至180°。c) 第2层超表面的权重-旋转关系:权重(相位)同样覆盖0°至360°,单元旋转角沿顺时针由180°减至0°。
如图3所示,输出平面被划分为对应不同图像类别的区域。训练过程中,通过误差反向传播算法优化超表面的相位分布,旨在使能量场最强的区域与输入图像的类别相匹配。训练完成后,将优化得到的相位值映射到具体的结构参数,即每个PB相位单元的旋转角度。
图4 十二星座符号分类。a) 输入数据集示意图,包含从水瓶座到摩羯座共12个类别。b-d) 三层衍射层的优化相位分布及旋转角分布。e-g) 三个代表性星座的输入图像及对应输出场模拟结果,输出场准确聚焦至目标区域。
网络的性能首先通过十二星座分类任务进行评估。训练所得的PB相位与对应的单元旋转角见图4。结果显示,MP-DNN能有效分类星座图案,其成功表现为:输入图案在输出平面正确区域激发的能量最大值显著高于其他区域(图5)。
图5 星座分类的实验场景与测量结果。a) 实验装置:左旋圆极化喇叭天线照射MP-DNN输入层,将携带图像信息的电磁波馈入网络;输出场由近场扫描仪采集,通过测量x与y极化分量合成圆极化场分布。b-e) 四个测试图像的右旋圆极化输出场分布,显示能量均准确聚焦于目标区域。
为作进一步验证,第二个任务采用了手写数字识别。网络经MNIST数据集训练后,其优化确定的超表面相位与单元转角见图6,对应的测试系统实物与性能结果见图7。
图6 手写数字分类。a) 识别所用MNIST数据集示意图,包含0-9共10类手写数字。b) 测试集混淆矩阵(MSE作为损失函数,准确率:81.22%)。c) 测试集混淆矩阵(SoftMax作为损失函数,准确率:89.23%)。d-f) 三层衍射层的优化相位与旋转角分布。
图7 手写数字测试场景与结果。a) 实验装置:左旋圆极化喇叭天线照射MP-DNN输入层,将携带图像信息的电磁波馈入网络;输出场由二维近场扫描仪采集,通过测量x与y极化分量合成圆极化场分布。b-e) 四个测试图像的右旋圆极化输出场分布,显示能量均准确聚焦于目标区域。
本研究提出了一种基于PB相位超表面的机械可编程衍射神经网络。通过调控超表面各单元的旋转角度,实现了对PB相位分布的灵活编程,从而使网络架构具备可重构能力,以适配多样化任务。实验验证了该系统的可编程特性,在多项任务中均实现了高精度分类。该设计融合了无源网络的低功耗优势与可编程网络的灵活性,展现出良好的应用潜力。
该工作得到了国家自然科学基金、江苏省自然科学基金、国家重点研发计划、江苏省多维感知信息技术联合实验室等项目的支持。

论文信息:
Y. M. Ning, Q. Ma, Q. Xiao, et al. “ Mechanically Programmable Diffractive Neural Networks Based on Pancharatnam-Berry Phase.” Adv. Funct. Mater. (2025): e12689.
https://doi.org/10.1002/adfm.202512689
撰稿|课题组

