大数跨境

前沿:东南大学崔铁军院士最新Nature Communications

前沿:东南大学崔铁军院士最新Nature Communications 两江科技评论
2025-12-05
6
导读:东南大学崔铁军院士团队提出一种工作在微波频段的可编程多层全空间非线性神经网络,其非线性层通过集成射频元件的可编程超表面实现类ReLU激活功能。
图片
图片
文章来源:超材料人
光学衍射神经网络正以其卓越的速度和能效优势,为机器学习领域带来革新。然而,非线性激活函数存在的响应延迟、高功耗及级联复杂性等挑战,制约了其性能表现与实际应用。东南大学崔铁军院士团队提出一种工作在微波频段的可编程多层全空间非线性神经网络,其非线性层通过集成射频元件的可编程超表面实现类ReLU激活功能。该非线性架构实现了纳秒级延迟(17.7纳秒),较基于光电转换的非线性实现方案呈现出数量级的速度提升。此外,该系统具备极低功耗阈值与可重构非线性激活函数的特性,在图像分类和实时人体姿态识别任务中展现出卓越的分类能力。这种兼具低延迟、高速度、低功耗及柔性非线性激活特点的架构,在安检筛查、医疗康复、人机交互等众多领域具有广阔应用前景。

图文速览

图1:MN-DNN的多任务处理能力。a MN-DNN工作原理示意图。该网络能够同时执行基于数据集的图像识别和实时人体姿态分类。携带输入信息的入射电磁波经过包含三个线性层与三个非线性层的MN-DNN处理,每个非线性单元集成射频探测器、放大器和电压加法器。分类结果对应输出平面上能量最强点的空间位置。b 非线性超表面单元的输入-响应特性曲线,呈现具有动态可调阈值与斜率的类ReLU特性:弱输入时输出可忽略不计,超过阈值后呈线性增长。c 单层非线性超表面实验测得的时延(17.7纳秒)。d-f 分别通过MNIST手写数字数据集(d)、Fashion-MNIST服装数据集(e)和人体姿态(f)任务对分类能力进行的实验验证。

图2:非线性超表面单元的结构与工作特性。a 单元结构及功能等效示意图。b 单元正反面视图。c 工作原理示意图。d 射频探测器输出的直流电压随入射功率密度增加而上升。e 射频放大器增益由直流电压VCC和VCTRL控制。f,g 增益响应随VCC(f)和VCTRL(g)的变化关系:两者均在低电压区呈现截止特性,随后逐步增大并最终饱和。h 在高VBIAS条件下(VBIAS>1.2V),输出能量与输入呈线性关系,且增益随VCC增大而提升。i,j 传输系数随入射能量从截止区升至饱和区:VBIAS可降低能量阈值(i),VCC则提高传输饱和值(j)。k 当VBIAS=1V、VCC=5V时,传输特性在1mW以下为零,超过该阈值后线性增长,呈现类ReLU响应。l 激活阈值随VBIAS增大而降低。m 增益值随VCC增大而升高。

图3:手写数字分类。a MNIST数据集中的示例图像,包含10个数字类别(0-9)。b 将二值化图像编码至输入超表面的传输系数。c 实验测试装置示意图。d 两种网络架构示意图:包含线性层与非线性层交替排列的非线性网络,以及仅含线性层的线性网络。e 两种网络测试集输出的t-SNE可视化结果,显示非线性网络具有更清晰的类别区分度和更紧密的类内聚类。f 混淆矩阵表明,在5000张测试图像上非线性网络准确率达92.6%,线性网络为88.5%。g 简单图像经两种网络生成的输出场分布样例,显示两者均能聚焦目标区域。h 复杂图像经两种网络的输出场分布样例:非线性网络聚焦正确区域,而线性网络则聚焦错误区域。

文章小结

我们通过将射频放大器、射频探测器和电压加法器集成于超表面单元,构建出新型多层非线性衍射神经网络(MN-DNN),实现了具有纳秒级延迟的类ReLU非线性特性,其性能超越传统光电方法。系统延迟可通过多种优化途径进一步降低(详见补充说明28)。通过在非线性层采用高性能有源元件,时间延迟可从纳秒量级优化至皮秒量级:例如采用高摆率运算放大器可将计算延迟降至200皮秒以下,使用快速响应二极管(如肖特基势垒二极管)作为射频探测器可将延迟缩短至220皮秒。若将传统射频放大器替换为高速射频肖特基二极管开关(约6皮秒),可实现更卓越的响应速度。理论计算表明,单层延迟可缩减至426皮秒以内,与现有最快非线性层相当;在适当权衡可重构性后,延迟可进一步降至226皮秒。此外,通过优化非线性网络架构(如提高工作频率、缩减层间间距),可有效最小化传播延迟,从而压缩输入输出平面间的径向距离。关于激活函数类型,通过修改非线性超表面的有源电路,可实现Tanh函数与Leaky-ReLU函数等多种替代形式(参见补充说明29)。

该MN-DNN具备原位训练潜力,可通过FPGA调节非线性层单元的偏置电压,并从集成探测器提取输出电压以表征节点强度。未来实施方案将采用射频探测器阵列检测输出面能量分布,通过FPGA进行梯度计算并采用梯度下降法更新权重,实现循环训练。通过将高频半导体器件与超表面设计集成,该系统可扩展至毫米波与太赫兹频段。这种构型在保持集成密度的同时支持更高频段操作,有利于实现小型化高度集成系统。在网络规模扩展时,采用更快速、更低功耗器件可提升能效。由于强扩展性优势,我们的网络在扩展至更大单层配置时可实现更高能效。例如采用56×56单元单非线性层的系统能效达4TOPS/W,跻身先进能效设计行列。

针对图像分类任务,未来架构改进可聚焦两个关键方向以提升识别精度并适应更广泛任务:其一,在输入层超表面集成数模转换器可实现连续灰度输入,从而提升信息保真度与特征提取精度(参见补充说明30);其二,通过增加超表面单元密度与层数进行系统维度扩展,可增强非线性处理能力,最终提升模式判别性能。本研究通过MNIST和Fashion-MNIST数据集验证了MN-DNN在图像分类准确率上显著优于线性网络,同时展示了MN-DNN在空间电磁波实时处理及静态动态姿态精准识别方面的能力。该MN-DNN凭借低延迟、良好适应性与广泛适用性,在实时感知、运动识别与信息处理领域展现巨大潜力,预示着广阔的技术创新前景。

原文链接:

https://doi.org/10.1038/s41467-025-65275-0
免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间后台联系,我们将协调进行处理,所有来稿文责自负,两江仅作分享平台。转载请注明出处,如原创内容转载需授权,请联系下方微信号。
图片

【声明】内容源于网络
0
0
两江科技评论
聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
内容 6001
粉丝 0
两江科技评论 聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
总阅读15.3k
粉丝0
内容6.0k