大数跨境

Laser & Photonics Reviews |基于光学超表面的高性能并行卷积神经网络加速器

Laser & Photonics Reviews |基于光学超表面的高性能并行卷积神经网络加速器 两江科技评论
2024-06-26
4
导读:近日,香港中文大学电子工程系黄超然教授课题组在基于光学超表面的并行卷积神经网络加速器取得进展。该卷积加速器由单片超薄超表面光学前端与数字成像处理后端组成。


欢迎课题组投递中文宣传稿,投稿方式见文末

稿|课题组供稿

导读


近日,香港中文大学电子工程系黄超然教授课题组在基于光学超表面的并行卷积神经网络加速器取得进展。该卷积加速器由单片超薄超表面光学前端与数字成像处理后端组成。光学和数字单元可以10 µm间距紧凑集成(图1),可实现0.016mm3的小体积,并能够对不同偏振的光学图像进行低功耗、低延时和高精度的并行卷积处理。该工作在实验上验证了其在加速卷积神经网络方面的优异性能,并在不同偏振光照射下实现高图像分类准确率。该研究成果发表在国际权威学术期刊《Laser & Photonics Reviews》上,标题为Meta-Optics Based Parallel Convolutional Processing for Neural Network Accelerator

香港中文大学电子工程系黄超然教授为本文通讯作者,黄超然教授课题组博士研究生罗明成为本文第一作者。本文合作作者包括黄超然教授课题组博士研究生徐滕基、香港中文大学电子工程系曾汉奇教授及其博士研究生肖舒琦,以及香港中文大学电子工程系许正德教授。该工作得到了香港信兴高等工程研究所、香港创新科技署、香港研究资助局、香港中文大学等的资助。

图1. 左图:基于光学超表面的并行卷积神经网络加速器示意图;右图:超表面芯片实物图。

研究背景

卷积神经网络已成为计算机视觉应用(例如自动驾驶汽车、增强现实、物体跟踪和检测)中的主要人工智能算法。然而,提高卷积神经网络性能通常需要大量计算资源。因此,在计算资源有限的边缘设备和系统中部署高性能卷积神经网络模型存在挑战。光学卷积加速器是克服这一挑战有吸引力的解决方案。与片上集成光子器件和光纤相比,空间光学元件可放置在成像系统前面,直接处理光编码图像,无需进行耗电的模数-数模转换,从而实现亚皮秒的处理延迟和几乎为零的功耗。超表面作为新兴的空间光学元件,因其超紧凑和高度设计自由度的优点,最近也被用于开发高性能光学卷积加速器。然而,目前基于超表面的光学卷积加速器需要在超表面前放置额外的组件,如偏振器和透镜,这增加了系统集成的难度和体积。此外,光衍射引起的串扰也会限制卷积神经网络的计算精度,严重影响其在实际应用中的性能表现。

研究亮点

本文提出并实验演示了一种新型的基于超表面的光学卷积加速器设计,以解决现有技术所面临的挑战。该设计可消除对透镜和偏振器等额外光学元件的需求,使超表面能够无缝且紧凑地集成到后续成像系统中,可实现0.016 mm³的系统体积。此外,通过优化超表面透射光场的空间相位,可有效抑制相邻图像传感器之间的空间串扰,使其低至-20dB,从而显著提升卷积计算精度。同时,该超表面能够并行计算多个卷积核,因此可作为卷积神经网络中的光学卷积层,应用于各种图像处理任务。在不同线偏振光的入射下,本文可实现对MNIST手写数字96% 的识别准确率。基于超表面的光学卷积加速器作为一种节能高速的边缘计算硬件,可广泛应用于各种机器视觉系统。


本文中超表面单元为圆柱体型(图2a),具有对光学偏振不敏感的优点,这使得超表面能够处理任意线偏振态的光学信息。通过调整超表面单元半径,可实现对入射光全相位2π调制(图 2b)。将超表面圆柱单元以特定方式排列在二维平面上,可形成对入射光具有聚焦效果的超表面透镜(图2c),绝大部分光场能量集中在图像传感器的有效区域内,仅有极少部分光场能量通过光衍射传播到相邻图像传感器,从而显著降低相邻图像传感器之间的串扰。超表面透镜的聚焦效率被定义为卷积核的权重。为实现连续可调的卷积核权重,我们在传统超表面透镜中引入米式共振(Mie resonance)超表面单元,米式共振会导致透射效率降低,通过优化米式共振超表面单元数目,可实现一系列连续的超表面透射效率(图2d)。


图2. (a)超表面单元结构示意图;(b)超表面单元光学响应随其半径的变化关系;(c)超表面透镜的聚光光场分布;(d)不同聚光效率的超表面所对应的权重。

本文中制备的超表面可用于图像特征提取(图3a)。通过粒子群算法优化所有超表面单元结构的半径,以实现用于特征提取的4个3×3卷积核(图3c),仿真与目标设计的卷积核在数值上接近,可实现7.3×10-4 的低均方根误差。实验所测的超表面透射光场与仿真结果一致,不同强度的聚焦光斑表明不同的卷积核权重(图3b)。实验所得的图像卷积特征图与目标设计结果吻合,图中物体的垂直和水平方向特征皆被有效提取,可实现7.7×10-4  的低均方根误差(图3d)。


图3. (a)用于图像特征提取的超表面光学显微图;(b)实验所测超表面透射光场分布与仿真透射光场分布;(c)目标设计、仿真与实验所测的卷积核;(d)超目标设计、仿真与实验所测的图像卷积特征图。


本文中制备的超表面可用作卷积神经网络中的卷积层,实现低延时和低功耗的并行卷积,从而加速卷积神经网络计算。在实验中,超表面为卷积神经网络提供4个并行的3 × 3卷积核,这些卷积核预先在计算机上进行MNIST图像分类任务的训练,并通过优化超表面来实现这些预训练卷积核。实验测得的光场分布与仿真结果一致(图 4a),从中可提取出4个卷积特征图(图 4b)。这些卷积特征图被输入到后端数字全连接网络中,以生成输入图像的预测分类结果(图 4c)。利用MNIST光学图像,对基于超表面的卷积神经网络性能进行测试,最终实现96 % 的分类准确率(图 4d)。对于不同偏振方向的入射光,制备的超表面展现出一致的透射率(图 4e),实验结果与仿真结果高度一致。针对不同偏振光编码的MNIST图像,基于超表面的光电融合卷积神经网络系统表现出一致的96 % 准确率,表明所提出的超表面光学卷积加速器可有效处理各种光偏振的信息。


图4. (a)实验所测与仿真的超表面透射光场分布;(b)实验提取与仿真的图像卷积特征图;(c)基于光学超表面的光电混合卷积网络加速系统架构示意图;(d) MNIST数据集图像分类的混淆矩阵,实验准确率为96 %;(e)实验与仿真的超表面透射率与入射偏振角度的关系;(f)不同偏振方向下的MNIST图像分类的实验准确率。

总结与展望


本文展示了一种基于超透镜单元组成的单个超表面的超紧凑光学卷积加速器,能够以光速并几乎零能耗的方式并行计算多个卷积核,用于光编码图像的处理。在该设计中,利用超透镜的光聚焦特性和高度几何对称的硅圆柱单元,可实现低串扰和优异的光学偏振不敏感性。此外,我们还构建了基于超表面的光电融合卷积神经网络加速系统,用于MNIST手写数字识别。实验结果表明,在各种偏振方向上,该系统能够达到96%的识别准确率。所提出的基于超表面的光学卷积加速器具备低延迟和低功耗的特点,并能与数字成像和处理系统实现紧凑集成,这将推动各种需要边缘计算的机器视觉应用的发展。


全文链接:
https://doi.org/10.1002/lpor.202300984

免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间后台联系,我们将协调进行处理,所有来稿文责自负,两江仅作分享平台。转载请注明出处,如原创内容转载需授权,请联系下方微信号。

【声明】内容源于网络
0
0
两江科技评论
聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
内容 6001
粉丝 0
两江科技评论 聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
总阅读15.3k
粉丝0
内容6.0k