
本文由论文作者团队投稿
导读
光计算作为一种新型的计算范式具有大带宽、低延时、低功耗等显著优势,然而,光子集成较大的单元器件尺寸及有限的芯片面积限制了芯片的算力性能,另一方面,高速模拟光计算与低速数字电计算之间面临严重的带宽失配问题,并且需要使用高功耗的高速模数/数模转换器件,带来严重的功耗问题。
针对上述问题,中国科学院半导体研究所的李明研究员团队提出基于波长调谐、光波微波融合复用的高算力密度光学张量处理单元架构。该架构基于单个微环谐振器通过波长调谐实现创纪录的34.04 TOPS/mm2的算力密度,向高算力光计算芯片的实现迈出了坚实的一步;此外,该团队通过光波微波融合复用技术引入微波副载波,将高速光计算的大带宽切分成若干子带,发挥光计算大带宽优势的同时提高了数据输入维度,解决了光电带宽失配问题并避免高速高功耗模数/数模转换器件的使用,有力推动光计算芯片的实用化进程。
该成果以“High-integrated photonic tensor core utilizing high-dimensional lightwave and microwave multidomain multiplexing”为题发表在Light: Science & Applications。中国科学院半导体研究所李明研究员、石暖暖副研究员为共同通讯作者,孟祥彦博士后为第一作者。
张量作为高维数据的载体,构成人工神经网络的计算基础。随着深度学习技术的快速演进,特别是生成式人工智能取得突破性进展,神经网络模型的层间连接维度持续扩展,参数规模呈指数级增长。在此背景下,传统电子计算架构将存储与运算单元分离的设计范式,正面临着高时延、高能耗等系统性挑战,这些硬件层面的局限已成为制约人工智能技术迭代的关键因素。
研究团队开创性的提出基于单个微环谐振器波长调谐、光波微波融合复用的光学张量处理单元(OTPU,图1),实现超高算力密度的同时解决了光电带宽失配问题。

图1:光学张量处理单元
该架构利用微环谐振器(MRR)周期性陷波的特性,使用无需热调的MRR创新性的通过波长调谐方式实现卷积核重构,基于单个MRR即可实现传统架构中一个MRR阵列的功能,从而实现34.04 TOPS/mm2的超高算力密度(图2)。此外,该架构中由于使用无需热调的MRR,与传统的基于热调的MRR阵列相比避免了热调MRR过程中严重的热串扰问题,显著降低芯片调控的复杂度的同时降低了芯片的功耗。

图2:处理单元的 (a) 实物图;(b) 显微镜照片
该架构通过光波微波融合复用,利用信道化技术将宽带的光波频谱(~百GHz)切分成若干窄带的微波子频带(~GHz),每个微波子频带作为一个数据输入通道进行低速数据输入,从而在有效利用光计算大带宽优势的同时解决了高速光计算与低速电计算之间的带宽失配问题,避免了高功耗的高速模数/数模转换器件的使用,并扩展了数据输入维度,实现光学张量运算。
总结与展望
研究团队提出了一种新型高算力密度光学张量处理单元(OTPU),使用不依赖热调谐的MRR作为核心单元。通过波分复用技术,利用波长调谐实现权重灵活调控,实现34.04 TOPS/mm2的超高算力密度,为高算力光计算实现探索了一种全新方案。通过引入光波微波融合复用技术,提升了数据输入维度从而实现光学张量运算,解决了高速光计算与低速电计算之间的带宽失配问题,避免了对高功耗的高速模数/数模转换器件的依赖。这一研究成果不仅凸显了光计算在高性能计算和高维数据处理方面的巨大潜力,还为人工智能和数据科学中的复杂计算任务提供了一种更高效、更节能的解决方案。
论文信息
Meng, X., Shi, N., Zhang, G. et al. High-integrated photonic tensor core utilizing high-dimensional lightwave and microwave multidomain multiplexing. Light Sci Appl 14, 27 (2025).
https://doi.org/10.1038/s41377-024-01706-9
免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间后台联系,我们将协调进行处理,所有来稿文责自负,两江仅作分享平台。转载请注明出处,如原创内容转载需授权,请联系下方微信号。

