
在后摩尔时代的浪潮中,存算一体技术如同一艘破浪前行的航船,正试图突破传统冯诺伊曼架构的“存储墙”和“功耗墙”,引领我们驶向能效比提升的未知海域。他如同一颗璀璨的新星,照亮了后摩尔时代的技术夜空。它不仅有望突破冯诺伊曼架构的桎梏,更承诺带来一场能效革命,让我们的计算设备更加智能、高效。
想象一下,如果计算机的存储和计算能力能够像魔法一样融合在一起,那会怎样?这正是存算一体技术的魅力所在。它不仅仅是一种技术,更像是一场革命,一场能够让我们的数据和运算效率飞跃的革命。
存算一体技术的发展,不仅在学术界引起了广泛关注,也在产业界掀起了一股创新浪潮,作为国家战略层面的重要组成部分,正在受到从学术研究到产业应用的全方位推进。例如,2022年中国移动联合多家机构发布的《存算一体白皮书》,为存算一体技术的标准化和产业化提供了重要参考。此外,阿里达摩院将存算一体技术列为“2023年度十大科技趋势之一”,进一步凸显了其在未来科技发展中的重要地位。作为存算一体创新赛道的一员,智芯科也在积极推进存算一体技术的商业化布局,努力推动存算一体技术成熟和生态繁荣,加快存算一体技术的产业化进程与应用推广,助力我国在先进计算领域实现高水平自立自强。
存算一体
让我们把时光机倒回上世纪50年代,那时就有人梦想着将计算逻辑嵌入存储单元。然而,直到70年代,斯坦福研究所才首次点亮了存算一体的火炬。虽然当时的技术限制和成本问题让这把火炬暂时熄灭,但它的火种从未熄灭,一直在等待重燃的那一天。
此前相当长的一段时间内,大部分存算一体研究本质上实现的是 “近存计算”,其核心设计理念在于缩短存储器与处理器的物理距离,提高内存带宽,其技术路径包括3D封装和高带宽内存等。
近存计算通过芯片封装和板卡组装等方式,将存储单元与计算单元集成,进一步缩短计算与存储的物理距离,尽可能减少数据搬移,并增加访存带宽,进而提升整体运算效率,其与存内计算最大的区别是, 近存计算仍然需要把数据从内存中读取出来之后再就近进行计算, 计算的结果还要再存储到内存当中。近存计算本质上仍然属于存算分离的冯诺依曼架构, 虽然可以在一定程度上减少数据搬运及其开销, 但不能从根本上消除冯诺依曼瓶颈。近存计算技术相对较成熟, 已经能够实现规模化量产,其中以 AMD、Intel、三星、海力士等企业为代表的半导体龙头企业均已发布多款基于高带宽内存技术 (high bandwidth memory, HBM) 和 2.5D/3D 封装技术的近存计算芯片。
如今,随着新型存储技术如PCM、RRAM、MRAM的诞生,存内计算技术终于迎来了它的春天。这些技术不仅拥有非易失性和高速度的双重优势,还能在存储单元内部直接执行计算操作,让我们的数据传输更加迅速,能耗更低。
存内计算两大派系
在存内计算的世界里,有两大门派:模拟存内计算和数字存内计算。模拟存内计算如同一位内功深厚的武林高手,能效高但精度和可靠性略显不足。而数字存内计算则像一位精通各种武技的战士,虽然单位面积能效和成本相对较大,但能够实现任意精度,是未来技术发展的重要方向。
模拟存内计算主要基于电路的物理性质,依据欧姆定律和基尔霍夫定律,在存算阵列上实现矩阵乘加运算,且需要数模转换器和模数转换器进行信号转换。模拟存内计算能效高, 但精度和可靠性较低。比如忆阻器就可以实现的阵列结构电路,该结构与矩阵形状类似,并具有矩阵运算能力,可以广泛应用于AI推理场景中。

图源:《存算一体白皮书》
数字存内计算则是通过在存储阵列内部加入逻辑计算电路,通常基于加法树与移位器实现,使得数字存内计算阵列具备存储及计算能力,并可以实现任意精度, 但单位面积能效和成本相对较大。其中以SRAM为代表的数字存内计算技术正在快速发展。数字存内计算的存储单元只能存储单bit数据,需增加部分传统逻辑电路,相比于模拟存内计算,一定程度上限制了面积及能效优势,当前业界多采用可兼容先进工艺的SRAM来实现数字存内计算。

图源:《存算一体白皮书》

图源:存算一体芯片发展现状、趋势与挑战
如今,业内已基于多种存储介质实现了存内计算芯片设计。其中包括静态随机存储器(SRAM)、NOR Flash、阻变随机存储器(RRAM)、磁性随机存储器(MRAM)、相变存储器(PCM)五种主流的存储器件。基于传统存储介质,如静态随机存储器(static random access memory, SRAM) 和 NOR flash技术的存内计算芯片设计已相对成熟, 已经实现小规模量产和出货; 而基于新型非易失性存储器介质的存内计算芯片, 如磁性随机存储器 (MRAM)、阻变随机存储器 (RRAM)、相变存储器 (phase change random access memory, PCRAM)、铁电存储器 (ferroelectric gate field-effecttransistor, FeFET) 等, 正在由基础研究逐步向产业化迈进。
存内计算未来
随着存内计算技术的不断成熟,我们已经看到了基于SRAM、NOR Flash、RRAM、MRAM、PCM等存储介质的存内计算芯片设计。这些技术正从实验室走向市场,不仅推动了存内计算的产业化,预示着一场技术革命的来临,更为我国在先进计算领域的自立自强提供了强有力的支持。
智芯科从2019年就专注存内计算大算力芯片开发,是存内计算芯片的开拓者和领跑者,不断探索和突破技术边界,提高运算效率,降低使用成本,为新质生产力提供人工智能自主可控算力底座。
现有自主研发的核心技术-基于精度无损存内计算(CIM)超低功耗神经网络处理器芯片,基于多元场景已实现产品与技术快速落地,将不可能变成可能,重新定义边缘计算芯片,致力于让AI走进千家万户!
结语
本期AI芯之旅带您回顾了存内计算芯片的发展,下一站,我们将探索AI算法如何在这些神奇的芯片上施展它们的魔法。敬请期待,不见不散!


