存算一体技术将在自动驾驶、AI处理、物联网等云边端场景广泛应用,对提升运算效率、降低系统功耗及设备成本等带来广阔的收益。
因此,今年仅过去一个季度的时间,“存算一体”便被多家技术趋势研究机构确定为今后的科技趋势。专家称,存算一体是突破AI算力瓶颈和大数据的关键技术。而未来,存算一体技术将在自动驾驶、AI处理、物联网等云边端场景广泛应用,对提升运算效率、降低系统功耗及设备成本等带来广阔的收益。
“存算一体“究竟是什么?它是如何诞生的?又究竟有怎样的魔力能够获得众多“好评”?今天,请跟随《中国科技信息》的脚步,一起了解当前炙手可热的“存算一体”技术。
突破AI算力瓶颈和大数据的关键技术
存算一体(Computing in Memory)是什么?在理论层面,它就是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算。可以说,近几年云计算和人工智能(AI)应用的发展,加速了存算一体时代的到来,因为存算一体是将存储与计算有机融合,以其巨大的能效比提升潜力,有望成为数字经济时代的先进生产力。
在面对如卷积神经网络、人工智能等这些需要频繁读写操作的数据密集型应用时,传统计算机处理数据,需要在 CPU 和存储器间来回的传输,这导致了巨大的数据复制和通信成本,功耗巨大,成为了计算的关键瓶颈。
同时,由于当前的存储体系将程序以数据的形式与其他数据共同存储在存储器中,为了在执行程序时不引起访问错误,需要从内存中提取指令并在处理单元中执行。随着计算并行度不断提高,数据传输速率受限,阻碍了高性能、节能计算系统的进一步发展。
因此,人们试图开发新的计算方式来避开这些瓶颈,以实现更为有效的数据运算和更大的数据吞吐量。而存算一体作为一种新型算力,与以往的冯诺依曼架构相比,其打破了由于计算单元与存储单元过于独立而导致的“存储墙”(即CPU 处理数据的速度与存储器读写数据速度之间严重失衡的问题,严重影响目标应用程序的功率和性能),能够达到用更低功耗实现更高算力的效果。

简单来说,在传统计算机采用的冯诺依曼架构中,计算和存储功能分别由中央处理器和存储器完成。面对庞大的数据,冯诺依曼架构下,由于计算和储存功能分离,需要反复进行读取、计算操作;而存算一体的结构只需要存一次、读一次,计算效率天差地别。
目前,存储一体也是我国极为关注的算力学科的突破性技术,已被确定为算力网络十大关键技术之一。
存算一体的落地将带来计算架构的变革
存算一体受到高度关注,那么它具体都有哪些优势和应用?事实上,存算一体的核心优势在于:减少不必要的数据搬运、延迟和功耗;存储单元参与逻辑计算,大幅提升计算效率,降低成本。
近年来,万物互联和人工智能的发展加速了存算一体的技术产品化进程, 产业界对于存算一体最终的产品形态也在持续探索。以AI算力方面应用为例,存算一体是突破AI算力瓶颈和大数据的关键技术。一方面,通过使用存算一体技术,可将带AI计算的中大量乘加计算的权重部分存在存储单元中,在存储单元的核心电路上做修改,从而在读取的同时进行数据输入和计算处理,在存储阵列中完成卷积运算。由于大量乘加的卷积运算是深度学习算法中的核心组成部分,因此存内计算和存内逻辑非常适合人工智能的深度神经网络应用和基于AI的大数据技术。

另一方面,在计算卷积、深度学习等任务的时候,存算一体结构的能耗比优势明显,大约是今天传统计算设备的百分之一。于是,使用在可穿戴设备上,散热、供电等装置就可以大幅减少,设备的重量就能大大降低。
因此,在产业和投资的驱动下, 基于SRAM,DRAM,Flash 存储介质的产品进入验证期,将优先在低功耗、小算力的端侧如智能家居、可穿戴设备、泛机器人、智能安防等计算场景落地。
综合存算一体的多重优势,该技术已经被多家技术趋势研究机构确定为今后的科技趋势。未来,随着存算一体芯片在云端推理大算力场景落地,或将带来计算架构的变革。
未来AI计算领域的主要架构
总体来看,存算一体推动传统的以计算为中心的架构向以数据为中心的架构演进,并对云计算、人工智能、物联网等产业发展带来积极影响。尤其是应用端,存算一体的市场发展驱动却是非常强烈的。在大规模并行计算场景中,例如 VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等,存算一体芯片具备高带宽、低功耗的显著优势。
此外,新型存储器的出现也带动了存算一体技术的发展,为存算一体技术升级方向提供可能。其中,阻变忆阻器RRAM使用等效器件电阻调制来实现数据存储,可以实现更高的计算密度。新型存储器与存算一体技术的结合,形成了新一代的算力元素,有望推动下一阶段的人工智能发展。

目前,存算一体已经在产业细分领域掀起了创业浪潮,并受到投资界和产业界的关注和投入。不过,目前国内外存算一体企业,都是刚刚起步阶段,差距尚不大。在大方向上,存算一体在技术上向着高精度、高算力和高能效的方向发展。在资本和产业双轮驱动下,基于SRAM、NOR Flash 等成熟存储器的存内计算将在垂直领域迎来规模化商用,小算力、低功耗场景有望优先迎来产品和生态的升级迭代,大算力通用计算场景或将进入技术产品化初期。基于非易失性、新型存储元件的存算一体依赖于工艺、良率的提升,走向成熟预计需要5-10 年。
就去全球而言,存算一体芯片在设计层面是创新的,没有成熟的方法借用,而我国在该领域的先发制人,为相关技术的弯道超车提供了巨大可能性。专家表示,存算技术正处在从学术领域到工业产品落地的关键时期,随着存算技术的不断进步和应用场景的不断催生,预计存算一体技术将成为AI计算领域的主要架构。

