内存的未来：多样性崛起与计算深度融合- 大数跨境

半导体产业报告

2025-08-22

导读：AI与数据洪流下，算力瓶颈已转向内存。需求激增而技术停滞，统一内存假设失效。权重要极致读取，流式数据需高效写入，训练缓存要求频繁稳定。传统DRAM、SRAM难以兼顾。未来内存唯有大规模、高密度、多样化，并与计算深度融合，方能重塑系统边界。

随着AI、边缘计算与数据密集型应用的快速发展，现代计算系统正面临严峻的内存挑战。传统以速度或容量为核心的扩展路径已难以满足多样化、动态化的应用需求。软件对内存使用的异质性日益凸显——既有大量只读数据，也有高频写入或流式处理任务；与此同时，内存技术本身也在发生结构性变革：新型器件不断涌现，物理集成日趋紧密，软件感知能力持续增强。在此背景下，内存正从被动存储介质演变为系统架构的主动参与者，成为驱动下一代算力平台的核心引擎。本报告提出，未来的内存将是大规模的、多样化的，并与计算深度融合，涵盖从器件到系统架构的全栈创新。

一、统一假设的终结

传统计算体系长期依赖“统一内存空间”假设，即所有数据可被同等访问。这一简化模型在早期架构中有效，但在当前复杂应用场景下已难以为继。

AI推理、流媒体处理等任务的数据访问模式差异显著：模型权重几乎只读，传感器数据频繁写入但生命周期短，训练缓存则持续读写且对延迟敏感。软件使用方式的高度异质化，暴露出通用内存架构在能效、性能和成本上的多重瓶颈。

早在1946年，冯·诺依曼就预言未来系统需配备多种功能不同的内存单元。如今，这一设想正成为现实需求。面对多样化访问模式与算力压力，内存系统正由“结构单一、逻辑简单”的支撑角色，转向具备差异化特性、参与系统调度的关键组件。

二、内存需求的多样性与挑战

芯片算力提升推动数据规模急剧膨胀，尤其在AI训练、边缘推理和实时分析等高吞吐场景中，内存逐渐成为性能瓶颈。然而，内存技术进展远落后于计算性能增长，晶体管密度提升速度远超存储密度，导致“计算-内存失衡”问题日益突出，倒逼架构向更紧耦合、更异构的方向演进。

不同应用对内存的需求本质各异：

Type A：如AI模型权重、指令缓存，高度可预测、频繁读取、极少写入；
Type B：如流式I/O或推理激活数据，写入频繁、读取少、生命周期短；
Type C：如文件系统缓存、训练数据，频繁读写、高延迟敏感、稳定性要求高。

单一内存技术（如SRAM或DRAM）已无法兼顾各类需求。SRAM速度快但面积成本高；DRAM密度适中但延迟不稳定；新兴RRAM、MRAM虽具非易失性和高密度潜力，但在写入能耗与耐久性方面仍有短板。仅追求某项指标（如速度或容量）已难以实现系统整体最优。

真正的挑战在于构建一套适配多场景、支持软硬协同、灵活权衡能耗与性能的内存体系。研究趋势正转向“以软件需求反向指导硬件设计”，从工作负载特性出发定义内存参数，为后续优化提供方向。

三、内存技术的演进与分类

在多样化需求驱动下，传统层级内存架构正向更灵活、更异构的形态演化。主流类型包括高速但面积大的SRAM、中等密度与速度的DRAM，以及RRAM（阻变存储）、MRAM（磁阻存储）、PCM（相变存储）、FeRAM（铁电存储）等新型非易失性技术。这些技术各具优劣，共同趋势是通过多维性能匹配不同应用场景。

SRAM因低延迟和高可靠性广泛用于片上缓存（L1/L2），但其静态功耗和面积开销限制了扩展性；DRAM作为主存广泛使用，具备较好密度和访问速度，但刷新机制影响能效。

RRAM、MRAM等新兴存储器提供更高密度与非易失性，但存在写能耗高、耐久性低等问题。例如，RRAM的写能耗与寿命强相关，优化一方常牺牲另一方。因此，实际部署必须结合具体负载，权衡延迟、密度、能耗与可靠性。

报告提出一种软件感知的分类方法——以数据类型为导向划分硬件需求。这种“类型驱动的内存匹配”理念，不仅指导新型器件设计目标，也为系统级构建提供标准化评估框架。例如，Type A数据可牺牲写性能换取读效率；Type B数据则优先优化写入能耗与速度，降低保留要求。

未来内存系统不应追求“通用最优”，而应是“按需定制、按类部署”的复合体系，需在设备、架构、系统层面实现统一设计逻辑。

四、软件-硬件协同：数据类型驱动的内存选择

单纯硬件优化已不足以应对多元内存需求。报告强调，必须建立软硬件协同机制，将软件中的“数据语义”映射到硬件的“内存选择”上。

核心在于构建抽象映射层，捕捉数据的访问模式、生命周期、容量需求、能耗敏感度等维度。例如，AI推理中模型参数（Type A）具有高度可预测性，适合部署于读性能强、能耗低的非易失性内存；流式数据（Type B）则倾向高写吞吐与短时存储，可用氧化物增益单元（OS-OS Gain Cell）或Hybrid Gain Cell优化。

该映射逻辑为器件选择提供依据，也为运行时优化提供可执行指令集。编译器可在编译阶段标注变量或数据结构为A/B/C类，执行时动态调度至合适内存区域；硬件则需提供足够异构的基础以支撑映射有效性。

传统“按技术指标选内存”已不适用。单一指标无法体现特定场景下的综合适应性。有效方式是以“软件数据类型”为核心，在多维权衡框架中进行匹配与裁剪。例如，RRAM虽密度优于SRAM，但用于Type C类频繁读写数据前，必须先优化其写能耗与耐久性。

最终目标是构建以数据语义驱动、场景导向的软硬融合型内存体系。在此体系中，硬件不再是被动支撑，而是能与软件同步演化的主动协同者。

五、新型内存技术：Gain Cell 与混合结构

尽管SRAM和DRAM仍占主流，其在面积效率、功耗控制和制程兼容性方面的局限日益明显。报告重点提出两种新型存储单元：氧化物增益单元（Oxide Semiconductor Gain Cell）与混合增益单元（Hybrid Gain Cell），作为实现高密度、低能耗、可扩展片上内存的关键路径。

Gain Cell基于传统SRAM架构引入氧化物半导体晶体管，显著降低静态功耗并提升存储密度。相比标准SRAM，其静态功耗降至15%，密度提升近3倍，同时保持高速与良好可读性。更重要的是，该结构具备良好制程兼容性，已成功扩展至5nm节点（N5），具备量产潜力。

Hybrid Gain Cell进一步结合高电流SRAM与Gain Cell，形成性能与密度之间的折中方案。在不牺牲访问速度前提下，实现读能耗降低72%、待机功耗降低24%，适用于Type B（流式）与Type C（高频读写）任务。

两类增益单元具备三大优势：

结构简单，易于集成：可在现有CMOS工艺实现，无需复杂后道工艺；
面积效率高：支持高位密度部署，适用于大容量片上缓存或中间层内存；
能耗表现优异：特别适合对写能耗与待机功耗敏感的应用，如边缘AI或电池终端。

这些特性使增益单元不仅是器件创新，更是内存层级设计的重要环节。结合软件数据类型的映射，Gain Cell可成为Type B/C类数据的“能效最佳匹配者”，为构建低功耗、高通量内存子系统提供可行路径。

六、内存与计算的深度集成路径

随着摩尔定律放缓和数据流动成本上升，“计算-内存分离”架构瓶颈凸显，尤其在AI和数据密集型应用中，访存延迟与带宽限制已成为效率瓶颈。报告提出核心理念：“让内存贴近计算”乃至“让计算走进内存”，通过物理与架构层的深度集成，重构内存组织方式。

在物理层面，展示RRAM与Gain Cell在CMOS工艺下的异构片上集成方案，包括层级堆叠、3D集成、Cu-to-Cu Hybrid Bond等。这些方案提升存储密度，缩短数据路径，显著降低能耗。实测显示，RRAM在AI加速器上实现高达9倍的整体能耗优化，体现器件革新对系统性能的直接推动。

在架构层面，提出突破性设计：Illusion System。该系统通过多颗存储芯片与计算单元的分布式协同，在具备超大内存容量的同时，保持接近理想“Dream Chip”的能效比。实测中，其AI推理效率达Dream系统的95%，整体能耗仅高出约10%。

Illusion架构三大核心：

片上内存足够大：容纳完整模型，减少外部访存；
芯片间快速开关：按需激活资源，降低静态功耗；
软硬协同的智能映射机制：动态调度计算与存储资源。

长远来看，集成趋势催生“互连密度连续体”概念——从单芯片3D集成到多芯片封装再到跨芯片协同，系统设计自由度大幅提升。由此诞生的不再是传统内存模块，而是与计算深度耦合、具备结构主动性与可塑性的内存子系统。

七、架构级集成案例：Illusion 系统

Illusion系统作为高效“计算+存储”协同的代表性范式，旨在维持高性能的同时显著优化能效与内存利用率。它不仅提供多芯片协同新路径，也验证了高度集成内存结构在AI推理中的可行性与优越性。

其架构理念源于一个关键判断：当模型规模扩大、数据访问密集时，与其扩大带宽，不如让计算更接近数据。系统由多个“计算+存储”小单元（芯片）以分布式方式组成逻辑统一体，每颗芯片配备本地高速存储（如RRAM、Gain Cell），形成“分布式片上大容量内存”结构。

三大机制实现能效最优化：

足够大的片上内存（M×N）：容纳完整AI模型，避免频繁外存访问；
芯片快速ON/OFF能力：仅激活必要资源，降低静态功耗；
软件引导的数据映射机制：根据负载智能划分计算与存储位置。

实测表明，Illusion在AI推理任务中达到Dream系统95%的执行效率，能耗仅高出不到15%，在能效-性能比（EDP）上差距极小。该结果在DNN、CNN、Transformer等多种模型上验证，具备通用性与推广潜力。

Illusion不仅是架构优化，更是系统工程与器件技术集成的综合体现，依赖3D集成、低功耗内存单元、互联优化及软硬件协同调度策略。

在AI算力向边缘延伸、终端设备极致降耗的背景下，Illusion提供了一个兼顾性能、能效、可扩展性且工程可落地的范式，预示未来计算平台将不再是“计算+外存”的机械组合，而是逻辑与存储深度融合、按需动态重构的异构系统体。

八、结语：从器件到系统的内存未来图景

报告明确指出：内存的未来不仅是容量扩展，更是形态与角色的根本转变。从材料与单元结构，到集成方式，再到软硬协同的系统架构，内存技术正经历全方位革新。

在存储单元层面，RRAM、Gain Cell、Hybrid Gain Cell等新型器件逐步成熟，为高密度、低功耗、可扩展的片上内存奠定基础，弥补SRAM/DRAM在能效与可扩展性上的不足，并带来非易失性、写入优化等新平衡机制。

在物理集成与互联维度，3D堆叠、混合键合、FinFET兼容集成等技术突破面积瓶颈，使“逻辑与存储共栖”成为现实。存储不再只是配套设施，而是可与计算核心同层协同的主动部件，大幅降低数据搬运成本。

在系统与架构层，Illusion系统所体现的软硬一体协同、数据语义驱动的内存分配机制，为未来平台提供范式参考。架构不再拘泥于L1/L2/L3分层，而是基于“任务-数据类型-内存结构”三维联动进行动态调度。

最终，未来内存将是一个“高密度 + 多样化 + 与计算紧耦合”的复合体，既能满足AI高负载吞吐，也能应对边缘计算、低功耗终端的能效挑战。

内存正从静态资源转变为参与计算调度、具备系统行为意识的活跃组件。推动这一变革的，不仅是材料与器件进步，更是架构重构、软硬融合，以及对真实工作负载的深刻理解。

【声明】内容源于网络

半导体产业报告

1234

内容 0

粉丝 0

半导体产业报告 1234

总阅读0

粉丝0

内容0