大数跨境

技术洞见 | 搞懂DDR、GDDR、HBM(DRAM内存架构)

技术洞见 | 搞懂DDR、GDDR、HBM(DRAM内存架构) 牛芯半导体
2025-03-28
2
导读:本文转载自系统级SIPI设计与仿真,转载文章仅供学习和研究使用。

本文转载自系统级SIPI设计与仿真,转载文章仅供学习和研究使用。

内存作为计算机系统的关键组件,在诸多领域发挥着不可或缺的作用。从日常使用的电子设备,到推动科技创新的高性能计算场景,内存都在背后提供着关键支持。其主要的应用场景介绍如下:
消费电子领域:DDRx/LPDDRx
智能手机:运行各类应用程序(APP)时,内存用于存储APP运行过程中的数据、用户操作指令以及系统运行所需的各种临时文件。
平板电脑:同样用于支撑系统和应用程序的运行。在进行多任务处理,如同时打开文档编辑软件、视频播放软件和网页浏览器时,内存会存储各个任务的相关数据,保证不同任务之间能快速切换和协同工作,提升用户的使用体验。
个人电脑:无论是日常办公使用的办公软件,如Word、Excel等,还是进行图形设计、视频剪辑等专业工作的软件,亦或是运行各类游戏,内存都承担着数据存储和交换的重任。
数据中心与云计算领域:DDRx
数据中心:作为海量数据的存储和处理中心,内存用于快速存储和读取大量的数据。在搜索引擎的数据中心,内存会缓存频繁访问的网页数据、索引信息等,加快搜索结果的返回速度
云计算服务:为众多用户提供虚拟化的计算资源,内存是实现多用户同时在线使用云计算服务的关键。云服务器中的内存为每个用户的虚拟环境分配一定的空间,用于运行用户的应用程序和存储相关数据,使用户能像使用本地计算机一样在云端进行工作和娱乐。
人工智能与机器学习领域:DDRx/LPDDRx/HBMx
训练模型:在训练深度学习模型,如神经网络时,需要处理海量的训练数据。内存用于存储训练数据、模型参数以及训练过程中的中间计算结果。
推理应用:当模型训练完成后进行推理应用时,内存同样发挥着重要作用。如智能语音助手在识别用户语音指令并进行语义理解时,内存会存储模型的相关数据和识别过程中的临时结果,快速给出相应的回答。
汽车电子领域:LPDDRx/GDDRx
自动驾驶系统:内存用于存储地图数据、传感器采集的实时数据(如摄像头图像、雷达测距数据等)以及自动驾驶算法运行过程中的中间结果。这些数据的快速存储和读取对于自动驾驶系统做出准确的决策至关重要,如判断车辆行驶路径、避让障碍物等。
车载娱乐系统:支持导航、多媒体播放等功能。导航地图数据会存储在内存中,方便快速定位和路径规划;多媒体播放时,音频、视频数据也临时存于内存,保证播放的流畅性。
内存应用如此广泛,做好内存的硬件设以及SIPI仿真对电子系统至关重要,接下来我们将介绍内存的一些基础知识以及SIPI关注点。


DRAM内存架构


LPDDRx、DDRx、GDDRx和HBMx都使用基于DRAM的技术。下图所示为DRAM的架构解析。
内存的结构从基础的存储单元(cell)到通道(channel),是一个逐步组合和扩展的层级架构,每个层级都有其特定功能,共同保障内存的数据存储和传输。
  • Cell(存储单元):是内存的最基本存储单元,由电容器和晶体管组成。工作原理是利用电容器存储电荷来表示数据,电荷的存在与否分别对应逻辑“1”和“0”。但由于电容器存在漏电现象,DRAM需要定期刷新以保持数据。其结构有平面、沟槽和堆叠式电容器等类型,不同结构在性能、集成度上各有优劣,比如堆叠式电容器能提高存储密度。
  • Row/Column(行/列):多个存储单元按行和列的形式排列组成存储阵列。行是一组能被同时激活的存储单元,当接收到行激活命令,一行的存储单元会并行工作。列是可独立进行读写操作的最小单元,通过列地址选通(CAS)信号来选择特定列进行数据传输。在进行内存读写时,先通过行地址选通(RAS)信号选中某一行,再用CAS信号选择列,从而定位到具体存储单元进行数据操作。
  • Bank:是DRAM芯片内独立的存储阵列分区,由多个行和列组成。一般的DRAM芯片包含4、8、16个甚至更多bank,随着内存密度提升,bank数量会增加,像DDR5 x4/x8设备中,16Gb内存就有32个bank。bank可独立进行读写操作,能并行处理不同的内存请求,提升内存整体性能,比如在多任务处理时,不同任务的数据可分别在不同bank中读写。
  • Chip(芯片):由多个存储体、行/列译码器、数据缓冲器等组成。多个存储体协同工作,通过行/列译码器选择具体的行和列,数据缓冲器负责数据的暂存和传输。不同类型的内存芯片在容量、速度等性能指标上有差异,如GDDR6芯片更注重高带宽,适用于图形处理,而LPDDR系列芯片侧重低功耗,用于移动设备。
  • Rank:是内存模块中一组协同工作的DRAM芯片集合,同一Rank内的芯片共享地址和命令总线,但各自提供不同的数据位。以DDR4为例,常见的单Rank包含8个或9个DRAM芯片(9个芯片时含1个用于ECC校验,64 bits of data + 8 bits ECC),这些芯片同时被控制,通过芯片选择(CS_n)信号来确定对哪个Rank进行操作。
    下图右图为三个64bit位宽的内存条:(上)用x4的DDR颗粒,正反对贴的16个颗粒组成64bit的单rank内存接口;(中)使用x8的DDR颗粒,8个颗粒组成64bit的单rank内存接口;(下)16个x8的DDR颗粒组成双rank内存接口,需要通过CS_n片选对相应rank进行操作。
  • DIMM(双列直插式内存模块):将多个Rank的芯片集成在一块印刷电路板上形成DIMM(也就是我们通常所说的内存条)。常见的有UDIMM(无缓冲双列直插式内存模块)、RDIMM(寄存器缓冲双列直插式内存模块)和LRDIMM(负载降低缓冲数据双列直插式内存模块)。不同类型的DIMM在功能和适用场景上有区别,UDIMM成本低但负载能力有限;RDIMM和LRDIMM适用于高容量、高数据速率系统,能降低信号干扰,但会增加系统成本、延迟和功耗。
    DDR3和DDR4支持三种主要DIMM类型:
    无缓冲DIMM(UDIMM):CK、C/A信号负载数量多,SI设计难度大。
    RDIMM:用于CK、ADDR、CMD、CTRL网络带寄存器缓冲,有效降低负载数量,降低SI设计难度。
    LRDIMM:除了CK、ADDR、CMD、CTRL网络,DQ网络也带有减载缓冲,降低多rank内存条中DQ信号SI设计难度。
具有更大内存容量和更高数据速率的系统需要RDIMMs或LRDIMMs来克服额外的通道负载并保持1N的时序。
  • Channel:是内存控制器与DIMM之间的数据传输通路。一个内存控制器可连接多个通道,如常见的双通道、四通道技术。每个通道可独立传输数据,增加通道数量能提升内存带宽,提高数据传输效率。在多通道系统中,内存控制器会根据负载情况合理分配数据到不同通道,实现并行传输,提升系统整体性能。

往期推荐

01

● 牛芯DDR5 IP取得突破性进展

▲ 点击阅读

02

● 牛芯半导体荣获2024年度深圳市集成电路产业双奖

▲ 点击阅读

03

● 牛芯半导体斩获2024粤港澳大湾区企业创新力榜单双项殊荣

▲ 点击阅读


牛芯半导体(深圳)有限公司(简称“牛芯半导体”)成立于2020年,聚焦接口IP的开发和授权,并提供相关整体解决方案,致力成为全球领先的IP供应商。


牛芯半导体在主流先进工艺布局SerDes、DDR等中高端接口IP,产品广泛应用于消费电子、网络通信、数据存储、人工智能、汽车电子、医疗电子等领域。


未来,牛芯半导体持续响应IP市场需求,适应不断演进的接口技术和日益拓展的接口互联场景,赋能数智时代下的千行百业。

【声明】内容源于网络
0
0
牛芯半导体
牛芯半导体,专注于高速互联技术的研发和持续创新,拥有完全自主可控的知识产权,提供全栈式接口IP授权和高速互联芯片的定制方案,赋能芯片国产化;已服务客户超百家,涵盖智能驾驶、人工智能、特种计算等领域,致力成为全球领先的高速互联半导体公司。
内容 0
粉丝 0
牛芯半导体 牛芯半导体,专注于高速互联技术的研发和持续创新,拥有完全自主可控的知识产权,提供全栈式接口IP授权和高速互联芯片的定制方案,赋能芯片国产化;已服务客户超百家,涵盖智能驾驶、人工智能、特种计算等领域,致力成为全球领先的高速互联半导体公司。
总阅读0
粉丝0
内容0