在本周的2025年IEEE国际电子器件会议(IEDM)上,全球领先的先进半导体技术研究中心Imec首次发布了针对3D HBM-on-GPU架构的热系统技术协同优化研究。该架构是面向下一代AI应用极具前景的计算架构。通过结合技术与系统级热缓解策略,在现实的AI训练负载下,GPU峰值温度可从140.7°C降至70.8°C,与当前2.5D集成方案相当。这一成果展现了跨层优化(即在所有抽象层级协同优化调控手段)与广泛技术专长相结合的强大力量,这也是Imec独有的综合优势。
将高带宽内存堆叠直接集成在图形处理器之上,为构建面向数据密集型AI工作负载的下一代计算架构提供了一条极具吸引力的路径。与当前将HBM堆叠置于(一至两个)GPU周围并通过硅中介层连接的2.5D集成方案相比,这种3D HBM-on-GPU架构有望在计算密度(每个封装内集成四个GPU)、单GPU内存容量以及GPU-内存带宽方面实现巨大飞跃。然而,这种激进的3D集成方法由于更高的局部功率密度和垂直热阻,容易引发热问题。
图1:集成方法:(a)当前的2.5D集成;(b)提出的3D HBM-on-GPU集成方案。
在2025年IEDM上,Imec首次发布了针对3D HBM-on-GPU集成的全面热仿真研究,不仅识别了热瓶颈,还提出了提升该架构热可行性的策略。Imec研究人员展示了如何通过协同优化技术与系统级热缓解方法,在现实的AI训练负载下将GPU峰值温度从141.7°C降至70.8°C。
该模型假设四个HBM堆叠(每个堆叠由十二个混合键合的DRAM裸片组成)通过微凸点直接置于GPU之上。冷却在HBM堆叠顶部进行。研究采用源自行业相关功率分布图的功率映射来识别局部热点,并将其与2.5D基准进行比较。若不采取热缓解策略,3D模型的GPU峰值温度高达141.7°C,远超出GPU和HBM的正常工作范围;而在相同冷却条件下,2.5D集成基准的峰值温度为可接受的69.1°C。研究团队以此数据为起点,评估了技术与系统级热缓解策略的共同影响。技术级策略包括HBM堆叠合并、热硅优化等。在系统层面,评估了双面冷却以及GPU频率调节的影响。
图2:通过系统技术协同优化实现的累积热缓解效果。
Imec系统技术项目总监James Myers表示:“将GPU核心频率减半,可将峰值温度从120°C降至100°C以下,达到了内存运行的一个关键目标。尽管这一步会带来28%的工作负载损失(即AI训练步骤变慢),但由于3D配置提供了更高的吞吐密度,整体封装性能仍优于2.5D基准。我们目前正运用此方法研究其他GPU/HBM配置(例如将GPU置于HBM之上),以应对未来的热约束。”
图3- GPU频率调节的影响:(a)在较低频率下性能吞吐量会下降,但通过4倍带宽提升可部分恢复;(b)吞吐密度(单位封装面积吞吐量):得益于更小的封装面积,3D集成提升了该指标。此分析未包含每封装增加额外GPU可能实现的效益。
Imec逻辑技术副总裁Julien Ryckaert补充道:“这也是我们首次展示Imec跨技术协同优化计划在构建热鲁棒性更强的计算系统方面的能力。XTCO计划于2025年启动,旨在高效协调Imec的技术路线图与行业关键系统扩展挑战,并建立在四大系统级支柱之上:计算密度、供电、热管理以及内存密度与带宽。它将我们的STCO/DTCO思维模式与Imec广泛的技术专长相结合——这种独特的组合对于应对计算系统需求的增长与多样化具有重要价值。我们邀请整个半导体生态系统内的公司,包括无晶圆厂公司和系统公司,加入我们的XTCO计划,共同解决关键的系统扩展瓶颈。”
此文稿中文翻译仅供参考,相关信息请以英文原稿为准。
英文原稿链接如下,或点击阅读原文。
关于SIW
聚焦泛半导体垂直领域的生态服务平台,秉持“协同、创新、共赢”价值观,贯彻“以生态协同打破技术壁垒,以垂直创新重塑产业格局”的理念,愿景是成为泛半导体产业背后不可或缺的战略陪跑伙伴。
作为产业生态的构建者,我们提供涵盖生态资源整合、战略前沿调研与行业营销培训的全方位服务。通过打造系列品牌自营栏目,推动行业深度交流,以专业的品牌运营与传播支持,助力企业将技术竞争力转化为市场影响力。
依托核心团队近三十年的行业积淀,在台湾、上海、武汉设立办事处,三地联动辐射亚太及全球市场,具备覆盖泛半导体全产业链的资源整合能力。目前,我们已服务众多行业领先企业与机构,通过生态化的全周期解决方案,助力中国半导体企业实现国产替代与全球化跃升。

