1、AMD EPYC 系列 Venice 处理器将入列首批台积电 2 纳米高性能运算产品(Technews)
最新市场消息显示,AMD即将推出的EPYC系列Venice服务器处理器将根据不同的产品定位与工作执行,采用多种核心配置设计。这款基于Zen 6架构的产品线,预计将成为首批采用台积电2纳米级技术的高效能运算产品之一。消息指出,AMD在Venice处理器上采取了双重CCD设计策略,以因应不同市场需求。在标准版Venice的部分,预计采用台积电N2P制程技术。N2P被视为标准N2制程的优化版本,目的在提升功耗效率与效能表现。此版本每个CCD整合了12个标准Zen 6核心,整颗处理器最高可扩展至96个CPU核心。至于,在高密度版本的Venice部分,则会采用标准N2制程。此版本CCD专为提升芯片密度与核心扩展性而设计,每个CCD拥有多达32个高密度核心,这使得单一处理器插槽的核心数最高可达256核心。市场分析师指出,这项双轨策略反映了AMD对于服务器市场的深度布局。标准版CCD的目标对象较为广泛,预计将应用于主流服务器平台、桌上型电脑以及笔记本电脑芯片。相较之下,高密度核心CCD则专为大规模企业与Hyperscale部署设计,优先考虑核心密度与吞吐量效率,而非追求峰值时脉频率,非常适合高度并行化的云端工作执行所使用。虽然AMD尚未正式确认具体规格细节,但市场消息表示,Zen 6高密度CCD已于2026年4月进入早期生产阶段。AMD此前曾公开承诺,Venice将是首批受惠于台积电先进2纳米技术的高效能运算产品。若上述资讯准确,AMD将能进一步强化其EPYC产品组合的灵活性,有效区隔传统企业运算与超大规模云端部署,持续扩大其在服务器市场的领先优势。
2、首批涵盖逻辑与内存 High-NA EUV 芯片即将交货,ASML 反驳台积电昂贵之说(Technews)
ASML新任执行长 Christophe Fouquet 于 19 日在比利时安特卫普举行的 imec 研讨会上表示,首批采用High-NA EUV曝光机制造的芯片,预计将在未来几个月内正式交付。ASML 指出,这款新一代设备能将芯片上的特征尺寸缩小达 66%,其效果如同提升摄影机的对焦精度,让芯片制造商能印刷出更细微的电路图案。 Christophe Fouquet 透露,首批 High-NA EUV 制造的产品将涵盖记忆体与逻辑芯片。因此,尽管每套 High-NA EUV 曝光机的造价高达 4 亿美元,且需要繁杂的资格验证过程,但 Christophe Fouquet 仍对其采购前景充满信心。强调虽然新技术初期投入成本昂贵,但其设计核心在于透过长期技术优化,最终降低整体图案化的生产成本。事实上,目前在采用进度上,各大芯片厂商呈现不同的战略。英特尔目前是 High-NA EUV 曝光机技术最积极的推动者,试图借此领先对手台积电与三星。同时,SK 海力士等记忆体制造商也已表态计画导入此技术。相较之下,ASML 的最大客户台积电则显得较为审慎。台积电业务开发及全球业务的资深副总经理暨副共同营运长张晓强先前再年度技术论坛上表示,目前现有的 EUV 设备仍具备发展空间,能透过创新的芯片设计持续提升效能,而不一定要立即追求更细的线宽。因此,在 High-NA EUV 曝光机目前价格过于昂贵,暂无立即导入的迫切性。目前受惠于AI产业的爆发性成长,Christophe Fouquet 预期未来几年全球芯片销售额将维持每年约 20% 的成长速度,使得针对业界担心 ASML 的产能可能成为扩张瓶颈。带是他回应指出,真正的挑战在于台积电与三星等代工大厂必须持续扩大生产规模,并购入更多设备以满足 AI 市场需求。首批 High-NA EUV 技术芯片的问世,将成为观察该技术能否顺利商用化并降低成本的重要指标。
3、AI Agent推升ARM CPU需求爆发,2026年出货估破600万( Digitimes )
DIGITIMES指出,不只Intel与AMD的x86架构的服务器CPU需求大增,ARM架构的CPU,在2026年也会大爆发,动能不只来自于NVIDIA的Grace芯片,更有亚马逊、Google、微软与Meta的ASIC服务器加持,全年出货估将超过600万颗。 DIGITIMES于20日举办「AI on Air COMPUTEX前瞻趋势论坛」,以「Agent应用爆发下的AI服务器市场展望与趋势」发表演说,针对AI时代从训练走到推论,硬件设备的发展走向。 萧圣伦指出,前几年AI算力以训练模型为主,对GPU、加速器存储器都有较高负荷,对CPU与相关存储器是中度负荷,主要瓶颈是在Scale-up互连加速器,然到了Agent系统,高负荷的硬件设备落在CPU与相关存储器,最大瓶颈在加速器存储器。 DIGITIMES表示,NVIDIA仍是AI芯片领头羊,下一代的Vera Rubin因为散热设计、HBM4供应状况、Switch架构改变等问题,延后到7月量产,预计全年出货200万颗的Rubin芯片,若考量Rack组装问题,预估全年出货将在1,000柜以内。 反倒是2025年出货一度下滑的HGX架构,2026年出货可望回升,出货量估达250万颗以上。若以系统来说,出货量将达35万台,原因就是因为AI Agent需求爆发,带动HGX需求拉升。然此需求转变,也让x86 CPU、DDR 5及SSD的供应短缺更严峻。 DIGITIMES指出,AI从训练进入Agent时代,不仅带动x86 CPU出货暴增,也带动ARM架构的CPU,在2026年大爆发,全年出货超过600万颗,其中出货最大的是NVIDIA的Grace与Vear CPU,2026年出货量估350万颗。 其次是亚马逊的Graviton,主因Amzon较早开发ARM架构CPU,包括Graviton 4、4.5、5,2026年出货预估将达150万~200万颗,再者为Google的Axion,虽然Google在ARM CPU算后进者,然发展速度非常快。 DIGITIMES指出,此波AI浪潮带动全球服务器出货快速拉升,预计2026年出货量将会接近2,000万台,达1,951.2万台,年增19.2%,从2026到2030年,全球服务器年复合成长率将达13.1%,到2030年,出货量将达3,187.7万台,年增9.8%。
OpenAI推出「算力保证」方案,让企业客户预先锁定1~3年AI运算资源,确保旗下产品、AI agent及工作流程稳定运行,有助算力供需双方提前规划。 OpenAI开放企业选择1~3年长期承诺方案,年限愈长可享有愈高折扣。客户可跨产品组合弹性调用额度,适用场景涵盖面向终端用户的产品、内部工作流程、平台基础设施,以及Codex自带金钥部署模式。 从官网申请表单细节可观察到,该方案针对有大规模需求的企业用户,要求填报预估算力需求,以每分钟可处理的token数量计算,选项从少于1亿TPM到10亿以上TPM,并询问端点击数据存放地点偏好,显示方案设计已纳入跨云端供应商及数据主权等企业部署考量。 OpenAICEOSam Altman在X平台表示,客户愈来愈需要确保算力稳定供应,而随模型性能持续提升,全球算力供应长期处于紧绷状态,认为该方案将打造双赢局面。 该方案将持续开放申请,直到当前分配额度售罄,未来计划再度推出。同时,Altman强调,OpenAI将保留足够算力供自家产品ChatGPT及程序码辅助工具Codex使用。 据悉,OpenAI已向投资人揭露,2030年前累计算力支出将达6,000亿美元。 CNBC等外媒解读,OpenAI算力保证方案有助公司在大规模基础设施建置的财务压力下,将长期算力需求转为可预测的收入,以便后续推进IPO计划。
根据TrendForce最新研究,北美五大CSP为扩大AI训练与推理部署,2026年将明显提高rack-scale AI server采购,不仅预计占全球60%以上NVIDIA GB/VR需求,也将带动AI训练算力年增逾56%、AI推理算力年增约122%。TrendForce预估,2026年AI server出货年增逾28%,目前仍以高阶训练机种为主(占约55%),但中长期将转向推理机种主导,推动AI云服务商业化。NVIDIA亦强化GB/VR系统的推理能力,训练算力(FP16/BF16)预计由2025年逾9 ExaFLOPS持续成长,推理算力(FP4/NVFP4)则由逾37 ExaFLOPS大增近122%,并落实于GB300、VR200方案。同时CSP加速自研ASIC布局,Google最积极,2026年TPU需求预计年增近80%、下半年升级至v8;Amazon则预计Trainium占自家AI server比重逾40%。资本支出方面,Google、Amazon、Microsoft、Meta、Oracle合计CapEx预计突破7,700亿美元、年增近87%。随着液冷机柜普及及GPU/ASIC功耗持续提升,北美五大CSP server功耗预计由2023年年增2.8GW扩大至2026年18GW,2025–2026年年增率达116%。

