英伟达200亿美元收购Groq:押注AI推理新赛道
200亿美元——这是英伟达收购AI芯片公司Groq团队及非独家技术授权的交易金额,创其并购历史之最。
Groq主攻LPU(Language Processing Unit)芯片技术,采用软件定义硬件的可重构数据流架构。其创始团队来自谷歌TPU早期研发核心,因此被业内称为“进阶版TPU”。
随着交易发酵,市场焦点已从金额本身转向技术路径:英伟达此举,显著抬高了非GPU类AI芯片赛道的战略价值。同类技术代表企业包括Intel拟收购的SambaNova、中国可重构AI芯片领军企业清微智能等。
为何是AI推理?
答案明确:AI推理。
据黄仁勋致员工邮件披露,英伟达计划将Groq的低延迟处理器集成至NVIDIA AI Factory架构,重点服务AI推理与实时工作负载。
当前大模型进入规模化部署阶段,面向海量终端用户的推理请求持续增长,对延迟稳定性、能效比、单位算力并发承载能力提出更高要求。而传统GPU虽擅长大规模并行计算,但能耗高、推理效率受限,难以长期满足低成本、高响应的商业化需求。
值得注意的是,Groq此前并无出售意愿,2025年9月刚完成7.5亿美元融资,投后估值约69亿美元,2025年营收目标为5亿美元,主要来自大模型推理服务与基础设施订单。
英伟达斥资200亿美元(占其预计2025年底现金储备700亿美元的近1/3),核心在于获取Groq的三张关键能力:
- 沙特市场卡位:2025年2月获沙特15亿美元投资承诺,用于扩建LPU推理基础设施;2024年12月建成沙特最大AI推理集群。
- 大模型推理实战能力:已实现万亿参数Kimi K2模型的实时token生成。
- 可重构架构底层技术:以TSP(Tensor Streaming Processor)为核心,实现软件定义硬件的数据流架构。
弥补GPU短板:Groq的技术突破
Groq芯片在int8精度下峰值算力达750TOPS,通过三大设计实现极致推理性能:
- TSP架构:取消指令分发、分支预测、缓存控制等冗余逻辑,编译器精确调度每个执行周期,达成时钟级确定性;
- SRAM内存架构:替代GPU常用HBM,大幅提升访存速度;
- 数据流驱动范式:区别于冯·诺依曼架构的“指令驱动数据”,采用“数据驱动计算”的流水线方式,避免资源等待,提升系统吞吐效率。
相比GPU,Groq在推理延时和吞吐上快5–18倍,能效比提升约10倍,本质是通过软件深度优化硬件利用率,实现“每一分算力都用在刀刃上”。
主流AI芯片三大技术流派成型
英伟达、英特尔等巨头密集布局,标志着AI芯片领域正式形成三大主流技术路径:
GPU路线
优势:暴力并行能力强、生态成熟,适用于大模型训练及通用计算;劣势:推理能效低。代表企业:英伟达、摩尔线程。
ASIC/DSA路线
优势:针对矩阵乘法等AI核心运算极致优化;劣势:硬件逻辑固化,非矩阵类任务性能骤降。代表企业:谷歌TPU、寒武纪、昆仑芯。
可重构路线
优势:基于数据流动态重构计算路径,兼顾能效与算法适应性;劣势:通用性略逊于GPU,灵活性弱于纯软件方案。代表企业:SambaNova、Groq、清微智能。
Groq采用“静态硬件+强编译器驱动”的重构模式,牺牲部分通用性换取高确定性;更经典路径则依托硬件级可编程交换矩阵,支持物理连接动态重构,通用性更强。
国产可重构芯片破局:清微智能冲刺IPO
2025年12月,清微智能宣布完成超20亿元C轮融资,并正式启动上市筹备,目标成为国内“非GPU”新型架构芯片领域首个上市标杆企业。
作为全球最早实现可重构计算商用的企业之一,清微智能是国家集成电路产业投资基金唯一投资的新型架构算力芯片企业,获国开装备基金、京能集团、北创投、京国瑞及蚂蚁集团、百度、商汤、兆易创新等多方支持。
在先进制程受限背景下,可重构架构通过“以架构换性能”的路径,成为中国算力自主的关键选项。其最新一代芯片具备3D扩展天然优势,可与3D芯片、晶圆级芯片技术深度融合,构建可持续迭代体系。
其自研高效互连技术TSM-LINK支持多芯片点对点直连,规避传统交换机带宽瓶颈与通信延迟;同步推进软件栈与工具链建设,降低开发迁移门槛。
依托中国丰富的端侧AI应用场景(如金融风控、工业质检、智能座舱等对低延时高度敏感的领域),清微智能2025年算力卡订单超3万张,累计出货超3000万颗,已在十余座千卡级智算中心实现规模化落地。IDC数据显示,其出货量已跻身国内AI芯片第一梯队。
可重构芯片不仅支撑国内AI推理算力供给,更可分散单一架构依赖带来的系统性风险。头部企业的资本化,将加速底层技术创新生态的形成。
结语:200亿美元拉高可重构赛道稀缺性
随着大模型应用重心向“快”与“便宜”迁移,可重构芯片的高能效、低延迟、强适配性正契合AI商业化普及浪潮。
英伟达200亿美元高价,不仅验证了可重构技术路径的商业价值,更释放出明确信号:AI计算胜负未定,软件定义硬件已成为下一代关键方向。在此背景下,国内可重构芯片头部企业的技术稀缺性与资本市场价值,在2026年进一步凸显。

