大数跨境
0
0

一文详解FPGA异构计算芯片

一文详解FPGA异构计算芯片 智能计算芯世界
2025-11-16
0

来自“XPU:AI时代与异构计算(AI算力篇)”,本文已分享完毕,本异构计算芯片系列分CPU篇(一文详解AI时代与异构计算芯片)、GPU篇一文详解AI时代与异构计算芯片)、FPGA篇(本篇)和ASIC篇(一文详解FPGA(TPU、DPU和NPU)异构计算芯片)四篇分享。

所有资料都已上传至智能计算芯知识星球”星球异构计算技术专栏(搜索“异构计算”下载)。

FPGA即现场可编程门阵列,是在硅片上预先设计实现的具有可编程特性的集成电路,用户在使用过程中可以通过软件重新配置芯片内部的资源实现不同功能,因此具有优越的灵活性,能够满足不同场景的应用需求。

相比CPU,FPGA具备两大性能优势,一是优越的灵活性,二是低时延处理。FPGA 芯片类似于集成电路中的积木,用户可根据各自的需求和想法,将其拼搭成不同的功能、特性的电路结构,以满足不同场景的应用需求。

GPU在设计完成后无法改动硬件资源,而 FPGA 根据特定应用对硬件进行编程,更具灵活性。机器学习使用多条指令平行处理单一数据,FPGA 的定制化能力更能满足精确度较低、分散、非常规深度神经网络计算需求。

时延方面,CPU为了保证最大程度的通用性和复杂任务的处理,引入了指令集和对应的取指译码操作,而FPGA在设计时就相当于预先指定了 指 令, 无需像CPU一样 进行Fetch( 取 指 )-Decode(译码),可以直接进入相当于CPU 的Excecute( 执 行)的环节。同时,FPGA 采用高并 行 架 构, 数十万个CLB 可以 同 步 执 行。 现代CPU虽然有多个ALU(核心计算单元)以完成并行计算,但在并行度上仍然不如有数十万个CLB 的FPGA。

此外, 对于现代CPU 为了提升并行 度 增 加 的模块,比如BranchPrediction( 分 支 预 测 ),Out-of orderExecution( 乱 序 行), 调 度(Scheduler),FPGA 都不需要,因此FPGA完成指令所花费的时钟周期要远小于CPU。

在 高 并 行 计 算 中,FPGA的时延优势更突出。比如,在完成雷达波束赋形这一高并行算 法 时, 使 用XilinxVirtex7(FPGA) 时 延 仅 需3.3ms,而且时钟频率仅需125MHz,系统功耗仅为75W, 而使用ARMA9(CPU) 在667MHz的时钟频率下依然需要250ms才能完成,而且系统功耗高至1400W。

低延时与灵活性优势造就了FPGA 广阔的下游市场。东兴证 券 研 报 称,2022 年FPGA全球市场空间超80 亿美元,其中大部分需求来自于电信、工业、 数 据 中 心&AI、 国 防& 航空 航 天 四 大 领 域,2028 年将增长至接近200 亿美元,2022年~2028 年CAGR 超15%,由中国市场引领增长。

据Marketsandmarkets预计2028年规模约为45 亿美元,2022 年~2028 年复合增速18%,高于全球其他地区。

具体来看,FPGA 在 数 据中心&AI 的增长驱动力主要来自于低时延推理的需求。

FPGA 的 高 并 行、 低 时延、 低 功 耗 的 特 性 特 别 适 合需要实时推理的场景。例如,YOLO是目前最重要的实时目标检测算 法, 使 用 赛 灵 思(Xilinx)的ZynqUltraScale+MPSoC(某个FPGA 方案),可以在约18ms 的 时 延 完 成YOLOv5(第五代YOLO 算法),而使用Zynq7100( 另 一 种FPGA方 案) 则 可 实 现 压 缩 后 的YOLOv7 模型(第七代YOLO算法),在30 帧率下实现小于33ms(15ms) 的低时延推理。

此外,FPGA 在数据中心常用于计算加速,比如云计算的加速实例、金融的高频/ 低时延的交易系统处理。FPGA 还广泛应用于数据中心的互联、存储控制系统。

目前, 全球FPGA 市 场 按制程可大致分为 三 类:90nm以上,主要用于高可靠的航天应 用;20-90 nm, 主要用于国防、航空航天、汽车、消费电子等领域; ≤16nm 以下。

其 中,14/16nm FPGA 主 要应用在电信领域的基带单元和有线网络,汽车领域的激光雷达,工业中的安防和仪器仪表等,7nm FPGA 则 主 要 应 用在数据中心加速计算。

制程竞争是贯穿FPGA 发展历史的竞争主线,制程领先后 则 具 备 先 发 优 势, 占 据 更多市场份额和盈利空间, 是FPGA 市场份额最直接的决定因素。因此FPGA 市场高度集中, 龙 头 赛 灵 思(Xilinx) 占据过半份额,前四名玩家合计份额超90%。在数据中心和AI加速计算领域,赛灵思占据绝对性份额。

而国内厂商在应用于数据中心&AI 领域的高端FPGA 市场 仍 处 在 从0 到1 阶 段。 国 内FPGA 厂商不仅需要硬件架构的创新,还需要EDA 软件和自研IP 能力的提升,以及更完善的国产应用生态培养。

本文已分享完毕,本异构计算芯片系列分CPU篇GPU篇FPGA篇(本文)ASIC篇四篇分享。

相关阅读:

FPGA芯片设计及前沿技术

一文了解FPGA技术知识

万能芯片之FPGA详解

FPGA:被RISC-V完全征服

FPGA从硬件到软件,国产替代分析(附合集)

英伟达GPU参数速查表(完整版)

一文图解CPU、GPU、NPU技术

GPU市场分析、竞争格局和产业链(附合集)

100个GPU核心基础知识

深度解读Blackwell系列GPU芯片

2025年AMD GPU战略

GPU集群:什么是Scale Up和Scale Out?

图形GPU:产业化发展和标准现状

GPU训练:十万卡AI集群思考

Blackwell GPU产品演进及参数分析

从H100、GH200到GB200,三代GPU集群架构解析

GPU详解:分布式训练与NVLink发展

英伟达GPU规格和架构路线图(2025)

GPU详解:NVSwitch基础和原理剖析

————本文完毕————

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。


免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索AI_Architect”或“扫码关注公众号实时掌握深度技术分享,点击阅读原文获取更多原创技术干货


【声明】内容源于网络
0
0
智能计算芯世界
聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享。
内容 557
粉丝 0
智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享。
总阅读46
粉丝0
内容557