解密Cerebras:4万亿晶体管晶圆级芯片领跑AI算力革命
Cerebras公司研发的晶圆级芯片面积达46,225平方毫米(直径超200毫米),集成4万亿晶体管,远大于常规芯片。该公司于2026年5月14日登陆纳斯达克,发行价185美元首日涨89%,市值突破750亿美元。五位联合创始人四人源自AMD收购的SeaMicro,一人来自MIT,十年潜心研发使该公司站上AI算力竞赛前沿。
晶圆级引擎技术突破
核心产品WSE-3颠覆传统芯片制造模式,直接采用整片晶圆打造单一芯片。集成84颗虚拟晶粒,每颗含10,700个计算核心,总计90万个核心通过2D网状片上网络互联。内存带宽达21拍字节/秒,网络带宽214拍字节/秒,显著提升数据处理效率。
(来源:https://www.cerebras.ai/)
高带宽内存架构
采用台积电5纳米工艺,每计算核心配备48KB本地SRAM,全芯片SRAM总量达44GB。内存与计算单元物理距离仅几十微米,无需依赖外部HBM。Cerebras宣称同等硅片面积下内存带宽可达GPU的200倍,彻底解决传统GPU带宽瓶颈问题。
(来源:https://www.cerebras.ai/)
稀疏计算与Weight Streaming
独创架构专为神经网络稀疏特性优化:发送端实时过滤零值数据,仅传输非零信息至对应核心,每个数据包含16位数据及控制信息,实现高效乘加运算。BLAS级别以下运算保持高利用率,避免无效计算。
Weight Streaming技术使模型权重不驻留芯片,而是通过MemoryX外部设备按需传输。计算时权重与激活值完成乘加后即被释放,突破芯片内存限制,支持万亿参数级大模型训练。
(来源:https://www.cerebras.ai/)
软件生态与系统架构
编译工具链可自动将PyTorch/TensorFlow模型映射至90万个核心。Transformer模型中,编译器按维度切分负载:隐藏维度分布于X轴,批大小与序列长度分布于Y轴。矩阵乘法通过权重行广播与列向归约实现,全程静态调度确保运行效率。
(来源:https://www.cerebras.ai/)
创始团队与商业表现
团队核心均来自SeaMicro及顶尖学府:CEO Andrew Feldman(斯坦福)曾主导3.57亿美元收购案;CTO Sean Lie(MIT)为AMD院士;其余成员涵盖麻省理工、加州伯克利等资深架构师。2025年营收5.1亿美元,净利润2.38亿美元实现扭亏,前两大客户MBZUAI和G42贡献86%收入,客户集中度较2024年明显改善。
(来源:https://www.cerebras.ai/)
市场挑战与发展前景
晶圆级方案虽在稀疏计算和大模型推理具明显优势,但面临制造良率与散热挑战。Cerebras通过冗余链路和自动纠错应对缺陷,CS-3系统采用液冷方案解决功耗问题。作为首家登陆纳斯达克的纯AI芯片公司,首日暴涨释放积极信号,但需持续拓展客户以应对英伟达、AMD及创业公司的激烈竞争。
(来源:https://www.cerebras.ai/)

