新智元报道
【新智元导读】Claude半月内第七次大规模故障,Anthropic因算力储备不足,启动自研芯片计划。
Claude全球服务再度中断,引发开发者工作受阻。美东时间周三上午,Anthropic官方状态页显示Claude核心服务及API接口出现高错误率,高峰期6000人在Downdetector平台提交故障报告。
此次事件暴露Anthropic算力储备问题,此前内部评估已指出该隐患。为填补算力缺口,该公司宣布启动自研芯片项目。
Claude故障频发背后的算力困境
4月以来,Claude累计发生七次服务中断:
- 4月1日:Opus 4.6和Sonnet 4.6模型超时异常
- 4月3日:Claude Code服务中断70分钟
- 4月6-7日:连续两天登录系统崩溃
- 4月10日:非Opus模型集体错误
- 4月13日:Claude.ai中断15分钟
- 4月15日:本次3小时大范围宕机
Anthropic将故障归因于“重磅发布后的用户激增”,但行业分析指出算力储备不足是核心症结。
自研芯片计划正式启动
路透社独家披露,Anthropic已进入芯片自研前期规划。该项目尚处“极早期”阶段,预计研发成本约5亿美元,需3-4年完成设计到量产。参考谷歌TPU研发周期,从立项到规模化部署耗时五年。
目前该公司采用多架构混合策略:
• 调用AWS Trainium、Google TPU及英伟达GPU跨平台运行
• 上周宣布与谷歌、博通共建3.5GW超算集群
行业转向ASIC定制化芯片
头部AI企业普遍加速芯片自研:
- Meta与博通合作量产MTIA芯片,2027年起部署数GW级算力
- OpenAI博通合作项目计划2026年部署,2029年累计10GW上线
|
|
定制芯片较通用GPU具双重优势:
• 总持有成本降低30%-50%
• 每瓦性能提升一个数量级
但ASIC存在模型绑定风险,研发初期仍依赖英伟达生态。
算力危机下的商业策略调整
Anthropic年化营收突破300亿美元,企业市场份额达73%,但模型推理成本持续侵蚀利润。为缓解压力,近期推出三项调整:
企业服务计费模式改革
Claude Enterprise变更为“20美元基础月费+用量计费”,重度用户成本或增2-3倍。发言人称此举可更精准匹配使用需求,避免额度浪费或超额限制。
第三方工具使用限制
限制Claude Code订阅用户接入OpenClaw等第三方Agent工具,优先保障核心API服务质量。
全球实名认证强化
推行强制KYC验证,要求政府签发证件及实时自拍,非支持地区账户将无法使用。
上述措施反映订阅制模型的算力困局:当用户需求超过系统容量,必须通过供给侧优化破解瓶颈。目前Anthropic仍需依赖外部算力,而自研芯片最早要2027年才能落地,期间服务稳定性仍将承压。



