大数跨境
0
0

[Light·科技]为什么 OpenAI 们都要搞 AI 基建?Groq 创始人把背后的逻辑讲透了

[Light·科技]为什么 OpenAI 们都要搞 AI 基建?Groq 创始人把背后的逻辑讲透了 LIGHT4Life
2025-11-30
1
导读:大模型是心智的望远镜。它们现在让我们觉得自己很渺小,但一百年后,我们会意识到智能的广阔超乎想象,而那同样是美的。

本篇文章转载自「AI产品阿颖」

近期,OpenAI在芯片与数据中心领域动作频频,不仅推进自研芯片,还与英伟达、AMD、Oracle等企业合作共建AI基础设施。这一系列布局背后,是AI发展对算力的极度依赖。

Groq创始人Jonathan Ross在最新访谈中深入剖析了当前AI算力格局的核心逻辑。Groq是一家专注于超低时延AI推理的LPU芯片与云服务公司,被视为英伟达的重要挑战者。其观点为理解AI基础设施竞争提供了关键视角。

  • 若OpenAI或Anthropic的推理算力翻倍,收入几乎可在一个月内翻倍——AI增长直接受限于算力供给。
  • AI三要素(数据、算法、算力)中,算力是最易调整且见效最快的因素。
  • 真正的护城河不仅是技术或品牌,更是高效、可控的供应链和交付能力。
  • 芯片制造难度被严重低估,成功依赖硬件设计、软件生态与技术节奏的协同。
  • 科技巨头“造芯”核心目的并非性能超越,而是掌握供应链主动权,摆脱外部制约。
  • 即便五年前发布的H100 GPU仍在高价租赁,反映出市场算力严重供不应求。
  • 在稀缺环境下,稳定、快速的交付能力本身即构成强大竞争优势。

芯片要自建?难得很

主持人提问当前是否处于AI泡沫期,Jonathan Ross认为更应关注头部企业的实际投入。Google、Microsoft、Amazon及多国政府持续加码AI基础设施,微软甚至将大批GPU用于自营服务而非出租,因其自用收益更高。

目前AI收入高度集中,约35至36家公司贡献了99%的算力支出。尽管多家企业尝试自研芯片,但成功率极低。Google曾同时推进三个芯片项目,仅TPU最终胜出;特斯拉Dojo项目已被取消。造芯复杂度极高,远非简单复制即可成功。

关于资金循环质疑,Ross指出只要资金用于真实基础设施建设,便非空转。以英伟达为例,其股价飙升源于全球算力供给严重不足,用户被锁定在其生态中。他断言:若OpenAI和Anthropic算力翻倍,收入也将几乎翻倍。

算力限制直接影响用户体验。Anthropic受限于Token调用上限,OpenAI则通过降低响应速度控制负载。而速度至关重要——如同快消品中多巴胺触发速度决定品牌黏性,网页加载每提升100毫秒,转化率可提高8%。

Ross强调,自研芯片真正难点不在硬件设计,而在软件生态构建与技术演进节奏的匹配。他相信OpenAI、Anthropic及各大云厂商终将自研芯片,根本动机在于“掌控命运”——打破英伟达在HBM(高带宽内存)上的买方垄断地位。

HBM产能有限,中介层供应紧张,导致整机GPU年产量受限。大客户为确保供给,宁愿自建芯片。即便自研芯片成本更高,但只要系统整体价值提升显著,微小性能优势即可转化为巨大商业优势。

回本周期的算法

HBM供应链受资本开支巨大、厂商保守扩产等因素制约,英伟达凭借预付款提前锁定产能,形成壁垒。尽管其他厂商有意分散风险,但难以抗衡其议价能力。

大规模融资主要用于数据中心建设,而非芯片采购。数据中心摊销周期长达10年,远高于芯片的3-5年。然而,AI芯片更新节奏更快,实际按年迭代更为现实。

芯片价值分为部署与运行两个阶段:部署需覆盖资本支出(CapEx),运行只需覆盖运营成本(OpEx)。只要能覆盖电费与机房费用,旧芯片仍可继续使用。因此,回本周期越短,决策越可控。

供给决定胜负

当前市场存在大量长期合同,部分企业面临违约解约与持续亏损运行的权衡。Groq策略是压缩回本周期,降低运营成本,以应对快速迭代。

尽管H100已近五年,仍因算力短缺而维持高租金,收入远超运营成本。这表明市场核心矛盾是“可获得的产品”而非“最好的产品”。

Groq的LPU芯片交付周期仅6个月,远快于GPU行业普遍的18个月以上。这一速度成为客户最关注点,尤其在模型迭代加速背景下,两年规划周期已不现实。

现有硬件生态形成正反馈闭环:模型围绕GPU优化,强化其主导地位。新进入者必须缩短产品与生态的适配周期,才能打破僵局。

开源不等于更省钱

尽管OpenAI、Anthropic等可能自研芯片,英伟达仍将保持强势。过去十年数据中心建设普遍低估需求,导致持续供不应求。AI的独特之处在于可通过增加算力直接提升服务质量,推动“Token即服务”模式普及。

所谓GPT-5转向效率的说法并不准确。OpenAI进入印度等价格敏感市场,需极致降本。但开源模型运行成本未必更低。例如,某些中国模型训练成本低,但推理成本约为美国同类模型的十倍。

中美算力竞争本质是能源博弈。中国在主场可通过核电与补贴堆砌算力规模;但在海外,能效更高的芯片更具优势。未来两三年,美国有望凭借高效芯片拉拢盟友参与AI竞赛。

能源与算力的比拼

模型并非决定性优势。品牌效应使用户愿为OpenAI支付溢价,即便使用旧模型亦然。Anthropic应开源上代模型,增强生态兼容性,吸引用户迁移并复用提示词。

能源是算力基础。除核电外,风电、水电等可再生能源同样具备成本优势。挪威风电利用率高达80%,若结合水电储能,单国供电能力可接近美国全国水平。日本已重启核电机组,并加速推进2纳米芯片工厂建设。

欧洲若不加快能源布局,将沦为“旅游经济”。仅靠数据本地化或模型主权无法取胜,缺乏算力支撑的模型再先进也无用武之地。Mistral等欧洲模型需配套足够算力才能公平竞争。

算力没有上限

算力需求被严重低估。与工业革命不同,AI无需等待硬件制造完成即可释放潜力——增加算力可直接提升模型质量与用户规模,形成正向循环。

提升数据、算法或算力任一要素,均可带动整体进步。其中算力最易扩展,年年迭代,投入即可见效。合成数据尚未完全打通,算力仍是当前最可靠的增长引擎。

Ross预测AI将带来三大变革:一是通缩压力,供应链全面提效使商品更便宜;二是工作时间减少,人们可用更少劳动维持生活;三是催生全新职业与产业,未来可能出现用工短缺而非失业潮。

是真实价值还是情绪价值?

AI价值可分为“秤”(真实价值)与“选美”(情绪溢价)。私募基金争购廉价算力以改善被投企业利润,证明其真实经济价值。股市过热可能导致短期波动,但低谷常孕育新巨头。

当前最大挑战是人才争夺。顶尖工程师可轻松融资创业,导致初创公司难以组建团队。尽管资本推高薪资,AI也在提升个体生产力,经济繁荣与企业成功仍可并存。

Ross看好谷歌在AI转型中的潜力,其文化鼓励创新。虽Gemini落地略显零散,但分发优势仍在。他认为OpenAI与谷歌将成为长期双雄,Anthropic则更聚焦编程工具领域。

护城河与毛利的取舍

Ross认为OpenAI与Anthropic均被严重低估。AI实验室将持续扩大市场边界,未来或将形成“九巨头”乃至“二十巨头”格局。OpenAI有吞并应用层的倾向,而Groq选择不涉足通用模型,避免与客户竞争,以此建立信任。

Groq最新融资7.5亿美元,估值近70亿。硬件销售已实现正毛利,软件利润则取决于芯片生命周期。作为未上市公司,其优势在于无需披露财务细节,可灵活调整毛利策略。

他主张在业务稳定前提下维持较低毛利,以增强竞争力。算力紧缺时,高溢价订单可支撑整体低价运营,形成动态平衡。

从芯片到系统视角

展望五年后,Jonathan Ross预测英伟达营收份额仍将超50%,但出货量占比或降至10%。品牌溢价使其维持高毛利,客户出于避险倾向选择英伟达。

然而,头部买家话语权强,更关注业务成败而非品牌,将推动多元化芯片采用。Groq等新势力有机会崛起。若问英伟达能否达到10万亿美元市值,他表示不会惊讶;至于Groq是否也能达成,答案是:有可能。

【声明】内容源于网络
0
0
LIGHT4Life
各类跨境出海行业相关资讯
内容 1618
粉丝 0
LIGHT4Life 各类跨境出海行业相关资讯
总阅读9.6k
粉丝0
内容1.6k