更便宜的AI模型正在崛起，科技巨头会爱吗？- 大数跨境

洞见畏来

2026-06-10

导读："80% 的工作负载将在 12 到 18 个月内切换到便宜 99% 的模型。" —— Brian Arm

"80% 的工作负载将在 12 到 18 个月内切换到便宜 99% 的模型。" —— Brian Armstrong

人工智能的浪潮席卷而来，我们已经习以为常地认为：模型越大，能力越强，赢家通吃。这个逻辑在过去几年几乎成了行业的铁律。OpenAI 和 Anthropic 每发布一代新模型，参数规模就再上一个台阶，用户的期待也水涨船高。资本疯狂涌入，估值一路飙升，所有人都相信一个朴素的道理：只要模型够大，就能解决一切。

但风向，似乎正在悄悄改变。

当成本压力真正落到企业头上时，那些「小而便宜」的模型，开始被人们认真打量。这不是渐进式改良，而是一场可能动摇行业根基的地震。问题摆在所有人面前：我们准备好拥抱更便宜的 AI 了吗？

🧠 一个假设正在崩塌

过去这些年，AI 行业的竞争逻辑很简单：比谁的模型更聪明。各大实验室卯足了劲，把算力堆到极致，训练出越来越庞大的模型。用户也养成了习惯——默认用最新、最强的模型，反正投资人买单，代币价格还被补贴着，谁在乎多花几美元？

这就是**"规模至上"**的叙事。它源于一个经典的行业信念：只要算力足够，模型就能不断突破。实验室们纷纷把赌注压在最昂贵的训练方案上，试图用规模碾压一切。从 GPT-3 到 GPT-4，再到 GPT-4o，每一次升级都是一次军备竞赛的加码。OpenAI、Anthropic、Google DeepMind，谁都不敢在这场竞赛中掉队，因为掉队意味着被遗忘。

然而，当补贴退潮、代币价格开始上涨，企业第一次真切感受到了成本的压力。原来，AI 不是越贵越好，有时候，它可能只是贵得没必要。一个客服机器人，一个文档分类器，一个邮件摘要工具——真的需要调动万亿参数的庞然大物来完成吗？这就像用火箭炮打蚊子，威力确实够大，但账单也足够吓人。

💸 80% 的 workloads 将跑在便宜模型上？

Coinbase 联合创始人 Brian Armstrong 在 X 上抛出了一个大胆的预测：

"对智能的需求几乎是无限的，但 80% 的工作负载将在 12 到 18 个月内运行在便宜 99% 的模型上。剩下的 20% 仍然会需要最新一代模型，因为那些任务需要把智商拉满。"

如果这句话成真，对整个 AI 行业的冲击将难以估量。

想想看，过去 AI 公司都在卷质量，客户也默认用最强模型。但现在，如果同样的工作可以用更便宜的模型完成，而且质量不打折，那 AI 的经济学就彻底变了。更重要的是，省下来的钱从谁的口袋里掏？答案是：OpenAI、Anthropic 这些大实验室——偏偏就在它们筹备 IPO 的节骨眼上。

这对它们的估值和收入预期，无疑是一记重拳。过去一年，OpenAI 的估值已经飙升到数千亿美元，Anthropic 也在紧锣密鼓地准备上市。它们的商业模式建立在「客户愿意为最强模型支付溢价」的假设上。如果这个假设被推翻，资本市场的故事就要重写。投资者会追问：如果客户只需要花 1% 的钱就能搞定 80% 的需求，那这些千亿估值凭什么撑得住？

🔬 实验证明了什么？

光预测不够，数据才有说服力。

AI 法律工具 Harvey 最近做了一项测试。它把推理任务拆分给 Claude Opus 和 Fireworks AI 的 GLM 5.1 组合处理：简单任务交给小模型，复杂推理才呼叫大模型。结果呢？

推理成本直接砍掉 3 倍，输出质量却完全没有下降。

这个数字听起来简单，但背后是商业模式的重构。Harvey 的联合创始人 Gabe Pereyra 说得很直白："质量永远排在第一位，尤其在法律领域。但质量的标准正在进化——从'所有任务都用最强模型'，变成'用最适合的模型，最高效地给出正确答案'。"

这个转变，听着理所当然，但细想之下，它和过去几年的行业逻辑是背道而驰的。长久以来，"质量"几乎等同于"用了 GPT-4"或"调用了 Claude Opus"。但现在，质量被重新定义：在正确的时间，用正确的工具，以正确的成本，交出正确的答案。这是一个更成熟的定义，也是一个更残酷的真相——它意味着很多大模型的溢价，本质上是在收智商税。

🥊 小模型 vs 大模型，不只是中美之争

现在讨论便宜模型，很多人第一反应是：中国模型或者开源模型在挑战美国巨头。但这个框架太狭隘了。

真正的分界不是「闭源 vs 开源」，而是大模型 vs 小模型。从 GPT-5.5 换到 DeepSeek 的 V4 Flash 可以省钱，但换到 GPT-5.4-mini 同样可以省钱。省钱的关键不在于模型是谁家的，而在于模型是不是太大了。

事实上，大实验室自己的「迷你版」模型也在降价，和独立的开源模型在推理市场上打起了价格战。而对于小模型 vs 大模型这个更大的议题来说，谁赢并不重要——重要的是，小模型本身正在赢。这很反直觉：过去几年的行业核心就是「规模越大越好」，现在却要反过来说，够用就行。

更值得玩味的是，这场价格战不是单向的。OpenAI 发布了 GPT-4o-mini，Anthropic 推出了 Claude 3 Haiku，Google 有 Gemini Flash——这些巨头自己也在主动把模型做小、做便宜。它们不是被动防守，而是提前卡位。因为它们知道，如果一个客户因为价格太贵而转向竞争对手，那么即使它只流失了 80% 的「低端需求」，也意味着巨大的收入损失。

🏢 企业会真的切换吗？

现在的问题是：面对成本压力，企业会怎么做？

切换模型只是选项之一。它们也可能选择减少调用次数、缩短上下文窗口、砍掉那些 ROI 最低的项目。换句话说，省钱的路不止一条，换小模型不一定是最快的那条。有些企业可能已经签了一年的大模型合同，短期内无法切换。有些企业的高层还在迷信「最强模型=最好结果」，需要时间去扭转观念。还有些人担心的是：如果换了小模型，出了错谁来背锅？毕竟用 GPT-4 出了问题，可以怪技术；用小模型出了问题，可能就得怪决策了。

但如果最终证明，绝大多数部署场景用小模型就能跑得很好，那对大模型的推理需求就会受到严重打击。实验室花天价训练出来的前沿模型，可能面临一个尴尬的灵魂拷问：

你这么贵，到底值不值？

这个问题的答案，将决定未来几年 AI 行业的格局。如果答案是否定的，那么我们可能会看到一场史无前例的估值回调。那些靠「大模型叙事」融到钱的创业公司，日子会变得很难过。而对于更务实的玩家来说，这或许是一个重新洗牌的机会。

🎯 写在最后：一个新的转折点

我们正站在 AI 行业的一个微妙转折点上。

过去，bigger 就是 better；未来，合适才是更好。当企业开始认真计算每一美分的投入产出比，当"最强模型"的光环开始褪色，AI 行业将从一场军备竞赛，变成一场效率竞赛。

这对创业公司可能是好事——更低的成本意味着更多的试错空间。一个预算有限的小团队，以前可能根本用不起 GPT-4，现在可以用小模型先跑起来 MVP。产品跑通了再升级，没跑通也亏不了多少。这种「低成本试错」的节奏，对于创新创业是极度友好的。

但对 OpenAI 和 Anthropic 这样的巨头来说，却是一道严峻的算术题：如果 80% 的客户不再需要最顶级的模型，那 IPO 的故事该怎么讲？它们不能只说"我们模型最强"，而要证明"客户愿意为最强买单"。一旦后者不成立，估值的泡沫就要被重新挤压。更麻烦的是，如果巨头们自己推小模型来抢市场，那等于自己革自己的命——左右都是割肉。

科技巨头能不能学会爱上更便宜的模型？答案可能不是"爱不爱"，而是"不得不爱"。因为最终，市场说了算。客户不会为不需要的算力买单，资本也不会为无法兑现的溢价投票。cheaper models are coming，而且它们来得比任何人想象的都要快。当风暴来临，真正适应的人，才能活下来。

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 0

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读0

粉丝0

内容0