大数跨境

更便宜的AI模型正在崛起,科技巨头会爱吗?

更便宜的AI模型正在崛起,科技巨头会爱吗? 洞见畏来
2026-06-10
0
导读:"80% 的工作负载将在 12 到 18 个月内切换到便宜 99% 的模型。" —— Brian Arm

"80% 的工作负载将在 12 到 18 个月内切换到便宜 99% 的模型。" —— Brian Armstrong

人工智能的浪潮席卷而来,我们已经习以为常地认为:模型越大,能力越强,赢家通吃。这个逻辑在过去几年几乎成了行业的铁律。OpenAI 和 Anthropic 每发布一代新模型,参数规模就再上一个台阶,用户的期待也水涨船高。资本疯狂涌入,估值一路飙升,所有人都相信一个朴素的道理:只要模型够大,就能解决一切。

但风向,似乎正在悄悄改变。

当成本压力真正落到企业头上时,那些「小而便宜」的模型,开始被人们认真打量。这不是渐进式改良,而是一场可能动摇行业根基的地震。问题摆在所有人面前:我们准备好拥抱更便宜的 AI 了吗?

               
🧠 一个假设正在崩塌

过去这些年,AI 行业的竞争逻辑很简单:比谁的模型更聪明。各大实验室卯足了劲,把算力堆到极致,训练出越来越庞大的模型。用户也养成了习惯——默认用最新、最强的模型,反正投资人买单,代币价格还被补贴着,谁在乎多花几美元?

这就是**"规模至上"**的叙事。它源于一个经典的行业信念:只要算力足够,模型就能不断突破。实验室们纷纷把赌注压在最昂贵的训练方案上,试图用规模碾压一切。从 GPT-3 到 GPT-4,再到 GPT-4o,每一次升级都是一次军备竞赛的加码。OpenAI、Anthropic、Google DeepMind,谁都不敢在这场竞赛中掉队,因为掉队意味着被遗忘。

然而,当补贴退潮、代币价格开始上涨,企业第一次真切感受到了成本的压力。原来,AI 不是越贵越好,有时候,它可能只是贵得没必要。一个客服机器人,一个文档分类器,一个邮件摘要工具——真的需要调动万亿参数的庞然大物来完成吗?这就像用火箭炮打蚊子,威力确实够大,但账单也足够吓人。

               
💸 80% 的 workloads 将跑在便宜模型上?

Coinbase 联合创始人 Brian Armstrong 在 X 上抛出了一个大胆的预测:

"对智能的需求几乎是无限的,但 80% 的工作负载将在 12 到 18 个月内运行在便宜 99% 的模型上。剩下的 20% 仍然会需要最新一代模型,因为那些任务需要把智商拉满。"

如果这句话成真,对整个 AI 行业的冲击将难以估量。

想想看,过去 AI 公司都在卷质量,客户也默认用最强模型。但现在,如果同样的工作可以用更便宜的模型完成,而且质量不打折,那 AI 的经济学就彻底变了。更重要的是,省下来的钱从谁的口袋里掏?答案是:OpenAI、Anthropic 这些大实验室——偏偏就在它们筹备 IPO 的节骨眼上。

这对它们的估值和收入预期,无疑是一记重拳。过去一年,OpenAI 的估值已经飙升到数千亿美元,Anthropic 也在紧锣密鼓地准备上市。它们的商业模式建立在「客户愿意为最强模型支付溢价」的假设上。如果这个假设被推翻,资本市场的故事就要重写。投资者会追问:如果客户只需要花 1% 的钱就能搞定 80% 的需求,那这些千亿估值凭什么撑得住?

               
🔬 实验证明了什么?

光预测不够,数据才有说服力。

AI 法律工具 Harvey 最近做了一项测试。它把推理任务拆分给 Claude OpusFireworks AIGLM 5.1 组合处理:简单任务交给小模型,复杂推理才呼叫大模型。结果呢?

推理成本直接砍掉 3 倍,输出质量却完全没有下降。

这个数字听起来简单,但背后是商业模式的重构。Harvey 的联合创始人 Gabe Pereyra 说得很直白:"质量永远排在第一位,尤其在法律领域。但质量的标准正在进化——从'所有任务都用最强模型',变成'用最适合的模型,最高效地给出正确答案'。"

这个转变,听着理所当然,但细想之下,它和过去几年的行业逻辑是背道而驰的。长久以来,"质量"几乎等同于"用了 GPT-4"或"调用了 Claude Opus"。但现在,质量被重新定义:在正确的时间,用正确的工具,以正确的成本,交出正确的答案。这是一个更成熟的定义,也是一个更残酷的真相——它意味着很多大模型的溢价,本质上是在收智商税。

               
🥊 小模型 vs 大模型,不只是中美之争

现在讨论便宜模型,很多人第一反应是:中国模型或者开源模型在挑战美国巨头。但这个框架太狭隘了。

真正的分界不是「闭源 vs 开源」,而是大模型 vs 小模型。从 GPT-5.5 换到 DeepSeek 的 V4 Flash 可以省钱,但换到 GPT-5.4-mini 同样可以省钱。省钱的关键不在于模型是谁家的,而在于模型是不是太大了

事实上,大实验室自己的「迷你版」模型也在降价,和独立的开源模型在推理市场上打起了价格战。而对于小模型 vs 大模型这个更大的议题来说,谁赢并不重要——重要的是,小模型本身正在赢。这很反直觉:过去几年的行业核心就是「规模越大越好」,现在却要反过来说,够用就行

更值得玩味的是,这场价格战不是单向的。OpenAI 发布了 GPT-4o-mini,Anthropic 推出了 Claude 3 Haiku,Google 有 Gemini Flash——这些巨头自己也在主动把模型做小、做便宜。它们不是被动防守,而是提前卡位。因为它们知道,如果一个客户因为价格太贵而转向竞争对手,那么即使它只流失了 80% 的「低端需求」,也意味着巨大的收入损失。

               
🏢 企业会真的切换吗?

现在的问题是:面对成本压力,企业会怎么做?

切换模型只是选项之一。它们也可能选择减少调用次数、缩短上下文窗口、砍掉那些 ROI 最低的项目。换句话说,省钱的路不止一条,换小模型不一定是最快的那条。有些企业可能已经签了一年的大模型合同,短期内无法切换。有些企业的高层还在迷信「最强模型=最好结果」,需要时间去扭转观念。还有些人担心的是:如果换了小模型,出了错谁来背锅?毕竟用 GPT-4 出了问题,可以怪技术;用小模型出了问题,可能就得怪决策了。

但如果最终证明,绝大多数部署场景用小模型就能跑得很好,那对大模型的推理需求就会受到严重打击。实验室花天价训练出来的前沿模型,可能面临一个尴尬的灵魂拷问:

你这么贵,到底值不值?

这个问题的答案,将决定未来几年 AI 行业的格局。如果答案是否定的,那么我们可能会看到一场史无前例的估值回调。那些靠「大模型叙事」融到钱的创业公司,日子会变得很难过。而对于更务实的玩家来说,这或许是一个重新洗牌的机会。

               
🎯 写在最后:一个新的转折点

我们正站在 AI 行业的一个微妙转折点上。

过去,bigger 就是 better;未来,合适才是更好。当企业开始认真计算每一美分的投入产出比,当"最强模型"的光环开始褪色,AI 行业将从一场军备竞赛,变成一场效率竞赛

这对创业公司可能是好事——更低的成本意味着更多的试错空间。一个预算有限的小团队,以前可能根本用不起 GPT-4,现在可以用小模型先跑起来 MVP。产品跑通了再升级,没跑通也亏不了多少。这种「低成本试错」的节奏,对于创新创业是极度友好的。

但对 OpenAI 和 Anthropic 这样的巨头来说,却是一道严峻的算术题:如果 80% 的客户不再需要最顶级的模型,那 IPO 的故事该怎么讲?它们不能只说"我们模型最强",而要证明"客户愿意为最强买单"。一旦后者不成立,估值的泡沫就要被重新挤压。更麻烦的是,如果巨头们自己推小模型来抢市场,那等于自己革自己的命——左右都是割肉。

科技巨头能不能学会爱上更便宜的模型?答案可能不是"爱不爱",而是"不得不爱"。因为最终,市场说了算。客户不会为不需要的算力买单,资本也不会为无法兑现的溢价投票。cheaper models are coming,而且它们来得比任何人想象的都要快。当风暴来临,真正适应的人,才能活下来。



【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 0
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读0
粉丝0
内容0