大模型厂商，是时候告别Token狂欢了- 大数跨境

伯虎财经

2026-04-10

导读：更便宜的Token不是未来。

来源 | 伯虎财经（bohuFN）

作者 | 楷楷

“低价卖Token并对第三方开放看似友好，实则是陷阱。”近日，小米集团MiMo负责人罗福莉在X平台发文警示，大模型公司不应盲目参与Token价格战。此举源于Anthropic突然切断第三方工具对Claude订阅的访问权限，成为行业罕见的“降温信号”。

在Token用量激增的热潮中，罗福莉的公开信与Anthropic的“封杀令”引发深思：大模型厂商究竟是成本精算失误，还是以短期亏损换取未来入场券？若属后者，市场或将持续“装睡”。

Anthropic撑不住了

Anthropic于4月4日宣布，Claude Pro和Max订阅将不再覆盖OpenClaw等第三方工具。用户仅获等额月费补贴，远不及此前200美元无限调用的优惠，引发社交媒体强烈反弹。

成本压力是关键动因。Anthropic指出第三方工具“造成系统过载”，需优先保障核心用户体验。据外媒分析，每月200美元的Claude Code订阅或消耗高达5000美元算力成本，凸显Agent时代订阅模式的困境。

Agent模式下Token消耗呈几何级增长：单轮对话原仅需1000-3000 Token，而Agent常以7×24小时运行，单用户日耗可达3000万-1亿Token。对比普通用户月耗百万级，重度“养虾”用户使算力成本持续攀升。

尽管GPT-3.5级别模型推理成本两年内降至1/280，但训练成本与全球算力紧缺推高运营压力。OpenAI预计2028年算力支出达1210亿美元，亏损或创纪录。Anthropic虽成本低于OpenAI约60%，仍难承受第三方工具消耗。

（图：OpenAI与Anthropic训练成本对比）

罗福莉强调，OpenClaw案例揭示问题核心：其上下文管理低效，单次查询多次调用长上下文API，耗超10万Token。同任务实际成本可超订阅价数十倍，导致轻度用户等同重度消耗。

低价开放Token实为双输陷阱：企业为控成本可能降级算力或采用低智模型，用户体验反受损。然当前行业仍以吞吐量为实力指标，中国模型单周调用量连续一月超海外，小米、阶跃星辰等位居前列。

科技大厂推波助澜，Meta等设立Token消耗KPI，加速消耗战。尽管Anthropic年收入3月内从90亿飙升至300亿美元，Token成本与供给失衡难解。大厂视“龙虾”为新生态入口，用户部署即沉淀数据并产生持续消耗；二线厂商亦借算力需求提振API销售。

逻辑上，“价格内卷”难持续，但增长叙事驱动厂商继续“装睡”。

高消耗未带来盈利改善。智谱2025年总收入7.24亿元（同比增131.9%），亏损47.18亿元（同比扩59.5%）。低价策略承压：其AutoClaw个人版39元/月仅含3500万Token，但2025年算力采购费从2022年1463万元激增至11.45亿元。

行业趋势显现：国内模型API均价3.88元/百万Tokens（海外约20.46元），价格优势支撑规模需求，但免费额度正逐步收紧。破局关键在于提升Token效率——罗福莉指出，出路在于“高效Agent框架+强大模型”，用智算替代盲目烧钱。

厂商需转向两方面突破：一是从“算力规模”竞争转向“工程效率”，深度融合模型与硬件应用；二是推进分层定价，如DeepSeek探索“快速模式/专家模式”，火山引擎拟按问题量收费，精准缓解算力压力。

Token狂欢终将回归理性。大模型本质是效率与价值的博弈，唯有精细算账、脚踏实地，方能兼顾当下生存与AGI未来。企业需在成本控制与技术创新间找到平衡点，真正实现可持续发展。

【声明】内容源于网络

伯虎财经

各类跨境出海行业相关资讯

内容 2683

粉丝 0

伯虎财经各类跨境出海行业相关资讯

总阅读19.5k

粉丝0

内容2.7k