“低价卖Token并对第三方开放看似友好,实则是陷阱。”近日,小米集团MiMo负责人罗福莉在X平台发文警示,大模型公司不应盲目参与Token价格战。此举源于Anthropic突然切断第三方工具对Claude订阅的访问权限,成为行业罕见的“降温信号”。
在Token用量激增的热潮中,罗福莉的公开信与Anthropic的“封杀令”引发深思:大模型厂商究竟是成本精算失误,还是以短期亏损换取未来入场券?若属后者,市场或将持续“装睡”。
Anthropic撑不住了
Anthropic于4月4日宣布,Claude Pro和Max订阅将不再覆盖OpenClaw等第三方工具。用户仅获等额月费补贴,远不及此前200美元无限调用的优惠,引发社交媒体强烈反弹。
成本压力是关键动因。Anthropic指出第三方工具“造成系统过载”,需优先保障核心用户体验。据外媒分析,每月200美元的Claude Code订阅或消耗高达5000美元算力成本,凸显Agent时代订阅模式的困境。
Agent模式下Token消耗呈几何级增长:单轮对话原仅需1000-3000 Token,而Agent常以7×24小时运行,单用户日耗可达3000万-1亿Token。对比普通用户月耗百万级,重度“养虾”用户使算力成本持续攀升。
尽管GPT-3.5级别模型推理成本两年内降至1/280,但训练成本与全球算力紧缺推高运营压力。OpenAI预计2028年算力支出达1210亿美元,亏损或创纪录。Anthropic虽成本低于OpenAI约60%,仍难承受第三方工具消耗。
(图:OpenAI与Anthropic训练成本对比)
卷Token价格是陷阱
罗福莉强调,OpenClaw案例揭示问题核心:其上下文管理低效,单次查询多次调用长上下文API,耗超10万Token。同任务实际成本可超订阅价数十倍,导致轻度用户等同重度消耗。
低价开放Token实为双输陷阱:企业为控成本可能降级算力或采用低智模型,用户体验反受损。然当前行业仍以吞吐量为实力指标,中国模型单周调用量连续一月超海外,小米、阶跃星辰等位居前列。
科技大厂推波助澜,Meta等设立Token消耗KPI,加速消耗战。尽管Anthropic年收入3月内从90亿飙升至300亿美元,Token成本与供给失衡难解。大厂视“龙虾”为新生态入口,用户部署即沉淀数据并产生持续消耗;二线厂商亦借算力需求提振API销售。
逻辑上,“价格内卷”难持续,但增长叙事驱动厂商继续“装睡”。
效率比价格更重要
高消耗未带来盈利改善。智谱2025年总收入7.24亿元(同比增131.9%),亏损47.18亿元(同比扩59.5%)。低价策略承压:其AutoClaw个人版39元/月仅含3500万Token,但2025年算力采购费从2022年1463万元激增至11.45亿元。
行业趋势显现:国内模型API均价3.88元/百万Tokens(海外约20.46元),价格优势支撑规模需求,但免费额度正逐步收紧。破局关键在于提升Token效率——罗福莉指出,出路在于“高效Agent框架+强大模型”,用智算替代盲目烧钱。
厂商需转向两方面突破:一是从“算力规模”竞争转向“工程效率”,深度融合模型与硬件应用;二是推进分层定价,如DeepSeek探索“快速模式/专家模式”,火山引擎拟按问题量收费,精准缓解算力压力。
Token狂欢终将回归理性。大模型本质是效率与价值的博弈,唯有精细算账、脚踏实地,方能兼顾当下生存与AGI未来。企业需在成本控制与技术创新间找到平衡点,真正实现可持续发展。

