洞见畏来

2025-08-15

导读：一直以来，“成本更低”都是开源AI模型吸引企业的重要理由。但一项新研究却揭示了一个反常识的真相：在执行相同任务时，开源AI模型消耗的计算资源远高于闭源模型，其“低价优势”可能只是假象。

一直以来，“成本更低”都是开源AI模型吸引企业的重要理由。但一项新研究却揭示了一个反常识的真相：在执行相同任务时，开源AI模型消耗的计算资源远高于闭源模型，其“低价优势”可能只是假象。

一、核心发现：开源模型的“token黑洞”

AI计算的核心单位是“token”（可理解为AI处理信息的“最小颗粒”），token消耗量直接决定计算成本。AI公司Nous Research对19个AI模型（覆盖基础知识问答、数学问题、逻辑谜题三大任务）的研究显示：

普遍差距：开源模型的token消耗量是OpenAI、Anthropic等闭源模型的1.5-4倍；
极端情况：面对“澳大利亚首都是哪里”这类简单知识题，部分开源模型的token用量甚至是闭源模型的10-12倍——明明一句话能答完，却要消耗数百个token“反复思考”；
成本反转：尽管开源模型单token价格更低，但“多耗token”的特性会直接抵消这一优势，最终导致单条查询成本更高。

二、关键原因：“推理效率”的巨大鸿沟

研究首次聚焦“token效率”（模型解决问题时，token消耗量与任务复杂度的匹配度），发现开源模型的低效主要源于两点：

推理过程冗余：尤其是“大型推理模型（LRMs）”，为了实现“逐步思考”，会用“思维链（Chain of Thought）”处理问题。但这种设计在简单任务上会过度消耗资源——比如回答基础常识题，也需要生成冗长的推理步骤；
优化方向差异：闭源模型厂商一直在迭代优化“减少token消耗”，以此降低用户的推理成本；而开源模型的新版本反而在增加token用量，优先追求“推理性能提升”，却忽视了成本控制。