别再担心AI应用成本:Token费用已不再是障碍
为什么开发AI应用时不应将节省Token作为首要关注点?
ChatGPT自2022年底推出后,我在2023年初开始测试OpenAI的API。当时GPT-3.5和GPT-4的成本确实较高,尤其是在尝试构建客服机器人时,高质量模型的调用成本令人望而却步。
然而到了2023年底,情况发生了明显变化。GPT-3.5的价格逐渐变得可控,直到2024年5月国内大模型厂商掀起了价格战,免费API、低价服务纷纷上线。同时,Meta推出的LLaMA-3系列性能强劲,接近甚至超越GPT-3.5,这使我们从“不敢多用”转变为“全力推进”。
目前我们已广泛应用多个大模型功能,包括:
- Emoji推荐师:基于用户需求推荐合适的Emoji;
- Emoji图像融合:生成创意Emoji图片;
- Emoji对话机器人:用Emoji回复用户聊天;
- Emoji角色聊天:赋予Emoji娱乐或工具类角色来互动。
这些新功能不仅提升了用户体验,也有效控制了成本。我们在实际中发现,许多开源及商用大模型API都非常廉价,甚至完全免费。例如火山引擎、Hugging Face等平台提供的API都拥有可观的性价比。
随后我们尝试转向付费模式,寻找更快速稳定的提供商。最终选择的服务每百万token输入仅需数美分,而且随着竞争加剧,价格仍在下降。我们每天使用数千万token,花费不到几美元,这让我们得以专注提升产品本身。
有开发者曾问我如何控制token成本,我的回答是:“不要控制token,希望用户用得越多越好。”目前每日消耗约五千万token,花费极低。未来成本还会进一步降低,因此限制token消耗并无必要。
如今大模型技术已经进入低门槛时代。我们应当尽早布局AI应用,在不断摸索中积累经验,而不是等待更低的价格或者更高的质量。
真正的挑战不在于模型质量与成本,而是理解并满足用户需求。无论是ToB还是ToC市场,都需要深度打磨产品体验。
当用户真正获得价值,收入自然水到渠成。因此,把注意力集中在用户体验与功能创新上,才是打造成功AI产品的关键。

