
在 AI 浪潮里,最激进的公司已经开始把员工用了多少 tokens 写进绩效参考。这场关于"数字化身"的辩论,正把硅谷一分为二。
一、Meta 的 leaderboard 泄露,引爆了一场风暴
事情的起因是 Meta 内部一个叫 "tokenmaxxing" 的排行榜被媒体捅了出来。这个 dashboard 追踪的是员工使用 AI 工具时消耗的 token 数量,并据此进行排名。消息一出,工程师们在社交媒体上炸开了锅。
有人觉得这是在鼓励无效刷量——就像用"谁花钱多"来评判购物能力一样荒谬;也有人认为,在 AI 转型的关键期,token 使用量恰恰是拥抱新技术意愿的晴雨表。
Meta 的反应很快:在舆论发酵几天后,公司关停了内部的 tokenmaxxing dashboard。但争议并没有因此平息,反而引来了更多大佬下场表态。
二、Reid Hoffman 的立场:追踪 token usage 是对的
LinkedIn 联合创始人、硅谷最具影响力的投资人之一 Reid Hoffman,在 Semafor 世界经济峰会上明确表达了对 tokenmaxxing 的支持。他没有用那些 Z 世代黑话,但核心观点很清楚:
"你应该让各个职能的人都去真正接触和实验 AI。有一个不错的 dashboard 值得关注——它当然不是生产力的完美指标,但……人们在实际工作中消耗了多少 token?"
Hoffman 进一步解释,有些人用得多可能是随机探索,有些则是高质量产出。所以关键在于:把 token 使用量和使用场景结合起来看。
"有些实验会失败,这没问题。但正是在这个循环里,你需要各种各样的人同时使用它。"
三、tokenmaxxing 到底是什么?
如果你还不熟悉这个术语,简单科普一下:
| 术语 | 含义 | 类比 |
|---|---|---|
| Token | AI 模型处理的最小数据单元,也是计费单位 | 类似"字/词"的计量单位 |
| Tokenmaxxing | 尽可能多地使用 AI tokens,以展示对技术的拥抱 | 类似 looksmaxxing(颜值管理)、sleepmaxxing(睡眠优化) |
| Leaderboard | 公司内部按 token 消耗量排名员工 | 一种数字化"考勤" |
对于 AI 服务提供商来说,token 就是钱。员工用得越多,公司在这块的支出就越高。但支持者认为,这笔"学费"是值得的——它买的是整个组织的 AI 熟练度。
四、反对者的声音:这是错误的激励
批评者主要有两个论点:
第一,token 量不等于产出质量。 有人可以用 10 万个 token 做出 brilliant 的方案,也可能用同样的 token 数写出一大段废话。把排行榜和任何形式的绩效挂钩,很容易催生"为了刷量而刷量"的行为。
第二,这会让内向或不擅长"秀存在感"的员工处于劣势。 不是所有高效使用 AI 的人都会产生大量 token 消耗。有些人擅长精准 prompt,一击即中;有些人习惯在本地模型上反复调试。这些"低调高效"的风格在 tokenmaxxing 排行榜上是看不到的。
五、Hoffman 给企业的三条建议
抛开 tokenmaxxing 的争议,Hoffman 对企业 AI 转型提出了更系统的建议,这些观点比单纯的"追不追踪 token"更有参考价值:
1. 把 AI 嵌入整个组织
不是让某个"AI 部门"去探索,而是让每个职能、每个层级的人都参与进来。AI 的价值只有在规模化使用时才会显现。
2. 每周做一次"AI 复盘"
Hoffman 建议公司建立定期的 check-in 机制,让员工分享:这周我尝试了哪些新的 AI 用法?哪些对个人效率提升最大?哪些值得团队复制?
3. 容忍失败,鼓励实验
"你会发现,有些事情的效果真的令人惊叹。"Hoffman 说。企业的文化氛围应该允许员工在 AI 应用上试错,而不是一失败就被问责。
六、tokenmaxxing 会成新常态吗?
Meta 关停了 leaderboard,但这不代表 tokenmaxxing 的概念会消失。恰恰相反,随着企业对 AI 投入的加大,如何量化员工的 AI 采用率将变成一个越来越现实的命题。
token 消耗量只是其中一个维度,而且显然是最粗糙的维度。未来可能会出现更精细的指标:比如"AI 辅助产出的代码提交占比"、"AI 生成内容被二次采用的比例"、"用 AI 解决问题的平均时长缩短率"等等。
但在这些更科学的指标出现之前,tokenmaxxing 或许就是很多企业能抓到的最现成的一根稻草。它的争议性在于:它测量的是投入,而不是回报。
七、写在最后
Reid Hoffman 的站台,让 tokenmaxxing 从一个硅谷内部的梗,变成了值得严肃讨论的管理命题。无论你是支持者还是反对者,有一个共识正在形成:在 AI 时代,"用不用"和"用得多不多"确实会越来越影响一个人的职场竞争力。只是,这个竞争力的衡量标准,显然还需要更多迭代。
对普通职场人来说,与其纠结公司有没有 token 排行榜,不如先问问自己:这周,我真的用 AI 解决了什么问题吗?

