当 AI 使用量被纳入绩效排名，工程师们开始表演式调用量- 大数跨境

首页

当 AI 使用量被纳入绩效排名，工程师们开始表演式调用量

AI驱动数字化转型

2026-04-07

导读：技术发展的终点，应是解放人，而非规训人。

1936年的电影《摩登时代》中，卓别林在飞速运转的传送带前拧螺丝，动作从熟练到机械，最终身体仿佛不再属于自己。这是一个关于工业时代人被工具异化的经典隐喻。

近一个世纪后，传送带换了形态，AI 成了新的齿轮。办公室里的工程师们发现自己正站在一条看不见的流水线前，不仅要使用工具，还要向系统证明自己用得足够多、足够好。

一场名为 AI 效率革命的浪潮席卷科技行业，但在现实执行层面正异化为一场表演运动。一些技术团队开始量化 AI 的使用，将 Token 消耗量、AI 生成代码比例纳入排名。工具不再仅仅是工具，它开始反过来定义使用它的人。

刷 Token 成了心照不宣的表演

春节过后，某头部互联网公司一位算法工程师感受到了内部急剧升温的 AI 氛围。内网铺天盖地都是关于如何使用 AI 的帖子，这些帖子本身甚至也是 AI 生成的。很快氛围从鼓励变成了压力，部门开始统计团队与个人的 AI 使用情况，核心指标有两个：Token 用量，以及提交代码中 AI 生成的比例。

这些数据来自公司统一封装的内部 AI 工具。所有员工必须通过公司提供的入口调用模型，确保每一次交互都被记录在案。虽然没有设定硬性的奖惩，但排名是真实存在的。这位工程师说，排名靠后领导会被问责，压力最终还是会传导到个人。

然而这种强制性的量化考核并未直接带来效率提升，反而扭曲了工作流程。算法团队习惯在配备高端显卡的远程服务器上开发，系统通常是 Linux。但公司最初的统计工具只适配了 Mac 和 Windows 本地环境。这是工程实践与管理工具脱节的典型案例。为了避免数据挂零，不让领导在周会上难堪，一种荒诞的工作模式诞生了。

这位工程师坦言，现在先在本地用 AI 写代码确保行为能被统计到，再把代码复制到服务器上运行，这其实很影响效率。当工具的使用被赋予了绩效意义，表演便不可避免。为了刷高数据，他开始刻意进行一些无效交互。一个两秒钟就能手动完成的代码复制粘贴，他会故意询问大模型然后等待近一分钟，只为增加一点 Token 消耗。为了证明 AI 能节省时间，他不得不浪费更多时间去表演 AI 如何节省时间。

这背后暴露了一个深刻的矛盾。在传统的软件工程价值体系中，衡量工程师能力的标准是代码质量、系统设计和解决复杂问题的能力。但在新的指标体系下，这些核心能力被一个简单粗暴的代理指标所替代：你消耗了多少 Token。

刷 Token 不难，难的是很多工作明明不需要 AI，现在却要为了用而用

另一位大厂的资深员工也发现了同样的趋势。Token 消耗量正成为判断员工是否积极拥抱 AI 的潜规则，甚至可能与未来的绩效和晋升挂钩。

她分享了用公司新推出的智能体做 PPT 和数据报告的经历。界面是好看了点，但为了生成想要的分析结果，需要跟 AI 反复交互，远不如自己做 Excel 快。更让她困扰的是生成结果的不确定性，同样的 prompt 每次跑出来的结果都可能不一样，修改也很麻烦，只能一次次重跑，跟抽盲盒似的。

在这场自上而下的 AI 强制运动中，一线员工们陷入了进退两难的困境。

看不见的传送带

为什么管理者会选择如此简单甚至有些粗暴的量化方式？这并非全然是管理层的短视，更像是一种集体性的焦虑。当一项颠覆性技术出现时，最焦虑的往往不是执行者而是决策者。他们迫切需要找到一种方法来衡量这项新技术带来的影响，以及组织在变革中的位置。

如果不能有效衡量，就无法进行有效管理。这几乎是现代企业管理的公理。

AI 带来的效率提升本质上是过程的优化，但其最终产出的结果，无论是代码质量还是产品功能，很难在短期内与 AI 使用率直接挂钩。一个经验丰富的工程师手动写的几十行关键代码，其价值可能远超 AI 生成的上千行模板代码。

在这种情况下管理者退而求其次，选择衡量那个最容易被观察和统计的变量：AI 工具的使用行为本身。Token 消耗量、API 调用次数、生成代码行数，这些数据清晰具体无可辩驳，自然成了构建新考核体系的基石。这种管理思维在技术圈被称为工具理性的极致体现，它专注于手段的优化而可能忽略最终目标。建立评估指标体系、确定权重，这些经典的量化管理方法被直接移植到了对 AI 使用的评估中。

于是，一条看不见的传送带被建立起来，由公司内部的监控系统、数据看板和排名报表构成。员工的每一次 AI 交互都像一个被计数的零件，汇入庞大的数据洪流，最终在管理者的屏幕上呈现为一条波动的曲线。这条曲线成了组织 AI 转型成功与否的晴雨表，也成了悬在每个团队头上的达摩克利斯之剑。

人才管道正在被重塑

这场量化风暴影响的不仅是现有员工的日常工作，它正在向上游蔓延，重塑整个人才的选、用、育、留管道。

变化的信号首先出现在招聘环节。过去算法与工程岗位的面试核心是数据结构和算法白板题，候选人需要大量刷题。但现在一些公司开始引入新的考察维度：利用 AI 解决问题的能力。

以蚂蚁集团为例，部分岗位的招聘已经引入了 AI Coding 环节。面试官不再仅仅考察候选人能否独立写出代码，而是观察他们如何与 AI 协作共同完成一项复杂的编程任务。一位蚂蚁的算法工程师认为这种考察很有意义，工作中已经找不到不用 AI 写代码的人了，相比会不会死记硬背地做题，能调用工具解决现实问题更符合实际需要。他甚至鼓励候选人在面试中使用任何工具，只要能解决问题。

这种转变是深刻的。对工程师的能力定义正从你会不会写代码悄然转变为你会不会和 AI 一起写代码。这背后是人才价值的迁移。当工具足够强大时，人的价值便从单纯的执行转向更高维度的调度与判断。这在逻辑上完全自洽，AI 可以快速生成代码片段，但它无法理解复杂的业务逻辑，也无法进行创造性的系统设计。一个优秀的工程师需要具备定义问题、拆解任务、评估 AI 方案优劣并最终整合出高质量解决方案的能力。

然而理想的逻辑在落地时总会遇到现实的挑战。AI 面试虽然能考察协作能力，但也面临着新的评估难题和潜在的偏见。AI 在简历筛选、初面环节的应用已经因为可能存在的算法偏见而备受争议。从全球范围看，希尔顿酒店利用 AI 将招聘周期缩短了 90%，联合利华缩短了 50%，这些数字背后是效率的极大提升，但也伴随着对人类 HR 角色被替代的担忧。

从招聘入口的变革到内部员工的量化考核，整个科技行业的人才评估体系都在经历一场由 AI 驱动的剧烈重构。

工具理性有极限

当所有人都被迫刷 Token 时，一个更深层的问题浮现：如果 AI 代码占比过高，是否恰恰证明了这个岗位可被替代？但如果占比过低，又会被认为是效率低下、拒绝拥抱变革。

这是一个无法完成的自证题，它将员工置于一种结构性的矛盾之中：为了证明自己不可替代，你必须深度依赖一个旨在替代你的工具。

这种困境在管理学上被称为强制技术采纳带来的心理压力和文化失调。当工具的使用不再是员工自发的选择而是自上而下的命令，它就可能从赋能工具异化为监控枷锁。长此以往可能削弱员工的批判性思维，甚至导致思维惰化。更危险的是，这种量化指标可能固化一种错误的价值导向，让组织陷入高分低能的陷阱。团队为了追求漂亮的 AI 使用数据，可能会选择那些更容易被 AI 解决的相对平庸的任务，而回避那些需要深度思考和人类创造力的真正难题。因为后者很难在 Token 消耗报表上得到体现。

或许当前这场略显笨拙的量化运动只是行业在面对颠覆性技术时一个必经的混乱过渡阶段。随着企业对 AI 的理解加深，管理体系也会随之进化，从关注行为量转向关注价值量。

真正的破局点在于找到那些无法被 AI 轻易量化却又至关重要的人类价值：

复杂系统设计能力，在模糊的需求中定义清晰的系统边界、模块交互和技术架构

跨领域沟通与协同，与产品、设计、业务团队有效沟通，将商业目标转化为技术实现

批判性思维与判断力，评估 AI 生成方案的潜在风险、技术债务和长期影响

工程品味与代码美学，写出简洁优雅易于维护的代码，这是 AI 目前难以企及的

真正的创新，提出全新的问题而非仅仅优化已知问题的解决方案

这些看似软性的东西才是人的核心竞争力，也是人作为主体而非零件的证明。

管理者面临的真正挑战并非设计出更精密的 AI 使用监控系统，而是创造一个能让上述价值得以涌现和被认可的组织环境。如果一个组织仅仅奖励那些消耗 Token 最多的人，那么它最终也只会得到一群精于刷 Token 的表演者。

卓别林的隐喻依然有效。无论是工业时代的物理传送带还是数字时代的 Token 流水线，当人被简化为单一维度的指标时异化便会发生。走出这场被 Token 绑架的困局需要管理者和工程师的共同智慧，前者需要超越对量化指标的迷信，后者则需要在适应工具的同时坚守并证明那些机器无法替代的专业价值。

技术发展的终点，应是解放人，而非规训人。

【声明】内容源于网络

AI驱动数字化转型

专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

内容 956

粉丝 0

AI驱动数字化转型专注AI，促进智造行业数据衍生，服务智能制造企业的数字化、智能化，聚焦大模型私域部署、大模型微调、数据清洗、AI模型训练、私域知识库及agent技术延展等。行业智能，落地为先。

总阅读3.0k

粉丝0

内容956