摘要:
透过最大化token消耗的喧嚣,我们需要回到真正创造价值的智能体。同时,智能体作为数据产品2.0,和确定性的数据产品1.0边际成本趋零不同,其依托大模型的智能化、开放式演进,自然也会消耗token,因而其具有边际成本增加且不确定的特征,其作为AI“员工”并非免费。这要求企业的智能体应用需要首先优化自身管理体系,避免token空耗,以真正发挥智能化的效益。
01
自人工智能大模型火爆以来,我们以加速度面临着层出不穷的概念冲击、技术撞击、模式暴击……
OPC(一人AI实体)重燃大众创业激情,AI原生公司风起云涌,更不用说传统企业都面临AI化压力。
OpenClaw热度还没有过去,Hermes的概念就开始刷屏。
提示词工程、上下文工程还没有过去,Harness(驾驭)工程、Loop(循环)工程又扑面而来。
更不用说多模态、智能体、世界模型,更不用说VLA、VLM、具身智能、人形机器人。
自然,哪里都少不了GPU、TPU、CPU……
当然这些都离不开大模型,以暴力计算(尺度定律)为特征的大模型,这些计算过程是真实的token(词元)在流淌,在汪洋……
于是,就出现了token薪酬、token福利,卷token利用,以此筛选员工,激发内部创业。
Tokenmaxxing(最大化token使用)甚至被推崇成创业方法论。YC(Y Combinator,美国创业孵化器)合伙人Diana Hu直言:“最大化token使用,而不是最大化员工人数,将成为关键转变。最优秀的公司,会是那些tokenmaxxing的公司。”[1]
随之而来的是FOMO(错失恐惧)情绪。人家都卷token,如果我不卷,是不是就被时代抛弃了?
02
但是,这种错失恐惧很快就显现为了成本担忧,甚至成了失败现场,烧token已经比员工贵了,而成效还难以评估,甚至有企业一个月烧掉5亿美元的案例。[2-4]
终于有高管站出来,用自己的实际经验直接质疑tokenmaxxing成本问题了。[1]
Tokenmaxxing的本质是把企业内部AI使用从“按需调用”变成“鼓励消耗”。只要企业把 token 使用量当成先进性指标,模型厂商就获得了一个近乎完美的增长飞轮。
Tokenmaxxing最直接的受益方,是OpenAI、Anthropic、Google、xAI等基础模型厂商。第二类赢家,是Cursor、Claude Code、Windsurf、Replit、Lovable等AI编程工具和Agent平台。而tokenmaxxing底层烧的是算力,最大的赢家还是英伟达、云厂商、GPU云服务商以及AI基础设施公司。
而这场浪潮中,最大的输家还是那些无法把token消耗转化为资产、但还盲目追风的企业。
Tokenmaxxing的本质,一定程度上,也是企业在AI转型焦虑下,把“消耗”误当成了“生产力”。
它把token使用量包装成AI原生程度,把AI原生程度包装成组织先进性。在更多token是否带来了更快交付、更少bug、更低事故率、更高收入和更可复用的能力等没有数据验证下,就无脑鼓励无尽烧token,更像是在缴纳一笔昂贵的“转型焦虑税”。
重要的是,它戳破了一层窗户纸:AI当然有用,可一旦用得没章法,成本也可以是惊人的。会用AI赚钱的公司没几家,用AI烧钱的倒是一抓一大把。
03
可见,将token消耗转化为资产才是关键。这个资产必须是服务于业务场景解决具体业务问题的数据产品、智能产品,即智能体,才能通过解决具体问题体现应用价值,体现过程中所消耗的token产生的价值。这样的token消耗才是值得的。
真正的资产不是token,而是智能体本身。token是智能体运行的燃料,但企业的竞争力取决于发动机的效率,而非油箱的容量。从token中心到智能体中心的度量范式转换,将是未来三到五年AI产业评价体系重构的主线之一。[5]
笔者曾经指出token作为数智时代度量的意义与限度:token流量是一个蕴含了智能化成果的综合流量。如果在应用中涉及到调用内部记忆、外部数据、各种工具包括智能体,它就不仅体现了算力价值、模型价值,还体现了来源数据价值、智能体价值,以及蕴含其中的部分算法价值。这些主要体现在大模型以及智能体在面向应用(任务)时的智能规划、排程、调用等迭代循环的token消耗中。尽管如此,token体现的终归还是以数据语义单元的流量为计量依据的流量价值。
对消耗token的用户而言,重要的是面向应用,得有更高价值的收益……将数据产品/智能体开发作为核心抓手,找到真正的应用价值出口,才能形成整个数智经济的价值闭环。[6]
Token消耗不是越多越好,而正是需要压缩的东西。我们需要的是面向应用的经济,即产生最终价值的经济。我们需要的是绿色经济,即节约token消耗的经济。业者需要的是单位词元消耗、单位能耗、单位流量产生出最大化的产出(应用价值),即效益最大化。[7]
Token是底层流量和投入的度量,DAA(日活智能体数)是应用规模和产出的度量,笔者建议,以度量投入产出比的DAA/Token(消耗每百万Token所激活的智能体数量)作为衡量智能经济效率与健康度的关键指标。因为智能经济的价值闭环仍需回归到“搭平台、谋场景、做产品”的数据产品化路径上,通过面向应用场景的数据产品和智能体服务,实现价值的最终确认与变现。[8]
04
让我们聚焦到智能体吧。
智能体是升级版的数据产品,是人工智能大模型加持的数据产品。
为此,我们需要先说清楚什么是数据产品。这不能泛泛而谈,而必须有清晰的定义。笔者之前已经在《数据产品论纲》系列文章中对此有详细论述。质而言之,数据产品是面向应用场景解决具体问题并且有数据嵌入才能提供服务的产品形态。关键点一是直接面向应用场景解决具体问题,二是有数据嵌入才提供服务。
因此,数据产品不是现成物,而是表现为信息系统的一套计算模型框架,需要在数据(来源数据、意图数据、提示词等)嵌入的同时才实时计算出结果并提供针对性的服务。因此,数据集不是数据产品;数据接口不是数据产品;非实时的数据分析报告不是数据产品;用于大模型训练、推理的高质量数据集也不是数据产品。而嵌入训练数据、用户提示词的AI大模型是数据产品(如ChatBot),智能体是数据产品,具身智能是数据产品。
广义的数据产品,包括以确定性为特征的数据产品1.0(表现为计算框架外置、固定的封闭式信息系统,依场景构建),以智能化(并隐含着概率性)为特征的数据产品2.0(大模型加持的智能体,计算框架可以开放、内生、依场景构建),以及在此基础上自我演进的数据产品2.x(依托智能体互联网生态开放式演进的智能体)。[9]
现在我们清楚了智能体和数据产品的关系。智能体是大模型加持,计算框架可以开放、内生、依场景构建的数据产品。不仅如此,智能体还可以开放式在智能体互联网(即智能体互操作)生态之上自我演进,成为更高阶的数据产品(智能体)。
这样的高阶数据产品是面向应用场景,以任务(即解决具体问题)为导向的,其依托大模型进行智能规划、排程、调用记忆、工具,并可能不断迭代循环,直到完成任务,输出服务。这中间少不了token消耗。
05
于是我们看到了确定性的普通数据产品1.0和智能化的数据产品2.0(以及数据产品2.x)之间在利用AI大模型消耗token上的区别。
数据产品1.0是确定性的,外置计算框架,封闭、固定的信息系统,不需要消耗token,系统部署后,其用户规模增加并不带来(用户自身技术资源之外)更多的成本增加,也就是说其边际成本近乎于零。
而数据产品2.0(以及数据产品2.x)则不然,其依托于AI大模型的智能化,也自然带有生成式大模型与生俱来的概率性(幻觉),为减少幻觉,需要借助于外部知识、历史记忆等,因而不可能是封闭系统,必须具有开放特征,并且可以借助于大模型的规划、排程而“自主”内生规则,并依场景动态调整,以至于在智能体互联网生态中调用工具、协作、迭代,因此其需要不断调动内外部资源与大模型互动,最终才能输出服务结果,解决问题,完成任务。因此,这样的智能体不仅会消耗token,而且其消耗token的规模还不可能准确预测,具有黑箱性质。结果是其边际成本不仅不会趋零,还可能较大且不可控。
06
文献[10]指出:智能体实际上是SaaS的AI化。
如果说SaaS表现为数据产品1.0——更确切地说是数据产品1.0表现为SaaS,后者是一个更宽泛的软件概念,前者则还要依场景并嵌入数据——AI SaaS表现为智能体,数据产品2.0。
文献[10]指出了两者的核心区别:
传统SaaS最大的特点是“预编译”,本质其实就是一套固定下来的最佳实践流程,用软件的形式表达。这里的关键词是“固定”。
与传统SaaS不同,AI SaaS本质上是让软件中原本固定的流程灵活化,通过自然语言为核心的交互,处理场景中的交互数据,由智能体来参与并持续优化业务。AI SaaS的核心能力取决于对场景(use case)的使用程度和理解场景的上下文工程(context),让智能体学会如何最有效地利用token来创造商业价值。
AI SaaS改变了SaaS的价值,也需要新的商业模式。根本上,这种新的SaaS运行方式,会带来新的成本结构:软件第一次有了真正意义上的边际成本。
最早PC时代的软件,一次性部署,边际成本几乎只剩下基础运维费用;到了云时代,边际成本是每个月的订阅费,更像是把之前的一次性成本摊薄到每个月,成本上升的体感并不强。所以传统的软件是典型的信息产品,边际成本接近于零。这也意味着服务商很难加价。
现在,AI SaaS的边际成本会高得多。为什么?首先,新的输入输出和上下文,本身就会不断消耗token。更重要的是,这个智能体就像一个会不断进化的员工,它越来越懂企业、越来越高效的时候,企业需要为此支付更高的费用(即单位token的价值也会上升)。升级为智能体之后,软件不再是一次编程之后边际成本为零的产品,反而会随着价值的上升,成本也会上升。
那么,SaaS的商业模式如何转变?不是按订阅席位数量付费,也不是按token使用量付费,而是直接为智能体付“人头费”。用微软CEO纳德拉的话说:“智能体就是新的用户席位”。智能体是一个有工作价值的工作者。
07
数据产品已经由针对固定场景的固定功能进化到了随场景而动开放式的数据产品2.0(智能体),后者已经成为了企业的“员工”,因此智能体已经不是边际成本递减,甚至到零,而很可能递增。
我们现在可以回答本文题目的问题了。智能体是免费员工吗?不是的。需要为智能体这样的AI“员工”付费。
这就是AI“员工”的成本,其“工资”付给了所谓的token工厂,即模型商/云服务商。
08
为这样的AI“员工”支付“工资”是否合算呢?
这取决于你的成本控制策略,更取决于你的管理体系合理与否。
微软最新发布的《2026工作趋势指数(Work Trend Index 2026)》年度报告,直接撕开了高管们的盲区:很多企业以为买了最先进的AI,就等于买到了未来的竞争力;但残酷的现实是,技术进步的红利,正被企业内部老旧的管理体制大量流失![11]
如果企业自身的流程本就是低效、冗余、错误的,当AI智能体以15倍的速度去执行这些错误流程时,结果只有一个:你只是在用极高的科技,把公司的“系统性错误”进行疯狂的规模化放大。
数据模型显示:决定 AI 能否为企业带来真正价值的因素中,“组织环境”占据了 67% 的决定性权重,而“员工个人心态与行为”仅占 32%。
还是要先把自己的“管理体系”“组织环境”做好,才能真正用好AI“员工”,否则就是无脑烧钱。不单普通企业如此,哪怕那些明星企业,也不是就天生具备了用好AI“员工”的条件。[12]
这场由AI智能体掀起的效率革命,本质上不是一场技术战,而是一场管理战和制度战。
09
我们需要回到“搭平台、谋场景、做产品”的数智化核心逻辑。[13]
我们需要回到知识工程。[8]
我们需要回到投入产出比的价值化考量。[7]
这样我们才能让智能体真正落地。
参考文献:
[1]米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?.
[3]微软按下vibe coding暂停键:烧token已经比员工贵了.
[4]员工狂用Claude月烧 33 亿,全网都在寻找这家公司.
[7]董学耕. 不可承受的词元之重——有Token经济这回事吗?.
[8]董学耕. 智能时代的价值度量:从Token到DAA,再到投入产出比的演进.
[9]董学耕. 知识工程:场景概念的核心——兼论人工智能发展的四要素飞轮.
[11]砸了高价买AI却没有回报?微软2026趋势报告:问题出在你的“管理体制”!.
[12]全球AI大撤退:7家巨头集体踩刹车,盲目烧钱时代彻底结束.
[13]董学耕. 详解“搭平台、谋场景、做产品”的数据价值化完整逻辑.
作者简介:董学耕, 原海南省大数据管理局局长
研究方向:数字政府、数据要素

