来源丨深潮 TechFlow
作者丨黑色龙虾
图源丨Midjourney
1858 年夏天,一根铜芯电缆横穿大西洋海底,连接伦敦与纽约。
其意义不在传输速度,而在权力结构——谁铺设海底电缆,谁便掌控信息流动的命脉。大英帝国凭借全球电报网,将殖民地情报、大宗商品价格、战况消息尽收于掌中。帝国力量不仅来自舰队,更来自那根无声的电缆。
一百六十多年后,这一逻辑正以新形态重演。
2026 年,中国大模型加速渗透全球开发者市场。OpenRouter 最新数据显示:平台前十模型总 Token 消耗约 8.7 万亿,其中中国模型占比达 61%(5.3 万亿);MiniMax M2.5 以 2.45 万亿 Token 空降榜首,Kimi K2.5、智谱 GLM-5 分列二、三位——前三名全部来自中国。旧金山、柏林、新加坡等地开发者的 API 请求,正经由太平洋海底光缆抵达中国数据中心完成推理,算力在此消耗,电力在此流转,结果回传全球。
电力未出中国电网,但其价值已借 Token 实现跨境交付。
AI 模型大迁徙
2026 年 2 月 24 日,OpenRouter 周度数据公布:平台前十模型总 Token 消耗约 8.7 万亿,中国模型独占 5.3 万亿(61%)。MiniMax M2.5 以 2.45 万亿 Token 居首,Kimi K2.5、智谱 GLM-5 紧随其后。
这一趋势并非偶然,导火索来自年初横空出世的开源工具 OpenClaw——它让 AI 真正开始“干活”:可控制电脑、执行命令、并行处理复杂工作流,GitHub 星标数周内突破 21 万。
金融从业者 John 接入 Anthropic API 后,AI 自动监控股市并生成交易信号。几小时后,他发现账户余额骤减数十美元。
原因在于:OpenClaw 触发多线程、高频次、强上下文调用,Token 消耗呈指数级增长,账单迅速飙升。
为控制成本,开发者普遍采用 OAuth 令牌直连订阅账户,将月费制“无限额度”转化为 AI Agent 的低成本燃料。官方随即反制:Anthropic 于 2 月 19 日更新协议,禁止将 Claude 订阅凭证用于 OpenClaw 等第三方工具;Google 大面积封禁通过 OpenClaw 接入 Gemini Ultra 的账号。
“天下苦秦久矣”,John 转向国产大模型。在 OpenRouter 上,MiniMax M2.5 在软件工程任务得分达 80.2%,接近 Claude Opus 4.6(80.8%),但价格仅为后者约 1/17——输入端每百万 Token 仅 0.3 美元(Claude 为 5 美元)。工作流无缝迁移,账单下降一个数量级。这场全球范围内的模型切换正在加速发生。
OpenRouter COO Chris Clark 指出:“中国开源模型之所以占据大量市场份额,是因为它们在美国开发者运行的代理工作流中占比异常之高。”
电力出海
理解 Token 出海本质,需拆解 Token 的物理成本结构。
一个 Token 约等于 0.75 个英文单词,单次对话消耗仅数千 Token;但当规模达万亿级,背后是沉甸甸的物理现实:核心成本只有两项——算力与电力。
算力对应 GPU 折旧摊销(如一块 H100 约 3 万美元);电力则是数据中心持续运转的燃料,单卡满载耗电约 700 瓦,叠加冷却系统,大型 AI 数据中心年电费常超亿美元。
地理路径清晰可见:美国开发者在旧金山发起 API 请求→经太平洋海底光缆抵达中国数据中心→GPU 集群响应→电力由中国电网供给→推理结果回传。全程仅需 1–2 秒。
电力从未离开中国电网,但其价值已借 Token 完成跨境交付。
Token 具有天然跨境优势:无形体、免通关、不计入现行贸易统计。中国出口了大量算力与电力服务,但在官方商品贸易数据中近乎“隐形”。
Token 是电力的衍生品,Token 出海即电力出海。
这一模式依托中国三大优势:
- 电价优势:综合电价较美国低约 40%,构成底层成本护城河;
- 算法效率:DeepSeek V3 的 MoE 架构实现推理时仅激活部分参数,测试显示其成本比 GPT-4o 低约 36 倍;MiniMax M2.5(229B 总参)仅激活 10B;
- 产业内卷:阿里、字节、百度、腾讯、月之暗面、智谱、MiniMax 等十余家厂商同台竞争,价格早已跌破合理利润区间,“赔本赚吆喝”成为常态。
这与当年中国制造出海路径高度一致:依托供应链与内卷能力,大幅压低 Token 单价。
从比特币到 Token
Token 出海并非全新现象,此前已有先例。
2015 年前后,四川、云南、新疆的电站迎来一批特殊访客:他们租用废弃厂房,安装密密麻麻的矿机,24 小时通电运行,只为反复求解一道数学题——偶尔从中产出一枚比特币。
这是电力出海的第一代形态:以廉价水电、风电驱动哈希运算,产出全球流通的数字资产,并在交易所兑换为美元。电力未越边境,价值却借比特币流向全球市场。
彼时中国算力曾占全球比特币挖矿总量 70%以上,水电与煤电借此间接参与全球资本再分配。
2021 年监管政策落地,矿工外迁,算力转向哈萨克斯坦、美国德克萨斯与加拿大。但底层逻辑并未消失,只待新载体——ChatGPT 问世、大模型爆发,昔日矿场升级为 AI 数据中心,矿机变为 GPU,比特币变为 Token,不变的仍是电力。
比特币出海与 Token 出海逻辑同构,但后者更具商业纵深:
- 比特币挖矿是纯数学计算,产出金融资产,价值源于稀缺性与共识,算力本身无直接生产性;
- 大模型推理则输出真实认知服务(代码、分析、翻译、创意),Token 价值直接锚定用户效用。一旦嵌入开发者工作流,迁移成本随时间积累呈指数上升。
关键差异还在于:比特币挖矿是被中国政策主动驱离;而 Token 出海,是全球开发者用脚投票的选择。
Token 战争
1858 年的海底电缆,象征大英帝国对信息高速公路的主权——基础设施即规则制定权。
Token 出海同样是一场无声博弈,面临双重硬约束:
- 数据主权壁垒:API 请求经由中国数据中心处理,数据物理路径穿越中国境内。对个人开发者及轻量应用影响有限,但涉及企业敏感数据、金融系统、政府合规场景时,构成实质性障碍。因此中国模型渗透率集中于开发工具与个人应用层,在企业核心系统中几乎为零。
- 芯片禁令制约:英伟达高端 GPU 出口受限,虽可通过 MoE 架构与算法优化部分弥补,但算力天花板依然存在。
当前阻力仅是序章,更大战场正在成型。
Token 与大模型已成为中美战略博弈新维度,其重要性不亚于 20 世纪的半导体、互联网,甚至更贴近一个古老比喻:太空争霸。
1957 年苏联发射斯普特尼克一号,美国举国震动,启动阿波罗计划投入数千亿美元资源,誓要在太空竞赛中胜出。
AI 竞争逻辑与此相似,但烈度更高:太空属物理空间,普通人感知有限;AI 则渗入经济毛细血管——每一行代码、每一份合同、每一个政府决策系统背后,都可能运行着某国大模型。谁的模型成为全球开发者的默认基础设施,谁就掌握对数字经济的结构性影响力。
这正是华盛顿真正警惕之处。
当开发者代码库、Agent 工作流、产品逻辑深度绑定某个中国模型 API,迁移成本将随时间指数级攀升。届时即便出台行政限制,开发者也会用脚抵制——正如今日无人能脱离 GitHub。
今天的 Token 出海,只是漫长博弈的开篇。中国大模型并未宣称颠覆,只是以更低价格,将服务送达全球每一个拥有 API Key 的开发者手中。
这一次铺设“数字电缆”的,是杭州、北京、上海的工程师团队,以及南方某省昼夜运转的 GPU 集群。
这场争霸没有倒计时,每天 24 小时进行,单位是 Token,战场是每个开发者的终端。



