上个月,Barclays发布的一份报告显示,Google在2025年第一季度的AI推理Token使用量高达634万亿,是同期微软(约100万亿)的6倍以上。尽管Gemini的日活跃用户数仅为ChatGPT的一半左右,但Google整体Token消耗量仍远超竞争对手。
数据显示,2025年3月Gemini的DAU约为4000万,不足ChatGPT(约8000万)的一半。MAU方面,ChatGPT达8亿,Gemini为4亿。然而,两者在单用户Token消耗上基本持平,月均每位MAU使用约5.6万个Token,表明用户使用强度相近。
Token消耗主力并非Gemini聊天产品
实际上,Google的高Token使用量主要来源于其核心搜索业务中集成的AI功能,如AI Overviews、Lens、Circle to Search以及Workspace套件对Gemini模型的深度调用。2025年3月,Gemini聊天产品的Token消耗约为23万亿,仅占Google整体Token使用的5%左右。真正的增长驱动力来自系统级AI功能的大规模部署。
AI推理成本可控,不影响利润率
2025年Q1,Google处理AI推理的成本约为7.49亿美元,占当季运营支出(不含流量获取成本)的1.63%。若按年化计算,该支出约占Google搜索收入的1.4%,远低于传统搜索约18%的运营成本占比。分析认为,当前AI带来的额外成本仍在可承受范围内,对整体利润率影响有限。
芯片需求激增,支撑AI基础设施扩张
为满足庞大的Token处理需求,Barclays估算Google在2025年Q1需配备约27万颗TPU v6芯片,季度新增芯片支出达6亿美元,预计Q2将升至16亿美元。这表明AI推理已成为Google未来技术架构和硬件投资的核心驱动力之一。

