谷歌收紧Gemini API免费额度,开发者质疑缺乏提前告知
近日,Google大幅下调Gemini API免费层调用限额:Gemini 1.5 Flash免费配额从每日1500次骤降至20次,Pro系列免费选项已全面取消。多名开发者反馈其自动化脚本因请求失败而中断,有用户直言“基本都用不了了”。
另有开发者发现,Google已从官方“批量API速率限制”文档中移除Gemini免费API条目,认为此举标志免费策略正式终结。
今年1月,Google曾推出极具吸引力的Gemini 1.5 Flash免费套餐:每日15亿Token、每分钟15次请求、每小时100万Token缓存,且支持免费微调与上下文缓存。此次调整未作任何事前通知,引发开发者普遍不满。
一名开发者批评称:“即使系统仅为实验性质,所有功能在毫无预警下突然停摆,令人感到被辜负。一家值得信赖的公司,理应在发布Gemini 3时同步说明免费额度终止计划。”
另有观点指出:“AI小善人阶段已结束——公域数据红利吸尽,进入付费转化期。我们以真实数据训练模型,本质已是隐形付费者。”
Gemini 3强势反超,与OpenAI GPT-5.2短兵相接
据《金融时报》数据,截至2025年底,Gemini在桌面端与移动端单次平均停留时长达7.2分钟,首次超越ChatGPT(约6分钟)及Claude(约6分钟)。
OpenAI计划于12月9日提前发布GPT-5.2,作为对Gemini 3的首次战略回应。网传基准测试显示其性能领先,若获验证,竞争优势或将重新倾斜。
与此同时,Gemini 3 Flash已上线LM Arena,被广泛视为谷歌对标GPT-5.2的核心产品。社区热议称:“Nano Banana Pro与Gemini 3 Flash是谷歌为狙击GPT-5.2部署的后手。”
DeepMind联合创始人兼CEO Demis Hassabis在Axios活动上强调:“不论AI行业是否存在泡沫,DeepMind和Google都必须处于最强位置。”
谷歌对Gemini 3能力高度认可
Hassabis评价Gemini 3具备“阶跃式智能提升”:回答简洁有力,能在观点失当时温和反驳,避免无条件附和。这一设计明显规避了此前ChatGPT因过度谄媚而回滚GPT-4o的缺陷。
他特别推崇Gemini 3在游戏制作与前端开发领域的表现——可数小时内生成商业级游戏,也能完成兼具审美、创意与技术深度的网站构建。他还指出:“用户总能比我们更快发掘模型潜力,他们对现有系统能力的探索,甚至远超内部团队。”
算力约束与Scaling Law的持续实践
部分开发者推测API限流或与算力紧张有关,如AI Studio中Nano Banana Pro响应明显变慢。Hassabis承认:“我们在Google和DeepMind拥有海量资源,但算力永远不够。”
他坚定主张Scaling Law路径:“必须将当前系统规模推至极限,这至少是实现AGI的关键组成部分。也可能仅靠规模化即达目标,但我更倾向未来还需类似Transformer或AlphaZero的重大突破。”
他对AGI设定严格标准:需具备人类全部认知能力,包括创造、发明、长期规划与复杂推理等。当前大模型仍呈“锯齿状智能”——某些维度达博士级,其他方面却显著薄弱。
回顾2017–2018年,谷歌并行推进Chinchilla语言模型、Sparrow对话系统、AlphaZero强化学习及神经科学启发架构,最终依据实证证据聚焦Scaling方向。“科学方法要求我们跟随证据,而非教条坚持假设。”
科学方法:谷歌AI研发的核心范式
Hassabis将科学方法视为“人类历史上最重要的思想之一”,其核心——实验精神、假设迭代、证据驱动——贯穿研究、工程与商业化全链条。他强调:“AI前沿竞争需要顶尖研究+顶尖工程+顶尖基础设施三者融合,而谷歌正是少数兼具此三者的世界级机构。”
在人才战略上,谷歌聚焦“使命驱动型”科学家与工程师:“DeepMind提供最具影响力的工作场景,吸引最优秀人才形成正向循环。”
谷歌AI三大主攻方向
模态融合:视频理解能力成关键突破口
Gemini自诞生即为原生多模态模型,现正强化跨模态协同。Nano Banana Pro图像模型展现出卓越视觉理解能力,可生成高精度信息图;视频理解尤为突出——Gemini对YouTube视频的概念性解析能力屡被验证,例如对《搏击俱乐部》中摘戒指动作给出深层哲学解读。
Gemini Live功能支持手机实时物体识别与任务交互,未来将适配AR眼镜等解放双手设备,但该能力目前仍被市场低估。
世界模型:Genie 3实现分钟级连贯交互模拟
Hassabis亲自推动世界模型研发。Genie 3为交互式视频模型,用户可生成视频后“进入其中”,并维持约一分钟的逻辑连贯性。
智能体系统:向“通用助手”演进
谷歌愿景是打造“通用助手”(universal assistant):覆盖电脑、手机、眼镜等全设备,深度融入日常,承担推荐、规划、创作等多元任务。当前Agent可靠性不足,尚无法全权托付复杂任务;但Hassabis预计一年内将出现接近可靠交付水平的版本。
他提醒:Agent自主性增强将带来目标偏移风险,确保其始终在安全护栏内持续学习,是当前重点研究课题。商业现实则形成天然约束——企业客户必然要求可靠性、数据合规与行为保障,从而倒逼供应商提升责任水平。
全球AI格局:中美差距缩至“几个月”
Hassabis指出,美国与西方在AI算法创新上仍保持领先,但中国追赶速度极快:“最新DeepSeek等模型已非常强劲,领先优势可能只剩‘几个月’,而非‘几年’。”
他补充:“中国团队擅长快速复现与优化前沿方法,但在提出颠覆性新算法(如Transformer级突破)方面,尚未见同等量级成果。”

