新智元报道
【新智元导读】Gemini 3.5 Pro 即将面世,却面临定价更高、内容过滤更严格的双重压力。更现实的挑战在于:OpenAI 和 Anthropic 不仅模型更优,发布迭代速度还在加速。留给 Gemini 的时间,真的不多了。
谷歌的 AI 急行军仍在继续,但此次传来的消息少了几分惊喜,多了些许争议。
好消息是,Gemini 3.5 Pro 发布在即;坏消息是,这次更新恐难敌 Claude 和 ChatGPT。


谷歌 CEO 承认:Agentic Coding 确实落后
在 5 月的谷歌 I/O 开发者大会上,尽管现场座无虚席,观众却难掩失望。谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)坦言:「我知道大家迫不及待想体验 Gemini 3.5 Pro,请再给我们一点时间,下个月它将正式交付。」

毫无疑问,谷歌正主导 AI 领域的数学赛道。Gemini 3.1 Deep Think 的最新推理更新,已巩固其在高级数学证明领域的领先地位,并在世界知识测试中独占鳌头。

然而,Gemini 在编程领域的表现却令人堪忧。两个月前,Gemini Pro 3.1 被曝存在「摸鱼」现象,面对复杂任务不愿深入思考,回应往往毫无用处。

这是 Gemini 的顽疾之一:在 AI 编辑器中过于激进地自动重写代码,导致用户审阅时因提问而被覆盖,若拒绝修改则会丢失已生成的全部代码。相比之下,Claude Opus 4.6 表现完美,只需一次项目上下文输入即可只读分析,全程尊重待处理状态,不随意覆盖差异代码。


皮查伊坦承,在 AI 编程尤其是处理复杂软件任务方面,谷歌已落后于竞争对手。但他对此并不十分担忧,声称内部使用量每周翻倍,并高调宣称 75% 的新代码由 AI 生成。


然而,谷歌内部论坛却充斥着员工发布的反 AI 表情包,嘲讽公司自研工具 Jetski 不可靠,甚至制造「垃圾代码」(slop)。
上下滑动查看
这些广泛传播的反 AI 表情包折射出一个事实:谷歌员工已对现有的 AI 编程工具忍无可忍。

Gemini 3.5 Pro:令人失望的迭代
据独家爆料,谷歌正对即将发布的 Gemini 3.5 Pro 进行高强度迭代,内部预计还将测试更多版本。然而,现阶段反馈难言乐观。

目前最棘手的硬伤,依然是 Gemini 在面对长文本及高复杂度任务时的「消极怠工」。这种「偷懒」行为,是谷歌在正式发布前必须攻克的头号顽疾。

亮点与隐忧并存
作为 3.5 时代的重磅产品,Gemini 3.5 Pro 并非毫无亮点。相比上一代,新模型在视觉能力、图像生成、SVG 质量及多模态理解方面展现出更强实力。爆料称,其上下文窗口将达到 2M。


但伴随硬实力升级的,是更严格的内容过滤机制与安全限制,以及更高的定价。懒惰仍是 Gemini 3 Pro 难以摆脱的阴影。


更严峻的挑战来自外部:OpenAI 和 Anthropic 不仅模型性能更优,迭代速度也在不断加快,留给 Gemini 的时间已然不多。


AI 进入深水区:边际效应递减
谷歌 3.5 Pro 暴露出的问题,或许是当前 AI 下半场的缩影。I/O 大会上的局促与新模型的困境,宣告 AGI 行业正式迈入「边际效应递减」的深水区。
依靠堆砌参数和算力实现指数级跨越的「黄金时代」正在远去。随之而来的,是昂贵的算力成本、日益收窄的安全红线,以及模型在物理极限下的自我妥协。
参考资料:
编辑:大卫

