早上起床,当我把「帮我做一个能自定义车速的模拟赛车」丢进对话框,30 秒后,一段可交互的 HTML 文件直接躺在了下载栏。旋转赛车的动画、速度控制、按钮一应俱全——这不是魔法,而是谷歌最新发布的 Gemini 3 Pro 的日常操作。
🚀 性能碾压:GPT-5.1 拿 1 分,它拿 23.4 分
在被称为「人类最后考试」的 Humanity’s Last Exam 中,Gemini 3 Pro 无工具版本直接拿下 37.5%,开工具后冲到 45.8%;而 GPT-5.1 只有 26.5%,Claude 4.5 更惨,仅 13.7%。
更夸张的是超难数学测试 MathArena Apex:GPT-5.1 只得 1 分,Gemini 3 Pro 直接飙到 23.4,断层式领先。
💡 vibe coding:不会写代码也能做产品
谷歌给这项能力起了个很「氛围」的名字——vibe coding:
-
• 说一句话,30 秒生成 3D 乐高编辑器,空间逻辑零错误; -
• 上传一张网页截图,直接还原可运行前端代码,布局像素级复刻; -
• 2 分钟搭完一个带终端、编辑器、小游戏的 Web OS,不再是「装饰性 UI」。
以前需要前端、后端、UI 三班倒的工作,现在一杯咖啡的功夫就搞定。
🧠 多模态狂魔:视频、PDF、音频一锅端
100 万 token 超长上下文,一口气读完一整本书或整个代码库。
-
• 视频:45 分钟电影直接总结关键剧情,自动生成时间轴; -
• PDF:1000 页论文一键提取图表、公式、结论; -
• 音频:8.4 小时会议录音秒变文字纪要。
更离谱的是,它还能根据 18 世纪手写稿识别字符,错误率仅 0.56%。
🖼️ 生成式界面:同一问题,给小孩和成人两种答案
传统 AI 给你一段文字,Gemini 3 Pro 直接给你一张「定制网页」。
-
• 问「量子计算是什么?」 -
• 成人版:简洁图表 + 论文链接 -
• 儿童版:卡通粒子动画 + 互动小游戏 -
• 做旅行规划:自动查航班、酒店、日历冲突,最后生成一份可交互的行程表。
这就是谷歌所说的 「AI 入口争夺战」 ——浏览器和聊天框的边界正在消失。
💰 免费先用,API 再付费
目前 Google AI Studio 完全免费,可随意体验。
想接 API?价格如下(每 100 万 token):
对比 GPT-4.5 的 $30 起步价,真·白菜。
🧩 实测场景表现
👨💻 开发者实测:从「调参」到「调词」
过去写代码:
-
• 调框架、调依赖、调环境,一天过去 Hello World 还没跑起来。
现在写代码:
-
• 一句「我要一个带登录、支付、暗黑模式的电商首页」,Gemini 3 Pro 直接给你完整 React 项目,ES 模块、Tailwind 样式、JWT 鉴权一步到位。
技能树直接刷新:
框架熟练度 → 场景描述力 + 审美品味。

