2025年11月19日,谷歌正式发布 Gemini 3,目前全球最强大的多模态理解模型,也是目前最强的智能体(agentic)与“vibe coding”(创造性、沉浸式交互)模型,能够带来更丰富的可视化、更深度的互动体验,并基于最先进的推理能力构建。
谷歌将从推出 Gemini 3 Pro(预览版) 开始,还推出了 Gemini 3 Deep Think ——一种增强推理模式,进一步提升 Gemini 3 的表现,并将优先提供给安全测试人员,之后面向 Google AI Ultra 订阅用户开放。
Gemini 3以的 1501 Elo 得分位居 LMArena 排行榜首位;在 Humanity’s Last Exam 上取得了博士水平的推理表现(在不使用任何工具的前提下得分 37.5%),在 GPQA Diamond 上的得分则达到 91.9%。在数学方面,它也为前沿模型树立了新标杆,在 MathArena Apex 上取得了 23.4% 的最新最优成绩。
不仅在文本上表现突出,Gemini 3 Pro 还以 81% 的 MMMU-Pro 成绩和 87.6% 的 Video-MMMU 成绩重新定义了多模态推理。同时,它在 SimpleQA Verified 上取得了 72.1% 的业界领先成绩,显示出在事实准确性方面的巨大进步。
这意味着,Gemini 3 Pro 能够以高度可靠的方式,在科学、数学等大量复杂主题上出色地解决复杂问题。
图1:Gemini3测试结果
Gemini 3 Deep Think
Gemini 3 的 Deep Think 模式进一步突破智能的边界,使 Gemini 3 在推理与多模态理解方面实现飞跃式提升,帮助解决更加复杂的问题。
在测试中,Gemini 3 Deep Think 的表现超过了已经非常强大的 Gemini 3 Pro:在 Humanity’s Last Exam 上取得 41.0%(不使用工具) 的成绩,在 GPQA Diamond 上达到 93.8%。它还在 ARC-AGI-2 上取得 45.1%(使用代码执行,ARC Prize Verified)。
图2:Gemini 3 Deep Think测试结果
Gemini 从诞生之初就被设计为能够跨文本、图像、视频、音频和代码等多种模态,顺畅地综合整理任何主题的信息。Gemini 3 进一步推动了多模态推理的边界,结合最先进的推理能力、视觉与空间理解、领先的多语言表现,以及 100 万 tokens 的上下文窗口,帮助用户最适合自己的方式学习知识。
例如:
如果想学习家族传统食谱,Gemini 3 可以识别和翻译不同语言的手写菜谱,把它们整理成可分享的家庭食谱书。
如果想学习一个新主题,可以给它学术论文、长视频课程或教程,它能够生成交互式记忆卡片、可视化图形或其他格式的学习材料,帮助你掌握内容。
它可以分析你打匹克球(pickleball)的比赛视频,找出你的薄弱环节,并生成一个系统的训练计划来帮助你提升整体动作表现。
为了帮助更好理解网页信息,搜索中的 AI 模式(AI Mode in Search) 现在使用 Gemini 3,能够即时生成全新的生成式交互界面,包括沉浸式视觉排版、交互式工具和模拟器——所有内容都根据你的搜索查询实时生成。
Gemini 3 是谷歌迄今为止最出色的 vibe coding(沉浸式创意编码) 和 agentic coding(智能体式编码) 模型,使产品更具自主性、显著提升开发者效率。它以 1487 Elo 的成绩登顶 WebDev Arena 排行榜;在测试模型通过终端操作计算机能力的 Terminal-Bench 2.0 中获得 54.2%;在衡量代码智能体能力的 SWE-bench Verified(76.2%)上则远超 2.5 Pro。
用户现在可以在 Google AI Studio、Vertex AI、Gemini CLI 以及全新的智能体开发平台 Google Antigravity 中使用 Gemini 3。同时,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上可用。
随着 Gemini 3 推动模型智能加速,谷歌发布 Google Antigravity ——一个全新的智能体开发平台,使开发者能够在更高层级、以任务为中心的方式进行构建。
依托 Gemini 3 的高级推理、工具使用与 agentic coding 能力,Google Antigravity 将 AI 从开发者工具箱中的一个辅助工具,转变为一个真正的主动合作伙伴。虽然其核心仍是熟悉的 AI IDE 体验,但平台中的智能体被提升到了独立的工作界面,并被赋予对编辑器、终端和浏览器的直接访问权限。现在,智能体能够代表你自主规划并执行复杂、端到端的软件开发任务,并在执行过程中自我验证代码。
除了 Gemini 3 Pro,Google Antigravity 还深度集成了谷歌最新的 Gemini 2.5 Computer Use(用于浏览器控制)以及最先进的图像编辑模型 Nano Banana(Gemini 2.5 Image)。
Gemini 3 Pro 在整个模拟的一年运营中,能够保持一致的工具使用与决策行为,在不偏离任务的情况下持续创造更高收益。这意味着 Gemini 3 将更好地帮助你在日常生活中完成实际任务。
通过结合更深层次的推理能力与更稳定的工具使用能力,Gemini 3 能够代表用户采取行动,从头到尾跨越更复杂的多步骤流程——例如预订本地服务、整理邮箱等——并始终在你的掌控与指导下执行。
Google AI Ultra 订阅用户今天即可在 Gemini 应用中体验这些智能体能力(Gemini Agent)。
图3:Gemini 3 Pro 在长周期规划方面表现更出色,能够产生显著更高的回报

