

Gemini3 正式发布

小熊跑的快

2025-11-19

2025年11月19日，谷歌正式发布 Gemini 3，目前全球最强大的多模态理解模型，也是目前最强的智能体（agentic）与“vibe coding”（创造性、沉浸式交互）模型，能够带来更丰富的可视化、更深度的互动体验，并基于最先进的推理能力构建。

谷歌将从推出 Gemini 3 Pro（预览版）开始，还推出了 Gemini 3 Deep Think ——一种增强推理模式，进一步提升 Gemini 3 的表现，并将优先提供给安全测试人员，之后面向 Google AI Ultra 订阅用户开放。

Gemini 3以的 1501 Elo 得分位居 LMArena 排行榜首位；在 Humanity’s Last Exam 上取得了博士水平的推理表现（在不使用任何工具的前提下得分 37.5%），在 GPQA Diamond 上的得分则达到 91.9%。在数学方面，它也为前沿模型树立了新标杆，在 MathArena Apex 上取得了 23.4% 的最新最优成绩。

不仅在文本上表现突出，Gemini 3 Pro 还以 81% 的 MMMU-Pro 成绩和 87.6% 的 Video-MMMU 成绩重新定义了多模态推理。同时，它在 SimpleQA Verified 上取得了 72.1% 的业界领先成绩，显示出在事实准确性方面的巨大进步。

这意味着，Gemini 3 Pro 能够以高度可靠的方式，在科学、数学等大量复杂主题上出色地解决复杂问题。

图1:Gemini3测试结果

Gemini 3 Deep Think

Gemini 3 的 Deep Think 模式进一步突破智能的边界，使 Gemini 3 在推理与多模态理解方面实现飞跃式提升，帮助解决更加复杂的问题。

在测试中，Gemini 3 Deep Think 的表现超过了已经非常强大的 Gemini 3 Pro：在 Humanity’s Last Exam 上取得 41.0%（不使用工具）的成绩，在 GPQA Diamond 上达到 93.8%。它还在 ARC-AGI-2 上取得 45.1%（使用代码执行，ARC Prize Verified）。

图2:Gemini 3 Deep Think测试结果

Gemini 从诞生之初就被设计为能够跨文本、图像、视频、音频和代码等多种模态，顺畅地综合整理任何主题的信息。Gemini 3 进一步推动了多模态推理的边界，结合最先进的推理能力、视觉与空间理解、领先的多语言表现，以及 100 万 tokens 的上下文窗口，帮助用户最适合自己的方式学习知识。

例如：

如果想学习家族传统食谱，Gemini 3 可以识别和翻译不同语言的手写菜谱，把它们整理成可分享的家庭食谱书。

如果想学习一个新主题，可以给它学术论文、长视频课程或教程，它能够生成交互式记忆卡片、可视化图形或其他格式的学习材料，帮助你掌握内容。

它可以分析你打匹克球（pickleball）的比赛视频，找出你的薄弱环节，并生成一个系统的训练计划来帮助你提升整体动作表现。

为了帮助更好理解网页信息，搜索中的 AI 模式（AI Mode in Search）现在使用 Gemini 3，能够即时生成全新的生成式交互界面，包括沉浸式视觉排版、交互式工具和模拟器——所有内容都根据你的搜索查询实时生成。

Gemini 3 是谷歌迄今为止最出色的 vibe coding（沉浸式创意编码）和 agentic coding（智能体式编码）模型，使产品更具自主性、显著提升开发者效率。它以 1487 Elo 的成绩登顶 WebDev Arena 排行榜；在测试模型通过终端操作计算机能力的 Terminal-Bench 2.0 中获得 54.2%；在衡量代码智能体能力的 SWE-bench Verified（76.2%）上则远超 2.5 Pro。

用户现在可以在 Google AI Studio、Vertex AI、Gemini CLI 以及全新的智能体开发平台 Google Antigravity 中使用 Gemini 3。同时，它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上可用。

随着 Gemini 3 推动模型智能加速，谷歌发布 Google Antigravity ——一个全新的智能体开发平台，使开发者能够在更高层级、以任务为中心的方式进行构建。

依托 Gemini 3 的高级推理、工具使用与 agentic coding 能力，Google Antigravity 将 AI 从开发者工具箱中的一个辅助工具，转变为一个真正的主动合作伙伴。虽然其核心仍是熟悉的 AI IDE 体验，但平台中的智能体被提升到了独立的工作界面，并被赋予对编辑器、终端和浏览器的直接访问权限。现在，智能体能够代表你自主规划并执行复杂、端到端的软件开发任务，并在执行过程中自我验证代码。

除了 Gemini 3 Pro，Google Antigravity 还深度集成了谷歌最新的 Gemini 2.5 Computer Use（用于浏览器控制）以及最先进的图像编辑模型 Nano Banana（Gemini 2.5 Image）。

Gemini 3 Pro 在整个模拟的一年运营中，能够保持一致的工具使用与决策行为，在不偏离任务的情况下持续创造更高收益。这意味着 Gemini 3 将更好地帮助你在日常生活中完成实际任务。

通过结合更深层次的推理能力与更稳定的工具使用能力，Gemini 3 能够代表用户采取行动，从头到尾跨越更复杂的多步骤流程——例如预订本地服务、整理邮箱等——并始终在你的掌控与指导下执行。

Google AI Ultra 订阅用户今天即可在 Gemini 应用中体验这些智能体能力（Gemini Agent）。

图3:Gemini 3 Pro 在长周期规划方面表现更出色，能够产生显著更高的回报

【声明】内容源于网络

小熊跑的快

内容 519

粉丝 0

小熊跑的快

总阅读94

粉丝0

内容519