谷歌重磅发布Gemini 3 Flash：超越Pro版，编程能力大幅跃升，速度更快，成本更低！



谷歌重磅发布Gemini 3 Flash：超越Pro版，编程能力大幅跃升，速度更快，成本更低！

沁诚信息

2025-12-18

点击蓝字关注我们

Gemini 3 Flash现已震撼发布！

Gemini 3家族实现了完整布局：包括Flash、Pro和Deep Think。

Flash模型已经全面集成到Gemini APP、AI Studio、Google Antigravity和Gemini CLI中，用户只需打开Gemini，即可免费体验默认的Gemini 3 Flash版本。

这款新的 Flash 模型距离 Google 发布的 Gemini 2.5 Flash 仅过去了六个月，但性能实现了显著提升。基准测试表明，Gemini 3 Flash 相较于前代模型有大幅进步，在某些指标上甚至达到了 Gemini 3 Pro 和 GPT-5.2 等顶尖模型的水平。

在智能与成本方面，它已成为全球性价比最高的模型之一。

在 Humanity’s Last Exam 基准测试中（该测试旨在评估模型在不同专业领域的综合能力），Gemini 3 Flash 在不使用工具的情况下取得了 33.7% 的成绩。相比之下，Gemini 3 Pro 的得分为 37.5%，而 Gemini 2.5 Flash 则为 11%。新发布的 GPT-5.2 获得了 34.5% 的成绩。

与此同时，谷歌将这一全新模型向全球数百万用户开放，覆盖以下渠道：

开发者：可以通过 Google AI Studio 提供的 Gemini API、Gemini CLI，以及全新的智能体开发平台 Google Antigravity 进行访问。
所有用户：通过 Gemini 应用和搜索中的 AI 模式（AI Mode in Search）使用。
企业用户：通过 Vertex AI 和 Gemini Enterprise 平台进行访问。

Gemini 3 Flash 证明了速度与规模无须以牺牲智能为代价。

在多项博士级推理与知识基准测试中，诸如 GPQA Diamond（达到90.4%）和 Humanity’s Last Exam（无需工具的情况下达到33.7%），Gemini 3 Flash 展现出卓越的性能，能够媲美更大规模的前沿模型，并在多个基准测试中大幅超越之前最强的2.5代模型——Gemini 2.5 Pro。

此外，在多模态推理基准 MMMU Pro 上，Gemini 3 Flash 以81.2%的高分达到了当前最先进水平，其表现与 Gemini 3 Pro 不相上下。

从基准测试结果可以看出，Gemini 3 Flash 性能强劲，全方位超越了 Gemini 2.5 Pro，甚至在 ARC-AGI-2 和 SWE-Bench Verified 测试中表现优于 Gemini 3 Pro。

目前，经过精简的模型（体积缩小至原来的三到四分之一）已经超越了半年前所谓的「前沿」模型。

Flash在GPQA Diamond（90.4%）和Humanity’s Last Exam（在无工具条件下达到33.7%）等博士级推理和知识基准测试中表现出色，其性能可与更大型的先进模型媲美，并且在多项基准测试中明显超越了上一代旗舰产品Gemini 2.5 Pro。

在ARC-AGI Semi-Private Eval测试中，Gemini 3 Flash展现了强大的竞争力，并且其运行成本显著低于其他先进模型。ARC-AGI-1的表现为84.7%，每任务成本为$0.17，而ARC-AGI-2的表现为33.6%，每任务成本为$0.23。

在LMArena上，Gemini 3 Flash的文本能力直接跃升至第3！

Gemini 3 Flash展示了速度和规模无需以牺牲智能为代价。除了拥有前沿的推理能力和多模态功能，Gemini 3 Flash还专为高效运作而设计，在质量、成本和速度之间达到帕累托最优。

处理最高层次的思维任务时，Gemini 3 Flash能够调节其「思考强度」。面对更复杂的用例时，它可能会花费更多时间进行思考，但在通常情况下，它比2.5 Pro平均节省30%的Token使用，同时以更高的性能精准完成日常任务。

Gemini 3 Flash的最大优势在于其出色的原生速度！它的性能超越了2.5 Pro，速度提升了三倍（根据Artificial Analysis基准测试），而成本却非常低。

Gemini 3 Flash的定价为每百万输入Token仅需0.50美元，每百万输出Token为3美元（音频输入的费用仍保持在每百万输入Token 1美元）。

开发者新宠：极速与深度的完美平衡

Gemini 3 Flash 专为高频迭代开发而设计，能够在保持低延迟的条件下提供与 Gemini 3 Pro 相媲美的代码能力。

在高并发和快节奏的工作流中，它能够迅速推理并解决问题。在用于评估代码智能体能力的基准测试 SWE-bench Verified 上，Gemini 3 Flash 取得了 78% 的优异成绩，超越了 2.5 系列模型，并胜过 Gemini 3 Pro。

这使得 Gemini 3 Flash 在智能体编程、生产级系统以及高响应交互式应用场景中，实现了性能、速度和成本之间的理想平衡。

例如，Gemini 3 Flash 能够在一款手部追踪的弹球益智游戏中进行多模态推理，提供几乎即时的人工智能辅助功能。

或者，可以几乎实时地创建和A/B测试新的加载动画设计，从而简化了从设计到代码的整个流程。

此外，它还能够利用多模态推理分析图像，并生成带有上下文的用户界面覆盖层字幕，将静态图像转化为互动体验。

面向所有人：Gemini 3 Flash 全球上线

Gemini 3 Flash 现在是 Gemini 应用的默认模型，替代了之前的 2.5 Flash。这一升级让全球的 Gemini 用户都可以免费使用 Gemini 3，从而显著提高日常任务的处理效率。

由于 Gemini 3 Flash 拥有卓越的多模态推理能力，你可以更快速地查看、聆听和理解各种类型的信息。举例来说，你可以让 Gemini 理解视频和图像，并在几秒钟内将这些内容转化为实用的计划。

比如，它可以通过分析短视频的内容，来为你制定改善高尔夫挥杆动作的计划。

上传一段音频录音后，Gemini 3 Flash将识别你的知识盲区，为你创建一个个性化定制的测验，并提供详细的答案解释。

经过速度优化的Gemini 3 Flash，能够在你绘制草图的同时预测你的创意。

即使你没有任何编程知识，也可以通过语音从头开始快速构建有趣且实用的App。只需在任何时间、任何地点对Gemini进行口述，它便能在数分钟内将你零散的想法转化为功能齐全的App。

Gemini 3 Flash现已成为搜索过程中AI模式的默认模型，并面向全球用户开放。

该模式建立在Gemini 3 Pro的强大推理能力之上，进一步增强了解析问题细微差别的能力。

Gemini 3 Flash在处理查询时，会全面考量各个方面，提供经过深思熟虑、全面且易于视觉理解的答案，同时从全网提取实时本地信息和有用链接。

这样一来，结果完美融合了研究与即时行动：用户可以快速获得针对性推荐，以及经过智能整理的内容细分——所有这些都以搜索的速度呈现。

尤其在解决多重考量的复杂目标时，表现尤为出色，例如规划一次说走就走的旅行或迅速掌握复杂的教育概念。

Gemini 3 Flash的发布传达了一个明确的信息："高性能人工智能已变得更加经济实惠和高效。不再存在高于我的速度却不如我智能的技术，也不再有超越我智能却不如我迅捷的产品，更不用说它们的价格都比我高昂。"

谷歌通过采取极具进攻性的策略——顶尖的推理能力、极快的速度和极具吸引力的价格，希望在2025年底占据市场领先地位。

联系我们

Tel丨

021-33680778

Mail丨

marketing@qinchengsoft.com

猜你喜欢：

沁诚信息携手Cloudflare参与ExpandX中国出海品牌全球数字化创新峰会，探索“从China到Global”全球化新路径

喜报|沁诚信息入选2025年度第三批浦东新区中小企业数字化转型城市试点数字化改造服务商（培育）计划

抵御企业数据洪流，NextAI PowerData如何实现多表格、文档等信息高效整合

沁诚信息携手DSMC 2025第五届中国制造业&新能源数智峰会，智领制造业AI新机遇！

企业出海必备：Azure云平台保障数据合规与智能化！

Cloudflare：企业网络安全与性能优化的终极解决方案

沁诚信息携手模速空间论坛，共话AI Agent驱动的商业变革

Azure AI Foundry，从概念到实践的AI解决方案

沁诚信息参与半导体CAD联盟论坛，交流AI技术在半导体领域创新

【声明】内容源于网络

沁诚信息

诚信至上，以人为本，服务为先。 Honesty First People-Oriented Service First Next AI 企业级AI解决方案、IT基础架构整体解决方案、企业通用软件代理

内容 298

粉丝 0

沁诚信息诚信至上，以人为本，服务为先。 Honesty First People-Oriented Service First Next AI 企业级AI解决方案、IT基础架构整体解决方案、企业通用软件代理

总阅读39

粉丝0

内容298