点击蓝字 关注我们
Gemini 3 Flash现已震撼发布!
Gemini 3家族实现了完整布局:包括Flash、Pro和Deep Think。
Flash模型已经全面集成到Gemini APP、AI Studio、Google Antigravity和Gemini CLI中,用户只需打开Gemini,即可免费体验默认的Gemini 3 Flash版本。
这款新的 Flash 模型距离 Google 发布的 Gemini 2.5 Flash 仅过去了六个月,但性能实现了显著提升。基准测试表明,Gemini 3 Flash 相较于前代模型有大幅进步,在某些指标上甚至达到了 Gemini 3 Pro 和 GPT-5.2 等顶尖模型的水平。
在智能与成本方面,它已成为全球性价比最高的模型之一。
在 Humanity’s Last Exam 基准测试中(该测试旨在评估模型在不同专业领域的综合能力),Gemini 3 Flash 在不使用工具的情况下取得了 33.7% 的成绩。相比之下,Gemini 3 Pro 的得分为 37.5%,而 Gemini 2.5 Flash 则为 11%。新发布的 GPT-5.2 获得了 34.5% 的成绩。
与此同时,谷歌将这一全新模型向全球数百万用户开放,覆盖以下渠道:
开发者:可以通过 Google AI Studio 提供的 Gemini API、Gemini CLI,以及全新的智能体开发平台 Google Antigravity 进行访问。
所有用户:通过 Gemini 应用和搜索中的 AI 模式(AI Mode in Search)使用。
企业用户:通过 Vertex AI 和 Gemini Enterprise 平台进行访问。
Gemini 3 Flash 证明了速度与规模无须以牺牲智能为代价。
在多项博士级推理与知识基准测试中,诸如 GPQA Diamond(达到90.4%)和 Humanity’s Last Exam(无需工具的情况下达到33.7%),Gemini 3 Flash 展现出卓越的性能,能够媲美更大规模的前沿模型,并在多个基准测试中大幅超越之前最强的2.5代模型——Gemini 2.5 Pro。
此外,在多模态推理基准 MMMU Pro 上,Gemini 3 Flash 以81.2%的高分达到了当前最先进水平,其表现与 Gemini 3 Pro 不相上下。
从基准测试结果可以看出,Gemini 3 Flash 性能强劲,全方位超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 测试中表现优于 Gemini 3 Pro。
目前,经过精简的模型(体积缩小至原来的三到四分之一)已经超越了半年前所谓的「前沿」模型。
Flash在GPQA Diamond(90.4%)和Humanity’s Last Exam(在无工具条件下达到33.7%)等博士级推理和知识基准测试中表现出色,其性能可与更大型的先进模型媲美,并且在多项基准测试中明显超越了上一代旗舰产品Gemini 2.5 Pro。
在ARC-AGI Semi-Private Eval测试中,Gemini 3 Flash展现了强大的竞争力,并且其运行成本显著低于其他先进模型。ARC-AGI-1的表现为84.7%,每任务成本为$0.17,而ARC-AGI-2的表现为33.6%,每任务成本为$0.23。
在LMArena上,Gemini 3 Flash的文本能力直接跃升至第3!
Gemini 3 Flash展示了速度和规模无需以牺牲智能为代价。除了拥有前沿的推理能力和多模态功能,Gemini 3 Flash还专为高效运作而设计,在质量、成本和速度之间达到帕累托最优。
处理最高层次的思维任务时,Gemini 3 Flash能够调节其「思考强度」。面对更复杂的用例时,它可能会花费更多时间进行思考,但在通常情况下,它比2.5 Pro平均节省30%的Token使用,同时以更高的性能精准完成日常任务。
Gemini 3 Flash的最大优势在于其出色的原生速度!它的性能超越了2.5 Pro,速度提升了三倍(根据Artificial Analysis基准测试),而成本却非常低。
Gemini 3 Flash的定价为每百万输入Token仅需0.50美元,每百万输出Token为3美元(音频输入的费用仍保持在每百万输入Token 1美元)。
开发者新宠:极速与深度的完美平衡
Gemini 3 Flash 专为高频迭代开发而设计,能够在保持低延迟的条件下提供与 Gemini 3 Pro 相媲美的代码能力。
在高并发和快节奏的工作流中,它能够迅速推理并解决问题。在用于评估代码智能体能力的基准测试 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的优异成绩,超越了 2.5 系列模型,并胜过 Gemini 3 Pro。
这使得 Gemini 3 Flash 在智能体编程、生产级系统以及高响应交互式应用场景中,实现了性能、速度和成本之间的理想平衡。
例如,Gemini 3 Flash 能够在一款手部追踪的弹球益智游戏中进行多模态推理,提供几乎即时的人工智能辅助功能。
或者,可以几乎实时地创建和A/B测试新的加载动画设计,从而简化了从设计到代码的整个流程。
此外,它还能够利用多模态推理分析图像,并生成带有上下文的用户界面覆盖层字幕,将静态图像转化为互动体验。
面向所有人:Gemini 3 Flash 全球上线
Gemini 3 Flash 现在是 Gemini 应用的默认模型,替代了之前的 2.5 Flash。这一升级让全球的 Gemini 用户都可以免费使用 Gemini 3,从而显著提高日常任务的处理效率。
由于 Gemini 3 Flash 拥有卓越的多模态推理能力,你可以更快速地查看、聆听和理解各种类型的信息。举例来说,你可以让 Gemini 理解视频和图像,并在几秒钟内将这些内容转化为实用的计划。
比如,它可以通过分析短视频的内容,来为你制定改善高尔夫挥杆动作的计划。
上传一段音频录音后,Gemini 3 Flash将识别你的知识盲区,为你创建一个个性化定制的测验,并提供详细的答案解释。
经过速度优化的Gemini 3 Flash,能够在你绘制草图的同时预测你的创意。
即使你没有任何编程知识,也可以通过语音从头开始快速构建有趣且实用的App。只需在任何时间、任何地点对Gemini进行口述,它便能在数分钟内将你零散的想法转化为功能齐全的App。
Gemini 3 Flash现已成为搜索过程中AI模式的默认模型,并面向全球用户开放。
该模式建立在Gemini 3 Pro的强大推理能力之上,进一步增强了解析问题细微差别的能力。
Gemini 3 Flash在处理查询时,会全面考量各个方面,提供经过深思熟虑、全面且易于视觉理解的答案,同时从全网提取实时本地信息和有用链接。
这样一来,结果完美融合了研究与即时行动:用户可以快速获得针对性推荐,以及经过智能整理的内容细分——所有这些都以搜索的速度呈现。
尤其在解决多重考量的复杂目标时,表现尤为出色,例如规划一次说走就走的旅行或迅速掌握复杂的教育概念。
Gemini 3 Flash的发布传达了一个明确的信息:"高性能人工智能已变得更加经济实惠和高效。不再存在高于我的速度却不如我智能的技术,也不再有超越我智能却不如我迅捷的产品,更不用说它们的价格都比我高昂。"
谷歌通过采取极具进攻性的策略——顶尖的推理能力、极快的速度和极具吸引力的价格,希望在2025年底占据市场领先地位。
联系我们
Tel丨
021-33680778
Mail丨
marketing@qinchengsoft.com

