Grok-3:马斯克推出的全球最强AI模型
【导读】Grok-3震撼发布,刷新多项记录
马斯克口中的“全球最聪明大模型”——Grok-3正式发布。该模型在训练规模、性能表现及应用能力上均创下新高,击败o3-mini(high)与DeepSeek-R1等顶尖模型。
这款模型基于20万块GPU完成训练[1],是人类历史上首个达到如此算力规模的模型。马斯克及其xAI团队通过在线直播宣布了Grok-3全家桶的推出,包括:
- Grok-3(Beta)
- Grok-3 mini
- 推理模型:Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning
- AI智能体:DeepSearch
Grok-3 Reasoning尤为突出,其回答问题时能展示完整的思维过程。
性能超越前代与竞品
Grok-3的训练计算量较Grok-2提升10倍,实际测试结果亦证明其优势显著:
- 数学领域:AIME 2025中获得93分,领先所有同类模型。
- 科学问答:GPQA测试成绩优异。
- 编码能力:LCB基准评测刷新SOTA。
特别是在LMSYS Arena排行榜中,Elo评分超1400,稳居榜首。
高级推理Think模式
Grok-3支持多种创新功能,例如“Think”模式下可以直观展现其解决问题时的思维过程:
- 生成从地球发射至火星返回的航天任务动画代码,验证成功。
- 结合俄罗斯方块和宝石迷阵元素创造全新游戏,并实现运行。
这些案例展示了Grok-3不仅具备逻辑推导能力,还能进行复杂任务的规划与执行。
深度搜索DeepSearch
Grok-3还引入了首个智能体DeepSearch,允许用户对互联网内容进行全面且透明化的检索。特点如下:
- 可指定搜索范围,如仅使用X平台内容。
- 实时显示搜索与推理过程。
- 答案详细合理,并附带参考链接。
无论是查询星舰发射时间还是游戏角色攻略,DeepSearch均表现出色。
展望未来
马斯克表示所有功能将在一周内上线,几个月内全面开源。此外还透露了语音助手版本及API接口即将推出的信息。
研究者指出,Grok-3的成功离不开高效的算法设计与算力支持,未来将致力于降低能耗,进一步优化数据中心效率。
AI界的高度认可
AI专家Karpathy对Grok-3评价颇高,认为其推理能力已接近o1 Pro水平,略胜于DeepSeek-R1。xAI团队则强调持续快速迭代才是他们脱颖而出的关键。

