大数跨境
0
0

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI 肖大锐
2025-02-25
100

Grok-3:马斯克推出的全球最强AI模型

【导读】Grok-3震撼发布,刷新多项记录

马斯克口中的“全球最聪明大模型”——Grok-3正式发布。该模型在训练规模、性能表现及应用能力上均创下新高,击败o3-mini(high)与DeepSeek-R1等顶尖模型。

这款模型基于20万块GPU完成训练[1],是人类历史上首个达到如此算力规模的模型。马斯克及其xAI团队通过在线直播宣布了Grok-3全家桶的推出,包括:

  • Grok-3(Beta)
  • Grok-3 mini
  • 推理模型:Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning
  • AI智能体:DeepSearch

Grok-3 Reasoning尤为突出,其回答问题时能展示完整的思维过程。

性能超越前代与竞品

Grok-3的训练计算量较Grok-2提升10倍,实际测试结果亦证明其优势显著:

  • 数学领域:AIME 2025中获得93分,领先所有同类模型。
  • 科学问答:GPQA测试成绩优异。
  • 编码能力:LCB基准评测刷新SOTA。

特别是在LMSYS Arena排行榜中,Elo评分超1400,稳居榜首。

高级推理Think模式

Grok-3支持多种创新功能,例如“Think”模式下可以直观展现其解决问题时的思维过程:

  • 生成从地球发射至火星返回的航天任务动画代码,验证成功。
  • 结合俄罗斯方块和宝石迷阵元素创造全新游戏,并实现运行。

这些案例展示了Grok-3不仅具备逻辑推导能力,还能进行复杂任务的规划与执行。

深度搜索DeepSearch

Grok-3还引入了首个智能体DeepSearch,允许用户对互联网内容进行全面且透明化的检索。特点如下:

  • 可指定搜索范围,如仅使用X平台内容。
  • 实时显示搜索与推理过程。
  • 答案详细合理,并附带参考链接。

无论是查询星舰发射时间还是游戏角色攻略,DeepSearch均表现出色。

展望未来

马斯克表示所有功能将在一周内上线,几个月内全面开源。此外还透露了语音助手版本及API接口即将推出的信息。

研究者指出,Grok-3的成功离不开高效的算法设计与算力支持,未来将致力于降低能耗,进一步优化数据中心效率。

AI界的高度认可

AI专家Karpathy对Grok-3评价颇高,认为其推理能力已接近o1 Pro水平,略胜于DeepSeek-R1。xAI团队则强调持续快速迭代才是他们脱颖而出的关键。

[1] https://x.com/i/broadcasts/1gqGvjeBljOGB
【声明】内容源于网络
0
0
肖大锐
专业赋能品牌出海,个人出海;独立站搭建,谷歌推广,社 媒营销,红人营销。
内容 131
粉丝 2
肖大锐 专业赋能品牌出海,个人出海;独立站搭建,谷歌推广,社 媒营销,红人营销。
总阅读51.7k
粉丝2
内容131