大数跨境
0
0

关于马斯克Grok 3模型的十个有趣事实!

关于马斯克Grok 3模型的十个有趣事实! AI算法之道
2025-02-23
1
导读:地表最强AI模型Grok3的十个事实
点击蓝字
 
关注我们










01


引言



埃隆-马斯克(Elon Musk)和 xAI 刚刚发布了他们迄今为止最先进的人工智能模型 Grok 3。在现场直播的发布会上,马斯克自信地称其为 "地球上最聪明的人工智能"。至于这一说法是否经得起推敲,还有待测试版发布后才能见分晓。

xAI 推出了一个新网站,Grok 3 暂时免费使用,甚至还发布了一个独立的 iOS 应用程序,让更多人可以试用。那么,是什么让Grok 3变得有趣呢?


我们在本文中将通过十个有趣的事实为大家进行解密。闲话少说,我们直接开始吧!








02


推出的新网站


Grok 3 在新网站 grok.com 上发布。这个专用平台将让用户以更便捷的方式探索人工智能模型并与之互动。

当前所有人都可以免费访问 Grok 3。这意味着您可以使用 Grok 3 进行休闲聊天、深入研究某个主题,甚至生成图片。





03


四种模型变体

Grok 3 有四个不同的版本:
  • Grok 3 Base:  共计 1.8 万亿参数模型,可实现最高精度。
  • Grok 3 Mini:  4000 亿参数版本,响应速度更快。
  • Grok 3 Reasoning:  使用思维链架构解决复杂问题。
  • Grok 3 Mini Reasoning: 兼顾速度与思考深度。
因此,Grok 3 共有四种基本型号。每个变体的设计都是为了满足不同的需求和使用情况。




04


性能对比

在 Grok 3 发布会上,xAI 将 OpenAI 的 o3 推理模型从基准图表中删除。
如果在基准中插入 o3,就会领先 Grok 3 的推理模型。
此举暗示了战略定位,表明 Grok 3 在某些领域领先于一些竞争对手。



05


地表最强人工智能

埃隆-马斯克称 Grok 3 是 "地球上最聪明的人工智能"。
在多次评估和现场演示中,该模型的表现令人印象深刻。是这样吗?至于事实的话,还需要一段时间进行验证。



06


超级计算机

Grok 3 运行在专为其开发而在孟菲斯建造的 Colossus 超级计算机上。
  • 硬件详情:它最初使用了 10 万个 Nvidia H100 GPU,后来增加了一倍,达到 20 万个。
  • 训练工作量:训练过程耗时超过 2 亿 GPU 小时。
这种令人难以置信的硬件设置使 Grok 3 能够实现 1.8 万亿个庞大的参数架构,是前代产品 Grok 2 的 10 倍。



07


聊天机器人竞技场冠军

Grok 3 在 LMSYS 的聊天机器人竞技场上排名第一。它是有史以来第一个得分超过 1400 ELO 的人工智能模型。
这一评分超过了 GPT-4o(1385 分)和 Claude 3.5 Sonnet(1372 分),在正面比较中获得了 72% 的首选响应率。在公开测试中,该模型在物理模拟和创意编码挑战中表现尤为突出。



08


Grok 3 在关键基准测试中击败 GPT-4o

在测试中,Grok 3 在几项重要基准测试中的表现都优于 GPT-4o:
  • AIME 数学基准:Grok 3 的准确率为 92%。
  • GPQA 科学测试:Grok 3 达到了人类成绩的第 94 百分位数。
这些测试涵盖了从数学到博士级科学的方方面面,证明了 Grok 3 的先进能力。



09


发展迅速

马斯克强调了Grok 3的快速进步,他说:"Grok已经准备好上大学了"。这句话强调了该模型自 Grok 2 以来取得的进步,反映了陡峭的学习曲线和快速的进化。
Grok 3 还非常擅长制作游戏模拟器。在演示过程中,Grok 3 展示了其创造性的一面:
  • 它设计了一个火星-地球轨道转移模拟,并进行了最佳 Δv 计算。
  • 它创造了一款混合了俄罗斯方块和宝石迷阵元素的混合游戏。
  • 它甚至生成了量子计算理论部件的 3D 打印模型。
大家可以查看 Grok 3 官方博客中展示的示例游戏。

官网:https://x.ai/blog/grok-3

示例给出的提示词如下:

提示:制作一款混合了两款经典游戏的游戏。用pygame制作,并使其看起来漂亮。

生成的游戏效果如下:
马斯克指出,这些输出显示了 "人工创造力的开端",表明 Grok 3 有潜力彻底改变实际任务和创意项目。


10


DeepSearch:下一代信息检索系统

Grok 3 引入了人工智能辅助研究的新功能 DeepSearch。
  • 工作原理:它通过学术论文和社会数据搜索相关信息。如果您听说过 ChatGPT 的 "深度研究"(Deep Research)或 DeepSeek R-1 的 "深度研究"(Deep Research),那么 Grok 3 自己的 "深度搜索"(DeepSearch)预计也会以同样的方式工作。
  • 示例:当被问及下一次 Starship的发射时,它能识别出超过 127 个来源,交叉引用轨道力学,甚至还提供了置信度加权预测。
这种结合AI的搜索与符号推理的融合使 DeepSearch 成为人工智能工具包中独一无二的工具。



11
xAI推出iOS 版 Grok APP

在发布 Grok 3 的同时,xAI 还推出了全新的独立 Grok iOS 应用程序。大家现在可以在苹果公司的 App Store 上下载 iPhone 和 iPad 应用程序。
要切换到 Grok 3 模型,请打开聊天窗口,并在上半部分下拉菜单中将模型设置为 Grok 3。
好了,就是这些!Grok 3 目前是免费使用的,所以趁现在赶紧试试吧。



素材来自互联网,侵权请联系删除!



点击上方小卡片关注我




添加个人微信,进专属粉丝群!


【声明】内容源于网络
0
0
AI算法之道
一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
内容 573
粉丝 0
AI算法之道 一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
总阅读129
粉丝0
内容573