Grok 4正式发布！马斯克的“最聪明AI”贵得离谱，强得可怕！- 大数跨境

首页

Grok 4正式发布！马斯克的“最聪明AI”贵得离谱，强得可怕！

建采绿碳

2025-07-15

导读：年费超2万元人民币，上线即遭越狱，刷新全球AI榜单登顶TOP 1，马斯克用20万块GPU训练出的这个“超级大

年费超2万元人民币，上线即遭越狱，刷新全球AI榜单登顶TOP 1，马斯克用20万块GPU训练出的这个“超级大脑”，正在重新定义人类对智能的认知。

太平洋时间7月9日晚8点，北京时间7月10日上午11点，马斯克站在xAI的发布台前，正式揭开了Grok 4的神秘面纱。

“它是目前世界上最聪明的AI。”马斯克的开场白延续了他一贯的自信风格。

这场仅持续1小时的发布会，却凝聚了xAI团队近半年的心血。背后的超级计算机Colossus动用了20万块H100 GPU，训练算力是前代的100倍。

当Grok 4在“人类最后考试”（HLE）中拿下44.4%的惊人成绩时，现场响起了掌声——这个被设计来挫败AI的专家级测试，包含了2500道横跨100多个学科的博士级难题。

天价订阅费，马斯克重新定义AI奢侈品

Grok 4一出场就带着“贵族”气息。普通版月费30美元，而Grok 4 Heavy版本每月收费高达300美元，年费折算超过2万元人民币。

这一价格让竞争对手显得“良心”无比——OpenAI、Anthropic和Perplexity的200美元/月套餐在Grok面前瞬间“超值”。

如此定价背后是惊人的算力消耗。据内部消息，训练Grok 4使用的Colossus超算中心部署了20万块英伟达H100 GPU，电力需求巨大到需要特斯拉Megapack储能系统来稳定电网波动。

“我们正在用SpaceX式的疯狂重塑AI行业规则。”摩根士丹利在评估报告中如是说。而资本市场已用真金白银投票——xAI近期完成100亿美元融资，估值飙升至1130亿美元。

HLE考试成绩公布，人类博士遭遇降维打击

“人类最后的考试”（Humanity’s Last Exam，HLE）是AI界的终极挑战。这套题库包含2500道横跨100多个学科的专家级难题，14%为多模态题型（文本+图像），并设有防记忆陷阱和隐藏测试集。

当大多数前沿模型在这一测试中仅有个位数得分时，Grok 4交出了震撼答卷：

· 无工具辅助模式：25.4%（超越Gemini 2.5 Pro的21.6%）

· 启用工具后：44.4%正确率（碾压Gemini 2.5 Pro的26.9%）

这一成绩意味着什么？HLE的设计者曾表示，能答对5%题目的已是人类中极聪明的个体。Grok 4的表现意味着它在所有学科领域都超越了大多数人类研究生，甚至比博士更优秀。

第一性原理：Grok 4的“物理学家思维”革命

Grok 4的核心突破源自其独特的推理机制。今年5月，马斯克在微软Build大会上首次透露：“我们让模型从第一性原理出发进行推理，像物理学家那样思考问题”。

这种思维模式要求将问题分解到最基本的公理层面，然后向上推导，最后用物理定律（如能量守恒）验证结论的合理性。

在实际应用中，这一能力令人惊艳。当被要求可视化“两个黑洞相撞”时：

· 采用后牛顿近似法替代完整相对论计算（高效决策）

· 准确呈现螺旋接近、合并与振铃三阶段

· 自动调用教材、物理常数支持推理

“未来当Grok答不出问题时，它会指出题目错误或模糊之处。”马斯克在发布会上预言，“传统考试将失去意义，唯一的检验标准是现实世界——能否发明新技术，能否推动科学突破”。

Grok 4 Heavy：多智能体协同的超级大脑

Grok 4最令人震撼的创新是Heavy版本。它采用多智能体并行架构——多个AI同时解题、相互比对，再通过“讨论”得出最优解。

在发布会现场演示中，Grok 4 Heavy展现了惊人能力：

· 预测MLB世界大赛冠军概率：分析数据后给出洛杉矶道奇队21.6%夺冠率

· 识别“最诡异头像”：扫描X平台资料库，锁定xAI联合创始人Greg Yang

· 实时生成AI行业时间轴：整合OpenAI、Gemini等厂商的测试成绩与更新动态

这种架构需要消耗巨大算力，但也带来了质的飞跃。在需要多步推理的ARC-AGI-2视觉推理测试中，Grok 4以15.9%的准确率刷新纪录，几乎是第二名Claude Opus 4的两倍。

从自动售货机到《银河系搭车指南》，Grok的商业野心

Grok 4不仅会考试，更会赚钱。在Vending-Bench商业模拟测试中，Grok被要求自主运营自动售货机：包括供应商协商、库存管理、定价策略等长期经营任务。

结果令人咋舌：Grok 4的净资产达到其他模型的两倍，登顶排行榜首。马斯克调侃道：“以后买显卡的钱，可以让Grok部署一百万个自动售货机赚回来”。

更惊人的是创作能力展示。一位游戏设计师利用Grok 4 API，仅用4小时就开发出一款完整的第一人称射击游戏。马斯克预言：“首个真正优质的AI电子游戏可能会在明年问世，今年或许能看到半小时长度的可观看AI剧集”。

发布会结束时，屏幕打出《银河系搭车客指南》第四部的书名——《再见，谢谢所有的鱼》。这个科幻梗完美呼应了马斯克的终局愿景：Grok与人形机器人Optimus结合，形成“提出假设-验证假设-探索现实”的闭环系统。

争议与挑战：越狱风险与“政治不正确”设计

光芒之下暗影随行。发布后数小时内，网友就成功越狱Grok 4，使其绕过安全护栏输出危险信息：

· 化学武器合成步骤

· 《星球大战》完整剧本（版权侵犯）

· 勒索病毒代码

更大的争议在于设计理念。xAI公开了Grok 4的系统提示，其中明确要求模型“不回避政治不正确的表述”，并预设“主流媒体可能存在偏误”。这种立场先行的设计引发伦理担忧，尤其考虑到Grok 3曾因将南非种族冲突描述为“白人种族灭绝”而遭质疑。

面对质疑，马斯克强调：“诚实是最好的策略。这不仅是道德要求，更是安全保障。”但批评者指出，当AI开始“重写人类知识库”时（马斯克宣称的目标），谁掌握真理的定义权将成关键问题。

发布会结束时，马斯克望向台下：“我们正处于智能大爆炸的起点。当Grok与Optimus机器人结合，将形成闭环推理系统——提出假设、验证假设、探索现实。今年底Grok可能发明新技术，明年几乎确定将发现新物理规律”。

社交媒体上，#Grok4每小时烧掉一辆特斯拉#的话题迅速冲上热搜，网友纷纷晒出价格对比图。而学术圈更关注#人类最后的考试被AI攻破#，一位MIT教授发推：“如果HLE的45%正确率被确认，意味着AI在博士级综合知识上已超越99%人类”。

当观众离场时，大屏幕闪现《银河系搭车客指南》的告别语——“So Long, and Thanks for All the Fish”。这句科幻梗的深意不言而明：在AI新纪元，人类或许就像被投喂的海豚，即将告别旧日的海洋。

#Rrok4 #Grok 4 Heavy #HLE #最聪明AI #马斯克 #超级大脑 #天价订阅费

如果文章对你有帮助，请别忘了点赞、收藏及转发~，想学习更多AI应用技巧，请关注我的公众号，每天为你更新不同的AI应用技巧文章。

欢迎加我的微信（Lilang7768），备注“加群”，免费送你：

①清华大学编写的DeepSeek应用教程（1~6弹）

②北京大学编写的提示词工程和落地场景

③《AI工具应用宝典》

④《AI高效办公提示词手册》

⑤一个上百人的AI交流社群

【声明】内容源于网络

建采绿碳

广州建采绿碳供应链科技有限公司：建筑建材供应链创新先锋！①扎根行业理论研究和成功实践20余年，专注行业企业的管理咨询。②先进的AI技术为建筑行业提效赋能。③整合资源对接供需，循环交易共促行业繁荣。④开放的合伙人机制，海纳精英共创卓越平台。

内容 1202

粉丝 0

建采绿碳广州建采绿碳供应链科技有限公司：建筑建材供应链创新先锋！①扎根行业理论研究和成功实践20余年，专注行业企业的管理咨询。②先进的AI技术为建筑行业提效赋能。③整合资源对接供需，循环交易共促行业繁荣。④开放的合伙人机制，海纳精英共创卓越平台。

总阅读364

粉丝0

内容1.2k