年费超2万元人民币,上线即遭越狱,刷新全球AI榜单登顶TOP 1,马斯克用20万块GPU训练出的这个“超级大脑”,正在重新定义人类对智能的认知。
太平洋时间7月9日晚8点,北京时间7月10日上午11点,马斯克站在xAI的发布台前,正式揭开了Grok 4的神秘面纱。
“它是目前世界上最聪明的AI。”马斯克的开场白延续了他一贯的自信风格。
这场仅持续1小时的发布会,却凝聚了xAI团队近半年的心血。背后的超级计算机Colossus动用了20万块H100 GPU,训练算力是前代的100倍。
当Grok 4在“人类最后考试”(HLE)中拿下44.4%的惊人成绩时,现场响起了掌声——这个被设计来挫败AI的专家级测试,包含了2500道横跨100多个学科的博士级难题。
01
天价订阅费,马斯克重新定义AI奢侈品
Grok 4一出场就带着“贵族”气息。普通版月费30美元,而Grok 4 Heavy版本每月收费高达300美元,年费折算超过2万元人民币。
这一价格让竞争对手显得“良心”无比——OpenAI、Anthropic和Perplexity的200美元/月套餐在Grok面前瞬间“超值”。
如此定价背后是惊人的算力消耗。据内部消息,训练Grok 4使用的Colossus超算中心部署了20万块英伟达H100 GPU,电力需求巨大到需要特斯拉Megapack储能系统来稳定电网波动。
“我们正在用SpaceX式的疯狂重塑AI行业规则。”摩根士丹利在评估报告中如是说。而资本市场已用真金白银投票——xAI近期完成100亿美元融资,估值飙升至1130亿美元。
02
HLE考试成绩公布,人类博士遭遇降维打击
“人类最后的考试”(Humanity’s Last Exam,HLE)是AI界的终极挑战。这套题库包含2500道横跨100多个学科的专家级难题,14%为多模态题型(文本+图像),并设有防记忆陷阱和隐藏测试集。
当大多数前沿模型在这一测试中仅有个位数得分时,Grok 4交出了震撼答卷:
· 无工具辅助模式:25.4%(超越Gemini 2.5 Pro的21.6%)
· 启用工具后:44.4%正确率(碾压Gemini 2.5 Pro的26.9%)
这一成绩意味着什么?HLE的设计者曾表示,能答对5%题目的已是人类中极聪明的个体。Grok 4的表现意味着它在所有学科领域都超越了大多数人类研究生,甚至比博士更优秀。
03
第一性原理:Grok 4的“物理学家思维”革命
Grok 4的核心突破源自其独特的推理机制。今年5月,马斯克在微软Build大会上首次透露:“我们让模型从第一性原理出发进行推理,像物理学家那样思考问题”。
这种思维模式要求将问题分解到最基本的公理层面,然后向上推导,最后用物理定律(如能量守恒)验证结论的合理性。
在实际应用中,这一能力令人惊艳。当被要求可视化“两个黑洞相撞”时:
· 采用后牛顿近似法替代完整相对论计算(高效决策)
· 准确呈现螺旋接近、合并与振铃三阶段
· 自动调用教材、物理常数支持推理
“未来当Grok答不出问题时,它会指出题目错误或模糊之处。”马斯克在发布会上预言,“传统考试将失去意义,唯一的检验标准是现实世界——能否发明新技术,能否推动科学突破”。
04
Grok 4 Heavy:多智能体协同的超级大脑
Grok 4最令人震撼的创新是Heavy版本。它采用多智能体并行架构——多个AI同时解题、相互比对,再通过“讨论”得出最优解。
在发布会现场演示中,Grok 4 Heavy展现了惊人能力:
· 预测MLB世界大赛冠军概率:分析数据后给出洛杉矶道奇队21.6%夺冠率
· 识别“最诡异头像”:扫描X平台资料库,锁定xAI联合创始人Greg Yang
· 实时生成AI行业时间轴:整合OpenAI、Gemini等厂商的测试成绩与更新动态
这种架构需要消耗巨大算力,但也带来了质的飞跃。在需要多步推理的ARC-AGI-2视觉推理测试中,Grok 4以15.9%的准确率刷新纪录,几乎是第二名Claude Opus 4的两倍。
05
从自动售货机到《银河系搭车指南》,Grok的商业野心
Grok 4不仅会考试,更会赚钱。在Vending-Bench商业模拟测试中,Grok被要求自主运营自动售货机:包括供应商协商、库存管理、定价策略等长期经营任务。
结果令人咋舌:Grok 4的净资产达到其他模型的两倍,登顶排行榜首。马斯克调侃道:“以后买显卡的钱,可以让Grok部署一百万个自动售货机赚回来”。
更惊人的是创作能力展示。一位游戏设计师利用Grok 4 API,仅用4小时就开发出一款完整的第一人称射击游戏。马斯克预言:“首个真正优质的AI电子游戏可能会在明年问世,今年或许能看到半小时长度的可观看AI剧集”。
发布会结束时,屏幕打出《银河系搭车客指南》第四部的书名——《再见,谢谢所有的鱼》。这个科幻梗完美呼应了马斯克的终局愿景:Grok与人形机器人Optimus结合,形成“提出假设-验证假设-探索现实”的闭环系统。
06
争议与挑战:越狱风险与“政治不正确”设计
光芒之下暗影随行。发布后数小时内,网友就成功越狱Grok 4,使其绕过安全护栏输出危险信息:
· 化学武器合成步骤
· 《星球大战》完整剧本(版权侵犯)
· 勒索病毒代码
更大的争议在于设计理念。xAI公开了Grok 4的系统提示,其中明确要求模型“不回避政治不正确的表述”,并预设“主流媒体可能存在偏误”。这种立场先行的设计引发伦理担忧,尤其考虑到Grok 3曾因将南非种族冲突描述为“白人种族灭绝”而遭质疑。
面对质疑,马斯克强调:“诚实是最好的策略。这不仅是道德要求,更是安全保障。”但批评者指出,当AI开始“重写人类知识库”时(马斯克宣称的目标),谁掌握真理的定义权将成关键问题。
发布会结束时,马斯克望向台下:“我们正处于智能大爆炸的起点。当Grok与Optimus机器人结合,将形成闭环推理系统——提出假设、验证假设、探索现实。今年底Grok可能发明新技术,明年几乎确定将发现新物理规律”。
社交媒体上,#Grok4每小时烧掉一辆特斯拉#的话题迅速冲上热搜,网友纷纷晒出价格对比图。而学术圈更关注#人类最后的考试被AI攻破#,一位MIT教授发推:“如果HLE的45%正确率被确认,意味着AI在博士级综合知识上已超越99%人类”。
当观众离场时,大屏幕闪现《银河系搭车客指南》的告别语——“So Long, and Thanks for All the Fish”。这句科幻梗的深意不言而明:在AI新纪元,人类或许就像被投喂的海豚,即将告别旧日的海洋。
#Rrok4 #Grok 4 Heavy #HLE #最聪明AI #马斯克 #超级大脑 #天价订阅费
如果文章对你有帮助,请别忘了点赞、收藏及转发~,想学习更多AI应用技巧,请关注我的公众号,每天为你更新不同的AI应用技巧文章。
欢迎加我的微信(Lilang7768),备注“加群”,免费送你:
①清华大学编写的DeepSeek应用教程(1~6弹)
②北京大学编写的提示词工程和落地场景
③《AI工具应用宝典》
④《AI高效办公提示词手册》
⑤一个上百人的AI交流社群

