大数跨境

人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神

人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神 新智元
2026-03-19
3

新智元报道

编辑:KingHZ

【新智元导读】xAI华人高管潮水般离开时,所有人以为它要凉,结果Grok Imagine突然三杀登顶!

华人联创快跑光了的xAI,突然迎来重大利好:Grok Imagine在DesignArena全球AI视频排行榜斩获三项第一——视频生成竞技场(Elo 1337)、图像转视频(Elo 1298)和视频编辑(Elo 1291),大幅领先谷歌Veo 3.1、OpenAI Sora及Kling等主流模型。

排行榜「三连冠」

什么让Grok Imagine这么牛?

DesignArena是全球AI视频模型的公开评测平台,采用真人用户盲选+Elo评分机制(类似国际象棋评级),真实反映模型在实际应用中的表现。

  • 视频生成竞技场:Elo 1337,领先第二名33分。支持文生视频,如输入“一只猫在月球上跳舞”,即可生成带音效的流畅短片。
  • 图像转视频:Elo 1298,超越Veo 3.1、Kling与Sora。可将静态图智能转化为动态场景,如风景照生成风吹树摇效果。
  • 视频编辑:Elo 1291,支持物体替换、风格迁移、片段延长等操作,平均耗时仅1分5秒,效率显著优于竞品。

高效泛化:不拼参数,重在结构

Grok Imagine并非依赖超大规模参数堆砌,而是通过创新架构实现“高效泛化”——在质量速度与成本间取得最优平衡。

生成带音频的视频成本仅为4.20美元/分钟,远低于Veo(12美元)和Sora(30美元)。

自2025年8月发布以来,其迭代速度极快:从初期简单图像生成,迅速拓展至复杂视频任务;日均生成量已超过所有竞争对手总和。

团队由多模态AI专家领衔,如Omni团队负责人Haotian Liu,聚焦让AI真正理解场景逻辑,而非仅模仿表层内容。

xAI的Omni团队负责人:Haotian Liu

行业地震:从「蛮力时代」到「智慧革命」

在OpenAI Sora、谷歌Veo、Kling等巨头主导的AI视频赛道中,Grok Imagine以小而精的路径实现突围,证明AI进步无需依赖算力军备竞赛。

在Artificial Analysis基准测试中,Grok Imagine同样包揽文本转视频与图像转视频双榜首,推动行业重心从“模型越大越好”转向“结构更精妙、推理更可靠”。

从2025年7月仅支持6秒视频,到2026年1月开放API接口,半年内完成从原型到工业级产品的跨越,进度堪比SpaceX火箭回收节奏。

对普通用户与企业的意义

对个人创作者:小博主制作产品演示视频,几分钟即可完成,无需专业剪辑;

对企业用户:营销视频、培训动画实现自动化生产,成本大幅降低;

在垂直领域:已与特斯拉协同,支持车载AI实时分析仪表盘画面,并为Optimus机器人生成训练数据。

更深层影响在于加速AGI演进——AI正从工具升级为创意伙伴,理解意图、生成个性化内容,推动视频创作门槛降至“发短信”级别。

当前局限包括单次输出限15秒、复杂物理场景仍需优化,但其快速迭代能力与工程务实性,已重新定义AI视频的技术范式。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 15045
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读143.2k
粉丝0
内容15.0k