鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI
Scaling Laws不死!
前有Ilya称Scaling遭遇瓶颈,后脚DeepMind CEO哈萨比斯便公开力挺Scaling Law:
Scaling有用,而且AGI必须用。
哈萨比斯此番表态并非空谈。今年谷歌凭借Scaling Law实现强势反弹,Gemini 3全网爆火即为明证。
在Axios AI+峰会上,他进一步披露了Scaling Law的起源、演进路径及未来12个月AI关键趋势:
Scaling Law最早的发现者不是OpenAI,是DeepMind。
单靠Scaling Law,也有可能达成AGI。
明年世界模型依旧重中之重。
Gemini的未来是通用万能助手。
该观点在𝕏上引发热议:一方认为Scaling仍有巨大潜力;另一方则质疑其可持续性。
Scaling在实现AGI上的关键作用
公认Scaling Law开山之作是2020年OpenAI研究,但哈萨比斯指出,DeepMind早在2017—2018年就已在内部开展相关探索,当时称其为“Chinchilla Scaling Laws”。
该发现未立即公开,而是作为核心方法论指导后续研发,推动DeepMind从Gemini 1.0快速迭代至3.0,充分体现工程化落地能力。
哈萨比斯强调:Scaling是AGI不可或缺的关键组成部分;当前尚未触达理论极限,持续扩大规模仍是必要路径;甚至可构成AGI系统主体。
他也指出,除Scaling外,AGI还需一两个如Transformer或AlphaGo级别的范式突破,预计时间窗口为5到10年。
展望未来12个月后的AI
哈萨比斯提出以下四大重点方向:
1、完整的多模态融合
以Gemini为基座,已实现图像、视频、文本、音频的无缝理解与生成。下一阶段将强化跨模态推理与创造力,成为主流模型演进核心。
2、视觉智能的突破
以Nano Banana Pro为代表的新一代图像模型,展现出对结构化视觉信息的高精度理解能力,后续将拓展至分析推演、故事生成与分步视觉推理。
3、世界模型的普及
继Genie 3上线后,用户可生成长达一分钟、支持自由交互的视频场景。世界模型已成为李飞飞、LeCun及DeepMind共同聚焦的核心赛道,明年将持续升温。
4、Agent变得可靠
当前Agent尚无法稳定承接复杂任务,但哈萨比斯预测:一年内将显著提升可靠性,向“可交付委托任务”迈进。Gemini终极定位是通用万能助手。
Gemini 3已展现三大跃升:响应更简洁、可温和纠偏、支持一键生成商业级游戏(数小时内完成)。这印证其基座架构优势——能精准理解高层指令并输出高保真细节。
下一代Gemini将覆盖更多终端设备(眼镜、手机等),深度融入工作与生活场景,使用频次将趋近智能手机。
总之,Scaling Law仍是当前通往AGI最坚实、最可扩展的技术路径;而多模态、视觉智能、世界模型与可靠Agent,将共同定义未来一年AI演进主轴。

