大数跨境
0
0

诺奖得主、谷歌AI掌门人泼冷水:所谓“博士级智能”纯属无稽之谈

诺奖得主、谷歌AI掌门人泼冷水:所谓“博士级智能”纯属无稽之谈 智东西
2025-09-15
22
导读:AGI有望开启一场新的文艺复兴。

AGI有望开启一场新的文艺复兴。
编译 |  陈骏达
编辑 |  李水青

智东西9月15日报道,谷歌DeepMind的AI应用Gemini凭借图像编辑模型“Nano Banana”的病毒式传播,近日登顶美区苹果App Store免费应用榜,超越ChatGPT,成为当地最受欢迎的应用之一。

这场现象级爆火背后的推动者——2024年诺贝尔化学奖得主、谷歌DeepMind创始人兼CEO Demis Hassabis,在All-in峰会上分享了从爆款产品到AGI未来的深度思考,内容涵盖世界模型、机器人技术、科学智能、创作未来及能源等多个前沿方向。

DeepMind:谷歌的“AI引擎室”

Hassabis将谷歌DeepMind定位为驱动谷歌与Alphabet的“AI引擎室”。Gemini、Genie、Veo等核心模型已深度集成至谷歌各类产品中。其中,Genie 3通过“逆向工程”学习物理规律,未来或将推动机器人技术革命。基于Gemini开发的机器人模型,正朝着打造“机器人安卓系统”这一通用平台迈进。

他认为当前部分AI系统宣称达到“博士级智能”是“无稽之谈”,强调真正的通用人工智能需具备跨领域一致性和创造性思维。目前AI仍缺乏提出原创理论的能力,实现AGI还需1-2个关键技术突破。

▲Demis Hassabis(右)接受采访(图源:Youtube)

Hassabis领导的AI药物发现公司Isomorphic进展迅速,预计明年进入临床前研究阶段,目标是将新药研发周期从数年缩短至数周。他自上世纪90年代起深耕AI与科学智能,坚信AGI将成为科学探索的终极工具,开启科学黄金时代乃至新一轮文艺复兴。

诺奖揭晓前10分钟才知情

Hassabis回忆获诺奖时的情景:“接到瑞典来电的那一刻非常超现实。他们在公布前约十分钟通知我,这通电话是每个科学家的梦想。”他形容在瑞典参加颁奖周的经历宛如奇迹,尤其震撼于在诺贝尔奖签名簿上与爱因斯坦、居里夫人、费曼等科学巨匠并列署名。

尽管外界早有呼声,但他坦言诺奖评选保密严密,影响显现常需二三十年,因此获奖对他而言仍是巨大惊喜。

DeepMind的定位与团队规模

作为谷歌DeepMind负责人,Hassabis介绍该部门由原谷歌与Alphabet内部AI研究团队整合而成,现已成为整个公司的“AI引擎室”。其主力模型Gemini已广泛应用于AI概览、AI模式、Gemini应用、Workspace、Gmail等产品,服务数十亿用户。

团队目前约有5000人,其中80%以上为工程师和博士研究员,兼具前沿科研能力与大规模落地经验。

Genie通过“逆向工程”学习物理规律

主持人:Genie 3世界模型有何突破?
Demis Hassabis:Genie生成的是可交互的实时3D环境,用户通过方向键操控,画面中的每一个像素都即时生成。例如,当玩家转头看向右侧,那部分场景才被创建;回头后之前留下的笔迹依然存在,体现高度一致性。
用户可输入“穿鸡仔戏服的人”或“水上摩托”等提示,系统会立即加入对应元素,展现强大的动态生成能力。

自主推理出物理规则

主持人:传统游戏依赖预设渲染引擎,Genie如何做到即时生成?
Demis Hassabis:Genie通过对数百万条YouTube视频和现实素材的学习,对物理学进行“逆向工程”,自主推演出光线反射、材质流动、物体互动等物理规律。尽管尚不完美,但已能提供持续一两分钟的稳定交互体验,支持操控人类、狗、水母等多种实体。
这一能力源于多模态训练,结合真实视频与游戏引擎合成数据。相比90年代手工编写图形与物理引擎的艰难,如今模型可轻松实现实时复杂渲染。

通往机器人技术的关键路径

主持人:这类技术将导向何方?
Demis Hassabis:Gemini从设计之初就是多模态模型,能处理图像、音频、视频等多元输入输出。我们认为真正意义上的AGI必须理解物理世界,而不仅是语言或数学抽象。
Genie、Veo等项目正是为了训练AI掌握世界动态与物理逻辑。若模型能生成交互式环境,说明它已部分理解现实运行机制,这对机器人技术至关重要,也将赋能AI眼镜等日常设备对环境的理解能力。

打造“机器人领域的安卓系统”

主持人:能否构建通用视觉-语言-行动(VLA)模型,让机器人听懂指令并执行任务?
Demis Hassabis:可以。Gemini Live已支持手机摄像头观察现实世界,理解周围环境。未来可集成至眼镜等便携设备,成为日常助手,甚至嵌入地图等功能。
我们已推出Gemini机器人模型,基于Gemini并用机器人数据微调。今年夏季演示中,双机械臂可在桌面环境中响应语音指令,如“把黄色物体放进红色桶里”,实现语言到动作的转化。
这种多模态能力超越传统专用控制模型,使机器人既能理解世界,又能与人自然交互。我们的战略之一是打造“机器人领域的安卓系统”,提供通用软件基础,促进行业爆发式发展。同时也在探索特定机器人设计的端到端垂直整合。

人形与专用机器人将共存

主持人:人形机器人是否合理?
Demis Hassabis:两种形态都将存在。工业领域适合专用机器人,如实验室或生产线按任务优化结构。但在通用或个人场景中,人形机器人更具优势。
我们的世界为人形设计——台阶、门道、家具皆适配人体。让机器人适应现有环境,比改造世界更高效。因此在家庭服务等场景,人形机器人可能至关重要,但专用形态仍有市场空间。

算法仍处早期,硬件需规模化突破

主持人:未来五到七年机器人数量会爆发吗?
Demis Hassabis:我们正处于机器人技术早期,类似PC的DOS时代。接下来几年可能出现“Wow”时刻,但算法仍需提升。
通用机器人模型需更可靠、更深入理解环境。硬件方面,一旦进入大规模生产阶段,设计迭代将变慢。因此需谨慎选择量产时机,避免被新一代更灵活可靠的机型迅速淘汰。

AGI将成为科学探索的终极工具

主持人:AI在科学领域有哪些突破潜力?
Demis Hassabis:用AI加速科学发现是我投身AI的初心,也是最重要的应用方向。AGI若构建得当,将成为科学探索的终极工具。
DeepMind已在多个领域取得成果:AlphaFold破解蛋白质折叠难题;AI用于材料设计、核聚变控制、天气预测,甚至解决数学奥赛问题。同一系统经微调即可应对不同复杂挑战。
但我们仍处于表层。当前AI缺乏真正的创造力,无法像人类科学家那样提出新猜想或理论。这将是衡量AGI实现的核心标准之一。

创造力的本质:类比与直觉飞跃

主持人:你如何定义创造力?
Demis Hassabis:创造力体现为历史伟大学者与艺术家所展现的直觉性飞跃,常通过类比推理实现。例如测试AI能否在知识截止于1901年的情况下,独立提出狭义相对论。若能做到,才意味着接近AGI。
AlphaGo曾下出第37手这样的创新招法,但当前AI尚无法创造出围棋这样兼具美感与逻辑的全新游戏体系,这正是其缺失之处。

“博士级智能”尚未实现

主持人:OpenAI等人称AGI即将来临,你认同吗?
Demis Hassabis:关键在于AI能否复现顶尖科学家的直觉飞跃,而非仅做渐进改进。伟大科学家与优秀者的区别在于创造力——能从其他领域发现模式并迁移应用。
当前系统缺乏此类推理能力。所谓“博士级智能”是无稽之谈——某些任务或达博士水平,但远未实现跨领域一致表现。真正的AGI不应在高中数学或计数问题上出错。
我认为还需5到10年,且需1-2个关键突破。另一缺失能力是持续学习——系统无法在线吸收新知识或调整行为。扩大模型规模或可缓解,但根本性进步仍待突破。

模型性能仍在快速提升

主持人:大模型性能是否趋于收敛?
Demis Hassabis:我们并未观察到停滞。Genie、Veo、Nano Banana等模型持续展现显著进步。

Nano Banana推动创作普惠化

Nano Banana在图像编辑领域表现突出,其核心优势在于一致性——能在修改局部的同时保持整体协调,支持用户通过迭代达成理想结果。这种自然交互方式预示创意工具的未来。
过去使用Photoshop需学习复杂操作,如今普通人只需描述需求即可完成去背、修复等任务,极大降低创作门槛。
与此同时,我们也与顶级创作者合作优化工具。如导演达伦·阿伦诺夫斯基团队使用Veo制作电影,反馈帮助我们提升功能。这些工具不仅普惠大众,更能十倍百倍提升专业用户的生产力。
未来娱乐或将分化:一方面,用户可定制个性化内容,如按音乐风格生成歌曲或基于电影构建游戏;另一方面,顶级创意者仍将主导高质量叙事体验,扮演“世界编辑者”角色。Genie等技术正逐步实现这一愿景。

聚焦AI药物发现,明年进入临床前研究

主持人:你在Isomorphic投入多少时间?
Demis Hassabis:投入大量精力。该公司由DeepMind分拆,致力于利用AlphaFold技术革新药物发现。
蛋白质结构解析只是起点,Isomorphic正开发多项关联技术,旨在设计高精度、低副作用的靶向化合物。目标是将药物研发周期从数年缩短至数周。
目前正构建技术平台,并与礼来、诺华等药企深度合作。内部项目预计明年进入临床前期研究,后续由合作伙伴推进临床试验,重点布局癌症、免疫学等领域。

混合模型:确定性与概率性协同

主持人:如何平衡确定性与概率性模型?
Demis Hassabis:我们采用混合架构。以AlphaFold为例,融合神经网络的概率学习与化学物理规则的确定性约束。
生物化学数据稀缺,直接学习效率低。将已知科学原理(如键角、原子不可重叠)作为硬约束,可大幅提升学习效率。
难点在于无缝整合学习模块与人工规则模块。参考AlphaGo做法:神经网络识别模式,蒙特卡洛树搜索进行规划。
主持人:这种架构能否通向AGI?
Demis Hassabis:混合系统是阶段性路径。一旦跑通,下一步是反哺知识至学习组件,尽可能实现端到端训练。
正如AlphaZero抛弃人类棋谱与专用知识,完全自我对弈,最终通吃所有棋类。未来AGI也可能走类似路线:先借助混合系统突破,再回归纯学习范式。

AGI将开启科学的黄金时代

主持人:AI能源消耗是否会持续飙升?
Demis Hassabis:两种趋势并存。前沿研究需更大模型实验新想法,导致能耗上升;但服务端模型正变得越来越高效。
我们在内部广泛应用蒸馏等技术,使小模型继承大模型能力。过去两年,同等性能下模型效率提升达10至100倍。
长期来看,AI将在电网优化、新材料研发、新能源开发等方面创造巨大价值,其对能源与气候的正面贡献将远超当前消耗。
主持人:请描绘10年后的世界。
Demis Hassabis:10年在AI领域极为漫长。若能实现AGI,将迎来科学的新黄金时代,一场新的文艺复兴。能源、医疗、材料等领域将发生深刻变革,人类社会将全面受益于这项技术。
来源:Youtube @allin
【声明】内容源于网络
智东西
各类跨境出海行业相关资讯
内容 10858
粉丝 0
智东西 各类跨境出海行业相关资讯
总阅读58.5k
粉丝0
内容10.9k