大数跨境
0
0

AI 领域急需解决的巨大难题 | Sam Altman最新访谈实录

AI 领域急需解决的巨大难题 | Sam Altman最新访谈实录 数智科技产业研究
2025-11-17
8
导读:我们仍处于这场变革的序章
图片


11月12日,OpenAI CEO Sam Altman 接受Stanford Online的访谈,本次对话探讨了深入探讨了 AI 领域急需解决的巨大难题、AI 系统防护的紧迫性、AI 对软件开发的重塑,以及 AI 将如何颠覆计算机科学教育等话题。


Sam Altman指出,AI 是当下最重要的技术前沿,其影响力将远超以往的技术变革,并深度融入未来生活的方方面面。 AI 安全(特别是系统防护)是一个被严重低估且急需人才投入的领域。


Altman 提出,真正的“超级智能”可能并非某个单一的 AI 大脑,而是人类文明与 AI 共同构建、不断累积迭代的庞大“支撑体系”。


他认为,计算机科学教育需要彻底改变。我们学的东西总比最有用的前沿知识落后十年,相比学习 C++ 或编译器,未来更应教授学生“如何在一个有 AI 辅助的世界里编程”。


01 

AI领域急需解决的重大问题


在你看来,AI 领域目前最值得人们去研究的、悬而未决的重大问题有哪些?

很多人都在谈论训练数据的问题,担心我们的训练数据即将耗尽,你是否认为这是一个急需投入更多研究的领域?

我们究竟是只想复制人类的能力,还是试图超越人类的能力?


Sam Altman: 依然有很多。我认为我们已经明确了深度学习这一股强大的驱动力,也见证了它的巨大潜力,但我认为我们仍处于这场变革的序章。我们构建这些系统的方式每年都在飞速进步,而且我认为这种势头将持续很长时间。数据效率仍然是一个急需解决的巨大难题,这也是目前人类与这些系统相比,依然具有显著优势的地方。


我认为,在我们目前区分预训练和强化学习这些概念的方式中,似乎还有一些新东西有待发掘。不过,要谈论我们仍然未知的东西,恐怕可以聊上很久。我们掌握了一项“魔法”,就是这种能够学习的算法,并且我们还在不断探索新方法,用它来完成更令人惊叹的任务。ChatGPT 推出至今也才两年半,如果你现在回去用最初的那个版本,会发现它其实相当差劲。


进步的曲线依然非常陡峭,但摆在我们面前的问题清单和未知领域的版图依然无比庞大。我们要构建一个能够自主发现新科学的系统,这对我个人而言至关重要,要实现这个目标,还有漫长的路要走。


(关于训练数据耗尽)这其实是换一种方式在说数据效率问题。如果我们能从每一份数据中学到远比现在多得多的知识,那么数据就谈不上耗尽。人类是如何做到仅凭感官就能学习的?我非常想知道答案。人类只需要几个数据点就能进行泛化,而那些系统,出于某种原因,需要海量的数据点才能做到泛化。


(关于复制还是超越人类)我认为在许多方面,这些系统已经超越了人类的能力。虽然不是所有方面,但它们在某些特定任务上的表现绝对是远超人类的。从某种意义上说,人类文明的发展史才是关键所在。真正存在的“超级智能”并不是某个天才的大脑,而是我们所有人共同构建的庞大支撑体系、技术树和工具链。它包含了所有日积月累的知识、人造产物和层层递进的工具链。没有哪个人能凭一己之力,从挖矿石开始一直到造出电脑。这背后需要海量的积累。但作为一个集体,人类社会却能完成这样不可思议的壮举。我们做出科学发现,用新方式操纵物质,完成各种了不起的成就。


从某种更深的层面上说,AI 也将成为这个支撑体系的又一个贡献者,它存在于任何个体神经网络之外,无论是人类的还是人工智能的。如果 AI 某天自主发现了新的物理学定律,然后人类利用这一定律做出了新事物,那我们是会觉得 AI 成为了超级智能?还是会觉得这个支撑体系被搭建得更高了?我不知道答案。也许这一天不远了。


02 

为什么 AI 是当下最值得投身的领域


假设现在有一个计算机科学背景学生,他同时在考虑一个 AI 公司或 AI 初创公司的 offer,以及一个来自金融或生物科技公司的 offer,你会给这个人什么建议?他该如何决定选择哪个领域?


如果我们快进五年、十年,甚至二十年,你认为 AI 会像今天这样炙手可热吗?还是说,它会在某个时刻达到顶峰,然后被其他某个领域所取代?


Sam Altman: 首先,你必须选择你内心最渴望做的事,选择那些让你充满激情的伙伴,去解决那个能让你产生共鸣的问题。我认为,这比任何泛泛而谈的建议都重要。但如果你非要一个通用的建议,那就是:在人类历史的任何特定时期,真正值得全力推动的科学前沿领域,永远只有那么几个。


在不同的历史阶段,这个前沿曾经是物理学、生物学、计算机科学的某些分支,或者是互联网的建设。而现在,我认为最重要的前沿就是拓展我们对人工智能的认知、理解和应用部署。我认为这是当今最重要的趋势,也可能是我们这一代人所面临的最重要的趋势。这甚至可能是未来更长一段时间里最重大的事件。能够生活在这样一个巨大颠覆性变革的时代并投身其中,是极其幸运的。我带有偏见但又通用的建议是:你现在有机会去触碰你此生所能遇到的最伟大的事业,你应该毫不犹豫地投身其中。AI 不仅是当下最核心的发展技术,它还可能成为对其他所有领域产生最广泛、最深远影响的技术。


(关于 AI 的未来热度)被取代是早晚的事,但问题是需要多久。未来世界对 AI 的依赖会更深,但也许那时人们已经习以为常,不再用今天的眼光去看待它。我记得,App Store 是哪年上线的?好像是 2008 年?在那之后的几年里,所有人都在谈论“我要做个移动优先的某某”、“我是一家移动公司”。如果你再往前倒推 10 年,回到互联网泡沫时期,我听说当时每个人,那是“.com”泡沫,每个人都在谈 .com,那是当时最火的东西。


它们都曾有过一段被疯狂追捧和高度聚焦的时期。但没过多久,人们就不再谈论自己是不是一家“互联网公司”了,因为每家公司都有自己的互联网战略。在 App Store 登陆 iPhone 仅仅几年后,也没人再谈论自己是不是“移动公司”了,因为如果你不是,那才叫奇怪。我希望五年或十年后,AI 也能如此,再没有人谈论自己是不是一家“AI 公司”。我们只是理所当然地认为所有产品和服务都应该非常智能。我非常期待那样的世界。那可能意味着 AI 的热度不如今天,但它的力量将比现在强大得多,并更深度地融入我们的生活。


03 

培养“AI 原住民”:未来最重要的技能是“运用”


你会如何帮助下一代为那个 AI 无处不在、理所当然的世界做好准备?


Sam Altman: 他们将能做到一些在今天看来匪夷所思的事情。当我还是个孩子时,计算机是非常神奇的东西。我比我父母那辈人更擅长使用它们。虽然那时计算机也不算新事物,但远没有像今天这样融入生活。我想我的父母当时也不知道该如何帮我为那个“计算机世界”做准备,他们能做的,只是说:“这东西看起来很重要。你似乎很感兴趣,我支持你。”


我不知道除了这些,我还能为下一代做什么,我只能告诉他们:“AI,我认为,将至关重要。你要学会使用它。有了它,你能做到的事情将远超没有它的我,这非常棒。如果你愿意,我希望你未来的成就远超于我。” 我想这就是答案。当然,还有些更宏观的事情要做:教育孩子保持韧性、适应力、好奇心和创造力。但具体到做法上,我们只需相信:有了新工具,人类就能成就更多。我们要鼓励孩子去熟练掌握这些工具,而且他们很可能天然就很擅长。


AI 的普及是否会像汽车或计算机一样,大众会习惯于使用 AI,但只有一小部分人会真正理解深度神经网络的工作原理,以及如何推动它去创造新事物?


Sam Altman: 必然如此,而且我认为这很棒。人们在完全不了解计算机工作细节的情况下,依然用它做出了不起的成就。这正是劳动分工和我们共享的“进步工具链”的运作模式。我认为,未来最重要的技能将不是构建 AI 的能力,而是运用 AI 去成就非凡事业的能力。


就像今天,OpenAI 的研究人员或许并不完全清楚如何从零开始造一台计算机,但他们知道如何利用计算机去创造 AGI。这就是下一个急待构建的、极具价值的“层”。而在 AGI 之上,又会出现新的事物有待构建,那时会有人去攻克它,而他们可能根本不需要知道如何训练一个神经网络。


我刚才还期望你会说,深入了解技术并理解其工作原理是非常必要的。对于今天的计算机科学家而言,了解深度神经网络的工作原理、知道如何训练它们,是很有价值的。但你是说,从更长远看,这些技术终将成为我们工具箱里的一个基础工具?


Sam Altman: 对某些人来说,的确如此。我认为在目前,这也许是世界上最有价值的技能。即便在未来,它依然很有价值。我的观点是,当我们试图展望 10 年、20 年后,届时可能会出现更多我们现在无法想象的、更令人兴奋的新事物。


(关于 CS 技能的长期价值)我认为是这样。未来我们都会默认它就是可用的。我就不知道怎么制造计算器。也许我使劲想想能做到,但这得掏空我所有关于电子工程学科的记忆。我从不去想怎么造计算器,但我仍然频繁地使用它。它是一个工具,让我能去思考更高层次的问题,或从事更有影响力的事情。我就不知道如何制造一台计算机。


04

AI 系统防护为何“最值得研究”


我们这门课的核心是 AI 系统的安全。课程中,我们讨论了各种攻击,比如提示注入、对抗性样本和模型提取,以及相应的防御。在 AI 众多的子领域中,你如何看待 AI 安全?你认为 AI 安全是一个值得投入的领域吗?


Sam Altman: 我认为这是最值得研究的领域之一。我们正迅速进入一个新时代,过去人们常讨论的许多 AI 伦理安全问题,正以不同方式被重塑为 AI 系统防护问题。同时,鉴于这些模型的能力日益强大,如果我们想将它们广泛部署,它们面临的系统防护问题将变得极其严峻。


你提到了许多我认为急需解决的重要领域。特别是对抗性鲁棒性,这个问题正变得日益严重。我还想补充一点,你之前也提到了,我最近一直在思考:现在有两项深受人们喜爱的技术,当它们结合在一起时,就带来了严峻的安全挑战。


第一,人们喜爱模型的个性化程度。ChatGPT 现在非常了解你;它会根据你的对话历史、你接入的数据和其他信息提供个性化服务。第二,你可以将这些模型连接到其他服务。它们可以访问网络,为你调用各种功能,提供帮助。


在这种情况下,我们最不希望发生的就是有人能从你那个无所不知的个人模型中窃取数据。在保守秘密方面,你姑且可以相信人类是理性的。你告诉配偶一些秘密,你大致能相信他们知道什么场合能对谁说。但模型在这方面还做不好。如果你告诉模型你所有的私人健康问题,然后你又用它去买东西,你肯定不希望那个电商网站了解到你所有的健康状况。要实现 100% 鲁棒性,这是一个极富挑战性的安全问题。


AI 系统防护很可能是当下被严重低估的一个领域。


Sam Altman: 的确如此。


关于 AI 安全还有另一方面,即“用 AI 提升安全防护”。比如 ChatGPT 在寻找软件 bug 方面表现惊人。你认为使用 AI 来测试软件,会是一个潜力巨大的增长领域吗?

这是一个人才们可以投入大量时间的潜在方向吗?


Sam Altman: 我们正开始在这方面投入更多工作。我认为,我们很快就会拥有一个“超人”级别的 AI 安全分析师,或者不管你怎么称呼它。


顺便说一句,这是双向的。你可以用它来保护系统,但我也认为它将对各种网络攻击产生重大影响。我也这么认为。


(关于这是否是个人才投入方向)是的。


05

AI Agent 将重塑开发流程


AI 会对整个计算机科学领域产生怎样的影响?我们看到开发者现在正用 AI 辅助编码,极大地提高了效率。你对未来两到五年,甚至十年后,软件开发会变成什么样子有什么看法?


假设我是一家公司,想开发一个推荐购书的 app。现在,我需要雇佣产品经理和一大批开发者。你认为未来这个流程会怎样变化?


这是否意味着开发者的生产力将极大提升,你只需要描述你想要什么,而不是去实际编写代码?


Sam Altman: 会和现在大不相同。我认为,未来软件开发主要会像是在和计算机对话。也许你提供的是伪代码,也许是更接近自然语言的描述。


(关于开发 app 的流程) 我想,要做出第一个版本,你可能只需要描述你想要的软件。AI 系统也许会思考一整夜,去编写和测试代码。第二天早上你醒来,你那个卖书的 app 就做好了。当系统变得越来越大、越来越复杂时,你就会有这些软件工程 AI Agent 在你的代码库  里巡视,帮你做事、写测试、提交代码。你甚至可以想象,公司里除了软件开发之外的许多其他工作流也可以被自动化。但在软件开发上,我认为我们已经有了一条清晰的路径,我们知道这将如何实现了。


所以,这基本上是让开发者的生产力极大提升。你只需要描述你想要什么,而不是像今天这样去实际编写代码。


Sam Altman: 我认为是这样。


06

我们学的东西比最有用的前沿知识落后了十年


作为教育者,我必须问:你认为五到十年后,计算机科学教育会是什么样子?今天我们教操作系统、教 C++、教编译器。五到十年后,我们该教什么?


Sam Altman: 我记得我上学时,坐在 106X 教室里,老师教我们怎么写排序算法之类的。我当时就在想:这很有趣,它在教我如何思考,但我不认为我这辈子还会再用到它。为什么不教我怎么写一个 web app 呢?那在当时是很前沿的。


我总觉得,我们学的东西比对我最有用的前沿知识落后了十年。我认为现在同样的情况又在发生。编写代码的方式在过去两年发生了巨变,在未来两年还会变得更多。在我看来,我们的课程设置,以及我们教授“CS 导论”或“编程导论”的方式,可能需要彻底改变了。


彻底改变?你的意思是,我们不应该再教 C++ 了吗?


Sam Altman: 某种程度上是。但我认为,教授这些内容的比例,相对于教授人们“如何在一个有软件工程 AI Agent 的世界里编程”的比例,后者的占比应该大大提高。


我很高兴我学了 C++。它确实有它有趣的地方。但如果我设想一下,一个未来能真正创造巨大价值的软件开发者,他的日常工作是怎样的,我敢打赌,那将和我们现在教授这门课的方式截然不同。


让我用这个论点来和你探讨一下:在小学,我们仍然要学加减乘除,尽管我们有计算器。我们学它只是为了储备知识。你认为学习操作系统和编译器也是一回事吗?


Sam Altman: 这很有趣。我记得小学时,有个老师对我说:“你必须学会基础加法。”我说:“可我们有计算器啊,为什么?”他们就说:“因为我让你学。”还是那个老师,非要我学草书,就是以前人写字的方式。我当时就很清楚,我以后绝对不会再用那玩意儿了。那简直太疯狂了,我就想:这不也没任何意义吗。


辨别哪些知识值得学、哪些不值得,似乎非常困难。话说回来,“学习如何学习”这个元技能本身是极具价值的。所以从某种意义上说,学习任何东西都有价值,因为你总能学到点别的。我很高兴我懂一些操作系统和编译器的工作原理。


但我认为,对大多数人来说,他们从中获得的价值是通用的元学习能力、大脑的锻炼和智力上的好奇心。未来,世界上需要深入理解如何构建一个伟大操作系统的人数,相对于那些需要真正理解如何使用 AI 创造我们尚无法想象的新事物的人数,前者的比例可能会下降。


你的意思是我们需要掌握的知识会不断变化,甚至到某个节点,我们连如何训练网络都不需要学了?


Sam Altman: 是的,因为你到时只需要告诉 AI:“去训练一个新网络,让它精通这个任务。”然后它就会做得很好。但就目前而言,我认为学习如何训练神经网络仍然非常值得。


07

 AI 会发明自己的编程语言吗?


这些代码生成器现在是用为人类程序员设计的语言(如 Java、Go 和 Rust)来编写代码。你认为未来我们会发明专门为 AI 代码生成器设计的新语言吗?还是说 AI 会为自己生成新语言?


Sam Altman: 我也在想这个问题。我猜,与人类兼容的特性非常重要。AI 能够编写代码,同时人类也能轻松阅读和修改它,这一点非常有价值。我猜,与人类兼容的编程语言,或者说人类易于阅读的语言,它们的重要性所延续的时间,将比从纯粹计算效率角度看的最优时间更长。可编辑性,这甚至比可读性更重要。


这很有趣。现在 AI 生成的代码 95% 是正确的,你总得去通读和修改。但也许几年后它将永远生成完美的代码,那时我们就不需要可读性了。但就目前而言,你的意思是,我们可能还是会坚持使用人类可读的语言


Sam Altman: 我认为是这样。但未来也可能不尽相同。


08

我们是否已接近技术路线图的终点?


我们是否已经找到了 AI 的正确架构?几年前,支持向量机和 GANs 曾风靡一时,现在的主角是 DNNs、Transformers 和 Stable Diffusion。这就是最终答案了吗?还是说,我们再等个两三年,一切又将再次改变?


这些新的 AI 架构和新想法,你认为它们会来自学术界、产业界(如 OpenAI、Google),还是开源社区的无名之辈?


Sam Altman: 我不知道转变的幅度会有多大,但我确定会转变。我希望它有所转变。如果架构不再演进,那才奇怪,保持变化会更有趣。我认为仍有重大的发现尚未完成。即使你对比一下最初被称为 Transformer 的东西和我们现在使用的版本,两者也已大不相同。但我敢赌,我们还可以走得更远、更远。我并不觉得我们已经接近技术路线图的终点。


(关于新架构的来源)我完全不知道,而我正喜欢这一点。根据我的经验,你根本无法预测这些创新来自何处。它只需要一个或一小群极具天赋的人朝着新的方向推进,而这可能发生在世界上任何地方、任何类型的组织或环境中。


09

能源消耗的“公平比较”


大家一直在问你关于能源消耗的问题。人脑完成所有功能大约只需要 20 瓦,而如今机器学习训练的消耗远超于此。你如何看待这种比较?


Sam Altman: 我认为这种比较并不公平。首先,我觉得我们得把人类 的散热系统和你所有的生命维持辅助系统都算进去,所以我们折中一下,算作 100 瓦。但你现在比较的是人类的推理成本和机器学习系统的训练成本。


如果我们把人类 20 年来以 100 瓦功率进行学习的消耗算上,再加上进化的“外循环”,以及进化压力为了塑造出你现在的大脑结构所经历的无数代人,我认为两者的能源数字就开始变得非常接近了。当然,GPT-4 在训练时,其瞬时功率远超于你,但它的训练时间远没有那么长。


我认为一个更公平的比较应该是:GPT-4 生成每个 Token 所需的瓦特数,对比 Dan Boneh 生成每个 Token 所需的瓦特数。我想,这个数字会非常接近。就是我们现在对话这样,比较推理 Token 与推理 Token。


我想我们在这方面的差距不会太大。


Sam Altman: 我没法立马给你确切的数字,但我的直觉是,不会相差太远。

你花了 20 年才变得足够聪明,可以用不那么多的能量快速给出答案,因为你反应很快。你不能拿人类的推理去和 AI 的训练比较。你必须比较推理对推理、训练对训练。


如何减少能源消耗这个问题,确实听起来像一个绝佳的研究课题。


Sam Altman: 而且我怀疑,随着时间的推移,我们在这方面还有 100 倍的提升空间,如果某些“奇特”的技术能成功的话,也许会更多。


在人脑中,存储和计算是融合的。但是我们的 GPUs,内存一侧,计算单元在另一侧,大量的能量都消耗在了数据传输上。你认为全新的硬件架构或更节能的算法在这方面是否有改善空间?


Sam Altman: 当然。比如新的硬件基板。如果我们能让光学计算取得突破,那显然将节省巨量的能源。但没错,在此期间,利用现有技术也可能诞生新的架构。


即使是一些“笨”办法。比如我们能找到将芯片冷却到液氮温度的方法,我认为就能获得巨大的能效提升。我毫不怀疑,我们一定会在降低每 Token 功耗方面取得巨大进展。


| 文章来源:数字开物


第二十届中国IDC产业年度大典(IDCC2025)暨数字基础设施科技展(DITExpo) 以“重塑算力 破界而生”为主题,将于2025年12月10-11日在北京首钢国际会展中心1号馆举办,将有超过12场主题平行论坛联合举办。
↓扫码立即报名参会

欢迎扫描上方二维码报名,有机会与数万算力产业从业者深入探讨AI算力、算电协同、国产化生态、集群建设、绿色能源、高密度液冷、HVDC供电等关键领域的技术突破与商业模式创新。

• END• 

【专栏】精品再读

从陪伴到巴甫洛夫的狗、再到尼亚加拉瀑布,一场贯穿AI与算力全景生态的“数字开物·奇点π对”亮相2025服贸会!
AI不是工具 | 黄仁勋GTC万字演讲全文
3万字完整实录 | Andrej Karpathy:LLM仍是“孩子”、RL非常糟、AI是“幽灵”?
上下文工程才是AI应用的护城河 | Manus首席科学家季逸超最新万字对话实录
企业部署AI Agent的两大挑战 | 谷歌云首席技术官万字对话实录
何宝宏:大语言模型上半场已进入“垃圾时间”

【声明】内容源于网络
0
0
数智科技产业研究
1234
内容 420
粉丝 0
数智科技产业研究 1234
总阅读3.2k
粉丝0
内容420