有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。
2 Al for science
Lex Fridman:下面我们谈谈 AlphaFold,你认为人类思维都来自于这种类似神经网络的、生物的计算糊状物,而非直接在精神上工作?
Demis Hassabis: 在我看来,宇宙中最大的奇迹就是我们头骨里只有几磅的糊状物,它也是大脑和目前所知宇宙中最复杂的物体。我认为这是一台令人惊奇的高效机器,这也是我一直想构建 AI 的原因之一。通过构建像 AI 这样的智能体,将其与人类思维进行比较,或能帮助我们历史以来一直想知道的心灵的独特性,和真正的秘密、意识、做梦、创造力、情感等一切事物。
现在有了大量的工具来实现这件事。所有的神经科学工具、FMI机器都可以记录,也有 AI 计算能力可以建立智能系统。人类思维所能做的事情令人惊讶,人类创造了像计算机这样的东西,并思考和研究这些问题,也都是对人类头脑的证明,有助于我们更清晰地了解宇宙和人类的思想。甚至可以说,我们或许是宇宙尝试和理解自己美丽的机制所在。
从另一个角度看,生物学的基本构件也可以用于理解人类思想和身体,从基本构建开始模拟和建立模型是件很神奇的事情,你可以构建越来越大的、更复杂的系统,甚至是整个人类生物学。
还有一个被认为不可能解决的问题,就是蛋白质折叠,而 AlphaFold 解决了蛋白质折叠问题,这是结构生物学史上最大的突破之一。蛋白质是所有生命都必不可少的,身体每一个功能都依赖于蛋白质。
蛋白质由它们的基因序列(也被称为氨基酸序列)指定,可以将其视为它们的基本构件。它们会在身体中、在自然界中折叠成一个三维结构,这个三维结构决定了它在身体中的功能。此外,如果你对药物或疾病感兴趣,想用一种药物化合物来阻断蛋白质的作用,前提是要了解蛋白质表面结合点的三维结构。
图注:2021年7月,DeepMind 首次通过与欧洲分子生物学实验室(EMBL)合作建立的数据库公开发布 AlphaFold 预测结果,初始数据库包含了所有人类蛋白质的98%
Lex Fridman:蛋白质折叠问题的本质是,你能从氨基酸序列中得到一维的字母串吗?能通过计算立即预测出三维结构吗?这是50多年来生物学界的一个重大挑战。1972年的诺贝尔奖获得者 Christian Anfinsen 首次阐述,他推测,从氨基酸序列到三维结构是可以实现的。
Demis Hassabis: Christian Anfinsen 的这句话开启了整个计算生物学的50个边缘领域,他们被困在当中、并没有完成得很好。
在 AlphaFold 出现之前,这都是通过实验来完成的,让蛋白质结晶是件非常困难的事情,有些蛋白质不能像膜蛋白那样结晶,必须使用昂贵的电子显微镜或X射线晶体分析仪,才能得到三维结构并将其结构可视化。有了 AlphaFold 后,两个人就能在几秒钟内预测出三维结构。
Lex Fridman:有一个数据集,它在这个数据集上进行训练,以及如何映射氨基酸。令人难以相信的是,这个小的化学计算机能以某种分布式方法来计算,且算得非常快。
Demis Hassabis: 或许我们该讨论一下生命的起源。实际上,蛋白质本身是一个神奇的小生物和动物机器。提出列文塔尔悖论的科学家 Cyrus Levinthal 大致计算了一下,一般的蛋白质可能有2000个氨基酸碱基长,可以有10到300种不同的蛋白质折叠方式。而在自然界中,物理学以某种方式解决了这个问题,蛋白质会在几毫秒、或是一秒的时间内,在你的身体中折叠起来。
Lex Fridman:该序列有独特的方式来自我形成,它找到了一种在巨大可能性中保持稳定的方式。某些情况下可能会出现功能失调等情况,但大多时候是独特的映射,而这种映射并不明显。
Demis Hassabis:如果是健康通常有一个独特的映射,那患病时,究竟问题出在哪里。例如,曾经有一个对阿尔茨海默氏症的猜想是,因为以错误的方式折叠 β-淀粉样蛋白导致折叠错位,以至于在神经元中纠缠在一起。
因此,要了解健康、功能和疾病,就需要了解它们是如何结构化的,知道这些东西在做什么超级重要。下一步是当蛋白质与某些东西相互作用时,它们会改变形状。因此在生物学中,它们不一定是静态的。
Lex Fridman:或许你可以给出一些解决 AlphaFold 的方法,与游戏不同,这是真正的物理系统。这当中什么是非常难解决的?有哪些跟解决方案是相关的?
Demis Hassabis:AlphaFold 是迄今为止我们构建的最复杂、可能也是最有意义的系统。
我们起初构建的 AlphaGo 和 AlphaZero 都是与游戏相关,但最终目标不仅仅是破解游戏,而是使用它们来引导通用学习系统,并应对现实世界的挑战。我们更多是希望致力于像蛋白质折叠这样的科学挑战,AlphaFold 是我们的第一个重要证明点。
就数据来说,创新数量大概需要30多种不同的组成算法,放在一起来破解蛋白质折叠。一些重大的创新是围绕物理学和进化生物学,建立了硬编码来约束像蛋白质中键角之类的东西,但不会影响学习系统,因此,系统仍能从案例中学习物理。
假设只有大约15万个蛋白质,即使经过40年的实验,也大概只有约5万种蛋白质结构会被发现。训练集比通常使用的数据量要少得多,但当中使用了像自我提取等各种技巧。因此,使用 AlphaFold 做一些非常有信心的预测时,将其放回训练集中使训练集更大,对 AlphaFold 工作至关重要。
实际上,为了解决这个问题,需要进行大量的创新,AlphaFold 产生的是一个直方图,一种蛋白质中所有分子之间的成对距离的矩阵,它们必须是一个单独的优化过程来创建三维结构。要使 AlphaFold 真正地从端到端,可直接从氨基酸的碱基序列到三维结构,跳过中间步骤。
从机器学习中也可以发现,越是端到端,就越能使系统变得更好,系统比人类设计者更善于学习约束条件。在这种情况下,三维结构要比有中间步骤更好,因为那必须手工进入下个步骤。最好的办法是让梯度和学习一直流经系统,从终点到想要的最终输出,再到输入。
Lex Fridman:关于 AlphaFold 的设想,那或许是生物学中一个漫长旅程的早期步骤,你认为同样的方法是否预测更复杂的生物系统的结构和功能、多蛋白质相互作用;其作为一个起点,能模拟越来越大的系统,最终模拟像人的大脑、人体这样的东西吗?你认为这是一个长期的愿景吗?
Demis Hassabis:当然,一旦我们有了足够强大的生物学系统,治疗疾病和理解生物学就是我的 To Do List 上的首要任务,这也是我亲自推动 AlphaFold 的原因之一,AlphaFold 只是一个开始。
AlphaFold 解决了蛋白质结构这个巨大的问题,但生物学是动态的,我们所研究的所有东西都是蛋白质液体结合。与分子发生反应,搭建通路,最终形成一个虚拟细胞,那是我的梦想。我一直同很多生物学朋友交谈,其中就包括了克里克研究所的生物学家 Paul Nurse。对生物学和疾病发现来说,构建一个虚拟细胞是不可思议的,因为你可以在虚拟细胞上进行大量实验,最后阶段再进入实验室来验证。
就发现新药而言,从确定目标到拥有一个候选药物大约需要10年时间,如果能在虚拟细胞中完成大部分工作,或许可以将时间缩短一个数量级。为了实现虚拟细胞,必须建立对生物学不同部分相互作用的理解。每隔几年,我们就会与跟 Paul 谈论这个问题。去年在 AlphaFold 之后,我说现在终于是我们可以去做的时候了,Paul 非常激动。我们与他的实验室有一些合作。在 AlphaFold 的基础上,相信生物学会有一些惊人的进步,目前也可以看到,在 AlphaFold 开源之后已经有社区在做了。
我认为有一天,人工智能系统可能会解决像广义相对论这样的问题,而不仅仅是通过对互联网或公共医疗上的内容进行处理。这将非常有趣,看它会能够想出什么。这有点像我们之前关于创造力发明围棋的辩论,不是仅仅想出一个好的围棋动作。如果想要获得像诺贝尔奖的奖项,那它需要做的是发明围棋,而不是由人类科学家或创造者来指定。
Lex Fridman:很多人确实把科学看作是站在巨人的肩膀上,而问题是你在巨人的肩膀上真正达到了多少?也许它只是吸收了过去的不同类型的结果,最终以新的视角提供了突破性的想法。
Demis Hassabis:这是一个很大的谜团,我相信在过去十年甚至未来几十年中,很多新的重大突破都会出现在不同学科领域的交叉点上,在这些看似不相干的领域之间会发现一些新的联系。人们甚至可以认为,深层思维是神经科学思想和 AI 工程思想间的一种交叉学科。
Lex Fridman:你有一篇论文是“通过深度强化学习对托卡马克等离子体进行磁控制”,所以你在寻求用深度强化学习来解决核聚变,做高温等离子体的控制。你能解释一下 AI 为什么最终能解决这个吗?
Demis Hassabis:过去的一两年里,我们的工作非常有趣和看到了成效,我们启动了很多我的梦想项目,这些是我多年来收集的同科学领域相关的项目。如果我们能参与推动,或许能带来具有变革性的影响,科学挑战本身就是一个非常有趣的问题。
目前,核聚变面临许多挑战,主要在物理、材料、科学和工程等方面,以及如何建造这些大规模的核聚变反应堆并容纳等离子体。
我们与瑞士洛桑联邦理工学院(EPFL)和瑞士技术研究所合作,他们有一个测试反应器愿意让我们使用。这是一个惊人的测试反应堆,他们在上面尝试各种相当疯狂的实验。而我们则看的是,当进入一个新领域如核聚变时,瓶颈问题是什么?从第一原理思考阻碍核聚变运作的底层问题是什么?
在这种情况下,血浆控制是完美的。这个等离子体有100万℃,比太阳还热,显然没有任何材料可以容纳它。因此必须有非常强大的超导磁场,但问题是等离子体相当不稳定,就像在一个反应堆中持有许多颗星,提前预测等离子体会做什么,你可以在几百万秒内移动磁场来控制它接下来会做什么。
如果你把它看作是一个强化学习预测问题,这似乎很完美,有控制器,可以移动磁场和切割,但此前用的是传统的控制器。我希望有一种可控的规则是他们不能在当下对等离子体做出反应,必须是硬编码的。
Lex Fridman:AI 最终解决了核聚变。
Demis Hassabis:去年我们在《自然》杂志上发表了关于解决这个问题的论文,把等离子体固定在一个特定的形状。实际上这几乎就像是把等离子体雕刻成不同的形状,控制它并保持在那里创纪录的时间。这是核聚变的一个未解决的问题。
把它包含在结构中并保持,还有一些不同形状更有利于能量的产生,称为滴液等等,这是很重要的。我们正与许多核聚变初创公司沟通,看在核聚变领域可以解决的下一个问题是什么。
Lex Fridman:论文标题中还有一个迷人的地方,通过解决分数电子问题来推动密度函数的前沿。你能解释一下这项工作吗?AI 在未来能否对任意的量子力学系统进行建模和模拟?
Demis Hassabis:人们试图写出密度函数的近似值以及对电子云的描述,观察两个元素放在一起时如何相互作用。而我们试图做的是学习一种模拟,学习一种能够描述更多化学类型的化学函数。
到目前为止,AI 可以运行昂贵的模拟,但只能模拟非常小和非常简单的分子,我们无法做到模拟大型材料。因此要建立函数近似值来展示其方程后,描述电子在做什么,所有材料科学和性质都是由电子如何相互作用来控制的。
Lex Fridman:通过功能对模拟进行总结来接近实际模拟出来的结果,这项任务的难度在于运行复杂的模拟,学习从初始条件和模拟参数的映射任务,学习函数会是什么?
Demis Hassabis:这很棘手,但好消息是我们已经做到了,我们可以在计算集群上运行大量的模拟,即分子动力学模拟,由此产生了大量的数据。在这种情况下,数据是生成的。这就是为什么我们使用游戏模拟器来生成数据,因为可以随心所欲地创造出更多的数据。如果在云端有空闲的电脑,我们就可以运行这些计算。
3 AI 与人类
Lex Fridman:你怎么理解生命起源?
Demis Hassabis:我认为 AI 的最终用途是将科学加速到极致。它有点像知识之树。如果你想象这就是宇宙中要获得的所有知识,但目前为止,我们几乎只触及了它的表面。AI 会加速这个过程,尽可能多地探索这棵知识树。
Lex Fridman:直觉告诉我,人类的知识之树是非常小的,考虑到我们的认知局限。即使有工具,我们仍然不能理解很多事情。这也许是非人类系统能够走得更远的原因。
Demis Hassabis:是的,很有可能。
但首先,这是两件不同的事情。就像我们今天理解了什么,人类的思想能理解什么,我们要理解的整体是什么,这里有三个同心,你可以把它们想象成三棵更大的树,或者探索这棵树的更多分支。有了 AI 后我们会探索更多。
现在的问题是,如果你思考一下我们能理解的事物的总体是什么,可能有些事物不能被理解,比如模拟之外的事物,或宇宙之外的事物。
Lex Fridman:因为人类大脑已经习惯了这个有时间的三维世界的状态。
Demis Hassabis:但我们的工具可以超越这些。它们可以是11维,12维的。
我经常举的例子是当我和 Gary Kasparov 下棋时,我们讨论过象棋之类的东西,如果你很擅长下棋,你不能想 Gary 他的走法,但他可以给你解释。你可以将其理解为事后推理。有一个进一步的解释,也许你不可能发明这个东西,但你可以理解和欣赏,就像你欣赏维瓦尔第或莫扎特一样欣赏它的美。
Lex Fridman:我想问一些更疯狂的问题。比如,你认为地球之外有外星文明吗?
Demis Hassabis:我个人的看法是,我们目前是孤独的。我们已经有各种天文望远镜和其他探测技术,尝试着在太空里寻找其他文明的信号,如果现在有许多外星文明在同时做这样的事,那我们应该听到来自外太空的嘈杂声音。可事实是,我们什么信号也没收到。
有很多人会争辩说,世界上有外星文明,只是我们还没有真正好好地去搜索,或者说我们找的波段错误,也有可能使用了错误的设备,我们没有意识到外星人存在的形式非常不同,等等。但我不同意这些观点,我们其实已经做了很多探索了,如果真有那么多外星文明,那我们应该早就发现了。
有趣的是,如果地球是孤独的文明,从大过滤器(Great Filters)的角度来看,这还挺令人欣慰,这意味着我们已经通过大过滤器的筛选了。
说回你刚才问的生命起源问题,生命起源于一些令人难以置信的事物,而且没人知道这些事是怎么发生的。如果在地球以外的地方看到单细胞的某种生命形式,比如细菌,我不会感到惊讶。但就凭其能够捕获线粒体并将线粒体为我所用的这个能力,多细胞生命的出现的难度就是空前绝后的。
图注:Demis Hassabis所提到的大过滤器理论
Lex Fridman:你认为需要有意识才能有真正的智能吗?
Demis Hassabis:我个人认为,意识和智慧是双重分离的,所以我们可以在没有智慧的同时实现意识,反过来也一样。
举个例子,很多动物是有自我意识的,也会社交和做梦,它们可以被定义为有一定的自我意识,但是它们没有智慧。但同时,那些在某一任务上非常聪明的人工智能,它们会下象棋,或者执行其他任务执行得非常好,但是它们没有任何的自我意识。
Lex Fridman:前段时间谷歌的一个工程师认为某个语言模型是有感知的,你遇到过有感知的语言模型吗?如果一个系统出现了“感知”,你怎么理解这种情况?
Demis Hassabis:我不觉得目前世界上的任何一个 AI 系统是有意识或者有感知的,这是我每天与 AI 互动的真实感受。所谓感知,更多是我们大脑自己的投射,由于那是一个语言模型,与智慧息息相关,所以人们就很容易把系统拟人化。这也是为什么我认为图灵测试有缺陷,因为它建立于人的反应和判断上。
我们应该和顶尖的哲学家谈谈意识,比如 Daniel Dennett 和 David Charmers,以及其他对意识有深刻思考的人。目前意识还没有公认的定义,如果让我来说的话,我觉得意识的定义是,信息得到处理时带来的感觉。
Lex Fridman:让我问一个黑暗的私人问题。你说创造一个世界上最强大的超级人工智能系统。正如老话所说,绝对权力导致腐败,你也很有可能成为其中一员,因为你是最有可能控制这个系统的人。你会考虑这些么?
Demis Hassabis:我每时每刻都在思考有什么能对抗这种腐败的防御措施。
人类最大利益的工具或技术让我们进入一个激进的世界,我们面临着许多艰巨的挑战。AI 可以帮助我们解决问题,最终使人类走向终极繁荣,甚至找到外星人。而 AI 的创造者,AI 所依赖的文化,AI 拥有的价值观,AI 系统的构建者都会影响它的发展。即使 AI 系统会自己学习,但其大部分知识也会带有一定已有文化和创造者价值观的残留。
不同的文化让我们比以往任何时候都更加分裂,也许当我们进入了一个极度富足的时代以后,资源不那么稀缺了,我们就不需要激烈竞争,而是可以转向更好的合作。
Lex Fridman:当资源受到重大限制时,一些暴行就会发生。
Demis Hassabis:资源稀缺是导致竞争和破坏的原因之一,全人类都想生活在善良、安全的世界里,所以我们必须解决稀缺性的问题。
但这还不足以达成和平,因为还有其他东西会产生腐败。AI 不应该任由仅仅一个人、或者一个组织来运行。我认为 AI 应该属于世界,属于人类,每个人都应该对 AI 有发言权。
Lex Fridman:你对高中生和大学生有什么建议吗? 如果年轻人有从事 AI 的愿望,或者想以自己的力量影响这个世界,他们应该如何获得一份自己由衷感到自豪的职业?如何找到理想的生活?
Demis Hassabis:我总喜欢对年轻人说两句话,第一句话是,你真正的激情在何处?年轻人应该去尽可能地探索这个世界。在人年轻时,我们有足够多的时间,还能够承担探索带来的风险。以自己独特的方式去寻找事物之间的联系,我认为这是寻找激情所在的好方法。
第二句话是,了解你自己。要花很多时间去了解自己最佳的工作方式是什么,最佳的工作时间是什么时候,最佳的学习方式是什么?,如何应对压力。年轻人应该在不同的环境下测试自己,尝试改进自己的弱点,找出自己独特的技能和优势,然后磨练它们,这些就是你以后在这个世界上的价值。
如果你能把这两件事结合起来,找到自己的激情所在,锻炼出你自己独特而强大的技能,那么你就会获得不可思议的能量,给世界带来巨大的改变。
江苏百奥信康医药科技有限公司是一家以新药研发驱动制药全产业链发展的高科技创新型医药企业。公司以研发自我持有的改良型新药和高端特色仿制药产品为主业,构建核心技术平台,同时为国内外客户提供新药和仿制药产品的研发服务。
「百奥信康」公众号推送的内容来源于原创或根据公开资料整理编辑,欢迎个人转发至朋友圈。媒体或机构如需转载,请完整注明:本文转载自百奥信康公众号(ID: BioScenePharma);作者栏请填写:百奥信康。
本公众号的目的在于分享行业相关知识、传递最新医药资讯。如有侵权,请在留言栏及时告知,我们将及时删除相关信息。本公众号推送的文章中的观点不代表百奥信康的立场,也不是治疗方案的推荐。如需获得诊断或治疗方面的指导,请前往正规医院就诊。

