图片来源:Tim Ferriss
Z Highlights
人始终是一切的核心。是人创造了AI,是人会使用AI,是人会受到AI的影响,而且,人也应该在AI的发展中拥有发言权。
物理教给我的不仅仅是数学和物理本身。它真正教会我的是:提出大胆问题的勇气和热情。
从今天回看,在ImageNet诞生将近二十年之后,它的真正意义在于:它标志着大数据时代的一个关键拐点。在ImageNet出现之前,人工智能这个领域其实并没有真正地在使用“大数据”。
但我在书中特别希望用一种方式来讲述AI的历史:这是一个由无数未被歌颂的英雄、一代又一代科学家、以及跨学科思想不断相互碰撞、相互滋养所共同构成的历史。我只是恰好在那个时间点,既对这个问题充满热情,又幸运地站在了这些研究成果的基础之上。
Fei-Fei Li(李飞飞),ImageNet数据集创建者、“AI教母”、斯坦福大学教授,以奠定现代AI基石的开创性工作与深刻的人文思考,持续引领着人工智能在技术前沿与人类价值交汇处的探索。本访谈发布于2025年12月10日。
普林斯顿往事:一场错过的校园重逢
主持人:李博士,很高兴见到你。谢谢你抽时间来。
李飞飞:嗨,Tim。很高兴来到这里,非常期待这次对话。
主持人:在正式录音前我们聊了一下,说实话挺神奇、也有点遗憾的是——我们竟然在同一个校园待了三年,却从来没有碰到过彼此。
李飞飞:我知道!现在我都在想你当时在哪个书院、参加了哪些社团。
主持人:我在Forbes College。
李飞飞:天呐,我也在Forbes。
主持人:好吧,给不了解我们在说什么的听众解释一下:普林斯顿有住宿书院制度,新生会被分到不同书院。Forbes在校园很偏的地方,旁边有个像7-Eleven的快餐店叫Wawa,还有通勤火车站。另外还有一种叫eating clubs的组织,算是男女混合的兄弟会/姐妹会,同时也是吃饭的地方。我在Terrace。
李飞飞:我没有参加这些。不过如果大家好奇我们为什么没见过——我们应该说,我们都是非常用功的学生,只待在图书馆里。
主持人:对,我们都很用功。我当时在Firestone图书馆阁楼打工,时薪大概6美元。
李飞飞:Tim,我也在那家图书馆工作过。我真的不明白我们怎么会没遇到。
主持人:这太有意思了。好吧,现在我们终于见面了。
李飞飞:你是不是改过名字?也许我们见过。
主持人:我没改过名字,不过现在我们确实重逢了。这真的很神奇。我中间还离开过一段时间——我在普林斯顿和北京两地学习,后来去了首都经济贸易大学,然后又休学一年,最后跟2000届毕业。所以我们其实有很多重叠时间。但我们进入正题吧。这是一个比较常见的开场问题,但对你来说很合适:你在哪里长大?能不能讲讲你的成长经历?因为根据我读到的资料,你的父母在我看来——尤其是对那个时代的中国家庭来说——非常不典型。
李飞飞:你真的知道得很多。
主持人:能不能展开说说?
双城记童年:非典型父母与导师塑造的坚韧与好奇心
李飞飞:我会说我的童年和成长期是一段“双城记”。我出生在北京,但大部分童年是在成都度过的——那里以熊猫闻名。15岁时,我和妈妈去了新泽西的Parsippany,与已经先过去的父亲团聚。我从一个相对典型的中国中产家庭孩子,变成了一个新移民,进入了一个完全不同的世界——在新泽西,学习一门新语言、适应一种新文化、拥抱一个新国家。后来我去了普林斯顿学物理,本科期间也修过你修的那些课,然后去了加州理工学院读AI博士,其余的故事就慢慢展开了。
主持人:我想多听一点关于你父母,尤其是你父亲的故事。从我读到的内容来看,他非常富有想象力、很有童心,和很多人对“中国父母”的刻板印象完全不同。我之前采访过一位企业家Bo Xiao,他的父亲就属于非常严格的那种“虎爸”:如果他赢了数学竞赛,就会得到奖励和更多关爱。你能不能讲讲你的父母?
李飞飞:首先,显然你读了我的书,谢谢你。确实,在我写这本科学回忆录的过程中,我才真正意识到:我的父亲真的非常不典型。他热爱大自然,极度好奇,能在很多“无关紧要”的事情里找到乐趣,比如昆虫。80年代中国物质并不丰富,但成都在扩张,我们住在城边的居民区。周末,我和爸爸会在稻田、水牛旁边玩,我有一只小狗。我所有关于童年的记忆,几乎都是在找虫子。有时我们还会去山里画画。我父亲对我的成绩、奖项、竞赛完全不关心。即便后来我们移民到新泽西,生活非常艰难,我记忆中的他仍然对逛yardsale乐此不疲,把它当作寻宝游戏。他就是这样一个保持童心、充满好奇的人。
主持人:我之所以问父母,是因为你现在也是一位母亲,之后我也会问你对育儿的看法。但很多听众一定会好奇:为什么你的父母要离开中国?是什么促成了这个决定?从成都到新泽西郊区,这种转变太巨大了——语言、经济、文化都完全不同。
李飞飞:我可以给你两个答案。对于小时候的我来说,我完全不理解。我父亲在我12岁时先走,我和妈妈15岁时才过去。那几年,我只知道他们说:“我们要去美国。”对于长大后的我来说,我意识到他们非常勇敢。在没有互联网、没有AI、没有信息渠道的年代,去一个完全陌生、不会语言的国家,几乎就像去另一个星球。他们希望我能拥有不同的教育机会。事实证明,这个判断是对的。
主持人:我也想听听你母亲的故事。在你父亲如此“随性”的情况下,人们会好奇:你的动力和技术专注从哪里来?以及,Bob Sabella是谁?
李飞飞:先说我母亲。她完全不擅长数学,所以技术热情并非来自她。我认为那是我与生俱来的。但她非常自律。她不盯成绩、不追奖项,但她要求我专注。她会说:“6点前把作业做完,做不完就承担后果。”她曾说:“我不知道来到新泽西会怎样,但我相信我能活下来,也会让飞飞活下来。”
主持人:那Bob是谁?
李飞飞:Bob Sabella是我在Parsippany High School 的数学老师。他不仅是我的老师,更是我的导师、朋友,后来他的整个家庭都成了我的“美国家庭”。当学校无法提供完整的AP Calculus BC课程时,他牺牲了自己的午休时间,一对一给我补课。多年后,当我自己成为教师,我才真正意识到这是多么大的付出。
主持人:真的要感谢那些愿意多走一步的老师。
李飞飞:我认为美国的公立学校教师是社会的无名英雄。他们帮助来自世界各地的移民家庭孩子成长。这也是我写书的原因之一——为了致敬Bob这样的老师。
主持人:是的,我想聊的内容实在太多了,而且我知道,在话题还没聊完之前,我们就一定会先没时间。所以我其实是想多花一点时间聊Bob。但与此同时,我也希望对话能够继续往前推进。所以我们会这样做:我可能会先简单带过几个方面,然后再深入问你一些问题。不过可以肯定的是,在普林斯顿那段时间,不只是你一个人在努力生存,你的整个家庭都在为生活打拼。你当时参与经营了新泽西的一家干洗店,对吗?而且你一共做了七年。通过这段经历,我感觉你在很多层面上都获得了非常重要的视角,这些视角后来也深刻影响了你在职业上的选择和思考方式。你学会去关注的,不只是那些生活在“象牙塔”里、受到保护的人,而是社会中各个阶层、各个角落的人——来自整个社会光谱的不同群体。
与此同时,你的母亲虽然并不是技术背景出身,但她在你身上培养了很强的纪律性,而且她似乎对文学、尤其是世界文学,有着非常广泛的理解和欣赏。所以在那个阶段,你已经拥有了一种全球化的视角——当然,那时这种视角主要是建立在中文文化和语言基础之上的。之后,你来到了普林斯顿。
我知道我们在时间线上会来回跳跃,但我真的很想知道:ImageNet是如何诞生的?你可以用任何你觉得合适的方式来介绍它。你可以先告诉大家它是什么、后来发展成了什么、为什么如此重要,然后再讲它最初是如何开始的;当然,你也可以只讲它的起点。但无论如何,这都是一个极其重要的篇章。
ImageNet:从个人兴趣到革命性AI数据集
李飞飞:那我先简单解释一下什么是ImageNet。从表面上看,ImageNet是在2007年到2009年间建立的,当时我还是普林斯顿大学的一名助理教授,随后我去了斯坦福。正是在这段过渡时期,我和我的学生一起构建了这个数据集——在当时,它是人工智能领域中规模最大的计算机视觉(或视觉智能)训练与评测数据集。
从今天回看,在ImageNet诞生将近二十年之后,它的真正意义在于:它标志着大数据时代的一个关键拐点。在ImageNet出现之前,人工智能这个领域其实并没有真正地在使用“大数据”。正因为如此,再加上一些我之后会提到的原因,AI在那之前的发展是停滞的。公众通常把那段时期称为“AI寒冬”。尽管对当时的我来说——作为一名年轻的研究者——那是一个极其令人兴奋的领域,但我也理解公众的看法,因为AI并没有展示出人们所期待的突破性成果。
但是ImageNet,加上另外两个现代计算的关键因素,一个是叫做neural network algorithm(神经网络算法),另一个是现代芯片,叫做GPU(graphic processing unit,图形处理单元)。这三者在2012年汇聚在一项开创性的工作里,即ImageNet classification deep convolutional neural network approach(ImageNet分类深度卷积神经网络方法)。这是一篇由一组科学家完成的论文,展示了ImageNet提供的大数据、GPU提供的高速并行计算以及神经网络算法的结合,能够以前所未有的方式实现图像识别领域的AI性能。这个里程碑被许多人称为现代AI的诞生。如果按元素来算,我在ImageNet的工作占了其中三分之一。
我真的感到非常幸运、也非常荣幸,自己的工作在现代AI的诞生过程中起到了如此关键的作用。但通往ImageNet的道路,其实远比这段时间线要长得多。ImageNet的旅程,早在我还是普林斯顿本科生的时候就已经开始了。你当时在东亚研究系,而我则躲在Jadwin Hall——也就是我们的物理系大楼里。我从很小的时候就热爱物理。我也说不清,为什么我父亲对昆虫、对自然的热爱,会在我的脑海中转化为一种对宇宙的好奇。我喜欢仰望星空,喜欢战斗机的速度,喜欢它们复杂而精妙的工程设计。最终,这种兴趣演变成了对一门学科的热爱——这门学科敢于提出人类文明中最大胆的问题:最小的物质是什么?时空的定义是什么?宇宙有多大?宇宙从何而来?
在我十几岁那段时期,我尤其崇拜爱因斯坦,热爱他的工作,也正是因为他,我想去普林斯顿。但后来我才意识到,物理教给我的不仅仅是数学和物理本身。它真正教会我的是:提出大胆问题的勇气和热情。所以在本科即将结束的时候,我开始渴望拥有属于我自己的那个“大胆问题”,而不仅仅是去追随别人提出的问题。在大量阅读和思考之后,我逐渐意识到:我真正的兴趣并不在于物质本身,而是在于智能。我深深地着迷于这样一个问题:什么是智能?我们如何创造出具备智能的机器?说实话,在那个时候,我甚至都不知道这门学科叫“人工智能”。我只是清楚地知道,我想研究智能,想研究智能机器。于是我申请了研究生院,去了加州理工学院。
在加州理工,我完成了博士学位。那是2000年,世纪之交。我认为,正是在那个时刻,我真正成为了一名刚刚起步的AI科学家。这是我作为人工智能方向计算机科学家的正式训练阶段。与此同时,我的物理训练并没有停止——物理教会我如何提出大胆的问题,并把它们转化为一个“北极星”。用科学的语言来说,这个北极星就是一个假设(hypothesis)。对我来说,明确自己的北极星至关重要。而在接下来许多年里,我的第一个北极星问题就是:如何解决视觉智能的问题——也就是,如何让机器“看见”这个世界。而“看见”并不仅仅是识别RGB颜色或明暗变化,而是要理解所看到的内容。比如,我正在看你,Tim,我能认出你;我看到你身后有一幅漂亮的画,我不知道它是真是假;我看到你坐在一把椅子上。这才叫“看见”。看见,是对这个世界的理解。这也成为了我的北极星问题。我当时的核心假设是:必须先解决“物体识别(object recognition)”的问题。于是,在整个博士阶段,我几乎都在与物体识别作斗争。我们做了大量的数学模型,提出了无数问题。
但我和整个领域都在挣扎。论文可以写,成果也能发表,但我们始终没有真正的突破。直到2007年,普林斯顿再次把我召回,邀请我以教师身份回到母校。那是我人生中最幸福的时刻之一。我感到一种巨大的认可——我的母校愿意给我一个教职。所以我非常开心地再次回到了普林斯顿,这一次是作为一名教授。而且,我实际上还是Forbes College的成员。正是在普林斯顿,我迎来了一个顿悟的时刻:我意识到,有一个所有人都忽略了的假设。那个假设就是:大数据。
主持人:我可以在这里先打断你一下吗?因为正是这一点让我非常、非常好奇,我想稍微停下来聊一聊。对那些对普林斯顿历史感兴趣的人来说,那段历史真的非常精彩。他们可以去查一查普林斯顿高等研究院(Institute for Advanced Study)的历史。我记得,我上过一些你刚才提到的东亚研究课程,那些教室正是爱因斯坦曾经授课的地方。那里有一种独特的气场,一种历史沉淀下来的“光环”。你会忍不住想相信,仿佛能感觉到这种氛围弥漫在整个校园里。这种感觉本身就很有趣——从这个意义上说,真的非常有趣。
不过接下来,我想读一段《WIRED》杂志中关于你的一篇文章。那篇文章对你进行了相当深入的讨论,也正好呼应了你刚才提到的“大数据在你的研究中介入之前和之后的差异”。文章中是这样写的——当然,如果有不准确的地方,你完全可以指出或反驳——《WIRED》提到,当时的问题在于:研究人员可能会写一个算法来识别狗,再写另一个算法来识别猫。而正是在这个过程中,你开始思考:问题也许并不在模型本身,而在数据上。你认为,如果一个孩子是通过亲身体验视觉世界、在成长早期观察无数的物体和场景来学会“看

