

言无不尽。
来源 | 量子位
救大命,OpenAI首席研究官Mark Chen最新访谈,信息量有点大呀。
不管是OpenAI的,还是自己个儿的,又或者是同事的,主打一个“我都能聊聊”。
比如:
-
爆料Meta抢人大战私下已经升级成送汤大战了,真能喝的那种汤,小扎熬了亲自送到OpenAI研究员嘴边。OpenAI反击也送汤。
-
Mark Chen、Scott Gray(OpenAI专门负责GPU内核优化的神秘狠人)等经常三五围坐,打扑克牌。其本质被解释为是概率与期望值的博弈。
-
OpenAI核心研究团队规模大概500人,公司内大概有300个项目。
-
Mark Chen表示OpenAI本质上仍然是一家纯AI研究公司。
-
Gemini 3发布后每个人都会用自己的方式去试探新模型,有个“42问题”从没见过哪个语言模型能真正把它完全做出来。
-
OpenAI“宫斗”,Mark Chen如何让研究员们统一意见、促成那封让Sam回归的请愿信也被聊了出来。
-
透露过去半年,一直专注在预训练上,在预训练方面,有信心轻松与Gemini 3正面对决。
-
表示内部已经有性能达到Gemini 3的模型,很快就会发布这些模型,并且能发布表现更好的下一代模型。
-
当被问到“你们真的需要那么多算力吗”会觉得很震惊:如果今天多10倍算力,可能几周内就能全部用满。
……
网友纷纷表示,这次访谈确实让人耳目一新,还有不少人在转发Mark Chen的观点。
Mark Chen之所以能够言无不尽,一大关键还在于,本期访谈来自于《Core Memory》,其主持人Ashlee Vance是硅谷知名的科技记者。
他以深入采访硅谷人物和讲述科技创新故事而闻名,更知名的是他那本《硅谷钢铁侠:埃隆·马斯克,创造未来的人》。
量子位对完整访谈进行了翻译整理,在不改变原意的前提下,对语言做了适当润色。
01
人才争夺战演
变成给人才送汤战
Q:关于人才争夺战,Meta的行为看起来很激进,这种针锋相对的竞争,目前已进入哪个阶段?
Mark Chen:其实就这么一批人才,大家基本都知道他们是谁。
很多公司已经意识到,要打造一个优秀的AI实验室,其中一个关键因素就是要招到最优秀的人才。
所以,Meta这么积极采用这种策略,也不奇怪。
我们当然也没有坐以待毙,我其实想从OpenAI的角度讲讲这个故事。
媒体上把这件事渲染得好像所有人才都单向流向Meta。
但就我看到的情况,Meta去挖了很多人,但多数并不成功。
他们从OpenAI去挖了我大概一半的直接下属,但他们全部都拒绝了。
当然,如果你一年有100亿美元的预算用来挖人,那你肯定会挖到一些人。
所以我其实觉得,我们在保护核心人才方面做得相当不错。
而且看着这件事情不断升级,其实还挺有趣的。
比如扎克伯格真的亲自给他想挖的人送汤,我觉得他是亲手煮的汤。
当时我很震惊,但后来我也意识到,这些方式以某种奇怪的方式,其实是有效的。
所以我后来也给我们想从Meta挖的人送过汤。
Q:你们现在是在比谁送汤?
Mark Chen:我还想过,下次团队团建我打算带大家去上烹饪课。
不过我确实学到了一些关于招聘的事情。
Q:你自己煮汤了吗?
Mark Chen:呃,其实最好还是买米其林级别的汤,你懂吧?
但我确实在这件事上学到了不少,比如怎样更积极地争取顶尖人才。
让我很受启发的一点是,在OpenAI,即使是那些最后去了Meta的人,我也从来没听谁说“AGI会先由Meta做出来”。
大家都对OpenAI的研究路线非常有信心。
而我明确告诉团队,我们不会跟Meta追逐报价对标。
在Meta的报价倍数远高于我们的情况下,人们仍然愿意留在OpenAI,这让我非常有信心。
他们真的相信这里的未来,相信我们能做成。
Q:你和Alex呢?他以前擅长数学竞赛,你们肯定一起玩过。
Mark Chen:我们以前确实一起玩过几次,但现在不怎么联系了。
Q:为什么汤会变成主流?
Mark Chen:我也不知道。汤、花,或者你能想到的任何东西都出现过。
但我觉得人生就是冒险嘛,我也乐得顺势玩玩这个梗。
Q:那你在想策略的时候,会用到什么扑克心法吗?
Mark Chen:我觉得这又回到媒体叙事的问题。目标不是留住组织里“每一个人”,而是相信我们的人才培养体系,并弄清楚我们必须留下的是哪一类关键人物,然后确保他们留下。
而在这一点上,我们做得非常出色。
Q:Sam一直非常喜欢研究,他是老板是最顶层的那个人。
而你和Jakub Pachocki(OpenAl的首席科学家)则一起塑造OpenAI的研究方向,然后还能决定哪些项目能获得多少算力。
所以你等于既要规划OpenAI的前进方向,也要负责执行层面,比如到底怎么把那些算力投入项目中。
而这在我看来完全是个“噩梦级别”的工作,因为我脑补大家为了从你那里弄到GPU会用尽各种手段。
Mark Chen:人们在想办法搞到GPU时会非常有创造力,各种后门交易的点子都会出现。
但你说得对,这确实是工作中的一个关键部分:
确定研究组织的优先级,并为执行负责。
关于第一点,其实Jakub和我有一个流程,大概每1–2个月会整体梳理OpenAI所有在进行的项目,这是一张巨大的表格,大约有300个项目。
我们尽可能深入地理解每一个项目,并给它们排优先级。
对于一家500人规模的公司来说,让大家理解组织的核心优先事项非常重要。
这些优先级不仅通过口头明确传达,也通过我们如何分配算力来传达。
Q:你提到500名研究人员,也就是这个现在拥有数千名员工的组织中最核心的研究团队,对吧?
Mark Chen:对。
Q:你说有300个项目,我想象其中肯定有一些是巨大的前沿模型,也有一些是研究人员正在做的小型实验。
那你们到底如何跟踪所有这些项目,并得出哪些项目应该分到GPU、哪些不应该?
Mark Chen:在做这类优先级梳理的时候,保持核心路线是很重要的。
我认为OpenAI与其他大型实验室最大的不同之一,就是OpenAI从一开始就把探索性研究作为核心。
我们并不是那种去复现别的实验室成果、去追赶别人benchmark的公司,那不是我们的核心能力。
我们一直在尝试找出下一种范式是什么,并愿意投入资源确保我们真的能找到它。
可能很多人会对此感到惊讶。
事实上,我们在“探索下一代范式”上投入的算力,比训练最终产物本身还要多。
Q:但问题是,你们如何避免被个人的推销说服?
因为每个人都会觉得自己的项目非常重要。
当我想到这个,我就会想起《纽约时报》每天都有头版头条,每个人都想上头版,每个人都觉得自己的故事是最重要的,每个人都竭尽全力告诉你为什么这件事重要。
他们都花了数周甚至数月做出那个成果,所以对他们来说这就是生死攸关。
Mark Chen:你必须做的最艰难的决定之一就是:这个项目,我们现在就是没法给它资源。
但我也认为,这是好的领导力。
你必须清晰沟通,这些是我们真正的优先事项,这些是我们要推进的内容,这些是我们认为能推动研究方向的重要结果。
其他事可以做,但它们必须明确是第二优先级。
02
回应谷歌Gemini 3
Q:你提到不要被竞争对手牵着走。
你认为其他公司有时候很被动,而你们过去处在领先位置,制定了行业标准,所以他们才需要对你们的成果做出反应。
刚好前几天Gemini 3发布,在这种竞争回合中,你们的对手有时显然会根据你们来行动。
我知道benchmark的价值常被争论,但大家确实会比这些。
那你们如何在这种环境下,保持那种“我们只做我们认为正确的事”的心态呢?
Mark Chen:我认为如今的AI研究环境比以往任何时候都更加竞争激烈。
但关键是不要被竞争动态困住。
因为你永远可以说:“我们发布一个小更新,就能领先竞争对手几周或几个月。”
但那不是一种长期可持续的研究方式。
如果你能突破下一代范式,那重要性完全不在一个数量级,你将决定整个领域的演化,你会理解围绕这一思想领域所有的旁支方向。
以我们在“思考(Reasoning)”方向的研究为例,在两年多前,我们就押注我们会在语言模型的思考能力上取得突破。
当时这个押注非常不受欢迎。
现在看起来显而易见,但那时的氛围是:预训练非常有效,后训练(post-training,包括RLHF等)也非常有效,为什么还要投资源做其他东西?
而今天你问任何人,他们都会说语言模型的思考能力是不可或缺的。
所以,我们承担的是大胆的押注,去探索如何扩展,如何构建能在未来成百上千倍算力下仍能工作的算法。
Q:随着公司发展,这显然变得更难了。
你们一开始是一个几乎纯研究的组织,但今天的OpenAI有产品线,有些部门看起来更像成熟的微软或谷歌。
通常来说,随着时间推移,公司会逐渐变成更关注能带来营收的部分,而非花大量钱做研究,研究经费往往会不断被挤压。
Mark Chen:我认为这正是OpenAI最特别的地方之一。
我们本质上仍然是一家纯AI研究公司。
你很难再找到另一家真正能这么说的公司。
我们最初成立时是非营利组织,我加入时也是那个时代。
当时的精神是,为了推动AGI研究,可以不惜一切代价,当然要以安全方式推进。
而我确实认为,这反而是创造价值的最佳方式。
如果你赢得了研究,价值创造是顺带发生的。
我觉得真正的陷阱是迷失在那些“让我们提升利润率吧”的目标里。
因为如果你的研究做到最好,其实那部分价值非常容易实现。
Q:你是2018年加入的。那么你觉得,那种“灵魂”、那种核心文化与核心使命……
Mark Chen:是的,那个核心文化和核心,确实持续存在。
Q:埃隆怎么说?他说我们不应该叫你们研究员?这只是工程师,对吧?
Mark Chen:我觉得这话有它的道理,因为一旦你设置了一个“层级”,比如把研究科学置于工程之外的部分,那你在某种意义上就已经输了。
因为在构建大型模型时,真正重要的是,你能否在实践中不断优化那些1%的细节,如何让kernel快一点?
如何确保数值计算足够稳定?
这些都是深度工程能力。
如果你没有这些东西,就根本无法把训练规模扩大到我们今天使用的GPU数量。
Q:但我想说的是,研究员和工程师之间确实有种神秘感上的差别。
你觉得保持一种“平视心态”比较好,是这个意思吗?
Mark Chen:我觉得研究员的类型其实非常多样。我们最优秀的一些研究员,他们的特点是,能提出无数种想法。
其中大部分不行,但就在你开始怀疑“这个人真的值得吗”的时候,他们突然又冒出一个惊为天人的点子。
还有一些研究员非常擅长沿着明确的路径执行,把事情做到极致。
所以研究员的类型太多了,根本很难把他们塞进一个刻板的类别里。
Q:Gemini 3刚发布不久,我很好奇,当一个竞争对手发布新模型时,你个人,或者你们团队,会怎样反应?
是大家都会去看它能做什么吗?
你们会不会有一些常用的prompt、常用的问题,去试探这些新模型有什么能力?
Mark Chen:关于Gemini 3,具体来说,它是个不错的模型。
我们会做的一件事是建立内部共识。
因为benchmark其实只能告诉你有限的信息。
就benchmark数据本身来看,我们其实相当有信心:
我们内部已经有性能达到Gemini 3的模型,而且我们相当确定很快就会发布这些模型,并且能发布表现更好的下一代模型。
但再次强调,benchmark只揭示了一部分内容。
每个人都会用自己的方式去“试探”新模型。
我有一个自己常用的题,到目前为止,没有哪个模型真正解决过,甚至是所谓的“thinking models”也没完全做出来。所以我还在等。
Q:这是个秘密数学问题吗?
Mark Chen:不是,不过……如果我在这里公开讲了,它可能以后就被训练进去(笑)。
这是过去一年我很喜欢的一个谜题,叫作“42问题”:
核心是借助若干个模数为小于42的素数的随机数生成器,用最少的调用次数搭建出模数为42的随机数生成器(RNG)。
这题很可爱。
语言模型总是能接近最优解,但我还没见过哪个真正把它完全做出来。
Q:这实际上引出了我接下来本来就想问的问题。
但在此之前,我知道你很有竞争心,你说过“我热爱竞争,但我极度讨厌输”,所以如果我们知道Gemini 3会在周四发布,你会不会在凌晨12点就把那道题丢给它?还是没有那么夸张?
Mark Chen:不会啦,我认为这是一个长周期的事情。
我是那种会有阶段性执念的人,但任何事业你都得用长期博弈的心态去做。
例如过去半年,我们一直专注在预训练(pre-training)上。
这是我和Jakub一起推动的方向,打造预训练的核心能力、组建顶尖团队、确保预训练所有关键都得到足够重视。
而正是这些投入,让我们今天能产出这样的模型,在预训练方面,我们就有信心轻松与Gemini 3正面对决。
03
大学室友带入坑编程
Q:我知道你高中也参加数学竞赛,甚至是从小学一路参加到高中,你是不是也参加IOI(国际信息学奥林匹克竞赛)?
Mark Chen:我很晚才开始写代码,是大学室友带我入坑的。
当时我还是一个满怀自负的数学人,觉得数学才是最纯粹、最困难的科学,真正的能力需要在数学中证明。
回头看,那时候我可能太沉浸在竞争里了。
但编程后来变成一件非常令人有成就感的事情。
开始它只是一个让我能继续和大学朋友保持联系的方式,毕业之后,我们每个周末都会一起上线做比赛。
渐渐地,我发现自己挺有天赋。
后来我开始在比赛中拿不错的成绩,然后开始给比赛出题,比如给USA Coding Olympiad出题。
最终我也开始担任教练,这是一个很棒的社区,我也在里面遇到了很多像Scott这样的人。
Q:你当时是在MIT?
Mark Chen:不是,我是毕业之后参加的。
最近比赛还有一个让我特别有感的地方,当我们把现代语言模型投入这些比赛题目时,它们的表现非常强。
而且它们的思维方式跟人类完全不同。
我们一直以为AI擅长模式识别,如果新题能映射到旧题,它就能解。
但我注意到,有些题目非常临时、技巧性、零散,这让我意识到AI+人类在前沿研究中会出现奇迹,因为AI对“什么是简单/困难”的直觉与人类不一样。
我以为模型绝对做不出来的,结果它们觉得这些题反而比较简单。
Q:是类似AlphaGo那种“人类从没见过的打法”的感觉吗?
Mark Chen:我觉得是的。
GPT-5 Pro出来之后,我真正感觉到前沿科研出现了一个拐点。
一个最好的例子是,发布后三天,我见了一个物理学家朋友,他之前玩过模型,觉得它们可爱但没啥用。
我让他用Pro模型更大胆地试,他把自己最新论文丢进去,模型想了30分钟,然后就把答案给出来了。
他的反应让我想到,李世石看到AlphaGo第37/38手时的表情。
我觉得这种场面在数学、科学、生物、材料科学中只会越来越常见,模型真的已经到这个程度了。
Q:我知道这个问题不新鲜——从深蓝、到AlphaGo,人们一直在问,当AI开始解决那些被人类视为“巅峰智力成就”的问题时,会不会让人感到某种悲伤?
Mark Chen:嗯,有,也没有。
我编程水平不错,但不属于最顶尖的那一批,所以对我来说……或许这算是“复仇”。
但认真说,我确实经历过一种“时刻”。
在我们开发思考模型期间,我们持续监控模型在竞赛题的表现。
一开始,它们表现并不好,大概就普通参赛者水平。
但随着时间推移,它们的能力不断提升,直到有一天,我走进会议室,看到模型的评分曲线越过了我自己的最高水平。
那一刻我真的震惊,“哇,我们到了这种程度,这么快?”
Jakub当时还稍稍得意,但也就过了一两个月,模型也超过了他。
今天,模型已经稳稳站在前沿了。
你能从我们今年夏天在Coder比赛上的成绩看出来那是世界顶级算法竞赛,模型拿了第二名。
它在一年内从世界第100名,跳到了世界前5。
Q:那十年后,我们还会办这种竞赛吗?
Mark Chen:我觉得会。它们很好玩。
尽管有些人做这些比赛是为了写简历,但真正热爱它的人,是因为它本身有趣,这种乐趣不会消失。
Q:在我写报道时,有人告诉我,一些国家,IOI拿牌基本等于“随便挑大学,免费入学”。
Mark Chen:你不觉得面试这些传统方式,很快也会被模型彻底打破吗?
大学考试、作业,也基本全被打破了。
我们确实需要新的方式来评估一个人,他学到了什么?他的实际能力在哪?
我其实一直有个想法,也许我们以后的面试,可以直接让候选人去跟ChatGPT对话。
不过是一个“特殊版本”的ChatGPT,这个模型的任务不是回答问题,而是判断你是不是真的懂相关内容、你的能力水平有没有达到在OpenAI工作的标准。
你要通过和它的对话,说服它你是一个适合OpenAI的人。
当然,你不能“越狱”它,然后我们再去看这段对话的记录。也许未来这种测试方式,会更准确地反映一个人到底懂不懂。
Q:我觉得你的背景很有趣,你从小接触过多个创新中心,尤其是你父母又在Bell Labs。后来你去了MIT,对吧。
Mark Chen:哦天哪,2012那一届真是太强了。
Q:有没有那种“全明星名单”?
Mark Chen:比如Jacob Steinhardt,现在在做Transluce公司,我们当时还一起上计算机课、一起做项目。
还有Paul Christiano,他也在OpenAI工作过。
刚才说到竞技编程那一挂,还有像Scott Wu,现在在Cognition,他现在在X上简直成了“数学梗王”。
Q:现在我看到你们这群人的“竞技一面”,已经主要转移到扑克上了。
之前我们在一个活动上深夜我路过一张桌子,看到你、Scott以及其他几个人,围在桌边打扑克,我不知道对你们来说算不算紧张,但对我来说气氛挺严肃的。
所以你们现在是把数学和竞争都用在扑克上了吗?
Mark Chen:扑克是个非常有趣的游戏。
我之前说过,我的人生就是一系列“阶段性痴迷”。
扑克曾经就是我其中一个超级痴迷的阶段。
对我来说,扑克的重大启发是,它本质上远非一场读心和诈唬的博弈,而是一场数学游戏。
你对扑克了解得越多,越会往这个方向修正自己的认知:
它本质上是概率与期望值的博弈。
当你从数学角度判断出诈唬是正确选择时,做这件事就变得易如反掌了,你不会紧张,因为你知道这是对的。
而且很有意思的是,扑克在大众印象中非常“人类化”,好像是关于心理、直觉、演技的游戏。
但真正的获胜机制,是极其深度的数学。前阵子我还在想,语言模型也有点像这样。
语言的生成是一个非常“人类”的过程,但现在有一台数学机器,可以做到和我们一样甚至更好。
Q:我自己是写作的人,这部分我几乎每天都在想,我大学时还学了一堆哲学,都是在想语言、意义这些东西。
你和Scott在我眼里都是“数学强得不太像凡人”的那种人,我完全不理解你们怎么在计算上还能互相拉开差距,你们打牌时,怎么区分谁更强?
Mark Chen:其实,说实话,我们现在更多是把它当作一个聚会场合,一个可以坐下来聊天、叙旧的平台。
如果把扑克太当回事,反而会把乐趣抽干。
我对扑克的那种“痴迷期”在十多年前就已经过去了,现在就是单纯觉得好玩。
Q:你这是因为我看到Scott连赢了两天,才这么说的吧?
Mark Chen:你可能说到点子上了。
Q:他确实打得挺认真。
Mark Chen:不过在回程飞机上我赢了。不是一对一,大概还有三四个人一桌。
04
离开华尔街,走向AI
Q:我感觉,尤其如果把时间拨回到2018年前后,在AI领域高层的人,大致能分成三类路径:
一类是学术出身;一类是数学天才后来去做机器人、物理之类;
还有一类是从华尔街来的,做高频交易、量化。
你走的是第三条,从MIT毕业后,直接去了华尔街。
Mark Chen:我其实并不为那段经历深以为荣,坦白讲。
但这确实是MIT那些数学/量化很强的学生当时常走的一条路。
它确实是一个非常唯才是举的体系,你只要聪明、会算,你的能力会直接反映成非常具体的奖赏,就是你赚的钱。
但对我来说,那里的文化有点难受。
那地方,如果你发现了什么突破、什么窍门,你的第一反应是尽可能别让别人知道。
因为你的知识,就是你赖以生存的价值。
所以在公司内部,你会看到各种竞争性的关系,人们彼此之间并不真正信任。而且整个生态系统非常封闭。
比如今天,如果某个团队让他们的算法快了,世界上没有其他人感受到它,它不会对任何更大的世界起作用。
我在那儿待了四五年后,有一天醒来突然意识到,我们还是在和完全相同的一群玩家竞争,大家都变快了一点,但世界有因此而变得更好吗?
答案是:没有。
那一刻我觉得,是时候去做别的事情了。
很多事情在那时同时发生,比如AlphaGo的大战,那对OpenAI很多人都是巨大启发。
Q:你下围棋吗?
Mark Chen:不下。但关键不是围棋本身,而是机器竟然能做出那么有创造力的东西。
我特别想弄明白背后到底发生了什么。
Q:当时你有读AI论文吗?
Mark Chen:老实说,完全没有。
直到那场对局,我才真正被点燃。那之后我开始疯狂深入AI。
我给自己定的目标之一是复现DQN的结果。
DQN是能够在Atari游戏上打出超人水平的深度网络。
从那里开始,我正式走上了AI之路。
Q:那你是白天工作、晚上回家自己搞研究?
Mark Chen:对,就是这样。
Q:我还记得2018年左右我采访George Hotz的时候,他说过一句让我印象深刻的话。
他说AI领域非常年轻,年轻到一个人只要读10/20/30篇论文(记不清到底多少篇了),就能学到整个领域的核心。
确实很有趣,AI是一个历史很久但“现在这个时刻非常浅”的领域。
Mark Chen:我给那些对AI感到畏惧的人一个建议:它很浅。
花三到六个月,选一个项目(比如复现DQN),你就能非常快地走到前沿。
最近几年这个领域是变“深”了一点,但和理论数学、物理比差得远。
Q:我问过Jakub,在数学里,很多人都是20多岁做出最伟大的工作,之后再难有突破。
AI也是这样吗?
我们是否依赖年轻人去读论文、突然灵光乍现?
还是说这是一个人可以干一辈子的领域?
Mark Chen:我觉得AI是一个可以一直做下去的领域。
虽然OpenAI本身文化相对年轻,但我不认为你必须年轻才能做出好研究。
年轻人最大的优势可能是,他们没有太多先入为主,不会被“事情应该怎么做”所框住。
随着年纪增长,你会形成自己的愿景,这是好事,但也会把你锁在某种思维模式里“研究就是这样做的,结果就是这样出来的”。
年轻研究员在这方面更有可塑性。
05
2018年加入OpenAI:
20人的小团队
Q:你职业生涯在OpenAI的发展很有意思,看起来你好像一开始就担任很重要的位置。
但你2018年加入时OpenAI只有……50人?
Mark Chen:更少,大概20人左右。当时基本就是两个团队。
我以Residency(常驻研究员)的身份加入,意思是,不是专家不是PhD,而是OpenAI想要投资、培养、从其他领域转进来的人。
Residency的前半段像是一个六个月压缩版PhD,之后才开始深入项目做研究。
我每天都和Ilya聊,他给我定课程、定项目,我遇到不懂的就去问他“这个方向为什么重要”“为什么大家会研究这个”。
Q:领英上写你加入就当了前沿研究主管?
Mark Chen:不,那不是我在Open的第一份工作。
我前面大概有三年都是做IC(个人研究员)。
我当时做的是生成式建模,因为那是Ilya当时最关注的方向。
管理团队是后来才开始的。
06
从ImageGPT到DALL·E:
语言模型之外的生成模型
Q:DALL·E是公众第一次真正认识OpenAI生成模型的项目吗?
Mark Chen:对。而DALL·E也标志着我从IC转向管理者。
在那之前,我最自豪的项目之一是ImageGPT,证明即使不是语言,你把图像丢进 Transformer,模型一样能学到非常强的表示。
它能理解图像内容,并展示出“语言建模方法可以用在非文本领域”的可行性。
另一个我很骄傲的IC项目是Codex,我搭建了很多评估代码模型的框架,并深度研究如何让语言模型变成强大的代码模型。
Q:所以你为什么选择OpenAI?
我其实能理解两种观点,一方面OpenAI是小池塘里的大鱼,有趣的人集中在这里;
但另一方面,2018年的OpenAI才20个人,在我看来,这东西看起来根本不可能成功。
Google当时已经主导AI,感觉AI是一件需要几十亿美元、几十年积累的事情,而那时就算连Scaling Law都还没真正形成概念。
那对你来说,这是一个困难的决定吗?还是你只是刚好撞进了OpenAI?
Mark Chen:我觉得有两点非常重要:
第一,你需要有宏大的愿景;
第二,你需要有能支撑这份愿景的人才。
当时的OpenAI具备这两点。
他们的野心非常大,而人才也强到足以把这个愿景变成现实。
我很幸运,Greg Brockman,我们大学以前就认识。
Q:你们在MIT有交集?
Mark Chen:其实我们更早,在高中时就一起参加过数学竞赛。
所以当时我给他发了条消息:“我不知道自己技能是否合适,但你们在做的事情看起来非常伟大。”
对我来说,今天这件事仍然很难以置信,我当时完全是“从天而降”加入的,而现在却负责研究方向。这对我来说也超现实。
从IC转成管理者那一步,我其实一度非常犹豫。
因为我不知道自己是否适合管理,而且那时我真的很享受IC的工作——
做研究、合作顺畅、成果突出,我玩得很开心。
但后来整个旅程就……真的非常疯狂。
Q:你给人的感觉一直是温和、理性、好相处的人。
但OpenAI的历史,说实话,有些部分非常戏剧化,甚至有点像肥皂剧、像《权力的游戏》那种“宫斗”。
要在那样的环境中做管理者……回头看,真的挺难想象的。
我觉得现在比之前平静了很多,但过去的那些时刻,你需要处理的事情,感觉与你的性格很不一样。
Mark Chen:老实说,我在OpenAI非常幸运。
我的经理们都非常支持我、为我发声。
在我做IC时,Wojciech Zaremba(OpenAI联创)就说:“哦,CodeX这个项目应该押注在他身上。”
我从未向任何人要求晋升或调级,这些都是自然发生的。
一路上,我得到很多很好的建议,我觉得管理的成长,本质上是靠“次数”累积,你要不断练习,没有比OpenAI更能给你练习机会的地方了,永远有新的挑战出现。
随着时间,你也会建立自信。
我现在相信,管理更多是经验,而不是天赋。
07
OpenAI“宫斗”那段时期
Q:我猜测你可能不太想详细谈“宫斗”那次风波。
Mark Chen:没关系,我愿意谈任何事情。
Q:我采访了很多人,也有不少独家素材要留给我的书。
但有几个时刻,我特别想问你,在那段混乱中,你帮助研究员们统一意见、促成那封让Sam回归的请愿信。
然后一两天之后,你在Greg家或者Chelsea家,做过一次很重要的短讲,是吗?
Mark Chen:是在Chelsea家。
而那两个时刻,不管是推动研究员签联名信,还是在那场聚会上的讲话,对我来说都是非常重要的瞬间。
Q:你站出来,为你相信的东西发声,并把队伍重新团结起来。
Mark Chen:是的,对我来说,那确实是一个关键时刻。
在那次风波后的几天里,整个公司都笼罩在不确定性中。
我、Nick(Nick Turley,ChatGPT产品负责人)、Barrett(Barret Zoph,OpenAI前研究副总裁)当时都感觉到一种责任感:“狼就在门口了。”
大家都不断收到来自各大实验室的电话:“要不要来我们这儿工作?”
我当时给自己定下一个目标,我不会失去任何一个人。
而且我们真的没有失去任何人。
那几天我们几乎每天都把自己的家打开,让大家有一个可以来倾诉焦虑、互相陪伴的地方,我们也帮助大家持续与核心领导层保持联系,让他们感觉自己能参与、有发声权。
随着时间推移,大家形成了一种非常强烈的共同体精神:
“我们一起面对这一切”“我们要向外界表明我们是一条心的”。
当时我在几处房子之间来回走,后来我们有了一个想法,我们需要向世界展示,我们团结一致,并且愿意为Sam工作。
于是请愿信就这样成形了。
这个主意大概在凌晨2点定下来,到了早上,研究组超过90%的人已经签名。
大家互相给朋友打电话“你赞成还是不赞成?你要不要签?”
最终,大概近100人签了那个请愿信。
Q:那应该让你陷入一个很困难的位置吧?
因为一开始看起来像是,Ilya和Sam站在对立面。
Ilya又是你的导师,后来Sam又回到团队……
这一切会不会让你觉得尴尬?
Mark Chen:不,不是尴尬,是困难。
在那种信息极少的环境下,很难看清真相。
你完全可以合理地问:“Sam到底做错了什么?”
Greg和Jakub这两个极具正直的人有辞职来表达立场吗?
我觉得有部分故事被严重误解了。
08
关于Jakub:
大家不知道但应该知道的事
Q:Jakub已经在OpenAI很久了,你觉得外界不了解但应该知道的是什么?
Mark Chen:他其实超——级——搞笑。
是一种非常讽刺式的幽默,经常把我笑疯。
我最喜欢OpenAI现状的一点就是,我和Jakub的高度一致性。
我们走进会议室,只需要互相抛几个想法,很快就能达成一致,然后对外发出同一个信息,再一起去处理路线图的不同部分。
能和他一起工作,是一种巨大的荣幸。
OpenAI的研究团队至今仍“被攻击”。
我们是一家人。
但我们永远都在被攻击。
当一个新团队开始组建时,他们第一步是什么?从OpenAI挖人。
他们想要我们的经验、愿景、哲学,毕竟我们培养了大量顶尖研究员。
我今天依然有同样的保护欲,如果有人来挖我们的人,我会不惜一切让我们的研究员开心、安心,并让他们知道自己的角色在路线图中的位置。
Q:我在写书时、或实时观察事件时,一直挣扎于一个问题——
当我回顾整个AI历史,2012年Ilya产生了重大突破、2017年Vaswani等人提出Transformer,Alec Radford推动了另一批重要成果,这些都是像“英雄人物”一样的突破
AI领域还非常年轻,看起来可能就是那8到10个人不断推动领域前进。
所以当John Schulman离开,Alec离开……
我当时心里想:哇,如果你们失去这部分全明星阵容,那怎么继续?这不像一个能轻易替换人才的领域。
但令人惊讶的是,就在那之后,你们在reasoning方向和其他前沿方向上继续取得突破。这一点对我来说一直很难理解……
Mark Chen:我其实不同意你刚才的说法,把“顶级个人”视为推动研究的唯一方式。
当然,我们确实会自上而下押注方向、下注赛道,但OpenAI也有非常深刻、非常真实的自下而上文化。
很多最好的点子,都来自最意想不到的地方。
而最令人兴奋的,就是看着这些“下注”逐渐成形、被扩展、被放大,比如reasoning(推理/思考)方向,就是这种过程的典型案例。
Q:但我们还是看到谷歌会砸天文数字把Noam Shazeer挖回去,这似乎说明,明星个人非常关键?
Mark Chen:我认为两者是必须并存的。
你必须投资自己的人才管线,因为我完全相信我们培养明星的能力,同时你也必须承认,世界上确实有一些非常顶级的人,每个人都知道他们是谁。
如果我从Meta那边学到一件事,那就是,OpenAI也可以非常激进地去争抢明星人才。
他们用过的一些激进招聘方法,我自己也学了几招。
但最终目标很简单,为我们的使命,组建最强的团队。
Q:好笑的是,这个圈子其实很小。你们明明互相都认识、甚至一起玩、一起出去吃饭……但转头你们却在互相挖对方的人。
Mark Chen:是啊,这是一个在所有维度都竞争残酷的行业。
但我喜欢这样。
我就是极度好胜的人,我讨厌输,不管是在研究还是在招聘上,我都会全力以赴。
Q:你说得没错,这一点让我想到半导体早期,一堆创业公司同时涌现,大家都在突破物理的极限,某家公司刚在一个方向突破,工程师们晚上一起喝啤酒又把想法互相说出来了。
工程师就是这样,他们停不下来,知识自然扩散。
而同时,人人都在挖每一个可能的突破。
Mark Chen:是的。一个公司面对这件事有两种选择:
建立深度信息隔离加强封闭性;
继续保持开放文化,用速度压制对手。
OpenAI明显是第二种,我们不认为封闭是正确方式。
我们的方法是跑得比别人更快。
我喜欢我们的开放文化,研究人员之间自由分享想法,大家都能更快推动进步。
Q:我知道Sam更热爱调研,他对日常经营没那么有激情,从组织结构上也看得出来。
而你和Jakub则是每天都深度泡在技术里。
他则在同时和全世界说话。

