OpenAI首席研究员Mark Chen长访谈：小扎亲手端汤来公司挖人，气得我们端着汤去了Meta



OpenAI首席研究员Mark Chen长访谈：小扎亲手端汤来公司挖人，气得我们端着汤去了Meta

科创最前线

2025-12-04

言无不尽。

来源 | 量子位

救大命，OpenAI首席研究官Mark Chen最新访谈，信息量有点大呀。

不管是OpenAI的，还是自己个儿的，又或者是同事的，主打一个“我都能聊聊”。

比如：

爆料Meta抢人大战私下已经升级成送汤大战了，真能喝的那种汤，小扎熬了亲自送到OpenAI研究员嘴边。OpenAI反击也送汤。
Mark Chen、Scott Gray(OpenAI专门负责GPU内核优化的神秘狠人)等经常三五围坐，打扑克牌。其本质被解释为是概率与期望值的博弈。
OpenAI核心研究团队规模大概500人，公司内大概有300个项目。
Mark Chen表示OpenAI本质上仍然是一家纯AI研究公司。
Gemini 3发布后每个人都会用自己的方式去试探新模型，有个“42问题”从没见过哪个语言模型能真正把它完全做出来。
OpenAI“宫斗”，Mark Chen如何让研究员们统一意见、促成那封让Sam回归的请愿信也被聊了出来。
透露过去半年，一直专注在预训练上，在预训练方面，有信心轻松与Gemini 3正面对决。
表示内部已经有性能达到Gemini 3的模型，很快就会发布这些模型，并且能发布表现更好的下一代模型。
当被问到“你们真的需要那么多算力吗”会觉得很震惊：如果今天多10倍算力，可能几周内就能全部用满。

……

网友纷纷表示，这次访谈确实让人耳目一新，还有不少人在转发Mark Chen的观点。

Mark Chen之所以能够言无不尽，一大关键还在于，本期访谈来自于《Core Memory》，其主持人Ashlee Vance是硅谷知名的科技记者。

他以深入采访硅谷人物和讲述科技创新故事而闻名，更知名的是他那本《硅谷钢铁侠：埃隆·马斯克，创造未来的人》。

量子位对完整访谈进行了翻译整理，在不改变原意的前提下，对语言做了适当润色。

人才争夺战演

变成给人才送汤战

Q：关于人才争夺战，Meta的行为看起来很激进，这种针锋相对的竞争，目前已进入哪个阶段？

Mark Chen：其实就这么一批人才，大家基本都知道他们是谁。

很多公司已经意识到，要打造一个优秀的AI实验室，其中一个关键因素就是要招到最优秀的人才。

所以，Meta这么积极采用这种策略，也不奇怪。

我们当然也没有坐以待毙，我其实想从OpenAI的角度讲讲这个故事。

媒体上把这件事渲染得好像所有人才都单向流向Meta。

但就我看到的情况，Meta去挖了很多人，但多数并不成功。

他们从OpenAI去挖了我大概一半的直接下属，但他们全部都拒绝了。

当然，如果你一年有100亿美元的预算用来挖人，那你肯定会挖到一些人。

所以我其实觉得，我们在保护核心人才方面做得相当不错。

而且看着这件事情不断升级，其实还挺有趣的。

比如扎克伯格真的亲自给他想挖的人送汤，我觉得他是亲手煮的汤。

当时我很震惊，但后来我也意识到，这些方式以某种奇怪的方式，其实是有效的。

所以我后来也给我们想从Meta挖的人送过汤。

Q：你们现在是在比谁送汤？

Mark Chen：我还想过，下次团队团建我打算带大家去上烹饪课。

不过我确实学到了一些关于招聘的事情。

Q：你自己煮汤了吗？

Mark Chen：呃，其实最好还是买米其林级别的汤，你懂吧？

但我确实在这件事上学到了不少，比如怎样更积极地争取顶尖人才。

让我很受启发的一点是，在OpenAI，即使是那些最后去了Meta的人，我也从来没听谁说“AGI会先由Meta做出来”。

大家都对OpenAI的研究路线非常有信心。

而我明确告诉团队，我们不会跟Meta追逐报价对标。

在Meta的报价倍数远高于我们的情况下，人们仍然愿意留在OpenAI，这让我非常有信心。

他们真的相信这里的未来，相信我们能做成。

Q：你和Alex呢？他以前擅长数学竞赛，你们肯定一起玩过。

Mark Chen：我们以前确实一起玩过几次，但现在不怎么联系了。

Q：为什么汤会变成主流？

Mark Chen：我也不知道。汤、花，或者你能想到的任何东西都出现过。

但我觉得人生就是冒险嘛，我也乐得顺势玩玩这个梗。

Q：那你在想策略的时候，会用到什么扑克心法吗？

Mark Chen：我觉得这又回到媒体叙事的问题。目标不是留住组织里“每一个人”，而是相信我们的人才培养体系，并弄清楚我们必须留下的是哪一类关键人物，然后确保他们留下。

而在这一点上，我们做得非常出色。

Q：Sam一直非常喜欢研究，他是老板是最顶层的那个人。

而你和Jakub Pachocki（OpenAl的首席科学家）则一起塑造OpenAI的研究方向，然后还能决定哪些项目能获得多少算力。

所以你等于既要规划OpenAI的前进方向，也要负责执行层面，比如到底怎么把那些算力投入项目中。

而这在我看来完全是个“噩梦级别”的工作，因为我脑补大家为了从你那里弄到GPU会用尽各种手段。

Mark Chen：人们在想办法搞到GPU时会非常有创造力，各种后门交易的点子都会出现。

但你说得对，这确实是工作中的一个关键部分：

确定研究组织的优先级，并为执行负责。

关于第一点，其实Jakub和我有一个流程，大概每1–2个月会整体梳理OpenAI所有在进行的项目，这是一张巨大的表格，大约有300个项目。

我们尽可能深入地理解每一个项目，并给它们排优先级。

对于一家500人规模的公司来说，让大家理解组织的核心优先事项非常重要。

这些优先级不仅通过口头明确传达，也通过我们如何分配算力来传达。

Q：你提到500名研究人员，也就是这个现在拥有数千名员工的组织中最核心的研究团队，对吧？

Mark Chen：对。

Q：你说有300个项目，我想象其中肯定有一些是巨大的前沿模型，也有一些是研究人员正在做的小型实验。

那你们到底如何跟踪所有这些项目，并得出哪些项目应该分到GPU、哪些不应该？

Mark Chen：在做这类优先级梳理的时候，保持核心路线是很重要的。

我认为OpenAI与其他大型实验室最大的不同之一，就是OpenAI从一开始就把探索性研究作为核心。

我们并不是那种去复现别的实验室成果、去追赶别人benchmark的公司，那不是我们的核心能力。

我们一直在尝试找出下一种范式是什么，并愿意投入资源确保我们真的能找到它。

可能很多人会对此感到惊讶。

事实上，我们在“探索下一代范式”上投入的算力，比训练最终产物本身还要多。

Q：但问题是，你们如何避免被个人的推销说服？

因为每个人都会觉得自己的项目非常重要。

当我想到这个，我就会想起《纽约时报》每天都有头版头条，每个人都想上头版，每个人都觉得自己的故事是最重要的，每个人都竭尽全力告诉你为什么这件事重要。

他们都花了数周甚至数月做出那个成果，所以对他们来说这就是生死攸关。

Mark Chen：你必须做的最艰难的决定之一就是：这个项目，我们现在就是没法给它资源。

但我也认为，这是好的领导力。

你必须清晰沟通，这些是我们真正的优先事项，这些是我们要推进的内容，这些是我们认为能推动研究方向的重要结果。

其他事可以做，但它们必须明确是第二优先级。

回应谷歌Gemini 3

Q：你提到不要被竞争对手牵着走。

你认为其他公司有时候很被动，而你们过去处在领先位置，制定了行业标准，所以他们才需要对你们的成果做出反应。

刚好前几天Gemini 3发布，在这种竞争回合中，你们的对手有时显然会根据你们来行动。

我知道benchmark的价值常被争论，但大家确实会比这些。

那你们如何在这种环境下，保持那种“我们只做我们认为正确的事”的心态呢？

Mark Chen：我认为如今的AI研究环境比以往任何时候都更加竞争激烈。

但关键是不要被竞争动态困住。

因为你永远可以说：“我们发布一个小更新，就能领先竞争对手几周或几个月。”

但那不是一种长期可持续的研究方式。

如果你能突破下一代范式，那重要性完全不在一个数量级，你将决定整个领域的演化，你会理解围绕这一思想领域所有的旁支方向。

以我们在“思考（Reasoning）”方向的研究为例，在两年多前，我们就押注我们会在语言模型的思考能力上取得突破。

当时这个押注非常不受欢迎。

现在看起来显而易见，但那时的氛围是：预训练非常有效，后训练（post-training，包括RLHF等）也非常有效，为什么还要投资源做其他东西？

而今天你问任何人，他们都会说语言模型的思考能力是不可或缺的。

所以，我们承担的是大胆的押注，去探索如何扩展，如何构建能在未来成百上千倍算力下仍能工作的算法。

Q：随着公司发展，这显然变得更难了。

你们一开始是一个几乎纯研究的组织，但今天的OpenAI有产品线，有些部门看起来更像成熟的微软或谷歌。

通常来说，随着时间推移，公司会逐渐变成更关注能带来营收的部分，而非花大量钱做研究，研究经费往往会不断被挤压。

Mark Chen：我认为这正是OpenAI最特别的地方之一。

我们本质上仍然是一家纯AI研究公司。

你很难再找到另一家真正能这么说的公司。

我们最初成立时是非营利组织，我加入时也是那个时代。

当时的精神是，为了推动AGI研究，可以不惜一切代价，当然要以安全方式推进。

而我确实认为，这反而是创造价值的最佳方式。

如果你赢得了研究，价值创造是顺带发生的。

我觉得真正的陷阱是迷失在那些“让我们提升利润率吧”的目标里。

因为如果你的研究做到最好，其实那部分价值非常容易实现。

Q：你是2018年加入的。那么你觉得，那种“灵魂”、那种核心文化与核心使命……

Mark Chen：是的，那个核心文化和核心，确实持续存在。

Q：埃隆怎么说？他说我们不应该叫你们研究员？这只是工程师，对吧？

Mark Chen：我觉得这话有它的道理，因为一旦你设置了一个“层级”，比如把研究科学置于工程之外的部分，那你在某种意义上就已经输了。

因为在构建大型模型时，真正重要的是，你能否在实践中不断优化那些1%的细节，如何让kernel快一点？

如何确保数值计算足够稳定？

这些都是深度工程能力。

如果你没有这些东西，就根本无法把训练规模扩大到我们今天使用的GPU数量。

Q：但我想说的是，研究员和工程师之间确实有种神秘感上的差别。

你觉得保持一种“平视心态”比较好，是这个意思吗？

Mark Chen：我觉得研究员的类型其实非常多样。我们最优秀的一些研究员，他们的特点是，能提出无数种想法。

其中大部分不行，但就在你开始怀疑“这个人真的值得吗”的时候，他们突然又冒出一个惊为天人的点子。

还有一些研究员非常擅长沿着明确的路径执行，把事情做到极致。

所以研究员的类型太多了，根本很难把他们塞进一个刻板的类别里。

Q：Gemini 3刚发布不久，我很好奇，当一个竞争对手发布新模型时，你个人，或者你们团队，会怎样反应？

是大家都会去看它能做什么吗？

你们会不会有一些常用的prompt、常用的问题，去试探这些新模型有什么能力？

Mark Chen：关于Gemini 3，具体来说，它是个不错的模型。

我们会做的一件事是建立内部共识。

因为benchmark其实只能告诉你有限的信息。

就benchmark数据本身来看，我们其实相当有信心：

我们内部已经有性能达到Gemini 3的模型，而且我们相当确定很快就会发布这些模型，并且能发布表现更好的下一代模型。

但再次强调，benchmark只揭示了一部分内容。

每个人都会用自己的方式去“试探”新模型。

我有一个自己常用的题，到目前为止，没有哪个模型真正解决过，甚至是所谓的“thinking models”也没完全做出来。所以我还在等。

Q：这是个秘密数学问题吗？

Mark Chen：不是，不过……如果我在这里公开讲了，它可能以后就被训练进去（笑）。

这是过去一年我很喜欢的一个谜题，叫作“42问题”：

核心是借助若干个模数为小于42的素数的随机数生成器，用最少的调用次数搭建出模数为42的随机数生成器（RNG）。

这题很可爱。

语言模型总是能接近最优解，但我还没见过哪个真正把它完全做出来。

Q：这实际上引出了我接下来本来就想问的问题。

但在此之前，我知道你很有竞争心，你说过“我热爱竞争，但我极度讨厌输”，所以如果我们知道Gemini 3会在周四发布，你会不会在凌晨12点就把那道题丢给它？还是没有那么夸张？

Mark Chen：不会啦，我认为这是一个长周期的事情。

我是那种会有阶段性执念的人，但任何事业你都得用长期博弈的心态去做。

例如过去半年，我们一直专注在预训练（pre-training）上。

这是我和Jakub一起推动的方向，打造预训练的核心能力、组建顶尖团队、确保预训练所有关键都得到足够重视。

而正是这些投入，让我们今天能产出这样的模型，在预训练方面，我们就有信心轻松与Gemini 3正面对决。

03 大学室友带入坑编程

Q：我知道你高中也参加数学竞赛，甚至是从小学一路参加到高中，你是不是也参加IOI（国际信息学奥林匹克竞赛）?

Mark Chen：我很晚才开始写代码，是大学室友带我入坑的。

当时我还是一个满怀自负的数学人，觉得数学才是最纯粹、最困难的科学，真正的能力需要在数学中证明。

回头看，那时候我可能太沉浸在竞争里了。

但编程后来变成一件非常令人有成就感的事情。

开始它只是一个让我能继续和大学朋友保持联系的方式，毕业之后，我们每个周末都会一起上线做比赛。

渐渐地，我发现自己挺有天赋。

后来我开始在比赛中拿不错的成绩，然后开始给比赛出题，比如给USA Coding Olympiad出题。

最终我也开始担任教练，这是一个很棒的社区，我也在里面遇到了很多像Scott这样的人。

Q：你当时是在MIT？

Mark Chen：不是，我是毕业之后参加的。

最近比赛还有一个让我特别有感的地方，当我们把现代语言模型投入这些比赛题目时，它们的表现非常强。

而且它们的思维方式跟人类完全不同。

我们一直以为AI擅长模式识别，如果新题能映射到旧题，它就能解。

但我注意到，有些题目非常临时、技巧性、零散，这让我意识到AI+人类在前沿研究中会出现奇迹，因为AI对“什么是简单/困难”的直觉与人类不一样。

我以为模型绝对做不出来的，结果它们觉得这些题反而比较简单。

Q：是类似AlphaGo那种“人类从没见过的打法”的感觉吗？

Mark Chen：我觉得是的。

GPT-5 Pro出来之后，我真正感觉到前沿科研出现了一个拐点。

一个最好的例子是，发布后三天，我见了一个物理学家朋友，他之前玩过模型，觉得它们可爱但没啥用。

我让他用Pro模型更大胆地试，他把自己最新论文丢进去，模型想了30分钟，然后就把答案给出来了。

他的反应让我想到，李世石看到AlphaGo第37/38手时的表情。

我觉得这种场面在数学、科学、生物、材料科学中只会越来越常见，模型真的已经到这个程度了。

Q：我知道这个问题不新鲜——从深蓝、到AlphaGo，人们一直在问，当AI开始解决那些被人类视为“巅峰智力成就”的问题时，会不会让人感到某种悲伤？

Mark Chen：嗯，有，也没有。

我编程水平不错，但不属于最顶尖的那一批，所以对我来说……或许这算是“复仇”。

但认真说，我确实经历过一种“时刻”。

在我们开发思考模型期间，我们持续监控模型在竞赛题的表现。

一开始，它们表现并不好，大概就普通参赛者水平。

但随着时间推移，它们的能力不断提升，直到有一天，我走进会议室，看到模型的评分曲线越过了我自己的最高水平。

那一刻我真的震惊，“哇，我们到了这种程度，这么快？”

Jakub当时还稍稍得意，但也就过了一两个月，模型也超过了他。

今天，模型已经稳稳站在前沿了。

你能从我们今年夏天在Coder比赛上的成绩看出来那是世界顶级算法竞赛，模型拿了第二名。

它在一年内从世界第100名，跳到了世界前5。

Q：那十年后，我们还会办这种竞赛吗？

Mark Chen：我觉得会。它们很好玩。

尽管有些人做这些比赛是为了写简历，但真正热爱它的人，是因为它本身有趣，这种乐趣不会消失。

Q：在我写报道时，有人告诉我，一些国家，IOI拿牌基本等于“随便挑大学，免费入学”。

Mark Chen：你不觉得面试这些传统方式，很快也会被模型彻底打破吗？

大学考试、作业，也基本全被打破了。

我们确实需要新的方式来评估一个人，他学到了什么？他的实际能力在哪？

我其实一直有个想法，也许我们以后的面试，可以直接让候选人去跟ChatGPT对话。

不过是一个“特殊版本”的ChatGPT，这个模型的任务不是回答问题，而是判断你是不是真的懂相关内容、你的能力水平有没有达到在OpenAI工作的标准。

你要通过和它的对话，说服它你是一个适合OpenAI的人。

当然，你不能“越狱”它，然后我们再去看这段对话的记录。也许未来这种测试方式，会更准确地反映一个人到底懂不懂。

Q：我觉得你的背景很有趣，你从小接触过多个创新中心，尤其是你父母又在Bell Labs。后来你去了MIT，对吧。

Mark Chen：哦天哪，2012那一届真是太强了。

Q：有没有那种“全明星名单”？

Mark Chen：比如Jacob Steinhardt，现在在做Transluce公司，我们当时还一起上计算机课、一起做项目。

还有Paul Christiano，他也在OpenAI工作过。

刚才说到竞技编程那一挂，还有像Scott Wu，现在在Cognition，他现在在X上简直成了“数学梗王”。

Q：现在我看到你们这群人的“竞技一面”，已经主要转移到扑克上了。

之前我们在一个活动上深夜我路过一张桌子，看到你、Scott以及其他几个人，围在桌边打扑克，我不知道对你们来说算不算紧张，但对我来说气氛挺严肃的。

所以你们现在是把数学和竞争都用在扑克上了吗？

Mark Chen：扑克是个非常有趣的游戏。

我之前说过，我的人生就是一系列“阶段性痴迷”。

扑克曾经就是我其中一个超级痴迷的阶段。

对我来说，扑克的重大启发是，它本质上远非一场读心和诈唬的博弈，而是一场数学游戏。

你对扑克了解得越多，越会往这个方向修正自己的认知：

它本质上是概率与期望值的博弈。

当你从数学角度判断出诈唬是正确选择时，做这件事就变得易如反掌了，你不会紧张，因为你知道这是对的。

而且很有意思的是，扑克在大众印象中非常“人类化”，好像是关于心理、直觉、演技的游戏。

但真正的获胜机制，是极其深度的数学。前阵子我还在想，语言模型也有点像这样。

语言的生成是一个非常“人类”的过程，但现在有一台数学机器，可以做到和我们一样甚至更好。

Q：我自己是写作的人，这部分我几乎每天都在想，我大学时还学了一堆哲学，都是在想语言、意义这些东西。

你和Scott在我眼里都是“数学强得不太像凡人”的那种人，我完全不理解你们怎么在计算上还能互相拉开差距，你们打牌时，怎么区分谁更强？

Mark Chen：其实，说实话，我们现在更多是把它当作一个聚会场合，一个可以坐下来聊天、叙旧的平台。

如果把扑克太当回事，反而会把乐趣抽干。

我对扑克的那种“痴迷期”在十多年前就已经过去了，现在就是单纯觉得好玩。

Q：你这是因为我看到Scott连赢了两天，才这么说的吧？

Mark Chen：你可能说到点子上了。

Q：他确实打得挺认真。

Mark Chen：不过在回程飞机上我赢了。不是一对一，大概还有三四个人一桌。

离开华尔街，走向AI

Q：我感觉，尤其如果把时间拨回到2018年前后，在AI领域高层的人，大致能分成三类路径：

一类是学术出身；一类是数学天才后来去做机器人、物理之类；

还有一类是从华尔街来的，做高频交易、量化。

你走的是第三条，从MIT毕业后，直接去了华尔街。

Mark Chen：我其实并不为那段经历深以为荣，坦白讲。

但这确实是MIT那些数学/量化很强的学生当时常走的一条路。

它确实是一个非常唯才是举的体系，你只要聪明、会算，你的能力会直接反映成非常具体的奖赏，就是你赚的钱。

但对我来说，那里的文化有点难受。

那地方，如果你发现了什么突破、什么窍门，你的第一反应是尽可能别让别人知道。

因为你的知识，就是你赖以生存的价值。

所以在公司内部，你会看到各种竞争性的关系，人们彼此之间并不真正信任。而且整个生态系统非常封闭。

比如今天，如果某个团队让他们的算法快了，世界上没有其他人感受到它，它不会对任何更大的世界起作用。

我在那儿待了四五年后，有一天醒来突然意识到，我们还是在和完全相同的一群玩家竞争，大家都变快了一点，但世界有因此而变得更好吗？

答案是：没有。

那一刻我觉得，是时候去做别的事情了。

很多事情在那时同时发生，比如AlphaGo的大战，那对OpenAI很多人都是巨大启发。

Q：你下围棋吗？

Mark Chen：不下。但关键不是围棋本身，而是机器竟然能做出那么有创造力的东西。

我特别想弄明白背后到底发生了什么。

Q：当时你有读AI论文吗？

Mark Chen：老实说，完全没有。

直到那场对局，我才真正被点燃。那之后我开始疯狂深入AI。

我给自己定的目标之一是复现DQN的结果。

DQN是能够在Atari游戏上打出超人水平的深度网络。

从那里开始，我正式走上了AI之路。

Q：那你是白天工作、晚上回家自己搞研究？

Mark Chen：对，就是这样。

Q：我还记得2018年左右我采访George Hotz的时候，他说过一句让我印象深刻的话。

他说AI领域非常年轻，年轻到一个人只要读10/20/30篇论文（记不清到底多少篇了），就能学到整个领域的核心。

确实很有趣，AI是一个历史很久但“现在这个时刻非常浅”的领域。

Mark Chen：我给那些对AI感到畏惧的人一个建议：它很浅。

花三到六个月，选一个项目（比如复现DQN），你就能非常快地走到前沿。

最近几年这个领域是变“深”了一点，但和理论数学、物理比差得远。

Q：我问过Jakub，在数学里，很多人都是20多岁做出最伟大的工作，之后再难有突破。

AI也是这样吗？

我们是否依赖年轻人去读论文、突然灵光乍现？

还是说这是一个人可以干一辈子的领域？

Mark Chen：我觉得AI是一个可以一直做下去的领域。

虽然OpenAI本身文化相对年轻，但我不认为你必须年轻才能做出好研究。

年轻人最大的优势可能是，他们没有太多先入为主，不会被“事情应该怎么做”所框住。

随着年纪增长，你会形成自己的愿景，这是好事，但也会把你锁在某种思维模式里“研究就是这样做的，结果就是这样出来的”。

年轻研究员在这方面更有可塑性。

05 2018年加入OpenAI：

20人的小团队

Q：你职业生涯在OpenAI的发展很有意思，看起来你好像一开始就担任很重要的位置。

但你2018年加入时OpenAI只有……50人？

Mark Chen：更少，大概20人左右。当时基本就是两个团队。

我以Residency（常驻研究员）的身份加入，意思是，不是专家不是PhD，而是OpenAI想要投资、培养、从其他领域转进来的人。

Residency的前半段像是一个六个月压缩版PhD，之后才开始深入项目做研究。

我每天都和Ilya聊，他给我定课程、定项目，我遇到不懂的就去问他“这个方向为什么重要”“为什么大家会研究这个”。

Q：领英上写你加入就当了前沿研究主管？

Mark Chen：不，那不是我在Open的第一份工作。

我前面大概有三年都是做IC（个人研究员）。

我当时做的是生成式建模，因为那是Ilya当时最关注的方向。

管理团队是后来才开始的。

06 从ImageGPT到DALL·E：

语言模型之外的生成模型

Q：DALL·E是公众第一次真正认识OpenAI生成模型的项目吗？

Mark Chen：对。而DALL·E也标志着我从IC转向管理者。

在那之前，我最自豪的项目之一是ImageGPT，证明即使不是语言，你把图像丢进 Transformer，模型一样能学到非常强的表示。

它能理解图像内容，并展示出“语言建模方法可以用在非文本领域”的可行性。

另一个我很骄傲的IC项目是Codex，我搭建了很多评估代码模型的框架，并深度研究如何让语言模型变成强大的代码模型。

Q：所以你为什么选择OpenAI？

我其实能理解两种观点，一方面OpenAI是小池塘里的大鱼，有趣的人集中在这里；

但另一方面，2018年的OpenAI才20个人，在我看来，这东西看起来根本不可能成功。

Google当时已经主导AI，感觉AI是一件需要几十亿美元、几十年积累的事情，而那时就算连Scaling Law都还没真正形成概念。

那对你来说，这是一个困难的决定吗？还是你只是刚好撞进了OpenAI？

Mark Chen：我觉得有两点非常重要：

第一，你需要有宏大的愿景；

第二，你需要有能支撑这份愿景的人才。

当时的OpenAI具备这两点。

他们的野心非常大，而人才也强到足以把这个愿景变成现实。

我很幸运，Greg Brockman，我们大学以前就认识。

Q：你们在MIT有交集？

Mark Chen：其实我们更早，在高中时就一起参加过数学竞赛。

所以当时我给他发了条消息：“我不知道自己技能是否合适，但你们在做的事情看起来非常伟大。”

对我来说，今天这件事仍然很难以置信，我当时完全是“从天而降”加入的，而现在却负责研究方向。这对我来说也超现实。

从IC转成管理者那一步，我其实一度非常犹豫。

因为我不知道自己是否适合管理，而且那时我真的很享受IC的工作——

做研究、合作顺畅、成果突出，我玩得很开心。

但后来整个旅程就……真的非常疯狂。

Q：你给人的感觉一直是温和、理性、好相处的人。

但OpenAI的历史，说实话，有些部分非常戏剧化，甚至有点像肥皂剧、像《权力的游戏》那种“宫斗”。

要在那样的环境中做管理者……回头看，真的挺难想象的。

我觉得现在比之前平静了很多，但过去的那些时刻，你需要处理的事情，感觉与你的性格很不一样。

Mark Chen：老实说，我在OpenAI非常幸运。

我的经理们都非常支持我、为我发声。

在我做IC时，Wojciech Zaremba（OpenAI联创）就说：“哦，CodeX这个项目应该押注在他身上。”

我从未向任何人要求晋升或调级，这些都是自然发生的。

一路上，我得到很多很好的建议，我觉得管理的成长，本质上是靠“次数”累积，你要不断练习，没有比OpenAI更能给你练习机会的地方了，永远有新的挑战出现。

随着时间，你也会建立自信。

我现在相信，管理更多是经验，而不是天赋。

07 OpenAI“宫斗”那段时期

Q：我猜测你可能不太想详细谈“宫斗”那次风波。

Mark Chen：没关系，我愿意谈任何事情。

Q：我采访了很多人，也有不少独家素材要留给我的书。

但有几个时刻，我特别想问你，在那段混乱中，你帮助研究员们统一意见、促成那封让Sam回归的请愿信。

然后一两天之后，你在Greg家或者Chelsea家，做过一次很重要的短讲，是吗？

Mark Chen：是在Chelsea家。

而那两个时刻，不管是推动研究员签联名信，还是在那场聚会上的讲话，对我来说都是非常重要的瞬间。

Q：你站出来，为你相信的东西发声，并把队伍重新团结起来。

Mark Chen：是的，对我来说，那确实是一个关键时刻。

在那次风波后的几天里，整个公司都笼罩在不确定性中。

我、Nick（Nick Turley，ChatGPT产品负责人）、Barrett（Barret Zoph，OpenAI前研究副总裁）当时都感觉到一种责任感：“狼就在门口了。”

大家都不断收到来自各大实验室的电话：“要不要来我们这儿工作？”

我当时给自己定下一个目标，我不会失去任何一个人。

而且我们真的没有失去任何人。

那几天我们几乎每天都把自己的家打开，让大家有一个可以来倾诉焦虑、互相陪伴的地方，我们也帮助大家持续与核心领导层保持联系，让他们感觉自己能参与、有发声权。

随着时间推移，大家形成了一种非常强烈的共同体精神：

“我们一起面对这一切”“我们要向外界表明我们是一条心的”。

当时我在几处房子之间来回走，后来我们有了一个想法，我们需要向世界展示，我们团结一致，并且愿意为Sam工作。

于是请愿信就这样成形了。

这个主意大概在凌晨2点定下来，到了早上，研究组超过90%的人已经签名。

大家互相给朋友打电话“你赞成还是不赞成？你要不要签？”

最终，大概近100人签了那个请愿信。

Q：那应该让你陷入一个很困难的位置吧？

因为一开始看起来像是，Ilya和Sam站在对立面。

Ilya又是你的导师，后来Sam又回到团队……

这一切会不会让你觉得尴尬？

Mark Chen：不，不是尴尬，是困难。

在那种信息极少的环境下，很难看清真相。

你完全可以合理地问：“Sam到底做错了什么？”

Greg和Jakub这两个极具正直的人有辞职来表达立场吗？

我觉得有部分故事被严重误解了。

08 关于Jakub：

大家不知道但应该知道的事

Q：Jakub已经在OpenAI很久了，你觉得外界不了解但应该知道的是什么？

Mark Chen：他其实超——级——搞笑。

是一种非常讽刺式的幽默，经常把我笑疯。

我最喜欢OpenAI现状的一点就是，我和Jakub的高度一致性。

我们走进会议室，只需要互相抛几个想法，很快就能达成一致，然后对外发出同一个信息，再一起去处理路线图的不同部分。

能和他一起工作，是一种巨大的荣幸。

OpenAI的研究团队至今仍“被攻击”。

我们是一家人。

但我们永远都在被攻击。

当一个新团队开始组建时，他们第一步是什么？从OpenAI挖人。

他们想要我们的经验、愿景、哲学，毕竟我们培养了大量顶尖研究员。

我今天依然有同样的保护欲，如果有人来挖我们的人，我会不惜一切让我们的研究员开心、安心，并让他们知道自己的角色在路线图中的位置。

Q：我在写书时、或实时观察事件时，一直挣扎于一个问题——

当我回顾整个AI历史，2012年Ilya产生了重大突破、2017年Vaswani等人提出Transformer，Alec Radford推动了另一批重要成果，这些都是像“英雄人物”一样的突破

AI领域还非常年轻，看起来可能就是那8到10个人不断推动领域前进。

所以当John Schulman离开，Alec离开……

我当时心里想：哇，如果你们失去这部分全明星阵容，那怎么继续？这不像一个能轻易替换人才的领域。

但令人惊讶的是，就在那之后，你们在reasoning方向和其他前沿方向上继续取得突破。这一点对我来说一直很难理解……

Mark Chen：我其实不同意你刚才的说法，把“顶级个人”视为推动研究的唯一方式。

当然，我们确实会自上而下押注方向、下注赛道，但OpenAI也有非常深刻、非常真实的自下而上文化。

很多最好的点子，都来自最意想不到的地方。

而最令人兴奋的，就是看着这些“下注”逐渐成形、被扩展、被放大，比如reasoning（推理/思考）方向，就是这种过程的典型案例。

Q：但我们还是看到谷歌会砸天文数字把Noam Shazeer挖回去，这似乎说明，明星个人非常关键？

Mark Chen：我认为两者是必须并存的。

你必须投资自己的人才管线，因为我完全相信我们培养明星的能力，同时你也必须承认，世界上确实有一些非常顶级的人，每个人都知道他们是谁。

如果我从Meta那边学到一件事，那就是，OpenAI也可以非常激进地去争抢明星人才。

他们用过的一些激进招聘方法，我自己也学了几招。

但最终目标很简单，为我们的使命，组建最强的团队。

Q：好笑的是，这个圈子其实很小。你们明明互相都认识、甚至一起玩、一起出去吃饭……但转头你们却在互相挖对方的人。

Mark Chen：是啊，这是一个在所有维度都竞争残酷的行业。

但我喜欢这样。

我就是极度好胜的人，我讨厌输，不管是在研究还是在招聘上，我都会全力以赴。

Q：你说得没错，这一点让我想到半导体早期，一堆创业公司同时涌现，大家都在突破物理的极限，某家公司刚在一个方向突破，工程师们晚上一起喝啤酒又把想法互相说出来了。

工程师就是这样，他们停不下来，知识自然扩散。

而同时，人人都在挖每一个可能的突破。

Mark Chen：是的。一个公司面对这件事有两种选择：

建立深度信息隔离加强封闭性；

继续保持开放文化，用速度压制对手。

OpenAI明显是第二种，我们不认为封闭是正确方式。

我们的方法是跑得比别人更快。

我喜欢我们的开放文化，研究人员之间自由分享想法，大家都能更快推动进步。

Q：我知道Sam更热爱调研，他对日常经营没那么有激情，从组织结构上也看得出来。

而你和Jakub则是每天都深度泡在技术里。

他则在同时和全世界说话。

【声明】内容源于网络

科创最前线

中国科技创新浪潮中的发现者，记录者，陪伴者。

内容 782

粉丝 0

科创最前线中国科技创新浪潮中的发现者，记录者，陪伴者。

总阅读330

粉丝0

内容782