前言
近期,据外媒《The Information》报道,OpenAI的元老级人物Alec Radford即将离职,计划离职后开展独立研究。
据知情人士透露,Radford表示他计划与OpenAI及其他AI开发者展开合作。
OpenAI研究主管Mark Chen在一份声明中表示:“我们对Alec及其贡献深感敬意,并期待在他探索独立研究的同时,继续与他合作。”虽然你可能不太熟悉Radford这个名字,但他参与的研究却极具影响力。
自2016年加入OpenAI以来,他推动了多个革命性突破,包括首代GPT的问世,并主导了GPT-2的研发等。
在最近的NeurIPS 2024大会上,OpenAI前首席科学家Ilya Sutskever在演讲中特别提到Alec Radford和Dario Amodei等人对GPT-2、GPT-3的开创性工作,正是这些成果催生了预训练时代的到来,并推动了技术的飞跃发展。
换句话说,有人推测Radford的离职可能意味着GPT-4.5即将发布,尤其是在OpenAI发布高级语音模式后的第二天,首席技术官Mira Murati也官宣了离职。这种推测基于一种假设,即Radford作为GPT系列的重要参与者,可能会在离开前推动一些重要的项目完成,比如GPT-4.5的发布。
然而,也有人认为,尽管Radford做了大量的研究工作,但他并没有参与公开发布,始终在幕后工作。如果他要等待某个事件,可能会选择等到GPT-5发布后再离开。
更进一步的观点认为,Radford的离职可能会有助于开源研究,因为离开OpenAI后,他可能能重新发表自己的研究成果。对于OpenAI来说,有些人认为前景可能不太明朗,暗示着一些内部的不确定性。
换句话说,有人认为人们可能低估了Alec(Radford)对OpenAI以及整个AI研究领域的巨大影响。Alec不仅是GPT和DALL·E等重要项目的主要作者,还可能在公司所有重要的研究方向上起到了领导作用。
有人甚至认为他的影响力不亚于Ilya(Sutskever,OpenAI的联合创始人之一)。因此,Alec的离职被视为对OpenAI的一个重大损失。然而,也有网友希望他在离开OpenAI后,能从事一些开放的研究并发表成果,这样整个世界都能从中受益,推动AI技术的发展和共享。
换句话说,不列颠哥伦比亚大学教授Jeff Clune在X平台上发起了一场关于“世界上最重要但最被低估的AI科学家”的讨论,并毫不犹豫地推荐了Alec Radford。
他认为,虽然许多重大进展背后都有某个人的推动,但这些人的贡献往往没有得到足够的认可。Jeff Clune强调,Radford在AI领域的影响力巨大,却鲜少被提及或庆祝,他推动了许多突破性的发展,理应被称为现代生成式人工智能的奠基人之一。
Jeff Clune还补充道,Radford是一个非常谦逊的人,不追求荣誉,这也是他鲜少受到关注的原因之一。总之,Clune认为我们应该更加重视和讨论Radford对人工智能的深远影响。
Radford的研究无疑处于前沿,他的贡献非常巨大,至少三次对人工智能领域产生了深远的影响。我们应当对他所做的工作感激不已。
他在GPT系列模型开发过程中发挥了关键作用
Alec Radford 是 GPT-1 的主要作者之一,同时也是 GPT-2 的共同作者。在学术界,GPT-1 已经被引用超过 11,947 次,而 GPT-2 的引用次数则达到了 14,828 次。
2018年,GPT-1 的发布标志着预训练大模型时代的开启,它提出了一种“半监督学习”(后来普遍称为自监督学习)的方法,即首先在没有标签的数据上进行预训练,然后再利用少量有标签的数据进行微调。这一方法为后续的发展奠定了基础。
2019年,OpenAI 基于 GPT-1 发布了改进版的 GPT-2。与初代模型相比,GPT-2 在多个方面做出了创新,参数量增至 15 亿,能够处理更广泛的任务,并开始展示出在没有明确监督的情况下执行大量任务的能力。在这一阶段,OpenAI 去除了 GPT-1 中的有监督微调,使 GPT-2 完全基于无监督学习进行训练。
Alec Radford 不仅参与了 GPT-3 论文的撰写,还在 GPT-4 的预训练数据和架构研究中发挥了重要作用。
2020年,GPT-3 的发布标志着模型规模的巨大跃升,相比 GPT-2,其参数量增加了两个数量级,达到了 1750 亿个参数。在多个自然语言处理任务中,GPT-3 展现出了强大的性能,涵盖了翻译、问答、完形填空等任务,此外,它还能够应对一些复杂的任务,如动态推理、领域适应、词汇解释、在句子中使用新词或进行基本的算术运算。
到了2023年,GPT-4 开始迈向多模态能力,成为人工智能领域的新里程碑。GPT-4 不仅能够解决更为复杂的问题,编写更大规模的代码,还能根据图像生成文字。与前代相比,GPT-4 在回答的准确性、图像识别能力以及创意文本生成等方面都有显著提升,它能够创作歌词、进行风格化写作,并生成富有创意的文本。
根据 Google Scholar 的数据,Alec Radford 的论文总引用次数已超过 19 万,其中有 7 篇论文的引用量超过了 1 万次。这充分体现了他所参与的研究工作的高影响力和重要性。
文章结尾
如有疑问或有需求可以添加下方微信交流。
Shirt AI
渗透智能

