Transformer「亲爹」跑路啦,说是烦透了「自己生的娃」!
还记得那篇8年前把「注意力机制」按在王座上的论文《Attention Is All You Need》吗?
共同作者Llion Jones最近在旧金山的TEDAI大会上当众「叛逃」:
AI研究正越做越窄,而他本人,准备把对Transformer的爱好调成「低电量模式」。

海量资金与人才反而让研究圈挤进死胡同,大家只顾卷参数、抢发论文,没人敢探索新架构。
这是一种资本与论文KPI的奇妙化学反应。
Jones的主张很直白:前所未有的关注、资金和人才涌入之后,研究反而被「收窄」了。
为啥?
一边是投资人盯着回报,另一边是研究者担心被别人「抢先发」,人人都在拥挤赛道里拼命刷存在感。
结果呢?
赶工纸面成绩,挤牙膏式创新,和千人一面的论文标题。
他还搬出了课本里的老朋友:「探索vs.利用」。
现在的行业像把「利用」旋钮拧到11档:不停对同一架构打补丁、换皮肤、加大模型,再加点「我们又SOTA了」的调味包。
可真正的新路子,没人敢走,也没空走。
Jones在会议上说:未来每个人都会失去工作,这是一件好事

Jones提醒大家想想Transformer出现前的日子!
当时研究圈正对RNN做无尽小改小优,就像给一块石头抛光一样。
一旦Transformer登场,前面那堆抛光操作立刻变得像「给马车装了碳纤维尾翼」!
很精致,但很不对路,甚至变得完全无用,现在还有谁再谈论RNN?
于是Jones担心我们是否又在重演历史:盯着一个8年前架构一直薅羊毛,薅到秃!
不停给马车打造各种好看的设备,却不知道拐弯看看路口是不是有飞船停靠。
不是KPI,是自由!
这就是Transformer之父给出的答案。
最扎心的一段来自Jones的回忆:
那会儿他在谷歌做Transformer,是「午饭唠嗑+白板乱画」式的自下而上的。
既没人规定必须发几篇论文,也没人拉着耳朵对着某个指标冲线。
先有自由,后有灵感,这话听上去朴素,但如今反而成了稀缺品。
再看现在:就算年薪上七位数,许多人也未必敢「瞎折腾」。
新岗位第一天,谁不想先稳住绩效?
于是低风险、可发表、见效快,自然优先级飙升。
想象力?创造力?
先等一等吧。

Llion Jones打算把探索旋钮拧回去。
Jones后来去日本创建了Sakana AI。
身为东京创业公司Sakana AI的CTO,Jones说他打算在实验室里复刻Transformer诞生前的「空气配方」:
少KPI,多好奇;少跟风,多自然启发。
他还给团队安利了一句研究格言:
You should only do the research that wouldn't happen if you weren't doing it.
你只应该做那些如果不是你来做就不会发生的研究。。
——来自工程师Brian Cheung
在这种环境诞生成果的一个例子是Sakana的「连续思维机器」,它在神经网络中融入了类似大脑的同步机制。
一位提出该想法的员工告诉Jones,在以前的雇主或学术岗位上,他会面临怀疑并受到不要浪费时间的压力。
在Sakana,Jones给了他一周时间去探索。
该项目取得了足够的成功,甚至在大型AI会议NeurIPS上获得了展示机会。
Jones甚至表示,在招聘中,自由胜过报酬。
他谈到这种探索性环境时说:「这是吸引人才的一个非常非常好的方式。想想看,有才华、聪明、有野心的人,自然会去寻找这种环境。」
这波操作证明——自由比高薪更能抢人。
聪明人对自由的敏感度,往往高于对钱的感知。

也许最具讽刺意味的是,Transformer可能是自身成功的受害者。
当前技术如此强大且灵活……这阻止了我们去寻找更好的技术,如果当前技术更糟糕,会有更多人去寻找更好的,这很有道理。
Jones并不是要把Transformer一脚踢下船。
他强调:现有技术上还有大量重要工作,未来几年也会继续创造价值。
只是以现在行业的人才与资源密度,我们完全「买得起」更多的探索。
Transformer的强大,正在阻挡我们寻找「更好」的冲动。
如果现有技术差一点,大家反而更会到处找下一个惊喜。

收尾时,Jones把姿态放得很开:这不是「你死我活」的竞技场,是集体解谜。
如果大家能一起把探索旋钮拧大一点,把有意思的发现公开分享,那条通往下一次「Transformer级」突破的路,可能近得超乎想象。
AI掌权者(是OpenAI、还是谷歌、还是其他?)是否会听从这一呼吁尚未可知。
但Jones提出了一个尖锐的提醒:下一次达到Transformer级别的突破可能就在拐角处。
毕竟,他在Transformer领域工作的时间比几乎所有人都要久。
他会知道何时该转向新方向。
Transformer可以奠定了如今的AI时代,几乎所有基础模型都是以此为地基。
「Token by token,一个词接一个词」的简单输出模式在算力的加成下成为了新时代的AI魔法。
Transformer催生了ChatGPT、Gemini、Claude等诸多前沿产品。
更重要的是,它让人类真正跨入了生成式AI时代。
人类和生成式AI的命运从2017年6月12日周一下午17点57分开始交汇。
Transformer的影响依然还在继续!
到今天为止,这篇论文的被引次数已经到了18万+次!
让人不禁好奇,除了Jones外,其他几位作者都身在何处?
曾经联手打造出谷歌最强Transformer的「亲爹们」如今也已分道扬镳。
· Ashish Vaswani
Essential AI联合创始人&CEO
称希望把EssentialAI做成“西方的DeepSeek”(2025-06-17采访)。
· Noam Shazeer
已回归Google;Gemini技术共同负责人
· Niki Parmar
Anthropic技术人员。
此前与Vaswani共同创办EssentialAI,早期为Adept联合创始人
2024年底/2025年初已加入Anthropic。
EssentialAI的联合创始人之一。
· Jakob Uszkoreit
Inceptive Nucleics联合创始人&CEO
2025年登台TED AI SanFrancisco分享「AI如何绕开传统科学」的新思路;持续推进「生物软件」方向。
· Llion Jones
SakanaAI联合创始人&CTO
外媒称SakanaAI正洽谈新一轮融资,目标估值约25亿美元。
采访中直言「已经受够了Transformer」,转而主打「演化式模型合并」等新架构路线。
媒体采访介绍其在东京推进“自然启发”的集体智能路线。
· Aidan N.Gomez
Cohere联合创始人&CEO
表示Cohere计划很快启动IPO(2025-10-21多家媒体现场采访)。
公司估值升至约70亿美元。
经营数据:年化收入达1亿美元、发力企业私有部署与代理平台North。
· Lukasz Kaiser
OpenAI研究员
2025年10月在OpenAI Forum发表「从Transformer到Reasoners」的主题演讲。
· Illia Polosukhin
NEAR Protocol联合创始人
主张User-OwnedAI,推进「用户所有的AI」与隐私保护AI-原生产品。
在NVIDIA GTC 2025分享「机密、可验证AI计算」。
8年前一篇不起眼的论文,却彻底开启了人类的生成式AI时代。
这个被忽视的小论文,彻底开启了AI的大时代。
它的故事还远远没有结束。
关于我们
具身智能®是智能科学发展的新范式
“具身智能®”是西安中科光电精密工程有限公司用于转载智能科学、机器人技术及具身智能®领域研究进展的微信公众号平台,致力于传播前沿资讯与深度洞察。
“具身智能®机器人”公众号作为原创内容平台,定期发布关于具身智能®的核心观点、技术突破及行业趋势分析,旨在推动智能科学与机器人技术的深度融合与创新发展。诚挚邀请您加入“具身智能®”与“具身智能®机器人”线上平台,共同探索智能科技的未来。
公司的核心优势在于:
原创理论:2019年基于科技部重大专项基金的支持,突破具身智能®底层理论,突破“物理空间小样本条件下精细结构识别”科学问题,让机器“理解”空间,解决“精准智能识别”和 “自主智能规划”两大核心技术。原创理论的特点:数学架构,“边”端布局,对数据、算力要求低。
该突破是智能科学底层关键问题——“四维时空感知、理解并自主运动规划”的基本路径;是链接大语言模型与运动执行系统(人形机器人、机器狗、无人车),通达通用人工智能的桥梁。
技术能力及技术成熟度:智能识别(对象的精准识别能力)-识别准确率100%(基于已经验数学语言);精准操控(精细结构的理解和处理能力)-物品及物品细节特征精准识别,不确定对象中的焊接场景精度0.5mm,精密装配场景精度10μm;复杂场景的自主的运动规划及移动规划(新场景的适应能力)—场景模型导入或一次性信息摄入,能快速布置在新场景中使用,具有基于地形学及知识图谱处理未知场景的能力,工业、军用、家庭场景均适用。
成果应用情况:基于具身智能®技术架构指导的智能机器人,已实际应用于自主智能工业机器人产品及国家重大任务中,解决了多项核心难题;具身智能®视觉终端,可用于电磁拒止环境下无人机、无人车基于地形与空间分析的自主导航,用于通用人形机器人导航与精准操控。自主智能工业机器人在面向离散制造领域的不确定对象中的焊接、装配、检测等场景中实现批量落地应用;国家重大任务中,自主机器人可在非结构化场景中实现自主识别、自主规划、自主决策以及自适应控制,已得到实质性验证。
未来,我们将继续深耕具身智能®领域,以技术创新为驱动,以产业应用为目标,持续引领智能科学与机器人技术的发展方向。加入我们,共同见证具身智能®改变世界的无限可能!
公司网址:http://www.xa-elecopt.com
关注我们
吴易明.何为“具身智能”?.具身智能机器人公众号,2023
吴易明.汉字创生过程隐含智能的底层密码.具身智能机器人公众号.2025
吴易明.仝人-具身智能词条1:具身性.具身智能机器人公众号.2025
吴易明.仝人-具身智能词条2:指称.具身智能机器人公众号.2025
吴易明.仝人-具身智能词条3:视觉.具身智能机器人公众号.2025
吴易明.儿童画:从歪歪扭扭的线条,看懂人类如何学会理解世界.具身智能机器人公众号.2025
吴易明.具身认知视角下“智能”的概念.具身智能公众号.2022
看累了吗?戳一下“点赞或推荐”支持我们吧

