编辑部 整理自 MEET2026
量子位 | 公众号 QbitAI
“涌现”已成为当前AI领域最令人期待的能力突破。自从Scaling Law推动大模型能力持续跃升,全球AI厂商纷纷陷入“不敢停”的竞争节奏。
大模型最有魅力之处在于其非线性变化带来的巨大不确定性,一旦出现性能涌现,潜力将远超想象。
在量子位MEET2026智能未来大会上,清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松指出,尽管算力与参数仍在不断扩张,但投入边际成本日益增高,若最终路径被证伪,前期投资或将付诸东流。
他提出应对策略应为“致广大而尽精微”:少数顶尖团队可继续探索大规模模型的前沿极限,而绝大多数企业则应聚焦垂直领域的精细化落地。
以下为孙茂松演讲内容的核心观点梳理与精要整理。
MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。核心观点梳理
- 随着模型和数据规模扩大,能力涌现成为可能。这种非线性增长极具不确定性,但也预示着未来几年机器或能通过人类最难考试。
- 当前大模型与具身智能的核心挑战在于如何实现“言、知、行”统一,真正达成“知行合一”,这涉及AI基础理论的重大突破。
- Scaling Laws的可持续性存在疑问。信息系统发展至一定阶段常趋于饱和,虽新涌现可能打破瓶颈,但仍需少量顶级团队跟踪国际前沿探索极限。
- 短期内人形机器人难以在开放环境中完成复杂任务。应优先推动AI在特定真实场景中的广泛应用,形成“星火燎原”之势,这是多数企业更现实的发展方向。
突飞猛进的八年
生成式AI与大模型的发展仅用八年便完成多轮跃迁。自2017年进入预训练时代以来,关键节点包括2020年GPT-3发布、2022年ChatGPT问世以及2024年DeepSeek崛起。
△来源:「大模型简史」
近年来,大模型凭借长思维链显著提升解决复杂任务的能力,呈现出全面超越传统基准的趋势。
其最大特征是“能力涌现”——当模型与数据达到临界规模时,性能呈非线性跃升。这一现象既带来巨大机遇,也伴随高度不确定性。
△来源:Our World in Data
以“Humanity’s Last Exam”测试集为例,该题库专为难倒AI设计,无历史答案可供检索。人类顶尖选手得分约5分,而当前大模型已可达三四十分。
预计未来几年,所有有标准答案的考试都将被机器攻克。代码大模型同样表现突出,已在世界大学生程序竞赛中超越人类冠军。多模态能力亦快速演进。
总体而言,文本、代码与多模态大模型已具备高水平基础能力,构成当前AI发展的基本态势。
Daniel Kahneman提出的系统一(快系统)与系统二(慢系统)理论,在当前AI中已有体现。机器已初步具备感知与推理能力,为走向具身智能奠定基础。
图灵测试在语言层面可视为已被通过,但控制论之父维纳强调:真正的智能必须让机器进入现实世界,通过感知、交互与反馈实现自我学习。
机器要具备智能,必须走进现实世界,感知环境、与之互动,并根据奖励或惩罚不断调整行为。
当前AI正具备实践维纳理念的技术条件,有望迈向更高阶智能。
语言模型擅长“言”,但在“行”上存在本质差异。“纸上得来终觉浅,绝知此事要躬行”,从表达到行动是一道鸿沟。
同时,“知难行易”亦揭示另一困境:大模型虽掌握海量知识,但缺乏体系化理解与自知之明。没有真正的“知”,“行”便失去意义。
尽管如此,大模型已实现七八成的知识覆盖,为追求“知行合一”提供了现实基础。如何协调“言、知、行”关系,成为当前AI发展的核心挑战。
AI的巨大投入让华尔街“冒冷汗”,前路充满挑战
当前AI发展依赖Scaling Law——大模型、大数据、大算力。然而,任何系统发展到一定阶段都会遭遇瓶颈,性能饱和可能导致Scaling失效。
Scaling能否持续尚存巨大不确定性,且其代价高昂。据法国《回声报》报道,OpenAI目前计算能力约为2GW,计划到2033年提升至250GW,相当于250个核反应堆的发电量,总投资或达10万亿美元(不含电力成本)。
如此激进的投资令华尔街罕见“冒冷汗”,反映出行业对高投入低回报风险的担忧。
问题在于:不跟进可能错失涌现机会,被甩开差距;跟进则面临难以承受的成本压力。
此外,Next Token Prediction作为当前主流范式,在文本生成中近乎完美,但在图像、视频乃至具身智能中面临严峻挑战。
△来源:https://glassboxmedicine.com/2024/04/28/human-and-artificial-general-intelligence-arises-from-next-token-prediction/
语言具有离散无限性和线性序列特征,适合Token预测。而图像缺乏明确语义边界,视频增加时间维度,具身智能更涉及三维空间与动态交互,复杂度呈指数上升。
因此,五年内指望人形机器人在家庭等开放环境中自主完成复杂任务并不现实。图灵奖得主Hinton曾建议:“如果有人建议你去做水管工,不要轻易拒绝。”这侧面说明AI距离掌握实际动手能力仍有遥远距离。
更可行的方向是在简化任务空间中实现突破,如灵巧手操作单一物体。这类有限场景下的应用虽具挑战,但完全可实现。
当前构建通用“世界模型”仍缺乏清晰技术路径,短期内仍依赖Next Token Prediction,但这将进一步推高对算力与数据的需求。
唯有再次出现能力涌现,才可能使机器人在开放任务中获得更高自由度。
「致广大而尽精微」
当前发展路径逐渐明晰。美国采取典型“致广大”策略,持续加大算力投入,试图通过规模优势实现断层领先。国内如DeepSeek、通义千问等模型已接近国际先进水平。
△来源:https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf
“致广大”意味着大规模投入与高风险博弈,仅少数财力雄厚的企业有能力参与。
相比之下,“尽精微”强调在垂直领域深耕细作,结合行业需求进行深度融合,更具可行性与较低风险。
开源基座模型已为垂直应用打下坚实基础。通过在医疗、制造、金融等场景中深度适配,有望实现全球领先。
更重要的是,垂直领域本身可能催生新的算法创新,从而反向推动基础模型进步。从这个角度看,“尽精微”也是一种广义上的“致广大”。
发展建议
- 少数实力雄厚团队可继续探索“致广大”路径,紧跟国际前沿;
- 绝大多数AI企业应聚焦“尽精微”,推进垂直领域落地。
我国在应用场景丰富性、工业基础扎实度及人才执行力方面具备优势,完全有可能在精细化应用层面建立领先地位。
至于“致广大”的长远布局,需等待教育体系培育出更多原始创新能力。当前阶段,应优先做好“尽精微”,同时保持对前沿趋势的密切关注。
在座许多从业者正致力于此,这正是现阶段最值得投入的方向。

