大数跨境

深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断

深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断 海外独角兽
2026-01-13
66
导读:推动全球华人 AGI

AGI-Next 2026 核心观点精要

刚刚落幕的 AGI-Next 2026 活动信息密度高、前瞻性强。由清华大学基础模型北京市重点实验室与智谱 AI 联合发起,张钹院士、杨强院士、唐杰教授、杨植麟、林俊旸、姚顺雨等中国大模型核心力量齐聚,拾象创始人李广密担任 panel 主持人。

华人已成为全球 AGI 发展的重要推动力量,中国开源大模型稳居全球 Tier 1 阵营。随着 2026 年技术演进加速,这一地位有望进一步巩固。

本文为「海外独角兽」对全场主题发言与圆桌讨论核心观点的系统性提炼,聚焦五大关键趋势:

  • 模型分化已成显性趋势:源于 To B/To C 场景需求差异、战略选择及客户高频反馈;
  • To B 领域强模型与弱模型差距持续扩大,而 To C 的瓶颈常不在模型规模,而在 Context 与 Environment 缺失;
  • 自主学习成为共识性新范式,2026 年将成为主流投入方向;
  • Scaling 仍将推进,是技术、数据与“品味”(taste)协同演进的结果;
  • 模型即 Agent,Agent 即产品——二者边界日益消融;
  • 中美算力差异不仅是总量级,更在于结构性:美国更多算力正投向下一代关键技术探索。

关键词 01:分化

To C 与 To B 的双轨分化

姚顺雨指出,当前 AI 分化主要体现为两方面:一是 To C 与 To B 场景的差异化发展路径;二是“垂直整合”与“模型-应用分层”的战略路线分歧。

To C 用户多数场景下对模型智能提升感知微弱;其瓶颈往往不在于参数规模,而在于缺乏实时上下文(如用户情绪、天气、所处环境)。例如,“今天吃什么”这类问题,再强的模型也难精准回应——缺失的是真实世界感知能力。

破局关键在于合规前提下的个性化数据利用。相较盲目堆叠预训练能力,善用微信聊天记录等私有 Context,更能释放实际价值。

To B 的强弱模型鸿沟

To B 场景中,企业愿为“最强模型”支付溢价。以 Opus 4.5 为例,其任务准确率可达 8–9/10,而弱模型仅 5–6/10;若后者出错点不可预测,企业需额外投入大量人力监控与兜底,综合成本反而更高。

垂直整合 vs 分层协作

To C 场景适合模型与产品深度耦合、快速迭代;To B(尤其生产力工具)则因涉及复杂生产环节,为应用层留出充分优化空间——应用公司难以自研模型,又高度依赖基座能力提升,因而催生“模型公司 + 应用公司”的清晰分层。

林俊旸强调,模型分化并非源自预设路线图,而是与客户高频互动的自然演化结果。Anthropic 在金融领域的突破,正是源于客户需求牵引。

拾象注:ChatGPT Health 面向 C 端提供健康解读,Claude Health 则直连医疗系统——前者延续搜索式基因,后者凸显 To B 架构思维。

战略卡位:时机决定分化路径

智谱押注 Coding 方向,是基于对竞争格局的判断:DeepSeek 推出后,“Chatbot 取代搜索”已近尾声,团队转而聚焦编程这一高价值、长生命周期的攻坚领域。

关键词 02:新范式

自主学习:渐进发生的底层变革

唐杰提出,Scaling 需区分两类路径:

  • 已知路径:靠持续增加数据与算力逼近能力上限,本质是效率导向的“确定性工程”;
  • 未知路径:探索新范式——让 AI 自主定义奖励函数、交互方式乃至训练任务,实现真正意义上的自我进化。

杨植麟将 Scaling Law 视为“能源→智能”的转化机制,强调其本质是技术、数据与审美(taste)的共进;前沿探索不会因风险停滞。

自主学习的核心目标是构建模型的自反思与自学习能力——通过持续评估与批判,识别有效行为、发现优化路径。姚顺雨指出,该进程已在发生:Cursor 模型每几小时更新一次;ChatGPT 拟合用户对话风格;Claude Code 自主编写 95% 的项目代码。

瓶颈与挑战

当前最大瓶颈实为想象力:若 2027 年宣布实现新范式,如何验证?是构建盈利交易系统,还是攻克科学难题?必须先定义“它该长什么样”。

林俊旸认为,强化学习(RL)潜力尚未充分释放;下一代范式需兼具“自主学习”与“主动性”——未来模型或将无需人类 Prompt,而由环境本身触发响应。

主动学习带来严峻安全挑战:风险不在“说错话”,而在“做错事”。方向校准比能力提升更关键。

个性化成效难量化:推荐系统可用点击率衡量,但当 AI 深度融入生活,评估指标将愈发模糊。

持续学习面临“长程衰减”问题:多 Agent 协作中,单点能力未达 100%,误差将指数级放大。人类通过睡眠“清噪”,AI 或需类似机制。

唐杰提出“智能效率(Intelligence Efficiency)”概念:未来范式应关注“单位资源投入带来的智能增量”,而非单纯追求更大模型。

突破方向:向人脑认知靠拢

当前模型在三方面显著落后于人类:1)多模态感知与融合;2)Memory 与持续学习能力;3)反思与自我认知。这三大方向或成下一阶段关键突破口。

智谱早在 2020 年即提出参考人脑的 AI 架构,包含系统一(快速直觉)、系统二(逻辑推理)与自学习模块,对应三类不同维度的 Scaling。

原生多模态:走向真实世界的感知底座

原生多模态类比人类“感统”:视觉、听觉、触觉等信号同步采集、融合理解。当前模型感统能力薄弱,限制其执行长链路、长时效的真实任务(如跨设备协同办公)。

智谱与 Qwen 均将多模态列为重点方向。林俊旸强调:“真正智能的系统天然应是 Multimodal。”视频作为广义表达载体,其长时序理解能力极具价值。

关键词 03:Agent

Coding:通往通用 Agent 的必经之路

智谱实践表明,GLM-4.5 虽评测分数高,却无法完整开发“植物大战僵尸”游戏;引入 RLVR 与海量真实编程环境训练后,GLM-4.7 成功突破该能力边界。

模型即产品,Agent 即产品

Agent 承载复杂任务,对模型能力要求极高。当模型、Agent、产品三位一体,研发基础模型本身即是在打造终端产品。

分化同样体现在 Agent 层面:

  • To C 产品的体验指标有时与模型智能水平负相关;
  • To B Agent 的核心价值在于解决真实世界任务、创造可衡量收益,创新并非刚需。

部署即价值:环境与工程同等关键

生产力类 Agent 处于早期阶段。除模型进步外,环境适配与部署能力才是价值放大的核心杠杆——即使模型不再升级,仅将现有能力嵌入各行业工作流,亦可带来 10–100 倍效率提升。目前 AI 对 GDP 贡献仍不足 1%。

教育至关重要:AI 不替代人,但“会使用工具的人”正在替代“不会使用工具的人”。

托管式 Agent:从交互到自治

林俊旸预测,未来 Agent 将走向“托管式”:用户设定宏观目标后,Agent 在后台长期自主运行直至完成,无需高频干预。

该能力高度依赖 Self-evolution 与 Active Learning,印证“模型即 Agent,Agent 即产品”的深度融合逻辑。

长尾任务:AGI 的真实战场

用户感知 AI 价值,往往源于某个长尾任务被精准解决。所谓 AGI,本质即是对长尾问题的系统性攻克。

杨强将 Agent 演进划分为四象限,基于两大维度:目标定义(人为 / 自动)与任务规划(人为 / 自动)。当前处于“双人为”初级阶段;未来将逐步迈向“双自动”,最终形成大模型原生的 Native Agent 系统。

决定 Agent 走势的三大问题

  • 能否真正解决人类任务?创造的价值有多大?
  • 成本是否可控?若 API 调用即可解决,基座厂商将直接集成,形成模型与应用的固有张力;
  • 应用公司能否建立半年以上的技术代差,率先满足用户需求并持续迭代?

关键词 04:全球 AI 竞赛

中国 AI 的机遇与瓶颈

姚顺雨持乐观态度:参照电动车与制造业经验,中国具备极强的“可行性复刻+局部超越”能力,3–5 年内进入全球第一梯队可能性高。

但长期挑战在于文化与结构层面:

  • 敢于突破新范式、承担高风险的探索者仍偏少;
  • 算力瓶颈核心不在电力,而在光刻机等关键制造环节;
  • To B 市场成熟度及国际竞争力仍待提升——过度追逐榜单分数不可持续,应效仿 Anthropic、DeepSeek,聚焦“正确的事”与真实用户体验。

结构性算力差距

林俊旸观点更审慎:中国 AI 全面超越美国的概率约 20%。中美算力差异不仅是总量(美国高 1–2 个数量级),更是结构性的:美方大量算力用于下一代技术探索,而中方仍集中于任务交付引发的短期算力缺口。

但“穷则思变”亦孕育创新机会:作为“算力穷人”,中国团队更有动力推动算法与 Infra 的联合优化,并可能在下一代模型架构与芯片的软硬协同上实现端到端突破。

【声明】内容源于网络
0
0
海外独角兽
各类跨境出海行业相关资讯
内容 349
粉丝 0
海外独角兽 各类跨境出海行业相关资讯
总阅读11.3k
粉丝0
内容349