编辑部 整理
量子位 | 公众号 QbitAI
清华教授唐杰在微博分享了关于人工智能发展的八点核心洞察,内容精炼务实,兼具学术深度与产业视角。
- 基座模型继续scaling仍高效;
- 真实使用体验的提升,绕不开长尾能力对齐与推理增强;
- Agent标志着模型正式进入环境并形成生产力;
- 模型持续交互后,记忆机制、在线学习与自我评估将成核心工程问题;
- AI终须落脚于替代人类工作、创造增量价值;
- 领域大模型本质上是过渡性概念,非终极形态;
- 多模态与具身智能面临数据规模、泛化能力与硬件稳定性等现实瓶颈;
- 大模型应用应回归第一性原理:替代或辅助人类完成特定工种任务。
01 关于基座模型Scaling
预训练已使大模型掌握世界常识与基础推理能力。更多数据、更大参数量与更充分的计算投入,仍是提升基座模型性能最高效的路径。
02 关于长尾能力对齐与推理增强
通用评测基准虽可衡量模型整体水平,但也易引发过拟合。真实场景中,如何快速对齐长尾需求、显著提升用户实际体感,才是关键挑战。Mid-training与Post-training技术为此提供了可行路径 [2] 。
03 关于Agent
Agent是模型从理论学习迈向真实生产力的关键里程碑。当前Agent能力已逐步融入模型训练流程,提升其通用性;但跨环境泛化与迁移仍是难点,需依赖多场景数据积累与针对性强化学习 [3] 。
04 关于模型记忆机制
模型需具备类人分层记忆能力——短期(Context)、中期(RAG)、长期(参数化知识)、历史级(外部知识库)。超长上下文支持有望统一短中长期记忆,但模型知识的动态迭代与参数更新仍属未解难题 [4] 。
05 关于在线学习与自我评估
当前定时全量重训模式存在效率低、交互数据浪费等问题。在线学习将成为下一阶段核心方向,而自我评估是其实现前提:模型须能判断自身输出的合理性,从而明确优化目标并实现自主演进 [5] 。
06 关于模型研发与应用融合
大模型发展正走向端到端一体化。AI应用的第一性原理并非开发新App,而是替代人类完成具体工种任务。2026年或将迎来AI规模化替代职业岗位的爆发期 [6] 。
07 关于多模态与具身智能
多模态是重要方向,但当前尚未显著突破AGI智能上界。文本、多模态理解、多模态生成宜分轨推进,再适度探索融合。具身智能则受限于通用性不足、数据获取成本高及机器人本体稳定性差,2026年有望取得实质性进展 [7] 。
08 关于领域大模型的本质
领域大模型是AGI成熟前的阶段性产物。其存在源于企业希望以领域Know-how构建护城河,将AI驯化为工具;但AI本质是范式级变革,最终各行业数据、流程与Agent行为将反哺主模型,推动通用能力持续进化。大模型应用必须回归价值本源:切实解决人类刚需任务,产生可衡量的新价值 [8] 。

