

清华唐杰：领域大模型，伪命题

量子位

2025-12-26

导读：8个方面的新感悟

清华教授唐杰在微博分享了关于人工智能发展的八点核心洞察，内容精炼务实，兼具学术深度与产业视角。

01 关于基座模型Scaling

预训练已使大模型掌握世界常识与基础推理能力。更多数据、更大参数量与更充分的计算投入，仍是提升基座模型性能最高效的路径。

通用评测基准虽可衡量模型整体水平，但也易引发过拟合。真实场景中，如何快速对齐长尾需求、显著提升用户实际体感，才是关键挑战。Mid-training与Post-training技术为此提供了可行路径 [2] 。

Agent是模型从理论学习迈向真实生产力的关键里程碑。当前Agent能力已逐步融入模型训练流程，提升其通用性；但跨环境泛化与迁移仍是难点，需依赖多场景数据积累与针对性强化学习 [3] 。

模型需具备类人分层记忆能力——短期（Context）、中期（RAG）、长期（参数化知识）、历史级（外部知识库）。超长上下文支持有望统一短中长期记忆，但模型知识的动态迭代与参数更新仍属未解难题 [4] 。

当前定时全量重训模式存在效率低、交互数据浪费等问题。在线学习将成为下一阶段核心方向，而自我评估是其实现前提：模型须能判断自身输出的合理性，从而明确优化目标并实现自主演进 [5] 。

大模型发展正走向端到端一体化。AI应用的第一性原理并非开发新App，而是替代人类完成具体工种任务。2026年或将迎来AI规模化替代职业岗位的爆发期 [6] 。

多模态是重要方向，但当前尚未显著突破AGI智能上界。文本、多模态理解、多模态生成宜分轨推进，再适度探索融合。具身智能则受限于通用性不足、数据获取成本高及机器人本体稳定性差，2026年有望取得实质性进展 [7] 。

领域大模型是AGI成熟前的阶段性产物。其存在源于企业希望以领域Know-how构建护城河，将AI驯化为工具；但AI本质是范式级变革，最终各行业数据、流程与Agent行为将反哺主模型，推动通用能力持续进化。大模型应用必须回归价值本源：切实解决人类刚需任务，产生可衡量的新价值 [8] 。

【声明】内容源于网络

量子位

各类跨境出海行业相关资讯

内容 14523

粉丝 0

量子位各类跨境出海行业相关资讯

总阅读95.3k

粉丝0

内容14.5k