模型- 大数跨境

首页

模型

变芯空间

2025-10-09

导读：它不再仅仅强调“做大模型”，而是更注重“做强模型”、“做优模型”和“用好模型”，涵盖了从底层理论到上层应用，再到评估迭代的全链条。

点左上小耳机可边听边看! 欢迎关注交流，联系方式见文末！

空间因“您”而变！动动手指点赞转发！

2025年8月国务院发布《国务院关于深入实施“人工智能+”行动的意见》

（七）提升模型基础能力。

加强人工智能基础理论研究，支持多路径技术探索和模型基础架构创新。加快研究更加高效的模型训练和推理方法，积极推动理论创新、技术创新、工程创新协同发展。探索模型应用新形态，提升复杂任务处理能力，优化交互体验。建立健全模型能力评估体系，促进模型能力有效迭代提升。

总体解读

这段政策的核心理念是推动AI发展从“规模驱动”向“效率驱动”和“能力驱动” 转变。它不再仅仅强调“做大模型”，而是更注重“做强模型”、“做优模型”和“用好模型”，涵盖了从底层理论到上层应用，再到评估迭代的全链条。

分点详细解读

1. 加强基础理论研究，支持多路径探索与架构创新

核心思想：打破路径依赖，为AI的长期发展夯实根基。
为什么重要：

当前瓶颈：现有模型（如Transformer）虽然在实践中取得了巨大成功，但在能耗、推理效率、长序列处理、因果推理等方面仍存在理论瓶颈。
避免内卷：如果所有研究都集中在微调现有架构上，容易导致技术“内卷”，难以产生颠覆性突破。

具体含义：

基础理论研究：探索机器学习的新范式、新的优化算法、对模型泛化能力的理论解释、模型与知识的结合等。
多路径技术探索：不仅支持基于Transformer的路线，也鼓励基于状态空间模型（如Mamba）、神经符号系统、类脑计算等不同技术路线的研究。
模型基础架构创新：研发下一代更高效、更智能的核心网络架构，以替代或改进现有的Transformer。

2. 加快研究高效的训练和推理方法，推动三类创新协同

核心思想：降低AI的总拥有成本，推动其规模化、普惠化应用。
为什么重要：

经济可行性：训练一个千亿级模型的成本和碳排放极高，推理成本同样巨大，这限制了AI技术的普及。
应用落地前提：只有成本足够低、速度足够快，AI才能广泛应用于手机、汽车、物联网设备等边缘终端。

具体含义：

理论创新：提供新的算法和原理（如新的注意力机制）。
技术创新：将理论转化为可行的工程实现。
工程创新：打造稳定、可扩展的大规模训练和推理系统（如推理服务器、编译优化）。三者缺一不可，必须紧密协同。

高效训练：研究如混合精度训练、模型并行/流水线并行优化、更好的优化器、课程学习等，以缩短训练时间、节省算力。
高效推理：研究模型量化、剪枝、知识蒸馏、动态计算等技术，让大模型能在更小的硬件资源上流畅运行。
三类创新协同：

3. 探索模型应用新形态，提升复杂任务处理与交互体验

核心思想：拓展AI的能力边界和应用场景，使其从“工具”变为“伙伴”。
为什么重要：

价值体现：模型能力的最终价值体现在解决实际问题和提升用户体验上。
下一代交互：文本对话只是开始，未来需要融合语音、视觉、手势等多模态交互，并能够执行复杂、多步骤的任务。

具体含义：

应用新形态：例如AI智能体（Agent）能够自主规划、使用工具、执行任务；模型作为“大脑”驱动机器人；沉浸式虚拟世界中的AI角色等。
提升复杂任务处理能力：使模型能够进行复杂的推理、规划、解决需要多步骤分析的科学和工程问题。
优化交互体验：使交互更自然、更人性化、更具上下文感知能力，减少“幻觉”输出，提供更准确、可靠的结果。

4. 建立健全模型能力评估体系，促进能力有效迭代

核心思想：建立科学的“指挥棒”，确保模型发展不偏航，实现持续、健康的进化。
为什么重要：

避免“刷榜”：传统的基准测试（如MMLU、GSM8K）可能被过拟合，无法真实反映模型的通用能力。
全面衡量：需要超越简单的“准确率”，去评估模型的推理能力、安全性、偏见、鲁棒性、能耗效率等。
指导发展：一个好的评估体系能为研发指明方向，知道模型的短板在哪里，从而进行针对性优化。

具体含义：

建立健全体系：开发更全面、更鲁棒、更贴近真实应用场景的评估基准。例如，ARC的AGI Eval、动态更新的挑战集等。
促进有效迭代：基于评估结果，形成“评估-发现问题-迭代优化-再评估”的闭环开发流程，确保每一次模型更新都是能力的真实提升，而非指标的虚假繁荣。

这四条措施构成了一个完整的增强循环：
（理论基础 & 架构创新） 为 （高效训练 & 推理） 提供了新的可能；
（高效训练 & 推理） 使得 （探索新应用形态 & 处理复杂任务） 在经济和技术上变得可行；而 （科学的评估体系） 则贯穿始终，确保前三个环节的方向正确和能力真实提升，并反馈指导新一轮的理论和技术创新。