2025年8月国务院发布《国务院关于深入实施“人工智能+”行动的意见》
(七)提升模型基础能力。
加强人工智能基础理论研究,支持多路径技术探索和模型基础架构创新。加快研究更加高效的模型训练和推理方法,积极推动理论创新、技术创新、工程创新协同发展。探索模型应用新形态,提升复杂任务处理能力,优化交互体验。建立健全模型能力评估体系,促进模型能力有效迭代提升。
总体解读
这段政策的核心理念是推动AI发展从“规模驱动”向“效率驱动”和“能力驱动” 转变。它不再仅仅强调“做大模型”,而是更注重“做强模型”、“做优模型”和“用好模型”,涵盖了从底层理论到上层应用,再到评估迭代的全链条。
分点详细解读
1. 加强基础理论研究,支持多路径探索与架构创新
核心思想:打破路径依赖,为AI的长期发展夯实根基。
为什么重要:
当前瓶颈:现有模型(如Transformer)虽然在实践中取得了巨大成功,但在能耗、推理效率、长序列处理、因果推理等方面仍存在理论瓶颈。
避免内卷:如果所有研究都集中在微调现有架构上,容易导致技术“内卷”,难以产生颠覆性突破。
具体含义:
基础理论研究:探索机器学习的新范式、新的优化算法、对模型泛化能力的理论解释、模型与知识的结合等。
多路径技术探索:不仅支持基于Transformer的路线,也鼓励基于状态空间模型(如Mamba)、神经符号系统、类脑计算等不同技术路线的研究。
模型基础架构创新:研发下一代更高效、更智能的核心网络架构,以替代或改进现有的Transformer。
2. 加快研究高效的训练和推理方法,推动三类创新协同
核心思想:降低AI的总拥有成本,推动其规模化、普惠化应用。
为什么重要:
经济可行性:训练一个千亿级模型的成本和碳排放极高,推理成本同样巨大,这限制了AI技术的普及。
应用落地前提:只有成本足够低、速度足够快,AI才能广泛应用于手机、汽车、物联网设备等边缘终端。
具体含义:
理论创新:提供新的算法和原理(如新的注意力机制)。
技术创新:将理论转化为可行的工程实现。
工程创新:打造稳定、可扩展的大规模训练和推理系统(如推理服务器、编译优化)。三者缺一不可,必须紧密协同。
高效训练:研究如混合精度训练、模型并行/流水线并行优化、更好的优化器、课程学习等,以缩短训练时间、节省算力。
高效推理:研究模型量化、剪枝、知识蒸馏、动态计算等技术,让大模型能在更小的硬件资源上流畅运行。
三类创新协同:
3. 探索模型应用新形态,提升复杂任务处理与交互体验
核心思想:拓展AI的能力边界和应用场景,使其从“工具”变为“伙伴”。
为什么重要:
价值体现:模型能力的最终价值体现在解决实际问题和提升用户体验上。
下一代交互:文本对话只是开始,未来需要融合语音、视觉、手势等多模态交互,并能够执行复杂、多步骤的任务。
具体含义:
应用新形态:例如AI智能体(Agent)能够自主规划、使用工具、执行任务;模型作为“大脑”驱动机器人;沉浸式虚拟世界中的AI角色等。
提升复杂任务处理能力:使模型能够进行复杂的推理、规划、解决需要多步骤分析的科学和工程问题。
优化交互体验:使交互更自然、更人性化、更具上下文感知能力,减少“幻觉”输出,提供更准确、可靠的结果。
4. 建立健全模型能力评估体系,促进能力有效迭代
核心思想:建立科学的“指挥棒”,确保模型发展不偏航,实现持续、健康的进化。
为什么重要:
避免“刷榜”:传统的基准测试(如MMLU、GSM8K)可能被过拟合,无法真实反映模型的通用能力。
全面衡量:需要超越简单的“准确率”,去评估模型的推理能力、安全性、偏见、鲁棒性、能耗效率等。
指导发展:一个好的评估体系能为研发指明方向,知道模型的短板在哪里,从而进行针对性优化。
具体含义:
建立健全体系:开发更全面、更鲁棒、更贴近真实应用场景的评估基准。例如,ARC的AGI Eval、动态更新的挑战集等。
促进有效迭代:基于评估结果,形成“评估-发现问题-迭代优化-再评估”的闭环开发流程,确保每一次模型更新都是能力的真实提升,而非指标的虚假繁荣。
这四条措施构成了一个完整的增强循环:
(理论基础 & 架构创新) 为 (高效训练 & 推理) 提供了新的可能;
(高效训练 & 推理) 使得 (探索新应用形态 & 处理复杂任务) 在经济和技术上变得可行;而 (科学的评估体系) 则贯穿始终,确保前三个环节的方向正确和能力真实提升,并反馈指导新一轮的理论和技术创新。
这份指导方针表明,中国在AI领域的发展正走向更加成熟、深入和可持续的阶段,着眼于构建长期的核心竞争力。
空间因“您”而变!
联系『变芯®空间』
合作沟通:请加 zr18620222480
合伙人招募:1638079312(微Q同号)
供应链接:请发至1638079312@qq.com

