11月28日,DeepSeek发布新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架,显著提升数学问题求解的准确性与可靠性。
自验证训练框架提升模型性能
该模型基于DeepSeek-V3.2-Exp-Base构建,引入LLM验证器自动审查生成的数学证明过程,并通过高难度样本持续优化推理能力。在IMO 2025和CMO 2024两项国际顶级数学竞赛中均达到金牌水平,在Putnam 2024测试中取得118/120分的优异成绩。
推动可靠数学智能系统发展
DeepSeek团队表示,该成果验证了自验证推理路径的技术可行性,为构建高可信度的数学智能系统提供了新方向。目前,模型代码与权重已全面开源,发布于Hugging Face及GitHub平台,供研究社区使用与进一步开发。


