https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf
推理能力全球领先
- DeepSeek-V3.2 旨在平衡推理能力与输出长度,适用于日常问答及通用 Agent 任务。在公开推理类 Benchmark 测试中,其性能达到 GPT-5 水平,略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 输出更短,显著降低计算开销与响应延迟。
- DeepSeek-V3.2-Speciale 是 V3.2 的长思考增强版,融合 DeepSeek-Math-V2 的定理证明能力,专为探索模型极限而设计。该模型在指令遵循、数学证明与逻辑验证方面表现卓越,主流推理基准性能媲美 Gemini-3.0-Pro。尤为突出的是,V3.2-Speciale 已成功斩获 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 四项国际顶级赛事金牌,其中 ICPC 与 IOI 成绩分别达人类选手第二名与第十名水平。
需注意:Speciale 模型在复杂任务上表现远超标准版,但 Token 消耗更高,成本更大。当前仅限研究用途,不支持工具调用,也未针对日常对话或写作进行优化。
表1:DeepSeek-V3.2 与其他模型在数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数)
思考融入工具调用
- DeepSeek-V3.2 是首款实现“思考融入工具使用”的模型,支持思考模式与非思考模式下的工具调用。我们提出大规模 Agent 训练数据合成方法,构建了 1800+ 环境、85,000+ 复杂指令的强化学习任务,显著提升模型泛化能力。
表2:DeepSeek-V3.2 与其他模型在智能体工具调用评测集上的得分
- 如表2所示,DeepSeek-V3.2 在智能体评测中达到当前开源模型最高水平,大幅缩小与闭源模型的差距。值得注意的是,该模型并未针对测试集中工具做专项训练,表明其具备较强的真实场景泛化能力。
示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力,获得更详尽准确的回答。
开源
- DeepSeek-V3.2
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
- DeepSeek-V3.2-Speciale
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
网页端、APP 与 API 更新
DeepSeek-V3.2 已全面上线官网网页端、APP 及 API,替代此前的实验版本 DeepSeek-V3.2-Exp,使用方式保持不变。
为便于社区评测与研究,我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。用户可通过设置:
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
访问该模型。API 定价不变,仅支持思考模式下的对话功能,不支持工具调用,最大输出长度为 128K,服务有效期至北京时间 2025-12-15 23:59。
思考模式下的工具调用
本次 API 更新支持 DeepSeek-V3.2 在思考模式下进行工具调用。在此模式下,模型可经多轮“思考 + 工具调用”后输出更精准详实的结果。下图为思考模式下工具调用的 API 请求流程示意:
- 在处理问题1时(请求1.1–1.3),模型通过多次思考与工具调用得出答案,用户需回传思维链内容(reasoning_content)以继续推理过程。
- 开始下一问题时(请求2.1),应删除前序思维链,保留其他上下文发送给 API。
- 详细使用说明请参考 API 文档:
https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
此外,DeepSeek-V3.2 的思考模式现已支持 Claude Code,用户可通过将模型名设为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键启用。但需注意,该模式尚未充分适配 Cline、RooCode 等采用非标准工具调用的组件,建议此类场景继续使用非思考模式。

