DeepSeek-V4 预览版
官方技术报告要点速览与核心能力图谱
超万亿参数规模 · 百万级上下文
1双版本并行
参数规模:总参数 1.6T / 激活参数 49B
核心亮点:三种推理模式(Non-think / Think High / Think Max)。在最强计算预算下,解决复杂 Agentic 任务的能力直接逼近全球闭源顶级水平。
参数规模:总参数 284B / 激活参数 13B
核心亮点:全面继承 Pro 版底层训练管线,主打极致性价比与极速吞吐。同享 1M 超大上下文,是企业级规模化落地与降本增效的基石。部分 Coding Agent已经可以体验。
2基准测试对抗(部分)
3核心技术创新
- 混合注意力架构 (Hybrid Attention):
结合压缩稀疏注意力(CSA)与重度压缩注意力(HCA),在1M上下文时,推理算力直降至27%,KV Cache 需求暴降至10%。 - 流形约束超连接 (mHC):
强化残差连接,极大提升信号跨层传播保真度,提升超深层模型中信号传播稳定性,降低长链路推理中的退化风险。 - Muon优化器赋能:
替代传统 Adam 系列,在超大规模训练里获得更快的收敛速度和更高的训练稳定性。 - 模块化后训练管线:
“两阶段范式”,SFT与GRPO先培育独立专家,再通过同策略蒸馏无损熔合进基础大模型。
4官方定价
计费单位:每百万 (1M) Token。
5API 使用
🌐 双兼容端点 (Endpoint):
• OpenAI 兼容: https://api.deepseek.com
• Anthropic 兼容: https://api.deepseek.com/anthropic
🏷️ 模型名称 (Model Name):deepseek-v4-pro或deepseek-v4-flash
🛠️ 全功能扩展支持:
原生支持 JSON 结构化输出 (JSON Output)、外部工具调用 (Tool Calls)、前缀补全及代码填充。
⚠️ 废弃预警:旧版deepseek-chat/reasoner将于 2026年7月24日 全面停服,过渡期内将在后端自动映射至 V4-Flash 的两种模式。
✨ 国产之光,开放生态 ✨
【算力主权】率先完成与华为昇腾(Ascend)国产AI芯片的原生适配,实质性推进“去CUDA化”,推动国产算力生态落地。
【开放生态】1.6万亿参数的完整权重在MIT 协议下开源,允许商用部署及二次开发,为企业、开发者和研究机构提供了更大的使用空间。
DeepSeek-V4 的意义,不只在于参数规模和基准成绩,更在于它展示了一条更开放、更高效、更易落地的大模型发展路径。对于企业而言,它降低了尝试先进模型能力的门槛;对于开发者而言,它提供了一个可研究、可部署、可二次开发的基模选择;对于生态而言,它也让普惠 AI 的落地多了一种现实可能。

