>

DeepSeek V4 ：通往百万级上下文与万亿参数推理的新纪元

>

DeepSeek V4 ：通往百万级上下文与万亿参数推理的新纪元

DeepSeek V4 ：通往百万级上下文与万亿参数推理的新纪元

AI智能创作写作

2026-05-06

34

导读：DeepSeek V4（预览版），该模型以1.6万亿参数、100万token原生上下文、MoE稀疏架构为核心，

双版本核心定位：旗舰与轻量全覆盖

DeepSeek V4（预览版）采用混合专家（MoE）架构，推出Pro与Flash两大版本。两者均支持100万token上下文窗口，突破“长上下文即高溢价”限制，兼顾旗舰性能与轻量高效。

对比项	DeepSeek-V4-Pro（旗舰版）	DeepSeek-V4-Flash（轻量版）
总参数	1.6万亿（1.6T）	2840亿（284B）
激活参数	490亿（49B）	130亿（13B）
训练数据	33T tokens	32T tokens
定位	旗舰性能标杆，对标国际顶级闭源模型	轻量高效，主打高性价比部署应用
适用场景	复杂推理、长文档剖析、高阶代码开发	日常对话、文案创作、轻量级编码

三大技术革命：重构长上下文与万亿参数推理体系

百万上下文：从概念到实用

原生100万token上下文窗口支持整本书籍及代码仓库的一次性处理，无需分块与RAG辅助。采用混合注意力架构（CSA+HCA）：

CSA（压缩自注意力）：剔除冗余计算，提升推理效率
HCA（分层上下文聚合）：提炼核心信息，降低算力开销

在100万token场景下，推理FLOPs降至V3的27%，KV缓存压缩至10%，显存占用降低40%。

MoE稀疏激活：解锁万亿参数轻量化推理

基于mHC门控技术动态调用1-2个专家网络：

Pro版：1.6T参数仅激活490B，推理效率提升1.8倍
Flash版：284B参数仅激活130B，部署成本降低75%以上

推理模式优化与国产算力适配

提供三档可调节推理强度：

Non-think模式：极速响应适配轻量交互
Think High模式：平衡深度与速度
Think Max模式：专注高复杂度任务

全面适配华为昇腾与英伟达GPU，降低国产企业部署门槛。

性能实测：比肩国际顶级闭源模型

核心能力表现

Agent编码：V4-Pro研发任务通过率67%，接近Claude Opus 4.6的70%
世界知识：SimpleQA-Verified得分57.9，领先开源竞品20个百分点
中文能力：功能性写作胜率62.7%，创意写作胜率77.5%
代码能力：Codeforces评分3206，相当于人类选手第23名

长上下文实测

输入200K+token代码仓库可精准识别模块依赖；150K+token场景下分块处理效果更优，无信息丢失。

行业影响：推动AI普惠落地

重塑开源生态：1.6T参数MIT开源协议开放商用，打破闭源垄断
长上下文普惠化：百万上下文成为标配，推动长文档处理规模化应用
助力国产算力：深度协同国产硬件，降低企业出海合规风险

【声明】内容源于网络

0

0

AI智能创作写作

1234

内容 432

粉丝 1

AI智能创作写作 1234

总阅读16.3k

粉丝1

内容432