DeepSeek-V4预览版正式发布
同步开源:模型权重及技术报告已在ModelScope平台发布,供开发者查阅与使用。
核心亮点
全系列模型标配100万Token超长上下文,有效支撑长文本处理场景。在Agent能力、世界知识储备及推理性能三大维度均达到国内及开源领域领先水平,其中V4-Pro版性能可比肩顶级闭源模型。
双版本配置
V4-Pro(旗舰版):总参数1.6T,激活参数49B;在100万Token上下文场景下单Token推理FLOPs仅为V3.2版本的27%,KV缓存占用量降低至10%,显著提升运行效率。
V4-Flash(轻量版):总参数284B,激活参数13B;推理性能接近旗舰版,部署成本更低,适用于高吞吐轻量化场景。
核心能力
Agent能力:在Agentic Coding评测中位列开源领域第一,实际体验优于Sonnet 4.5版本,可兼容Claude Code、OpenClaw等主流Agent框架。
世界知识储备:SimpleQA-Verified评测得分57.9分,显著领先开源竞品,略低于Gemini-Pro-3.1版本。
推理性能:LiveCodeBench评测93.5分,Codeforces Rating达3206分,在数学、STEM及竞赛代码领域超越所有公开开源模型。
核心技术突破
混合注意力架构:采用CSA+HCA+DSA稀疏注意力组合方案,大幅提升长上下文处理效率。
国产算力适配:深度适配华为昇腾系列芯片,降低对英伟达芯片依赖,助力国产化部署。
体验渠道
官网:chat.deepseek.com
官方App:各应用市场下载
API调用:指定model_name为deepseek-v4-pro或deepseek-v4-flash

