DeepSeek-V4即将发布。
DeepSeek V4:专注编程能力的下一代旗舰模型
据The Information独家报道,DeepSeek正筹备推出下一代旗舰大模型V4,预计于2026年2月中旬、春节前后正式上线。
两位知情人士透露,内部测试显示V4在编程任务上的综合表现有望超越Anthropic Claude与OpenAI GPT系列主流模型。
此次升级为继R1之后的又一次架构级迭代,技术重心从通用推理转向「编程」——这一关键能力正成为AI在个人开发者与企业级市场的核心竞争力。
2025年1月20日(农历春节前),DeepSeek发布R1,假期期间迅速引发行业关注;节后首个交易日,美股芯片股集体下挫。市场由此意识到:中国AI团队可在极低算力成本下实现与国际顶尖模型的性能对标。
今年,DeepSeek或将再次复刻这一路径。
为何聚焦编程?
当前编程能力评估的黄金标准是Claude Opus 4.5,其在权威基准SWE-bench Verified上以80.9%准确率保持领先。
V4若要突破现有瓶颈,不仅需强化代码生成能力,还需集成调试、多步推理及调用外部工具的Agent能力。
报道称,V4在超长上下文代码提示处理方面取得显著进展,对复杂软件工程场景具备实用价值。
两大技术信号已提前释放
信号一:mHC论文(1月1日)
DeepSeek于元旦发布mHC技术论文,创始人梁文锋署名。论文指出,其信号放大倍数从3000降至1.6,压缩达三个数量级。
德国特里尔大学研究员Florian Brand指出,DeepSeek过往论文常为下一代模型的技术路线提供早期线索。
信号二:R1论文v2版更新(1月4日)
未发公告,仅悄然将R1论文版本号由v1升至v2:页数从22页扩展至86页,完整披露训练流程,并新增罕见的“失败尝试”章节,分析MCTS在通用推理任务中的失效原因。
此类“防御性开源”通常意味着:清理既有技术债务、固化方法论,并集中资源投入下一代模型研发。
产品演进路径:R2或将跳过,V4成主线
行业分析师普遍认为,DeepSeek很可能不再单独发布R2。目前R1的关键改进已整合进V3,而mHC技术大概率将成为V4的核心架构基础。
V4预计于2月中旬发布,具体时间仍存在调整可能。
去年R1证明了中国AI公司可凭约十分之一算力成本达成国际一线水平;今年V4的目标更进一步:在编程这一高门槛领域,同样实现技术平权。

