DeepSeek将于2月中旬发布新一代旗舰模型V4,聚焦超强代码生成能力
据科技媒体“The Information”援引两位直接知情人士消息,深度求索(DeepSeek)预计将在2026年2月中旬、农历新年前后正式推出代号为V4的新一代人工智能大模型。该模型以卓越的代码生成能力为核心定位。
支持百万级上下文,实现跨文件深度理解
V4在超长代码提示词的处理与解析方面取得关键突破,支持百万级token上下文窗口,可一次性解析中型项目全部代码库、技术文档与需求说明,精准识别跨文件依赖关系,有效解决大型软件开发中的上下文断裂难题,对系统开发、遗留代码重构及复杂文档理解具有显著价值。
训练全程性能不衰减,提升抽象学习能力
V4攻克了AI训练中常见的数据模式理解能力随训练轮次增加而衰减的问题,相较传统模型具备更稳定的泛化表现。该特性使其能更高效地从海量数据中提炼规律,超越简单记忆,形成深层次抽象理解能力。
综合性能领先主流模型,适配国产硬件生态
基于内部基准测试,V4在代码生成任务中已超越Anthropic Claude、OpenAI GPT系列等当前主流模型。行业消息称,V4或采用全新mHC架构,在并行计算效率和国产AI芯片适配性方面显著优化,有助于降低部署成本、提升推理速度,为规模化商用提供支撑。
R1论文大幅扩容,技术准备就绪
1月4日,DeepSeek在arXiv平台更新R1论文,页数由22页扩展至86页,新增完整训练管线详解及20余项权威评测基准的详实数据,被业内视为V4发布的前置技术铺垫。

