大数跨境
0
0

爆料!DeepSeek-V4 再战春节:不卷推理,卷「编程」!

爆料!DeepSeek-V4 再战春节:不卷推理,卷「编程」! AI信息Gap
2026-01-10
6
导读:DeepSeek-V4 要来了。

DeepSeek-V4即将发布。

DeepSeek V4:专注编程能力的下一代旗舰模型

据The Information独家报道,DeepSeek正筹备推出下一代旗舰大模型V4,预计于2026年2月中旬、春节前后正式上线。

两位知情人士透露,内部测试显示V4在编程任务上的综合表现有望超越Anthropic Claude与OpenAI GPT系列主流模型。

此次升级为继R1之后的又一次架构级迭代,技术重心从通用推理转向「编程」——这一关键能力正成为AI在个人开发者与企业级市场的核心竞争力。

2025年1月20日(农历春节前),DeepSeek发布R1,假期期间迅速引发行业关注;节后首个交易日,美股芯片股集体下挫。市场由此意识到:中国AI团队可在极低算力成本下实现与国际顶尖模型的性能对标。

今年,DeepSeek或将再次复刻这一路径。

为何聚焦编程?

当前编程能力评估的黄金标准是Claude Opus 4.5,其在权威基准SWE-bench Verified上以80.9%准确率保持领先。

V4若要突破现有瓶颈,不仅需强化代码生成能力,还需集成调试、多步推理及调用外部工具的Agent能力。

报道称,V4在超长上下文代码提示处理方面取得显著进展,对复杂软件工程场景具备实用价值。

两大技术信号已提前释放

信号一:mHC论文(1月1日)

DeepSeek于元旦发布mHC技术论文,创始人梁文锋署名。论文指出,其信号放大倍数从3000降至1.6,压缩达三个数量级。

德国特里尔大学研究员Florian Brand指出,DeepSeek过往论文常为下一代模型的技术路线提供早期线索。

信号二:R1论文v2版更新(1月4日)

未发公告,仅悄然将R1论文版本号由v1升至v2:页数从22页扩展至86页,完整披露训练流程,并新增罕见的“失败尝试”章节,分析MCTS在通用推理任务中的失效原因。

此类“防御性开源”通常意味着:清理既有技术债务、固化方法论,并集中资源投入下一代模型研发。

产品演进路径:R2或将跳过,V4成主线

行业分析师普遍认为,DeepSeek很可能不再单独发布R2。目前R1的关键改进已整合进V3,而mHC技术大概率将成为V4的核心架构基础。

V4预计于2月中旬发布,具体时间仍存在调整可能。

去年R1证明了中国AI公司可凭约十分之一算力成本达成国际一线水平;今年V4的目标更进一步:在编程这一高门槛领域,同样实现技术平权。

【声明】内容源于网络
0
0
AI信息Gap
各类跨境出海行业相关资讯
内容 683
粉丝 0
AI信息Gap 各类跨境出海行业相关资讯
总阅读28.3k
粉丝0
内容683