DeepSeek深夜更新V3-0324版本，R2有望提前上线！- 大数跨境

汇智智能体

2025-03-25

3月24日晚间， DeepSeek 在 Hugging Face上放出了最新的 DeepSeek-V3-0324 模型，不过，DS尚未放出新版模型的系统卡，目前只能看到新版模型参数为 6850 亿，较早期版本的 6710 亿有小幅增长。

新版模型性能相较于旧版模型提升幅度显著，尤其在代码生成、数学推理、多轮对话方面表现亮眼，编程能力对标 Claude 3.7。

网址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

和之前旧版所采用的自定义许可证有所不同， DeepSeek-V3-0324 采用的是 MIT 开源协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给了开发者更多的自主权。

引入两项突破性技术

DeepSeek-V3-0324 依然采用混合专家（MoE，mixture-of-experts）架构。与传统大模型相比，计算效率大幅提升，其总参数量高达 6850 亿，但实际在特定任务期间仅激活约 370 亿参数，从而降低计算成本。

此外，该模型还引入了两项突破性的技术：

这两项创新技术让 DeepSeek-V3-0324 在推理效率和长文本处理能力上表现更优，将输出速度提高了近 80%。

一名昵称为 Xeophon 的 AI 研究员在 X 上发帖称：“在我的内部工作台上测试了新的 DeepSeek V3 ，它在所有测试的所有指标上都有了巨大的飞跃，它现在是最好的非推理模型，取代了（Claude）Sonnet3.5”

还有海外AI博主认为，DeepSeek 优于 Sonnet3.5 ，甚至与 Claude 3.7 竞争编码和数学，也有专业用户在体验后认为，V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

不过需要强调的是，与需要订阅的 Claude Sonnet 3.5 不同的是，DeepSeek-V3-0324 免费供任何人下载和使用。

虽然 DeepSeek 并未给出新版模型的基准测试结果，但是用户测试表明，新版模型在生成复杂代码、数学问题求解、前端设计任务等方面表现更加出色。

深度体验新版 DeepSeek-V3 模型

想要体验 DeepSeek-V3-0324 模型，需要先关闭深度思考模式，小编也第一时间进行了代码、数学和通用能力等多方面的测试。

1、生成精美天气卡片，只需在输入框中输入："生成一个南京市天气的卡片，充满科技感，html格式输出"。

新版 DeepSeek-V3 仅需几十秒就交付出了一个总计300多行代码，据其介绍，为了营造科技感氛围，背景采用了深色与霓虹蓝色调结合，同时做了动态渐变效果以及微光动画，移动鼠标就能体验。

2、开发一个小游戏，只需在输入框中输入："使用html、js和CSS，做一个网页版的俄罗斯方块小游戏"。

同样的，不到一分钟，新版 DeepSeek-V3 就交付出了一个总计 400 多行代码，还可以根据需要调整游戏参数，如游戏板大小、方块颜色、下落速度等，以自定义游戏体验。

3、2024年全国大学生数学竞赛的题目：设双叶双曲面 S:x2+y2−z=−2。记以 M0(1,1,−1) 为顶点且与 S 的上半叶 S+={(x,y,z)∈S∣z≥2} 相切的所有切线构成的锥面为 Σ。1.求锥面 Σ 的方程；2.求 S+nΣ 所在平面 π 的方程。

以上就是对此次新版模型的体验，而有消息称，原计划5月发布的 R2 模型将提前至4月发布，主打多模态，并且推理成本再砍50%。

随着DS的一次次霸屏，中美AI格局正在加速改写中，几个月前，中国AI能力还落后美国1-2年，而如今这一差距已经大大缩小，甚至正呈现出中国领先趋势！

欢迎加入汇智智能官方社群，

一起交流AI前沿技术！

【声明】内容源于网络

汇智智能体

让AI力量成为每个人的天赋！

内容 179

粉丝 0

汇智智能体让AI力量成为每个人的天赋！

总阅读3

粉丝0

内容179