3月24日晚间, DeepSeek 在 Hugging Face上放出了最新的 DeepSeek-V3-0324 模型,不过,DS尚未放出新版模型的系统卡,目前只能看到新版模型参数为 6850 亿,较早期版本的 6710 亿有小幅增长。
新版模型性能相较于旧版模型提升幅度显著,尤其在代码生成、数学推理、多轮对话方面表现亮眼,编程能力对标 Claude 3.7。
网址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
和之前旧版所采用的自定义许可证有所不同, DeepSeek-V3-0324 采用的是 MIT 开源协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。
DeepSeek-V3-0324 依然采用混合专家(MoE,mixture-of-experts)架构。与传统大模型相比,计算效率大幅提升,其总参数量高达 6850 亿,但实际在特定任务期间仅激活约 370 亿参数,从而降低计算成本。
-
多头潜在注意力(MLA):增强了模型在长篇文本中保持上下文的能力
-
多标记预测(MTP):改变了通常一次只能生成一个 token 的方法,改为每步生成多个 tokens
这两项创新技术让 DeepSeek-V3-0324 在推理效率和长文本处理能力上表现更优,将输出速度提高了近 80%。
一名昵称为 Xeophon 的 AI 研究员在 X 上发帖称:“在我的内部工作台上测试了新的 DeepSeek V3 ,它在所有测试的所有指标上都有了巨大的飞跃,它现在是最好的非推理模型,取代了(Claude)Sonnet3.5”
还有海外AI博主认为,DeepSeek 优于 Sonnet3.5 ,甚至与 Claude 3.7 竞争编码和数学,也有专业用户在体验后认为,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。
不过需要强调的是,与需要订阅的 Claude Sonnet 3.5 不同的是,DeepSeek-V3-0324 免费供任何人下载和使用。
虽然 DeepSeek 并未给出新版模型的基准测试结果,但是用户测试表明,新版模型在生成复杂代码、数学问题求解、前端设计任务等方面表现更加出色。
想要体验 DeepSeek-V3-0324 模型,需要先关闭深度思考模式,小编也第一时间进行了代码、数学和通用能力等多方面的测试。
1、生成精美天气卡片,只需在输入框中输入:"生成一个南京市天气的卡片,充满科技感,html格式输出"。
新版 DeepSeek-V3 仅需几十秒就交付出了一个总计300多行代码,据其介绍,为了营造科技感氛围,背景采用了深色与霓虹蓝色调结合,同时做了动态渐变效果以及微光动画,移动鼠标就能体验。
2、开发一个小游戏,只需在输入框中输入:"使用html、js和CSS,做一个网页版的俄罗斯方块小游戏"。
同样的,不到一分钟,新版 DeepSeek-V3 就交付出了一个总计 400 多行代码,还可以根据需要调整游戏参数,如游戏板大小、方块颜色、下落速度等,以自定义游戏体验。
3、2024年全国大学生数学竞赛的题目:设双叶双曲面 S:x2+y2−z=−2。记以 M0(1,1,−1) 为顶点且与 S 的上半叶 S+={(x,y,z)∈S∣z≥2} 相切的所有切线构成的锥面为 Σ。1.求锥面 Σ 的方程;2.求 S+nΣ 所在平面 π 的方程。
以上就是对此次新版模型的体验,而有消息称,原计划5月发布的 R2 模型将提前至4月发布,主打多模态,并且推理成本再砍50%。
随着DS的一次次霸屏,中美AI格局正在加速改写中,几个月前,中国AI能力还落后美国1-2年,而如今这一差距已经大大缩小,甚至正呈现出中国领先趋势!
欢迎加入汇智智能官方社群,
一起交流AI前沿技术!