近日,DeepSeek-V3深度求索发布了最新版 DeepSeek-V3-0324。尽管官方称是“小版本升级”,但不少测试过的网友并不同意官方的谦虚说辞。这一版本在编码、写作、数学能力上显然有不小提升,属于“小版本,大升级”。
耀途天使轮项目硅基流动宣布, SiliconCloud 平台的 Pro 版与普通版 DeepSeek-V3 都已完成升级,且同样基于华为云昇腾云部署推理服务。
新版本 DeepSeek-V3 的价格与 API 接口保持不变,max_tokens 提升至 8K,支持 Function Calling、JSON Mode、Prefix、FIM。
另外,为确保企业用户平稳过渡至新版本,初始版本 V3-1226 服务将持续支持一段时间。
在线体验:https://cloud.siliconflow.cn/models
API 文档:https://docs.siliconflow.cn/cn/api-reference/

还有多位用户尝试使用 DeepSeek V3-0324 创建了漂亮的 HTML5、CSS 和前端。提示的结果代码总共 958 行,最后实现了一个交互式网站,包括所有图像,并且结果也适用于移动设备。

另外一位网友用模型一口气编写了 800 多行代码,一次都没有中断,而且它开源、免费、速度超快。
博主orange.ai对 DeepSeek V3、DeepSeek-V3-0324 与 Claude Sonnet 3.7 的海报设计结果进行了比较,同样表示前端代码能力相比上代有了显著增强。
看来这次“小更新”比预期更好,数学方面也有提升。这让用户对 DeepSeek-R2 抱有极大期望。“中国不仅在追赶,且在超越我们。而且这一切都是开源的。”
新版 V3 模型借鉴了 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现。
根据 DeepSeek 官方提供的基准测试数据,相比 DeepSeek-V3 初始版本,DeepSeek-V3-0324 的推理能力显著提升:在 MMLU-Pro 上提升了 5.3%,在 GPQA 上提升 9.3%,在 AIME 上提升了 19.8%,在 LiveCodeBench 上提升了 10.0%。
同时,DeepSeek-V3-0324 在以下能力上有所改进:
-
优化前端开发能力:提高代码生成准确性,可生成更美观的网页和游戏前端。
-
升级中文写作能力:对齐了 R1 写作风格,中长篇写作质量更高;提升多轮交互式改写能力,优化了翻译质量和书信写作。
-
提升中文搜索功能:优化报告分析类请求,提供更详实的内容。
-
改进 Function Calling 能力:提高了函数调用的准确性,修复了 V3 初始版本存在的问题。
作为一站式大模型云服务平台,SiliconCloud 致力于为开发者提供极速响应、价格亲民、品类齐全、稳定丝滑的大模型 API。
除了最新版 DeepSeek-V3,SiliconCloud 已上架包括 Wan2.1-I2V、Qwen2.5VL-72B、Wan2.1-T2、QwQ-32B、DeepSeek-R1、DeepSeek-R1-Distill、CosyVoice2、DeepSeek-VL2、HunyuanVideo、Qwen2.5-7B/14B/32B/72B、BCE、BGE、SenseVoice-Small在内的上百款模型。其中,DeepSeek-R1 蒸馏版(8B、7B、1.5B)、BGE 等多款大模型 API 免费使用,让开发者实现“Token 自由”。
开发者可在 SiliconCloud 平台自由对比、组合各类大模型,只需在开发应用时轻松调用更易用、高效的 API,为你的生成式 AI 应用选择最佳实践。
AI是耀途资本长期重点投资赛道。耀途资本已经全方位布局生成式人工智能GenAI领域,包括硅基流动、焱融科技、速石科技、未来速度Xprobe、MemVerge等基础软件,以及包括元戎启行、数巅科技、新石器、喆塔科技、天鹜科技、FutureBio等应用层项目,壁仞科技、瀚博半导体、云豹智能、网迅科技、Credo(CRDO)、NeuReality、电科星拓、Xconn、赛勒科技、得一微电子、先进全成等基础硬件项目。(阅读更多)
参考资料:
机器之心:DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

