告别CUDA！DeepSeek V4全面适配昇腾，国产AI这次真的站起来了- 大数跨境

cDesgin-天渊

2026-04-27

导读：DeepSeek V4完成华为昇腾全面适配，脱离CUDA依赖，训练效率达92%，推理效率持平。

告别CUDA！DeepSeek V4这次真的站起来了

当所有人都在追逐英伟达的CUDA生态时，DeepSeek悄悄走了一条不同的路。

昨天深夜，一条消息在AI圈炸开了锅——DeepSeek V4完成了对华为昇腾芯片的全面适配，彻底脱离了对CUDA的依赖。

很多人听到这个消息的第一反应是："能做到吗？"毕竟现在全球AI训练几乎都离不开英伟达的CUDA生态。但DeepSeek用实际行动给出了答案：能，而且做得很好。

说"叛逃"可能有点夸张，但DeepSeek的选择确实很勇敢。

CUDA是英伟达的专有计算平台，全球90%以上的AI训练都跑在上面。但问题也很明显——贵、垄断、供应链风险。今年美国对华芯片出口管制一轮比一轮严，国内科技公司都在找Plan B。

华为昇腾是国产AI芯片的代表，算力不差，但软件生态确实是个短板。之前很多团队尝试适配，都是"能用但不好用"的状态。

DeepSeek这次不是简单的"移植"，而是重新设计了整个计算图。

最核心的突破是——他们搞出了一套自己的算子自动优化框架，可以直接把PyTorch代码编译成昇腾的底层指令，不需要手动改写。这意味着，以后开发者用DeepSeek的这套方案，可以在昇腾上跑原来CUDA环境的代码，几乎零成本迁移。

用他们技术负责人的话说："我们不是在对抗CUDA，而是在证明——AI计算的未来不应该被某一个生态绑架。"

坦白说，看到这个消息时我是有点激动的。

过去几年，"国产替代"的口号喊了很多，但真正能在生产环境跑起来的案例不多。DeepSeek V4这次不一样——他们已经在3个业务场景上全量切换到昇腾集群，包括：

重要的是，成本降了。据说同样算力需求，用昇腾比租A100便宜40%左右。在AI烧钱的今天，这个数字足够让很多公司心动。

短期看，DeepSeek这套方案主要还是自用，但技术框架是开源的。如果真能跑通，对整个国内AI行业都是个好消息。

当然，挑战也还在。软件生态的完善不是一朝一夕的事，开发者工具、调试体验、社区支持，这些都需要时间积累。

但至少，我们看到了一种可能性——AI计算的未来，不一定只有CUDA一种答案。

就像当年移动互联网时代，安卓和iOS双雄并立；AI时代，也许我们会看到CUDA和昇腾各占一方。

不管你看好不看好，DeepSeek这次都值得点个赞。在大家都往CUDA生态里挤的时候，有人愿意转身去啃硬骨头，这才是真正的创新。

— cDesgin-天渊

【声明】内容源于网络

cDesgin-天渊

AI前沿资讯，AI项目落地

内容 40

粉丝 0

cDesgin-天渊 AI前沿资讯，AI项目落地

总阅读32

粉丝0

内容40