前言
本文为产业链结构分析,所涉公司仅作行业讨论样本,不构成任何投资建议。投资有风险,入市需谨慎。
DeepSeek V4 发布当天,A 股上演了一场分裂行情。
冲进去的人逻辑很简单:国产大模型跑在国产芯片上了,算力自主的故事终于可以盖章了。昇腾概念,国产替代,干就完了。
但在冲向所谓的昇腾概念股之前,我们该看一看真正的市场逻辑:哪一层真的换了,哪一层还没换,以及这个"分号"离"句号"还有多远。
01.
所有人都在等的那个胜利
朋友圈这两天能刷到三十遍 DeepSeek V4 加昇腾。
中文媒体的标题几乎是同一个意思——国产替代里程碑、AI 算力突围、华为昇腾时代来临。海光、寒武纪、深圳华强、光迅。A 股开盘前后,资金已经投票了。
这种叙事的诱惑很容易理解。
从 2022 年 H100 出口管制开始,国产 AI 一直处在"卡脖子"的预言里,市场在等一个可以盖章的胜利时刻。
V4 是迄今最像那个时刻的事件——一个万亿参数级的国产开源旗舰模型,发布当天就跑在了国产硬件上。
但 DeepSeek 自己的技术报告里,藏着一个被所有中文媒体跳过的字。
它写的是:"我们在英伟达 GPU 和华为昇腾 NPU 平台上均验证了细粒度专家并行方案。"
是"均",不是"换"。
同一天,路透社问华为这件事。华为发言人的英文措辞是:
"Huawei said its chips were used in some of the V4's training process."
是"部分",不是"全部"。
两边的措辞都很谨慎。
但中文媒体把"均"读成"换"、把"some of"读成"all"。读完之后留给读者的画面是——"DeepSeek 换硬件了"。
但在冲向所谓的昇腾概念股之前,我们该看一看真正的市场逻辑。
02.
跑得动,但训不动
一个大语言模型从无到有,有两个完全不同的阶段。
训练,是把模型从随机初始化"喂"成 V4。32 万亿 token、上百天连续不间断的算力。一次性大事件。
推理,是 V4 训练完之后被用户调用。每一次提问、每一次 Agent 调用,都是一次推理。日常小事件,每天发生几十亿到几百亿次。
技术报告说"均验证了",是说推理这一头可以在两种硬件上都跑通。它没说,也没暗示,训练那一头已经迁到了昇腾。
事实上:
DeepSeek 训 V4 用的最底层那套工具,还是英伟达专用。别人想拿这套去昇腾上训同款模型,得先把工具整套重写。
V4 的核心创新「FP4 量化感知训练」,昇腾的卡还用不上。
华为对外用 "some of" 指的是训练流程里能用昇腾的那部分:数据预处理、部分微调、推理验证。不是整个预训练。
InfoQ 在分析报道里直接写过:"开源层面当前释放的仍主要是基于 CUDA 的 MegaMoE 和 DeepGEMM,底层实现深度绑定 NVIDIA 工具链。"
技术圈知道这件事。中文主流报道在标题和正文里都跳过了。
不是不知道。是这件事拆开看会让叙事掉一档。「算力自主」作为愿景,和「算力自主分两层、目前只完成了一层」作为事实,传播效果完全不同。前者是胜利,后者是工程进度。
所有人都在等胜利。所以叙事被自动简化。
03.
电费和钥匙
要把训练和推理的分量讲清楚,借一个家庭场景。
训练,是房子的钥匙。
一年装修一次,一次的支出占全年最大头。OpenAI 2026 年预计要烧 250 亿美元在训练上。Anthropic 二月份刚拿到 300 亿美元 G 轮。这些钱大头都进了英伟达 H100/H200 的发货单。它决定了下一代模型由谁来训。
推理,是日常的电费。
每天买菜、烧饭、用电。一千亿次调用乘以单价,就是 AI 公司每天的运营开支。这笔钱分散、流水、对单价敏感。
两件事的钱、节奏、技术门槛完全不同。
钥匙的钱是脉冲式的,决策频次低,对硬件性能上限要求高。差一个数量级的算力就训不出新一代模型。
电费的钱是流水式的,决策频次高,对硬件单价敏感度高。每天一千亿次调用,单次成本省一分钱就是一千万。
V4 这次换的是电费,没换的是钥匙。
04.
电价真变了
V4 发布当天,华为给了一组实测数据:
V4-Pro 在昇腾上跑起来,每输出一个字延迟约 20 毫秒(大概是你眼里 ChatGPT 打字的速度)
V4-Flash 更快一倍,每字 10 毫秒
寒武纪也在同一天跑通了 V4
智源研究院公告 V4 在 8 款国产芯片上全部跑通
价格层面更直接。
昇腾 950PR 的采购价格大约是英伟达 H200 的三分之一到四分之一。绝对算力是 H200 的一半。单位算力成本只有英伟达的一半左右。
这个比例传到 API 价格上:
V4-Flash 输出价 2 元/百万 tokens
发布前一天 OpenAI 上线的 GPT-5.5,输出价 30 美元/百万 tokens,折人民币超过 200 元
价差 100 倍。
这不是单点价格战。是一个完整的国产推理生态,在 V4 发布当天就闭环了:模型方、芯片方、推理框架方、企业部署方的适配工作全部前置到 Day0。
中国 AI 公司每天烧出去的运营开支,从这一天开始可以在国内循环了。
这一句话是真的写完了。
05.
钥匙这一头,还在英伟达手里
DeepSeek 这次预训练 V4 用的算子,还是 CUDA 版本。MegaMoE 和 DeepGEMM 在昇腾上没有对应的成熟实现。FP4 量化感知训练,昇腾的硬件还不支持。
V4-Pro 训出来的那一刻,最关键的几步是在英伟达硬件上完成的。
OpenAI 一年烧 250 亿美元在训练上。DeepSeek 这次开放融资也只融 3 亿美元。
如果训练这一头还系在英伟达身上,那么中国 AI 公司每年最大的那笔资本开支,仍然要交给英伟达。
V4 不是句号。它是一个分号。
分号的上半句是推理国产化。已经写完。昇腾、寒武纪、海光、智源 FlagOS,企业每天的运营开支可以在国内循环。
分号的下半句是训练国产化。还在写。MegaMoE 还在 CUDA 上,FP4 训练昇腾还没跟上,下一代 V5 是不是还能在英伟达硬件之外跑通预训练,得 12 到 24 个月之后才知道。
把分号读成句号,是这次 V4 报道里最大的误读。它把一个已完成的下半场,和一个还在写的上半场,压成了一个不存在的全场胜利。
误读不是无害的。如果你是投资者,把分号当句号会让你高估国产替代的进度,低估下一轮训练硬件迭代的难度。
产业链的利润从来不是均匀分布的,看清一条产业链里钱怎么流,才看得见真正的价值在哪里。
这里是「价值前沿」,一个专注产业链深度拆解和热点解读的账号,数据和逻辑均来自专业研报。
留言告诉我你想看哪个行业、哪个热点,下篇文章见。

