DeepSeek V4 来了，黄仁勋最担心的事成真了- 大数跨境

首页

DeepSeek V4 来了，黄仁勋最担心的事成真了

诺亚AI方舟

2026-04-25

Noah的AI观察

AI深度实践 · 一线实战派

2026.04.25

DeepSeek 跳票了一年，原来是去啃这块骨头？

DeepSeek V4 来了，黄仁勋最担心的事成真了

DeepSeek V4 归来 / GPT-5.5 同日对决 / Conway 曝光 / 华为首发

DeepSeek V4华为首发GPT-5.5对决Conway曝光

今日速览

HIGHLIGHTS

深度聚焦

DEEP DIVE

///

今日感悟

INSIGHT

BEGIN

01PART

今日速览TOP 5 HIGHLIGHTS

❶ DeepSeek V4 震撼归来，首发华为昇腾，迟到 15 个月原来是在啃最硬的骨头
无发布会、无采访、直接开源。V4-Pro1.6T 参数 / 49B 激活，V4-Flash 284B / 13B，双档均标配1M token 上下文。Codeforces Rating 3206，人类排名第 23；SWE Verified80.6%，与 Claude Opus 4.6 Max 的 80.8% 基本持平。1M 场景下 FLOPs 仅为 V3.2 的 27%，KV 缓存缩至 10%。华为昇腾独家首发，从迁移初期到今天推理速度提升 35 倍。官方结尾引用荀子："不诱于誉，不恐于诽，率道而行，端然正己。"

❷ GPT-5.5 同日正面对决，AI "疯狂星期五" 来了
2026 年 4 月 24 日，DeepSeek V4 与 GPT-5.5 同日发布。实测：两者 IMO 级数学题均给出正确答案，但 V4 思考时间更长；可视化任务 V4 更佳，GPT-5.5 整体响应更快。中国开源模型第一次在同一时间窗口正面接住 OpenAI。

❸ Anthropic 源码意外泄露，Conway 项目曝光：Claude 要变"操作系统入口"
Anthropic npm 包因 .npmignore 漏配，51.2 万行未混淆 TypeScript 裸奔公网。代码揭示 Conway：24 小时常驻后台的 Claude 实例，支持 webhook 唤醒、持久化会话、系统级进程守护，还预埋 Extensions 生态（.cnw.zip 格式）。Anthropic 想做的，是下一代操作系统入口，不是更聪明的聊天机器人。

❹ ChatGPT 杀入诊室：72% 美国医生已用 AI，OpenAI 免费开放临床版
AMA 2026 报告：72%美国医生已纳入至少一种 AI 用例，一年前是 48%。ChatGPT for Clinicians 向 NPI 认证医师免费开放，切入点是转诊信、保险预授权、病历文书等行政文书——医生最痛恨却最占时间的那些杂活，并支持 CME 学分自动计入。

❺ Google 拟向 Anthropic 投资最高 400 亿美元
据彭博社报道，Google 将以3500 亿美元估值立即注入 100 亿美元现金，可追加至最高 400 亿。Amazon 此前已投入 40 亿。Anthropic 的两个最大金主同时押注，资本正在重新定价 AI 行业格局。

✦ DeepSeek 不声不响迟到 15 个月，却把英伟达的护城河凿开了一道口子 ✦

02PART

深度聚焦DEEP DIVE · 3 TOPICS

国产化DeepSeek V4：迟到 15 个月的真相

很多人以为 DeepSeek V4 跳票是因为模型做不出来。

事实不是这样的。

V4 迟到的真正原因，是 DeepSeek 做了一个极其艰难的决定：把整个底层架构，从英伟达的 CUDA 生态迁移到华为的昇腾芯片上。

全球绝大多数 AI 模型都在英伟达的芯片上跑，CUDA 是整个行业积累了十几年的"专用操作系统"。DeepSeek 决定绕开它。

2025 年中途，他们遭遇了训练崩溃、稳定性不足、芯片间通信速度未达预期。一点一点优化。最终结果：V4-Pro 在华为昇腾 950 PR 上的推理速度，比迁移初期提升了 35 倍。

3206

Codeforces
人类第 23 名

27%

1M 场景推理 FLOPs
仅为 V3.2 的

35x

昇腾推理速度
迁移初期至今提升

还有一个定价页面的小字值得注意：受限于高端算力，V4-Pro 当前价格不是最终态，等下半年昇腾 950 超节点批量上市后，价格还会大幅下调。

DeepSeek 的"价格屠夫"属性，还没真正出手。

PULL QUOTE

"开源模型必须以英伟达芯片作为基建——这条行业铁律，DeepSeek 用 15 个月打破了它。"

—— 关于 DeepSeek V4 迟到的真相

点评：黄仁勋说"如果 DeepSeek 先在华为上首发，对我们来说非常可怕"。这句话今天成现实了。但更值得关注的不是这次，而是下一次——当昇腾 950 超节点批量上市，当价格真的杀下来，那才是这盘棋真正落子的时刻。DeepSeek 用 15 个月换来的，不只是一款更强的模型，而是一张不被卡脖子的底牌。

开源生态Kimi × DeepSeek 五次"撞车"：你中有我，我中有你

同一周，Kimi K2.6 和 DeepSeek V4 先后开源。这已经是过去 15 个月里，两家公司的第五次"撞车"了。

但比撞车更有意思的，是技术在两家之间的流动方向：

DeepSeek V4 的技术报告里，写着 Kimi 的名字——Muon 优化器，最早由 Kimi 团队验证能在万亿参数规模上跑通，DeepSeek 引用并采用。

Kimi K2.6 的架构底层，写着 DeepSeek 的名字——MLA（多头潜在注意力），DeepSeek V3 首创，Kimi 采用作为注意力机制基础。

两家被外界反复对比的对手，技术底层早就长到了一起。

PULL QUOTE

"DeepSeek 的报告里写着 Kimi 的名字，Kimi 的架构底座写着 DeepSeek 的名字——这才是中国 AI 应有的样子。"

—— 关于中国 AI 的开源协作

点评：国外媒体讲中国 AI 的故事，通常是"追赶叙事"：中国在跟 OpenAI 学。但 Kimi 和 DeepSeek 这几次撞车说明，最前沿的几家已经是在互相验证、互相推进了。Muon 优化器是 Kimi 先在万亿参数上验证了能跑，DeepSeek 才用进 V4——这不是学美国，这是中国 AI 自己在走自己的技术路线。追赶叙事正在失效。

产品战略Anthropic Conway：从聊天框到操作系统入口

一行 .npmignore 没配好，Anthropic 的野心就这样曝光了。

泄露代码里有一个此前从没公开过的代号：Conway。

Conway 不是一个更聪明的对话功能。它是一个独立运行的 Claude 实例环境：有自己的后台任务队列、持久化会话状态、系统级进程守护，支持 webhook 唤醒——你关掉浏览器，它还在跑。你去睡觉，它在后台继续执行任务。

还预埋了 Extensions 生态，自定义格式 .cnw.zip，支持安装工具和 UI 标签页。这是在铺一个平台，不只是改一个产品。

结合路线来看：2025 年底发 Claude Code，让开发者习惯"Claude 在后台帮我跑代码"；Conway 是下一步，把这个逻辑扩展到所有用户的所有任务。

PULL QUOTE

"对话框，是 AI 的起点，但绝不会是终点。Anthropic 看到的终局，是 24 小时不下班的操作系统。"

—— 关于 Conway 产品逻辑

点评：用户真正想要的从来不是"说话更好听的 AI"，而是"我不用盯着、不用催、任务自己跑完"。Conway 是第一个把这件事说清楚的产品信号。而且 Anthropic 的路线很清晰——先让开发者用 Claude Code 习惯"后台 Agent"，再用 Conway 把这个习惯扩散到所有人。如果这条路走通，Anthropic 抢到的就不只是 AI 助手入口，而是贯穿你所有工作流的"数字操作系统层"。这步走得很深。

快讯其他值得关注

▸阿联酋要让 AI Agent 接管一半政府工作：消息源自 APPSO 今日快讯，政府工作流 AI 化正在从概念变成政策。
▸小米 MiMo-V2.5-Pro 实测：Claude Code + MiMo-V2.5-Pro 被评为"目前国内最丝滑的 Agent 组合"，AA 榜与 Kimi K2.6 并列开源第一，价格比 Opus 4.6 便宜约 60%，且速度极快（用户少）。
▸SimpleTES 横扫 21 个科学难题：清北斯坦福联合团队，不靠更大模型、靠系统化放大"试错-反馈-进化"闭环，在圆填充等组合优化领域刷新最佳记录。
▸Vision Banana：谷歌 DeepMind 联合何恺明等，用单一生成式模型统一所有视觉任务——"Generation Is All You Need"，向视觉领域的"Attention Is All You Need"时刻发起挑战。
▸DeepSeek V4 架构细节：1.6T 总参 / 384 个专家 MoE，纯文本模型（暂无多模态），架构三件套：CSA+HCA 混合注意力 + mHC 流形约束超连接 + Muon 优化器。

///INSIGHT

今日感悟WHAT REALLY MATTERS

DeepSeek 在 V4 发布文章的结尾，引了一句荀子的话：

"不诱于誉，不恐于诽，率道而行，端然正己。"

过去半年，"DeepSeek 是不是落后了""梁文锋到底在干什么"的讨论在中英文 AI 圈来来回回跑了好几轮。他们一次都没有回应。

然后这个周五，悄悄更新了官网。

当我们都以为他们在解决技术瓶颈的时候，他们其实在啃一块别人不敢动的骨头：把英伟达 CUDA 生态，整个迁移到华为昇腾上。这是一个代价极高、失败概率很大、没有任何捷径的方向。

但如果成了，英伟达黄仁勋说的那句 "a horrible outcome" 就真的来了。

今天，它来了。

AI 行业里太多人在喊口号，太少人在啃骨头。DeepSeek 这 15 个月什么都没说，最后用一句荀子收尾——我觉得这挺合适。

不声不响地做难的事，
比大声说要做什么，难得多也值钱得多。

NOAH · AI深度实践

既然看到这里了
如果觉得有用，先点个赞，再顺手点个在看或转发

THANKS FOR READING

Noah的AI观察AI深度实践 · 一线实战派

长按关注 →

【声明】内容源于网络

诺亚AI方舟

🏷️ AI企业培训师 | 📕 小红书博主聚焦AI企业落地实战、行业动态与应用复盘。拒绝焦虑，只谈落地，带你深度思考AI如何赋能业务。

内容 73

粉丝 0

诺亚AI方舟 🏷️ AI企业培训师 | 📕 小红书博主聚焦AI企业落地实战、行业动态与应用复盘。拒绝焦虑，只谈落地，带你深度思考AI如何赋能业务。

总阅读294

粉丝0

内容73