
Noah的AI观察
AI深度实践 · 一线实战派
DeepSeek 跳票了一年,原来是去啃这块骨头?
DeepSeek V4 来了,黄仁勋最担心的事成真了
DeepSeek V4 归来 / GPT-5.5 同日对决 / Conway 曝光 / 华为首发
01
今日速览
HIGHLIGHTS
02
深度聚焦
DEEP DIVE
///
今日感悟
INSIGHT
无发布会、无采访、直接开源。V4-Pro1.6T 参数 / 49B 激活,V4-Flash 284B / 13B,双档均标配1M token 上下文。Codeforces Rating 3206,人类排名第 23;SWE Verified80.6%,与 Claude Opus 4.6 Max 的 80.8% 基本持平。1M 场景下 FLOPs 仅为 V3.2 的 27%,KV 缓存缩至 10%。华为昇腾独家首发,从迁移初期到今天推理速度提升 35 倍。官方结尾引用荀子:"不诱于誉,不恐于诽,率道而行,端然正己。"
2026 年 4 月 24 日,DeepSeek V4 与 GPT-5.5 同日发布。实测:两者 IMO 级数学题均给出正确答案,但 V4 思考时间更长;可视化任务 V4 更佳,GPT-5.5 整体响应更快。中国开源模型第一次在同一时间窗口正面接住 OpenAI。
Anthropic npm 包因 .npmignore 漏配,51.2 万行未混淆 TypeScript 裸奔公网。代码揭示 Conway:24 小时常驻后台的 Claude 实例,支持 webhook 唤醒、持久化会话、系统级进程守护,还预埋 Extensions 生态(.cnw.zip 格式)。Anthropic 想做的,是下一代操作系统入口,不是更聪明的聊天机器人。
AMA 2026 报告:72%美国医生已纳入至少一种 AI 用例,一年前是 48%。ChatGPT for Clinicians 向 NPI 认证医师免费开放,切入点是转诊信、保险预授权、病历文书等行政文书——医生最痛恨却最占时间的那些杂活,并支持 CME 学分自动计入。
据彭博社报道,Google 将以3500 亿美元估值立即注入 100 亿美元现金,可追加至最高 400 亿。Amazon 此前已投入 40 亿。Anthropic 的两个最大金主同时押注,资本正在重新定价 AI 行业格局。
很多人以为 DeepSeek V4 跳票是因为模型做不出来。
事实不是这样的。
V4 迟到的真正原因,是 DeepSeek 做了一个极其艰难的决定:把整个底层架构,从英伟达的 CUDA 生态迁移到华为的昇腾芯片上。
全球绝大多数 AI 模型都在英伟达的芯片上跑,CUDA 是整个行业积累了十几年的"专用操作系统"。DeepSeek 决定绕开它。
2025 年中途,他们遭遇了训练崩溃、稳定性不足、芯片间通信速度未达预期。一点一点优化。最终结果:V4-Pro 在华为昇腾 950 PR 上的推理速度,比迁移初期提升了 35 倍。
3206
Codeforces
人类第 23 名
27%
1M 场景推理 FLOPs
仅为 V3.2 的
35x
昇腾推理速度
迁移初期至今提升
还有一个定价页面的小字值得注意:受限于高端算力,V4-Pro 当前价格不是最终态,等下半年昇腾 950 超节点批量上市后,价格还会大幅下调。
DeepSeek 的"价格屠夫"属性,还没真正出手。
PULL QUOTE
"开源模型必须以英伟达芯片作为基建——这条行业铁律,DeepSeek 用 15 个月打破了它。"

同一周,Kimi K2.6 和 DeepSeek V4 先后开源。这已经是过去 15 个月里,两家公司的第五次"撞车"了。
但比撞车更有意思的,是技术在两家之间的流动方向:
DeepSeek V4 的技术报告里,写着 Kimi 的名字——Muon 优化器,最早由 Kimi 团队验证能在万亿参数规模上跑通,DeepSeek 引用并采用。
Kimi K2.6 的架构底层,写着 DeepSeek 的名字——MLA(多头潜在注意力),DeepSeek V3 首创,Kimi 采用作为注意力机制基础。
两家被外界反复对比的对手,技术底层早就长到了一起。
PULL QUOTE
"DeepSeek 的报告里写着 Kimi 的名字,Kimi 的架构底座写着 DeepSeek 的名字——这才是中国 AI 应有的样子。"

一行 .npmignore 没配好,Anthropic 的野心就这样曝光了。
泄露代码里有一个此前从没公开过的代号:Conway。
Conway 不是一个更聪明的对话功能。它是一个独立运行的 Claude 实例环境:有自己的后台任务队列、持久化会话状态、系统级进程守护,支持 webhook 唤醒——你关掉浏览器,它还在跑。你去睡觉,它在后台继续执行任务。
还预埋了 Extensions 生态,自定义格式 .cnw.zip,支持安装工具和 UI 标签页。这是在铺一个平台,不只是改一个产品。
结合路线来看:2025 年底发 Claude Code,让开发者习惯"Claude 在后台帮我跑代码";Conway 是下一步,把这个逻辑扩展到所有用户的所有任务。
PULL QUOTE
"对话框,是 AI 的起点,但绝不会是终点。Anthropic 看到的终局,是 24 小时不下班的操作系统。"

▸小米 MiMo-V2.5-Pro 实测:Claude Code + MiMo-V2.5-Pro 被评为"目前国内最丝滑的 Agent 组合",AA 榜与 Kimi K2.6 并列开源第一,价格比 Opus 4.6 便宜约 60%,且速度极快(用户少)。
▸SimpleTES 横扫 21 个科学难题:清北斯坦福联合团队,不靠更大模型、靠系统化放大"试错-反馈-进化"闭环,在圆填充等组合优化领域刷新最佳记录。
▸Vision Banana:谷歌 DeepMind 联合何恺明等,用单一生成式模型统一所有视觉任务——"Generation Is All You Need",向视觉领域的"Attention Is All You Need"时刻发起挑战。
▸DeepSeek V4 架构细节:1.6T 总参 / 384 个专家 MoE,纯文本模型(暂无多模态),架构三件套:CSA+HCA 混合注意力 + mHC 流形约束超连接 + Muon 优化器。
DeepSeek 在 V4 发布文章的结尾,引了一句荀子的话:
"不诱于誉,不恐于诽,率道而行,端然正己。"
过去半年,"DeepSeek 是不是落后了""梁文锋到底在干什么"的讨论在中英文 AI 圈来来回回跑了好几轮。他们一次都没有回应。
然后这个周五,悄悄更新了官网。
当我们都以为他们在解决技术瓶颈的时候,他们其实在啃一块别人不敢动的骨头:把英伟达 CUDA 生态,整个迁移到华为昇腾上。这是一个代价极高、失败概率很大、没有任何捷径的方向。
但如果成了,英伟达黄仁勋说的那句 "a horrible outcome" 就真的来了。
今天,它来了。
AI 行业里太多人在喊口号,太少人在啃骨头。DeepSeek 这 15 个月什么都没说,最后用一句荀子收尾——我觉得这挺合适。
比大声说要做什么,难得多也值钱得多。

NOAH · AI深度实践
既然看到这里了
如果觉得有用,先点个赞,再顺手点个在看或转发
THANKS FOR READING

