偷师OpenAI阿里千问DeepSeek，发布当天被破解，Claude Opus 4.8动态工作流的秘密在这- 大数跨境

首页

偷师OpenAI阿里千问DeepSeek，发布当天被破解，Claude Opus 4.8动态工作流的秘密在这

AI顿悟涌现时

2026-05-29

导读：Anthropic 终于发力codex擅长的指令追随能力，Dynamic Workflows引发用户对Claude Code烧钱担忧💡

「

Dynamic Workflows出手

一夜让你变身亿万“负”翁

」

🚀Anthropic 不拼“最聪明”，开始学习OpenAI指令追随能力，发力“最可信”！

🔥 就在昨天（2026年5月28日），Anthropic 官方账号直接放出大招：Claude Opus 4.8 正式发布！这是 Claude 系列在代理能力（Agentic） 和自我诚实度上的显著跃升。更重要的是，它价格不变，直接免费升级给现有用户。

其中Dynamic Workflows动态工作流能力，让AI 编程能力再上一个新台阶！用自主规划大幅降低了人工决策的复杂性。

不过，Claude Code本来就以极度消耗token著称。

最近，米哈游工程师一夜间烧掉200万元token让业内震惊；微软因为不可控的token成本，选择停用AI Coding；国外一小公司因为检查不及时，一个月烧掉100万美金导致创始人当场泪崩……

这个动态工作流实在也让人绷不住！

当然瑕不掩瑜，Dynamic Workflows动态工作流还是极具开创性。可这么具有开创性的能力，竟然在发布当天就被大神copy在Pi中使用其他家大模型复现并开源：

更离谱的是：当用中文向新模型提问“你是谁”时，Opus 4.8 有时会直接回答“我是 Qwen”有时候回答“我是 DeepSeek”。这一“身份裂开”现象被广泛讨论，有人推测 4.8 的训练数据或合成数据生成过程中，可能深度借鉴或作为 teacher model 影响了 Qwen、DeepSeek、Kimi 等开源/中系模型的蒸馏迭代。

虽然 Anthropic 一贯强调反蒸馏防护，4.8 这么高诚实度就让人尴尬了。

核心升级：从“聪明”到“靠谱”的转变 ⚙️

根据 Anthropic 发布的基准对比，Opus 4.8 在多个关键维度上超越了 4.7，并与 GPT-5.5、Gemini 3.1 Pro 形成直接竞争：

代理编码（SWE-Bench Pro）：69.2%（4.7 为 64.3%）
代理终端编码（Terminal-Bench 2.1）：74.6%
代理计算机使用（OSWorld-Verified）：83.4%
多学科推理：无工具 49.8%，带工具 57.9%
知识工作（GDPval-AA）：1890 分

更亮眼的是诚实度的飞跃。Anthropic 特别强调：Opus 4.8 在代码工作中未标记自身缺陷的概率降低了约 4 倍（从 4.7 的较高水平大幅下降）。它更愿意承认不确定性，不会盲目自信地推进有问题的计划。这在实际开发场景中极其宝贵——避免了“AI 自信满满地写出一堆 bug，还自以为完美”的尴尬。

用户和早期测试者反馈也很一致：判断力更锐利、能独立工作更长时间、工具调用更高效、上下文保持更好。有人说它“像一个经验丰富的工程师，不需要频繁 check-in”。

Claude Code 的杀手级新功能：动态工作流（Dynamic Workflows） 🤖💼

这是本次发布最令人兴奋的部分之一！

动态工作流（研究预览）：Claude 可以自主制定计划，然后并行启动数百个子代理，完成超级复杂任务（如涉及数十万行代码的大型迁移），最后自我验证再汇报。
Fast Mode：相同模型，速度提升约 2.5 倍，价格还便宜 3 倍！在 Claude Code 中用 /fast 开启，API 用户可申请。
努力控制：用户现在能在 claude.ai 上手动调节“努力程度”——高努力更深思熟虑，低努力更快响应，灵活掌控 token 消耗。

想象一下：你把一个大型功能或 bug 扫荡任务甩给 Claude Code，然后去喝咖啡、开会、甚至小睡一觉。它自己规划、执行、纠错、验证，最后给你一个可靠的结果。这已经不是“辅助编程”，而是朝着AI 工程师搭档的方向又迈了一大步。

AI编程最痛苦的部分被解决🧠

当前 AI 发展的瓶颈早已不是单纯的“参数规模”或“基准分数”，而是可信度、可靠性和长时自主性。开发者、企业用户最怕的就是 AI 在关键任务中“翻车”却不自知，或者需要人类全程监工。

Anthropic 这波把“诚实”和“代理可靠性”作为核心卖点，精准击中了痛点。同时，他们还预告了Mythos-class 模型即将到来——更高智能级别，但需要更强的安全保障。这体现了 Anthropic 一贯的“安全第一”哲学，在追求前沿能力的同时，不忘底线。

当然，也有一些声音提到模型切换、老版本下架等问题，但整体社区兴奋度很高，Elon Musk 都简单回复了 “Nice work”。

AI 进化进入“信任时代” 📈

总的来看，Claude Opus 4.8是一次务实且有力的迭代。至少他是真的在让用户真正放心地把工作交给 AI。当然钱包例外。

你试过 Opus 4.8 了吗？它在你的工作流里表现如何？欢迎评论区分享真实感受！💬

阅读更多：

Anthropic干了件大事：帮你手机省出92%空间，功劳在这个！

马斯克站队Anthropic

深度扒光Anthropic 51万行代码：Claude Code 8大新功能+6级安全架构被开发者玩明白了

文末点击下一篇或者扫码加入学习群，即可学习前沿AGI常识。

欢迎大家关注AI顿悟涌现时，快速入门当下最热的AI大模型前沿。

AI顿悟涌现时推出了【AGI常识】专题。【AGI常识】专题会以最通俗易懂的解释，帮你在一分钟内学会一个新技术名词背后的原理。欢迎点击下方动图，持续关注。

AI顿悟涌现时

AI顿悟涌现时是红绿旗下关注新技术的内容品牌。

AI顿悟涌现时关注前沿技术的发展应用，深度解读新技术对商业模式和社会形态的变革。

大模型商业技术及通识，筹备开课，欢迎有授课能力的朋友合作，欢迎有兴趣的朋友报名一起学习。相关‍优质内容将会发布在下方动图内微信公众号▼▼

【声明】内容源于网络

AI顿悟涌现时

全网唯一零门槛大模型科普！GenAI生成式大模型重塑互联网，世界模型重塑现实世界，硅基生命改写宇宙……人工智能与AR/MR/XR计算机合流，元宇宙虚拟世界开启超越实物价值。人类历史正在被int8和FP16量化卷积训练推理……

内容 72

粉丝 0

AI顿悟涌现时全网唯一零门槛大模型科普！GenAI生成式大模型重塑互联网，世界模型重塑现实世界，硅基生命改写宇宙……人工智能与AR/MR/XR计算机合流，元宇宙虚拟世界开启超越实物价值。人类历史正在被int8和FP16量化卷积训练推理……

总阅读33

粉丝0

内容72