大数跨境

偷师OpenAI阿里千问DeepSeek,发布当天被破解,Claude Opus 4.8动态工作流的秘密在这

偷师OpenAI阿里千问DeepSeek,发布当天被破解,Claude Opus 4.8动态工作流的秘密在这 AI顿悟涌现时
2026-05-29
2
导读:Anthropic 终于发力codex擅长的指令追随能力,Dynamic Workflows引发用户对Claude Code烧钱担忧💡

Dynamic Workflows出手

一夜让你变身亿万“负”

🚀Anthropic 不拼“最聪明”,开始学习OpenAI指令追随能力,发力“最可信”!

🔥 就在昨天(2026年5月28日),Anthropic 官方账号直接放出大招:Claude Opus 4.8 正式发布!这是 Claude 系列在代理能力(Agentic) 自我诚实度上的显著跃升。更重要的是,它价格不变,直接免费升级给现有用户。

其中Dynamic Workflows动态工作流能力,让AI 编程能力再上一个新台阶!用自主规划大幅降低了人工决策的复杂性。

不过,Claude Code本来就以极度消耗token著称。

最近,米哈游工程师一夜间烧掉200万元token让业内震惊;微软因为不可控的token成本,选择停用AI Coding;国外一小公司因为检查不及时,一个月烧掉100万美金导致创始人当场泪崩……

这个动态工作流实在也让人绷不住!

当然瑕不掩瑜,Dynamic Workflows动态工作流还是极具开创性。可这么具有开创性的能力,竟然在发布当天就被大神copy在Pi中使用其他家大模型复现并开源:

更离谱的是:当用中文向新模型提问“你是谁”时,Opus 4.8 有时会直接回答“我是 Qwen”有时候回答“我是 DeepSeek”。这一“身份裂开”现象被广泛讨论,有人推测 4.8 的训练数据或合成数据生成过程中,可能深度借鉴或作为 teacher model 影响了 Qwen、DeepSeek、Kimi 等开源/中系模型的蒸馏迭代。

虽然 Anthropic 一贯强调反蒸馏防护,4.8 这么高诚实度就让人尴尬了。

核心升级:从“聪明”到“靠谱”的转变 ⚙️

根据 Anthropic 发布的基准对比,Opus 4.8 在多个关键维度上超越了 4.7,并与 GPT-5.5、Gemini 3.1 Pro 形成直接竞争:

  • 代理编码(SWE-Bench Pro):69.2%(4.7 为 64.3%)
  • 代理终端编码(Terminal-Bench 2.1):74.6%
  • 代理计算机使用(OSWorld-Verified):83.4%
  • 多学科推理:无工具 49.8%,带工具 57.9%
  • 知识工作(GDPval-AA):1890 分

更亮眼的是诚实度的飞跃。Anthropic 特别强调:Opus 4.8 在代码工作中未标记自身缺陷的概率降低了约 4 倍(从 4.7 的较高水平大幅下降)。它更愿意承认不确定性,不会盲目自信地推进有问题的计划。这在实际开发场景中极其宝贵——避免了“AI 自信满满地写出一堆 bug,还自以为完美”的尴尬。

用户和早期测试者反馈也很一致:判断力更锐利、能独立工作更长时间、工具调用更高效、上下文保持更好。有人说它“像一个经验丰富的工程师,不需要频繁 check-in”。

Claude Code 的杀手级新功能:动态工作流(Dynamic Workflows) 🤖💼

这是本次发布最令人兴奋的部分之一!

  • 动态工作流(研究预览):Claude 可以自主制定计划,然后并行启动数百个子代理,完成超级复杂任务(如涉及数十万行代码的大型迁移),最后自我验证再汇报。
  • Fast Mode:相同模型,速度提升约 2.5 倍,价格还便宜 3 倍!在 Claude Code 中用 /fast 开启,API 用户可申请。
  • 努力控制:用户现在能在 claude.ai 上手动调节“努力程度”——高努力更深思熟虑,低努力更快响应,灵活掌控 token 消耗。

想象一下:你把一个大型功能或 bug 扫荡任务甩给 Claude Code,然后去喝咖啡、开会、甚至小睡一觉。它自己规划、执行、纠错、验证,最后给你一个可靠的结果。这已经不是“辅助编程”,而是朝着AI 工程师搭档的方向又迈了一大步。

AI编程最痛苦的部分被解决🧠

当前 AI 发展的瓶颈早已不是单纯的“参数规模”或“基准分数”,而是可信度、可靠性和长时自主性。开发者、企业用户最怕的就是 AI 在关键任务中“翻车”却不自知,或者需要人类全程监工。

Anthropic 这波把“诚实”和“代理可靠性”作为核心卖点,精准击中了痛点。同时,他们还预告了Mythos-class 模型即将到来——更高智能级别,但需要更强的安全保障。这体现了 Anthropic 一贯的“安全第一”哲学,在追求前沿能力的同时,不忘底线。

当然,也有一些声音提到模型切换、老版本下架等问题,但整体社区兴奋度很高,Elon Musk 都简单回复了 “Nice work”。

AI 进化进入“信任时代” 📈

总的来看,Claude Opus 4.8是一次务实且有力的迭代。至少他是真的在让用户真正放心地把工作交给 AI。当然钱包例外。

你试过 Opus 4.8 了吗?它在你的工作流里表现如何?欢迎评论区分享真实感受!💬

阅读更多:
Anthropic干了件大事:帮你手机省出92%空间,功劳在这个!
马斯克站队Anthropic
深度扒光Anthropic 51万行代码:Claude Code 8大新功能+6级安全架构被开发者玩明白了
文末点击下一篇或者扫码加入学习群,即可学习前沿AGI常识。

欢迎大家关注AI顿悟涌现时,快速入门当下最热的AI大模型前沿。

原来人类的本质就是AGI
不用看数字的数学,让人高兴 人类大脑真是个奇迹

AI顿悟涌现时推出了【AGI常识】专题。【AGI常识】专题会以最通俗易懂的解释,帮你在一分钟内学会一个新技术名词背后的原理。欢迎点击下方动图,持续关注。

AI顿悟涌现时

AI顿悟涌现时绿旗下关注新技术的内容品牌。
AI顿悟涌现时关注前沿技术的发展应用,深度解读新技术对商业模式和社会形态的变革
大模型商业技术及通识,筹备开课,欢迎有授课能力的朋友合作,欢迎有兴趣的朋友报名一起学习。相关优质内容将会发布在下方动图内微信公众号▼▼
关注AGI ▶▶学习直达▶▶

【声明】内容源于网络
0
0
AI顿悟涌现时
全网唯一零门槛大模型科普!GenAI生成式大模型重塑互联网,世界模型重塑现实世界,硅基生命改写宇宙……人工智能与AR/MR/XR计算机合流,元宇宙虚拟世界开启超越实物价值。人类历史正在被int8和FP16量化卷积训练推理……
内容 72
粉丝 0
AI顿悟涌现时 全网唯一零门槛大模型科普!GenAI生成式大模型重塑互联网,世界模型重塑现实世界,硅基生命改写宇宙……人工智能与AR/MR/XR计算机合流,元宇宙虚拟世界开启超越实物价值。人类历史正在被int8和FP16量化卷积训练推理……
总阅读33
粉丝0
内容72