Dynamic Workflows出手
一夜让你变身亿万“负”翁
🚀Anthropic 不拼“最聪明”,开始学习OpenAI指令追随能力,发力“最可信”!
🔥 就在昨天(2026年5月28日),Anthropic 官方账号直接放出大招:Claude Opus 4.8 正式发布!这是 Claude 系列在代理能力(Agentic) 和自我诚实度上的显著跃升。更重要的是,它价格不变,直接免费升级给现有用户。
其中Dynamic Workflows动态工作流能力,让AI 编程能力再上一个新台阶!用自主规划大幅降低了人工决策的复杂性。
不过,Claude Code本来就以极度消耗token著称。
最近,米哈游工程师一夜间烧掉200万元token让业内震惊;微软因为不可控的token成本,选择停用AI Coding;国外一小公司因为检查不及时,一个月烧掉100万美金导致创始人当场泪崩……
这个动态工作流实在也让人绷不住!
当然瑕不掩瑜,Dynamic Workflows动态工作流还是极具开创性。可这么具有开创性的能力,竟然在发布当天就被大神copy在Pi中使用其他家大模型复现并开源:
更离谱的是:当用中文向新模型提问“你是谁”时,Opus 4.8 有时会直接回答“我是 Qwen”有时候回答“我是 DeepSeek”。这一“身份裂开”现象被广泛讨论,有人推测 4.8 的训练数据或合成数据生成过程中,可能深度借鉴或作为 teacher model 影响了 Qwen、DeepSeek、Kimi 等开源/中系模型的蒸馏迭代。
虽然 Anthropic 一贯强调反蒸馏防护,4.8 这么高诚实度就让人尴尬了。
核心升级:从“聪明”到“靠谱”的转变 ⚙️
根据 Anthropic 发布的基准对比,Opus 4.8 在多个关键维度上超越了 4.7,并与 GPT-5.5、Gemini 3.1 Pro 形成直接竞争:
- 代理编码(SWE-Bench Pro):69.2%(4.7 为 64.3%)
- 代理终端编码(Terminal-Bench 2.1):74.6%
- 代理计算机使用(OSWorld-Verified):83.4%
- 多学科推理:无工具 49.8%,带工具 57.9%
- 知识工作(GDPval-AA):1890 分
更亮眼的是诚实度的飞跃。Anthropic 特别强调:Opus 4.8 在代码工作中未标记自身缺陷的概率降低了约 4 倍(从 4.7 的较高水平大幅下降)。它更愿意承认不确定性,不会盲目自信地推进有问题的计划。这在实际开发场景中极其宝贵——避免了“AI 自信满满地写出一堆 bug,还自以为完美”的尴尬。
用户和早期测试者反馈也很一致:判断力更锐利、能独立工作更长时间、工具调用更高效、上下文保持更好。有人说它“像一个经验丰富的工程师,不需要频繁 check-in”。
Claude Code 的杀手级新功能:动态工作流(Dynamic Workflows) 🤖💼
这是本次发布最令人兴奋的部分之一!
- 动态工作流(研究预览):Claude 可以自主制定计划,然后并行启动数百个子代理,完成超级复杂任务(如涉及数十万行代码的大型迁移),最后自我验证再汇报。
- Fast Mode:相同模型,速度提升约 2.5 倍,价格还便宜 3 倍!在 Claude Code 中用
/fast开启,API 用户可申请。 - 努力控制:用户现在能在 claude.ai 上手动调节“努力程度”——高努力更深思熟虑,低努力更快响应,灵活掌控 token 消耗。
想象一下:你把一个大型功能或 bug 扫荡任务甩给 Claude Code,然后去喝咖啡、开会、甚至小睡一觉。它自己规划、执行、纠错、验证,最后给你一个可靠的结果。这已经不是“辅助编程”,而是朝着AI 工程师搭档的方向又迈了一大步。
AI编程最痛苦的部分被解决🧠
当前 AI 发展的瓶颈早已不是单纯的“参数规模”或“基准分数”,而是可信度、可靠性和长时自主性。开发者、企业用户最怕的就是 AI 在关键任务中“翻车”却不自知,或者需要人类全程监工。
Anthropic 这波把“诚实”和“代理可靠性”作为核心卖点,精准击中了痛点。同时,他们还预告了Mythos-class 模型即将到来——更高智能级别,但需要更强的安全保障。这体现了 Anthropic 一贯的“安全第一”哲学,在追求前沿能力的同时,不忘底线。
当然,也有一些声音提到模型切换、老版本下架等问题,但整体社区兴奋度很高,Elon Musk 都简单回复了 “Nice work”。
AI 进化进入“信任时代” 📈
总的来看,Claude Opus 4.8是一次务实且有力的迭代。至少他是真的在让用户真正放心地把工作交给 AI。当然钱包例外。
你试过 Opus 4.8 了吗?它在你的工作流里表现如何?欢迎评论区分享真实感受!💬
欢迎大家关注AI顿悟涌现时,快速入门当下最热的AI大模型前沿。
AI顿悟涌现时
AI顿悟涌现时是红绿旗下关注新技术的内容品牌。 AI顿悟涌现时关注前沿技术的发展应用,深度解读新技术对商业模式和社会形态的变革。 大模型商业技术及通识,筹备开课,欢迎有授课能力的朋友合作,欢迎有兴趣的朋友报名一起学习。相关优质内容将会发布在下方动图内微信公众号▼▼

