今天 claude opus4.7 正式发布了,这次有点不一样的话,核心放在强化复杂软件工程能力,能适合高度自主,长时运行的 Agentic 任务。
Opus 4.7 价格是不变的,但 token 消耗增加了,和 opus 4.6 同样的任务花费更高了,悠着点。
大家非常关心,编码能力到底提升,这次多模态这块有明显幅度提升。
(1)指令遵循,字面理解更严格,旧 prompt 可能产生意外行为,需重新调优
(2)高分辨率视觉,支持最长边 2576px 图像(约 3.75MP),是旧版 3 倍以上
(3)长期记忆,更好利用文件系统记忆跨 Session 保留关键上下文
(4)专业输出质量,财务分析、PPT、文档输出更专业,GDPval-AA 评测 SOTA
Opus4.7 评估,内部自己跑的评分,数据由厂商选择性披露,一般都好看,主场优势看看就好哈哈。
另外,不仅更新了模型,Claude Code 今天也更新了,有几个比较有意思的功能。
1、新增 xhigh effort 级别:之前参数只有 4 档,官方建议编程场景下用 high 或 xhigh。
2、/ultrareview 命令:是一个新的代码审查功能,会起一个专门的审查会话,仔细过一遍你的改动,找 bug 和设计问题,模拟一个认真的 reviewer。
但值得注意的是,Pro 和 Max 用户仅可以免费试三次,凭啥才有 3 次免费,我怀疑用了 mythos 的能力。(保留疑问)
3、Auto mode 对 Max 用户开放:之前只有少部分能用,现在 Max 用户都能用了。开了之后 Claude 自己做权限决策,跑长任务时不用一直点确认,比 yolo 模式更安全一些。
总结,这次模型卖点,代码能力更强,尤其复杂软件工程领域,以及图像分辨率支持三倍的提升,意思就是看图写代码更精度了。