这 AI 卷到能连续搬砖 7 小时
当 AI 圈还在为 "996 福报" 争论不休时,Anthropic 突然甩出王炸 —— 能连续肝 7 小时的 Claude 4 系列模型!这波操作堪称 AI 界的 "卷王登基",直接把隔壁 OpenAI 和 Google 看得瞳孔地震。
在首届 "Code with Claude" 开发者大会上,这俩新模型活脱脱像刚从健身房出来的猛男,一亮相就把行业 benchmark 举得嘎嘎高。
05/23
最新热点资讯
—INNOVATION—
先说说这位叫 Opus 4 的硬核选手,官方盖章 "全球最佳编程模型" 可不是吹的。在 SWE-bench 考试里狂揽 72.5% 的正确率,Terminal-bench 也拿下 43.2% 的高分,妥妥的 AI 界学霸。最吓人的是它的续航能力 —— 日本乐天让它搞开源重构,这哥们儿居然一口气跑了 7 小时没掉链子,中间连个 "摸鱼喝水" 的动作都没有。Cursor 平台直呼这是 "编程界的新能源汽车",复杂代码库理解能力直接来了个续航飞跃;Replit 更是感慨,跨文件改代码就像开了涡轮增压,这效率谁看了不喊一句 "卷王本王"?
再看 Sonnet 4 这位 "职场多面手",虽说定位是 "日常版",但战斗力一点不含糊。SWE-bench 考了 72.7%,直接把 OpenAI 家的某些模型按在地上摩擦。现在它可是被 GitHub 官方看中的 "潜力股",即将成为 Copilot 新助手的核心大脑。最贴心的是,免费版 Claude 聊天机器人直接预装了它,相当于给打工人发了个 "摸鱼神器",写代码时突然来句 "帮我看看这个逻辑",AI 秒回的感觉比喊同事还快。
这俩模型最骚的操作是搞了个 "双模式切换"—— 想秒回消息就开 "外卖小哥模式",追求深度思考就切 "老教授模式"。要是给它们开放本地文件权限,那记忆力好得堪比 "人形硬盘",前几天改的代码细节都能给你翻出来。搭配新上线的 Claude Code 工具,现在 VS Code 里写代码就像带了个隐形助教,你写前端它默默补后端,debug 时比你自己还先发现 bug,这哪儿是 AI,分明是自带 "读心术" 的编程搭子。
价格方面 Anthropic 倒是挺良心,Opus 4 输 15 美刀输出 75 美刀,Sonnet 4 更便宜,输入 3 刀输出 15 刀。现在 Amazon 和 Google 云都能直接调用,相当于把 "AI 编程大牛" 打包放进你的开发环境。最刺激的是现在 AI 圈这战况 ——Google 在搞 AI 搜索,OpenAI 砸 65 亿买硬件,微软抱上 Grok 大腿,Anthropic 这波操作简直是往硝烟里扔了颗烟雾弹,接下来的 AI 大战怕是要卷到火星上去了。
各位开发者注意了,现在你们的工位上可能多了个 "永不下班的同事"。当 Claude 4 开始帮你写凌晨三点的代码,当它能记住你三个月前随口提的需求,或许未来编程界的新内卷标准就是:你的 AI 助手能连续肝几小时?反正我已经准备好给这俩 "卷王" 申请加班补贴了,毕竟能让人类早点下班的 AI,才是好 AI 啊!
微信号 丨科技牛咨讯
服务号 丨上海科技牛
科技牛产学研+互联网平台将长期提供新材料、新能源、智能装备、新一代信息技术等领域的科技成果。关注科技牛,每天向您推荐最新科技消息!
信息来源于媒体网站和官方网站等

