小模型,大牛马。
12天。
3月5日,OpenAI发布GPT-5.4 Pro(超大杯)与GPT-5.4 Thinking(大杯);3月17日,正式上线GPT-5.4 mini(中杯)与GPT-5.4 nano(小杯)。
GPT-5.4系列全面对标竞品
OpenAI本次发布强调性能与成本双重优势:横向超越前代GPT-5 mini,纵向对标Anthropic Claude Haiku 4.5与谷歌Gemini 3 Flash。
MCP Atlas测试:AI工具调用能力
GPT-5.4 nano达56.1%,Claude Haiku 4.5为34.6%。nano输入价格仅0.2美元/百万token,为Haiku 4.5(1美元)的1/5,性能高出21个百分点。
OSWorld电脑操作测试
GPT-5.4满血版得分75.0%,首次超越人类基准;mini达72.1%,接近满血版;Haiku 4.5为50.7%。
Terminal-Bench终端编程测试
GPT-5.4 mini得分为60.0%,Haiku 4.5为41.0%,Gemini 3 Flash为47.6%。mini输入价格0.75美元/百万token,比Haiku 4.5低25%。
GPQA Diamond专家推理测试
Gemini 3 Flash以90.4%领先,GPT-5.4 mini为88.0%,显示谷歌在纯推理任务上仍有优势。
Codex子代理功能全面支持mini与nano
Codex「Subagents」(子代理)功能已向GPT-5.4 mini与nano开放。开发者可组合调用不同模型分工协作——例如在代码审查中,由GPT-5.4负责核心逻辑与安全分析,GPT-5.4 mini处理文档核查,GPT-5.3 Codex Spark执行代码库扫描,最多并行运行6个子代理。
mini消耗配额仅为GPT-5.4的30%,单位成本下算力利用率显著提升。
“别死磕一个模型了。大模型思考,小模型干脏活累活。”
AI开发正从单模型驱动转向多模型协同的“团队作业”模式。
用户可用性与部署策略
ChatGPT免费版及Go用户现已可在加号菜单中选择「思考(Thinking)」模式,调用GPT-5.4 mini,支持400K上下文窗口。
ChatGPT Plus与Pro用户默认享有GPT-5.4 Thinking调用权限(Plus限3000次/周,Pro无限)。
GPT-5.4 nano仅开放API接口,不接入ChatGPT界面,定位为开发者级轻量工具,适用于分类、数据清洗、排序等高吞吐、低复杂度任务,输入成本仅0.2美元/百万token。
三月密集发布:小模型战略升级
OpenAI在3月12天内连续推出GPT-5.4 Pro、GPT-5.4 mini、GPT-5.4 nano三款模型,完成从旗舰到边缘的全栈覆盖。
小模型角色已发生本质转变:从过去作为大模型的“低成本平替”,进化为协同生态中的“高效执行单元”——即“赛博牛马”。

